X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=blobdiff_plain;f=filestd.tex;h=15da6a791ca905e6b3849abb42896600675fdda7;hp=aed8addb240ef73ae5e144c00a302ead9f1bdfd3;hb=ff76d56c6a2c280cbe4f153173488871d7b12336;hpb=ff2d0141751ed62ef56e5bfd226c589311b8b669 diff --git a/filestd.tex b/filestd.tex index aed8add..15da6a7 100644 --- a/filestd.tex +++ b/filestd.tex @@ -1,13 +1,14 @@ %% filestd.tex %% -%% Copyright (C) 2000-2002 Simone Piccardi. Permission is granted to +%% Copyright (C) 2000-2007 Simone Piccardi. Permission is granted to %% copy, distribute and/or modify this document under the terms of the GNU Free %% Documentation License, Version 1.1 or any later version published by the -%% Free Software Foundation; with the Invariant Sections being "Prefazione", +%% Free Software Foundation; with the Invariant Sections being "Un preambolo", %% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the %% license is included in the section entitled "GNU Free Documentation %% License". %% + \chapter{I file: l'interfaccia standard ANSI C} \label{cha:files_std_interface} @@ -21,7 +22,7 @@ dell'interfaccia nell'ultima sezione. \section{Introduzione} \label{sec:file_stream_intro} -Come visto in \capref{cha:file_unix_interface} le operazioni di I/O sui file +Come visto in cap.~\ref{cha:file_unix_interface} le operazioni di I/O sui file sono gestibili a basso livello con l'interfaccia standard unix, che ricorre direttamente alle system call messe a disposizione dal kernel. @@ -37,16 +38,18 @@ costituire il nucleo\footnote{queste funzioni sono state implementate la prima \label{sec:file_stream} \index{file!stream|(} + Come più volte ribadito, l'interfaccia dei file descriptor è un'interfaccia di basso livello, che non provvede nessuna forma di formattazione dei dati e nessuna forma di bufferizzazione per ottimizzare le operazioni di I/O. In \cite{APUE} Stevens descrive una serie di test sull'influenza delle -dimensioni del blocco di dati (il parametro \param{buf} di \func{read} e +dimensioni del blocco di dati (l'argomento \param{buf} di \func{read} e \func{write}) nell'efficienza nelle operazioni di I/O con i file descriptor, evidenziando come le prestazioni ottimali si ottengano a partire da dimensioni del buffer dei dati pari a quelle dei blocchi del filesystem (il valore dato -dal campo \var{st\_blksize} di \struct{stat}). +dal campo \var{st\_blksize} di \struct{stat}), che di norma corrispondono alle +dimensioni dei settori fisici in cui è suddiviso il disco. Se il programmatore non si cura di effettuare le operazioni in blocchi di dimensioni adeguate, le prestazioni sono inferiori. La caratteristica @@ -66,34 +69,35 @@ A parte i dettagli legati alla gestione delle operazioni di lettura e scrittura (sia per quel che riguarda la bufferizzazione, che le formattazioni), i file stream restano del tutto equivalenti ai file descriptor (sui quali sono basati), ed in particolare continua a valere quanto visto in -\secref{sec:file_sharing} a proposito dell'accesso condiviso ed in -\secref{sec:file_access_control} per il controllo di accesso. +sez.~\ref{sec:file_sharing} a proposito dell'accesso condiviso ed in +sez.~\ref{sec:file_access_control} per il controllo di accesso. + \index{file!stream|)} -\subsection{Gli oggetti \ctyp{FILE}} +\subsection{Gli oggetti \type{FILE}} \label{sec:file_FILE} + Per ragioni storiche la struttura di dati che rappresenta uno stream è stata -chiamata \ctyp{FILE}, questi oggetti sono creati dalle funzioni di libreria e +chiamata \type{FILE}, questi oggetti sono creati dalle funzioni di libreria e contengono tutte le informazioni necessarie a gestire le operazioni sugli stream, come la posizione corrente, lo stato del buffer e degli indicatori di stato e di fine del file. -Per questo motivo gli utenti non devono mai utilizzare direttamente o -allocare queste strutture, ma usare sempre puntatori del tipo \ctyp{FILE - *} ottenuti dalla libreria stessa (tanto che in certi casi il termine -di puntatore a file è diventato sinonimo di stream). Tutte le funzioni -della libreria che operano sui file accettano come parametri solo -variabili di questo tipo, che diventa accessibile includendo l'header -file \file{stdio.h}. - +Per questo motivo gli utenti non devono mai utilizzare direttamente o allocare +queste strutture (che sono dei \index{tipo!opaco} \textsl{tipi opachi}) ma +usare sempre puntatori del tipo \texttt{FILE *} ottenuti dalla libreria stessa +(tanto che in certi casi il termine di puntatore a file è diventato sinonimo +di stream). Tutte le funzioni della libreria che operano sui file accettano +come argomenti solo variabili di questo tipo, che diventa accessibile +includendo l'header file \file{stdio.h}. \subsection{Gli stream standard} \label{sec:file_std_stream} -Ai tre file descriptor standard (vedi \secref{sec:file_std_descr}) +Ai tre file descriptor standard (vedi sez.~\ref{sec:file_std_descr}) aperti per ogni processo, corrispondono altrettanti stream, che rappresentano i canali standard di input/output prestabiliti; anche questi tre stream sono identificabili attraverso dei nomi simbolici @@ -113,17 +117,13 @@ definiti nell'header \file{stdio.h} che sono: sullo schermo. \end{basedescript} -Nelle \acr{glibc} \var{stdin}, \var{stdout} e \var{stderr} sono -effettivamente tre variabili di tipo \ctyp{FILE *} che possono essere -usate come tutte le altre, ad esempio si può effettuare una redirezione -dell'output di un programma con il semplice codice: -\begin{lstlisting}[labelstep=0,frame=,indent=1cm]{} - fclose(stdout); - stdout = fopen("standard-output-file", "w"); -\end{lstlisting} -ma in altri sistemi queste variabili possono essere definite da macro, e -se si hanno problemi di portabilità e si vuole essere sicuri, diventa -opportuno usare la funzione \func{freopen}. +Nelle \acr{glibc} \var{stdin}, \var{stdout} e \var{stderr} sono effettivamente +tre variabili di tipo \type{FILE}\texttt{ *} che possono essere usate come +tutte le altre, ad esempio si può effettuare una redirezione dell'output di un +programma con il semplice codice: \includecodesnip{listati/redir_stdout.c} ma +in altri sistemi queste variabili possono essere definite da macro, e se si +hanno problemi di portabilità e si vuole essere sicuri, diventa opportuno +usare la funzione \func{freopen}. \subsection{Le modalità di bufferizzazione} @@ -136,21 +136,24 @@ funzionalit uno degli aspetti più comunemente fraintesi, in particolare per quello che riguarda l'aspetto della scrittura dei dati sul file. -I caratteri che vengono scritti su uno stream normalmente vengono accumulati -in un buffer e poi trasmessi in blocco in maniera asincrona rispetto alla -scrittura (quello che viene chiamato lo \textsl{scarico} dei dati, -dall'inglese \textit{flush}) tutte le volte che il buffer viene riempito. Un -comportamento analogo avviene anche in lettura (cioè dal file viene letto un -blocco di dati, anche se ne sono richiesti una quantità inferiore), ma la cosa -ovviamente ha rilevanza inferiore, dato che i dati letti sono sempre gli -stessi; in caso di scrittura invece, quando si ha un accesso contemporaneo -allo stesso file (ad esempio da parte di un altro processo) si potranno vedere -solo le parti effettivamente scritte, e non quelle ancora presenti nel buffer. - -Allo stesso modo, se si sta facendo dell'input/output interattivo -bisognerà tenere presente le caratteristiche delle operazioni di scarico -dei dati, poiché non è detto che ad una scrittura sullo stream -corrisponda una immediata scrittura sul dispositivo. +I caratteri che vengono scritti su di uno stream normalmente vengono +accumulati in un buffer e poi trasmessi in blocco\footnote{questa operazione + viene usualmente chiamata \textsl{scaricamento} dei dati, dal termine + inglese \textit{flush}.} tutte le volte che il buffer viene riempito, in +maniera asincrona rispetto alla scrittura. Un comportamento analogo avviene +anche in lettura (cioè dal file viene letto un blocco di dati, anche se ne +sono richiesti una quantità inferiore), ma la cosa ovviamente ha rilevanza +inferiore, dato che i dati letti sono sempre gli stessi. In caso di scrittura +invece, quando si ha un accesso contemporaneo allo stesso file (ad esempio da +parte di un altro processo) si potranno vedere solo le parti effettivamente +scritte, e non quelle ancora presenti nel buffer. + +Per lo stesso motivo, in tutte le situazioni in cui si sta facendo +dell'input/output interattivo, bisognerà tenere presente le caratteristiche +delle operazioni di scaricamento dei dati, poiché non è detto che ad una +scrittura sullo stream corrisponda una immediata scrittura sul dispositivo (la +cosa è particolarmente evidente quando con le operazioni di input/output su +terminale). Per rispondere ad esigenze diverse, lo standard definisce tre distinte modalità in cui può essere eseguita la bufferizzazione, delle quali @@ -200,7 +203,7 @@ comporta l'accesso al kernel\footnote{questo vuol dire che lo stream da cui si legge è in modalità \textit{unbuffered}.} viene anche eseguito lo scarico di tutti i buffer degli stream in scrittura. -In \secref{sec:file_buffering_ctrl} vedremo come la libreria definisca delle +In sez.~\ref{sec:file_buffering_ctrl} vedremo come la libreria definisca delle opportune funzioni per controllare le modalità di bufferizzazione e lo scarico dei dati. @@ -210,7 +213,7 @@ dei dati. \label{sec:file_ansi_base_func} Esamineremo in questa sezione le funzioni base dell'interfaccia degli stream, -analoghe a quelle di \secref{sec:file_base_func} per i file descriptor. In +analoghe a quelle di sez.~\ref{sec:file_base_func} per i file descriptor. In particolare vedremo come aprire, leggere, scrivere e cambiare la posizione corrente in uno stream. @@ -219,7 +222,7 @@ corrente in uno stream. \label{sec:file_fopen} Le funzioni che si possono usare per aprire uno stream sono solo tre: -\func{fopen}, \func{fdopen} e \func{freopen},\footnote{\func{fopen} e +\funcd{fopen}, \funcd{fdopen} e \funcd{freopen},\footnote{\func{fopen} e \func{freopen} fanno parte dello standard ANSI C, \func{fdopen} è parte dello standard POSIX.1.} i loro prototipi sono: \begin{functions} @@ -245,19 +248,19 @@ Le funzioni che si possono usare per aprire uno stream sono solo tre: Normalmente la funzione che si usa per aprire uno stream è \func{fopen}, essa apre il file specificato nella modalità specificata da \param{mode}, che è una stringa che deve iniziare con almeno uno dei -valori indicati in \tabref{tab:file_fopen_mode} (sono possibili varie +valori indicati in tab.~\ref{tab:file_fopen_mode} (sono possibili varie estensioni che vedremo in seguito). L'uso più comune di \func{freopen} è per redirigere uno dei tre file -standard (vedi \secref{sec:file_std_stream}): il file \param{path} viene +standard (vedi sez.~\ref{sec:file_std_stream}): il file \param{path} viene associato a \param{stream} e se questo è uno stream già aperto viene preventivamente chiuso. Infine \func{fdopen} viene usata per associare uno stream ad un file descriptor esistente ottenuto tramite una altra funzione (ad esempio con una \func{open}, una \func{dup}, o una \func{pipe}) e serve quando si vogliono -usare gli stream con file come le fifo o i socket\index{socket}, che non -possono essere aperti con le funzioni delle librerie standard del C. +usare gli stream con file come le fifo o i socket, che non possono essere +aperti con le funzioni delle librerie standard del C. \begin{table}[htb] \centering @@ -268,21 +271,23 @@ possono essere aperti con le funzioni delle librerie standard del C. \hline \hline \texttt{r} & Il file viene aperto, l'accesso viene posto in sola - lettura, lo stream è posizionato all'inizio del file.\\ - \texttt{r+} & Il file viene aperto, l'accesso viene posto in lettura e - scrittura, lo stream è posizionato all'inizio del file. \\ + lettura, lo stream è posizionato all'inizio del file.\\ + \texttt{r+}& Il file viene aperto, l'accesso viene posto in lettura e + scrittura, lo stream è posizionato all'inizio del file. \\ % \hline \texttt{w} & Il file viene aperto e troncato a lunghezza nulla (o - creato se non esiste), l'accesso viene posto in sola scrittura, lo - stream è posizionato all'inizio del file.\\ - \texttt{w+} & Il file viene aperto e troncato a lunghezza nulla (o - creato se non esiste), l'accesso viene posto in scrittura e lettura, - lo stream è posizionato all'inizio del file.\\ + creato se non esiste), l'accesso viene posto in sola + scrittura, lo stream è posizionato all'inizio del file.\\ + \texttt{w+}& Il file viene aperto e troncato a lunghezza nulla (o + creato se non esiste), l'accesso viene posto in scrittura e + lettura, lo stream è posizionato all'inizio del file.\\ % \hline \texttt{a} & Il file viene aperto (o creato se non esiste) in - \textit{append mode}, l'accesso viene posto in sola scrittura. \\ - \texttt{a+} & Il file viene aperto (o creato se non esiste) in - \textit{append mode}, l'accesso viene posto in lettura e scrittura. \\ + \itindex{append~mode} \textit{append mode}, l'accesso viene + posto in sola scrittura.\\ + \texttt{a+}& Il file viene aperto (o creato se non esiste) in + \itindex{append~mode} \textit{append mode}, l'accesso viene + posto in lettura e scrittura.\\ \hline \texttt{b} & specifica che il file è binario, non ha alcun effetto. \\ \texttt{x} & l'apertura fallisce se il file esiste già. \\ @@ -294,7 +299,7 @@ possono essere aperti con le funzioni delle librerie standard del C. \end{table} In realtà lo standard ANSI C prevede un totale di 15 possibili valori -diversi per \param{mode}, ma in \tabref{tab:file_fopen_mode} si sono +diversi per \param{mode}, ma in tab.~\ref{tab:file_fopen_mode} si sono riportati solo i sei valori effettivi, ad essi può essere aggiunto pure il carattere \texttt{b} (come ultimo carattere o nel mezzo agli altri per le stringhe di due caratteri) che in altri sistemi operativi serve a @@ -304,7 +309,7 @@ compatibilit Le \acr{glibc} supportano alcune estensioni, queste devono essere sempre indicate dopo aver specificato il \param{mode} con uno dei valori di -\tabref{tab:file_fopen_mode}. L'uso del carattere \texttt{x} serve per +tab.~\ref{tab:file_fopen_mode}. L'uso del carattere \texttt{x} serve per evitare di sovrascrivere un file già esistente (è analoga all'uso dell'opzione \const{O\_EXCL} in \func{open}), se il file specificato già esiste e si aggiunge questo carattere a \param{mode} la \func{fopen} @@ -319,15 +324,16 @@ opportune funzioni di conversione in lettura e scrittura. Nel caso si usi \func{fdopen} i valori specificati da \param{mode} devono essere compatibili con quelli con cui il file descriptor è stato aperto. Inoltre i modi \cmd{w} e \cmd{w+} non troncano il file. La posizione nello -stream viene impostata a quella corrente nel file descriptor, e le variabili di -errore e di fine del file (vedi \secref{sec:file_io}) sono cancellate. Il file -non viene duplicato e verrà chiuso alla chiusura dello stream. +stream viene impostata a quella corrente nel file descriptor, e le variabili +di errore e di fine del file (vedi sez.~\ref{sec:file_io}) sono cancellate. Il +file non viene duplicato e verrà chiuso alla chiusura dello stream. I nuovi file saranno creati secondo quanto visto in -\secref{sec:file_ownership} ed avranno i permessi di accesso impostati al -valore \code{S\_IRUSR|S\_IWUSR|S\_IRGRP|S\_IWGRP|S\_IROTH|S\_IWOTH} (pari a +sez.~\ref{sec:file_ownership_management} ed avranno i permessi di accesso +impostati al valore +\code{S\_IRUSR|S\_IWUSR|S\_IRGRP|S\_IWGRP|S\_IROTH|S\_IWOTH} (pari a \val{0666}) modificato secondo il valore di \acr{umask} per il processo (si -veda \secref{sec:file_umask}). +veda sez.~\ref{sec:file_perm_management}). In caso di file aperti in lettura e scrittura occorre ricordarsi che c'è di mezzo una bufferizzazione; per questo motivo lo standard ANSI C @@ -345,10 +351,10 @@ un'operazione nominalmente nulla come \code{fseek(file, 0, SEEK\_CUR)} sufficiente a garantire la sincronizzazione. Una volta aperto lo stream, si può cambiare la modalità di bufferizzazione -(si veda \secref{sec:file_buffering_ctrl}) fintanto che non si è effettuato +(si veda sez.~\ref{sec:file_buffering_ctrl}) fintanto che non si è effettuato alcuna operazione di I/O sul file. -Uno stream viene chiuso con la funzione \func{fclose} il cui prototipo è: +Uno stream viene chiuso con la funzione \funcd{fclose} il cui prototipo è: \begin{prototype}{stdio.h}{int fclose(FILE *stream)} Chiude lo stream \param{stream}. @@ -364,10 +370,10 @@ e scarta tutti i dati in ingresso; se era stato allocato un buffer per lo stream questo verrà rilasciato. La funzione effettua lo scarico solo per i dati presenti nei buffer in user space usati dalle \acr{glibc}; se si vuole essere sicuri che il kernel forzi la scrittura su disco occorrerà effettuare -una \func{sync} (vedi \secref{sec:file_sync}). +una \func{sync} (vedi sez.~\ref{sec:file_sync}). -Linux supporta anche una altra funzione, \func{fcloseall}, come estensione GNU -implementata dalle \acr{glibc}, accessibile avendo definito +Linux supporta anche una altra funzione, \funcd{fcloseall}, come estensione +GNU implementata dalle \acr{glibc}, accessibile avendo definito \macro{\_GNU\_SOURCE}, il suo prototipo è: \begin{prototype}{stdio.h}{int fcloseall(void)} Chiude tutti gli stream. @@ -379,7 +385,7 @@ e scarta quelli in ingresso, chiudendo tutti i file. Questa funzione provvista solo per i casi di emergenza, quando si è verificato un errore ed il programma deve essere abortito, ma si vuole compiere qualche altra operazione dopo aver chiuso i file e prima di uscire (si ricordi quanto -visto in \secref{sec:proc_exit}). +visto in sez.~\ref{sec:proc_exit}). \subsection{Lettura e scrittura su uno stream} @@ -391,12 +397,12 @@ scrittura sui file. Sono infatti previste ben tre diverse modalit modalità di input/output non formattato: \begin{enumerate*} \item\textsl{binario} in cui legge/scrive un blocco di dati alla - volta, vedi \secref{sec:file_binary_io}. + volta, vedi sez.~\ref{sec:file_binary_io}. \item\textsl{a caratteri} in cui si legge/scrive un carattere alla volta (con la bufferizzazione gestita automaticamente dalla libreria), - vedi \secref{sec:file_char_io}. + vedi sez.~\ref{sec:file_char_io}. \item\textsl{di linea} in cui si legge/scrive una linea alla volta (terminata - dal carattere di newline \verb|'\n'|), vedi \secref{sec:file_line_io}. + dal carattere di newline \verb|'\n'|), vedi sez.~\ref{sec:file_line_io}. \end{enumerate*} ed inoltre la modalità di input/output formattato. @@ -417,15 +423,16 @@ Siccome la condizione di end-of-file il problema di come distinguerla da un errore effettivo; basarsi solo sul valore di ritorno della funzione e controllare il valore di \var{errno} infatti non basta, dato che quest'ultimo potrebbe essere stato impostato in -una altra occasione, (si veda \secref{sec:sys_errno} per i dettagli del +una altra occasione, (si veda sez.~\ref{sec:sys_errno} per i dettagli del funzionamento di \var{errno}). Per questo motivo tutte le implementazioni delle librerie standard mantengono per ogni stream almeno due flag all'interno dell'oggetto -\ctyp{FILE}, il flag di \textit{end-of-file}, che segnala che si è +\type{FILE}, il flag di \textit{end-of-file}, che segnala che si è raggiunta la fine del file in lettura, e quello di errore, che segnala la presenza di un qualche errore nelle operazioni di input/output; -questi due flag possono essere riletti dalle funzioni: +questi due flag possono essere riletti dalle funzioni \funcd{feof} e +\funcd{ferror}, i cui prototipi sono: \begin{functions} \headdecl{stdio.h} \funcdecl{int feof(FILE *stream)} @@ -442,7 +449,7 @@ qualunque operazione sullo stream, il controllo quindi deve essere effettuato ogni volta che si chiama una funzione di libreria. Entrambi i flag (di errore e di end-of-file) possono essere cancellati usando -la funzione \func{clearerr}, il cui prototipo è: +la funzione \funcd{clearerr}, il cui prototipo è: \begin{prototype}{stdio.h}{void clearerr(FILE *stream)} Cancella i flag di errore ed end-of-file di \param{stream}. \end{prototype} @@ -450,17 +457,18 @@ la funzione \func{clearerr}, il cui prototipo corretta la causa di un errore per evitare di mantenere i flag attivi, così da poter rilevare una successiva ulteriore condizione di errore. Di questa funzione esiste una analoga \func{clearerr\_unlocked} che non esegue il blocco -dello stream (vedi \secref{sec:file_stream_thread}). +dello stream (vedi sez.~\ref{sec:file_stream_thread}). \subsection{Input/output binario} \label{sec:file_binary_io} La prima modalità di input/output non formattato ricalca quella della -interfaccia dei file descriptor, e provvede semplicemente la scrittura e -la lettura dei dati da un buffer verso un file e viceversa. In generale -questa è la modalità che si usa quando si ha a che fare con dati non -formattati. Le due funzioni che si usano per l'I/O binario sono: +interfaccia dei file descriptor, e provvede semplicemente la scrittura e la +lettura dei dati da un buffer verso un file e viceversa. In generale questa è +la modalità che si usa quando si ha a che fare con dati non formattati. Le due +funzioni che si usano per l'I/O binario sono \funcd{fread} ed \funcd{fwrite}; +i loro prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -482,40 +490,12 @@ In genere si usano queste funzioni quando si devono trasferire su file blocchi di dati binari in maniera compatta e veloce; un primo caso di uso tipico è quello in cui si salva un vettore (o un certo numero dei suoi elementi) con una chiamata del tipo: -%\footnotesize -\begin{lstlisting}[labelstep=0,frame=,indent=1cm]{} -int WriteVect(FILE *stream, double *vec, size_t nelem) -{ - int size, nread; - size = sizeof(*vec); - if ( (nread = fwrite(vec, size, nelem, stream)) != nelem) { - perror("Write error"); - } - return nread; -} -\end{lstlisting} -%\normalsize +\includecodesnip{listati/WriteVect.c} in questo caso devono essere specificate le dimensioni di ciascun elemento ed il numero di quelli che si vogliono scrivere. Un secondo caso è invece quello in cui si vuole trasferire su file una struttura; si avrà allora una chiamata tipo: -%\footnotesize -\begin{lstlisting}[labelstep=0,frame=,indent=1cm]{} -struct histogram { - int nbins; - double max, min; - double *bin; -} histo; - -int WriteStruct(FILE *stream, struct histogram *histo) -{ - if ( fwrite(vec, sizeof(*histo), 1, stream) !=1) { - perror("Write error"); - } - return nread; -} -\end{lstlisting} -%\normalsize +\includecodesnip{listati/WriteStruct.c} in cui si specifica la dimensione dell'intera struttura ed un solo elemento. @@ -558,10 +538,11 @@ permetta di recuperare l'informazione completa), per assicurarsi che versioni diverse del programma siano in grado di rileggere i dati tenendo conto delle eventuali differenze. -Le \acr{glibc} definiscono altre due funzioni per l'I/O binario, che -evitano il lock implicito dello stream, usato per dalla librerie per la -gestione delle applicazioni multi-thread (si veda -\secref{sec:file_stream_thread} per i dettagli): +Le \acr{glibc} definiscono altre due funzioni per l'I/O binario, +\funcd{fread\_unlocked} e \funcd{fwrite\_unlocked} che evitano il lock +implicito dello stream, usato per dalla librerie per la gestione delle +applicazioni multi-thread (si veda sez.~\ref{sec:file_stream_thread} per i +dettagli), i loro prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -583,7 +564,7 @@ gestione delle applicazioni multi-thread (si veda La seconda modalità di input/output è quella a caratteri, in cui si trasferisce un carattere alla volta. Le funzioni per la lettura a -caratteri sono tre, \func{fgetc}, \func{getc} e \func{getchar}, i +caratteri sono tre, \funcd{fgetc}, \funcd{getc} e \funcd{getchar}, i rispettivi prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -607,14 +588,14 @@ differenza viene implementata con una macro, per cui occorre stare attenti a cosa le si passa come argomento, infatti \param{stream} può essere valutato più volte nell'esecuzione, e non viene passato in copia con il -meccanismo visto in \secref{sec:proc_var_passing}; per questo motivo se +meccanismo visto in sez.~\ref{sec:proc_var_passing}; per questo motivo se si passa un'espressione si possono avere effetti indesiderati. -Invece \func{fgetc} è assicurata essere sempre una funzione, per questo -motivo la sua esecuzione normalmente è più lenta per via dell'overhead -della chiamata, ma è altresì possibile ricavarne l'indirizzo, che può -essere passato come parametro ad un altra funzione (e non si hanno i -problemi accennati in precedenza con \param{stream}). +Invece \func{fgetc} è assicurata essere sempre una funzione, per questo motivo +la sua esecuzione normalmente è più lenta per via dell'overhead della +chiamata, ma è altresì possibile ricavarne l'indirizzo, che può essere passato +come argomento ad un altra funzione (e non si hanno i problemi accennati in +precedenza nel tipo di argomento). Le tre funzioni restituiscono tutte un \ctyp{unsigned char} convertito ad \ctyp{int} (si usa \ctyp{unsigned char} in modo da evitare @@ -622,9 +603,10 @@ l'espansione del segno). In questo modo il valore di ritorno positivo, tranne in caso di errore o fine del file. Nelle estensioni GNU che provvedono la localizzazione sono definite tre -funzioni equivalenti alle precedenti che invece di un carattere di un -byte restituiscono un carattere in formato esteso (cioè di tipo -\ctyp{wint\_t}), il loro prototipo è: +funzioni equivalenti alle precedenti, \funcd{getwc}, \funcd{fgetwc} e +\funcd{getwchar}, che invece di un carattere di un byte restituiscono un +carattere in formato esteso (cioè di tipo \ctyp{wint\_t}), il loro prototipo +è: \begin{functions} \headdecl{stdio.h} \headdecl{wchar.h} @@ -641,9 +623,9 @@ byte restituiscono un carattere in formato esteso (cio caso di errore o fine del file il valore di ritorno è \const{WEOF}.} \end{functions} -Per scrivere un carattere si possono usare tre funzioni analoghe alle -precedenti usate per leggere: \func{putc}, \func{fputc} e -\func{putchar}; i loro prototipi sono: +Per scrivere un carattere si possono usare tre funzioni, analoghe alle +precedenti usate per leggere: \funcd{putc}, \funcd{fputc} e \funcd{putchar}; i +loro prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -660,21 +642,20 @@ precedenti usate per leggere: \func{putc}, \func{fputc} e fine del file il valore di ritorno è \val{EOF}.} \end{functions} -Tutte queste funzioni scrivono sempre un byte alla volta, anche se -prendono come parametro un \ctyp{int} (che pertanto deve essere ottenuto -con un cast da un \ctyp{unsigned char}). Anche il valore di ritorno è -sempre un intero; in caso di errore o fine del file il valore di ritorno -è \val{EOF}. +Tutte queste funzioni scrivono sempre un byte alla volta, anche se prendono +come argomento un \ctyp{int} (che pertanto deve essere ottenuto con un cast da +un \ctyp{unsigned char}). Anche il valore di ritorno è sempre un intero; in +caso di errore o fine del file il valore di ritorno è \val{EOF}. -Come nel caso dell'I/O binario le \acr{glibc} provvedono per ciascuna -delle funzioni precedenti, come estensione GNU, una seconda funzione, il -cui nome è ottenuto aggiungendo un \code{\_unlocked}, che esegue -esattamente le stesse operazioni evitando però il lock implicito dello -stream. +Come nel caso dell'I/O binario con \func{fread} e \func{fwrite} le \acr{glibc} +provvedono come estensione, per ciascuna delle funzioni precedenti, +un'ulteriore funzione, il cui nome è ottenuto aggiungendo un +\code{\_unlocked}, che esegue esattamente le stesse operazioni, evitando però +il lock implicito dello stream. -Per compatibilità con SVID sono provviste anche due funzioni per leggere -e scrivere una \textit{word} (che è sempre definita come \ctyp{int}); i -loro prototipi sono: +Per compatibilità con SVID sono inoltre provviste anche due funzioni, +\funcd{getw} e \funcd{putw}, da usare per leggere e scrivere una \textit{word} +(cioè due byte in una volta); i loro prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -685,8 +666,10 @@ loro prototipi sono: \bodydesc{Le funzioni restituiscono la parola \param{w}, o \val{EOF} in caso di errore o di fine del file.} \end{functions} -\noindent l'uso di queste funzioni è deprecato in favore dell'uso di -\func{fread} e \func{fwrite}, in quanto non è possibile distinguere il + +Le funzioni leggono e scrivono una \textit{word} di due byte, usando comunque +una variabile di tipo \ctyp{int}; il loro uso è deprecato in favore dell'uso +di \func{fread} e \func{fwrite}, in quanto non è possibile distinguere il valore -1 da una condizione di errore che restituisce \val{EOF}. Uno degli usi più frequenti dell'input/output a caratteri è nei programmi di @@ -699,7 +682,7 @@ viene dopo. Nel nostro caso questo tipo di comportamento può essere realizzato prima leggendo il carattere, e poi rimandandolo indietro, cosicché ridiventi disponibile per una lettura successiva; la funzione che inverte la -lettura si chiama \func{ungetc} ed il suo prototipo è: +lettura si chiama \funcd{ungetc} ed il suo prototipo è: \begin{prototype}{stdio.h}{int ungetc(int c, FILE *stream)} Rimanda indietro il carattere \param{c}, con un cast a \ctyp{unsigned char}, sullo stream \param{stream}. @@ -730,7 +713,7 @@ successivamente. Infine si tenga presente che \func{ungetc} non altera il contenuto del file, ma opera esclusivamente sul buffer interno. Se si esegue una qualunque delle operazioni di riposizionamento (vedi -\secref{sec:file_fseek}) i caratteri rimandati indietro vengono +sez.~\ref{sec:file_fseek}) i caratteri rimandati indietro vengono scartati. @@ -739,11 +722,11 @@ scartati. La terza ed ultima modalità di input/output non formattato è quella di linea, in cui si legge o si scrive una riga alla volta; questa è una modalità molto -usata per l'I/O da terminale, ma che presenta le caratteristiche più -controverse. +usata per l'I/O da terminale, ma è anche quella che presenta le +caratteristiche più controverse. Le funzioni previste dallo standard ANSI C per leggere una linea sono -sostanzialmente due, \func{gets} e \func{fgets}, i cui rispettivi +sostanzialmente due, \funcd{gets} e \funcd{fgets}, i cui rispettivi prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -768,19 +751,19 @@ dentro la stringa. Se la lettura incontra la fine del file (o c' viene restituito un \val{NULL}, ed il buffer \param{buf} non viene toccato. L'uso di \func{gets} è deprecato e deve essere assolutamente evitato; la funzione infatti non controlla il numero di byte letti, per cui nel caso la -stringa letta superi le dimensioni del buffer, si avrà un \textit{buffer - overflow}\index{buffer overflow}, con sovrascrittura della memoria del -processo adiacente al buffer.\footnote{questa tecnica è spiegata in dettaglio - e con molta efficacia nell'ormai famoso articolo di Aleph1 \cite{StS}.} - -Questa è una delle vulnerabilità più sfruttate per guadagnare accessi -non autorizzati al sistema (i cosiddetti \textit{exploit}), basta -infatti inviare una stringa sufficientemente lunga ed opportunamente -forgiata per sovrascrivere gli indirizzi di ritorno nello stack -(supposto che la \func{gets} sia stata chiamata da una subroutine), in -modo da far ripartire l'esecuzione nel codice inviato nella stringa -stessa (in genere uno \textit{shell code} cioè una sezione di programma -che lancia una shell). +stringa letta superi le dimensioni del buffer, si avrà un +\itindex{buffer~overflow} \textit{buffer overflow}, con sovrascrittura della +memoria del processo adiacente al buffer.\footnote{questa tecnica è spiegata + in dettaglio e con molta efficacia nell'ormai famoso articolo di Aleph1 + \cite{StS}.} + +Questa è una delle vulnerabilità più sfruttate per guadagnare accessi non +autorizzati al sistema (i cosiddetti \textit{exploit}), basta infatti inviare +una stringa sufficientemente lunga ed opportunamente forgiata per +sovrascrivere gli indirizzi di ritorno nello \itindex{stack} \textit{stack} +(supposto che la \func{gets} sia stata chiamata da una subroutine), in modo da +far ripartire l'esecuzione nel codice inviato nella stringa stessa (in genere +uno \textit{shell code} cioè una sezione di programma che lancia una shell). La funzione \func{fgets} non ha i precedenti problemi di \func{gets} in quanto prende in input la dimensione del buffer \param{size}, che non verrà mai @@ -793,7 +776,7 @@ finale; sar successiva. Per la scrittura di una linea lo standard ANSI C prevede altre due -funzioni, \func{fputs} e \func{puts}, analoghe a quelle di lettura, i +funzioni, \funcd{fputs} e \funcd{puts}, analoghe a quelle di lettura, i rispettivi prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -816,8 +799,10 @@ uno zero ed aggiunge automaticamente il ritorno a capo. La differenza con \var{stdout}) è che quest'ultima non aggiunge il newline, che deve essere previsto esplicitamente. -Come per le funzioni di input/output a caratteri esistono le estensioni -per leggere e scrivere caratteri estesi, i loro prototipi sono: +Come per le analoghe funzioni di input/output a caratteri, anche per l'I/O di +linea esistono delle estensioni per leggere e scrivere linee di caratteri +estesi, le funzioni in questione sono \funcd{fgetws} e \funcd{fputws} ed i +loro prototipi sono: \begin{functions} \headdecl{wchar.h} \funcdecl{wchar\_t *fgetws(wchar\_t *ws, int n, FILE *stream)} @@ -831,17 +816,19 @@ per leggere e scrivere caratteri estesi, i loro prototipi sono: non negativo in caso di successo e \val{NULL} o \val{EOF} in caso di errore o fine del file.} \end{functions} -\noindent il cui comportamento è identico a quello di \func{fgets} e -\func{fputs} a parte il fatto che tutto (numero di caratteri massimo, + +Il comportamento di queste due funzioni è identico a quello di \func{fgets} e +\func{fputs}, a parte il fatto che tutto (numero di caratteri massimo, terminatore della stringa, newline) è espresso in termini di caratteri estesi -anziché di caratteri ASCII. +anziché di normali caratteri ASCII. -Come nel caso dell'I/O binario e a caratteri nelle \acr{glibc} sono -previste una serie di altre funzioni, estensione di tutte quelle -illustrate finora (eccetto \func{gets} e \func{puts}), il cui nome si -ottiene aggiungendo un \code{\_unlocked}, e che eseguono esattamente le -stesse operazioni delle loro equivalenti, evitando però il lock -implicito dello stream (vedi \secref{sec:file_stream_thread}). +Come per l'I/O binario e quello a caratteri, anche per l'I/O di linea le +\acr{glibc} supportano una serie di altre funzioni, estensioni di tutte quelle +illustrate finora (eccetto \func{gets} e \func{puts}), che eseguono +esattamente le stesse operazioni delle loro equivalenti, evitando però il lock +implicito dello stream (vedi sez.~\ref{sec:file_stream_thread}). Come per le +altre forma di I/O, dette funzioni hanno lo stesso nome della loro analoga +normale, con l'aggiunta dell'estensione \code{\_unlocked}. Come abbiamo visto, le funzioni di lettura per l'input/output di linea previste dallo standard ANSI C presentano svariati inconvenienti. Benché @@ -855,13 +842,12 @@ buffer), ma a costo di una complicazione ulteriore della logica del programma. Lo stesso dicasi quando si deve gestire il caso di stringa che eccede le dimensioni del buffer. -Per questo motivo le \acr{glibc} prevedono, come estensione GNU, due -nuove funzioni per la gestione dell'input/output di linea, il cui uso -permette di risolvere questi problemi. L'uso di queste funzioni deve -essere attivato definendo la macro \macro{\_GNU\_SOURCE} prima di -includere \file{stdio.h}. La prima delle due, \func{getline}, serve per -leggere una linea terminata da un newline esattamente allo stesso modo -di \func{fgets}, il suo prototipo è: +Per questo motivo le \acr{glibc} prevedono, come estensione GNU, due nuove +funzioni per la gestione dell'input/output di linea, il cui uso permette di +risolvere questi problemi. L'uso di queste funzioni deve essere attivato +definendo la macro \macro{\_GNU\_SOURCE} prima di includere \file{stdio.h}. La +prima delle due, \funcd{getline}, serve per leggere una linea terminata da un +newline, esattamente allo stesso modo di \func{fgets}, il suo prototipo è: \begin{prototype}{stdio.h} {ssize\_t getline(char **buffer, size\_t *n, FILE *stream)} Legge una linea dal file \param{stream} copiandola sul buffer indicato da \param{buffer} @@ -875,35 +861,28 @@ di \func{fgets}, il suo prototipo La funzione permette di eseguire una lettura senza doversi preoccupare della eventuale lunghezza eccessiva della stringa da leggere. Essa prende come primo -parametro l'indirizzo del puntatore al buffer su cui si vuole copiare la +argomento l'indirizzo del puntatore al buffer su cui si vuole copiare la linea. Quest'ultimo \emph{deve} essere stato allocato in precedenza con una \func{malloc} (non si può passare l'indirizzo di un puntatore ad una variabile -locale); come secondo parametro la funzione vuole l'indirizzo della variabile +locale); come secondo argomento la funzione vuole l'indirizzo della variabile contenente le dimensioni del buffer suddetto. -Se il buffer di destinazione è sufficientemente ampio la stringa viene -scritta subito, altrimenti il buffer viene allargato usando -\func{realloc} e la nuova dimensione ed il nuovo puntatore vengono -passata indietro (si noti infatti come per entrambi i parametri si siano -usati dei \textit{value result argument}, passando dei puntatori anziché -i valori delle variabili, secondo la tecnica spiegata in -\secref{sec:proc_var_passing}). +Se il buffer di destinazione è sufficientemente ampio la stringa viene scritta +subito, altrimenti il buffer viene allargato usando \func{realloc} e la nuova +dimensione ed il nuovo puntatore vengono restituiti indietro (si noti infatti +come per entrambi gli argomenti si siano usati dei +\itindex{value~result~argument} \textit{value result argument}, passando dei +puntatori anziché i valori delle variabili, secondo la tecnica spiegata in +sez.~\ref{sec:proc_var_passing}). -Se si passa alla funzione l'indirizzo di un puntatore impostato a \val{NULL} -e \var{*n} è zero, la funzione provvede da sola all'allocazione della memoria +Se si passa alla funzione l'indirizzo di un puntatore impostato a \val{NULL} e +\var{*n} è zero, la funzione provvede da sola all'allocazione della memoria necessaria a contenere la linea. In tutti i casi si ottiene dalla funzione un puntatore all'inizio del testo della linea letta. Un esempio di codice può -essere il seguente: -\begin{lstlisting}[labelstep=0,frame=,indent=1cm]{} - size_t n = 0; - char *ptr = NULL; - int nread; - FILE * file; - ... - nread = getline(&ptr, &n, file); -\end{lstlisting} -e per evitare memory leak occorre ricordarsi di liberare \var{ptr} con -una \func{free}. +essere il seguente: +\includecodesnip{listati/getline.c} +e per evitare \itindex{memory~leak} \textit{memory leak} occorre ricordarsi di +liberare \var{ptr} con una \func{free}. Il valore di ritorno della funzione indica il numero di caratteri letti dallo stream (quindi compreso il newline, ma non lo zero di @@ -914,7 +893,7 @@ un errore la funzione restituisce -1. La seconda estensione GNU è una generalizzazione di \func{getline} per poter usare come separatore un carattere qualsiasi, la funzione si -chiama \func{getdelim} ed il suo prototipo è: +chiama \funcd{getdelim} ed il suo prototipo è: \begin{prototype}{stdio.h} {ssize\_t getdelim(char **buffer, size\_t *n, int delim, FILE *stream)} Identica a \func{getline} solo che usa \param{delim} al posto del @@ -935,7 +914,8 @@ caratteristiche pi permette di stampare in maniera facile e veloce dati, tabelle e messaggi. L'output formattato viene eseguito con una delle 13 funzioni della famiglia -\func{printf}; le tre più usate sono le seguenti: +\func{printf}; le tre più usate sono \funcd{printf}, \funcd{fprintf} e +\funcd{sprintf}, i cui prototipi sono: \begin{functions} \headdecl{stdio.h} \funcdecl{int printf(const char *format, ...)} Stampa su \file{stdout} @@ -951,22 +931,26 @@ L'output formattato viene eseguito con una delle 13 funzioni della famiglia \bodydesc{Le funzioni ritornano il numero di caratteri stampati.} \end{functions} -\noindent le prime due servono per stampare su file (lo standard output -o quello specificato) la terza permette di stampare su una stringa, in genere +\noindent le prime due servono per stampare su file (lo standard output o +quello specificato) la terza permette di stampare su una stringa, in genere l'uso di \func{sprintf} è sconsigliato in quanto è possibile, se non si ha la sicurezza assoluta sulle dimensioni del risultato della stampa, eccedere le -dimensioni di \param{str} con conseguente sovrascrittura di altre variabili e -possibili buffer overflow; per questo motivo si consiglia l'uso -dell'alternativa: +dimensioni di \param{str}, con conseguente sovrascrittura di altre variabili e +possibili \itindex{buffer~overflow} \textit{buffer overflow}; per questo +motivo si consiglia l'uso dell'alternativa \funcd{snprintf}, il cui prototipo +è: \begin{prototype}{stdio.h} {snprintf(char *str, size\_t size, const char *format, ...)} Identica a \func{sprintf}, ma non scrive su \param{str} più di \param{size} caratteri. \end{prototype} -La parte più complessa di queste funzioni è il formato della stringa -\param{format} che indica le conversioni da fare, da cui poi deriva il numero -dei parametri che dovranno essere passati a seguire. +La parte più complessa delle funzioni di scrittura formattata è il formato +della stringa \param{format} che indica le conversioni da fare, e da cui +deriva anche il numero degli argomenti che dovranno essere passati a seguire +(si noti come tutte queste funzioni siano \index{variadic} \textit{variadic}, +prendendo un numero di argomenti variabile che dipende appunto da quello che +si è specificato in \param{format}). \begin{table}[htb] \centering @@ -986,7 +970,7 @@ dei parametri che dovranno essere passati a seguire. \cmd{\%X} &\ctyp{unsigned int}& Stampano un intero in formato esadecimale, rispettivamente con lettere minuscole e maiuscole. \\ - \cmd{\%f} &\ctyp{unsigned int}& Stampa un numero in virgola mobile con la + \cmd{\%f} &\ctyp{double} & Stampa un numero in virgola mobile con la notazione a virgola fissa \\ \cmd{\%e}, \cmd{\%E} &\ctyp{double} & Stampano un numero in virgola mobile con la @@ -1016,7 +1000,7 @@ La stringa vengono passati invariati all'output, e da direttive di conversione, in cui devono essere sempre presenti il carattere \texttt{\%}, che introduce la direttiva, ed uno degli specificatori di conversione (riportati in -\tabref{tab:file_format_spec}) che la conclude. +tab.~\ref{tab:file_format_spec}) che la conclude. \begin{table}[htb] \centering @@ -1053,13 +1037,13 @@ questo ordine: \begin{itemize*} \item uno specificatore del parametro da usare (terminato da un \val{\$}), \item uno o più flag (i cui valori possibili sono riassunti in - \tabref{tab:file_format_flag}) che controllano il formato di stampa della + tab.~\ref{tab:file_format_flag}) che controllano il formato di stampa della conversione, \item uno specificatore di larghezza (un numero decimale), eventualmente seguito (per i numeri in virgola mobile) da un specificatore di precisione (un altro numero decimale), \item uno specificatore del tipo di dato, che ne indica la dimensione (i cui - valori possibili sono riassunti in \tabref{tab:file_format_type}). + valori possibili sono riassunti in tab.~\ref{tab:file_format_type}). \end{itemize*} @@ -1103,7 +1087,8 @@ manuale di \func{printf} e nella documentazione delle \acr{glibc}. Una versione alternativa delle funzioni di output formattato, che permettono di usare il puntatore ad una lista di argomenti (vedi -\secref{sec:proc_variadic}), sono le seguenti: +sez.~\ref{sec:proc_variadic}), sono \funcd{vprintf}, \funcd{vfprintf} e +\funcd{vsprintf}, i cui prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -1122,28 +1107,30 @@ di usare il puntatore ad una lista di argomenti (vedi \bodydesc{Le funzioni ritornano il numero di caratteri stampati.} \end{functions} \noindent con queste funzioni diventa possibile selezionare gli argomenti che -si vogliono passare ad una routine di stampa, passando direttamente la lista -tramite il parametro \param{ap}. Per poter far questo ovviamente la lista dei -parametri dovrà essere opportunamente trattata (l'argomento è esaminato in -\secref{sec:proc_variadic}), e dopo l'esecuzione della funzione l'argomento +si vogliono passare ad una funzione di stampa, passando direttamente la lista +tramite l'argomento \param{ap}. Per poter far questo ovviamente la lista degli +argomenti dovrà essere opportunamente trattata (l'argomento è esaminato in +sez.~\ref{sec:proc_variadic}), e dopo l'esecuzione della funzione l'argomento \param{ap} non sarà più utilizzabile (in generale dovrebbe essere eseguito un \code{va\_end(ap)} ma in Linux questo non è necessario). Come per \func{sprintf} anche per \func{vsprintf} esiste una analoga -\func{vsnprintf} che pone un limite sul numero di caratteri che vengono +\funcd{vsnprintf} che pone un limite sul numero di caratteri che vengono scritti sulla stringa di destinazione: \begin{prototype}{stdio.h} {vsnprintf(char *str, size\_t size, const char *format, va\_list ap)} Identica a \func{vsprintf}, ma non scrive su \param{str} più di \param{size} caratteri. \end{prototype} -\noindent in modo da evitare possibili buffer overflow. +\noindent in modo da evitare possibili \itindex{buffer~overflow} buffer +overflow. Per eliminare alla radice questi problemi, le \acr{glibc} supportano una specifica estensione GNU che alloca dinamicamente tutto lo spazio necessario; l'estensione si attiva al solito definendo \macro{\_GNU\_SOURCE}, le due -funzioni sono: +funzioni sono \funcd{asprintf} e \funcd{vasprintf}, ed i rispettivi prototipi +sono: \begin{functions} \headdecl{stdio.h} @@ -1158,13 +1145,15 @@ funzioni sono: \bodydesc{Le funzioni ritornano il numero di caratteri stampati.} \end{functions} -Entrambe le funzioni prendono come parametro \param{strptr} che deve essere + +Entrambe le funzioni prendono come argomento \param{strptr} che deve essere l'indirizzo di un puntatore ad una stringa di caratteri, in cui verrà -restituito (si ricordi quanto detto in \secref{sec:proc_var_passing} a -proposito dei \textit{value result argument}) l'indirizzo della stringa -allocata automaticamente dalle funzioni. Occorre inoltre ricordarsi di -invocare \func{free} per liberare detto puntatore quando la stringa non serve -più, onde evitare memory leak. +restituito (si ricordi quanto detto in sez.~\ref{sec:proc_var_passing} a +proposito dei \itindex{value~result~argument} \textit{value result argument}) +l'indirizzo della stringa allocata automaticamente dalle funzioni. Occorre +inoltre ricordarsi di invocare \func{free} per liberare detto puntatore quando +la stringa non serve più, onde evitare \itindex{memory~leak} \textit{memory + leak}. Infine una ulteriore estensione GNU definisce le due funzioni \func{dprintf} e \func{vdprintf}, che prendono un file descriptor al posto dello stream. Altre @@ -1175,12 +1164,13 @@ davanti a \texttt{print}, sono trattate in dettaglio nella documentazione delle In corrispondenza alla famiglia di funzioni \func{printf} che si usano per l'output formattato, l'input formattato viene eseguito con le funzioni della -famiglia \func{scanf}; fra queste le tre più importanti sono: +famiglia \func{scanf}; fra queste le tre più importanti sono \funcd{scanf}, +\funcd{fscanf} e \funcd{sscanf}, i cui prototipi sono: \begin{functions} \headdecl{stdio.h} \funcdecl{int scanf(const char *format, ...)} Esegue una scansione di \file{stdin} cercando una corrispondenza di quanto letto con il formato dei dati specificato da \param{format}, ed effettua le relative - conversione memorizzando il risultato nei parametri seguenti. + conversione memorizzando il risultato negli argomenti seguenti. \funcdecl{int fscanf(FILE *stream, const char *format, ...)} Analoga alla precedente, ma effettua la scansione su \param{stream}. @@ -1204,11 +1194,11 @@ caratteristica. Le funzioni leggono i caratteri dallo stream (o dalla stringa) di input ed eseguono un confronto con quanto indicato in \param{format}, la sintassi di -questo parametro è simile a quella usata per l'analogo di \func{printf}, ma ci +questo argomento è simile a quella usata per l'analogo di \func{printf}, ma ci sono varie differenze. Le funzioni di input infatti sono più orientate verso la lettura di testo libero che verso un input formattato in campi fissi. Uno spazio in \param{format} corrisponde con un numero qualunque di caratteri di -separazione (che possono essere spazi, tabulatori, virgole etc.), mentre +separazione (che possono essere spazi, tabulatori, virgole ecc.), mentre caratteri diversi richiedono una corrispondenza esatta. Le direttive di conversione sono analoghe a quelle di \func{printf} e si trovano descritte in dettaglio nelle pagine di manuale e nel manuale delle \acr{glibc}. @@ -1230,7 +1220,7 @@ scansione e conversione di quanto serve direttamente con una delle funzioni di conversione delle stringhe; se invece il formato è più complesso diventa più facile utilizzare uno strumento come \cmd{flex}\footnote{il programma \cmd{flex}, è una implementazione libera di \cmd{lex} un generatore di - analizzatori lessicali, per i dettagli si può fare riferimento al manuale + analizzatori lessicali. Per i dettagli si può fare riferimento al manuale \cite{flex}.} per generare un analizzatore lessicale o il \cmd{bison}\footnote{il programma \cmd{bison} è un clone del generatore di parser \cmd{yacc}, maggiori dettagli possono essere trovati nel relativo @@ -1245,9 +1235,9 @@ all'interno di un file per effettuare operazioni di lettura o scrittura in un punto prestabilito; sempre che l'operazione di riposizionamento sia supportata dal file sottostante lo stream, quando cioè si ha a che fare con quello che viene detto un file ad \textsl{accesso casuale}.\footnote{dato che in un - sistema Unix esistono vari tipi di file, come le fifo ed i file di - dispositivo\index{file!di dispositivo}, non è scontato che questo sia sempre - vero.} + sistema Unix esistono vari tipi di file, come le fifo ed i + \index{file!di~dispositivo} file di dispositivo, non è scontato che questo + sia sempre vero.} In GNU/Linux ed in generale in ogni sistema unix-like la posizione nel file è espressa da un intero positivo, rappresentato dal tipo \type{off\_t}, il @@ -1259,9 +1249,9 @@ esempio in VMS pu rispetto al record corrente). Tutto questo comporta la presenza di diverse funzioni che eseguono -sostanzialmente le stesse operazioni, ma usano parametri di tipo -diverso. Le funzioni tradizionali usate per il riposizionamento della -posizione in uno stream sono: +sostanzialmente le stesse operazioni, ma usano argomenti di tipo diverso. Le +funzioni tradizionali usate per il riposizionamento della posizione in uno +stream sono \funcd{fseek} e \funcd{rewind} i cui prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -1274,15 +1264,15 @@ posizione in uno stream sono: \end{functions} L'uso di \func{fseek} è del tutto analogo a quello di \func{lseek} per i file -descriptor, ed i parametri, a parte il tipo, hanno lo stesso significato; in +descriptor, e gli argomenti, a parte il tipo, hanno lo stesso significato; in particolare \param{whence} assume gli stessi valori già visti in -\secref{sec:file_lseek}. La funzione restituisce 0 in caso di successo e -1 +sez.~\ref{sec:file_lseek}. La funzione restituisce 0 in caso di successo e -1 in caso di errore. La funzione \func{rewind} riporta semplicemente la posizione corrente all'inizio dello stream, ma non esattamente equivalente ad una \code{fseek(stream, 0L, SEEK\_SET)} in quanto vengono cancellati anche i flag di errore e fine del file. -Per ottenere la posizione corrente si usa invece la funzione \func{ftell}, il +Per ottenere la posizione corrente si usa invece la funzione \funcd{ftell}, il cui prototipo è: \begin{prototype}{stdio.h}{long ftell(FILE *stream)} Legge la posizione attuale nello stream \param{stream}. @@ -1298,7 +1288,7 @@ dall'inizio dello stream. Queste funzioni esprimono tutte la posizione nel file come un \ctyp{long int}. Dato che (ad esempio quando si usa un filesystem indicizzato a 64 bit) questo può non essere possibile lo standard POSIX ha introdotto le nuove funzioni -\func{fgetpos} e \func{fsetpos}, che invece usano il nuovo tipo +\funcd{fgetpos} e \funcd{fsetpos}, che invece usano il nuovo tipo \type{fpos\_t}, ed i cui prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -1335,7 +1325,7 @@ impliciti per la programmazione multi thread. Al contrario di quanto avviene con i file descriptor, le librerie standard del C non prevedono nessuna funzione come la \func{fcntl} per il controllo degli attributi dei file. Però, dato che ogni stream si appoggia ad un file -descriptor, si può usare la funzione \func{fileno} per ottenere quest'ultimo, +descriptor, si può usare la funzione \funcd{fileno} per ottenere quest'ultimo, il prototipo della funzione è: \begin{prototype}{stdio.h}{int fileno(FILE *stream)} Legge il file descriptor sottostante lo stream \param{stream}. @@ -1357,7 +1347,7 @@ disponibile, e si deve ricordare come il file essere complessa se le operazioni vengono effettuate in una subroutine, che a questo punto necessiterà di informazioni aggiuntive rispetto al semplice puntatore allo stream; questo può essere evitato con le due funzioni -\func{\_\_freadable} e \func{\_\_fwritable} i cui prototipi sono: +\funcd{\_\_freadable} e \funcd{\_\_fwritable} i cui prototipi sono: \begin{functions} \headdecl{stdio\_ext.h} \funcdecl{int \_\_freadable(FILE *stream)} @@ -1371,7 +1361,7 @@ puntatore allo stream; questo pu La conoscenza dell'ultima operazione effettuata su uno stream aperto è utile in quanto permette di trarre conclusioni sullo stato del buffer e del suo -contenuto. Altre due funzioni, \func{\_\_freading} e \func{\_\_fwriting} +contenuto. Altre due funzioni, \funcd{\_\_freading} e \funcd{\_\_fwriting} servono a tale scopo, il loro prototipo è: \begin{functions} \headdecl{stdio\_ext.h} @@ -1395,7 +1385,7 @@ operazione ci fosse comunque stata. \subsection{Il controllo della bufferizzazione} \label{sec:file_buffering_ctrl} -Come accennato in \secref{sec:file_buffering} le librerie definiscono una +Come accennato in sez.~\ref{sec:file_buffering} le librerie definiscono una serie di funzioni che permettono di controllare il comportamento degli stream; se non si è specificato nulla, la modalità di buffering viene decisa autonomamente sulla base del tipo di file sottostante, ed i buffer vengono @@ -1403,7 +1393,7 @@ allocati automaticamente. Però una volta che si sia aperto lo stream (ma prima di aver compiuto operazioni su di esso) è possibile intervenire sulle modalità di buffering; la -funzione che permette di controllare la bufferizzazione è \func{setvbuf}, il +funzione che permette di controllare la bufferizzazione è \funcd{setvbuf}, il suo prototipo è: \begin{prototype}{stdio.h}{int setvbuf(FILE *stream, char *buf, int mode, size\_t size)} @@ -1435,7 +1425,7 @@ Dato che la procedura di allocazione manuale (come delle scritture accidentali sul buffer) e non assicura la scelta delle dimensioni ottimali, è sempre meglio lasciare allocare il buffer alle funzioni di libreria, che sono in grado di farlo in maniera ottimale e trasparente -all'utente (in quanto la disallocazione avviene automaticamente). Inoltre +all'utente (in quanto la deallocazione avviene automaticamente). Inoltre siccome alcune implementazioni usano parte del buffer per mantenere delle informazioni di controllo, non è detto che le dimensioni dello stesso coincidano con quelle su cui viene effettuato l'I/O. @@ -1453,22 +1443,22 @@ coincidano con quelle su cui viene effettuato l'I/O. \const{\_IOFBF} & \textit{fully buffered}\\ \hline \end{tabular} - \caption{Valori del parametro \param{mode} di \func{setvbuf} - per l'impostazione delle modalità di bufferizzazione.} + \caption{Valori dell'argomento \param{mode} di \func{setvbuf} + per l'impostazione delle modalità di bufferizzazione.} \label{tab:file_stream_buf_mode} \end{table} Per evitare che \func{setvbuf} imposti il buffer basta passare un valore -\val{NULL} per \param{buf} e la funzione ignorerà il parametro \param{size} +\val{NULL} per \param{buf} e la funzione ignorerà l'argomento \param{size} usando il buffer allocato automaticamente dal sistema. Si potrà comunque modificare la modalità di bufferizzazione, passando in \param{mode} uno degli -opportuni valori elencati in \tabref{tab:file_stream_buf_mode}. Qualora si +opportuni valori elencati in tab.~\ref{tab:file_stream_buf_mode}. Qualora si specifichi la modalità non bufferizzata i valori di \param{buf} e \param{size} vengono sempre ignorati. Oltre a \func{setvbuf} le \acr{glibc} definiscono altre tre funzioni per la -gestione della bufferizzazione di uno stream: \func{setbuf}, \func{setbuffer} -e \func{setlinebuf}; i loro prototipi sono: +gestione della bufferizzazione di uno stream: \funcd{setbuf}, \funcd{setbuffer} +e \funcd{setlinebuf}; i loro prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -1486,8 +1476,8 @@ e \func{setlinebuf}; i loro prototipi sono: \noindent tutte queste funzioni sono realizzate con opportune chiamate a \func{setvbuf} e sono definite solo per compatibilità con le vecchie librerie BSD. Infine le \acr{glibc} provvedono le funzioni non standard\footnote{anche - queste funzioni sono originarie di Solaris.} \func{\_\_flbf} e -\func{\_\_fbufsize} che permettono di leggere le proprietà di bufferizzazione + queste funzioni sono originarie di Solaris.} \funcd{\_\_flbf} e +\funcd{\_\_fbufsize} che permettono di leggere le proprietà di bufferizzazione di uno stream; i cui prototipi sono: \begin{functions} \headdecl{stdio\_ext.h} @@ -1501,7 +1491,7 @@ di uno stream; i cui prototipi sono: Come già accennato, indipendentemente dalla modalità di bufferizzazione scelta, si può forzare lo scarico dei dati sul file con la funzione -\func{fflush}, il suo prototipo è: +\funcd{fflush}, il suo prototipo è: \begin{prototype}{stdio.h}{int fflush(FILE *stream)} Forza la scrittura di tutti i dati bufferizzati dello stream \param{stream}. @@ -1521,7 +1511,7 @@ stream aperti. Esistono per sicuri che sia stato eseguito tutto l'output su terminale, in cui serve poter effettuare lo scarico dei dati solo per gli stream in modalità line buffered; per questo motivo le \acr{glibc} supportano una estensione di Solaris, la -funzione \func{\_flushlbf}, il cui prototipo è: +funzione \funcd{\_flushlbf}, il cui prototipo è: \begin{prototype}{stdio-ext.h}{void \_flushlbf(void)} Forza la scrittura di tutti i dati bufferizzati degli stream in modalità line buffered. @@ -1530,10 +1520,10 @@ funzione \func{\_flushlbf}, il cui prototipo Si ricordi comunque che lo scarico dei dati dai buffer effettuato da queste funzioni non comporta la scrittura di questi su disco; se si vuole che il kernel dia effettivamente avvio alle operazioni di scrittura su disco occorre -usare \func{sync} o \func{fsync} (si veda~\secref{sec:file_sync}). +usare \func{sync} o \func{fsync} (si veda~sez.~\ref{sec:file_sync}). Infine esistono anche circostanze in cui si vuole scartare tutto l'output -pendente; per questo si può usare \func{fpurge}, il cui prototipo è: +pendente; per questo si può usare \funcd{fpurge}, il cui prototipo è: \begin{prototype}{stdio.h}{int fpurge(FILE *stream)} Cancella i buffer di input e di output dello stream \param{stream}. @@ -1566,9 +1556,10 @@ operazione. Ci sono comunque situazioni in cui questo non basta, come quando un thread necessita di compiere più di una operazione sullo stream atomicamente, per -questo motivo le librerie provvedono anche delle funzioni che permettono la -gestione esplicita dei blocchi sugli stream; queste funzioni sono disponibili -definendo \macro{\_POSIX\_THREAD\_SAFE\_FUNCTIONS} ed i loro prototipi sono: +questo motivo le librerie provvedono anche delle funzioni \funcd{flockfile}, +\funcd{ftrylockfile} e \funcd{funlockfile}, che permettono la gestione +esplicita dei blocchi sugli stream; esse sono disponibili definendo +\macro{\_POSIX\_THREAD\_SAFE\_FUNCTIONS} ed i loro prototipi sono: \begin{functions} \headdecl{stdio.h} @@ -1600,10 +1591,10 @@ accade per \func{getc} e \func{putc}) sono realizzate come macro. La sostituzione di tutte le funzioni di I/O con le relative versioni \code{\_unlocked} in un programma che non usa i thread è però un lavoro -abbastanza noioso; per questo motivo le \acr{glibc} provvedono al +abbastanza noioso; per questo motivo le \acr{glibc} forniscono al programmatore pigro un'altra via\footnote{anche questa mutuata da estensioni introdotte in Solaris.} da poter utilizzare per disabilitare in blocco il -locking degli stream: l'uso della funzione \func{\_\_fsetlocking}, il cui +locking degli stream: l'uso della funzione \funcd{\_\_fsetlocking}, il cui prototipo è: \begin{prototype}{stdio\_ext.h}{int \_\_fsetlocking (FILE *stream, int type)} Specifica o richiede a seconda del valore di \param{type} la modalità in cui @@ -1631,3 +1622,27 @@ che pu %%% mode: latex %%% TeX-master: "gapil" %%% End: + +% LocalWords: stream cap system call kernel Ritchie glibc descriptor Stevens +% LocalWords: buf read write filesystem st blksize stat sez l'header stdio BSD +% LocalWords: nell'header stdin shell stdout stderr error freopen flush line +% LocalWords: unbuffered buffered newline fully SVr fopen fdopen POSIX const +% LocalWords: char path int fildes NULL errno malloc fcntl fclose fflush tab +% LocalWords: dup fifo socket append EXCL ccs STRING IRUSR IWUSR IRGRP IWGRP +% LocalWords: IROTH IWOTH umask fseek fsetpos rewind SEEK CUR EOF EBADF close +% LocalWords: sync fcloseall SOURCE void stdlib of feof ferror clearerr l'I ws +% LocalWords: unlocked fread fwrite size ptr nmemb nelem gcc padding point str +% LocalWords: lock thread fgetc getc getchar dell'overhead altresì unsigned ap +% LocalWords: getwc fgetwc getwchar wint wchar WEOF putc fputc putchar dell'I +% LocalWords: SVID getw putw parsing peeking ahead ungetc gets fgets string Di +% LocalWords: overflow Aleph stack fputs puts fgetws fputws getline ssize leak +% LocalWords: realloc value result argument memory getdelim delim printf short +% LocalWords: fprintf sprintf format snprintf variadic long double intmax list +% LocalWords: uintmax ptrdiff vprintf vfprintf vsprintf vsnprintf asprintf lex +% LocalWords: vasprintf strptr dprintf vdprintf print scanf fscanf sscanf flex +% LocalWords: vscanf vfscanf vsscanf bison parser yacc like off VMS whence pos +% LocalWords: lseek ftell fgetpos fpos fseeko ftello fileno Solaris freadable +% LocalWords: fwritable ext freading fwriting buffering setvbuf BUFSIZ setbuf +% LocalWords: IONBF IOLBF IOFBF setbuffer setlinebuf flbf fbufsize flushlbf hh +% LocalWords: fsync fpurge flockfile ftrylockfile funlockfile SAFE FUNCTIONS +% LocalWords: locking fsetlocking type BYCALLER QUERY ll