X-Git-Url: https://gapil.gnulinux.it/gitweb/?a=blobdiff_plain;f=fileunix.tex;h=1b4edcef570024767a173bb753c8788fedf87132;hb=3d3b2a0c6e47ab411bb55925dd9330a7dbd95f96;hp=60f34900bdf82c25b06b9917201c149ed433d1ff;hpb=dc6f430983f53479f813a2b7bc5ec6517e4b7e98;p=gapil.git diff --git a/fileunix.tex b/fileunix.tex index 60f3490..1b4edce 100644 --- a/fileunix.tex +++ b/fileunix.tex @@ -8,6 +8,7 @@ %% license is included in the section entitled "GNU Free Documentation %% License". %% + \chapter{I file: l'interfaccia standard Unix} \label{cha:file_unix_interface} @@ -1052,6 +1053,191 @@ file descriptor libero di valore uguale o maggiore di \param{newfd} (e se \param{newfd} è aperto la duplicazione avverrà su un altro file descriptor). + +\subsection{Le funzioni \func{openat}, \func{mkdirat} e affini} +\label{sec:file_openat} + +Un problema che si pone con l'uso della funzione \func{open}, così come per +molte altre funzioni che accettano come argomenti dei pathname relativi, è +che, quando un pathname relativo non fa riferimento alla directory di lavoro +corrente, è possibile che alcuni dei suoi componenti vengano modificati in +parallelo alla chiamata a \func{open}, e questo lascia aperta la possibilità +di una \itindex{race~condition} \textit{race condition}. + +Inoltre come già accennato, la directory di lavoro corrente è una proprietà +del singolo processo; questo significa che quando si lavora con i thread essa +sarà la stessa per tutti, ma esistono molti casi in cui sarebbe invece utile +che ogni singolo thread avesse la sua directory di lavoro. + +Per risolvere questi problemi, riprendendo una interfaccia già presente in +Solaris, a fianco delle normali funzioni che operano sui file (come +\func{open}, \func{mkdir}, ecc.) sono state introdotte delle ulteriori +funzioni, contraddistinte dal suffisso \texttt{at}, che permettono che +permettano l'apertura di un file (o le rispettive altre operazioni) usando un +pathname relativo ad una directory specificata.\footnote{l'introduzione è + avvenuta su proposta dello sviluppatore principale delle \acr{glibc} Urlich + Drepper; le corrispondenti system call sono state inserite nel kernel + ufficiale a partire dalla versione 2.6.16, in precedenza era disponibile una + emulazione che, sia pure con prestazioni inferiori, funzionava facendo + ricorso all'uso del filesystem \textit{proc} con l'apertura del file + attraverso il riferimento a pathname del tipo di + \texttt{/proc/self/fd/dirfd/relative\_path}.} Benché queste non siano +funzioni standard esse sono disponibili anche su altri Unix\footnote{oltre al + citato Solaris ne è prevista l'inclusione anche in BSD.} e sono state +proposte per l'inclusione nello standard POSIX.1, nelle future revisioni dello +stesso. + +L'idea è che si apra prima la directory che si vuole usare come base dei +pathname relativo, e si passi il file descriptor alla funzione che userà +quella directory come punto di partenza per la risoluzione.\footnote{in questo + modo, anche quando si lavora con i thread, si può mantenere anche una + directory di lavoro diversa per ciascuno di essi.} Con queste funzioni si +possono anche ottenere grossi aumenti di prestazioni quando si devono eseguire +operazioni su delle sezioni di albero dei file che prevedono gerarchie molto +profonde e grandi quantità di file e directory, dato che basta eseguire la +risoluzione di un pathname una sola volta (nell'apertura della directory) e +non per ciascun file che essa contiene. + +La sintassi generale di queste nuove funzioni è che esse prendano come primo +argomento il file descriptor della directory da usare come base, mentre gli +argomenti successivi restano identici a quelli della corrispondente funzione +ordinaria; ad esempio nel caso di \funcd{openat} avremo che essa è definita +come: +\begin{functions} + \headdecl{fcntl.h} + \funcdecl{int openat(int dirfd, const char *pathname, int flags)} + \funcdecl{int openat(int dirfd, const char *pathname, int flags, mode\_t + mode))} + + Apre un file usando come directory di lavoro corrente \param{dirfd}. + + \bodydesc{la funzione restituisce gli stessi valori e gli stessi codici di + errore di \func{open}, ed in più: + \begin{errlist} + \item[\errcode{EBADF}] \param{dirfd} non è un file descriptor valido. + \item[\errcode{ENOTDIR}] \param{pathname} è un pathname relativo, ma + \param{dirfd} fa riferimento ad un file. + \end{errlist}} +\end{functions} + +In tab.~\ref{tab:file_atfunc_corr} si sono riportate le funzioni introdotte +con questa nuova interfaccia, con a fianco la corrispondente funzione +classica. Tranne che nel caso di \func{faccessat} e \func{unlinkat} tutti i +loro prototipi seguono la convenzione appena vista per \func{openat}, in cui +agli argomenti della corrispondente funzione classica viene anteposto +l'argomento \param{dirfd}.\footnote{non staremo pertanto a riportarli uno per + uno.} + +\begin{table}[htb] + \centering + \footnotesize + \begin{tabular}[c]{|l|l|} + \hline + \textbf{Funzione} & \textbf{Corrispondente} \\ + \hline + \hline + \func{faccessat} &\func{access} \\ + \func{fchmodat} &\func{chmod} \\ + \func{fchownat} &\func{chown} \\ + \func{fstatat} &\func{stat} \\ + \func{futimesat} &\func{utimes} \\ + \func{linkat} &\func{link} \\ + \func{mkdirat} &\func{mkdir} \\ + \func{mknodat} &\func{mknod} \\ + \func{openat} &\func{open} \\ + \func{readlinkat}&\func{readlink}\\ + \func{renameat} &\func{rename} \\ + \func{symlinkat} &\func{symlink} \\ + \func{unlinkat} &\func{unlink} \\ + \func{mkfifoat} &\func{mkfifo} \\ + \hline + \end{tabular} + \caption{Corrispondenze fra le nuove funzioni ``\textit{at}'' e le + corrispettive funzioni classiche.} + \label{tab:file_atfunc_corr} +\end{table} + +% TODO documentare utimesat, introdotta in 2.6.22 +% http://kernelnewbies.org/Linux_2_6_22 + +Il comportamento delle nuove funzioni è del tutto analogo a quello delle +corrispettive classiche, con la sola eccezione del fatto che se fra i loro +argomenti si utilizza un pathname relativo questo sarà risolto rispetto alla +directory indicata da \param{dirfd}; qualora invece si usi un pathname +assoluto \param{dirfd} verrà semplicemente ignorato. Infine se per +\param{dirfd} si usa il valore speciale \const{AT\_FDCWD}, la risoluzione sarà +effettuata rispetto alla directory di lavoro corrente del processo. + +Così come il comportamento, anche i valori di ritorno e le condizioni di +errore delle nuove funzioni sono gli stessi delle funzioni classiche, agli +errori si aggiungono però quelli dovuti a valori errati per \param{dirfd}; in +particolare si avrà un errore di \errcode{EBADF} se esso non è un file +descriptor valido, ed un errore di \errcode{ENOTDIR} se esso non fa riferimento +ad una directory.\footnote{tranne il caso in cui si sia specificato un + pathname assoluto, nel qual caso, come detto, il valore di \param{dirfd} + sarà completamente ignorato.} + +Come accennato ci sono due eccezioni alla precedente regola, \func{faccessat} +e \func{unlinkat}, che tratteremo esplicitamente. Dette funzioni, oltre a +prendere \param{dirfd} come primo argomento aggiuntivo, prendono un ulteriore +argomento finale \param{flags}, utilizzato come maschera binaria. Nel caso di +\funcd{faccessat} avremo cioè: +\begin{functions} + \headdecl{unistd.h} + \funcdecl{int faccessat(int dirfd, const char *path, int mode, int flags)} + + Controlla i permessi di accesso. + + \bodydesc{la funzione restituisce gli stessi valori e gli stessi codici di + errore di \func{access}, ed in più: + \begin{errlist} + \item[\errcode{EBADF}] \param{dirfd} non è un file descriptor valido. + \item[\errcode{ENOTDIR}] \param{pathname} è un pathname relativo, ma + \param{dirfd} fa riferimento ad un file. + \end{errlist}} +\end{functions} + +La funzione esegue lo stesso controllo di accesso effettuabile con +\func{access}, ma si può utilizzare l'argomento \param{flags} per modificarne +il comportamento rispetto a quello ordinario di \func{access}; questo infatti +può essere specificato come maschera binaria dei seguenti valori: +\begin{basedescript}{\desclabelwidth{2.0cm}} +\item[\const{AT\_EACCESS}] se impostato esegue il controllo dei permessi + usando l'\textsl{user-ID effettivo} invece di quello reale (il comportamento + di default, che riprende quello di \func{access}). +\item[\const{AT\_SYMLINK\_NOFOLLOW}] se impostato non esegue la + dereferenziazione del link simbolico (il comportamento di default, che + riprende quello di \func{access}), ma effettua il controllo sui permessi del + link simbolico stesso. +\end{basedescript} + +Nel caso di \func{unlinkat} l'ulteriore argomento \param{flags} viene inserito +perché detta funzione può comportarsi sia come analogo di \func{unlink} che di +\func{rmdir}; pertanto il suo prototipo è: +\begin{functions} + \headdecl{fcntl.h} + \funcdecl{int unlinkat(int dirfd, const char *pathname, int flags)} + + Rimuove una voce da una directory. + + \bodydesc{la funzione restituisce gli stessi valori e gli stessi codici di + errore di \func{unlink} o di \func{rmdir} a seconda del valore di + \param{flags}, ed in più: + \begin{errlist} + \item[\errcode{EBADF}] \param{dirfd} non è un file descriptor valido. + \item[\errcode{ENOTDIR}] \param{pathname} è un pathname relativo, ma + \param{dirfd} fa riferimento ad un file. + \end{errlist}} +\end{functions} + +Di default il comportamento di \func{unlinkat} è equivalente a quello che +avrebbe \func{unlink} applicata a \param{pathname}, fallendo se questo è una +directory, se però si imposta \param{flags} al valore di +\const{AT\_REMOVEDIR},\footnote{anche se \param{flags} è una maschera binaria, + essendo questo l'unico flag disponibile, lo si può assegnare direttamente.} +essa si comporterà come \func{rmdir}. + + \subsection{La funzione \func{fcntl}} \label{sec:file_fcntl} @@ -1241,10 +1427,9 @@ di una funzione apposita, \funcd{ioctl}, con cui poter compiere le operazioni specifiche di ogni dispositivo particolare, usando come riferimento il solito file descriptor. Il prototipo di questa funzione è: \begin{prototype}{sys/ioctl.h}{int ioctl(int fd, int request, ...)} - Manipola il dispositivo sottostante, usando l'argomento \param{request} per - specificare l'operazione richiesta ed il terzo argomento (usualmente di tipo - \param{char * argp} o \param{int argp}) per il trasferimento - dell'informazione necessaria. + + Esegue l'operazione di controllo specificata da \param{request} sul file + descriptor \param{fd}. \bodydesc{La funzione nella maggior parte dei casi ritorna 0, alcune operazioni usano però il valore di ritorno per restituire informazioni. In @@ -1260,12 +1445,27 @@ file descriptor. Il prototipo di questa funzione ed inoltre \errval{EBADF} e \errval{EFAULT}.} \end{prototype} -La funzione serve in sostanza per fare tutte quelle operazioni che non si -adattano al design dell'architettura dei file e che non è possibile effettuare -con le funzioni esaminate finora. Esse vengono selezionate attraverso il -valore di \param{request} e gli eventuali risultati possono essere restituiti -sia attraverso il valore di ritorno che attraverso il terzo argomento -\param{argp}. Sono esempi delle operazioni gestite con una \func{ioctl}: +La funzione serve in sostanza come meccanismo generico per fare tutte quelle +operazioni che non rientrano nell'interfaccia ordinaria della gestione dei +file e che non è possibile effettuare con le funzioni esaminate finora. La +funzione richiede che si passi come primo argomento un file descriptor +regolarmente aperto, e l'operazione da compiere viene selezionata attraverso +il valore dell'argomento \param{request}. Il terzo argomento dipende +dall'operazione prescelta; tradizionalmente è specificato come \code{char * + argp}, da intendersi come puntatore ad un area di memoria +generica,\footnote{all'epoca della creazione di questa funzione infatti ancora + non era stato introdotto il tipo \ctyp{void}.} ma per certe operazioni può +essere omesso, e per altre è un semplice intero. + +Normalmente la funzione ritorna zero in caso di successo e $-1$ in caso di +errore, ma per alcune operazione il valore di ritorno, che nel caso viene +impostato ad un valore positivo, può essere utilizzato come parametro di +uscita. È più comune comunque restituire i risultati all'indirizzo puntato dal +terzo argomento. + +Data la genericità dell'interfaccia non è possibile classificare in maniera +sistematica le operazioni che si possono gestire con \func{ioctl}, un breve +elenco di alcuni esempi di esse è il seguente: \begin{itemize*} \item il cambiamento dei font di un terminale. \item l'esecuzione di una traccia audio di un CDROM. @@ -1274,11 +1474,15 @@ sia attraverso il valore di ritorno che attraverso il terzo argomento \item l'impostazione della velocità trasmissione di una linea seriale. \item l'impostazione della frequenza e della durata dei suoni emessi dallo speaker. +\item l'impostazione degli attributi dei file su un filesystem + ext2.\footnote{i comandi \texttt{lsattr} e \texttt{chattr} fanno questo con + delle \func{ioctl} dedicate, usabili solo su questo filesystem e derivati + successivi (come ext3).} \end{itemize*} -In generale ogni dispositivo ha un suo insieme di possibili diverse operazioni -effettuabili attraverso \func{ioctl}, che sono definite nell'header file -\file{sys/ioctl.h}, e devono essere usate solo sui dispositivi cui fanno +In generale ogni dispositivo ha un suo insieme di operazioni specifiche +effettuabili attraverso \func{ioctl}, tutte queste sono definite nell'header +file \file{sys/ioctl.h}, e devono essere usate solo sui dispositivi cui fanno riferimento. Infatti anche se in genere i valori di \param{request} sono opportunamente differenziati a seconda del dispositivo\footnote{il kernel usa un apposito \textit{magic number} per distinguere ciascun dispositivo nella @@ -1298,28 +1502,64 @@ sommaria delle sue caratteristiche; torneremo ad esaminare in seguito\footnote{per l'uso di \func{ioctl} con i socket si veda sez.~\ref{sec:sock_ctrl_func}.} quelle relative ad alcuni casi specifici (ad esempio la gestione dei terminali è effettuata attraverso \func{ioctl} in -quasi tutte le implementazioni di Unix), qui riportiamo solo i valori di -alcuni comandi che sono definiti per ogni file: +quasi tutte le implementazioni di Unix), qui riportiamo solo l'elenco delle +operazioni che sono predefinite per qualunque file,\footnote{in particolare + queste operazioni sono definite nel kernel a livello generale, e vengono + sempre interpretate per prime, per cui, come illustrato in \cite{LinDevDri}, + eventuali operazioni specifiche che usino lo stesso valore verrebbero + ignorate.} caratterizzate dal prefisso \texttt{FIO}: \begin{basedescript}{\desclabelwidth{2.0cm}} -\item[\const{FIOCLEX}] Imposta il flag di \itindex{close-on-exec} - \textit{close-on-exec}. -\item[\const{FIONCLEX}] Cancella il flag di \itindex{close-on-exec} - \textit{close-on-exec}. -\item[\const{FIOASYNC}] Abilita l'I/O asincrono. -\item[\const{FIONBIO}] Abilita l'I/O in modalità non bloccante. +\item[\const{FIOCLEX}] imposta il flag di \itindex{close-on-exec} + \textit{close-on-exec} sul file, in questo caso, essendo usata come + operazione logica, \func{ioctl} non richiede un terzo argomento, il cui + eventuale valore viene ignorato. +\item[\const{FIONCLEX}] cancella il flag di \itindex{close-on-exec} + \textit{close-on-exec} sul file, in questo caso, essendo usata come + operazione logica, \func{ioctl} non richiede un terzo argomento, il cui + eventuale valore viene ignorato. +\item[\const{FIOASYNC}] abilita o disabilita la modalità di I/O asincrono sul + file (vedi sez.~\ref{sec:file_asyncronous_operation}); il terzo argomento + deve essere un puntatore ad un intero (cioè di tipo \texttt{const int *}) + che contiene un valore logico (un valore nullo disabilita, un valore non + nullo abilita). +\item[\const{FIONBIO}] abilita o disabilita sul file l'I/O in modalità non + bloccante; il terzo argomento deve essere un puntatore ad un intero (cioè di + tipo \texttt{const int *}) che contiene un valore logico (un valore nullo + disabilita, un valore non nullo abilita). +\item[\const{FIOSETOWN}] imposta il processo che riceverà i segnali + \const{SIGURG} e \const{SIGIO} generati sul file; il terzo argomento deve + essere un puntatore ad un intero (cioè di tipo \texttt{const int *}) il cui + valore specifica il PID del processo. +\item[\const{FIOGETOWN}] legge il processo che riceverà i segnali + \const{SIGURG} e \const{SIGIO} generati sul file; il terzo argomento deve + essere un puntatore ad un intero (cioè di tipo \texttt{int *}) su cui sarà + scritto il PID del processo. +\item[\const{FIONREAD}] legge il numero di byte disponibili in lettura sul + file descriptor;\footnote{questa operazione è disponibile solo su alcuni + file descriptor, in particolare sui socket (vedi + sez.~\ref{sec:sock_ioctl_IP}) o sui file descriptor di \textit{epoll} + (vedi sez.~\ref{sec:file_epoll}).} il terzo argomento deve essere un + puntatore ad un intero (cioè di tipo \texttt{int *}) su cui sarà restituito + il valore. +\item[\const{FIOQSIZE}] restituisce la dimensione corrente di un file o di una + directory, mentre se applicata ad un dispositivo fallisce con un errore di + \errcode{ENOTTY}; il terzo argomento deve essere un puntatore ad un intero + (cioè di tipo \texttt{int *}) su cui sarà restituito il valore. \end{basedescript} -relativi ad operazioni comunque eseguibili anche attraverso \func{fcntl}. - - -% TODO estendere la lista delle ioctl sui file +Si noti però come la gran parte di queste operazioni (per essere precisi le +prime sei dell'elenco) siano effettuabili in maniera generica anche tramite +l'uso di \func{fcntl}. Le due funzioni infatti sono molto simili e la presenza +di questa sovrapposizione è principalmente dovuta al fatto che alle origini di +Unix i progettisti considerarono che era necessario trattare diversamente +rispetto alle operazione di controllo delle modalità di I/O file e dispositivi +usando \func{fcntl} per i primi e \func{ioctl} per i +secondi;\footnote{all'epoca tra l'altro i dispositivi che usavano \func{ioctl} + erano sostanzialmente solo i terminali, il che spiega l'uso comune di + \errcode{ENOTTY} come codice di errore.} oggi non è più così ma le due +funzioni sono rimaste. -%%% Local Variables: -%%% mode: latex -%%% TeX-master: "gapil" -%%% End: - % LocalWords: descriptor system call cap like kernel sez l'inode inode VFS tab % LocalWords: process table struct files flags pos all'inode dentry fig shell % LocalWords: error POSIX STDIN FILENO STDOUT STDERR unistd read write lseek @@ -1338,6 +1578,17 @@ relativi ad operazioni comunque eseguibili anche attraverso \func{fcntl}. % LocalWords: fdatasync fstat ext dup oldfd newfd DUPFD cmd long arg flock pid % LocalWords: SETFD GETFD GETFL SETFL GETLK SETLK SETLKW GETOWN group SIGURG % LocalWords: SETOWN GETSIG SETSIG sigaction SIGINFO siginfo SETLEASE lease is -% LocalWords: truncate GETLEASE NOTIFY all'I AND ACCMODE ioctl everything argp -% LocalWords: framebuffer request ENOTTY CDROM nell'header magic number -% LocalWords: FIOCLEX FIONCLEX FIOASYNC FIONBIO NOATIME +% LocalWords: truncate GETLEASE NOTIFY AND ACCMODE ioctl everything argp all'I +% LocalWords: framebuffer request ENOTTY CDROM nell'header magic number openat +% LocalWords: FIOCLEX FIONCLEX FIOASYNC FIONBIO NOATIME redirezione FIOSETOWN +% LocalWords: FIOGETOWN FIONREAD mkdirat thread Solaris mkdir at Urlich proc +% LocalWords: Drepper path dirfd faccessat unlinkat access fchmodat chmod Di +% LocalWords: fchownat chown fstatat futimesat utimes linkat mknodat mknod +% LocalWords: readlinkat readlink renameat rename symlinkat symlink unlink +% LocalWords: mkfifoat mkfifo FDCWD EACCESS dereferenziazione rmdir REMOVEDIR +% LocalWords: epoll lsattr chattr FIOQSIZE + +%%% Local Variables: +%%% mode: latex +%%% TeX-master: "gapil" +%%% End: