Correzioni multiple agli indici delle funzioni, inserita macro per
[gapil.git] / filedir.tex
1 %% filedir.tex
2 %%
3 %% Copyright (C) 2000-2012 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{La gestione di file e directory}
13 \label{cha:files_and_dirs}
14
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando da un approfondimento dell'architettura del
17 sistema illustrata a grandi linee in sez.~\ref{sec:file_arch_overview} ed
18 illustrando le principali caratteristiche di un filesystem e le interfacce
19 che consentono di controllarne il montaggio e lo smontaggio. 
20
21 Esamineremo poi le funzioni di libreria che si usano per copiare, spostare e
22 cambiare i nomi di file e directory e l'interfaccia che permette la
23 manipolazione dei loro attributi. Tratteremo inoltre la struttura di base del
24 sistema delle protezioni e del controllo dell'accesso ai file e le successive
25 estensioni (\textit{Extended Attributes}, ACL, quote disco,
26 \textit{capabilities}). Tutto quello che riguarda invece la gestione dell'I/O
27 sui file è lasciato al capitolo successivo.
28
29
30
31 \section{L'architettura della gestione dei file}
32 \label{sec:file_arch_func}
33
34 In questa sezione tratteremo con maggiori dettagli rispetto a quanto visto in
35 sez.~\ref{sec:file_arch_overview} il \textit{Virtual File System} di Linux e
36 come il kernel può gestire diversi tipi di filesystem, descrivendo prima le
37 caratteristiche generali di un filesystem di un sistema unix-like, per poi
38 fare una panoramica sul filesystem più usato con Linux, l'\acr{ext2} ed i suoi
39 successori.
40
41
42 \subsection{Il funzionamento del \textit{Virtual File System} di Linux}
43 \label{sec:file_vfs_work}
44
45 % NOTE articolo interessante:
46 % http://www.ibm.com/developerworks/linux/library/l-virtual-filesystem-switch/index.html?ca=dgr-lnxw97Linux-VFSdth-LXdW&S_TACT=105AGX59&S_CMP=GRlnxw97
47
48 \itindbeg{Virtual~File~System}
49
50 Come illustrato brevemente in sez.~\ref{sec:file_arch_overview} in Linux il
51 concetto di \textit{everything is a file} è stato implementato attraverso il
52 \textit{Virtual File System}, la cui struttura generale è illustrata in
53 fig.~\ref{fig:file_VFS_scheme}.  Il VFS definisce un insieme di funzioni che
54 tutti i filesystem devono implementare per l'accesso ai file che contengono e
55 l'interfaccia che consente di eseguire l'I/O sui file, che questi siano di
56 dati o dispositivi. 
57
58 \itindbeg{inode}
59
60 L'interfaccia fornita dal VFS comprende in sostanza tutte le funzioni che
61 riguardano i file, le operazioni implementate dal VFS sono realizzate con una
62 astrazione che prevede quattro tipi di oggetti strettamente correlati: i
63 filesystem, le \textit{dentry}, gli \textit{inode} ed i file. A questi oggetti
64 corrispondono una serie di apposite strutture definite dal kernel che
65 contengono come campi le funzioni di gestione e realizzano l'infrastruttura
66 del VFS. L'interfaccia è molto complessa, ne faremo pertanto una trattazione
67 estremamente semplificata che consenta di comprenderne i principi
68 di funzionamento.
69
70 Il VFS usa una tabella mantenuta dal kernel che contiene il nome di ciascun
71 filesystem supportato, quando si vuole inserire il supporto di un nuovo
72 filesystem tutto quello che occorre è chiamare la funzione
73 \code{register\_filesystem} passando come argomento la struttura
74 \kstruct{file\_system\_type} (la cui definizione è riportata in
75 fig.~\ref{fig:kstruct_file_system_type}) relativa a quel filesystem. Questa
76 verrà inserita nella tabella, ed il nuovo filesystem comparirà in
77 \procfile{/proc/filesystems}.
78
79 \begin{figure}[!htb]
80   \footnotesize \centering
81   \begin{minipage}[c]{\textwidth}
82     \includestruct{listati/file_system_type.h}
83   \end{minipage}
84   \normalsize 
85   \caption{Estratto della struttura \kstructd{file\_system\_type} usata dal
86     VFS (da \texttt{include/linux/fs.h}).}
87   \label{fig:kstruct_file_system_type}
88 \end{figure}
89
90 La struttura \kstruct{file\_system\_type}, oltre ad una serie di dati interni,
91 come il nome del tipo di filesystem nel campo \var{name},\footnote{quello che
92   viene riportato in \procfile{/proc/filesystems} e che viene usato come
93   valore del parametro dell'opzione \texttt{-t} del comando \texttt{mount} che
94   indica il tipo di filesystem.}  contiene i riferimenti alle funzioni di base
95 che consentono l'utilizzo di quel filesystem. In particolare la funzione
96 \code{mount} del quarto campo è quella che verrà invocata tutte le volte che
97 si dovrà effettuare il montaggio di un filesystem di quel tipo. Per ogni nuovo
98 filesystem si dovrà allocare una di queste strutture ed inizializzare i
99 relativi campi con i dati specifici di quel filesystem, ed in particolare si
100 dovrà creare anche la relativa versione della funzione \code{mount}.
101
102 \itindbeg{pathname}
103 \itindbeg{pathname~resolution}
104
105 Come illustrato in fig.~\ref{fig:kstruct_file_system_type} questa funzione
106 restituisce una \textit{dentry}, abbreviazione che sta per \textit{directory
107   entry}. Le \textit{dentry} sono gli oggetti che il kernel usa per eseguire
108 la \textit{pathname resolution}, ciascuna di esse corrisponde ad un
109 \textit{pathname} e contiene il riferimento ad un \textit{inode}, che come
110 vedremo a breve è l'oggetto usato dal kernel per identificare un un
111 file.\footnote{in questo caso si parla di file come di un qualunque oggetto
112   generico che sta sul filesystem e non dell'oggetto file del VFS cui
113   accennavamo prima.} La \textit{dentry} ottenuta dalla chiamata alla funzione
114 \code{mount} sarà inserita in corrispondenza al \textit{pathname} della
115 directory in cui il filesystem è stato montato.
116
117 % NOTA: struct dentry è dichiarata in include/linux/dcache.h
118
119 Le \textit{dentry} sono oggetti del VFS che vivono esclusivamente in memoria,
120 nella cosiddetta \textit{directory entry cache} (spesso chiamata in breve
121 \textit{dcache}). Ogni volta che una \textit{system call} specifica un
122 \textit{pathname} viene effettuata una ricerca nella \textit{dcache} per
123 ottenere immediatamente la \textit{dentry} corrispondente,\footnote{il buon
124   funzionamento della \textit{dcache} è in effetti di una delle parti più
125   critiche per le prestazioni del sistema.} che a sua volta ci darà, tramite
126 l'\textit{inode}, il riferimento al file.
127
128 Dato che normalmente non è possibile mantenere nella \textit{dcache} le
129 informazioni relative a tutto l'albero dei file la procedura della
130 \textit{pathname resolution} richiede un meccanismo con cui riempire gli
131 eventuali vuoti. Il meccanismo prevede che tutte le volte che si arriva ad una
132 \textit{dentry} mancante venga invocata la funzione \texttt{lookup}
133 dell'\textit{inode} associato alla \textit{dentry} precedente nella
134 risoluzione del \textit{pathname},\footnote{che a questo punto è una
135   directory, per cui si può cercare al suo interno il nome di un file.} il cui
136 scopo è risolvere il nome mancante e fornire la sua \textit{dentry} che a
137 questo punto verrà inserita nella cache.
138
139 Dato che tutte le volte che si monta un filesystem la funzione \texttt{mount}
140 della corrispondente \kstruct{file\_system\_type} inserisce la \textit{dentry}
141 iniziale nel \itindex{mount~point} \textit{mount point} dello stesso si avrà
142 comunque un punto di partenza. Inoltre essendo questa \textit{dentry} relativa
143 a quel tipo di filesystem essa farà riferimento ad un \textit{inode} di quel
144 filesystem, e come vedremo questo farà sì che venga eseguita una
145 \texttt{lookup} adatta per effettuare la risoluzione dei nomi per quel
146 filesystem.
147
148 \itindend{pathname}
149 \itindend{pathname~resolution}
150
151 % Un secondo effetto della chiamata funzione \texttt{mount} di
152 % \kstruct{file\_system\_type} è quello di allocare una struttura
153 % \kstruct{super\_block} per ciascuna istanza montata, che contiene le
154 % informazioni generali di un qualunque filesystem montato, come le opzioni di
155 % montaggio, le dimensioni dei blocchi, quando il filesystem è stato montato
156 % ecc. Fra queste però viene pure inserta, nel campo \var{s\_op}, una ulteriore
157 % struttura \kstruct{super\_operations}, il cui contenuto sono i puntatori
158 % alle funzioni di gestione di un filesystem, anche inizializzata in modo da
159 % utilizzare le versioni specifiche di quel filesystem.
160
161 L'oggetto più importante per il funzionamento del VFS è probabilmente
162 l'\textit{inode}, ma con questo nome si può fare riferimento a due cose
163 diverse.  La prima è la struttura su disco (su cui torneremo anche in
164 sez.~\ref{sec:file_filesystem}) che fa parte della organizzazione dei dati
165 realizzata dal filesystem e che contiene le informazioni relative alle
166 proprietà (i cosiddetti \textsl{metadati}) di ogni oggetto presente su di esso
167 (si intende al solito uno qualunque dei tipi di file di
168 tab.~\ref{tab:file_file_types}).
169
170 La seconda è la corrispondente struttura \kstruct{inode}, della cui
171 definizione si è riportato un estratto in
172 fig.~\ref{fig:kstruct_inode}.\footnote{l'estratto fa riferimento alla versione
173   del kernel 2.6.37.} Questa struttura viene mantenuta in memoria ed è a
174 questa che facevamo riferimento quando parlavamo dell'\textit{inode} associato
175 a ciascuna \textit{dentry}. Nella struttura in memoria sono presenti gli
176 stessi \textsl{metadati} memorizzati su disco, che vengono letti quando questa
177 struttura viene allocata e trascritti all'indietro se modificati.
178
179 \begin{figure}[!htb]
180   \footnotesize \centering
181   \begin{minipage}[c]{\textwidth}
182     \includestruct{listati/inode.h}
183   \end{minipage}
184   \normalsize 
185   \caption{Estratto della struttura \kstructd{inode} del kernel (da
186     \texttt{include/linux/fs.h}).}
187   \label{fig:kstruct_inode}
188 \end{figure}
189
190 Il fatto che la struttura \kstruct{inode} sia mantenuta in memoria,
191 direttamente associata ad una \textit{dentry}, rende sostanzialmente immediate
192 le operazioni che devono semplicemente effettuare un accesso ai dati in essa
193 contenuti: è così ad esempio che viene realizzata la \textit{system call}
194 \func{stat} che vedremo in sez.~\ref{sec:file_stat}. Rispetto ai dati salvati
195 sul disco questa struttura contiene però anche quanto necessario alla
196 implementazione del VFS, ed in particolare è importante il campo \var{i\_op}
197 che, come illustrato in fig.~\ref{fig:kstruct_inode}, contiene il puntatore ad
198 una struttura di tipo \kstruct{inode\_operation}, la cui definizione si può
199 trovare nel file \texttt{include/kernel/fs.h} dei sorgenti del kernel.
200
201 Questa struttura non è altro che una tabella di funzioni, ogni suo membro cioè
202 è un puntatore ad una funzione e, come suggerisce il nome della struttura
203 stessa, queste funzioni sono quelle che definiscono le operazioni che il VFS
204 può compiere su un \textit{inode}. Si sono riportate in
205 tab.~\ref{tab:file_inode_operations} le più rilevanti.
206
207 \begin{table}[htb]
208   \centering
209   \footnotesize
210   \begin{tabular}[c]{|l|l|}
211     \hline
212     \textbf{Funzione} & \textbf{Operazione} \\
213     \hline
214     \hline
215     \textsl{\code{create}} & Chiamata per creare un nuovo file (vedi
216                              sez.~\ref{sec:file_open}).\\ 
217     \textsl{\code{link}}   & Crea un \textit{hard link} (vedi
218                              sez.~\ref{sec:file_link}).\\
219     \textsl{\code{unlink}} & Cancella un \textit{hard link} (vedi
220                              sez.~\ref{sec:file_link}).\\
221     \textsl{\code{symlink}}& Crea un link simbolico (vedi
222                              sez.~\ref{sec:file_symlink}).\\
223     \textsl{\code{mkdir}}  & Crea una directory (vedi
224                              sez.~\ref{sec:file_dir_creat_rem}).\\
225     \textsl{\code{rmdir}}  & Rimuove una directory (vedi
226                              sez.~\ref{sec:file_dir_creat_rem}).\\
227     \textsl{\code{mknod}}  & Crea un file speciale (vedi
228                              sez.~\ref{sec:file_mknod}).\\
229     \textsl{\code{rename}} & Cambia il nome di un file (vedi
230                              sez.~\ref{sec:file_remove}).\\
231     \textsl{\code{lookup}}&  Risolve il nome di un file.\\
232     \hline
233   \end{tabular}
234   \caption{Le principali operazioni sugli \textit{inode} definite tramite
235     \kstruct{inode\_operation}.} 
236   \label{tab:file_inode_operations}
237 \end{table}
238
239 Possiamo notare come molte di queste funzioni abbiano nomi sostanzialmente
240 identici alle varie \textit{system call} con le quali si gestiscono file e
241 directory, che tratteremo nel resto del capitolo. Quello che succede è che
242 tutte le volte che deve essere eseguita una \textit{system call}, o una
243 qualunque altra operazione su un \textit{inode} (come \texttt{lookup}) il VFS
244 andrà ad utilizzare la funzione corrispondente attraverso il puntatore
245 \var{i\_op}.
246
247 Sarà allora sufficiente che nella realizzazione di un filesystem si crei una
248 implementazione di queste funzioni per quel filesystem e si allochi una
249 opportuna istanza di \kstruct{inode\_operation} contenente i puntatori a dette
250 funzioni. A quel punto le strutture \kstruct{inode} usate per gli oggetti di
251 quel filesystem otterranno il puntatore alla relativa istanza di
252 \kstruct{inode\_operation} e verranno automaticamente usate le funzioni
253 corrette.
254
255 Si noti però come in tab.~\ref{tab:file_inode_operations} non sia presente la
256 funzione \texttt{open} che invece è citata in
257 tab.~\ref{tab:file_file_operations}.\footnote{essa può essere comunque
258   invocata dato che nella struttura \kstruct{inode} è presente anche il
259   puntatore \var{i\_fop} alla struttura \kstruct{file\_operation} che fornisce
260   detta funzione.} Questo avviene perché su Linux l'apertura di un file
261 richiede comunque un'altra operazione che mette in gioco l'omonimo oggetto del
262 VFS: l'allocazione di una struttura di tipo \kstruct{file} che viene associata
263 ad ogni file aperto nel sistema.
264
265 I motivi per cui viene usata una struttura a parte sono diversi, anzitutto,
266 come illustrato in sez.~\ref{sec:file_fd}, questa è necessaria per le
267 operazioni eseguite dai processi con l'interfaccia dei file descriptor; ogni
268 processo infatti mantiene il riferimento ad una struttura \kstruct{file} per
269 ogni file che ha aperto, ed è tramite essa che esegue le operazioni di I/O.
270
271 Inoltre se le operazioni relative agli \textit{inode} fanno riferimento ad
272 oggetti posti all'interno di un filesystem e vi si applicano quindi le
273 funzioni fornite nell'implementazione di quest'ultimo, quando si apre un file
274 questo può essere anche un file di dispositivo, ed in questo caso il VFS
275 invece di usare le operazioni fornite dal filesystem (come farebbe per un file
276 di dati) dovrà invece ricorrere a quelle fornite dal driver del dispositivo.
277
278 \itindend{inode}
279
280 \begin{figure}[!htb]
281   \footnotesize \centering
282   \begin{minipage}[c]{\textwidth}
283     \includestruct{listati/file.h}
284   \end{minipage}
285   \normalsize 
286   \caption{Estratto della struttura \kstructd{file} del kernel (da
287     \texttt{include/linux/fs.h}).}
288   \label{fig:kstruct_file}
289 \end{figure}
290
291 Come si può notare dall'estratto di fig.~\ref{fig:kstruct_file}, la struttura
292 \kstruct{file} contiene, oltre ad alcune informazioni usate dall'interfaccia
293 dei file descriptor il cui significato emergerà più avanti, il puntatore
294 \var{f\_op} ad una struttura \kstruct{file\_operation}. Questa è l'analoga per
295 i file di \kstruct{inode\_operation}, e definisce le operazioni generiche
296 fornite dal VFS per i file. Si sono riportate in
297 tab.~\ref{tab:file_file_operations} le più significative.
298
299 \begin{table}[htb]
300   \centering
301   \footnotesize
302   \begin{tabular}[c]{|l|p{8cm}|}
303     \hline
304     \textbf{Funzione} & \textbf{Operazione} \\
305     \hline
306     \hline
307     \textsl{\code{open}}   & Apre il file (vedi sez.~\ref{sec:file_open}).\\
308     \textsl{\code{read}}   & Legge dal file (vedi sez.~\ref{sec:file_read}).\\
309     \textsl{\code{write}}  & Scrive sul file (vedi 
310                              sez.~\ref{sec:file_write}).\\
311     \textsl{\code{llseek}} & Sposta la posizione corrente sul file (vedi
312                              sez.~\ref{sec:file_lseek}).\\
313     \textsl{\code{ioctl}}  & Accede alle operazioni di controllo 
314                              (vedi sez.~\ref{sec:file_ioctl}).\\
315     \textsl{\code{readdir}}& Legge il contenuto di una directory (vedi 
316                              sez.~\ref{sec:file_dir_read}).\\
317     \textsl{\code{poll}}   & Usata nell'I/O multiplexing (vedi
318                              sez.~\ref{sec:file_multiplexing}).\\
319     \textsl{\code{mmap}}   & Mappa il file in memoria (vedi 
320                              sez.~\ref{sec:file_memory_map}).\\
321     \textsl{\code{release}}& Chiamata quando l'ultimo riferimento a un file 
322                              aperto è chiuso.\\
323     \textsl{\code{fsync}}  & Sincronizza il contenuto del file (vedi
324                              sez.~\ref{sec:file_sync}).\\
325     \textsl{\code{fasync}} & Abilita l'I/O asincrono (vedi
326                              sez.~\ref{sec:file_asyncronous_io}) sul file.\\
327     \hline
328   \end{tabular}
329   \caption{Operazioni sui file definite tramite \kstruct{file\_operation}.}
330   \label{tab:file_file_operations}
331 \end{table}
332
333 Anche in questo caso tutte le volte che deve essere eseguita una
334 \textit{system call} o una qualunque altra operazione sul file il VFS andrà ad
335 utilizzare la funzione corrispondente attraverso il puntatore
336 \var{f\_op}. Dato che è cura del VFS quando crea la struttura all'apertura del
337 file assegnare a \var{f\_op} il puntatore alla versione di
338 \kstruct{file\_operation} corretta per quel file, sarà possibile scrivere allo
339 stesso modo sulla porta seriale come su un normale file di dati, e lavorare
340 sui file allo stesso modo indipendentemente dal filesystem.
341
342 Il VFS realizza la quasi totalità delle operazioni relative ai file grazie
343 alle funzioni presenti nelle due strutture \kstruct{inode\_operation} e
344 \kstruct{file\_operation}.  Ovviamente non è detto che tutte le operazioni
345 possibili siano poi disponibili in tutti i casi, ad esempio \code{llseek} non
346 sarà presente per un dispositivo come la porta seriale o per una fifo, mentre
347 sui file del filesystem \texttt{vfat} non saranno disponibili i permessi, ma
348 resta il fatto che grazie al VFS le \textit{system call} per le operazioni sui
349 file possono restare sempre le stesse nonostante le enormi differenze che
350 possono esserci negli oggetti a cui si applicano.
351  
352
353 \itindend{Virtual~File~System}
354
355 % NOTE: documentazione interessante:
356 %       * sorgenti del kernel: Documentation/filesystems/vfs.txt
357 %       * http://thecoffeedesk.com/geocities/rkfs.html
358 %       * http://www.linux.it/~rubini/docs/vfs/vfs.html
359
360
361
362 \subsection{Il funzionamento di un filesystem Unix}
363 \label{sec:file_filesystem}
364
365 Come già accennato in sez.~\ref{sec:file_arch_overview} Linux (ed ogni sistema
366 unix-like) organizza i dati che tiene su disco attraverso l'uso di un
367 filesystem. Una delle caratteristiche di Linux rispetto agli altri Unix è
368 quella di poter supportare, grazie al VFS, una enorme quantità di filesystem
369 diversi, ognuno dei quali avrà una sua particolare struttura e funzionalità
370 proprie.  Per questo non entreremo nei dettagli di un filesystem specifico, ma
371 daremo una descrizione a grandi linee che si adatta alle caratteristiche
372 comuni di qualunque filesystem di un sistema unix-like.
373
374 Una possibile strutturazione dell'informazione su un disco è riportata in
375 fig.~\ref{fig:file_disk_filesys}, dove si hanno tre filesystem su tre
376 partizioni. In essa per semplicità si è fatto riferimento alla struttura del
377 filesystem \acr{ext2}, che prevede una suddivisione dei dati in \textit{block
378   group}.  All'interno di ciascun \textit{block group} viene anzitutto
379 replicato il cosiddetto \itindex{superblock} \textit{superblock}, (la
380 struttura che contiene l'indice iniziale del filesystem e che consente di
381 accedere a tutti i dati sottostanti) e creata una opportuna suddivisione dei
382 dati e delle informazioni per accedere agli stessi.  Sulle caratteristiche di
383 \acr{ext2} e derivati torneremo in sez.~\ref{sec:file_ext2}.
384
385 \itindbeg{inode}
386
387 È comunque caratteristica comune di tutti i filesystem per Unix,
388 indipendentemente da come poi viene strutturata nei dettagli questa
389 informazione, prevedere la presenza di due tipi di risorse: gli
390 \textit{inode}, cui abbiamo già accennato in sez.~\ref{sec:file_vfs_work}, che
391 sono le strutture che identificano i singoli oggetti sul filesystem, e i
392 blocchi, che invece attengono allo spazio disco che viene messo a disposizione
393 per i dati in essi contenuti.
394
395 \begin{figure}[!htb]
396   \centering
397   \includegraphics[width=12cm]{img/disk_struct}
398   \caption{Organizzazione dello spazio su un disco in partizioni e
399   filesystem.}
400   \label{fig:file_disk_filesys}
401 \end{figure}
402
403 Se si va ad esaminare con maggiore dettaglio la strutturazione
404 dell'informazione all'interno del filesystem \textsl{ext2}, tralasciando i
405 dettagli relativi al funzionamento del filesystem stesso come la
406 strutturazione in gruppi dei blocchi, il \itindex{superblock}
407 \textit{superblock} e tutti i dati di gestione possiamo esemplificare la
408 situazione con uno schema come quello esposto in
409 fig.~\ref{fig:file_filesys_detail}.
410
411 \begin{figure}[!htb]
412   \centering
413   \includegraphics[width=12cm]{img/filesys_struct}
414   \caption{Strutturazione dei dati all'interno di un filesystem.}
415   \label{fig:file_filesys_detail}
416 \end{figure}
417
418 Da fig.~\ref{fig:file_filesys_detail} si evidenziano alcune delle
419 caratteristiche di base di un filesystem, che restano le stesse anche su
420 filesystem la cui organizzazione dei dati è totalmente diversa da quella
421 illustrata, e sulle quali è bene porre attenzione visto che sono fondamentali
422 per capire il funzionamento delle funzioni che manipolano i file e le
423 directory che tratteremo nel prosieguo del capitolo. In particolare è
424 opportuno tenere sempre presente che:
425
426
427 \begin{enumerate}
428   
429 \item L'\textit{inode} contiene i cosiddetti \textsl{metadati}, vale dire le
430   informazioni riguardanti le proprietà del file come oggetto del filesystem:
431   il tipo di file, i permessi di accesso, le dimensioni, i puntatori ai
432   blocchi fisici che contengono i dati e così via. Le informazioni che la
433   funzione \func{stat} (vedi sez.~\ref{sec:file_stat}) fornisce provengono
434   dall'\textit{inode}.  Dentro una directory si troverà solo il nome del file
435   e il numero dell'\textit{inode} ad esso associato; il nome non è una
436   proprietà del file e non viene mantenuto nell'\textit{inode}. Da da qui in
437   poi chiameremo il nome del file contenuto in una directory
438   ``\textsl{voce}'', come traduzione della nomenclatura inglese
439   \textit{directory entry} che non useremo per evitare confusione con le
440   \textit{dentry} del kernel viste in sez.~\ref{sec:file_vfs_work}.
441   
442 \item Come mostrato in fig.~\ref{fig:file_filesys_detail} per i file
443   \texttt{macro.tex} e \texttt{gapil\_macro.tex}, ci possono avere più voci
444   che fanno riferimento allo stesso \textit{inode}. Fra le proprietà di un
445   file mantenute nell'\textit{inode} c'è anche il contatore con il numero di
446   riferimenti che sono stati fatti ad esso, il cosiddetto \textit{link
447     count}.\footnote{mantenuto anche nel campo \var{i\_nlink} della struttura
448     \kstruct{inode} di fig.~\ref{fig:kstruct_inode}.}  Solo quando questo
449   contatore si annulla i dati del file possono essere effettivamente rimossi
450   dal disco. Per questo la funzione per cancellare un file si chiama
451   \func{unlink} (vedi sez.~\ref{sec:file_link}), ed in realtà non cancella
452   affatto i dati del file, ma si limita ad eliminare la relativa voce da una
453   directory e decrementare il numero di riferimenti nell'\textit{inode}.
454   
455 \item All'interno di ogni filesystem ogni \textit{inode} è identificato da un
456   numero univoco. Il numero di \textit{inode} associato ad una voce in una
457   directory si riferisce ad questo numero e non ci può essere una directory
458   che contiene riferimenti ad \textit{inode} relativi ad altri filesystem.
459   Questa è la ragione che limita l'uso del comando \cmd{ln}, che crea una
460   nuova voce per un file esistente con la funzione \func{link} (vedi
461   sez.~\ref{sec:file_link}) a file nel filesystem corrente.
462   
463 \item Quando si cambia nome ad un file senza cambiare filesystem il contenuto
464   del file non viene spostato fisicamente, viene semplicemente creata una
465   nuova voce per l'\textit{inode} in questione e rimossa la precedente, questa
466   è la modalità in cui opera normalmente il comando \cmd{mv} attraverso la
467   funzione \func{rename} (vedi sez.~\ref{sec:file_remove}). Questa operazione
468   non modifica minimamente neanche l'\textit{inode} del file, dato che non si
469   opera sul file ma sulla directory che lo contiene.
470
471 \item Gli \textit{inode} dei file, che contengono i \textsl{metadati}, ed i
472   blocchi di spazio disco, che contengono i dati, sono risorse indipendenti ed
473   in genere vengono gestite come tali anche dai diversi filesystem; è pertanto
474   possibile esaurire sia lo spazio disco (il caso più comune) che lo spazio
475   per gli \textit{inode}. Nel primo caso non sarà possibile allocare ulteriore
476   spazio, ma si potranno creare file (vuoti), nel secondo non si potranno
477   creare nuovi file, ma si potranno estendere quelli che ci
478   sono.\footnote{questo comportamento non è generale, alcuni filesystem
479     evoluti possono evitare il problema dell'esaurimento degli \textit{inode}
480     riallocando lo spazio disco libero per i blocchi.}
481
482 \end{enumerate}
483
484 \begin{figure}[!htb]
485   \centering 
486   \includegraphics[width=12cm]{img/dir_links}
487   \caption{Organizzazione dei \textit{link} per le directory.}
488   \label{fig:file_dirs_link}
489 \end{figure}
490
491 Infine tenga presente che, essendo file pure loro, il numero di riferimenti
492 esiste anche per le directory. Per questo se a partire dalla situazione
493 mostrata in fig.~\ref{fig:file_filesys_detail} creiamo una nuova directory
494 \file{img} nella directory \file{gapil}, avremo una situazione come quella
495 illustrata in fig.~\ref{fig:file_dirs_link}.
496
497 La nuova directory avrà un numero di riferimenti pari a due, in quanto è
498 referenziata dalla directory da cui si era partiti (in cui è inserita la nuova
499 voce che fa riferimento a \texttt{img}) e dalla voce interna ``\texttt{.}''
500 che è presente in ogni directory.  Questo è il valore che si troverà sempre
501 per ogni directory che non contenga a sua volta altre directory. Al contempo,
502 la directory da cui si era partiti avrà un numero di riferimenti di almeno
503 tre, in quanto adesso sarà referenziata anche dalla voce ``\texttt{..}'' di
504 \texttt{img}. L'aggiunta di una sottodirectory fa cioè crescere di uno il
505 \textit{link count} della directory genitrice.
506
507 \itindend{inode}
508
509
510 \subsection{Alcuni dettagli sul filesystem \textsl{ext2} e successori}
511 \label{sec:file_ext2}
512
513
514 Benché non esista ``il'' filesystem di Linux, dato che esiste un supporto
515 nativo di diversi filesystem che sono in uso da anni, quello che gli avvicina
516 di più è la famiglia di filesystem evolutasi a partire dal \textit{second
517   extended filesystem}, o \acr{ext2}. Il filesystem \acr{ext2} ha subito un
518 grande sviluppo e diverse evoluzioni, fra cui l'aggiunta del
519 \textit{journaling} con \acr{ext3}, probabilmente ancora il filesystem più
520 diffuso, ed una serie di ulteriori miglioramento con il successivo \acr{ext4},
521 che sta iniziando a sostituirlo gradualmente. In futuro è previsto che questo
522 debba essere sostituito da un filesystem completamente diverso, \acr{btrfs},
523 che dovrebbe diventare il filesystem standard di Linux, ma questo al momento è
524 ancora in fase di sviluppo.\footnote{si fa riferimento al momento dell'ultima
525   revisione di di questo paragrafo, l'inizio del 2012.}
526
527 Il filesystem \acr{ext2} nasce come filesystem nativo per Linux a partire
528 dalle prime versioni del kernel e supporta tutte le caratteristiche di un
529 filesystem standard Unix: è in grado di gestire nomi di file lunghi (256
530 caratteri, estensibili a 1012) e supporta una dimensione massima dei file fino
531 a 4~Tb. I successivi filesystem \acr{ext3} ed \acr{ext4} sono evoluzioni di
532 questo filesystem, e sia pure con molti miglioramenti ed estensioni
533 significative ne mantengono le caratteristiche fondamentali.
534
535 Oltre alle caratteristiche standard, \acr{ext2} fornisce alcune estensioni che
536 non sono presenti su un classico filesystem di tipo Unix; le principali sono
537 le seguenti:
538 \begin{itemize}
539 \item i \textit{file attributes} consentono di modificare il comportamento del
540   kernel quando agisce su gruppi di file. Possono essere impostati su file e
541   directory e in quest'ultimo caso i nuovi file creati nella directory
542   ereditano i suoi attributi.
543 \item sono supportate entrambe le semantiche di BSD e SVr4 come opzioni di
544   montaggio. La semantica BSD comporta che i file in una directory sono creati
545   con lo stesso identificatore di gruppo della directory che li contiene. La
546   semantica SVr4 comporta che i file vengono creati con l'identificatore del
547   gruppo primario del processo, eccetto il caso in cui la directory ha il bit
548   di \acr{sgid} impostato (per una descrizione dettagliata del significato di
549   questi termini si veda sez.~\ref{sec:file_access_control}), nel qual caso
550   file e subdirectory ereditano sia il \ids{GID} che lo \acr{sgid}.
551 \item l'amministratore può scegliere la dimensione dei blocchi del filesystem
552   in fase di creazione, a seconda delle sue esigenze: blocchi più grandi
553   permettono un accesso più veloce, ma sprecano più spazio disco.
554 \item il filesystem implementa link simbolici veloci, in cui il nome del file
555   non è salvato su un blocco, ma tenuto all'interno \itindex{inode}
556   dell'\textit{inode} (evitando letture multiple e spreco di spazio), non
557   tutti i nomi però possono essere gestiti così per limiti di spazio (il
558   limite è 60 caratteri).
559 \item vengono supportati i file immutabili (che possono solo essere letti) per
560   la protezione di file di configurazione sensibili, o file
561   \textit{append-only} che possono essere aperti in scrittura solo per
562   aggiungere dati (caratteristica utilizzabile per la protezione dei file di
563   log).
564 \end{itemize}
565
566 La struttura di \acr{ext2} è stata ispirata a quella del filesystem di BSD: un
567 filesystem è composto da un insieme di blocchi, la struttura generale è quella
568 riportata in fig.~\ref{fig:file_filesys_detail}, in cui la partizione è divisa
569 in gruppi di blocchi.
570
571 Ciascun gruppo di blocchi contiene una copia delle informazioni essenziali del
572 filesystem (i \itindex{superblock} \textit{superblock} sono quindi ridondati)
573 per una maggiore affidabilità e possibilità di recupero in caso di corruzione
574 del \itindex{superblock} \textit{superblock} principale. L'utilizzo di
575 raggruppamenti di blocchi ha inoltre degli effetti positivi nelle prestazioni
576 dato che viene ridotta la distanza fra i dati e la tabella degli
577 \itindex{inode} inode.
578
579 \begin{figure}[!htb]
580   \centering
581   \includegraphics[width=9cm]{img/dir_struct}  
582   \caption{Struttura delle directory nel \textit{second extended filesystem}.}
583   \label{fig:file_ext2_dirs}
584 \end{figure}
585
586 Le directory sono implementate come una \itindex{linked~list} \textit{linked
587   list} con voci di dimensione variabile. Ciascuna voce della lista contiene
588 il numero di inode \itindex{inode}, la sua lunghezza, il nome del file e la sua
589 lunghezza, secondo lo schema in fig.~\ref{fig:file_ext2_dirs}; in questo modo
590 è possibile implementare nomi per i file anche molto lunghi (fino a 1024
591 caratteri) senza sprecare spazio disco.
592
593 Con l'introduzione del filesystem \textit{ext3} sono state introdotte diverse
594 modifiche strutturali, la principale di queste è quella che \textit{ext3} è un
595 filesystem \textit{journaled}, è cioè in grado di eseguire una registrazione
596 delle operazioni di scrittura su un giornale (uno speciale file interno) in
597 modo da poter garantire il ripristino della coerenza dei dati del
598 filesystem\footnote{si noti bene che si è parlato di dati \textsl{del}
599   filesystem, non di dati \textsl{nel} filesystem, quello di cui viene
600   garantito un veloce ripristino è relativo ai dati della struttura interna
601   del filesystem, non di eventuali dati contenuti nei file che potrebbero
602   essere stati persi.} in brevissimo tempo in caso di interruzione improvvisa
603 della corrente o di crollo del sistema che abbia causato una interruzione
604 della scrittura dei dati sul disco.
605
606 Oltre a questo \textit{ext3} introduce ulteriori modifiche volte a migliorare
607 sia le prestazioni che la semplicità di gestione del filesystem, in
608 particolare per le directory si è passato all'uso di alberi binari con
609 indicizzazione tramite hash al posto delle \textit{linked list} che abbiamo
610 illustrato, ottenendo un forte guadagno di prestazioni in caso di directory
611 contenenti un gran numero di file.
612
613 % TODO (bassa priorità) portare a ext3, ext4 e btrfs ed illustrare le
614 % problematiche che si possono incontrare (in particolare quelle relative alla
615 % perdita di contenuti in caso di crash del sistema)
616 % TODO (media priorità) trattare btrfs quando sarà usato come stabile
617
618
619 \subsection{La gestione dell'uso dei filesystem}
620 \label{sec:sys_file_config}
621
622 Come accennato in sez.~\ref{sec:file_arch_overview} per poter accedere ai file
623 occorre prima rendere disponibile al sistema il filesystem su cui essi sono
624 memorizzati; l'operazione di attivazione del filesystem è chiamata
625 \textsl{montaggio}, per far questo in Linux si usa la funzione \funcd{mount},
626 il cui prototipo è:\footnote{la funzione è una versione specifica di Linux che
627   usa la omonima \textit{system call} e non è portabile.}
628
629 \begin{funcproto}{ 
630 \fhead{sys/mount.h} 
631 \fdecl{mount(const char *source, const char *target, const char
632   *filesystemtype, \\ 
633 \phantom{mount(}unsigned long mountflags, const void *data)}
634 \fdesc{Monta un filesystem.} 
635 }
636
637 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
638   caso \var{errno} assumerà uno dei valori:
639   \begin{errlist}
640   \item[\errcode{EACCES}] non si ha il permesso di accesso su uno dei
641     componenti del \textit{pathname}, o si è cercato di montare un filesystem
642     disponibile in sola lettura senza aver specificato \const{MS\_RDONLY} o il
643     device \param{source} è su un filesystem montato con l'opzione
644     \const{MS\_NODEV}.
645   \item[\errcode{EBUSY}] \param{source} è già montato, o non può essere
646     rimontato in sola lettura perché ci sono ancora file aperti in scrittura,
647     o non può essere montato su \param{target} perché la directory è ancora in
648     uso.
649   \item[\errcode{EINVAL}] il dispositivo \param{source} presenta un
650     \itindex{superblock} \textit{superblock} non valido, o si è cercato di
651     rimontare un filesystem non ancora montato, o di montarlo senza
652     che \param{target} sia un \itindex{mount~point} \textit{mount point} o di
653     spostarlo quando \param{target} non è un \itindex{mount~point}
654     \textit{mount point} o è la radice.
655   \item[\errcode{ELOOP}] si è cercato di spostare un \itindex{mount~point}
656     \textit{mount point} su una sottodirectory di \param{source} o si sono
657     incontrati troppi link simbolici nella risoluzione di un nome.
658   \item[\errcode{EMFILE}] in caso di filesystem virtuale, la tabella dei
659     dispositivi fittizi (chiamati \textit{dummy} nella documentazione inglese)
660     è piena.
661   \item[\errcode{ENODEV}] il tipo \param{filesystemtype} non esiste o non è
662     configurato nel kernel.
663   \item[\errcode{ENOTBLK}] non si è usato un \textit{block device} per
664     \param{source} quando era richiesto.
665   \item[\errcode{ENXIO}] il \itindex{major~number} \textit{major number} del
666     dispositivo \param{source} è sbagliato.
667   \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
668   \end{errlist} 
669   ed inoltre \errval{EFAULT}, \errval{ENOMEM}, \errval{ENAMETOOLONG},
670   \errval{ENOENT}, \errval{ENOTDIR} nel loro significato generico.}
671 \end{funcproto}
672
673 La funzione monta sulla directory indicata da \param{target}, detta
674 \itindex{mount~point} \textit{mount point}, il filesystem contenuto nel file
675 di dispositivo indicato da \param{source}. In entrambi i casi, come daremo per
676 assunto da qui in avanti tutte le volte che si parla di directory o file nel
677 passaggio di un argomento di una funzione, si intende che questi devono essere
678 indicati con la stringa contenente il loro \textit{pathname}.
679
680 Normalmente un filesystem è contenuto su un disco o una partizione, ma come
681 illustrato in sez.~\ref{sec:file_vfs_work} la struttura del
682 \itindex{Virtual~File~System} \textit{Virtual File System} è estremamente
683 flessibile e può essere usata anche per oggetti diversi da un disco. Ad
684 esempio usando il \textit{loop device} si può montare un file qualunque (come
685 l'immagine di un CD-ROM o di un floppy) che contiene l'immagine di un
686 filesystem, inoltre alcuni tipi di filesystem, come \texttt{proc} o
687 \texttt{sysfs} sono virtuali e non hanno un supporto che ne contenga i dati,
688 che invece sono generati al volo ad ogni lettura, e passati indietro al kernel
689 ad ogni scrittura.\footnote{costituiscono quindi un meccanismo di
690   comunicazione, attraverso l'ordinaria interfaccia dei file, con il kernel.}
691
692 Il tipo di filesystem che si vuole montare è specificato
693 dall'argomento \param{filesystemtype}, che deve essere una delle stringhe
694 riportate nel file \procfile{/proc/filesystems} che, come accennato in
695 sez.~\ref{sec:file_vfs_work}, contiene l'elenco dei filesystem supportati dal
696 kernel. Nel caso si sia indicato un filesystem virtuale, che non è associato a
697 nessun file di dispositivo, il contenuto di \param{source} viene ignorato.
698
699 L'argomento \param{data} viene usato per passare le impostazioni relative alle
700 caratteristiche specifiche di ciascun filesystem. Si tratta di una stringa di
701 parole chiave (separate da virgole e senza spazi) che indicano le cosiddette
702 ``\textsl{opzioni}'' del filesystem che devono essere impostate; in genere
703 viene usato direttamente il contenuto del parametro dell'opzione \texttt{-o}
704 del comando \texttt{mount}. I valori utilizzabili dipendono dal tipo di
705 filesystem e ciascuno ha i suoi, pertanto si rimanda alla documentazione della
706 pagina di manuale di questo comando e dei singoli filesystem.
707
708 Dopo l'esecuzione della funzione il contenuto del filesystem viene resto
709 disponibile nella directory specificata come \itindex{mount~point}
710 \textit{mount point}, il precedente contenuto di detta directory viene
711 mascherato dal contenuto della directory radice del filesystem montato. Fino
712 ai kernel della serie 2.2.x non era possibile montare un filesystem se un
713 \textit{mount point} era già in uso. 
714
715 A partire dal kernel 2.4.x inoltre è divenuto possibile sia spostare
716 atomicamente un \itindex{mount~point} \textit{mount point} da una directory ad
717 un'altra, sia montare lo stesso filesystem in diversi \itindex{mount~point}
718 \textit{mount point}, sia montare più filesystem sullo stesso
719 \itindex{mount~point} \textit{mount point} impilandoli l'uno sull'altro, nel
720 qual caso vale comunque quanto detto in precedenza, e cioè che solo il
721 contenuto dell'ultimo filesystem montato sarà visibile.
722
723 Oltre alle opzioni specifiche di ciascun filesystem, che si passano nella
724 forma della lista di parole chiave indicata con l'argomento \param{data},
725 esistono pure alcune opzioni che si possono applicare in generale, anche se
726 non è detto che tutti i filesystem le supportino, che si specificano tramite
727 l'argomento \param{mountflags}.  L'argomento inoltre può essere utilizzato per
728 modificare il comportamento della funzione, facendole compiere una operazione
729 diversa (ad esempio un rimontaggio, invece che un montaggio).
730
731 In Linux \param{mountflags} deve essere un intero a 32 bit; fino ai kernel
732 della serie 2.2.x i 16 più significativi avevano un valore riservato che
733 doveva essere specificato obbligatoriamente,\footnote{il valore era il
734   \itindex{magic~number} \textit{magic number} \code{0xC0ED}, si può usare la
735   costante \const{MS\_MGC\_MSK} per ottenere la parte di \param{mountflags}
736   riservata al \textit{magic number}, mentre per specificarlo si può dare un
737   OR aritmetico con la costante \const{MS\_MGC\_VAL}.} e si potevano usare
738 solo i 16 meno significativi. Oggi invece, con un numero di opzioni superiore,
739 sono utilizzati tutti e 32 i bit, ma qualora nei 16 più significativi sia
740 presente detto valore, che non esprime una combinazione valida, esso viene
741 ignorato. Il valore dell'argomento deve essere espresso come maschera binaria
742 e i vari bit devono essere impostati con un OR aritmetico dei rispettivi flag,
743 identificati dalle costanti riportate nell'elenco seguente:
744
745 \begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}}
746 \itindbeg{bind~mount}
747 \item[\const{MS\_BIND}] Effettua un cosiddetto \textit{bind mount}, in cui è
748   possibile montare una directory di un filesystem in un'altra directory,
749   l'opzione è disponibile a partire dai kernel della serie 2.4. In questo caso
750   verranno presi in considerazione solo gli argomenti \param{source}, che
751   stavolta indicherà la directory che si vuole montare (e non un file di
752   dispositivo) e \param{target} che indicherà la directory su cui verrà
753   effettuato il \textit{bind mount}. Gli argomenti \param{filesystemtype}
754   e \param{data} vengono ignorati.
755
756   In sostanza quello che avviene è che in corrispondenza del \textit{pathname}
757   indicato da \param{target} viene montato l'\textit{inode} di \param{source},
758   così che la porzione di albero dei file presente sotto
759   \param{source} diventi visibile allo stesso modo sotto
760   \param{target}. Trattandosi esattamente dei dati dello stesso filesystem,
761   ogni modifica fatta in uno qualunque dei due rami di albero sarà visibile
762   nell'altro, visto che entrambi faranno riferimento agli stessi
763   \textit{inode}.
764
765   Dal punto di vista del \itindex{Virtual~File~System} VFS l'operazione è
766   analoga al montaggio di un filesystem proprio nel fatto che anche in questo
767   caso si inserisce in corrispondenza della \textit{dentry} di \texttt{target}
768   un diverso \textit{inode}, che stavolta, invece di essere quello della
769   radice del filesystem indicato da un file di dispositivo, è quello di una
770   directory già montata.
771
772   Si tenga presente che proprio per questo sotto \param{target} comparirà il
773   contenuto che è presente sotto \param{source} all'interno del filesystem in
774   cui quest'ultima è contenuta. Questo potrebbe non corrispondere alla
775   porzione di albero che sta sotto \param{source} qualora in una
776   sottodirectory di quest'ultima si fosse effettuato un altro montaggio. In
777   tal caso infatti nella porzione di albero sotto \param{source} si troverebbe
778   il contenuto del nuovo filesystem (o di un altro \textit{bind mount}) mentre
779   sotto \param{target} ci sarebbe il contenuto presente nel filesystem
780   originale.\footnote{questo evita anche il problema dei \textit{loop} di
781     fig.~\ref{fig:file_link_loop}, dato che se anche si montasse su
782     \param{target} una directory in cui essa è contenuta, il cerchio non
783     potrebbe chiudersi perché ritornati a \param{target} dentro il
784     \textit{bind mount} vi si troverebbe solo il contenuto originale e non si
785     potrebbe tornare indietro.}
786
787   Fino al kernel 2.6.26 questo flag doveva essere usato da solo, in quanto il
788   \textit{bind mount} continuava ad utilizzare le stesse opzioni del montaggio
789   originale, dal 2.6.26 è stato introdotto il supporto per il cosiddetto
790   \textit{read-only bind mount} e viene onorata la presenza del flag
791   \const{MS\_RDONLY}. In questo modo si ottiene che l'accesso ai file sotto
792   \param{target} sia effettuabile esclusivamente in sola lettura.
793
794   Il supporto per il \textit{bind mount} consente di superare i limiti
795   presenti per gli \textit{hard link} (di cui parleremo in
796   sez.~\ref{sec:file_link}) ottenendo un qualcosa di analogo in cui si può
797   fare riferimento alla porzione dell'albero dei file di un filesystem
798   presente a partire da una certa directory utilizzando una qualunque altra
799   directory, anche se questa sta su un filesystem diverso. Si può così fornire
800   una alternativa all'uso dei link simbolici (di cui parleremo in
801   sez.~\ref{sec:file_symlink}) che funziona correttamente anche all'intero di
802   un \textit{chroot} (argomento su cui torneremo in
803   sez.~\ref{sec:file_chroot}.  
804 \itindend{bind~mount}
805
806 \item[\const{MS\_DIRSYNC}] Richiede che ogni modifica al contenuto di una
807   directory venga immediatamente registrata su disco in maniera sincrona
808   (introdotta a partire dai kernel della serie 2.6). L'opzione si applica a
809   tutte le directory del filesystem, ma su alcuni filesystem è possibile
810   impostarla a livello di singole directory o per i sottorami di una directory
811   con il comando \cmd{lsattr}.\footnote{questo avviene tramite delle opportune
812     \texttt{ioctl} (vedi sez.~\ref{sec:file_ioctl}).}
813
814   Questo consente di ridurre al minimo il rischio di perdita dei dati delle
815   directory in caso di crollo improvviso del sistema, al costo di una certa
816   perdita di prestazioni dato che le funzioni di scrittura relative ad
817   operazioni sulle directory non saranno più bufferizzate e si bloccheranno
818   fino all'arrivo dei dati sul disco prima che un programma possa proseguire.
819
820 \item[\const{MS\_MANDLOCK}] Consente l'uso del \textit{mandatory locking}
821   \itindex{mandatory~locking} (vedi sez.~\ref{sec:file_mand_locking}) sui file
822   del filesystem. Per poterlo utilizzare effettivamente però esso dovrà essere
823   comunque attivato esplicitamente per i singoli file impostando i permessi
824   come illustrato in sez.~\ref{sec:file_mand_locking}.
825
826 \item[\const{MS\_MOVE}] Effettua uno del spostamento del \itindex{mount~point}
827   \textit{mount point} di un filesystem. La directory del
828   \itindex{mount~point} \textit{mount point} originale deve essere indicata
829   nell'argomento \param{source}, e la sua nuova posizione
830   nell'argomento \param{target}. Tutti gli altri argomenti della funzione
831   vengono ignorati.
832
833   Lo spostamento avviene atomicamente, ed il ramo di albero presente
834   sotto \param{source} sarà immediatamente visibile sotto \param{target}. Non
835   esiste cioè nessun momento in cui il filesystem non risulti montato in una o
836   nell'altra directory e pertanto è garantito che la risoluzione di
837   \itindsub{pathname}{relativo} \textit{pathname} relativi all'interno del
838   filesystem non possa fallire.
839
840 \item[\const{MS\_NOATIME}] Viene disabilitato sul filesystem l'aggiornamento
841   degli \textit{access time} (vedi sez.~\ref{sec:file_file_times}) per
842   qualunque tipo di file. Dato che l'aggiornamento degli \textit{access time}
843   è una funzionalità la cui utilità è spesso irrilevante ma comporta un costo
844   elevato visto che una qualunque lettura comporta comunque una scrittura su
845   disco,\footnote{e questo ad esempio ha conseguenze molto pesanti nell'uso
846     della batteria sui portatili.} questa opzione consente di disabilitarla
847   completamente. La soluzione può risultare troppo drastica dato che
848   l'informazione viene comunque utilizzata da alcuni programmi, per cui nello
849   sviluppo del kernel sono state introdotte altre opzioni che forniscono
850   soluzioni più appropriate e meno radicali.
851
852 \item[\const{MS\_NODEV}] Viene disabilitato sul filesystem l'accesso ai file
853   di dispositivo eventualmente presenti su di esso. L'opzione viene usata come
854   misura di precauzione per rendere inutile la presenza di eventuali file di
855   dispositivo su filesystem che non dovrebbero contenerne.\footnote{si ricordi
856     che le convenzioni del \itindex{Filesystem~Hierarchy~Standard~(FHS)}
857     \textit{Linux Filesystem Hierarchy Standard} richiedono che questi siano
858     mantenuti esclusivamente sotto \texttt{/dev}.}
859
860   Viene utilizzata, assieme a \const{MS\_NOEXEC} e \const{MS\_NOSUID}, per
861   fornire un accesso più controllato a quei filesystem di cui gli utenti hanno
862   il controllo dei contenuti, in particolar modo quelli posti su dispositivi
863   rimuovibili. In questo modo si evitano alla radice possibili situazioni in
864   cui un utente malizioso inserisce su uno di questi filesystem dei file di
865   dispositivo con permessi ``opportunamente'' ampliati che gli consentano di
866   accedere anche a risorse cui non dovrebbe.
867
868 \item[\const{MS\_NODIRATIME}] Viene disabilitato sul filesystem
869   l'aggiornamento degli \textit{access time} (vedi
870   sez.~\ref{sec:file_file_times}), ma soltanto per le directory. Costituisce
871   una alternativa per \const{MS\_NOATIME}, che elimina l'informazione per le
872   directory, che in pratica che non viene mai utilizzata, mantenendola per i
873   file in cui invece ha un impiego, sia pur limitato.
874
875 \item[\const{MS\_NOEXEC}] Viene disabilitata sul filesystem l'esecuzione di un
876   qualunque file eseguibile eventualmente presente su di esso. L'opzione viene
877   usata come misura di precauzione per rendere impossibile l'uso di programmi
878   posti su filesystem che non dovrebbero contenerne.
879
880   Anche in questo caso viene utilizzata per fornire un accesso più controllato
881   a quei filesystem di cui gli utenti hanno il controllo dei contenuti. Da
882   questo punto di vista l'opzione è meno importante delle analoghe
883   \const{MS\_NODEV} e \const{MS\_NOSUID} in quanto l'esecuzione di un
884   programma creato dall'utente pone un livello di rischio nettamente
885   inferiore, ed è in genere consentita per i file contenuti nella sua home
886   directory.\footnote{cosa che renderebbe superfluo l'attivazione di questa
887     opzione, il cui uso ha senso solo per ambienti molto controllati in cui si
888     vuole che gli utenti eseguano solo i programmi forniti
889     dall'amministratore.}
890
891 \item[\const{MS\_NOSUID}] Viene disabilitato sul filesystem l'effetto dei bit
892   dei permessi \itindex{suid~bit} \acr{suid} e \itindex{sgid~bit} \acr{sgid}
893   (vedi sez.~\ref{sec:file_special_perm}) eventualmente presenti sui file in
894   esso contenuti. L'opzione viene usata come misura di precauzione per rendere
895   inefficace l'effetto di questi bit per filesystem in cui non ci dovrebbero
896   essere file dotati di questi permessi.
897
898   Di nuovo viene utilizzata, analogamente a \const{MS\_NOEXEC} e
899   \const{MS\_NODEV}, per fornire un accesso più controllato a quei filesystem
900   di cui gli utenti hanno il controllo dei contenuti. In questo caso si evita
901   che un utente malizioso possa inserire su uno di questi filesystem un
902   eseguibile con il bit \itindex{suid~bit} \acr{suid} attivo e di proprietà
903   dell'amministratore o di un altro utente, che gli consentirebbe di eseguirlo
904   per conto di quest'ultimo.
905
906 \item[\const{MS\_PRIVATE}] Marca un \itindex{mount~point} \textit{mount point}
907   come privato. Si tratta di una delle nuove opzioni (insieme a
908   \const{MS\_SHARED}, \const{MS\_SLAVE} e \const{MS\_UNBINDABLE}) facenti
909   parte dell'infrastruttura degli \itindex{shared~subtree} \textit{shared
910     subtree} introdotta a partire dal kernel 2.6.15, che estendono le
911   funzionalità dei \itindex{bind~mount} \textit{bind mount}. In questo caso
912   \param{target} dovrà fare riferimento al \textit{mount point} che si intende
913   marcare, e tutti gli altri argomenti verranno ignorati.
914
915   Di default, finché non lo si marca altrimenti con una delle altre opzioni
916   dell'interfaccia \itindex{shared~subtree} \textit{shared subtree}, ogni
917   \textit{mount point} è privato. Ogni \textit{bind mount} ottenuto da un
918   \itindex{mount~point} \textit{mount point} di tipo \textit{private} si
919   comporta come descritto nella trattazione di \const{MS\_BIND}. Si usa questo
920   flag principalmente per revocare gli effetti delle altre opzioni e riportare
921   il comportamento a quello ordinario.
922
923 \item[\const{MS\_RDONLY}] Esegue il montaggio del filesystem in sola lettura,
924   non sarà possibile nessuna modifica ai suoi contenuti. Viene usato tutte le
925   volte che si deve accedere ai contenuti di un filesystem con la certezza che
926   questo non venga modificato (ad esempio per ispezionare un filesystem
927   corrotto). All'avvio di default il kernel monta la radice in questa
928   modalità.
929
930 \item[\const{MS\_REC}] Applica ricorsivamente a tutti i \itindex{mount~point}
931   \textit{mount point} presenti al di sotto del \textit{mount point} indicato
932   gli effetti della opzione degli \itindex{shared~subtree} \textit{shared
933     subtree} associata. Anche questo caso l'argomento \param{target} deve fare
934   riferimento ad un \itindex{mount~point} \textit{mount point} e tutti gli
935   altri argomenti sono ignorati, ed il flag deve essere indicato assieme ad
936   una fra \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
937   \const{MS\_UNBINDABLE}.
938
939 \item[\const{MS\_RELATIME}] Indica di effettuare l'aggiornamento degli
940   \textit{access time} sul filesystem soltanto quando questo risulti
941   antecedente il valore corrente del \textit{modification time} o del
942   \textit{change time} (per i tempi dei file si veda
943   sez.~\ref{sec:file_file_times}). L'opzione è disponibile a partire dal
944   kernel 2.6.20, mentre dal 2.6.30 questo è diventato il comportamento di
945   default del sistema, che può essere riportato a quello tradizionale con
946   l'uso di \const{MS\_STRICTATIME}. Sempre dal 2.6.30 il comportamento è stato
947   anche modificato e l'\textit{access time} viene comunque aggiornato se è più
948   vecchio di un giorno.
949
950   L'opzione consente di evitare i problemi di prestazioni relativi
951   all'aggiornamento dell'\textit{access time} senza avere impatti negativi
952   riguardo le funzionalità, il comportamento adottato infatti consente di
953   rendere evidente che vi è stato un accesso dopo la scrittura, ed evitando al
954   contempo ulteriori operazioni su disco negli accessi successivi. In questo
955   modo l'informazione relativa al fatto che un file sia stato letto resta
956   disponibile, ed i programmi che ne fanno uso continuano a funzionare. Con
957   l'introduzione di questo comportamento l'uso delle alternative
958   \const{MS\_NOATIME} e \const{MS\_NODIRATIME} è sostanzialmente inutile.
959
960 \item[\const{MS\_REMOUNT}] Consente di rimontare un filesystem già montato
961   cambiandone le opzioni di montaggio in maniera atomica. In questo modo si
962   possono modificare le opzioni del filesystem anche se questo è in uso. Gli
963   argomenti \param{source} e \param{target} devono essere gli stessi usati per
964   il montaggio originale, mentre \param{data} che \param{mountflags}
965   conterranno le nuove opzioni, \param{filesystemtype} viene ignorato.
966
967   Qualunque opzione specifica del filesystem indicata con \param{data} può
968   essere modificata, mentre con \param{mountflags} possono essere modificate
969   solo alcune opzioni generiche. Con i kernel più recenti queste sono soltanto
970   \const{MS\_MANDLOCK}, \const{MS\_RDONLY} e \const{MS\_SYNCHRONOUS}, prima
971   del kernel 2.6.16 potevano essere modificate anche le ulteriori
972   \const{MS\_NOATIME} e \const{MS\_NODIRATIME}, ed infine prima del kernel
973   2.4.10 anche \const{MS\_NODEV}, \const{MS\_NOEXEC} e \const{MS\_NOSUID}.
974
975 \item[\const{MS\_SHARED}] Marca un \itindex{mount~point} \textit{mount point}
976   come \textit{shared mount}.  Si tratta di una delle nuove opzioni (insieme a
977   \const{MS\_PRIVATE}, \const{MS\_SLAVE} e \const{MS\_UNBINDABLE}) facenti
978   parte dell'infrastruttura degli \itindex{shared~subtree} \textit{shared
979     subtree} introdotta a partire dal kernel 2.6.15, che estendono le
980   funzionalità dei \itindex{bind~mount} \textit{bind mount}.  In questo caso
981   \param{target} dovrà fare riferimento al \itindex{mount~point} \textit{mount
982     point} che si intende marcare, e tutti gli altri argomenti verranno
983   ignorati.
984
985   Lo scopo dell'opzione è ottenere che tutti i successivi \textit{bind mount}
986   effettuati da un \textit{mount point} marcato da essa siano di tipo
987   \textit{shared}, cioè ``\textsl{condividano}'' con l'originale e fra di loro
988   ogni ulteriore operazione di montaggio o smontaggio che avviene su una
989   directory al di sotto di uno qualunque di essi. Le operazioni di montaggio e
990   smontaggio cioè vengono ``\textsl{propagate}'' a tutti i \textit{mount
991     point} della stessa condivisione, e la sezione di albero di file vista al
992   di sotto di ciascuno di essi sarà sempre identica.
993
994 \item[\const{MS\_SILENT}] Richiede la soppressione di alcuni messaggi di
995   avvertimento nei log del kernel (vedi sez.~\ref{sec:sess_daemon}). L'opzione
996   è presente a partire dal kernel 2.6.17 e sostituisce, utilizzando un nome
997   non fuorviante, la precedente \const{MS\_VERBOSE}, introdotta nel kernel
998   2.6.12, che aveva lo stesso effetto.
999
1000 \item[\const{MS\_SLAVE}] Marca un \itindex{mount~point} \textit{mount point}
1001   come \textit{slave mount}. Si tratta di una delle nuove opzioni (insieme a
1002   \const{MS\_PRIVATE}, \const{MS\_SHARED} e \const{MS\_UNBINDABLE}) facenti
1003   parte dell'infrastruttura degli \itindex{shared~subtree} \textit{shared
1004     subtree} introdotta a partire dal kernel 2.6.15, che estendono le
1005   funzionalità dei \itindex{bind~mount} \textit{bind mount}.  In questo caso
1006   \param{target} dovrà fare riferimento al \textit{mount point} che si intende
1007   marcare, e tutti gli altri argomenti verranno ignorati.
1008
1009   Lo scopo dell'opzione è ottenere che tutti i successivi \textit{bind mount}
1010   effettuati da un \textit{mount point} marcato da essa siano di tipo
1011   \textit{slave}, cioè ``\textsl{condividano}'' ogni ulteriore operazione di
1012   montaggio o smontaggio che avviene su una directory al di sotto del
1013   \textit{mount point} originale.  Le operazioni di montaggio e smontaggio in
1014   questo caso vengono ``\textsl{propagate}'' soltanto dal \textit{mount point}
1015   originale (detto anche \textit{master}) verso gli \textit{slave}, mentre
1016   essi potranno eseguire al loro interno ulteriori montaggi che non saranno
1017   propagati né negli altri né nel \itindex{mount~point} \textit{mount point}
1018   originale.
1019
1020 \item[\const{MS\_STRICTATIME}] Ripristina il comportamento tradizionale per
1021   cui l'\textit{access time} viene aggiornato ad ogni accesso al
1022   file. L'opzione è disponibile solo a partire dal kernel 2.6.30 quando il
1023   comportamento di default del kernel è diventato quello fornito da
1024   \const{MS\_RELATIME}.
1025
1026 \item[\const{MS\_SYNCHRONOUS}] Abilita la scrittura sincrona richiedendo che
1027   ogni modifica al contenuto del filesystem venga immediatamente registrata su
1028   disco. Lo stesso comportamento può essere ottenuto con il flag
1029   \const{O\_SYNC} di \func{open} (vedi sez.~\ref{sec:file_open}).
1030
1031   Questa opzione consente di ridurre al minimo il rischio di perdita dei dati
1032   in caso di crollo improvviso del sistema, al costo di una pesante perdita di
1033   prestazioni dato che tutte le funzioni di scrittura non saranno più
1034   bufferizzate e si bloccheranno fino all'arrivo dei dati sul disco. Per un
1035   compromesso in cui questo comportamento avviene solo per le directory, ed ha
1036   quindi una incidenza nettamente minore, si può usare \const{MS\_DIRSYNC}.
1037
1038 \item[\const{MS\_UNBINDABLE}] Marca un \itindex{mount~point} \textit{mount
1039     point} come \textit{unbindable mount}. Si tratta di una delle nuove
1040   opzioni (insieme a \const{MS\_PRIVATE}, \const{MS\_SHARED} e
1041   \const{MS\_SLAVE}) facenti parte dell'infrastruttura degli
1042   \itindex{shared~subtree} \textit{shared subtree} introdotta a partire dal
1043   kernel 2.6.15, che estendono le funzionalità dei \itindex{bind~mount}
1044   \textit{bind mount}.  In questo caso
1045   \param{target} dovrà fare riferimento al \textit{mount point} che si intende
1046   marcare, e tutti gli altri argomenti verranno ignorati.
1047
1048   Un \textit{mount point} marcato in questo modo disabilità la capacità di
1049   eseguire dei \itindex{bind~mount} \textit{bind mount}. Si comporta cioè come
1050   allo stesso modo di un \itindex{mount~point} \textit{mount point} ordinario
1051   di tipo \textit{private} con in più la restrizione che nessuna sua
1052   sottodirectory (anche se relativa ad un ulteriore montaggio) possa essere
1053   utilizzata per un come sorgente di un \itindex{bind~mount} \textit{bind
1054     mount}.
1055
1056 \end{basedescript}
1057
1058 % NOTE per \const{MS\_SLAVE},\const{MS\_SHARE}, \const{MS\_PRIVATE} e
1059 % \const{MS\_UNBINDABLE} dal 2.6.15 vedi shared subtrees, in particolare
1060 %  * http://lwn.net/Articles/159077/ e
1061 %  * Documentation/filesystems/sharedsubtree.txt
1062
1063 % TODO: (bassa priorità) non documentati ma presenti in sys/mount.h:
1064 %       * MS_POSIXACL
1065 %       * MS_KERNMOUNT
1066 %       * MS_I_VERSION
1067 %       * MS_ACTIVE
1068 %       * MS_NOUSER
1069
1070
1071 Una volta che non si voglia più utilizzare un certo filesystem è possibile
1072 ``\textsl{smontarlo}'' usando la funzione \funcd{umount}, il cui prototipo è:
1073
1074 \begin{funcproto}{ 
1075 \fhead{sys/mount.h}
1076 \fdecl{umount(const char *target)}
1077 \fdesc{Smonta un filesystem.} 
1078 }
1079 {La funzione ritorna  $0$ in caso di successo e $-1$ per un errore,
1080   nel qual caso \var{errno} assumerà uno dei valori: 
1081   \begin{errlist}
1082   \item[\errcode{EBUSY}] il filesystem è occupato.
1083   \item[\errcode{EINVAL}] \param{target} non è un \textit{mount point}.
1084   \item[\errcode{EPERM}] il processo non ha i privilegi di
1085     amministratore.\footnotemark 
1086   \end{errlist}
1087   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
1088   \errval{ENOENT}, \errval{ENOMEM} nel loro significato generico.  }
1089 \end{funcproto}
1090
1091 \footnotetext{più precisamente la \itindex{capabilities} capacità
1092   \texttt{CAP\_SYS\_ADMIN}.}
1093
1094 La funzione prende il nome della directory su cui il filesystem è montato e
1095 non il file o il dispositivo che è stato montato,\footnote{questo è vero a
1096   partire dal kernel 2.3.99-pre7, prima esistevano due chiamate separate e la
1097   funzione poteva essere usata anche specificando il file di dispositivo.} in
1098 quanto a partire dai kernel della serie 2.4.x è possibile montare lo stesso
1099 dispositivo in più punti. Nel caso più di un filesystem sia stato montato
1100 sullo stesso \itindex{mount~point} \textit{mount point} viene smontato quello
1101 che è stato montato per ultimo. Si tenga presente che la funzione fallisce se
1102 il filesystem è ``\textsl{occupato}'', cioè quando ci sono ancora dei file
1103 aperti sul filesystem, se questo contiene la \index{directory~di~lavoro}
1104 directory di lavoro di un qualunque processo o il \itindex{mount~point}
1105 \textit{mount point} di un altro filesystem.
1106
1107 Linux provvede inoltre una seconda funzione, \funcd{umount2}, che consente un
1108 maggior controllo delle operazioni, come forzare lo smontaggio di un
1109 filesystem anche quando questo risulti occupato; il suo prototipo è:
1110
1111 \begin{funcproto}{ 
1112 \fhead{sys/mount.h}
1113 \fdecl{umount2(const char *target, int flags)}
1114 \fdesc{Smonta un filesystem.} 
1115 }
1116 {La funzione ritorna  $0$ in caso di successo e $-1$ per un errore,
1117   nel qual caso \var{errno} assumerà uno dei valori: 
1118   \begin{errlist}
1119      \item[\errcode{BUSY}] \param{target} è la \index{directory~di~lavoro}
1120        directory di lavoro di qualche processo, o contiene dei file aperti, o un
1121        altro mount point.
1122      \item[\errcode{EAGAIN}] si è chiamata la funzione con \const{MNT\_EXPIRE}
1123        ed il filesystem non era occupato.
1124      \item[\errcode{EINVAL}] \param{target} non è un \itindex{mount~point}
1125        \textit{mount point} o si è usato \const{MNT\_EXPIRE} con
1126        \const{MNT\_FORCE} o \const{MNT\_DETACH} o si è specificato un flag non
1127        esistente.
1128   \end{errlist}
1129   e tutti gli altri valori visti per \func{umount} con lo stesso significato.}
1130 \end{funcproto}
1131
1132 Il valore di \param{flags} è una maschera binaria dei flag che controllano le
1133 modalità di smontaggio, che deve essere specificato con un OR aritmetico delle
1134 costanti illustrate in tab.~\ref{tab:umount2_flags}.  Specificando
1135 \const{MNT\_FORCE} la funzione cercherà di liberare il filesystem anche se è
1136 occupato per via di una delle condizioni descritte in precedenza. A seconda
1137 del tipo di filesystem alcune (o tutte) possono essere superate, evitando
1138 l'errore di \errcode{EBUSY}. In tutti i casi prima dello smontaggio viene
1139 eseguita una sincronizzazione dei dati.
1140
1141 \begin{table}[!htb]
1142   \centering
1143   \footnotesize
1144   \begin{tabular}[c]{|l|p{8cm}|}
1145     \hline
1146     \textbf{Costante} & \textbf{Descrizione}\\
1147     \hline
1148     \hline
1149     \const{MNT\_FORCE}  & forza lo smontaggio del filesystem anche se questo è
1150                           occupato (presente dai kernel della serie 2.2).\\
1151     \const{MNT\_DETACH} & esegue uno smontaggio ``\textsl{pigro}'', in cui si
1152                           blocca l'accesso ma si aspetta che il filesystem si
1153                           liberi (presente dal kernel 2.4.11 e dalla
1154                           \acr{glibc} 2.11).\\ 
1155     \const{MNT\_EXPIRE} & se non occupato marca un \itindex{mount~point} 
1156                           \textit{mount point} come ``\textsl{in scadenza}'' in
1157                           modo che ad una successiva chiamata senza utilizzo
1158                           del filesystem questo venga smontato (presente dal
1159                           kernel 2.6.8 e dalla \acr{glibc} 2.11).\\ 
1160     \const{UMOUNT\_NOFOLLOW}& non dereferenzia \param{target} se questo è un
1161                           link simbolico (vedi sez.~\ref{sec:file_symlink})
1162                           evitando problemi di sicurezza (presente dal kernel
1163                           2.6.34).\\ 
1164     \hline
1165   \end{tabular}
1166   \caption{Costanti che identificano i bit dell'argomento \param{flags}
1167     della funzione \func{umount2}.} 
1168   \label{tab:umount2_flags}
1169 \end{table}
1170
1171 Con l'opzione \const{MNT\_DETACH} si richiede invece uno smontaggio
1172 ``\textsl{pigro}'' (o \textit{lazy umount}) in cui il filesystem diventa
1173 inaccessibile per i nuovi processi subito dopo la chiamata della funzione, ma
1174 resta accessibile per quelli che lo hanno ancora in uso e non viene smontato
1175 fintanto che resta occupato.
1176
1177 Con \const{MNT\_EXPIRE}, che non può essere specificato insieme agli altri
1178 due, si marca il \itindex{mount~point} \textit{mount point} di un filesystem
1179 non occupato come ``\textsl{in scadenza}'', in tal caso \func{umount2} ritorna
1180 con un errore di \errcode{EAGAIN}, mentre in caso di filesystem occupato si
1181 sarebbe ricevuto \errcode{BUSY}.  Una volta marcato, se nel frattempo non
1182 viene fatto nessun uso del filesystem, ad una successiva chiamata con
1183 \const{MNT\_EXPIRE} questo verrà smontato. Questo flag consente di realizzare
1184 un meccanismo che smonti automaticamente i filesystem che restano inutilizzato
1185 per un certo periodo di tempo.
1186
1187 % Infine il flag \const{UMOUNT\_NOFOLLOW} impedisce l'uso di un link simbolico
1188 % per \param{target} evitando così che si possano passare ai programmi che
1189 % effettuano lo smontaggio dei filesystem per i quali è previsto la possibilità
1190 % di gestione da parte degli utenti con uno programma \acr{sgid} 
1191
1192 Altre due funzioni specifiche di Linux,\footnote{esse si trovano anche su BSD,
1193   ma con una struttura diversa.} utili per ottenere in maniera diretta
1194 informazioni riguardo al filesystem su cui si trova un certo file, sono
1195 \funcd{statfs} e \funcd{fstatfs}, i cui prototipi sono:
1196
1197 \begin{funcproto}{ 
1198 \fhead{sys/vfs.h}
1199 \fdecl{int statfs(const char *path, struct statfs *buf)}
1200 \fdecl{int fstatfs(int fd, struct statfs *buf)}
1201 \fdesc{Restituiscono informazioni relative ad un filesystem.} 
1202 }
1203 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
1204   nel qual caso \var{errno} assumerà uno dei valori: 
1205   \begin{errlist}
1206   \item[\errcode{ENOSYS}] il filesystem su cui si trova il file specificato
1207     non supporta la funzione.
1208   \end{errlist} ed inoltre \errval{EFAULT} ed \errval{EIO} per entrambe,
1209   \errval{EBADF} per \func{fstatfs}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
1210   \errval{ENOENT}, \errval{EACCES}, \errval{ELOOP} per \func{statfs} nel loro
1211   significato generico.}
1212 \end{funcproto}
1213
1214 Queste funzioni permettono di ottenere una serie di informazioni generali
1215 riguardo al filesystem su cui si trova il file specificato con un ; queste vengono
1216 restituite all'indirizzo \param{buf} di una struttura \struct{statfs} definita
1217 come in fig.~\ref{fig:sys_statfs}, ed i campi che sono indefiniti per il
1218 filesystem in esame sono impostati a zero.  I valori del campo \var{f\_type}
1219 sono definiti per i vari filesystem nei relativi file di header dei sorgenti
1220 del kernel da costanti del tipo \var{XXX\_SUPER\_MAGIC}, dove \var{XXX} in
1221 genere è il nome del filesystem stesso.
1222
1223 \begin{figure}[!htb]
1224   \footnotesize \centering
1225   \begin{minipage}[c]{\textwidth}
1226     \includestruct{listati/statfs.h}
1227   \end{minipage}
1228   \normalsize 
1229   \caption{La struttura \structd{statfs}.} 
1230   \label{fig:sys_statfs}
1231 \end{figure}
1232
1233 Le \acr{glibc} provvedono infine una serie di funzioni per la gestione dei due
1234 file \conffile{/etc/fstab} ed \conffile{/etc/mtab}, che convenzionalmente sono
1235 usati in quasi tutti i sistemi unix-like per mantenere rispettivamente le
1236 informazioni riguardo ai filesystem da montare e a quelli correntemente
1237 montati. Le funzioni servono a leggere il contenuto di questi file in
1238 opportune strutture \struct{fstab} e \struct{mntent}, e, per
1239 \conffile{/etc/mtab} per inserire e rimuovere le voci presenti nel file.
1240
1241 In generale si dovrebbero usare queste funzioni (in particolare quelle
1242 relative a \conffile{/etc/mtab}), quando si debba scrivere un programma che
1243 effettua il montaggio di un filesystem; in realtà in questi casi è molto più
1244 semplice invocare direttamente il programma \cmd{mount}, per cui ne
1245 tralasceremo la trattazione, rimandando al manuale delle \acr{glibc}
1246 \cite{glibc} per la documentazione completa.
1247
1248 % TODO (bassa priorità) scrivere delle funzioni (getfsent e getmntent &C)
1249 % TODO (bassa priorità) documentare ? swapon e swapoff (man 2 ...) 
1250
1251 \section{La gestione di file e directory}
1252 \label{sec:file_dir}
1253
1254 Come già accennato in sez.~\ref{sec:file_filesystem} in un sistema unix-like
1255 la gestione dei file ha delle caratteristiche specifiche che derivano
1256 direttamente dall'architettura del sistema.  In questa sezione esamineremo le
1257 funzioni usate per la manipolazione di file e directory, per la creazione di
1258 link simbolici e diretti, per la gestione e la lettura delle directory.
1259
1260 In particolare ci soffermeremo sulle conseguenze che derivano
1261 dall'architettura dei filesystem illustrata nel capitolo precedente per quanto
1262 riguarda il comportamento e gli effetti delle varie funzioni.
1263
1264
1265 \subsection{Le funzioni \func{link} e \func{unlink}}
1266 \label{sec:file_link}
1267
1268 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
1269 dei nomi fittizi (come gli alias del vecchio MacOS o i collegamenti di Windows
1270 o i nomi logici del VMS) che permettono di fare riferimento allo stesso file
1271 chiamandolo con nomi diversi o accedendovi da directory diverse.
1272
1273 Questo è possibile anche in ambiente Unix, dove tali collegamenti sono
1274 usualmente chiamati \textit{link}; ma data l'architettura del sistema riguardo
1275 la gestione dei file ci sono due metodi sostanzialmente diversi per fare
1276 questa operazione.
1277
1278 Come spiegato in sez.~\ref{sec:file_filesystem} l'accesso al contenuto di un
1279 file su disco avviene passando attraverso il suo \itindex{inode}
1280 \textit{inode}, che è la struttura usata dal kernel che lo identifica
1281 univocamente all'interno di un singolo filesystem. Il nome del file che si
1282 trova nella voce di una directory è solo un'etichetta, mantenuta all'interno
1283 della directory, che viene associata ad un puntatore che fa riferimento al
1284 suddetto \textit{inode}.
1285
1286 Questo significa che, fintanto che si resta sullo stesso filesystem, la
1287 realizzazione di un link è immediata, ed uno stesso file può avere tanti nomi
1288 diversi, dati da altrettante associazioni diverse allo stesso \itindex{inode}
1289 \textit{inode} effettuate tramite ``etichette'' diverse in directory
1290 diverse. Si noti anche che nessuno di questi nomi viene ad assumere una
1291 particolare preferenza o originalità rispetto agli altri, in quanto tutti
1292 fanno comunque riferimento allo stesso \itindex{inode} \textit{inode}.
1293
1294 Per aggiungere ad una directory una voce che faccia riferimento ad un
1295 \itindex{inode} \textit{inode} già esistente si utilizza la funzione
1296 \funcd{link}; si suole chiamare questo tipo di associazione un collegamento
1297 diretto, o \textit{hard link}.  Il prototipo della funzione è il seguente:
1298
1299 \begin{funcproto}{ 
1300 \fhead{unistd.h}
1301 \fdecl{int link(const char *oldpath, const char *newpath)}
1302 \fdesc{Crea un nuovo collegamento diretto (\textit{hard link}).} 
1303 }
1304 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1305   nel qual caso \var{errno} assumerà uno dei valori: 
1306   \begin{errlist}
1307   \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
1308     riferimento ad un filesystem montato sullo stesso \itindex{mount~point}
1309     \textit{mount point}.
1310   \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
1311     \param{newpath} non supporta i link diretti o è una directory.
1312   \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
1313     esiste già.
1314   \item[\errcode{EMLINK}] ci sono troppi link al file \param{oldpath} (il
1315     numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
1316     sez.~\ref{sec:sys_limits}).
1317   \end{errlist} ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG},
1318   \errval{ENOTDIR}, \errval{EFAULT}, \errval{ENOMEM}, \errval{EROFS},
1319   \errval{ELOOP}, \errval{ENOSPC}, \errval{EIO} nel loro significato
1320   generico.}
1321 \end{funcproto}
1322
1323
1324 La funzione crea sul \textit{pathname} \param{newpath} un collegamento diretto
1325 al file indicato da \param{oldpath}.  Per quanto detto la creazione di un
1326 nuovo collegamento diretto non copia il contenuto del file, ma si limita a
1327 creare una voce nella directory specificata da \param{newpath} e ad aumentare
1328 di uno il numero di riferimenti al file (riportato nel campo \var{st\_nlink}
1329 della struttura \struct{stat}, vedi sez.~\ref{sec:file_stat}) aggiungendo il
1330 nuovo nome ai precedenti. Si noti che uno stesso file può essere così chiamato
1331 con vari nomi in diverse directory.
1332
1333 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
1334 collegamento diretto è possibile solo se entrambi i \textit{pathname} sono
1335 nello stesso filesystem; inoltre il filesystem deve supportare i collegamenti
1336 diretti (il meccanismo non è disponibile ad esempio con il filesystem
1337 \acr{vfat} di Windows). In realtà la funzione ha un ulteriore requisito, e
1338 cioè che non solo che i due file siano sullo stesso filesystem, ma anche che
1339 si faccia riferimento ad essi sullo stesso \itindex{mount~point} \textit{mount
1340   point}.\footnote{si tenga presente infatti (vedi
1341   sez.~\ref{sec:sys_file_config}) che a partire dal kernel 2.4 uno stesso
1342   filesystem può essere montato più volte su directory diverse.}
1343
1344 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
1345 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
1346 l'amministratore è in grado di creare un collegamento diretto ad un'altra
1347 directory: questo viene fatto perché con una tale operazione è possibile
1348 creare dei \textit{loop} nel filesystem (vedi l'esempio mostrato in
1349 sez.~\ref{sec:file_symlink}, dove riprenderemo il discorso) che molti programmi
1350 non sono in grado di gestire e la cui rimozione diventerebbe estremamente
1351 complicata (in genere per questo tipo di errori occorre far girare il
1352 programma \cmd{fsck} per riparare il filesystem).
1353
1354 Data la pericolosità di questa operazione e la disponibilità dei link
1355 simbolici (che vedremo in sez.~\ref{sec:file_symlink}) e dei
1356 \itindex{bind~mount} \textit{bind mount} (già visti in
1357 sez.~\ref{sec:sys_file_config}) che possono fornire la stessa funzionalità
1358 senza questi problemi, nel caso di Linux questa capacità è stata completamente
1359 disabilitata, e al tentativo di creare un link diretto ad una directory la
1360 funzione \func{link} restituisce l'errore \errcode{EPERM}.
1361
1362 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
1363 \textit{hard link} ad un link simbolico. In questo caso lo standard POSIX
1364 prevederebbe che quest'ultimo venga risolto e che il collegamento sia
1365 effettuato rispetto al file cui esso punta, e che venga riportato un errore
1366 qualora questo non esista o non sia un file. Questo era anche il comportamento
1367 iniziale di Linux ma a partire dai kernel della serie 2.0.x\footnote{per la
1368   precisione il comportamento era quello previsto dallo standard POSIX fino al
1369   kernel di sviluppo 1.3.56, ed è stato temporaneamente ripristinato anche
1370   durante lo sviluppo della serie 2.1.x, per poi tornare al comportamento
1371   attuale fino ad oggi (per riferimento si veda
1372   \url{http://lwn.net/Articles/293902}).} è stato adottato un comportamento
1373 che non segue più lo standard per cui l'\textit{hard link} viene creato
1374 rispetto al link simbolico, e non al file cui questo punta.
1375
1376 La ragione di questa differenza rispetto allo standard, presente anche in
1377 altri sistemi unix-like, sono dovute al fatto che un link simbolico può fare
1378 riferimento anche ad un file non esistente o a una directory, per i quali
1379 l'\textit{hard link} non può essere creato, per cui la scelta di seguire il
1380 link simbolico è stata ritenuta una scelta scorretta nella progettazione
1381 dell'interfaccia.  Infatti se non ci fosse il comportamento adottato da Linux
1382 sarebbe impossibile creare un \textit{hard link} ad un link simbolico, perché
1383 la funzione lo risolverebbe e l'\textit{hard link} verrebbe creato verso la
1384 destinazione. Invece evitando di seguire lo standard l'operazione diventa
1385 possibile, ed anche il comportamento della funzione risulta molto più
1386 comprensibile. Tanto più che se proprio se si vuole creare un \textit{hard
1387   link} rispetto alla destinazione di un link simbolico è sempre possibile
1388 farlo direttamente.\footnote{ciò non toglie che questo comportamento fuori
1389   standard possa causare problemi, come nell'esempio descritto nell'articolo
1390   citato nella nota precedente, a programmi che non si aspettano questa
1391   differenza rispetto allo standard POSIX.}
1392
1393 La rimozione di un file (o più precisamente della voce che lo referenzia
1394 all'interno di una directory) si effettua con la funzione \funcd{unlink}; il
1395 suo prototipo è il seguente:
1396
1397 \begin{funcproto}{ 
1398 \fhead{unistd.h}
1399 \fdecl{int unlink(const char *pathname)}
1400 \fdesc{Cancella un file.} 
1401 }
1402 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1403   nel qual caso \var{errno} assumerà uno dei valori: 
1404   \begin{errlist}
1405   \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una
1406     directory.\footnotemark 
1407   \item[\errcode{EROFS}] \param{pathname} è su un filesystem montato in sola
1408   lettura.
1409   \item[\errcode{EISDIR}] \param{pathname} fa riferimento a una directory.
1410   \end{errlist} ed inoltre \errval{EACCES}, \errval{EFAULT}, \errval{ENOENT},
1411   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
1412   \errval{EIO} nel loro significato generico.}
1413 \end{funcproto}
1414
1415 \footnotetext{questo è un valore specifico ritornato da Linux che non consente
1416   l'uso di \func{unlink} con le directory (vedi sez.~\ref{sec:file_remove}).
1417   Non è conforme allo standard POSIX, che prescrive invece l'uso di
1418   \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
1419   abbia privilegi sufficienti.}
1420
1421 La funzione cancella il nome specificato da \param{pathname} nella relativa
1422 directory e decrementa il numero di riferimenti nel relativo \itindex{inode}
1423 \textit{inode}. Nel caso di link simbolico cancella il link simbolico; nel
1424 caso di socket, fifo o file di dispositivo \index{file!di~dispositivo} rimuove
1425 il nome, ma come per i file i processi che hanno aperto uno di questi oggetti
1426 possono continuare ad utilizzarlo.
1427
1428 Per cancellare una voce in una directory è necessario avere il permesso di
1429 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
1430 il diritto di esecuzione sulla directory che la contiene (affronteremo in
1431 dettaglio l'argomento dei permessi di file e directory in
1432 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
1433 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
1434 occorrerà anche essere proprietari del file o proprietari della directory (o
1435 root, per cui nessuna delle restrizioni è applicata).
1436
1437 Una delle caratteristiche di queste funzioni è che la creazione/rimozione del
1438 nome dalla directory e l'incremento/decremento del numero di riferimenti
1439 \itindex{inode} nell'\textit{inode} devono essere effettuati in maniera
1440 atomica (si veda sez.~\ref{sec:proc_atom_oper}) senza possibili interruzioni
1441 fra le due operazioni. Per questo entrambe queste funzioni sono realizzate
1442 tramite una singola system call.
1443
1444 Si ricordi infine che un file non viene eliminato dal disco fintanto che tutti
1445 i riferimenti ad esso sono stati cancellati: solo quando il \textit{link
1446   count} mantenuto \itindex{inode} nell'\textit{inode} diventa zero lo spazio
1447 occupato su disco viene rimosso (si ricordi comunque che a questo si aggiunge
1448 sempre un'ulteriore condizione,\footnote{come vedremo in
1449   cap.~\ref{cha:file_unix_interface} il kernel mantiene anche una tabella dei
1450   file aperti nei vari processi, che a sua volta contiene i riferimenti agli
1451   \itindex{inode} \textit{inode} ad essi relativi. Prima di procedere alla
1452   cancellazione dello spazio occupato su disco dal contenuto di un file il
1453   kernel controlla anche questa tabella, per verificare che anche in essa non
1454   ci sia più nessun riferimento all'\textit{inode} in questione.} e cioè che
1455 non ci siano processi che abbiano il suddetto file aperto).
1456
1457 Questa proprietà viene spesso usata per essere sicuri di non lasciare file
1458 temporanei su disco in caso di crash dei programmi; la tecnica è quella di
1459 aprire il file e chiamare \func{unlink} subito dopo, in questo modo il
1460 contenuto del file è sempre disponibile all'interno del processo attraverso il
1461 suo file descriptor (vedi sez.~\ref{sec:file_fd}) fintanto che il processo non
1462 chiude il file, ma non ne resta traccia in nessuna directory, e lo spazio
1463 occupato su disco viene immediatamente rilasciato alla conclusione del
1464 processo (quando tutti i file vengono chiusi).
1465
1466
1467 \subsection{Le funzioni \func{remove} e \func{rename}}
1468 \label{sec:file_remove}
1469
1470 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
1471 \func{unlink} sulle directory; per cancellare una directory si può usare la
1472 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}), oppure la
1473 funzione \funcd{remove}. 
1474
1475 Questa è la funzione prevista dallo standard ANSI C per cancellare un file o
1476 una directory (e funziona anche per i sistemi che non supportano i link
1477 diretti). Per i file è identica a \func{unlink} e per le directory è identica
1478 a \func{rmdir}; il suo prototipo è:
1479
1480 \begin{funcproto}{ 
1481 \fhead{stdio.h}
1482 \fdecl{int remove(const char *pathname)}
1483 \fdesc{Cancella un nome dal filesystem.} 
1484 }
1485 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1486   caso \var{errno} assumerà uno dei valori relativi alla chiamata utilizzata,
1487   pertanto si può fare riferimento a quanto illustrato nelle descrizioni di
1488   \func{unlink} e \func{rmdir}.}
1489 \end{funcproto}
1490
1491 La funzione utilizza la funzione \func{unlink}\footnote{questo vale usando le
1492   \acr{glibc}; nelle libc4 e nelle libc5 la funzione \func{remove} è un
1493   semplice alias alla funzione \func{unlink} e quindi non può essere usata per
1494   le directory.} per cancellare i file e la funzione \func{rmdir} per
1495 cancellare le directory; si tenga presente che per alcune implementazioni del
1496 protocollo NFS utilizzare questa funzione può comportare la scomparsa di file
1497 ancora in uso.
1498
1499 Per cambiare nome ad un file o a una directory (che devono comunque essere
1500 nello stesso filesystem) si usa invece la funzione \funcd{rename},\footnote{la
1501   funzione è definita dallo standard ANSI C, ma si applica solo per i file, lo
1502   standard POSIX estende la funzione anche alle directory.} il cui prototipo
1503 è:
1504
1505 \begin{funcproto}{ 
1506 \fhead{stdio.h}
1507 \fdecl{int rename(const char *oldpath, const char *newpath)}
1508 \fdesc{Rinomina un file.} 
1509 }
1510 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1511   nel qual caso \var{errno} assumerà uno dei valori: 
1512   \begin{errlist}
1513   \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
1514     \param{oldpath} non è una directory.
1515   \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
1516     stesso filesystem.
1517   \item[\errcode{ENOTEMPTY}] \param{newpath} è una directory già esistente e
1518     non vuota.
1519   \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
1520     parte di qualche processo (come \index{directory~di~lavoro} directory di
1521     lavoro o come radice) o del sistema (come \itindex{mount~point}
1522     \textit{mount point}).
1523   \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
1524     \param{oldpath} o più in generale si è cercato di creare una directory come
1525     sotto-directory di se stessa.
1526   \item[\errcode{ENOTDIR}] uno dei componenti dei \textit{pathname} non è una
1527     directory o \param{oldpath} è una directory e 
1528     \param{newpath} esiste e non è una directory.
1529   \end{errlist} ed inoltre \errval{EACCES}, \errval{EPERM}, \errval{EMLINK},
1530   \errval{ENOENT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP} e
1531   \errval{ENOSPC} nel loro significato generico.}
1532 \end{funcproto}
1533
1534 La funzione rinomina il file \param{oldpath} in \param{newpath}, eseguendo se
1535 necessario lo spostamento di un file fra directory diverse. Eventuali altri
1536 link diretti allo stesso file non vengono influenzati.
1537
1538 Il comportamento della funzione è diverso a seconda che si voglia rinominare
1539 un file o una directory; se ci riferisce ad un file allora \param{newpath}, se
1540 esiste, non deve essere una directory (altrimenti si ha l'errore
1541 \errcode{EISDIR}). Nel caso \param{newpath} indichi un file esistente questo
1542 viene cancellato e rimpiazzato (atomicamente).
1543
1544 Se \param{oldpath} è una directory allora \param{newpath}, se esiste, deve
1545 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
1546 (se non è una directory) o \errcode{ENOTEMPTY} (se non è vuota). Chiaramente
1547 \param{newpath} non può contenere \param{oldpath} altrimenti si avrà un errore
1548 \errcode{EINVAL}.
1549
1550 Se \param{oldpath} si riferisce ad un link simbolico questo sarà rinominato; se
1551 \param{newpath} è un link simbolico verrà cancellato come qualunque altro
1552 file.  Infine qualora \param{oldpath} e \param{newpath} siano due nomi dello
1553 stesso file lo standard POSIX prevede che la funzione non dia errore, e non
1554 faccia nulla, lasciando entrambi i nomi; Linux segue questo standard, anche
1555 se, come fatto notare dal manuale delle \textit{glibc}, il comportamento più
1556 ragionevole sarebbe quello di cancellare \param{oldpath}.
1557
1558 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
1559 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
1560 può esistere cioè nessun istante in cui un altro processo può trovare attivi
1561 entrambi i nomi dello stesso file, o, in caso di sostituzione di un file
1562 esistente, non trovare quest'ultimo prima che la sostituzione sia stata
1563 eseguita.
1564
1565 In ogni caso se \param{newpath} esiste e l'operazione fallisce per un qualche
1566 motivo (come un crash del kernel), \func{rename} garantisce di lasciare
1567 presente un'istanza di \param{newpath}. Tuttavia nella sovrascrittura potrà
1568 esistere una finestra in cui sia \param{oldpath} che \param{newpath} fanno
1569 riferimento allo stesso file.
1570
1571
1572 \subsection{I link simbolici}
1573 \label{sec:file_symlink}
1574
1575 Come abbiamo visto in sez.~\ref{sec:file_link} la funzione \func{link} crea
1576 riferimenti agli \itindex{inode} \textit{inode}, pertanto può funzionare
1577 soltanto per file che risiedono sullo stesso filesystem e solo per un
1578 filesystem di tipo Unix.  Inoltre abbiamo visto che in Linux non è consentito
1579 eseguire un link diretto ad una directory.
1580
1581 Per ovviare a queste limitazioni i sistemi Unix supportano un'altra forma di
1582 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
1583 come avviene in altri sistemi operativi, dei file speciali che contengono
1584 semplicemente il riferimento ad un altro file (o directory). In questo modo è
1585 possibile effettuare link anche attraverso filesystem diversi, a file posti in
1586 filesystem che non supportano i link diretti, a delle directory, ed anche a
1587 file che non esistono ancora.
1588
1589 Il sistema funziona in quanto i link simbolici sono riconosciuti come tali dal
1590 kernel\footnote{è uno dei diversi tipi di file visti in
1591   tab.~\ref{tab:file_file_types}, contrassegnato come tale
1592   nell'\textit{inode}, e riconoscibile dal valore del campo \var{st\_mode}
1593   della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).}  per cui
1594 alcune funzioni di libreria (come \func{open} o \func{stat}) quando ricevono
1595 come argomento un link simbolico vengono automaticamente applicate al file da
1596 esso specificato.  La funzione che permette di creare un nuovo link simbolico
1597 è \funcd{symlink}, ed il suo prototipo è:
1598
1599
1600 \begin{funcproto}{ 
1601 \fhead{unistd.h}
1602 \fdecl{int symlink(const char *oldpath, const char *newpath)}
1603 \fdesc{Crea un nuovo link simbolico.} 
1604 }
1605 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1606   nel qual caso \var{errno} assumerà uno dei valori: 
1607   \begin{errlist}
1608   \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
1609     supporta i link simbolici.
1610   \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
1611     \param{oldpath} è una stringa vuota.
1612   \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
1613   \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
1614     lettura.
1615   \end{errlist} ed inoltre \errval{EFAULT}, \errval{EACCES},
1616   \errval{ENAMETOOLONG}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1617   \errval{ENOSPC} e \errval{EIO} nel loro significato generico.}
1618 \end{funcproto}
1619
1620 La funzione crea un nuovo link simbolico con \textit{pathname} \param{newpath}
1621 che fa riferimento ad \param{oldpath}.  Si tenga presente che la funzione non
1622 effettua nessun controllo sull'esistenza di un file di nome \param{oldpath},
1623 ma si limita ad inserire il \textit{pathname} nel link simbolico. Pertanto un
1624 link simbolico può anche riferirsi ad un file che non esiste: in questo caso
1625 si ha quello che viene chiamato un \textit{dangling link}, letteralmente un
1626 \textsl{link ciondolante}.
1627
1628 Come accennato i link simbolici sono risolti automaticamente dal kernel
1629 all'invocazione delle varie system call; in tab.~\ref{tab:file_symb_effect} si
1630 è riportato un elenco dei comportamenti delle varie funzioni di libreria che
1631 operano sui file nei confronti della risoluzione dei link simbolici,
1632 specificando quali seguono il link simbolico e quali invece possono operare
1633 direttamente sul suo contenuto.
1634 \begin{table}[htb]
1635   \centering
1636   \footnotesize
1637   \begin{tabular}[c]{|l|c|c|}
1638     \hline
1639     \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
1640     \hline 
1641     \hline 
1642     \func{access}   & $\bullet$ & --        \\
1643     \func{chdir}    & $\bullet$ & --        \\
1644     \func{chmod}    & $\bullet$ & --        \\
1645     \func{chown}    & --        & $\bullet$ \\
1646     \func{creat}    & $\bullet$ & --        \\
1647     \func{exec}     & $\bullet$ & --        \\
1648     \func{lchown}   & $\bullet$ & --        \\
1649     \func{link}\footnotemark & --        & $\bullet$ \\
1650     \func{lstat}    & --        & $\bullet$ \\
1651     \func{mkdir}    & $\bullet$ & --        \\
1652     \func{mkfifo}   & $\bullet$ & --        \\
1653     \func{mknod}    & $\bullet$ & --        \\
1654     \func{open}     & $\bullet$ & --        \\
1655     \func{opendir}  & $\bullet$ & --        \\
1656     \func{pathconf} & $\bullet$ & --        \\
1657     \func{readlink} & --        & $\bullet$ \\
1658     \func{remove}   & --        & $\bullet$ \\
1659     \func{rename}   & --        & $\bullet$ \\
1660     \func{stat}     & $\bullet$ & --        \\
1661     \func{truncate} & $\bullet$ & --        \\
1662     \func{unlink}   & --        & $\bullet$ \\
1663     \hline 
1664   \end{tabular}
1665   \caption{Uso dei link simbolici da parte di alcune funzioni.}
1666   \label{tab:file_symb_effect}
1667 \end{table}
1668
1669 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
1670   dallo standard POSIX, si veda quanto detto in sez.~\ref{sec:file_link}.}
1671
1672 Si noti che non si è specificato il comportamento delle funzioni che operano
1673 con i file descriptor, in quanto la risoluzione del link simbolico viene in
1674 genere effettuata dalla funzione che restituisce il file descriptor
1675 (normalmente la \func{open}, vedi sez.~\ref{sec:file_open}) e tutte le
1676 operazioni seguenti fanno riferimento solo a quest'ultimo.
1677
1678 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
1679 \func{open} seguono i link simbolici, occorrono funzioni apposite per accedere
1680 alle informazioni del link invece che a quelle del file a cui esso fa
1681 riferimento. Quando si vuole leggere il contenuto di un link simbolico si usa
1682 la funzione \funcd{readlink}, il cui prototipo è:
1683 \begin{prototype}{unistd.h}
1684 {int readlink(const char *path, char *buff, size\_t size)} 
1685   Legge il contenuto del link simbolico indicato da \param{path} nel buffer
1686   \param{buff} di dimensione \param{size}.
1687   
1688   \bodydesc{La funzione restituisce il numero di caratteri letti dentro
1689     \param{buff} o -1 per un errore, nel qual caso la variabile
1690     \var{errno} assumerà i valori:
1691   \begin{errlist}
1692   \item[\errcode{EINVAL}] \param{path} non è un link simbolico o \param{size}
1693     non è positiva.
1694   \end{errlist}
1695   ed inoltre \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1696   \errval{EACCES}, \errval{ELOOP}, \errval{EIO}, \errval{EFAULT} e
1697   \errval{ENOMEM}.}
1698 \end{prototype}
1699
1700 La funzione apre il link simbolico, ne legge il contenuto, lo scrive nel
1701 buffer, e lo richiude. Si tenga presente che la funzione non termina la
1702 stringa con un carattere nullo e la tronca alla dimensione specificata da
1703 \param{size} per evitare di sovrascrivere oltre le dimensioni del buffer.
1704
1705 \begin{figure}[htb]
1706   \centering
1707   \includegraphics[width=8.5cm]{img/link_loop}
1708   \caption{Esempio di loop nel filesystem creato con un link simbolico.}
1709   \label{fig:file_link_loop}
1710 \end{figure}
1711
1712 Un caso comune che si può avere con i link simbolici è la creazione dei
1713 cosiddetti \textit{loop}. La situazione è illustrata in
1714 fig.~\ref{fig:file_link_loop}, che riporta la struttura della directory
1715 \file{/boot}. Come si vede si è creato al suo interno un link simbolico che
1716 punta di nuovo a \file{/boot}.\footnote{il loop mostrato in
1717   fig.~\ref{fig:file_link_loop} è un usato per poter permettere a \cmd{grub}
1718   (un bootloader in grado di leggere direttamente da vari filesystem il file
1719   da lanciare come sistema operativo) di vedere i file contenuti nella
1720   directory \file{/boot} con lo stesso \textit{pathname} con cui verrebbero
1721   visti dal sistema operativo, anche se essi si trovano, come accade spesso,
1722   su una partizione separata (che \cmd{grub}, all'avvio, vede come radice).}
1723
1724 Questo può causare problemi per tutti quei programmi che effettuano la
1725 scansione di una directory senza tener conto dei link simbolici, ad esempio se
1726 lanciassimo un comando del tipo \code{grep -r linux *}, il loop nella
1727 directory porterebbe il comando ad esaminare \file{/boot}, \file{/boot/boot},
1728 \file{/boot/boot/boot} e così via.
1729
1730 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
1731 un \textit{pathname} possano essere seguiti un numero limitato di link
1732 simbolici, il cui valore limite è specificato dalla costante
1733 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
1734 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}.
1735
1736 Un punto da tenere sempre presente è che, come abbiamo accennato, un link
1737 simbolico può fare riferimento anche ad un file che non esiste; ad esempio
1738 possiamo creare un file temporaneo nella nostra directory con un link del
1739 tipo:
1740 \begin{verbatim}
1741 $ ln -s /tmp/tmp_file temporaneo
1742 \end{verbatim}%$
1743 anche se \file{/tmp/tmp\_file} non esiste. Questo può generare confusione, in
1744 quanto aprendo in scrittura \file{temporaneo} verrà creato
1745 \file{/tmp/tmp\_file} e scritto; ma accedendo in sola lettura a
1746 \file{temporaneo}, ad esempio con \cmd{cat}, otterremmo:
1747 \begin{verbatim}
1748 $ cat temporaneo
1749 cat: temporaneo: No such file or directory
1750 \end{verbatim}%$
1751 con un errore che può sembrare sbagliato, dato che un'ispezione con \cmd{ls}
1752 ci mostrerebbe invece l'esistenza di \file{temporaneo}.
1753
1754
1755 \subsection{La creazione e la cancellazione delle directory} 
1756 \label{sec:file_dir_creat_rem}
1757
1758 Benché in sostanza le directory non siano altro che dei file contenenti
1759 elenchi di nomi ed \itindex{inode} \textit{inode}, non è possibile trattarle
1760 come file ordinari e devono essere create direttamente dal kernel attraverso
1761 una opportuna system call.\footnote{questo è quello che permette anche,
1762   attraverso l'uso del VFS, l'utilizzo di diversi formati per la gestione dei
1763   suddetti elenchi, dalle semplici liste a strutture complesse come alberi
1764   binari, hash, ecc. che consentono una ricerca veloce quando il numero di
1765   file è molto grande.}  La funzione usata per creare una directory è
1766 \funcd{mkdir}, ed il suo prototipo è:
1767 \begin{functions}
1768   \headdecl{sys/stat.h}
1769   \headdecl{sys/types.h}
1770   \funcdecl{int mkdir(const char *dirname, mode\_t mode)} 
1771
1772   Crea una nuova directory.
1773   
1774   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1775     errore, nel qual caso \var{errno} assumerà i valori:
1776   \begin{errlist}
1777   \item[\errcode{EEXIST}] un file (o una directory) con quel nome esiste di
1778     già.
1779   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
1780     cui si vuole inserire la nuova directory.
1781   \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
1782     directory contiene troppi file; sotto Linux questo normalmente non avviene
1783     perché il filesystem standard consente la creazione di un numero di file
1784     maggiore di quelli che possono essere contenuti nel disco, ma potendo
1785     avere a che fare anche con filesystem di altri sistemi questo errore può
1786     presentarsi.
1787   \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
1788     la nuova directory o si è esaurita la quota disco dell'utente.
1789   \end{errlist}
1790   ed inoltre anche \errval{EPERM}, \errval{EFAULT}, \errval{ENAMETOOLONG},
1791   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1792   \errval{EROFS}.}
1793 \end{functions}
1794
1795 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
1796 standard presenti in ogni directory (cioè ``\file{.}'' e ``\file{..}''), con
1797 il nome indicato dall'argomento \param{dirname}. Il nome può essere indicato
1798 sia come \itindsub{pathname}{assoluto} \textit{pathname} assoluto che come
1799 \itindsub{pathname}{relativo} \textit{pathname} relativo.
1800
1801 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
1802 directory viene creata sono specificati dall'argomento \param{mode}, i cui
1803 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
1804 tenga presente che questi sono modificati dalla maschera di creazione dei file
1805 (si veda sez.~\ref{sec:file_perm_management}).  La titolarità della nuova
1806 directory è impostata secondo quanto riportato in
1807 sez.~\ref{sec:file_ownership_management}.
1808
1809 La funzione che permette la cancellazione di una directory è invece
1810 \funcd{rmdir}, ed il suo prototipo è:
1811 \begin{prototype}{sys/stat.h}{int rmdir(const char *dirname)} 
1812   Cancella una directory.
1813
1814   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1815     errore, nel qual caso \var{errno} assumerà i valori:
1816   \begin{errlist}
1817   \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
1818     directory, oppure la directory che contiene \param{dirname} ha lo
1819     \itindex{sticky~bit} \textit{sticky bit} impostato e l'\ids{UID} effettivo
1820     del processo non corrisponde al proprietario della directory.
1821   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
1822     che contiene la directory che si vuole cancellare, o non c'è il permesso
1823     di attraversare (esecuzione) una delle directory specificate in
1824     \param{dirname}.
1825   \item[\errcode{EBUSY}] la directory specificata è la
1826     \index{directory~di~lavoro} directory di lavoro o la radice di qualche
1827     processo.
1828   \item[\errcode{ENOTEMPTY}] la directory non è vuota.
1829   \end{errlist}
1830   ed inoltre anche \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1831   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{EROFS}.}
1832 \end{prototype}
1833
1834 La funzione cancella la directory \param{dirname}, che deve essere vuota (la
1835 directory deve cioè contenere soltanto le due voci standard ``\file{.}'' e
1836 ``\file{..}'').  Il nome può essere indicato con il \textit{pathname} assoluto
1837 o relativo.
1838
1839 La modalità con cui avviene la cancellazione è analoga a quella di
1840 \func{unlink}: fintanto che il numero di link \itindex{inode}
1841 all'\textit{inode} della directory non diventa nullo e nessun processo ha la
1842 directory aperta lo spazio occupato su disco non viene rilasciato. Se un
1843 processo ha la directory aperta la funzione rimuove il link \itindex{inode}
1844 all'\textit{inode} e nel caso sia l'ultimo, pure le voci standard ``\file{.}''
1845 e ``\file{..}'', a questo punto il kernel non consentirà di creare più nuovi
1846 file nella directory.
1847
1848
1849 \subsection{La creazione di file speciali}
1850 \label{sec:file_mknod}
1851
1852 \index{file!di~dispositivo|(} 
1853
1854 Finora abbiamo parlato esclusivamente di file, directory e link simbolici; in
1855 sez.~\ref{sec:file_file_types} abbiamo visto però che il sistema prevede pure
1856 degli altri tipi di file speciali, come i file di dispositivo, le fifo ed i
1857 socket (questi ultimi sono un caso a parte, essendo associati anche alla
1858 comunicazione via rete, per cui ci saranno trattati in dettaglio a partire da
1859 cap.~\ref{cha:socket_intro}).
1860
1861 La manipolazione delle caratteristiche di questi diversi tipi di file e la
1862 loro cancellazione può essere effettuata con le stesse funzioni che operano
1863 sui file regolari; ma quando li si devono creare sono necessarie delle
1864 funzioni apposite. La prima di queste funzioni è \funcd{mknod}, il cui
1865 prototipo è:
1866 \begin{functions}
1867   \headdecl{sys/types.h}
1868   \headdecl{sys/stat.h}
1869   \headdecl{fcntl.h}
1870   \headdecl{unistd.h}
1871   \funcdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)} 
1872   
1873   Crea un \textit{inode} del tipo specificato sul filesystem.
1874   
1875   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1876     errore, nel qual caso \var{errno} assumerà i valori:
1877   \begin{errlist}
1878   \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
1879     l'\texttt{inode}, o il filesystem su cui si è cercato di
1880     creare \param{pathname} non supporta l'operazione.
1881   \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
1882     fifo, un socket o un dispositivo.
1883   \item[\errcode{EEXIST}] \param{pathname} esiste già o è un link simbolico.
1884   \end{errlist}
1885   ed inoltre anche \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
1886   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1887   \errval{ENOSPC}, \errval{EROFS}.}
1888 \end{functions}
1889
1890 La funzione, come suggerisce il nome, permette di creare un ``\textsl{nodo}''
1891 sul filesystem, e viene in genere utilizzata per creare i file di dispositivo,
1892 ma si può usare anche per creare file regolari. L'argomento
1893 \param{mode} specifica sia il tipo di file che si vuole creare che i relativi
1894 permessi, secondo i valori riportati in tab.~\ref{tab:file_mode_flags}, che
1895 vanno combinati con un OR binario. I permessi sono comunque modificati nella
1896 maniera usuale dal valore di \itindex{umask} \textit{umask} (si veda
1897 sez.~\ref{sec:file_perm_management}).
1898
1899 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
1900 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
1901 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
1902 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
1903 per una fifo;\footnote{con Linux la funzione non può essere usata per creare
1904   directory o link simbolici, si dovranno usare le funzioni \func{mkdir} e
1905   \func{symlink} a questo dedicate.} un valore diverso comporterà l'errore
1906 \errcode{EINVAL}.  
1907
1908 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
1909 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
1910 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
1911 valore verrà ignorato.  Solo l'amministratore può creare un file di
1912 dispositivo usando questa funzione (il processo deve avere la
1913 \itindex{capabilities} \textit{capability} \const{CAP\_MKNOD}), ma in
1914 Linux\footnote{questo è un comportamento specifico di Linux, la funzione non è
1915   prevista dallo standard POSIX.1 originale, mentre è presente in SVr4 e
1916   4.4BSD, ma esistono differenze nei comportamenti e nei codici di errore,
1917   tanto che questa è stata introdotta in POSIX.1-2001 con una nota che la
1918   definisce portabile solo quando viene usata per creare delle fifo, ma
1919   comunque deprecata essendo utilizzabile a tale scopo la specifica
1920   \func{mkfifo}.} l'uso per la creazione di un file ordinario, di una fifo o
1921 di un socket è consentito anche agli utenti normali.
1922
1923 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
1924 al proprietario e al gruppo del processo che li ha creati, a meno che non si
1925 sia attivato il bit \acr{sgid} per la directory o sia stata attivata la
1926 semantica BSD per il filesystem (si veda
1927 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
1928 \itindex{inode} l'\textit{inode}.
1929
1930 Nella creazione di un file di dispositivo occorre poi specificare
1931 correttamente il valore di \param{dev}; questo infatti è di tipo
1932 \type{dev\_t}, che è un tipo primitivo (vedi
1933 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
1934 \textsl{numero} di dispositivo; il kernel infatti identifica ciascun
1935 dispositivo con un valore numerico. Originariamente questo era un intero a 16
1936 bit diviso in due parti di 8 bit chiamate rispettivamente
1937 \itindex{major~number} \textit{major number} e \itindex{minor~number}
1938 \textit{minor number}, che sono poi i due numeri mostrati dal comando
1939 \texttt{ls -l} al posto della dimensione quando lo si esegue su un file di
1940 dispositivo.
1941
1942 Il \itindex{major~number} \textit{major number} identifica una classe di
1943 dispositivi (ad esempio la seriale, o i dischi IDE) e serve in sostanza per
1944 indicare al kernel quale è il modulo che gestisce quella classe di
1945 dispositivi; per identificare uno specifico dispositivo di quella classe (ad
1946 esempio una singola porta seriale, o una partizione di un disco) si usa invece
1947 il \itindex{minor~number} \textit{minor number}. L'elenco aggiornato di questi
1948 numeri con le relative corrispondenze ai vari dispositivi può essere trovato
1949 nel file \texttt{Documentation/devices.txt} allegato alla documentazione dei
1950 sorgenti del kernel.
1951
1952 Data la crescita nel numero di dispositivi supportati, ben presto il limite
1953 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
1954 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
1955 \type{dev\_t}, con delle dimensioni passate a 12 bit per il
1956 \itindex{major~number} \textit{major number} e 20 bit per il
1957 \itindex{minor~number} \textit{minor number}. La transizione però ha anche
1958 comportato il passaggio di \type{dev\_t} a \index{tipo!opaco} tipo opaco, e la
1959 necessità di specificare il numero tramite delle opportune macro, così da non
1960 avere problemi di compatibilità con eventuali ulteriori estensioni.
1961
1962 Le macro sono definite nel file \headfile{sys/sysmacros.h}, che viene
1963 automaticamente incluso quando si include \headfile{sys/types.h}; si possono
1964 pertanto ottenere i valori del \itindex{major~number} \textit{major number} e
1965 \itindex{minor~number} \textit{minor number} di un dispositivo rispettivamente
1966 con le macro \macro{major} e \macro{minor}:
1967 \begin{functions}
1968   \headdecl{sys/types.h}
1969   \funcdecl{int \macro{major}(dev\_t dev)}
1970   Restituisce il \itindex{major~number} \textit{major number} del dispositivo
1971   \param{dev}.
1972   
1973   \funcdecl{int \macro{minor}(dev\_t dev)}
1974   Restituisce il \itindex{minor~number} \textit{minor number} del dispositivo
1975   \param{dev}.
1976 \end{functions}
1977 \noindent mentre una volta che siano noti \itindex{major~number} \textit{major
1978   number} e \itindex{minor~number} \textit{minor number} si potrà costruire il
1979 relativo identificativo con la macro \macro{makedev}:
1980 \begin{functions}
1981   \headdecl{sys/types.h}
1982   \funcdecl{dev\_t \macro{minor}(int major, int minor)}
1983
1984   Restituisce l'identificativo di un dispositivo dati \itindex{major~number}
1985   \textit{major number} e \itindex{minor~number} \textit{minor number}.
1986 \end{functions}
1987
1988 \index{file!di~dispositivo|)}
1989
1990 Infine con lo standard POSIX.1-2001 è stata introdotta una funzione specifica
1991 per creare una fifo (tratteremo le fifo in in sez.~\ref{sec:ipc_named_pipe});
1992 la funzione è \funcd{mkfifo} ed il suo prototipo è:
1993 \begin{functions}
1994   \headdecl{sys/types.h} \headdecl{sys/stat.h} 
1995   
1996   \funcdecl{int mkfifo(const char *pathname, mode\_t mode)} 
1997   
1998   Crea una fifo.
1999   
2000   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
2001     errore, nel qual caso \var{errno} assumerà i valori \errval{EACCES},
2002     \errval{EEXIST}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC},
2003     \errval{ENOTDIR} e \errval{EROFS}.}
2004 \end{functions}
2005
2006 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
2007 per \func{mknod} il file \param{pathname} non deve esistere (neanche come link
2008 simbolico); al solito i permessi specificati da \param{mode} vengono
2009 modificati dal valore di \itindex{umask} \textit{umask}.
2010
2011
2012
2013 \subsection{Accesso alle directory}
2014 \label{sec:file_dir_read}
2015
2016 Benché le directory alla fine non siano altro che dei file che contengono
2017 delle liste di nomi ed \itindex{inode} \textit{inode}, per il ruolo che
2018 rivestono nella struttura del sistema, non possono essere trattate come dei
2019 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
2020 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
2021 può essere un processo a inserirvi direttamente delle voci con le usuali
2022 funzioni di scrittura.
2023
2024 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
2025 kernel, sono molte le situazioni in cui i processi necessitano di poterne
2026 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
2027 in sez.~\ref{sec:file_open} che è possibile aprire una directory come se fosse
2028 un file, anche se solo in sola lettura) in generale il formato con cui esse
2029 sono scritte può dipendere dal tipo di filesystem, tanto che, come riportato
2030 in tab.~\ref{tab:file_file_operations}, il VFS del kernel prevede una apposita
2031 funzione per la lettura delle directory.
2032
2033 Tutto questo si riflette nello standard POSIX\footnote{le funzioni erano
2034   presenti in SVr4 e 4.3BSD, la loro specifica è riportata in POSIX.1-2001.}
2035 che ha introdotto una apposita interfaccia per la lettura delle directory,
2036 basata sui cosiddetti \textit{directory stream} (chiamati così per l'analogia
2037 con i file stream dell'interfaccia standard ANSI C di
2038 cap.~\ref{cha:files_std_interface}). La prima funzione di questa interfaccia è
2039 \funcd{opendir}, il cui prototipo è:
2040 \begin{functions}
2041   \headdecl{sys/types.h} \headdecl{dirent.h} 
2042   
2043   \funcdecl{DIR * opendir(const char *dirname)} 
2044   
2045   Apre un \textit{directory stream}.
2046   
2047   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
2048     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
2049     assumerà i valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
2050     \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}.}
2051 \end{functions}
2052
2053 La funzione apre un \textit{directory stream} per la directory
2054 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
2055 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
2056 \textit{directory stream}) da usare per tutte le operazioni successive, la
2057 funzione inoltre posiziona lo stream sulla prima voce contenuta nella
2058 directory. 
2059
2060 Si tenga presente che comunque la funzione opera associando il
2061 \textit{directory stream} ad un opportuno file descriptor sottostante, sul
2062 quale vengono compiute le operazioni. Questo viene sempre aperto impostando il
2063 flag di \itindex{close-on-exec} \textit{close-on-exec}, così da evitare che
2064 resti aperto in caso di esecuzione di un altro programma.
2065
2066 Nel caso in cui sia necessario conoscere il \textit{file descriptor} associato
2067 ad un \textit{directory stream} si può usare la funzione
2068 \funcd{dirfd},\footnote{questa funzione è una estensione introdotta con BSD
2069   4.3-Reno ed è presente in Linux con le libc5 (a partire dalla versione
2070   5.1.2) e con le \acr{glibc} ma non presente in POSIX fino alla revisione
2071   POSIX.1-2008, per questo per poterla utilizzare fino alla versione 2.10
2072   delle \acr{glibc} era necessario definire le macro \macro{\_BSD\_SOURCE} o
2073   \macro{\_SVID\_SOURCE}, dalla versione 2.10 si possono usare anche
2074   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o
2075   \texttt{\macro{\_XOPEN\_SOURCE} >= 700}.}  il cui prototipo è:
2076 \begin{functions}
2077   \headdecl{sys/types.h} \headdecl{dirent.h} 
2078   
2079   \funcdecl{int dirfd(DIR * dir)} 
2080   
2081   Restituisce il file descriptor associato ad un \textit{directory stream}.
2082   
2083   \bodydesc{La funzione restituisce il file descriptor (un valore positivo) in
2084     caso di successo e -1 in caso di errore.}
2085 \end{functions}
2086
2087 La funzione restituisce il file descriptor associato al \textit{directory
2088   stream} \param{dir}. Di solito si utilizza questa funzione in abbinamento a
2089 funzioni che operano sui file descriptor, ad esempio si potrà usare
2090 \func{fstat} per ottenere le proprietà della directory, o \func{fchdir} per
2091 spostare su di essa la \index{directory~di~lavoro} directory di lavoro (vedi
2092 sez.~\ref{sec:file_work_dir}).
2093
2094 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
2095 possibile associarvi un \textit{directory stream} con la funzione
2096 \funcd{fdopendir},\footnote{questa funzione è però disponibile solo a partire
2097   dalla versione 2.4 delle \acr{glibc}, ed è stata introdotta nello standard
2098   POSIX solo a partire dalla revisione POSIX.1-2008, prima della versione 2.10
2099   delle \acr{glibc} per poterla utilizzare era necessario definire la macro
2100   \macro{\_GNU\_SOURCE}, dalla versione 2.10 si possono usare anche
2101   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o \texttt{\_XOPEN\_SOURCE >=
2102     700} .}  il cui prototipo è:
2103 \begin{functions}
2104   \headdecl{sys/types.h} \headdecl{dirent.h}
2105   
2106   \funcdecl{DIR * fdopendir(int fd)} 
2107   
2108   Associa un \textit{directory stream} al file descriptor \param{fd}.
2109   
2110   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
2111     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
2112     assumerà il valore \errval{EBADF}.}
2113 \end{functions}
2114
2115 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
2116   stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
2117 stato aperto in precedenza; la funzione darà un errore qualora questo non
2118 corrisponda ad una directory. L'uso di questa funzione permette di rispondere
2119 agli stessi requisiti delle funzioni ``\textit{at}'' che vedremo in
2120 sez.~\ref{sec:file_openat}.
2121
2122 Una volta utilizzata il file descriptor verrà usato internamente dalle
2123 funzioni che operano sul \textit{directory stream} e non dovrà essere più
2124 utilizzato all'interno del proprio programma; in particolare dovrà essere
2125 chiuso con \func{closedir} e non direttamente. Si tenga presente inoltre che
2126 \func{fdopendir} non modifica lo stato di un eventuale flag di
2127 \itindex{close-on-exec} \textit{close-on-exec}, che pertanto dovrà essere
2128 impostato esplicitamente in fase di apertura del file descriptor.
2129
2130 Una volta che si sia aperto un \textit{directory stream} la lettura del
2131 contenuto della directory viene effettuata attraverso la funzione
2132 \funcd{readdir}; il suo prototipo è:
2133 \begin{functions}
2134   \headdecl{sys/types.h} \headdecl{dirent.h} 
2135   
2136   \funcdecl{struct dirent *readdir(DIR *dir)}
2137   
2138   Legge una voce dal \textit{directory stream}.
2139   
2140   \bodydesc{La funzione restituisce il puntatore alla struttura contenente i
2141     dati in caso di successo e \val{NULL} altrimenti, in caso di
2142     \textit{directory stream} non valido \var{errno} assumerà il valore
2143     \errval{EBADF}, il valore \val{NULL} viene restituito anche quando si
2144     raggiunge la fine dello stream.}
2145 \end{functions}
2146
2147 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
2148 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
2149 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
2150 esaurite tutte le voci in essa presenti.
2151
2152 \begin{figure}[!htb]
2153   \footnotesize \centering
2154   \begin{minipage}[c]{\textwidth}
2155     \includestruct{listati/dirent.c}
2156   \end{minipage} 
2157   \normalsize 
2158   \caption{La struttura \structd{dirent} per la lettura delle informazioni dei 
2159     file.}
2160   \label{fig:file_dirent_struct}
2161 \end{figure}
2162
2163 I dati vengono memorizzati in una struttura \struct{dirent}, la cui
2164 definizione è riportata in fig.~\ref{fig:file_dirent_struct}.\footnote{la
2165   definizione è quella usata da Linux, che si trova nel file
2166   \file{/usr/include/bits/dirent.h}, essa non contempla la presenza del campo
2167   \var{d\_namlen} che indica la lunghezza del nome del file.} La funzione
2168 restituisce il puntatore alla struttura; si tenga presente però che
2169 quest'ultima è allocata staticamente, per cui viene sovrascritta tutte le
2170 volte che si ripete la lettura di una voce sullo stesso \textit{directory
2171   stream}.
2172
2173 Di questa funzione esiste anche una versione \index{funzioni!rientranti}
2174 rientrante, \funcd{readdir\_r},\footnote{per usarla è necessario definire una
2175   qualunque delle macro \texttt{\macro{\_POSIX\_C\_SOURCE} >= 1},
2176   \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
2177   \macro{\_POSIX\_SOURCE}.} che non usa una struttura allocata staticamente, e
2178 può essere utilizzata anche con i \itindex{thread} \textit{thread}, il suo
2179 prototipo è:
2180 \begin{functions}
2181   \headdecl{sys/types.h} \headdecl{dirent.h} 
2182   
2183   \funcdecl{int readdir\_r(DIR *dir, struct dirent *entry,
2184           struct dirent **result)}
2185   
2186   Legge una voce dal \textit{directory stream}.
2187   
2188   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2189     errore, gli errori sono gli stessi di \func{readdir}.}
2190 \end{functions}
2191
2192 La funzione restituisce in \param{result} (come
2193 \itindex{value~result~argument} \textit{value result argument}) l'indirizzo
2194 dove sono stati salvati i dati, che di norma corrisponde a quello della
2195 struttura precedentemente allocata e specificata dall'argomento \param{entry},
2196 anche se non è assicurato che la funzione usi lo spazio fornito dall'utente.
2197
2198 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
2199 presenti nella directory; sia BSD che SVr4 prevedono che siano sempre presenti
2200 il campo \var{d\_name},\footnote{lo standard POSIX prevede invece solo la
2201   presenza del campo \var{d\_fileno}, identico \var{d\_ino}, che in Linux è
2202   definito come alias di quest'ultimo; il campo \var{d\_name} è considerato
2203   dipendente dall'implementazione.} che contiene il nome del file nella forma
2204 di una stringa terminata da uno zero,\footnote{lo standard POSIX non specifica
2205   una lunghezza, ma solo un limite \const{NAME\_MAX}; in SVr4 la lunghezza del
2206   campo è definita come \code{NAME\_MAX+1} che di norma porta al valore di 256
2207   byte usato anche in Linux.} ed il campo \var{d\_ino}, che contiene il numero
2208 di \textit{inode} cui il file è associato e corrisponde al campo \var{st\_ino}
2209 di \struct{stat}.
2210
2211 La presenza di ulteriori campi opzionali oltre i due citati è segnalata dalla
2212 definizione di altrettante macro nella forma \code{\_DIRENT\_HAVE\_D\_XXX}
2213 dove \code{XXX} è il nome del relativo campo; nel caso di Linux sono pertanto
2214 definite le macro \macro{\_DIRENT\_HAVE\_D\_TYPE},
2215 \macro{\_DIRENT\_HAVE\_D\_OFF} e \macro{\_DIRENT\_HAVE\_D\_RECLEN}, mentre non
2216 è definita la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN}.
2217
2218 \begin{table}[htb]
2219   \centering
2220   \footnotesize
2221   \begin{tabular}[c]{|l|l|}
2222     \hline
2223     \textbf{Valore} & \textbf{Tipo di file} \\
2224     \hline
2225     \hline
2226     \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
2227     \const{DT\_REG}     & File normale.\\
2228     \const{DT\_DIR}     & Directory.\\
2229     \const{DT\_LNK}     & Link simbolico.\\
2230     \const{DT\_FIFO}    & Fifo.\\
2231     \const{DT\_SOCK}    & Socket.\\
2232     \const{DT\_CHR}     & Dispositivo a caratteri.\\
2233     \const{DT\_BLK}     & Dispositivo a blocchi.\\
2234     \hline    
2235   \end{tabular}
2236   \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
2237     della struttura \struct{dirent}.}
2238   \label{tab:file_dtype_macro}
2239 \end{table}
2240
2241 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
2242 indica il tipo di file (se fifo, directory, link simbolico, ecc.), e consente
2243 di evitare una successiva chiamata a \func{lstat} per determinarlo. I suoi
2244 possibili valori sono riportati in tab.~\ref{tab:file_dtype_macro}. Si tenga
2245 presente che questo valore è disponibile solo per i filesystem che ne
2246 supportano la restituzione (fra questi i più noti sono \textsl{btrfs},
2247 \textsl{ext2}, \textsl{ext3}, e \textsl{ext4}), per gli altri si otterrà
2248 sempre il valore \const{DT\_UNKNOWN}.\footnote{inoltre fino alla versione 2.1
2249   delle \acr{glibc}, pur essendo il campo \var{d\_type} presente, il suo uso
2250   non era implementato, e veniva restituito comunque il valore
2251   \const{DT\_UNKNOWN}.}
2252
2253 Per la conversione da e verso l'analogo valore mantenuto dentro il campo
2254 \var{st\_mode} di \struct{stat} sono definite anche due macro di conversione,
2255 \macro{IFTODT} e \macro{DTTOIF}:
2256 \begin{functions}
2257   \funcdecl{int IFTODT(mode\_t MODE)} Converte il tipo di file dal formato di
2258   \var{st\_mode} a quello di \var{d\_type}.
2259   
2260   \funcdecl{mode\_t DTTOIF(int DTYPE)} Converte il tipo di file dal formato di
2261   \var{d\_type} a quello di \var{st\_mode}.
2262 \end{functions}
2263
2264 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
2265 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
2266 letta. Con questi due campi diventa possibile, determinando la posizione delle
2267 varie voci, spostarsi all'interno dello stream usando la funzione
2268 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
2269   estensioni prese da BSD, ed introdotte nello standard POSIX solo a partire
2270   dalla revisione POSIX.1-2001, per poterle utilizzare deve essere definita
2271   una delle macro \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE} o
2272   \macro{\_SVID\_SOURCE}.} il cui prototipo è:
2273 \begin{prototype}{dirent.h}{void seekdir(DIR *dir, off\_t offset)}
2274   Cambia la posizione all'interno di un \textit{directory stream}.
2275 \end{prototype}
2276
2277 La funzione non ritorna nulla e non segnala errori, è però necessario che il
2278 valore dell'argomento \param{offset} sia valido per lo stream \param{dir};
2279 esso pertanto deve essere stato ottenuto o dal valore di \var{d\_off} di
2280 \struct{dirent} o dal valore restituito dalla funzione \funcd{telldir}, che
2281 legge la posizione corrente; il prototipo di quest'ultima è:\footnote{prima
2282   delle \acr{glibc} 2.1.1 la funzione restituiva un valore di tipo
2283   \type{off\_t}, sostituito a partire dalla versione 2.1.2 da \ctyp{long} per
2284   conformità a POSIX.1-2001.}
2285 \begin{prototype}{dirent.h}{long telldir(DIR *dir)}
2286   Ritorna la posizione corrente in un \textit{directory stream}.
2287   
2288   \bodydesc{La funzione restituisce la posizione corrente nello stream (un
2289     numero positivo) in caso di successo, e -1 altrimenti, nel qual caso
2290     \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
2291     valore errato per \param{dir}.}
2292 \end{prototype}
2293
2294 La sola funzione di posizionamento nello stream prevista originariamente dallo
2295 standard POSIX è \funcd{rewinddir}, che riporta la posizione a quella
2296 iniziale; il suo prototipo è:
2297 \begin{functions}
2298   \headdecl{sys/types.h} \headdecl{dirent.h} 
2299   
2300   \funcdecl{void rewinddir(DIR *dir)}
2301   
2302   Si posiziona all'inizio di un \textit{directory stream}.
2303 \end{functions}
2304
2305 Una volta completate le operazioni si può chiudere il \textit{directory
2306   stream}, ed il file descriptor ad esso associato, con la funzione
2307 \funcd{closedir}, il cui prototipo è:
2308 \begin{functions}
2309   \headdecl{sys/types.h} \headdecl{dirent.h} 
2310   
2311   \funcdecl{int closedir(DIR * dir)} 
2312   
2313   Chiude un \textit{directory stream}.
2314   
2315   \bodydesc{La funzione restituisce 0 in caso di successo e -1 altrimenti, nel
2316     qual caso \var{errno} assume il valore \errval{EBADF}.}
2317 \end{functions}
2318
2319 A parte queste funzioni di base in BSD 4.3 venne introdotta un'altra funzione
2320 che permette di eseguire una scansione completa, con tanto di ricerca ed
2321 ordinamento, del contenuto di una directory; la funzione è
2322 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
2323   \acr{libc4} e richiede siano definite le macro \macro{\_BSD\_SOURCE} o
2324   \macro{\_SVID\_SOURCE}.} ed il suo prototipo è:
2325 \begin{prototype}{dirent.h}{int scandir(const char *dir, 
2326     struct dirent ***namelist, int(*filter)(const struct dirent *),
2327     int(*compar)(const struct dirent **, const struct dirent **))} 
2328   
2329   Esegue una scansione di un \textit{directory stream}.
2330   
2331   \bodydesc{La funzione restituisce in caso di successo il numero di voci
2332     trovate, e -1 altrimenti.}
2333 \end{prototype}
2334
2335 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
2336 prototipo non è molto comprensibile; queste funzioni però sono quelle che
2337 controllano rispettivamente la selezione di una voce (quella passata con
2338 l'argomento \param{filter}) e l'ordinamento di tutte le voci selezionate
2339 (quella specificata dell'argomento \param{compar}).
2340
2341 La funzione legge tutte le voci della directory indicata dall'argomento
2342 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
2343 \struct{dirent}) come argomento della funzione di selezione specificata da
2344 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
2345 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
2346 Qualora si specifichi un valore \val{NULL} per l'argomento \param{filter} non
2347 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
2348
2349 Le voci selezionate possono essere riordinate tramite \funcm{qsort}, le
2350 modalità del riordinamento possono essere personalizzate usando la funzione
2351 \param{compar} come criterio di ordinamento di \funcm{qsort}, la funzione
2352 prende come argomenti le due strutture \struct{dirent} da confrontare
2353 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
2354 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
2355 \struct{dirent} viene restituito nell'argomento
2356 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
2357   restituisce, come \itindex{value~result~argument} \textit{value result
2358     argument}, l'indirizzo della stessa; questo significa che \param{namelist}
2359   deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
2360   si deve passare il suo indirizzo.}
2361
2362 Per l'ordinamento, vale a dire come valori possibili per l'argomento
2363 \param{compar} sono disponibili due funzioni predefinite, \funcd{alphasort} e
2364 \funcd{versionsort}, i cui prototipi sono:
2365 \begin{functions}
2366   \headdecl{dirent.h} 
2367   
2368   \funcdecl{int alphasort(const void *a, const void *b)} 
2369
2370   \funcdecl{int versionsort(const void *a, const void *b)} 
2371   
2372   Funzioni per l'ordinamento delle voci di \textit{directory stream}.
2373   
2374   \bodydesc{Le funzioni restituiscono un valore minore, uguale o maggiore di
2375     zero qualora il primo argomento sia rispettivamente minore, uguale o
2376     maggiore del secondo.}
2377 \end{functions}
2378
2379 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
2380 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
2381   argomenti dei puntatori a delle strutture \struct{dirent}; le glibc usano il
2382   prototipo originario di BSD, mostrato anche nella definizione, che prevede
2383   puntatori a \ctyp{void}.} e deve essere specificata come argomento
2384 \param{compar} per ottenere un ordinamento alfabetico (secondo il valore del
2385 campo \var{d\_name} delle varie voci). Le \acr{glibc} prevedono come
2386 estensione\footnote{le glibc, a partire dalla versione 2.1, effettuano anche
2387   l'ordinamento alfabetico tenendo conto delle varie localizzazioni, usando
2388   \funcm{strcoll} al posto di \funcm{strcmp}.} anche \func{versionsort}, che
2389 ordina i nomi tenendo conto del numero di versione (cioè qualcosa per cui
2390 \texttt{file10} viene comunque dopo \texttt{file4}.)
2391
2392 \begin{figure}[!htbp]
2393   \footnotesize \centering
2394   \begin{minipage}[c]{\codesamplewidth}
2395     \includecodesample{listati/my_ls.c}
2396   \end{minipage}
2397   \caption{Esempio di codice per eseguire la lista dei file contenuti in una
2398     directory.} 
2399   \label{fig:file_my_ls}
2400 \end{figure}
2401
2402 Un semplice esempio dell'uso di queste funzioni è riportato in
2403 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
2404 programma che, usando la funzione di scansione illustrata in
2405 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
2406 e la relativa dimensione (in sostanza una versione semplificata del comando
2407 \cmd{ls}).
2408
2409 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
2410 la parte di gestione delle opzioni (che prevede solo l'uso di una funzione per
2411 la stampa della sintassi, anch'essa omessa) ma il codice completo potrà essere
2412 trovato coi sorgenti allegati nel file \file{myls.c}.
2413
2414 In sostanza tutto quello che fa il programma, dopo aver controllato
2415 (\texttt{\small 12--15}) di avere almeno un argomento (che indicherà la
2416 directory da esaminare) è chiamare (\texttt{\small 16}) la funzione
2417 \func{DirScan} per eseguire la scansione, usando la funzione \code{do\_ls}
2418 (\texttt{\small 22--29}) per fare tutto il lavoro.
2419
2420 Quest'ultima si limita (\texttt{\small 26}) a chiamare \func{stat} sul file
2421 indicato dalla directory entry passata come argomento (il cui nome è appunto
2422 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
2423 dati ad esso relativi, per poi provvedere (\texttt{\small 27}) a stampare il
2424 nome del file e la dimensione riportata in \var{data}.
2425
2426 Dato che la funzione verrà chiamata all'interno di \func{DirScan} per ogni
2427 voce presente questo è sufficiente a stampare la lista completa dei file e
2428 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
2429 valore di ritorno per indicare una esecuzione senza errori.
2430
2431 \begin{figure}[!htbp]
2432   \footnotesize \centering
2433   \begin{minipage}[c]{\codesamplewidth}
2434     \includecodesample{listati/DirScan.c}
2435   \end{minipage}
2436   \caption{Codice della funzione di scansione di una directory contenuta nel
2437     file \file{DirScan.c}.} 
2438   \label{fig:file_dirscan}
2439 \end{figure}
2440
2441 Tutto il grosso del lavoro è svolto dalla funzione \func{DirScan}, riportata
2442 in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e permette
2443 di eseguire una funzione, passata come secondo argomento, su tutte le voci di
2444 una directory.  La funzione inizia con l'aprire (\texttt{\small 18--22}) uno
2445 stream sulla directory passata come primo argomento, stampando un messaggio in
2446 caso di errore.
2447
2448 Il passo successivo (\texttt{\small 23--24}) è cambiare
2449 \index{directory~di~lavoro} directory di lavoro (vedi
2450 sez.~\ref{sec:file_work_dir}), usando in sequenza le funzioni \func{dirfd} e
2451 \func{fchdir} (in realtà si sarebbe potuto usare direttamente \func{chdir} su
2452 \var{dirname}), in modo che durante il successivo ciclo (\texttt{\small
2453   26--30}) sulle singole voci dello stream ci si trovi all'interno della
2454 directory.\footnote{questo è essenziale al funzionamento della funzione
2455   \code{do\_ls}, e ad ogni funzione che debba usare il campo \var{d\_name}, in
2456   quanto i nomi dei file memorizzati all'interno di una struttura
2457   \struct{dirent} sono sempre relativi alla directory in questione, e senza
2458   questo posizionamento non si sarebbe potuto usare \func{stat} per ottenere
2459   le dimensioni.}
2460
2461 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
2462 alla funzione passata come secondo argomento, il ciclo di scansione della
2463 directory è molto semplice; si legge una voce alla volta (\texttt{\small 26})
2464 all'interno di una istruzione di \code{while} e fintanto che si riceve una
2465 voce valida, cioè un puntatore diverso da \val{NULL}, si esegue
2466 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
2467 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
2468   28}) qualora questa presenti una anomalia, identificata da un codice di
2469 ritorno negativo. Una volta terminato il ciclo la funzione si conclude con la
2470 chiusura (\texttt{\small 32}) dello stream\footnote{nel nostro caso, uscendo
2471   subito dopo la chiamata, questo non servirebbe, in generale però
2472   l'operazione è necessaria, dato che la funzione può essere invocata molte
2473   volte all'interno dello stesso processo, per cui non chiudere i
2474   \textit{directory stream} comporterebbe un consumo progressivo di risorse,
2475   con conseguente rischio di esaurimento delle stesse.} e la restituzione
2476 (\texttt{\small 32}) del codice di operazioni concluse con successo.
2477
2478
2479 \subsection{La directory di lavoro}
2480 \label{sec:file_work_dir}
2481
2482 \index{directory~di~lavoro|(} 
2483
2484 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
2485 directory nel filesystem,\footnote{questa viene mantenuta all'interno dei dati
2486   della sua \kstruct{task\_struct} (vedi fig.~\ref{fig:proc_task_struct}), più
2487   precisamente nel campo \texttt{pwd} della sotto-struttura
2488   \kstruct{fs\_struct}.} che è chiamata \textsl{directory corrente} o
2489 \textsl{directory di lavoro} (in inglese \textit{current working directory}).
2490 La directory di lavoro è quella da cui si parte quando un
2491 \itindsub{pathname}{relativo} \textit{pathname} è espresso in forma relativa,
2492 dove il ``\textsl{relativa}'' fa riferimento appunto a questa directory.
2493
2494 Quando un utente effettua il login, questa directory viene impostata alla
2495 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
2496 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
2497 comando \cmd{pwd} la stampa sul terminale.  Siccome la directory corrente
2498 resta la stessa quando viene creato un processo figlio (vedi
2499 sez.~\ref{sec:proc_fork}), la directory corrente della shell diventa anche la
2500 directory corrente di qualunque comando da essa lanciato.
2501
2502 Dato che è il kernel che tiene traccia per ciascun processo \itindex{inode}
2503 dell'\textit{inode} della directory di lavoro, per ottenerne il
2504 \textit{pathname} occorre usare una apposita funzione di libreria,
2505 \funcd{getcwd},\footnote{con Linux \func{getcwd} è una \textit{system call}
2506   dalla versione 2.1.9, in precedenza il valore doveva essere ottenuto tramite
2507   il filesystem \texttt{/proc} da \procfile{/proc/self/cwd}.} il cui prototipo
2508 è:
2509 \begin{prototype}{unistd.h}{char *getcwd(char *buffer, size\_t size)}
2510   Legge il \textit{pathname} della directory di lavoro corrente.
2511   
2512   \bodydesc{La funzione restituisce il puntatore \param{buffer} se riesce,
2513     \val{NULL} se fallisce, in quest'ultimo caso la variabile
2514     \var{errno} è impostata con i seguenti codici di errore:
2515   \begin{errlist}
2516   \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
2517     è nullo.
2518   \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
2519     lunghezza del \textit{pathname}. 
2520   \item[\errcode{EACCES}] manca il permesso di lettura o di ricerca su uno dei
2521     componenti del \textit{pathname} (cioè su una delle directory superiori
2522     alla corrente).
2523   \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata.
2524   \end{errlist}}
2525 \end{prototype}
2526
2527 La funzione restituisce il \textit{pathname} completo della directory di
2528 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
2529 precedentemente allocata, per una dimensione massima di \param{size}.  Il
2530 buffer deve essere sufficientemente largo da poter contenere il
2531 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
2532 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
2533 un errore.
2534
2535 Si può anche specificare un puntatore nullo come
2536 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
2537   supportata da Linux e dalla \acr{glibc}.} nel qual caso la stringa sarà
2538 allocata automaticamente per una dimensione pari a \param{size} qualora questa
2539 sia diversa da zero, o della lunghezza esatta del \textit{pathname}
2540 altrimenti. In questo caso ci si deve ricordare di disallocare la stringa una
2541 volta cessato il suo utilizzo.
2542
2543 Di questa funzione esiste una versione \code{char *getwd(char *buffer)} fatta
2544 per compatibilità all'indietro con BSD, che non consente di specificare la
2545 dimensione del buffer; esso deve essere allocato in precedenza ed avere una
2546 dimensione superiore a \const{PATH\_MAX} (di solito 256 byte, vedi
2547 sez.~\ref{sec:sys_limits}); il problema è che in Linux non esiste una
2548 dimensione superiore per un \textit{pathname}, per cui non è detto che il
2549 buffer sia sufficiente a contenere il nome del file, e questa è la ragione
2550 principale per cui questa funzione è deprecata.
2551
2552 Un uso comune di \func{getcwd} è quello di salvare la directory di lavoro
2553 iniziale per poi potervi tornare in un tempo successivo, un metodo alternativo
2554 più veloce, se non si è a corto di file descriptor, è invece quello di aprire
2555 la directory corrente (vale a dire ``\texttt{.}'') e tornarvi in seguito con
2556 \func{fchdir}. 
2557
2558 Una seconda usata per ottenere la directory di lavoro è \code{char
2559   *get\_current\_dir\_name(void)} che è sostanzialmente equivalente ad una
2560 \code{getcwd(NULL, 0)}, con la sola differenza che essa ritorna il valore
2561 della variabile di ambiente \envvar{PWD}, che essendo costruita dalla shell
2562 può contenere un \textit{pathname} comprendente anche dei link
2563 simbolici. Usando \func{getcwd} infatti, essendo il \textit{pathname} ricavato
2564 risalendo all'indietro l'albero della directory, si perderebbe traccia di ogni
2565 passaggio attraverso eventuali link simbolici.
2566
2567 Per cambiare la directory di lavoro si può usare la funzione \funcd{chdir}
2568 (equivalente del comando di shell \cmd{cd}) il cui nome sta appunto per
2569 \textit{change directory}, il suo prototipo è:
2570 \begin{prototype}{unistd.h}{int chdir(const char *pathname)} 
2571   Cambia la directory di lavoro in \param{pathname}.
2572   
2573   \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
2574     nel qual caso \var{errno} assumerà i valori:
2575   \begin{errlist}
2576   \item[\errcode{ENOTDIR}] non si è specificata una directory.
2577   \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
2578     di \param{path}.
2579   \end{errlist}
2580   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2581   \errval{ENOMEM}, \errval{ELOOP} e \errval{EIO}.}
2582 \end{prototype}
2583 \noindent ed ovviamente \param{pathname} deve indicare una directory per la
2584 quale si hanno i permessi di accesso.
2585
2586 Dato che anche le directory sono file, è possibile riferirsi ad esse anche
2587 tramite il file descriptor, e non solo tramite il \textit{pathname}, per fare
2588 questo si usa \funcd{fchdir}, il cui prototipo è:
2589 \begin{prototype}{unistd.h}{int fchdir(int fd)} 
2590   Identica a \func{chdir}, ma usa il file descriptor \param{fd} invece del
2591   \textit{pathname}.
2592   
2593   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
2594     errore, in caso di errore \var{errno} assumerà i valori \errval{EBADF} o
2595     \errval{EACCES}.}
2596 \end{prototype}
2597 \noindent anche in questo caso \param{fd} deve essere un file descriptor
2598 valido che fa riferimento ad una directory. Inoltre l'unico errore di accesso
2599 possibile (tutti gli altri sarebbero occorsi all'apertura di \param{fd}), è
2600 quello in cui il processo non ha il permesso di accesso alla directory
2601 specificata da \param{fd}.
2602
2603 \index{directory~di~lavoro|)} 
2604
2605
2606 \subsection{I file temporanei}
2607 \label{sec:file_temp_file}
2608
2609 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
2610 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
2611 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
2612 creare il file dopo aver controllato che questo non esista, nel momento fra il
2613 controllo e la creazione si ha giusto lo spazio per una possibile
2614 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
2615 sez.~\ref{sec:proc_race_cond}).
2616
2617 Le \acr{glibc} provvedono varie funzioni per generare nomi di file temporanei,
2618 di cui si abbia certezza di unicità al momento della generazione; storicamente
2619 la prima di queste funzioni create a questo scopo era
2620 \funcd{tmpnam},\footnote{la funzione è stata deprecata nella revisione
2621   POSIX.1-2008 dello standard POSIX.} il cui prototipo è:
2622 \begin{prototype}{stdio.h}{char *tmpnam(char *string)}
2623   Genera un nome univoco per un file temporaneo.
2624  
2625   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
2626   \val{NULL} in caso di fallimento. Non sono definiti errori.}
2627 \end{prototype}
2628
2629 La funzione restituisce il puntatore ad una stringa contente un nome di file
2630 valido e non esistente al momento dell'invocazione; se si è passato come
2631 argomento \param{string} un puntatore non nullo ad un buffer di caratteri
2632 questo deve essere di dimensione \const{L\_tmpnam} ed il nome generato vi
2633 verrà copiato automaticamente; altrimenti il nome sarà generato in un buffer
2634 statico interno che verrà sovrascritto ad una chiamata successiva.  Successive
2635 invocazioni della funzione continueranno a restituire nomi unici fino ad un
2636 massimo di \const{TMP\_MAX} volte, limite oltre il quale il comportamento è
2637 indefinito. Al nome viene automaticamente aggiunto come prefisso la directory
2638 specificata dalla costante \const{P\_tmpdir}.\footnote{le costanti
2639   \const{L\_tmpnam}, \const{P\_tmpdir} e \const{TMP\_MAX} sono definite in
2640   \headfile{stdio.h}.}
2641
2642 Di questa funzione esiste una versione \index{funzioni!rientranti} rientrante,
2643 \funcm{tmpnam\_r}, che non fa nulla quando si passa \val{NULL} come argomento.
2644 Una funzione simile, \funcd{tempnam}, permette di specificare un prefisso per
2645 il file esplicitamente, il suo prototipo è:
2646 \begin{prototype}{stdio.h}{char *tempnam(const char *dir, const char *pfx)}
2647   Genera un nome univoco per un file temporaneo.
2648
2649   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
2650   \val{NULL} in caso di fallimento, \var{errno} viene impostata a
2651   \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
2652 \end{prototype}
2653
2654 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
2655 per cui è sempre \index{funzioni!rientranti} rientrante, occorre però
2656 ricordarsi di disallocare con \code{free} il puntatore che restituisce.
2657 L'argomento \param{pfx} specifica un prefisso di massimo 5 caratteri per il
2658 nome provvisorio. La funzione assegna come directory per il file temporaneo,
2659 verificando che esista e sia accessibile, la prima valida fra le seguenti:
2660 \begin{itemize*}
2661 \item La variabile di ambiente \envvar{TMPDIR} (non ha effetto se non è
2662   definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
2663   \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}).
2664 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}).
2665 \item Il valore della costante \const{P\_tmpdir}.
2666 \item la directory \file{/tmp}.
2667 \end{itemize*}
2668
2669 In ogni caso, anche se la generazione del nome è casuale, ed è molto difficile
2670 ottenere un nome duplicato, nulla assicura che un altro processo non possa
2671 avere creato, fra l'ottenimento del nome e l'apertura del file, un altro file
2672 con lo stesso nome; per questo motivo quando si usa il nome ottenuto da una di
2673 queste funzioni occorre sempre aprire il nuovo file in modalità di esclusione
2674 (cioè con l'opzione \const{O\_EXCL} per i file descriptor o con il flag
2675 \code{x} per gli stream) che fa fallire l'apertura in caso il file sia già
2676 esistente.
2677
2678 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
2679 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
2680 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
2681 \begin{prototype}{stdio.h}{FILE *tmpfile(void)}
2682   Restituisce un file temporaneo aperto in lettura/scrittura.
2683   
2684   \bodydesc{La funzione ritorna il puntatore allo stream associato al file
2685     temporaneo in caso di successo e \val{NULL} in caso di errore, nel qual
2686     caso \var{errno} assumerà i valori:
2687     \begin{errlist}
2688     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
2689     \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
2690     \end{errlist}
2691     ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
2692     \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES}.}
2693 \end{prototype}
2694
2695 La funzione restituisce direttamente uno stream già aperto (in modalità
2696 \code{r+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso, che viene
2697 automaticamente cancellato alla sua chiusura o all'uscita dal programma. Lo
2698 standard non specifica in quale directory verrà aperto il file, ma le
2699 \acr{glibc} prima tentano con \const{P\_tmpdir} e poi con \file{/tmp}. Questa
2700 funzione è \index{funzioni!rientranti} rientrante e non soffre di problemi di
2701 \itindex{race~condition} \textit{race condition}.
2702
2703 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
2704 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
2705 modificano una stringa di input che serve da modello e che deve essere
2706 conclusa da 6 caratteri \code{X} che verranno sostituiti da un codice
2707 unico. La prima delle due è analoga a \func{tmpnam} e genera un nome casuale,
2708 il suo prototipo è:
2709 \begin{prototype}{stlib.h}{char *mktemp(char *template)}
2710   Genera un nome univoco per un file temporaneo.
2711   
2712   \bodydesc{La funzione ritorna il puntatore \param{template} in caso di
2713     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
2714     assumerà i valori:
2715     \begin{errlist}
2716     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2717     \end{errlist}}
2718 \end{prototype}
2719
2720 La funzionane genera un nome univoco sostituendo le \code{XXXXXX} finali di
2721 \param{template}; dato che \param{template} deve poter essere modificata dalla
2722 funzione non si può usare una stringa costante.  Tutte le avvertenze riguardo
2723 alle possibili \itindex{race~condition} \textit{race condition} date per
2724 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
2725 il valore usato per sostituire le \code{XXXXXX} viene formato con il \ids{PID}
2726 del processo più una lettera, il che mette a disposizione solo 26 possibilità
2727 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
2728 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
2729 usata.
2730
2731 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
2732 \func{tmpfile}, ma restituisce un file descriptor invece di un nome; il suo
2733 prototipo è:
2734 \begin{prototype}{stlib.h}{int mkstemp(char *template)}
2735   Genera un file temporaneo.
2736   
2737   \bodydesc{La funzione ritorna il file descriptor in caso di successo e
2738     -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
2739     \begin{errlist}
2740     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2741     \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
2742       contenuto di \param{template} è indefinito.
2743     \end{errlist}}
2744 \end{prototype}
2745
2746 Come per \func{mktemp} anche in questo caso \param{template} non può essere
2747 una stringa costante. La funzione apre un file in lettura/scrittura con la
2748 funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
2749 sez.~\ref{sec:file_open}), in questo modo al ritorno della funzione si ha la
2750 certezza di essere stati i creatori del file, i cui permessi (si veda
2751 sez.~\ref{sec:file_perm_overview}) sono impostati al valore \code{0600}
2752 (lettura e scrittura solo per il proprietario).\footnote{questo è vero a
2753   partire dalle \acr{glibc} 2.0.7, le versioni precedenti delle \acr{glibc} e
2754   le vecchie \acr{libc5} e \acr{libc4} usavano il valore \code{0666} che
2755   permetteva a chiunque di leggere e scrivere i contenuti del file.}  Di
2756 questa funzione esiste una variante \funcd{mkostemp}, introdotta
2757 specificamente dalla \acr{glibc},\footnote{la funzione è stata introdotta
2758   nella versione 2.7 delle librerie e richiede che sia definita la macro
2759   \macro{\_GNU\_SOURCE}.} il cui prototipo è:
2760 \begin{prototype}{stlib.h}{int mkostemp(char *template, int flags)}
2761   Genera un file temporaneo.
2762   
2763   \bodydesc{La funzione ritorna il file descriptor in caso di successo e
2764     -1 in caso di errore, con gli stessi errori di \func{mkstemp}.}
2765 \end{prototype}
2766 \noindent la cui sola differenza è la presenza dell'ulteriore argomento
2767 \var{flags} che consente di specificare i flag da passare ad \func{open}
2768 nell'apertura del file.
2769
2770
2771 In OpenBSD è stata introdotta un'altra funzione simile alle precedenti,
2772 \funcd{mkdtemp}, che crea invece una directory temporanea;\footnote{la
2773   funzione è stata introdotta nelle \acr{glibc} a partire dalla versione
2774   2.1.91 ed inserita nello standard POSIX.1-2008.}  il suo prototipo è:
2775 \begin{prototype}{stlib.h}{char *mkdtemp(char *template)}
2776   Genera una directory temporanea.
2777   
2778   \bodydesc{La funzione ritorna il puntatore al nome della directory in caso
2779     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
2780     assumerà i valori:
2781     \begin{errlist}
2782     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2783     \end{errlist}
2784     più gli altri eventuali codici di errore di \func{mkdir}.}
2785 \end{prototype}
2786
2787 La funzione genera una directory il cui nome è ottenuto sostituendo le
2788 \code{XXXXXX} finali di \param{template} con permessi \code{0700} (al solito
2789 si veda cap.~\ref{cha:file_unix_interface} per i dettagli); dato che la
2790 creazione della directory è sempre esclusiva i precedenti problemi di
2791 \itindex{race~condition} \textit{race condition} non si pongono.
2792
2793
2794 \section{La manipolazione delle caratteristiche dei file}
2795 \label{sec:file_infos}
2796
2797 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
2798 relative alle caratteristiche di ciascun file, a partire dalle informazioni
2799 relative al controllo di accesso, sono mantenute \itindex{inode}
2800 nell'\textit{inode}.
2801
2802 Vedremo in questa sezione come sia possibile leggere tutte queste informazioni
2803 usando la funzione \func{stat}, che permette l'accesso a tutti i dati
2804 memorizzati \itindex{inode} nell'\textit{inode}; esamineremo poi le varie
2805 funzioni usate per manipolare tutte queste informazioni (eccetto quelle che
2806 riguardano la gestione del controllo di accesso, trattate in in
2807 sez.~\ref{sec:file_access_control}).
2808
2809
2810 \subsection{La lettura delle caratteristiche dei file}
2811 \label{sec:file_stat}
2812
2813 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
2814 delle funzioni \func{stat} che sono quelle che usa il comando \cmd{ls} per
2815 poter ottenere e mostrare tutti i dati relativi ad un file; ne fanno parte le
2816 funzioni \funcd{stat}, \funcd{fstat} e \funcd{lstat}, i cui prototipi sono:
2817 \begin{functions}
2818   \headdecl{sys/types.h} 
2819   \headdecl{sys/stat.h} 
2820   \headdecl{unistd.h}
2821
2822   \funcdecl{int stat(const char *file\_name, struct stat *buf)} 
2823   \funcdecl{int lstat(const char *file\_name, struct stat *buf)} 
2824   \funcdecl{int fstat(int filedes, struct stat *buf)} 
2825   Legge le informazioni di un file.
2826
2827   \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
2828     errore, nel qual caso \var{errno} assumerà uno dei valori: \errval{EBADF},
2829     \errval{ENOENT}, \errval{ENOTDIR}, \errval{ELOOP}, \errval{EFAULT},
2830     \errval{EACCES}, \errval{ENOMEM}, \errval{ENAMETOOLONG}.}
2831 \end{functions}
2832
2833 La funzione \func{stat} legge le informazioni del file il cui
2834 \textit{pathname} è specificato dalla stringa puntata da \param{file\_name} e
2835 le inserisce nel buffer puntato dall'argomento \param{buf}; la funzione
2836 \func{lstat} è identica a \func{stat} eccetto che se \param{file\_name} è un
2837 link simbolico vengono lette le informazioni relative ad esso e non al file a
2838 cui fa riferimento. Infine \func{fstat} esegue la stessa operazione su un file
2839 già aperto, specificato tramite il suo file descriptor \param{filedes}.
2840
2841 La struttura \struct{stat} usata da queste funzioni è definita nell'header
2842 \headfile{sys/stat.h} e in generale dipende dall'implementazione; la versione
2843 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
2844 riportata dalla pagina di manuale di \func{stat}; in realtà la definizione
2845 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
2846 riservati per estensioni come tempi dei file più precisi (vedi
2847 sez.~\ref{sec:file_file_times}), o per il padding dei campi.
2848
2849 \begin{figure}[!htb]
2850   \footnotesize
2851   \centering
2852   \begin{minipage}[c]{\textwidth}
2853     \includestruct{listati/stat.h}
2854   \end{minipage} 
2855   \normalsize 
2856   \caption{La struttura \structd{stat} per la lettura delle informazioni dei 
2857     file.}
2858   \label{fig:file_stat_struct}
2859 \end{figure}
2860
2861 Si noti come i vari membri della struttura siano specificati come tipi
2862 primitivi del sistema (di quelli definiti in
2863 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \headfile{sys/types.h}).
2864
2865 \subsection{I tipi di file}
2866 \label{sec:file_types}
2867
2868 Come riportato in tab.~\ref{tab:file_file_types} in Linux oltre ai file e alle
2869 directory esistono altri oggetti che possono stare su un filesystem.  Il tipo
2870 di file è ritornato dalla funzione \func{stat} come maschera binaria nel campo
2871 \var{st\_mode} (che contiene anche le informazioni relative ai permessi) di
2872 una struttura \struct{stat}.
2873
2874 Dato che il valore numerico può variare a seconda delle implementazioni, lo
2875 standard POSIX definisce un insieme di macro per verificare il tipo di file,
2876 queste vengono usate anche da Linux che supporta pure le estensioni allo
2877 standard per i link simbolici e i socket definite da BSD; l'elenco completo
2878 delle macro con cui è possibile estrarre l'informazione da \var{st\_mode} è
2879 riportato in tab.~\ref{tab:file_type_macro}.
2880 \begin{table}[htb]
2881   \centering
2882   \footnotesize
2883   \begin{tabular}[c]{|l|l|}
2884     \hline
2885     \textbf{Macro} & \textbf{Tipo del file} \\
2886     \hline
2887     \hline
2888     \macro{S\_ISREG}\texttt{(m)}  & file normale.\\
2889     \macro{S\_ISDIR}\texttt{(m)}  & directory.\\
2890     \macro{S\_ISCHR}\texttt{(m)}  & dispositivo a caratteri.\\
2891     \macro{S\_ISBLK}\texttt{(m)}  & dispositivo a blocchi.\\
2892     \macro{S\_ISFIFO}\texttt{(m)} & fifo.\\
2893     \macro{S\_ISLNK}\texttt{(m)}  & link simbolico.\\
2894     \macro{S\_ISSOCK}\texttt{(m)} & socket.\\
2895     \hline    
2896   \end{tabular}
2897   \caption{Macro per i tipi di file (definite in \headfile{sys/stat.h}).}
2898   \label{tab:file_type_macro}
2899 \end{table}
2900
2901 Oltre alle macro di tab.~\ref{tab:file_type_macro} è possibile usare
2902 direttamente il valore di \var{st\_mode} per ricavare il tipo di file
2903 controllando direttamente i vari bit in esso memorizzati. Per questo sempre in
2904 \headfile{sys/stat.h} sono definite le costanti numeriche riportate in
2905 tab.~\ref{tab:file_mode_flags}.
2906
2907 Il primo valore dell'elenco di tab.~\ref{tab:file_mode_flags} è la maschera
2908 binaria che permette di estrarre i bit nei quali viene memorizzato il tipo di
2909 file, i valori successivi sono le costanti corrispondenti ai singoli bit, e
2910 possono essere usati per effettuare la selezione sul tipo di file voluto, con
2911 un'opportuna combinazione.
2912
2913 \begin{table}[htb]
2914   \centering
2915   \footnotesize
2916   \begin{tabular}[c]{|l|c|l|}
2917     \hline
2918     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
2919     \hline
2920     \hline
2921     \const{S\_IFMT}   &  0170000 & Maschera per i bit del tipo di file.\\
2922     \const{S\_IFSOCK} &  0140000 & Socket.\\
2923     \const{S\_IFLNK}  &  0120000 & Link simbolico.\\
2924     \const{S\_IFREG}  &  0100000 & File regolare.\\ 
2925     \const{S\_IFBLK}  &  0060000 & Dispositivo a blocchi.\\
2926     \const{S\_IFDIR}  &  0040000 & Directory.\\
2927     \const{S\_IFCHR}  &  0020000 & Dispositivo a caratteri.\\
2928     \const{S\_IFIFO}  &  0010000 & Fifo.\\
2929     \hline
2930     \const{S\_ISUID}  &  0004000 & Set UID bit \itindex{suid~bit}.\\
2931     \const{S\_ISGID}  &  0002000 & Set GID bit \itindex{sgid~bit}.\\
2932     \const{S\_ISVTX}  &  0001000 & Sticky bit \itindex{sticky~bit}.\\
2933     \hline
2934 %    \const{S\_IRWXU}  &  00700   & Bitmask per i permessi del proprietario.\\
2935     \const{S\_IRUSR}  &  00400   & Il proprietario ha permesso di lettura.\\
2936     \const{S\_IWUSR}  &  00200   & Il proprietario ha permesso di scrittura.\\
2937     \const{S\_IXUSR}  &  00100   & Il proprietario ha permesso di esecuzione.\\
2938     \hline
2939 %    \const{S\_IRWXG}  &  00070   & Bitmask per i permessi del gruppo.\\
2940     \const{S\_IRGRP}  &  00040   & Il gruppo ha permesso di lettura.\\
2941     \const{S\_IWGRP}  &  00020   & Il gruppo ha permesso di scrittura.\\
2942     \const{S\_IXGRP}  &  00010   & Il gruppo ha permesso di esecuzione.\\
2943     \hline
2944 %    \const{S\_IRWXO}  &  00007   & Bitmask per i permessi di tutti gli altri\\
2945     \const{S\_IROTH}  &  00004   & Gli altri hanno permesso di lettura.\\
2946     \const{S\_IWOTH}  &  00002   & Gli altri hanno permesso di esecuzione.\\
2947     \const{S\_IXOTH}  &  00001   & Gli altri hanno permesso di esecuzione.\\
2948     \hline    
2949   \end{tabular}
2950   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
2951     \var{st\_mode} (definite in \headfile{sys/stat.h}).}
2952   \label{tab:file_mode_flags}
2953 \end{table}
2954
2955 Ad esempio se si volesse impostare una condizione che permetta di controllare
2956 se un file è una directory o un file ordinario si potrebbe definire la macro
2957 di preprocessore:
2958 \includecodesnip{listati/is_file_dir.h}
2959 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
2960 poi si effettua il confronto con la combinazione di tipi scelta.
2961
2962
2963 \subsection{Le dimensioni dei file}
2964 \label{sec:file_file_size}
2965
2966 Il campo \var{st\_size} di una struttura \struct{stat} contiene la dimensione
2967 del file in byte, se si tratta di un file regolare. Nel caso di un link
2968 simbolico la dimensione è quella del \textit{pathname} che il link stesso
2969 contiene; per le fifo questo campo è sempre nullo.
2970
2971 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
2972 byte. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
2973 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
2974 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
2975 dimensione inferiore sarebbe inefficiente.
2976
2977 Si tenga conto che la lunghezza del file riportata in \var{st\_size} non è
2978 detto che corrisponda all'occupazione dello spazio su disco per via della
2979 possibile esistenza dei cosiddetti \index{file!\textit{hole}} \textit{holes}
2980 (letteralmente \textsl{buchi}) che si formano tutte le volte che si va a
2981 scrivere su un \itindex{sparse~file} file dopo aver eseguito uno spostamento
2982 oltre la sua fine (tratteremo in dettaglio l'argomento in
2983 sez.~\ref{sec:file_lseek}).
2984
2985 In questo caso si avranno risultati differenti a seconda del modo in cui si
2986 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
2987 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
2988 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
2989 caso per le parti non scritte vengono restituiti degli zeri, si avrà lo stesso
2990 risultato di \cmd{ls}.
2991
2992 Se è sempre possibile allargare un file, scrivendoci sopra od usando la
2993 funzione \func{lseek} per spostarsi oltre la sua fine, esistono anche casi in
2994 cui si può avere bisogno di effettuare un troncamento, scartando i dati
2995 presenti al di là della dimensione scelta come nuova fine del file.
2996
2997 Un file può sempre essere troncato a zero aprendolo con il flag
2998 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
2999 dimensione si possono usare le due funzioni \funcd{truncate} e
3000 \funcd{ftruncate}, i cui prototipi sono:
3001 \begin{functions}
3002   \headdecl{unistd.h} 
3003
3004   \funcdecl{int truncate(const char *file\_name, off\_t length)} 
3005
3006   \funcdecl{int ftruncate(int fd, off\_t length))} 
3007
3008   Troncano un file alla lunghezza \param{length}.
3009
3010   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per un
3011     errore, nel qual caso \var{errno} viene impostata opportunamente; per
3012     \func{ftruncate} si hanno i valori:
3013   \begin{errlist}
3014   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
3015   \item[\errcode{EINVAL}] \param{fd} è un riferimento ad un socket, non a un
3016     file o non è aperto in scrittura.
3017   \end{errlist}
3018   per \func{truncate} si hanno:
3019   \begin{errlist}
3020   \item[\errcode{EACCES}] il file non ha permesso di scrittura o non si ha il
3021     permesso di esecuzione una delle directory del \textit{pathname}.
3022   \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
3023   \end{errlist}
3024   ed anche \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
3025   \errval{EROFS}, \errval{EIO}, \errval{EFAULT}, \errval{ELOOP}.}
3026 \end{functions}
3027
3028 Entrambe le funzioni fan sì che la dimensione del file sia troncata ad un
3029 valore massimo specificato da \param{length}, e si distinguono solo per il
3030 fatto che il file viene indicato con il \textit{pathname} \param{file\_name}
3031 per \func{truncate} e con il file descriptor \param{fd} per \funcd{ftruncate};
3032 se il file è più lungo della lunghezza specificata i dati in eccesso saranno
3033 perduti.
3034
3035 Il comportamento in caso di lunghezza inferiore non è specificato e dipende
3036 dall'implementazione: il file può essere lasciato invariato o esteso fino alla
3037 lunghezza scelta; nel caso di Linux viene esteso con la creazione di un
3038 \index{file!\textit{hole}} \textsl{buco} nel \itindex{sparse~file} file e ad
3039 una lettura si otterranno degli zeri; si tenga presente però che questo
3040 comportamento è supportato solo per filesystem nativi, ad esempio su un
3041 filesystem non nativo come il VFAT di Windows questo non è possibile.
3042
3043 \subsection{I tempi dei file}
3044 \label{sec:file_file_times}
3045
3046 Il sistema mantiene per ciascun file tre tempi, questi sono registrati
3047 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del file e
3048 possono essere letti tramite la funzione \func{stat}, che li restituisce
3049 attraverso tre specifici campi della struttura \struct{stat} di
3050 fig.~\ref{fig:file_stat_struct}. Il significato di detti tempi e dei relativi
3051 campi è riportato nello schema in tab.~\ref{tab:file_file_times}, dove è anche
3052 riportato un esempio delle funzioni che effettuano cambiamenti su di essi. Il
3053 valore è espresso nel cosiddetto \itindex{calendar~time} \textit{calendar
3054   time}, su cui torneremo in dettaglio in sez.~\ref{sec:sys_time}.
3055
3056 \begin{table}[htb]
3057   \centering
3058   \footnotesize
3059   \begin{tabular}[c]{|c|l|l|c|}
3060     \hline
3061     \textbf{Membro} & \textbf{Significato} & \textbf{Funzione} 
3062     & \textbf{Opzione di \cmd{ls}} \\
3063     \hline
3064     \hline
3065     \var{st\_atime}& ultimo accesso ai dati del file    &
3066                      \func{read}, \func{utime}          & \cmd{-u}\\
3067     \var{st\_mtime}& ultima modifica ai dati del file   &
3068                      \func{write}, \func{utime}         & default\\
3069     \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
3070                      \func{chmod}, \func{utime}         & \cmd{-c}\\
3071     \hline
3072   \end{tabular}
3073   \caption{I tre tempi associati a ciascun file.}
3074   \label{tab:file_file_times}
3075 \end{table}
3076
3077 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
3078 ultima modifica (il \textit{modification time}, \var{st\_mtime}) e il tempo di
3079 ultimo cambiamento di stato (il \textit{change time}, \var{st\_ctime}). Il
3080 primo infatti fa riferimento ad una modifica del contenuto di un file, mentre
3081 il secondo ad una modifica \itindex{inode} dell'\textit{inode}. Dato che
3082 esistono molte operazioni, come la funzione \func{link} e altre che vedremo in
3083 seguito, che modificano solo le informazioni contenute \itindex{inode}
3084 nell'\textit{inode} senza toccare il contenuto del file, diventa necessario
3085 l'utilizzo di questo secondo tempo.
3086
3087 Il tempo di ultima modifica viene usato ad esempio da programmi come
3088 \cmd{make} per decidere quali file necessitano di essere ricompilati o
3089 (talvolta insieme anche al tempo di cambiamento di stato) per decidere quali
3090 file devono essere archiviati per il backup. Il tempo di ultimo accesso viene
3091 di solito usato per identificare i file che non vengono più utilizzati per un
3092 certo lasso di tempo. Ad esempio un programma come \texttt{leafnode} lo usa
3093 per cancellare gli articoli letti più vecchi, mentre \texttt{mutt} lo usa per
3094 marcare i messaggi di posta che risultano letti.  Il sistema non tiene conto
3095 dell'ultimo accesso \itindex{inode} all'\textit{inode}, pertanto funzioni come
3096 \func{access} o \func{stat} non hanno alcuna influenza sui tre tempi. Il
3097 comando \cmd{ls} (quando usato con le opzioni \cmd{-l} o \cmd{-t}) mostra i
3098 tempi dei file secondo lo schema riportato nell'ultima colonna di
3099 tab.~\ref{tab:file_file_times}.
3100
3101 L'aggiornamento del tempo di ultimo accesso è stato a lungo considerato un
3102 difetto progettuale di Unix, questo infatti comporta la necessità di
3103 effettuare un accesso in scrittura sul disco anche in tutti i casi in cui
3104 questa informazione non interessa e sarebbe possibile avere un semplice
3105 accesso in lettura sui dati bufferizzati. Questo comporta un ovvio costo sia
3106 in termini di prestazioni, che di consumo di risorse come la batteria per i
3107 portatili, o cicli di riscrittura per i dischi su memorie riscrivibili.
3108
3109 % TODO aggiustare per il contenuto duplicato con le analoghe MS_*
3110
3111 Per questo motivo, onde evitare di mantenere una informazione che nella
3112 maggior parte dei casi non interessa, è sempre stato possibile disabilitare
3113 l'aggiornamento del tempo di ultimo accesso con l'opzione di montaggio
3114 \texttt{noatime}. Dato però che questo può creare problemi a qualche
3115 programma, in Linux è stata introdotta la opzione \texttt{relatime} che esegue
3116 l'aggiornamento soltanto se il tempo di ultimo accesso è precedente al tempo di
3117 ultima modifica o cambiamento, così da rendere evidente che vi è stato un
3118 accesso dopo la scrittura, ed evitando al contempo ulteriori operazioni su
3119 disco negli accessi successivi. In questo modo l'informazione relativa al
3120 fatto che un file sia stato letto resta disponibile, e ad esempio i programmi
3121 citati in precedenza continuano a funzionare. Questa opzione, a partire dal
3122 kernel 2.6.30, è diventata il comportamento di default e non deve più essere
3123 specificata esplicitamente.\footnote{si può comunque riottenere il vecchio
3124   comportamento usando la opzione di montaggio \texttt{strictatime}.}
3125
3126 \begin{table}[htb]
3127   \centering
3128   \footnotesize
3129   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
3130     \hline
3131     \multicolumn{1}{|p{3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
3132     \multicolumn{3}{|p{3.6cm}|}{\centering{
3133         \textbf{File o directory del riferimento}}}&
3134     \multicolumn{3}{|p{3.6cm}|}{\centering{
3135         \textbf{Directory contenente il riferimento}}} 
3136     &\multicolumn{1}{|p{3.6cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
3137     \cline{2-7}
3138     \cline{2-7}
3139     \multicolumn{1}{|p{3cm}|}{} 
3140     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
3141     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
3142     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
3143     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
3144     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
3145     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
3146     &\multicolumn{1}{|p{3cm}|}{} \\
3147     \hline
3148     \hline
3149     \func{chmod}, \func{fchmod} 
3150              & --      & --      &$\bullet$& --      & --      & --      &\\
3151     \func{chown}, \func{fchown} 
3152              & --      & --      &$\bullet$& --      & --      & --      &\\
3153     \func{creat}  
3154              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&  
3155              con \const{O\_CREATE} \\
3156     \func{creat}  
3157              & --      &$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&   
3158              con \const{O\_TRUNC} \\
3159     \func{exec}  
3160              &$\bullet$& --      & --      & --      & --      & --      &\\
3161     \func{lchown}  
3162              & --      & --      &$\bullet$& --      & --      & --      &\\
3163     \func{link}
3164              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
3165     \func{mkdir}
3166              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3167     \func{mkfifo}
3168              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3169     \func{open}
3170              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$& 
3171              con \const{O\_CREATE} \\
3172     \func{open}
3173              & --      &$\bullet$&$\bullet$& --      & --      & --      & 
3174              con \const{O\_TRUNC}  \\
3175     \func{pipe}
3176              &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
3177     \func{read}
3178              &$\bullet$& --      & --      & --      & --      & --      &\\
3179     \func{remove}
3180              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
3181              se esegue \func{unlink}\\
3182     \func{remove}
3183               & --      & --      & --      & --      &$\bullet$&$\bullet$& 
3184               se esegue \func{rmdir}\\
3185     \func{rename}
3186               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
3187               per entrambi gli argomenti\\
3188     \func{rmdir}
3189               & --      & --      & --      & --      &$\bullet$&$\bullet$&\\ 
3190     \func{truncate}, \func{ftruncate}
3191               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
3192     \func{unlink}
3193               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\ 
3194     \func{utime}
3195               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\ 
3196     \func{write}
3197               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
3198     \hline
3199   \end{tabular}
3200   \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo 
3201     accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento
3202     \textsl{(c)} dalle varie funzioni operanti su file e directory.}
3203   \label{tab:file_times_effects}  
3204 \end{table}
3205
3206
3207 L'effetto delle varie funzioni di manipolazione dei file sui relativi tempi è
3208 illustrato in tab.~\ref{tab:file_times_effects}, facendo riferimento al
3209 comportamento classico per quanto riguarda \var{st\_atime}. Si sono riportati
3210 gli effetti sia per il file a cui si fa riferimento, sia per la directory che
3211 lo contiene; questi ultimi possono essere capiti se si tiene conto di quanto
3212 già detto, e cioè che anche le directory sono anch'esse file che contengono
3213 una lista di nomi, che il sistema tratta in maniera del tutto analoga a tutti
3214 gli altri.
3215
3216 Per questo motivo tutte le volte che compiremo un'operazione su un file che
3217 comporta una modifica del nome contenuto nella directory, andremo anche a
3218 scrivere sulla directory che lo contiene cambiandone il tempo di modifica. Un
3219 esempio di questo tipo di operazione può essere la cancellazione di un file,
3220 invece leggere o scrivere o cambiare i permessi di un file ha effetti solo sui
3221 tempi di quest'ultimo.
3222
3223 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
3224 creazione del file, usato in molti altri sistemi operativi, ma che in Unix non
3225 esiste. Per questo motivo quando si copia un file, a meno di preservare
3226 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
3227 avrà sempre il tempo corrente come data di ultima modifica.
3228
3229 I tempi di ultimo accesso e modifica possono essere modificati esplicitamente
3230 usando la funzione \funcd{utime}, il cui prototipo è:
3231 \begin{prototype}{utime.h}
3232   {int utime(const char *filename, struct utimbuf *times)} 
3233   Modifica i tempi di ultimo accesso e modifica di un file.
3234
3235   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3236     errore, nel qual caso \var{errno} assumerà uno dei valori:
3237     \begin{errlist}
3238     \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
3239     \item[\errcode{EPERM}] non si è proprietari del file.
3240     \end{errlist}
3241     ed inoltre \errval{EROFS} e \errval{ENOENT}.}
3242 \end{prototype}
3243
3244 La funzione cambia i tempi di ultimo accesso e modifica del file specificato
3245 dall'argomento \param{filename}, e richiede come secondo argomento il
3246 puntatore ad una struttura \struct{utimbuf}, la cui definizione è riportata in
3247 fig.~\ref{fig:struct_utimebuf}, con i nuovi valori di detti tempi
3248 (rispettivamente  nei campi \var{actime} e \var{modtime}). Se si passa un
3249 puntatore nullo verrà impostato il tempo corrente.
3250
3251 \begin{figure}[!htb]
3252   \footnotesize \centering
3253   \begin{minipage}[c]{\textwidth}
3254     \includestruct{listati/utimbuf.h}
3255   \end{minipage} 
3256   \normalsize 
3257   \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
3258     i tempi dei file.}
3259   \label{fig:struct_utimebuf}
3260 \end{figure}
3261
3262 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
3263 cosa è l'argomento \param{times}; se è \val{NULL} la funzione imposta il
3264 tempo corrente ed è sufficiente avere accesso in scrittura al file; se invece
3265 si è specificato un valore la funzione avrà successo solo se si è proprietari
3266 del file o si hanno i privilegi di amministratore.
3267
3268 Si tenga presente che non è comunque possibile specificare il tempo di
3269 cambiamento di stato del file, che viene aggiornato direttamente dal kernel
3270 tutte le volte che si modifica \itindex{inode} l'\textit{inode} (quindi anche
3271 alla chiamata di \func{utime}).  Questo serve anche come misura di sicurezza
3272 per evitare che si possa modificare un file nascondendo completamente le
3273 proprie tracce. In realtà la cosa resta possibile se si è in grado di accedere
3274 al \index{file!di~dispositivo} file di dispositivo, scrivendo direttamente sul
3275 disco senza passare attraverso il filesystem, ma ovviamente in questo modo la
3276 cosa è più complicata da realizzare.
3277
3278 A partire dal kernel 2.6 la risoluzione dei tempi dei file, che nei campi di
3279 tab.~\ref{tab:file_file_times} è espressa in secondi, è stata portata ai
3280 nanosecondi per la gran parte dei filesystem. La ulteriore informazione può
3281 essere acceduta attraverso altri campi appositamente aggiunti alla struttura
3282 \struct{stat}. Se si sono definite le macro \macro{\_BSD\_SOURCE} o
3283 \macro{\_SVID\_SOURCE} questi sono \var{st\_atim.tv\_nsec},
3284 \var{st\_mtim.tv\_nsec} e \var{st\_ctim.tv\_nsec} se queste non sono definite,
3285 \var{st\_atimensec}, \var{st\_mtimensec} e \var{st\_mtimensec}. Qualora il
3286 supporto per questa maggior precisione sia assente questi campi aggiuntivi
3287 saranno nulli.
3288
3289 Per la gestione di questi nuovi valori è stata definita una seconda funzione
3290 di modifica, \funcd{utimes}, che consente di specificare tempi con maggior
3291 precisione; il suo prototipo è:
3292 \begin{prototype}
3293   {sys/time.h}
3294   {int utimes(const char *filename, struct timeval times[2])} 
3295   Modifica i tempi di ultimo accesso e modifica di un file.
3296
3297   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3298     errore, nel qual caso \var{errno} assumerà uno dei valori:
3299     \begin{errlist}
3300     \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
3301     \item[\errcode{EPERM}] non si è proprietari del file.
3302     \end{errlist} 
3303     ed inoltre \errval{EROFS} e \errval{ENOENT}.}
3304 \end{prototype}
3305
3306 La funzione è del tutto analoga alla precedente \func{utime} ma usa come
3307 secondo argomento un vettore di due strutture \struct{timeval}, la cui
3308 definizione è riportata in fig.~\ref{fig:sys_timeval_struct}, che consentono
3309 di indicare i tempi con una precisione del microsecondo. Il primo elemento
3310 di \param{times} indica il valore per il tempo di ultimo accesso, il secondo
3311 quello per il tempo di ultima modifica. Se si indica come secondo argomento un
3312 puntatore nullo di nuovo verrà utilizzato il tempo corrente.
3313
3314 \begin{figure}[!htb]
3315   \footnotesize \centering
3316   \begin{minipage}[c]{\textwidth}
3317     \includestruct{listati/timeval.h}
3318   \end{minipage} 
3319   \normalsize 
3320   \caption{La struttura \structd{timeval} usata per indicare valori di tempo
3321     con la precisione del microsecondo.}
3322   \label{fig:sys_timeval_struct}
3323 \end{figure}
3324
3325 Oltre ad \func{utimes} su Linux sono presenti altre due funzioni,\footnote{le
3326   due funzioni non sono definite in nessuno standard, ma sono presenti, oltre
3327   che su Linux, anche su BSD.} \funcd{futimes} e \funcd{lutimes}, che
3328 consentono rispettivamente di effettuare la modifica utilizzando un file
3329 già aperto o di eseguirla direttamente su un link simbolico. I relativi
3330 prototipi sono:
3331 \begin{functions}
3332   \headdecl{sys/time.h} 
3333   
3334   \funcdecl{int futimes(int fd, const struct timeval tv[2])} Cambia i tempi
3335   di un file già aperto specificato tramite il file descriptor \param{fd}.
3336
3337   \funcdecl{int lutimes(const char *filename, const struct timeval tv[2])}
3338   Cambia i tempi di \param{filename} anche se questo è un link simbolico.
3339   
3340   
3341   \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
3342     errore, nel qual caso \var{errno} assumerà gli stessi valori di
3343     \func{utimes}, con in più per \func{futimes}:
3344   \begin{errlist}
3345   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
3346   \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3347   \end{errlist}}
3348 \end{functions}
3349
3350 Le due funzioni anno lo stesso comportamento di \texttt{utimes} e richiedono
3351 gli stessi privilegi per poter operare, la differenza è che con \func{futimes}
3352 si può indicare il file su cui operare facendo riferimento al relativo file
3353 descriptor mentre con \func{lutimes} nel caso in cui \param{filename} sia un
3354 link simbolico saranno modificati i suoi tempi invece di quelli del file a cui
3355 esso punta.
3356
3357 Nonostante il kernel, come accennato, supporti risoluzioni dei tempi dei file
3358 fino al nanosecondo, le funzioni fin qui esaminate non consentono di impostare
3359 valori con questa precisione. Per questo sono state introdotte due nuove
3360 funzioni, \funcd{futimens} e \func{utimensat}, in grado di eseguire questo
3361 compito; i rispettivi prototipi sono:
3362 \begin{functions}
3363   \headdecl{sys/time.h} 
3364   
3365   \funcdecl{futimens(int fd, const struct timespec times[2])} Cambia i tempi
3366   di un file già aperto, specificato dal file descriptor \param{fd}.
3367
3368   \funcdecl{int utimensat(int dirfd, const char *pathname, const struct
3369     timespec times[2], int flags)} Cambia i tempi del file \param{pathname}.
3370   
3371   
3372   \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
3373     errore, nel qual caso \var{errno} assumerà gli stessi valori di
3374     \func{utimes}, con in più per \func{futimes}:
3375   \begin{errlist}
3376   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
3377   \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3378   \end{errlist}}
3379 \end{functions}
3380
3381 Entrambe le funzioni utilizzano per indicare i valori dei tempi un
3382 vettore \param{times} di due strutture \struct{timespec} che permette di
3383 specificare un valore di tempo con una precisione fino al nanosecondo, la cui
3384 definizione è riportata in fig.~\ref{fig:sys_timespec_struct}.
3385
3386 \begin{figure}[!htb]
3387   \footnotesize \centering
3388   \begin{minipage}[c]{\textwidth}
3389     \includestruct{listati/timespec.h}
3390   \end{minipage} 
3391   \normalsize 
3392   \caption{La struttura \structd{timespec} usata per indicare valori di tempo
3393     con la precisione del nanosecondo.}
3394   \label{fig:sys_timespec_struct}
3395 \end{figure}
3396
3397 Come per le precedenti funzioni il primo elemento di \param{times} indica il
3398 tempo di ultimo accesso ed il secondo quello di ultima modifica, e se si usa
3399 il valore \val{NULL} verrà impostato il tempo corrente sia per l'ultimo
3400 accesso che per l'ultima modifica. Nei singoli elementi di \param{times} si
3401 possono inoltre utilizzare due valori speciali per il campo \var{tv\_nsec}:
3402 con \const{UTIME\_NOW} si richiede l'uso del tempo corrente, mentre con
3403 \const{UTIME\_OMIT} si richiede di non impostare il tempo. Si può così
3404 aggiornare in maniera specifica soltanto uno fra il tempo di ultimo accesso e
3405 quello di ultima modifica. Quando si usa uno di questi valori speciali per
3406 \var{tv\_nsec} il corrispondente valore di \var{tv\_sec} viene ignorato.
3407
3408 Queste due funzioni sono una estensione definita in una recente revisione
3409 dello standard POSIX (la POSIX.1-2008); sono state introdotte a partire dal
3410 kernel 2.6.22, e supportate dalle \acr{glibc} a partire dalla versione
3411 2.6.\footnote{in precedenza, a partire dal kernel 2.6.16, era stata introdotta
3412   la funzione \funcm{futimesat} seguendo una bozza della revisione dello
3413   standard poi modificata, questa funzione, sostituita da \func{utimensat}, è
3414   stata dichiarata obsoleta, non è supportata da nessuno standard e non deve
3415   essere più utilizzata: pertanto non la tratteremo.} La prima è
3416 sostanzialmente una estensione di \func{futimes} che consente di specificare i
3417 tempi con precisione maggiore, la seconda supporta invece, rispetto ad
3418 \func{utimes}, una sintassi più complessa che, come vedremo in
3419 sez.~\ref{sec:file_openat} consente una indicazione sicura dei
3420 \itindsub{pathname}{relativo} \textit{pathname relativi} specificando la
3421 directory da usare come riferimento in \param{dirfd} e la possibilità di
3422 usare \param{flags} per indicare alla funzione di dereferenziare o meno i link
3423 simbolici; si rimanda pertanto la spiegazione del significato degli argomenti
3424 aggiuntivi alla trattazione generica delle varie funzioni che usano la stessa
3425 sintassi, effettuata in sez.~\ref{sec:file_openat}.
3426
3427
3428 \section{Il controllo di accesso ai file}
3429 \label{sec:file_access_control}
3430
3431 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
3432 del controllo di accesso ai file, che viene implementato per qualunque
3433 filesystem standard.\footnote{per standard si intende che implementa le
3434   caratteristiche previste dallo standard POSIX; in Linux sono disponibili
3435   anche una serie di altri filesystem, come quelli di Windows e del Mac, che
3436   non supportano queste caratteristiche.} In questa sezione ne esamineremo i
3437 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
3438
3439
3440 \subsection{I permessi per l'accesso ai file}
3441 \label{sec:file_perm_overview}
3442
3443 Ad ogni file Linux associa sempre l'utente che ne è proprietario (il
3444 cosiddetto \textit{owner}) ed un gruppo di appartenenza, secondo il meccanismo
3445 degli identificatori di utente e gruppo (\ids{UID} e \ids{GID}). Questi valori
3446 sono accessibili da programma tramite la funzione \func{stat}, e sono
3447 mantenuti nei campi \var{st\_uid} e \var{st\_gid} della struttura
3448 \struct{stat} (si veda sez.~\ref{sec:file_stat}).\footnote{questo è vero solo
3449   per filesystem di tipo Unix, ad esempio non è vero per il filesystem vfat di
3450   Windows, che non fornisce nessun supporto per l'accesso multiutente, e per
3451   il quale i permessi vengono assegnati in maniera fissa con un opzione in
3452   fase di montaggio.}
3453
3454 Il controllo di accesso ai file segue un modello abbastanza semplice che
3455 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
3456 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
3457     Control List} che sono state aggiunte ai filesystem standard con opportune
3458   estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
3459   controllo ancora più sofisticati come il \textit{mandatory access control}
3460   di SE-Linux.} ma nella maggior parte dei casi il meccanismo standard è più
3461 che sufficiente a soddisfare tutte le necessità più comuni.  I tre permessi di
3462 base associati ad ogni file sono:
3463 \begin{itemize*}
3464 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
3465   \textit{read}).
3466 \item il permesso di scrittura (indicato con la lettera \texttt{w},
3467   dall'inglese \textit{write}).
3468 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
3469   dall'inglese \textit{execute}).
3470 \end{itemize*}
3471 mentre i tre livelli su cui sono divisi i privilegi sono:
3472 \begin{itemize*}
3473 \item i privilegi per l'utente proprietario del file.
3474 \item i privilegi per un qualunque utente faccia parte del gruppo cui
3475   appartiene il file.
3476 \item i privilegi per tutti gli altri utenti.
3477 \end{itemize*}
3478
3479 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
3480 meno significativi sono usati a gruppi di tre per indicare i permessi base di
3481 lettura, scrittura ed esecuzione e sono applicati rispettivamente
3482 rispettivamente al proprietario, al gruppo, a tutti gli altri.
3483
3484 \begin{figure}[htb]
3485   \centering
3486   \includegraphics[width=6cm]{img/fileperm}
3487   \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
3488     contenuti nel campo \var{st\_mode} di \struct{stat}.}
3489   \label{fig:file_perm_bit}
3490 \end{figure}
3491
3492 I restanti tre bit (noti come \itindex{suid~bit} \textit{suid bit},
3493 \itindex{sgid~bit} \textit{sgid bit}, e \itindex{sticky~bit} \textit{sticky
3494   bit}) sono usati per indicare alcune caratteristiche più complesse del
3495 meccanismo del controllo di accesso su cui torneremo in seguito (in
3496 sez.~\ref{sec:file_special_perm}); lo schema di allocazione dei bit è
3497 riportato in fig.~\ref{fig:file_perm_bit}.
3498
3499 Anche i permessi, come tutte le altre informazioni pertinenti al file, sono
3500 memorizzati \itindex{inode} nell'\textit{inode}; in particolare essi sono
3501 contenuti in alcuni bit del campo \var{st\_mode} della struttura \struct{stat}
3502 (si veda di nuovo fig.~\ref{fig:file_stat_struct}).
3503
3504 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
3505 \cmd{u} (per \textit{user}), \cmd{g} (per \textit{group}) e \cmd{o} (per
3506 \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti insieme
3507 si usa la lettera \cmd{a} (per \textit{all}). Si tenga ben presente questa
3508 distinzione dato che in certi casi, mutuando la terminologia in uso nel VMS,
3509 si parla dei permessi base come di permessi per \textit{owner}, \textit{group}
3510 ed \textit{all}, le cui iniziali possono dar luogo a confusione.  Le costanti
3511 che permettono di accedere al valore numerico di questi bit nel campo
3512 \var{st\_mode} sono riportate in tab.~\ref{tab:file_bit_perm}.
3513
3514 \begin{table}[htb]
3515   \centering
3516     \footnotesize
3517   \begin{tabular}[c]{|c|l|}
3518     \hline
3519     \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
3520     \hline 
3521     \hline 
3522     \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
3523     \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
3524     \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\ 
3525     \hline            
3526     \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
3527     \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
3528     \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
3529     \hline            
3530     \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
3531     \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
3532     \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
3533     \hline              
3534   \end{tabular}
3535   \caption{I bit dei permessi di accesso ai file, come definiti in 
3536     \texttt{<sys/stat.h>}}
3537   \label{tab:file_bit_perm}
3538 \end{table}
3539
3540 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
3541 che si riferiscano a dei file, dei link simbolici o delle directory; qui ci
3542 limiteremo ad un riassunto delle regole generali, entrando nei dettagli più
3543 avanti.
3544
3545 La prima regola è che per poter accedere ad un file attraverso il suo
3546 \textit{pathname} occorre il permesso di esecuzione in ciascuna delle
3547 directory che compongono il \textit{pathname}; lo stesso vale per aprire un
3548 file nella directory corrente (per la quale appunto serve il diritto di
3549 esecuzione).
3550
3551 Per una directory infatti il permesso di esecuzione significa che essa può
3552 essere attraversata nella risoluzione del \textit{pathname}, ed è distinto dal
3553 permesso di lettura che invece implica che si può leggere il contenuto della
3554 directory.
3555
3556 Questo significa che se si ha il permesso di esecuzione senza permesso di
3557 lettura si potrà lo stesso aprire un file in una directory (se si hanno i
3558 permessi opportuni per il medesimo) ma non si potrà vederlo con \cmd{ls}
3559 (mentre per crearlo occorrerà anche il permesso di scrittura per la
3560 directory).
3561
3562 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
3563 (si veda quanto riportato in tab.~\ref{tab:file_open_flags}) di sola lettura o
3564 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
3565 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
3566 il cont