Aggiornamento note di copyright e correzioni minime.
[gapil.git] / filedir.tex
1 %% filedir.tex
2 %%
3 %% Copyright (C) 2000-2014 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{La gestione di file e directory}
13 \label{cha:files_and_dirs}
14
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando da un approfondimento dell'architettura del
17 sistema illustrata a grandi linee in sez.~\ref{sec:file_arch_overview} ed
18 illustrando le principali caratteristiche di un filesystem e le interfacce
19 che consentono di controllarne il montaggio e lo smontaggio. 
20
21 Esamineremo poi le funzioni di libreria che si usano per copiare, spostare e
22 cambiare i nomi di file e directory e l'interfaccia che permette la
23 manipolazione dei loro attributi. Tratteremo inoltre la struttura di base del
24 sistema delle protezioni e del controllo dell'accesso ai file e le successive
25 estensioni (\textit{Extended Attributes}, ACL, quote disco,
26 \textit{capabilities}). Tutto quello che riguarda invece la gestione dell'I/O
27 sui file è lasciato al capitolo successivo.
28
29
30
31 \section{L'architettura della gestione dei file}
32 \label{sec:file_arch_func}
33
34 In questa sezione tratteremo con maggiori dettagli rispetto a quanto visto in
35 sez.~\ref{sec:file_arch_overview} il \textit{Virtual File System} di Linux e
36 come il kernel può gestire diversi tipi di filesystem, descrivendo prima le
37 caratteristiche generali di un filesystem di un sistema unix-like, per poi
38 fare una panoramica sul filesystem più usato con Linux, l'\acr{ext2} ed i suoi
39 successori.
40
41
42 \subsection{Il funzionamento del \textit{Virtual File System} di Linux}
43 \label{sec:file_vfs_work}
44
45 % NOTE articolo interessante:
46 % http://www.ibm.com/developerworks/linux/library/l-virtual-filesystem-switch/index.html?ca=dgr-lnxw97Linux-VFSdth-LXdW&S_TACT=105AGX59&S_CMP=GRlnxw97
47
48 \itindbeg{Virtual~File~System}
49
50 Come illustrato brevemente in sez.~\ref{sec:file_arch_overview} in Linux il
51 concetto di \textit{everything is a file} è stato implementato attraverso il
52 \textit{Virtual File System}, la cui struttura generale è illustrata in
53 fig.~\ref{fig:file_VFS_scheme}.  Il VFS definisce un insieme di funzioni che
54 tutti i filesystem devono implementare per l'accesso ai file che contengono e
55 l'interfaccia che consente di eseguire l'I/O sui file, che questi siano di
56 dati o dispositivi. 
57
58 \itindbeg{inode}
59
60 L'interfaccia fornita dal VFS comprende in sostanza tutte le funzioni che
61 riguardano i file, le operazioni implementate dal VFS sono realizzate con una
62 astrazione che prevede quattro tipi di oggetti strettamente correlati: i
63 filesystem, le \textit{dentry}, gli \textit{inode} ed i file. A questi oggetti
64 corrispondono una serie di apposite strutture definite dal kernel che
65 contengono come campi le funzioni di gestione e realizzano l'infrastruttura
66 del VFS. L'interfaccia è molto complessa, ne faremo pertanto una trattazione
67 estremamente semplificata che consenta di comprenderne i principi
68 di funzionamento.
69
70 Il VFS usa una tabella mantenuta dal kernel che contiene il nome di ciascun
71 filesystem supportato, quando si vuole inserire il supporto di un nuovo
72 filesystem tutto quello che occorre è chiamare la funzione
73 \code{register\_filesystem} passando come argomento la struttura
74 \kstruct{file\_system\_type} (la cui definizione è riportata in
75 fig.~\ref{fig:kstruct_file_system_type}) relativa a quel filesystem. Questa
76 verrà inserita nella tabella, ed il nuovo filesystem comparirà in
77 \procfile{/proc/filesystems}.
78
79 \begin{figure}[!htb]
80   \footnotesize \centering
81   \begin{minipage}[c]{0.80\textwidth}
82     \includestruct{listati/file_system_type.h}
83   \end{minipage}
84   \normalsize 
85   \caption{Estratto della struttura \kstructd{file\_system\_type} usata dal
86     VFS (da \texttt{include/linux/fs.h}).}
87   \label{fig:kstruct_file_system_type}
88 \end{figure}
89
90 La struttura \kstruct{file\_system\_type}, oltre ad una serie di dati interni,
91 come il nome del tipo di filesystem nel campo \var{name},\footnote{quello che
92   viene riportato in \procfile{/proc/filesystems} e che viene usato come
93   valore del parametro dell'opzione \texttt{-t} del comando \texttt{mount} che
94   indica il tipo di filesystem.}  contiene i riferimenti alle funzioni di base
95 che consentono l'utilizzo di quel filesystem. In particolare la funzione
96 \code{mount} del quarto campo è quella che verrà invocata tutte le volte che
97 si dovrà effettuare il montaggio di un filesystem di quel tipo. Per ogni nuovo
98 filesystem si dovrà allocare una di queste strutture ed inizializzare i
99 relativi campi con i dati specifici di quel filesystem, ed in particolare si
100 dovrà creare anche la relativa versione della funzione \code{mount}.
101
102 \itindbeg{pathname}
103 \itindbeg{pathname~resolution}
104
105 Come illustrato in fig.~\ref{fig:kstruct_file_system_type} questa funzione
106 restituisce una \textit{dentry}, abbreviazione che sta per \textit{directory
107   entry}. Le \textit{dentry} sono gli oggetti che il kernel usa per eseguire
108 la \textit{pathname resolution}, ciascuna di esse corrisponde ad un
109 \textit{pathname} e contiene il riferimento ad un \textit{inode}, che come
110 vedremo a breve è l'oggetto usato dal kernel per identificare un un
111 file.\footnote{in questo caso si parla di file come di un qualunque oggetto
112   generico che sta sul filesystem e non dell'oggetto file del VFS cui
113   accennavamo prima.} La \textit{dentry} ottenuta dalla chiamata alla funzione
114 \code{mount} sarà inserita in corrispondenza al \textit{pathname} della
115 directory in cui il filesystem è stato montato.
116
117 % NOTA: struct dentry è dichiarata in include/linux/dcache.h
118
119 Le \textit{dentry} sono oggetti del VFS che vivono esclusivamente in memoria,
120 nella cosiddetta \textit{directory entry cache} (spesso chiamata in breve
121 \textit{dcache}). Ogni volta che una \textit{system call} specifica un
122 \textit{pathname} viene effettuata una ricerca nella \textit{dcache} per
123 ottenere immediatamente la \textit{dentry} corrispondente,\footnote{il buon
124   funzionamento della \textit{dcache} è in effetti di una delle parti più
125   critiche per le prestazioni del sistema.} che a sua volta ci darà, tramite
126 l'\textit{inode}, il riferimento al file.
127
128 Dato che normalmente non è possibile mantenere nella \textit{dcache} le
129 informazioni relative a tutto l'albero dei file la procedura della
130 \textit{pathname resolution} richiede un meccanismo con cui riempire gli
131 eventuali vuoti. Il meccanismo prevede che tutte le volte che si arriva ad una
132 \textit{dentry} mancante venga invocata la funzione \texttt{lookup}
133 dell'\textit{inode} associato alla \textit{dentry} precedente nella
134 risoluzione del \textit{pathname},\footnote{che a questo punto è una
135   directory, per cui si può cercare al suo interno il nome di un file.} il cui
136 scopo è risolvere il nome mancante e fornire la sua \textit{dentry} che a
137 questo punto verrà inserita nella cache.
138
139 Dato che tutte le volte che si monta un filesystem la funzione \texttt{mount}
140 della corrispondente \kstruct{file\_system\_type} inserisce la \textit{dentry}
141 iniziale nel \itindex{mount~point} \textit{mount point} dello stesso, si avrà
142 comunque un punto di partenza. Inoltre essendo questa \textit{dentry} relativa
143 a quel tipo di filesystem essa farà riferimento ad un \textit{inode} di quel
144 filesystem, e come vedremo questo farà sì che venga eseguita una
145 \texttt{lookup} adatta per effettuare la risoluzione dei nomi per quel
146 filesystem.
147
148 \itindend{pathname}
149 \itindend{pathname~resolution}
150
151 % Un secondo effetto della chiamata funzione \texttt{mount} di
152 % \kstruct{file\_system\_type} è quello di allocare una struttura
153 % \kstruct{super\_block} per ciascuna istanza montata, che contiene le
154 % informazioni generali di un qualunque filesystem montato, come le opzioni di
155 % montaggio, le dimensioni dei blocchi, quando il filesystem è stato montato
156 % ecc. Fra queste però viene pure inserta, nel campo \var{s\_op}, una ulteriore
157 % struttura \kstruct{super\_operations}, il cui contenuto sono i puntatori
158 % alle funzioni di gestione di un filesystem, anche inizializzata in modo da
159 % utilizzare le versioni specifiche di quel filesystem.
160
161 L'oggetto più importante per il funzionamento del VFS è probabilmente
162 l'\textit{inode}, ma con questo nome si può fare riferimento a due cose
163 diverse.  La prima è la struttura su disco (su cui torneremo anche in
164 sez.~\ref{sec:file_filesystem}) che fa parte della organizzazione dei dati
165 realizzata dal filesystem e che contiene le informazioni relative alle
166 proprietà (i cosiddetti \textsl{metadati}) di ogni oggetto presente su di esso
167 (si intende al solito uno qualunque dei tipi di file di
168 tab.~\ref{tab:file_file_types}).
169
170 La seconda è la corrispondente struttura \kstruct{inode}, della cui
171 definizione si è riportato un estratto in
172 fig.~\ref{fig:kstruct_inode}.\footnote{l'estratto fa riferimento alla versione
173   del kernel 2.6.37.} Questa struttura viene mantenuta in memoria ed è a
174 questa che facevamo riferimento quando parlavamo dell'\textit{inode} associato
175 a ciascuna \textit{dentry}. Nella struttura in memoria sono presenti gli
176 stessi \textsl{metadati} memorizzati su disco, che vengono letti quando questa
177 struttura viene allocata e trascritti all'indietro se modificati.
178
179 \begin{figure}[!htb]
180   \footnotesize \centering
181   \begin{minipage}[c]{0.8\textwidth}
182     \includestruct{listati/inode.h}
183   \end{minipage}
184   \normalsize 
185   \caption{Estratto della struttura \kstructd{inode} del kernel (da
186     \texttt{include/linux/fs.h}).}
187   \label{fig:kstruct_inode}
188 \end{figure}
189
190 Il fatto che la struttura \kstruct{inode} sia mantenuta in memoria,
191 direttamente associata ad una \textit{dentry}, rende sostanzialmente immediate
192 le operazioni che devono semplicemente effettuare un accesso ai dati in essa
193 contenuti: è così ad esempio che viene realizzata la \textit{system call}
194 \func{stat} che vedremo in sez.~\ref{sec:file_stat}. Rispetto ai dati salvati
195 sul disco questa struttura contiene però anche quanto necessario alla
196 implementazione del VFS, ed in particolare è importante il campo \var{i\_op}
197 che, come illustrato in fig.~\ref{fig:kstruct_inode}, contiene il puntatore ad
198 una struttura di tipo \kstruct{inode\_operation}, la cui definizione si può
199 trovare nel file \texttt{include/kernel/fs.h} dei sorgenti del kernel.
200
201 Questa struttura non è altro che una tabella di funzioni, ogni suo membro cioè
202 è un puntatore ad una funzione e, come suggerisce il nome della struttura
203 stessa, queste funzioni sono quelle che definiscono le operazioni che il VFS
204 può compiere su un \textit{inode}. Si sono riportate in
205 tab.~\ref{tab:file_inode_operations} le più rilevanti.
206
207 \begin{table}[htb]
208   \centering
209   \footnotesize
210   \begin{tabular}[c]{|l|l|}
211     \hline
212     \textbf{Funzione} & \textbf{Operazione} \\
213     \hline
214     \hline
215     \textsl{\code{create}} & Chiamata per creare un nuovo file (vedi
216                              sez.~\ref{sec:file_open_close}).\\ 
217     \textsl{\code{link}}   & Crea un \textit{hard link} (vedi
218                              sez.~\ref{sec:link_symlink_rename}).\\
219     \textsl{\code{unlink}} & Cancella un \textit{hard link} (vedi
220                              sez.~\ref{sec:link_symlink_rename}).\\
221     \textsl{\code{symlink}}& Crea un collegamento simbolico (vedi
222                              sez.~\ref{sec:link_symlink_rename}).\\
223     \textsl{\code{mkdir}}  & Crea una directory (vedi
224                              sez.~\ref{sec:file_dir_creat_rem}).\\
225     \textsl{\code{rmdir}}  & Rimuove una directory (vedi
226                              sez.~\ref{sec:file_dir_creat_rem}).\\
227     \textsl{\code{mknod}}  & Crea un \index{file!speciali} file speciale (vedi
228                              sez.~\ref{sec:file_mknod}).\\
229     \textsl{\code{rename}} & Cambia il nome di un file (vedi
230                              sez.~\ref{sec:link_symlink_rename}).\\
231     \textsl{\code{lookup}}&  Risolve il nome di un file.\\
232     \hline
233   \end{tabular}
234   \caption{Le principali operazioni sugli \textit{inode} definite tramite
235     \kstruct{inode\_operation}.} 
236   \label{tab:file_inode_operations}
237 \end{table}
238
239 Possiamo notare come molte di queste funzioni abbiano nomi sostanzialmente
240 identici alle varie \textit{system call} con le quali si gestiscono file e
241 directory, che tratteremo nel resto del capitolo. Quello che succede è che
242 tutte le volte che deve essere eseguita una \textit{system call}, o una
243 qualunque altra operazione su un \textit{inode} (come \texttt{lookup}) il VFS
244 andrà ad utilizzare la funzione corrispondente attraverso il puntatore
245 \var{i\_op}.
246
247 Sarà allora sufficiente che nella realizzazione di un filesystem si crei una
248 implementazione di queste funzioni per quel filesystem e si allochi una
249 opportuna istanza di \kstruct{inode\_operation} contenente i puntatori a dette
250 funzioni. A quel punto le strutture \kstruct{inode} usate per gli oggetti di
251 quel filesystem otterranno il puntatore alla relativa istanza di
252 \kstruct{inode\_operation} e verranno automaticamente usate le funzioni
253 corrette.
254
255 Si noti però come in tab.~\ref{tab:file_inode_operations} non sia presente la
256 funzione \texttt{open} che invece è citata in
257 tab.~\ref{tab:file_file_operations}.\footnote{essa può essere comunque
258   invocata dato che nella struttura \kstruct{inode} è presente anche il
259   puntatore \var{i\_fop} alla struttura \kstruct{file\_operation} che fornisce
260   detta funzione.} Questo avviene perché su Linux l'apertura di un file
261 richiede comunque un'altra operazione che mette in gioco l'omonimo oggetto del
262 VFS: l'allocazione di una struttura di tipo \kstruct{file} che viene associata
263 ad ogni file aperto nel sistema.  I motivi per cui viene usata una struttura a
264 parte sono diversi, anzitutto, come illustrato in sez.~\ref{sec:file_fd},
265 questa è necessaria per le operazioni eseguite dai processi con l'interfaccia
266 dei file descriptor. Ogni processo infatti mantiene il riferimento ad una
267 struttura \kstruct{file} per ogni file che ha aperto, ed è tramite essa che
268 esegue le operazioni di I/O. Inoltre il kernel mantiene un elenco di tutti i
269 file aperti nella \itindex{file~table} \textit{file table}.
270
271 Inoltre se le operazioni relative agli \textit{inode} fanno riferimento ad
272 oggetti posti all'interno di un filesystem e vi si applicano quindi le
273 funzioni fornite nell'implementazione di quest'ultimo, quando si apre un file
274 questo può essere anche un file di dispositivo, ed in questo caso il VFS
275 invece di usare le operazioni fornite dal filesystem (come farebbe per un file
276 di dati) dovrà invece ricorrere a quelle fornite dal driver del dispositivo.
277
278 \itindend{inode}
279
280 \begin{figure}[!htb]
281   \footnotesize \centering
282   \begin{minipage}[c]{0.8\textwidth}
283     \includestruct{listati/file.h}
284   \end{minipage}
285   \normalsize 
286   \caption{Estratto della struttura \kstructd{file} del kernel (da
287     \texttt{include/linux/fs.h}).}
288   \label{fig:kstruct_file}
289 \end{figure}
290
291 Come si può notare dall'estratto di fig.~\ref{fig:kstruct_file}, la struttura
292 \kstruct{file} contiene, oltre ad alcune informazioni usate dall'interfaccia
293 dei file descriptor il cui significato emergerà più avanti, il puntatore
294 \var{f\_op} ad una struttura \kstruct{file\_operation}. Questa è l'analoga per
295 i file di \kstruct{inode\_operation}, e definisce le operazioni generiche
296 fornite dal VFS per i file. Si sono riportate in
297 tab.~\ref{tab:file_file_operations} le più significative.
298
299 \begin{table}[htb]
300   \centering
301   \footnotesize
302   \begin{tabular}[c]{|l|p{8cm}|}
303     \hline
304     \textbf{Funzione} & \textbf{Operazione} \\
305     \hline
306     \hline
307     \textsl{\code{open}}   & Apre il file (vedi
308                              sez.~\ref{sec:file_open_close}).\\ 
309     \textsl{\code{read}}   & Legge dal file (vedi sez.~\ref{sec:file_read}).\\
310     \textsl{\code{write}}  & Scrive sul file (vedi 
311                              sez.~\ref{sec:file_write}).\\
312     \textsl{\code{llseek}} & Sposta la posizione corrente sul file (vedi
313                              sez.~\ref{sec:file_lseek}).\\
314     \textsl{\code{ioctl}}  & Accede alle operazioni di controllo 
315                              (vedi sez.~\ref{sec:file_fcntl_ioctl}).\\
316     \textsl{\code{readdir}}& Legge il contenuto di una directory (vedi 
317                              sez.~\ref{sec:file_dir_read}).\\
318     \textsl{\code{poll}}   & Usata nell'I/O multiplexing (vedi
319                              sez.~\ref{sec:file_multiplexing}).\\
320     \textsl{\code{mmap}}   & Mappa il file in memoria (vedi 
321                              sez.~\ref{sec:file_memory_map}).\\
322     \textsl{\code{release}}& Chiamata quando l'ultimo riferimento a un file 
323                              aperto è chiuso.\\
324     \textsl{\code{fsync}}  & Sincronizza il contenuto del file (vedi
325                              sez.~\ref{sec:file_sync}).\\
326     \textsl{\code{fasync}} & Abilita l'I/O asincrono (vedi
327                              sez.~\ref{sec:file_asyncronous_io}) sul file.\\
328     \hline
329   \end{tabular}
330   \caption{Operazioni sui file definite tramite \kstruct{file\_operation}.}
331   \label{tab:file_file_operations}
332 \end{table}
333
334 Anche in questo caso tutte le volte che deve essere eseguita una
335 \textit{system call} o una qualunque altra operazione sul file il VFS andrà ad
336 utilizzare la funzione corrispondente attraverso il puntatore
337 \var{f\_op}. Dato che è cura del VFS quando crea la struttura all'apertura del
338 file assegnare a \var{f\_op} il puntatore alla versione di
339 \kstruct{file\_operation} corretta per quel file, sarà possibile scrivere allo
340 stesso modo sulla porta seriale come su un normale file di dati, e lavorare
341 sui file allo stesso modo indipendentemente dal filesystem.
342
343 Il VFS realizza la quasi totalità delle operazioni relative ai file grazie
344 alle funzioni presenti nelle due strutture \kstruct{inode\_operation} e
345 \kstruct{file\_operation}.  Ovviamente non è detto che tutte le operazioni
346 possibili siano poi disponibili in tutti i casi, ad esempio \code{llseek} non
347 sarà presente per un dispositivo come la porta seriale o per una fifo, mentre
348 sui file del filesystem \texttt{vfat} non saranno disponibili i permessi, ma
349 resta il fatto che grazie al VFS le \textit{system call} per le operazioni sui
350 file possono restare sempre le stesse nonostante le enormi differenze che
351 possono esserci negli oggetti a cui si applicano.
352  
353
354 \itindend{Virtual~File~System}
355
356 % NOTE: documentazione interessante:
357 %       * sorgenti del kernel: Documentation/filesystems/vfs.txt
358 %       * http://thecoffeedesk.com/geocities/rkfs.html
359 %       * http://www.linux.it/~rubini/docs/vfs/vfs.html
360
361
362
363 \subsection{Il funzionamento di un filesystem Unix}
364 \label{sec:file_filesystem}
365
366 Come già accennato in sez.~\ref{sec:file_arch_overview} Linux (ed ogni sistema
367 unix-like) organizza i dati che tiene su disco attraverso l'uso di un
368 filesystem. Una delle caratteristiche di Linux rispetto agli altri Unix è
369 quella di poter supportare, grazie al VFS, una enorme quantità di filesystem
370 diversi, ognuno dei quali avrà una sua particolare struttura e funzionalità
371 proprie.  Per questo non entreremo nei dettagli di un filesystem specifico, ma
372 daremo una descrizione a grandi linee che si adatta alle caratteristiche
373 comuni di qualunque filesystem di un sistema unix-like.
374
375 Una possibile strutturazione dell'informazione su un disco è riportata in
376 fig.~\ref{fig:file_disk_filesys}, dove si hanno tre filesystem su tre
377 partizioni. In essa per semplicità si è fatto riferimento alla struttura del
378 filesystem \acr{ext2}, che prevede una suddivisione dei dati in \textit{block
379   group}.  All'interno di ciascun \textit{block group} viene anzitutto
380 replicato il cosiddetto \itindex{superblock} \textit{superblock}, (la
381 struttura che contiene l'indice iniziale del filesystem e che consente di
382 accedere a tutti i dati sottostanti) e creata una opportuna suddivisione dei
383 dati e delle informazioni per accedere agli stessi.  Sulle caratteristiche di
384 \acr{ext2} e derivati torneremo in sez.~\ref{sec:file_ext2}.
385
386 \itindbeg{inode}
387
388 È comunque caratteristica comune di tutti i filesystem per Unix,
389 indipendentemente da come poi viene strutturata nei dettagli questa
390 informazione, prevedere la presenza di due tipi di risorse: gli
391 \textit{inode}, cui abbiamo già accennato in sez.~\ref{sec:file_vfs_work}, che
392 sono le strutture che identificano i singoli oggetti sul filesystem, e i
393 blocchi, che invece attengono allo spazio disco che viene messo a disposizione
394 per i dati in essi contenuti.
395
396 \begin{figure}[!htb]
397   \centering
398   \includegraphics[width=12cm]{img/disk_struct}
399   \caption{Organizzazione dello spazio su un disco in partizioni e
400   filesystem.}
401   \label{fig:file_disk_filesys}
402 \end{figure}
403
404 Se si va ad esaminare con maggiore dettaglio la strutturazione
405 dell'informazione all'interno del filesystem \textsl{ext2}, tralasciando i
406 dettagli relativi al funzionamento del filesystem stesso come la
407 strutturazione in gruppi dei blocchi, il \itindex{superblock}
408 \textit{superblock} e tutti i dati di gestione possiamo esemplificare la
409 situazione con uno schema come quello esposto in
410 fig.~\ref{fig:file_filesys_detail}.
411
412 \begin{figure}[!htb]
413   \centering
414   \includegraphics[width=12cm]{img/filesys_struct}
415   \caption{Strutturazione dei dati all'interno di un filesystem.}
416   \label{fig:file_filesys_detail}
417 \end{figure}
418
419 Da fig.~\ref{fig:file_filesys_detail} si evidenziano alcune delle
420 caratteristiche di base di un filesystem, che restano le stesse anche su
421 filesystem la cui organizzazione dei dati è totalmente diversa da quella
422 illustrata, e sulle quali è bene porre attenzione visto che sono fondamentali
423 per capire il funzionamento delle funzioni che manipolano i file e le
424 directory che tratteremo nel prosieguo del capitolo. In particolare è
425 opportuno tenere sempre presente che:
426
427
428 \begin{enumerate}
429   
430 \item L'\textit{inode} contiene i cosiddetti \textsl{metadati}, vale dire le
431   informazioni riguardanti le proprietà del file come oggetto del filesystem:
432   il tipo di file, i permessi di accesso, le dimensioni, i puntatori ai
433   blocchi fisici che contengono i dati e così via. Le informazioni che la
434   funzione \func{stat} (vedi sez.~\ref{sec:file_stat}) fornisce provengono
435   dall'\textit{inode}.  Dentro una directory si troverà solo il nome del file
436   e il numero dell'\textit{inode} ad esso associato; il nome non è una
437   proprietà del file e non viene mantenuto nell'\textit{inode}. Da da qui in
438   poi chiameremo il nome del file contenuto in una directory
439   ``\textsl{voce}'', come traduzione della nomenclatura inglese
440   \textit{directory entry} che non useremo per evitare confusione con le
441   \textit{dentry} del kernel viste in sez.~\ref{sec:file_vfs_work}.
442   
443 \item Come mostrato in fig.~\ref{fig:file_filesys_detail} per i file
444   \texttt{macro.tex} e \texttt{gapil\_macro.tex}, ci possono avere più voci
445   che fanno riferimento allo stesso \textit{inode}. Fra le proprietà di un
446   file mantenute nell'\textit{inode} c'è anche il contatore con il numero di
447   riferimenti che sono stati fatti ad esso, il cosiddetto \textit{link
448     count}.\footnote{mantenuto anche nel campo \var{i\_nlink} della struttura
449     \kstruct{inode} di fig.~\ref{fig:kstruct_inode}.}  Solo quando questo
450   contatore si annulla i dati del file possono essere effettivamente rimossi
451   dal disco. Per questo la funzione per cancellare un file si chiama
452   \func{unlink} (vedi sez.~\ref{sec:link_symlink_rename}), ed in realtà non
453   cancella affatto i dati del file, ma si limita ad eliminare la relativa voce
454   da una directory e decrementare il numero di riferimenti
455   nell'\textit{inode}.
456   
457 \item All'interno di ogni filesystem ogni \textit{inode} è identificato da un
458   numero univoco. Il numero di \textit{inode} associato ad una voce in una
459   directory si riferisce ad questo numero e non ci può essere una directory
460   che contiene riferimenti ad \textit{inode} relativi ad altri filesystem.
461   Questa è la ragione che limita l'uso del comando \cmd{ln}, che crea una
462   nuova voce per un file esistente con la funzione \func{link} (vedi
463   sez.~\ref{sec:link_symlink_rename}), a operare su file nel filesystem
464   corrente.
465   
466 \item Quando si cambia nome ad un file senza cambiare filesystem il contenuto
467   del file non viene spostato fisicamente, viene semplicemente creata una
468   nuova voce per l'\textit{inode} in questione e rimossa la precedente, questa
469   è la modalità in cui opera normalmente il comando \cmd{mv} attraverso la
470   funzione \func{rename} (vedi sez.~\ref{sec:link_symlink_rename}). Questa
471   operazione non modifica minimamente neanche l'\textit{inode} del file, dato
472   che non si opera sul file ma sulla directory che lo contiene.
473
474 \item Gli \textit{inode} dei file, che contengono i \textsl{metadati}, ed i
475   blocchi di spazio disco, che contengono i dati, sono risorse indipendenti ed
476   in genere vengono gestite come tali anche dai diversi filesystem; è pertanto
477   possibile esaurire sia lo spazio disco (il caso più comune) che lo spazio
478   per gli \textit{inode}. Nel primo caso non sarà possibile allocare ulteriore
479   spazio, ma si potranno creare file (vuoti), nel secondo non si potranno
480   creare nuovi file, ma si potranno estendere quelli che ci
481   sono.\footnote{questo comportamento non è generale, alcuni filesystem
482     evoluti possono evitare il problema dell'esaurimento degli \textit{inode}
483     riallocando lo spazio disco libero per i blocchi.}
484
485 \end{enumerate}
486
487 \begin{figure}[!htb]
488   \centering 
489   \includegraphics[width=12cm]{img/dir_links}
490   \caption{Organizzazione dei \textit{link} per le directory.}
491   \label{fig:file_dirs_link}
492 \end{figure}
493
494 Infine tenga presente che, essendo file pure loro, il numero di riferimenti
495 esiste anche per le directory. Per questo se a partire dalla situazione
496 mostrata in fig.~\ref{fig:file_filesys_detail} creiamo una nuova directory
497 \file{img} nella directory \file{gapil}, avremo una situazione come quella
498 illustrata in fig.~\ref{fig:file_dirs_link}.
499
500 La nuova directory avrà un numero di riferimenti pari a due, in quanto è
501 referenziata dalla directory da cui si era partiti (in cui è inserita la nuova
502 voce che fa riferimento a \texttt{img}) e dalla voce interna ``\texttt{.}''
503 che è presente in ogni directory.  Questo è il valore che si troverà sempre
504 per ogni directory che non contenga a sua volta altre directory. Al contempo,
505 la directory da cui si era partiti avrà un numero di riferimenti di almeno
506 tre, in quanto adesso sarà referenziata anche dalla voce ``\texttt{..}'' di
507 \texttt{img}. L'aggiunta di una sottodirectory fa cioè crescere di uno il
508 \textit{link count} della directory genitrice.
509
510 \itindend{inode}
511
512
513 \subsection{Alcuni dettagli sul filesystem \textsl{ext2} e successori}
514 \label{sec:file_ext2}
515
516
517 Benché non esista ``il'' filesystem di Linux, dato che esiste un supporto
518 nativo di diversi filesystem che sono in uso da anni, quello che gli avvicina
519 di più è la famiglia di filesystem evolutasi a partire dal \textit{second
520   extended filesystem}, o \acr{ext2}. Il filesystem \acr{ext2} ha subito un
521 grande sviluppo e diverse evoluzioni, fra cui l'aggiunta del
522 \textit{journaling} con il passaggio ad \acr{ext3}, che probabilmente è ancora
523 il filesystem più diffuso, ed una serie di ulteriori miglioramenti con il
524 successivo \acr{ext4}, che sta iniziando a sostituirlo gradualmente. In futuro
525 è previsto che questo debba essere sostituito da un filesystem completamente
526 diverso, \acr{btrfs}, che dovrebbe diventare il filesystem standard di Linux,
527 ma questo al momento è ancora in fase di sviluppo.\footnote{si fa riferimento
528   al momento dell'ultima revisione di di questo paragrafo, l'inizio del 2012.}
529
530 Il filesystem \acr{ext2} nasce come filesystem nativo per Linux a partire
531 dalle prime versioni del kernel e supporta tutte le caratteristiche di un
532 filesystem standard Unix: è in grado di gestire nomi di file lunghi (256
533 caratteri, estensibili a 1012) e supporta una dimensione massima dei file fino
534 a 4~Tb. I successivi filesystem \acr{ext3} ed \acr{ext4} sono evoluzioni di
535 questo filesystem, e sia pure con molti miglioramenti ed estensioni
536 significative ne mantengono le caratteristiche fondamentali.
537
538 Oltre alle caratteristiche standard, \acr{ext2} fornisce alcune estensioni che
539 non sono presenti su un classico filesystem di tipo Unix; le principali sono
540 le seguenti:
541 \begin{itemize}
542 \item gli attributi estesi (vedi sez.~\ref{sec:file_xattr}) che consentono di
543   estendere le informazioni salvabili come metadati e le ACL (vedi
544   sez.~\ref{sec:file_ACL}) che consentono di estendere il modello tradizionale
545   dei permessi sui file.
546 \item sono supportate entrambe le semantiche di BSD e SVr4 come opzioni di
547   montaggio. La semantica BSD comporta che i file in una directory sono creati
548   con lo stesso identificatore di gruppo della directory che li contiene. La
549   semantica SVr4 comporta che i file vengono creati con l'identificatore del
550   gruppo primario del processo, eccetto il caso in cui la directory ha il bit
551   di \acr{sgid} impostato (per una descrizione dettagliata del significato di
552   questi termini si veda sez.~\ref{sec:file_access_control}), nel qual caso
553   file e subdirectory ereditano sia il \ids{GID} che lo \acr{sgid}.
554 \item l'amministratore può scegliere la dimensione dei blocchi del filesystem
555   in fase di creazione, a seconda delle sue esigenze: blocchi più grandi
556   permettono un accesso più veloce, ma sprecano più spazio disco.
557 \item il filesystem implementa collegamenti simbolici veloci, in cui il nome
558   del file non è salvato su un blocco, ma tenuto all'interno \itindex{inode}
559   dell'\textit{inode} (evitando letture multiple e spreco di spazio), non
560   tutti i nomi però possono essere gestiti così per limiti di spazio (il
561   limite è 60 caratteri).
562 \item vengono supportati \itindex{file~attributes} i cosiddetti \textit{file
563     attributes} che attivano comportamenti specifici per i file su cui vengono
564   attivati come marcarli come immutabili (che possono cioè essere soltanto
565   letti) per la protezione di file di configurazione sensibili, o come
566   \textit{append-only} (che possono essere aperti in scrittura solo per
567   aggiungere dati) per la protezione dei file di log.
568 \end{itemize}
569
570 La struttura di \acr{ext2} è stata ispirata a quella del filesystem di BSD: un
571 filesystem è composto da un insieme di blocchi, la struttura generale è quella
572 riportata in fig.~\ref{fig:file_filesys_detail}, in cui la partizione è divisa
573 in gruppi di blocchi.
574
575 Ciascun gruppo di blocchi contiene una copia delle informazioni essenziali del
576 filesystem (i \itindex{superblock} \textit{superblock} sono quindi ridondati)
577 per una maggiore affidabilità e possibilità di recupero in caso di corruzione
578 del \itindex{superblock} \textit{superblock} principale. L'utilizzo di
579 raggruppamenti di blocchi ha inoltre degli effetti positivi nelle prestazioni
580 dato che viene ridotta la distanza fra i dati e la tabella degli
581 \itindex{inode} \textit{inode}.
582
583 \begin{figure}[!htb]
584   \centering
585   \includegraphics[width=9cm]{img/dir_struct}  
586   \caption{Struttura delle directory nel \textit{second extended filesystem}.}
587   \label{fig:file_ext2_dirs}
588 \end{figure}
589
590 Le directory sono implementate come una \itindex{linked~list} \textit{linked
591   list} con voci di dimensione variabile. Ciascuna voce della lista contiene
592 il numero di \itindex{inode} \textit{inode}, la sua lunghezza, il nome del
593 file e la sua lunghezza, secondo lo schema in fig.~\ref{fig:file_ext2_dirs};
594 in questo modo è possibile implementare nomi per i file anche molto lunghi
595 (fino a 1024 caratteri) senza sprecare spazio disco.
596
597 Con l'introduzione del filesystem \textit{ext3} sono state introdotte diverse
598 modifiche strutturali, la principale di queste è quella che \textit{ext3} è un
599 filesystem \textit{journaled}, è cioè in grado di eseguire una registrazione
600 delle operazioni di scrittura su un giornale (uno speciale file interno) in
601 modo da poter garantire il ripristino della coerenza dei dati del
602 filesystem\footnote{si noti bene che si è parlato di dati \textsl{del}
603   filesystem, non di dati \textsl{nel} filesystem, quello di cui viene
604   garantito un veloce ripristino è relativo ai dati della struttura interna
605   del filesystem, non di eventuali dati contenuti nei file che potrebbero
606   essere stati persi.} in brevissimo tempo in caso di interruzione improvvisa
607 della corrente o di crollo del sistema che abbia causato una interruzione
608 della scrittura dei dati sul disco.
609
610 Oltre a questo \textit{ext3} introduce ulteriori modifiche volte a migliorare
611 sia le prestazioni che la semplicità di gestione del filesystem, in
612 particolare per le directory si è passato all'uso di alberi binari con
613 indicizzazione tramite hash al posto delle \textit{linked list} che abbiamo
614 illustrato, ottenendo un forte guadagno di prestazioni in caso di directory
615 contenenti un gran numero di file.
616
617 % TODO (bassa priorità) portare a ext3, ext4 e btrfs ed illustrare le
618 % problematiche che si possono incontrare (in particolare quelle relative alla
619 % perdita di contenuti in caso di crash del sistema)
620 % TODO (media priorità) trattare btrfs quando sarà usato come stabile
621
622
623 \subsection{La gestione dell'uso dei filesystem}
624 \label{sec:filesystem_mounting}
625
626 Come accennato in sez.~\ref{sec:file_arch_overview} per poter accedere ai file
627 occorre rendere disponibile al sistema il filesystem su cui essi sono
628 memorizzati. L'operazione di attivazione del filesystem è chiamata
629 \textsl{montaggio} e per far questo in Linux si usa la funzione di sistema
630 \funcd{mount}, il cui prototipo è:\footnote{la funzione è una versione
631   specifica di Linux che usa la omonima \textit{system call} e non è
632   portabile.}
633
634 \begin{funcproto}{
635 \fhead{sys/mount.h} 
636 \fdecl{mount(const char *source, const char *target, const char
637   *filesystemtype, \\ 
638 \phantom{mount(}unsigned long mountflags, const void *data)}
639 \fdesc{Monta un filesystem.} 
640 }
641 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
642   caso \var{errno} assumerà uno dei valori:
643   \begin{errlist}
644   \item[\errcode{EACCES}] non si ha il permesso di accesso su uno dei
645     componenti del \textit{pathname}, o si è cercato di montare un filesystem
646     disponibile in sola lettura senza aver specificato \const{MS\_RDONLY} o il
647     device \param{source} è su un filesystem montato con l'opzione
648     \const{MS\_NODEV}.
649   \item[\errcode{EBUSY}] \param{source} è già montato, o non può essere
650     rimontato in sola lettura perché ci sono ancora file aperti in scrittura,
651     o non può essere montato su \param{target} perché la directory è ancora in
652     uso.
653   \item[\errcode{EINVAL}] il dispositivo \param{source} presenta un
654     \itindex{superblock} \textit{superblock} non valido, o si è cercato di
655     rimontare un filesystem non ancora montato, o di montarlo senza
656     che \param{target} sia un \itindex{mount~point} \textit{mount point} o di
657     spostarlo quando \param{target} non è un \itindex{mount~point}
658     \textit{mount point} o è la radice.
659   \item[\errcode{ELOOP}] si è cercato di spostare un \itindex{mount~point}
660     \textit{mount point} su una sottodirectory di \param{source} o si sono
661     incontrati troppi collegamenti simbolici nella risoluzione di un nome.
662   \item[\errcode{EMFILE}] in caso di filesystem virtuale, la tabella dei
663     dispositivi fittizi (chiamati \textit{dummy} nella documentazione inglese)
664     è piena.
665   \item[\errcode{ENODEV}] il tipo \param{filesystemtype} non esiste o non è
666     configurato nel kernel.
667   \item[\errcode{ENOTBLK}] non si è usato un \textit{block device} per
668     \param{source} quando era richiesto.
669   \item[\errcode{ENXIO}] il \itindex{major~number} \textit{major number} del
670     dispositivo \param{source} è sbagliato.
671   \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
672   \end{errlist} 
673   ed inoltre \errval{EFAULT}, \errval{ENOMEM}, \errval{ENAMETOOLONG},
674   \errval{ENOENT}, \errval{ENOTDIR} nel loro significato generico.}
675 \end{funcproto}
676
677 La funzione monta sulla directory indicata da \param{target}, detta
678 \itindex{mount~point} \textit{mount point}, il filesystem contenuto nel file
679 di dispositivo indicato da \param{source}. In entrambi i casi, come daremo per
680 assunto da qui in avanti tutte le volte che si parla di directory o file nel
681 passaggio di un argomento di una funzione, si intende che questi devono essere
682 indicati con la stringa contenente il loro \textit{pathname}.
683
684 Normalmente un filesystem è contenuto su un disco o una partizione, ma come
685 illustrato in sez.~\ref{sec:file_vfs_work} la struttura del
686 \itindex{Virtual~File~System} \textit{Virtual File System} è estremamente
687 flessibile e può essere usata anche per oggetti diversi da un disco. Ad
688 esempio usando il \textit{loop device} si può montare un file qualunque (come
689 l'immagine di un CD-ROM o di un floppy) che contiene l'immagine di un
690 filesystem, inoltre alcuni tipi di filesystem, come \texttt{proc} o
691 \texttt{sysfs} sono virtuali e non hanno un supporto che ne contenga i dati,
692 che invece sono generati al volo ad ogni lettura, e passati indietro al kernel
693 ad ogni scrittura.\footnote{costituiscono quindi un meccanismo di
694   comunicazione, attraverso l'ordinaria interfaccia dei file, con il kernel.}
695
696 Il tipo di filesystem che si vuole montare è specificato
697 dall'argomento \param{filesystemtype}, che deve essere una delle stringhe
698 riportate nel file \procfile{/proc/filesystems} che, come accennato in
699 sez.~\ref{sec:file_vfs_work}, contiene l'elenco dei filesystem supportati dal
700 kernel. Nel caso si sia indicato un filesystem virtuale, che non è associato a
701 nessun file di dispositivo, il contenuto di \param{source} viene ignorato.
702
703 L'argomento \param{data} viene usato per passare le impostazioni relative alle
704 caratteristiche specifiche di ciascun filesystem. Si tratta di una stringa di
705 parole chiave (separate da virgole e senza spazi) che indicano le cosiddette
706 ``\textsl{opzioni}'' del filesystem che devono essere impostate; in genere
707 viene usato direttamente il contenuto del parametro dell'opzione \texttt{-o}
708 del comando \texttt{mount}. I valori utilizzabili dipendono dal tipo di
709 filesystem e ciascuno ha i suoi, pertanto si rimanda alla documentazione della
710 pagina di manuale di questo comando e dei singoli filesystem.
711
712 Dopo l'esecuzione della funzione il contenuto del filesystem viene resto
713 disponibile nella directory specificata come \itindex{mount~point}
714 \textit{mount point}, il precedente contenuto di detta directory viene
715 mascherato dal contenuto della directory radice del filesystem montato. Fino
716 ai kernel della serie 2.2.x non era possibile montare un filesystem se un
717 \textit{mount point} era già in uso. 
718
719 A partire dal kernel 2.4.x inoltre è divenuto possibile sia spostare
720 atomicamente un \itindex{mount~point} \textit{mount point} da una directory ad
721 un'altra, sia montare lo stesso filesystem in diversi \itindex{mount~point}
722 \textit{mount point}, sia montare più filesystem sullo stesso
723 \itindex{mount~point} \textit{mount point} impilandoli l'uno sull'altro, nel
724 qual caso vale comunque quanto detto in precedenza, e cioè che solo il
725 contenuto dell'ultimo filesystem montato sarà visibile.
726
727 Oltre alle opzioni specifiche di ciascun filesystem, che si passano nella
728 forma della lista di parole chiave indicata con l'argomento \param{data},
729 esistono pure alcune opzioni che si possono applicare in generale, anche se
730 non è detto che tutti i filesystem le supportino, che si specificano tramite
731 l'argomento \param{mountflags}.  L'argomento inoltre può essere utilizzato per
732 modificare il comportamento della funzione \func{mount}, facendole compiere
733 una operazione diversa (ad esempio un rimontaggio, invece che un montaggio).
734
735 In Linux \param{mountflags} deve essere un intero a 32 bit; fino ai kernel
736 della serie 2.2.x i 16 più significativi avevano un valore riservato che
737 doveva essere specificato obbligatoriamente,\footnote{il valore era il
738   \itindex{magic~number} \textit{magic number} \code{0xC0ED}, si può usare la
739   costante \const{MS\_MGC\_MSK} per ottenere la parte di \param{mountflags}
740   riservata al \textit{magic number}, mentre per specificarlo si può dare un
741   OR aritmetico con la costante \const{MS\_MGC\_VAL}.} e si potevano usare
742 solo i 16 meno significativi. Oggi invece, con un numero di opzioni superiore,
743 sono utilizzati tutti e 32 i bit, ma qualora nei 16 più significativi sia
744 presente detto valore, che non esprime una combinazione valida, esso viene
745 ignorato. Il valore dell'argomento deve essere espresso come maschera binaria
746 e i vari bit che lo compongono, detti anche \textit{mount flags}, devono
747 essere impostati con un OR aritmetico dei valori dalle costanti riportate
748 nell'elenco seguente:
749
750 \begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}}
751 \itindbeg{bind~mount}
752 \item[\const{MS\_BIND}] Effettua un cosiddetto \textit{bind mount}, in cui è
753   possibile montare una directory di un filesystem in un'altra directory,
754   l'opzione è disponibile a partire dai kernel della serie 2.4. In questo caso
755   verranno presi in considerazione solo gli argomenti \param{source}, che
756   stavolta indicherà la directory che si vuole montare e non un file di
757   dispositivo, e \param{target} che indicherà la directory su cui verrà
758   effettuato il \textit{bind mount}. Gli argomenti \param{filesystemtype}
759   e \param{data} vengono ignorati.
760
761   In sostanza quello che avviene è che in corrispondenza del \textit{pathname}
762   indicato da \param{target} viene montato \itindex{inode} l'\textit{inode}
763   di \param{source}, così che la porzione di albero dei file presente sotto
764   \param{source} diventi visibile allo stesso modo sotto
765   \param{target}. Trattandosi esattamente dei dati dello stesso filesystem,
766   ogni modifica fatta in uno qualunque dei due rami di albero sarà visibile
767   nell'altro, visto che entrambi faranno riferimento agli stessi
768   \textit{inode}.
769
770   Dal punto di vista del \itindex{Virtual~File~System} VFS l'operazione è
771   analoga al montaggio di un filesystem proprio nel fatto che anche in questo
772   caso si inserisce in corrispondenza della \textit{dentry} di \texttt{target}
773   un diverso \itindex{inode} \textit{inode}, che stavolta, invece di essere
774   quello della radice del filesystem indicato da un file di dispositivo, è
775   quello di una directory già montata.
776
777   Si tenga presente che proprio per questo sotto \param{target} comparirà il
778   contenuto che è presente sotto \param{source} all'interno del filesystem in
779   cui quest'ultima è contenuta. Questo potrebbe non corrispondere alla
780   porzione di albero che sta sotto \param{source} qualora in una
781   sottodirectory di quest'ultima si fosse effettuato un altro montaggio. In
782   tal caso infatti nella porzione di albero sotto \param{source} si troverebbe
783   il contenuto del nuovo filesystem (o di un altro \textit{bind mount}) mentre
784   sotto \param{target} ci sarebbe il contenuto presente nel filesystem
785   originale.\footnote{questo evita anche il problema dei \textit{loop} di
786     fig.~\ref{fig:file_link_loop}, dato che se anche si montasse su
787     \param{target} una directory in cui essa è contenuta, il cerchio non
788     potrebbe chiudersi perché ritornati a \param{target} dentro il
789     \textit{bind mount} vi si troverebbe solo il contenuto originale e non si
790     potrebbe tornare indietro.}
791
792   Fino al kernel 2.6.26 questo flag doveva essere usato da solo, in quanto il
793   \textit{bind mount} continuava ad utilizzare le stesse opzioni del montaggio
794   originale, dal 2.6.26 è stato introdotto il supporto per il cosiddetto
795   \textit{read-only bind mount} e viene onorata la presenza aggiuntiva del
796   flag \const{MS\_RDONLY}. In questo modo si ottiene che l'accesso ai file
797   sotto \param{target} sia effettuabile esclusivamente in sola lettura.
798
799   Il supporto per il \textit{bind mount} consente di superare i limiti
800   presenti per gli \textit{hard link} (di cui parleremo in
801   sez.~\ref{sec:link_symlink_rename}) con la possibilità di fare riferimento
802   alla porzione dell'albero dei file di un filesystem presente a partire da
803   una certa directory, utilizzando una qualunque altra directory, anche se
804   questa sta su un filesystem diverso. Si può così fornire una alternativa
805   all'uso dei collegamenti simbolici (di cui parleremo in
806   sez.~\ref{sec:link_symlink_rename}) che funziona correttamente anche
807   all'intero di un \textit{chroot} (argomento su cui torneremo in
808   sez.~\ref{sec:file_chroot}).  \itindend{bind~mount}
809
810 \item[\const{MS\_DIRSYNC}] Richiede che ogni modifica al contenuto di una
811   directory venga immediatamente registrata su disco in maniera sincrona
812   (introdotta a partire dai kernel della serie 2.6). L'opzione si applica a
813   tutte le directory del filesystem, ma su alcuni filesystem è possibile
814   impostarla a livello di singole directory o per i sottorami di una directory
815   con il comando \cmd{chattr}.\footnote{questo avviene tramite delle opportune
816     \texttt{ioctl} (vedi sez.~\ref{sec:file_fcntl_ioctl}).}
817
818   Questo consente di ridurre al minimo il rischio di perdita dei dati delle
819   directory in caso di crollo improvviso del sistema, al costo di una certa
820   perdita di prestazioni dato che le funzioni di scrittura relative ad
821   operazioni sulle directory non saranno più bufferizzate e si bloccheranno
822   fino all'arrivo dei dati sul disco prima che un programma possa proseguire.
823
824 \item[\const{MS\_MANDLOCK}] Consente l'uso del \textit{mandatory locking}
825   \itindex{mandatory~locking} (vedi sez.~\ref{sec:file_mand_locking}) sui file
826   del filesystem. Per poterlo utilizzare effettivamente però esso dovrà essere
827   comunque attivato esplicitamente per i singoli file impostando i permessi
828   come illustrato in sez.~\ref{sec:file_mand_locking}.
829
830 \item[\const{MS\_MOVE}] Effettua uno del spostamento del \itindex{mount~point}
831   \textit{mount point} di un filesystem. La directory del
832   \itindex{mount~point} \textit{mount point} originale deve essere indicata
833   nell'argomento \param{source}, e la sua nuova posizione
834   nell'argomento \param{target}. Tutti gli altri argomenti della funzione
835   vengono ignorati.
836
837   Lo spostamento avviene atomicamente, ed il ramo di albero presente
838   sotto \param{source} sarà immediatamente visibile sotto \param{target}. Non
839   esiste cioè nessun momento in cui il filesystem non risulti montato in una o
840   nell'altra directory e pertanto è garantito che la risoluzione di
841   \itindsub{pathname}{relativo} \textit{pathname} relativi all'interno del
842   filesystem non possa fallire.
843
844 \item[\const{MS\_NOATIME}] Viene disabilitato sul filesystem l'aggiornamento
845   degli \textit{access time} (vedi sez.~\ref{sec:file_file_times}) per
846   qualunque tipo di file. Dato che l'aggiornamento degli \textit{access time}
847   è una funzionalità la cui utilità è spesso irrilevante ma comporta un costo
848   elevato visto che una qualunque lettura comporta comunque una scrittura su
849   disco,\footnote{e questo ad esempio ha conseguenze molto pesanti nell'uso
850     della batteria sui portatili.} questa opzione consente di disabilitarla
851   completamente. La soluzione può risultare troppo drastica dato che
852   l'informazione viene comunque utilizzata da alcuni programmi, per cui nello
853   sviluppo del kernel sono state introdotte altre opzioni che forniscono
854   soluzioni più appropriate e meno radicali.
855
856 \item[\const{MS\_NODEV}] Viene disabilitato sul filesystem l'accesso ai file
857   di dispositivo eventualmente presenti su di esso. L'opzione viene usata come
858   misura di precauzione per rendere inutile la presenza di eventuali file di
859   dispositivo su filesystem che non dovrebbero contenerne.\footnote{si ricordi
860     che le convenzioni del \itindex{Filesystem~Hierarchy~Standard~(FHS)}
861     \textit{Linux Filesystem Hierarchy Standard} richiedono che questi siano
862     mantenuti esclusivamente sotto \texttt{/dev}.}
863
864   Viene utilizzata, assieme a \const{MS\_NOEXEC} e \const{MS\_NOSUID}, per
865   fornire un accesso più controllato a quei filesystem di cui gli utenti hanno
866   il controllo dei contenuti, in particolar modo quelli posti su dispositivi
867   rimuovibili. In questo modo si evitano alla radice possibili situazioni in
868   cui un utente malizioso inserisce su uno di questi filesystem dei file di
869   dispositivo con permessi ``opportunamente'' ampliati che gli consentirebbero
870   di accedere anche a risorse cui non dovrebbe.
871
872 \item[\const{MS\_NODIRATIME}] Viene disabilitato sul filesystem
873   l'aggiornamento degli \textit{access time} (vedi
874   sez.~\ref{sec:file_file_times}), ma soltanto per le directory. Costituisce
875   una alternativa per \const{MS\_NOATIME}, che elimina l'informazione per le
876   directory, che in pratica che non viene mai utilizzata, mantenendola per i
877   file in cui invece ha un impiego, sia pur limitato.
878
879 \item[\const{MS\_NOEXEC}] Viene disabilitata sul filesystem l'esecuzione di un
880   qualunque file eseguibile eventualmente presente su di esso. L'opzione viene
881   usata come misura di precauzione per rendere impossibile l'uso di programmi
882   posti su filesystem che non dovrebbero contenerne.
883
884   Anche in questo caso viene utilizzata per fornire un accesso più controllato
885   a quei filesystem di cui gli utenti hanno il controllo dei contenuti. Da
886   questo punto di vista l'opzione è meno importante delle analoghe
887   \const{MS\_NODEV} e \const{MS\_NOSUID} in quanto l'esecuzione di un
888   programma creato dall'utente pone un livello di rischio nettamente
889   inferiore, ed è in genere consentita per i file contenuti nella sua home
890   directory.\footnote{cosa che renderebbe superfluo l'attivazione di questa
891     opzione, il cui uso ha senso solo per ambienti molto controllati in cui si
892     vuole che gli utenti eseguano solo i programmi forniti
893     dall'amministratore.}
894
895 \item[\const{MS\_NOSUID}] Viene disabilitato sul filesystem l'effetto dei bit
896   dei permessi \itindex{suid~bit} \acr{suid} e \itindex{sgid~bit} \acr{sgid}
897   (vedi sez.~\ref{sec:file_special_perm}) eventualmente presenti sui file in
898   esso contenuti. L'opzione viene usata come misura di precauzione per rendere
899   inefficace l'effetto di questi bit per filesystem in cui non ci dovrebbero
900   essere file dotati di questi permessi.
901
902   Di nuovo viene utilizzata, analogamente a \const{MS\_NOEXEC} e
903   \const{MS\_NODEV}, per fornire un accesso più controllato a quei filesystem
904   di cui gli utenti hanno il controllo dei contenuti. In questo caso si evita
905   che un utente malizioso possa inserire su uno di questi filesystem un
906   eseguibile con il bit \itindex{suid~bit} \acr{suid} attivo e di proprietà
907   dell'amministratore o di un altro utente, che gli consentirebbe di eseguirlo
908   per conto di quest'ultimo.
909
910 \item[\const{MS\_PRIVATE}] Marca un \itindex{mount~point} \textit{mount point}
911   come privato. Si tratta di una delle nuove opzioni (insieme a
912   \const{MS\_SHARED}, \const{MS\_SLAVE} e \const{MS\_UNBINDABLE}) facenti
913   parte dell'infrastruttura degli \itindex{shared~subtree} \textit{shared
914     subtree} introdotta a partire dal kernel 2.6.15, che estendono le
915   funzionalità dei \itindex{bind~mount} \textit{bind mount}. In questo caso
916   \param{target} dovrà fare riferimento al \textit{mount point} che si intende
917   marcare, e tutti gli altri argomenti verranno ignorati.
918
919   Di default, finché non lo si marca altrimenti con una delle altre opzioni
920   dell'interfaccia \itindex{shared~subtree} \textit{shared subtree}, ogni
921   \textit{mount point} è privato. Ogni \textit{bind mount} ottenuto da un
922   \itindex{mount~point} \textit{mount point} di tipo \textit{private} si
923   comporta come descritto nella trattazione di \const{MS\_BIND}. Si usa questo
924   flag principalmente per revocare gli effetti delle altre opzioni e riportare
925   il comportamento a quello ordinario.
926
927 \item[\const{MS\_RDONLY}] Esegue il montaggio del filesystem in sola lettura,
928   non sarà possibile nessuna modifica ai suoi contenuti. Viene usato tutte le
929   volte che si deve accedere ai contenuti di un filesystem con la certezza che
930   questo non venga modificato (ad esempio per ispezionare un filesystem
931   corrotto). All'avvio di default il kernel monta la radice in questa
932   modalità.
933
934 \item[\const{MS\_REC}] Applica ricorsivamente a tutti i \itindex{mount~point}
935   \textit{mount point} presenti al di sotto del \textit{mount point} indicato
936   gli effetti della opzione degli \itindex{shared~subtree} \textit{shared
937     subtree} associata. Anche questo caso l'argomento \param{target} deve fare
938   riferimento ad un \itindex{mount~point} \textit{mount point} e tutti gli
939   altri argomenti sono ignorati, ed il flag deve essere indicato assieme ad
940   una fra \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
941   \const{MS\_UNBINDABLE}.
942
943 \item[\const{MS\_RELATIME}] Indica di effettuare l'aggiornamento degli
944   \textit{access time} sul filesystem soltanto quando questo risulti
945   antecedente il valore corrente del \textit{modification time} o del
946   \textit{change time} (per i tempi dei file si veda
947   sez.~\ref{sec:file_file_times}). L'opzione è disponibile a partire dal
948   kernel 2.6.20, mentre dal 2.6.30 questo è diventato il comportamento di
949   default del sistema, che può essere riportato a quello tradizionale con
950   l'uso di \const{MS\_STRICTATIME}. Sempre dal 2.6.30 il comportamento è stato
951   anche modificato e l'\textit{access time} viene comunque aggiornato se è più
952   vecchio di un giorno.
953
954   L'opzione consente di evitare i problemi di prestazioni relativi
955   all'aggiornamento dell'\textit{access time} senza avere impatti negativi
956   riguardo le funzionalità, il comportamento adottato infatti consente di
957   rendere evidente che vi è stato un accesso dopo la scrittura, ed evitando al
958   contempo ulteriori operazioni su disco negli accessi successivi. In questo
959   modo l'informazione relativa al fatto che un file sia stato letto resta
960   disponibile, ed i programmi che ne fanno uso continuano a funzionare. Con
961   l'introduzione di questo comportamento l'uso delle alternative
962   \const{MS\_NOATIME} e \const{MS\_NODIRATIME} è sostanzialmente inutile.
963
964 \item[\const{MS\_REMOUNT}] Consente di rimontare un filesystem già montato
965   cambiandone le opzioni di montaggio in maniera atomica. In questo modo si
966   possono modificare le opzioni del filesystem anche se questo è in uso. Gli
967   argomenti \param{source} e \param{target} devono essere gli stessi usati per
968   il montaggio originale, mentre sia \param{data} che \param{mountflags}
969   conterranno le nuove opzioni, \param{filesystemtype} viene ignorato.
970
971   Qualunque opzione specifica del filesystem indicata con \param{data} può
972   essere modificata, mentre con \param{mountflags} possono essere modificate
973   solo alcune opzioni generiche. Con i kernel più recenti queste sono soltanto
974   \const{MS\_MANDLOCK}, \const{MS\_RDONLY} e \const{MS\_SYNCHRONOUS}, prima
975   del kernel 2.6.16 potevano essere modificate anche le ulteriori
976   \const{MS\_NOATIME} e \const{MS\_NODIRATIME}, ed infine prima del kernel
977   2.4.10 anche \const{MS\_NODEV}, \const{MS\_NOEXEC} e \const{MS\_NOSUID}.
978
979 \item[\const{MS\_SHARED}] Marca un \itindex{mount~point} \textit{mount point}
980   come \textit{shared mount}.  Si tratta di una delle nuove opzioni (insieme a
981   \const{MS\_PRIVATE}, \const{MS\_SLAVE} e \const{MS\_UNBINDABLE}) facenti
982   parte dell'infrastruttura degli \itindex{shared~subtree} \textit{shared
983     subtree} introdotta a partire dal kernel 2.6.15, che estendono le
984   funzionalità dei \itindex{bind~mount} \textit{bind mount}.  In questo caso
985   \param{target} dovrà fare riferimento al \itindex{mount~point} \textit{mount
986     point} che si intende marcare, e tutti gli altri argomenti verranno
987   ignorati.
988
989   Lo scopo dell'opzione è ottenere che tutti i successivi \itindex{bind~mount}
990   \textit{bind mount} effettuati da un \textit{mount point} marcato da essa
991   siano di tipo \textit{shared}, cioè ``\textsl{condividano}'' con l'originale
992   e fra di loro ogni ulteriore operazione di montaggio o smontaggio che
993   avviene su una directory al di sotto di uno qualunque di essi. Le operazioni
994   di montaggio e smontaggio effettuate al di sotto di un qualunque
995   \textit{mount point} così marcato verranno ``\textsl{propagate}'' a tutti i
996   \itindex{mount~point} \textit{mount point} della stessa condivisione, e la
997   sezione di albero di file vista al di sotto di ciascuno di essi sarà sempre
998   identica.
999
1000 \item[\const{MS\_SILENT}] Richiede la soppressione di alcuni messaggi di
1001   avvertimento nei log del kernel (vedi sez.~\ref{sec:sess_daemon}). L'opzione
1002   è presente a partire dal kernel 2.6.17 e sostituisce, utilizzando un nome
1003   non fuorviante, la precedente \const{MS\_VERBOSE}, introdotta nel kernel
1004   2.6.12, che aveva lo stesso effetto.
1005
1006 \item[\const{MS\_SLAVE}] Marca un \itindex{mount~point} \textit{mount point}
1007   come \textit{slave mount}. Si tratta di una delle nuove opzioni (insieme a
1008   \const{MS\_PRIVATE}, \const{MS\_SHARED} e \const{MS\_UNBINDABLE}) facenti
1009   parte dell'infrastruttura degli \itindex{shared~subtree} \textit{shared
1010     subtree} introdotta a partire dal kernel 2.6.15, che estendono le
1011   funzionalità dei \itindex{bind~mount} \textit{bind mount}.  In questo caso
1012   \param{target} dovrà fare riferimento al \textit{mount point} che si intende
1013   marcare, e tutti gli altri argomenti verranno ignorati.
1014
1015   Lo scopo dell'opzione è ottenere che tutti i successivi \textit{bind mount}
1016   effettuati da un \textit{mount point} marcato da essa siano di tipo
1017   \textit{slave}, cioè ``\textsl{condividano}'' ogni ulteriore operazione di
1018   montaggio o smontaggio che avviene su una directory al di sotto del
1019   \textit{mount point} originale. Le operazioni di montaggio e smontaggio in
1020   questo caso vengono ``\textsl{propagate}'' soltanto dal \textit{mount point}
1021   originale (detto anche \textit{master}) verso gli \textit{slave}, mentre
1022   essi potranno eseguire al loro interno ulteriori montaggi che non saranno
1023   propagati né negli altri né nel \itindex{mount~point} \textit{mount point}
1024   originale.
1025
1026 \item[\const{MS\_STRICTATIME}] Ripristina il comportamento tradizionale per
1027   cui l'\textit{access time} viene aggiornato ad ogni accesso al
1028   file. L'opzione è disponibile solo a partire dal kernel 2.6.30 quando il
1029   comportamento di default del kernel è diventato quello fornito da
1030   \const{MS\_RELATIME}.
1031
1032 \item[\const{MS\_SYNCHRONOUS}] Abilita la scrittura sincrona richiedendo che
1033   ogni modifica al contenuto del filesystem venga immediatamente registrata su
1034   disco. Lo stesso comportamento può essere ottenuto con il flag
1035   \const{O\_SYNC} di \func{open} (vedi sez.~\ref{sec:file_open_close}).
1036
1037   Questa opzione consente di ridurre al minimo il rischio di perdita dei dati
1038   in caso di crollo improvviso del sistema, al costo di una pesante perdita di
1039   prestazioni dato che tutte le funzioni di scrittura non saranno più
1040   bufferizzate e si bloccheranno fino all'arrivo dei dati sul disco. Per un
1041   compromesso in cui questo comportamento avviene solo per le directory, ed ha
1042   quindi una incidenza nettamente minore, si può usare \const{MS\_DIRSYNC}.
1043
1044 \item[\const{MS\_UNBINDABLE}] Marca un \itindex{mount~point} \textit{mount
1045     point} come \textit{unbindable mount}. Si tratta di una delle nuove
1046   opzioni (insieme a \const{MS\_PRIVATE}, \const{MS\_SHARED} e
1047   \const{MS\_SLAVE}) facenti parte dell'infrastruttura degli
1048   \itindex{shared~subtree} \textit{shared subtree} introdotta a partire dal
1049   kernel 2.6.15, che estendono le funzionalità dei \itindex{bind~mount}
1050   \textit{bind mount}.  In questo caso
1051   \param{target} dovrà fare riferimento al \textit{mount point} che si intende
1052   marcare, e tutti gli altri argomenti verranno ignorati.
1053
1054   Un \textit{mount point} marcato in questo modo disabilita la capacità di
1055   eseguire dei \itindex{bind~mount} \textit{bind mount} del suo contenuto. Si
1056   comporta cioè come allo stesso modo di un \itindex{mount~point}
1057   \textit{mount point} ordinario di tipo \textit{private} con in più la
1058   restrizione che nessuna sua sottodirectory (anche se relativa ad un
1059   ulteriore montaggio) possa essere utilizzata per un come sorgente di un
1060   \itindex{bind~mount} \textit{bind mount}.
1061
1062 \end{basedescript}
1063
1064 % NOTE per \const{MS\_SLAVE},\const{MS\_SHARE}, \const{MS\_PRIVATE} e
1065 % \const{MS\_UNBINDABLE} dal 2.6.15 vedi shared subtrees, in particolare
1066 %  * http://lwn.net/Articles/159077/ e
1067 %  * Documentation/filesystems/sharedsubtree.txt
1068
1069 % TODO: (bassa priorità) non documentati ma presenti in sys/mount.h:
1070 %       * MS_POSIXACL
1071 %       * MS_KERNMOUNT
1072 %       * MS_I_VERSION
1073 %       * MS_ACTIVE
1074 %       * MS_NOUSER
1075
1076
1077 Una volta che non si voglia più utilizzare un certo filesystem è possibile
1078 ``\textsl{smontarlo}'' usando la funzione di sistema \funcd{umount}, il cui
1079 prototipo è:
1080
1081 \begin{funcproto}{
1082 \fhead{sys/mount.h}
1083 \fdecl{umount(const char *target)}
1084 \fdesc{Smonta un filesystem.} 
1085 }
1086 {La funzione ritorna  $0$ in caso di successo e $-1$ per un errore,
1087   nel qual caso \var{errno} assumerà uno dei valori: 
1088   \begin{errlist}
1089   \item[\errcode{EBUSY}] il filesystem è occupato.
1090   \item[\errcode{EINVAL}] \param{target} non è un \textit{mount point}.
1091   \item[\errcode{EPERM}] il processo non ha i privilegi di
1092     amministratore.\footnotemark 
1093   \end{errlist}
1094   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
1095   \errval{ENOENT}, \errval{ENOMEM} nel loro significato generico.  }
1096 \end{funcproto}
1097
1098 \footnotetext{più precisamente la \itindex{capabilities} capacità
1099   \const{CAP\_SYS\_ADMIN}, vedi sez.~\ref{sec:proc_capabilities}.}
1100
1101 La funzione prende il nome della directory su cui il filesystem è montato e
1102 non il file o il dispositivo che è stato montato,\footnote{questo è vero a
1103   partire dal kernel 2.3.99-pre7, prima esistevano due chiamate separate e la
1104   funzione poteva essere usata anche specificando il file di dispositivo.} in
1105 quanto a partire dai kernel della serie 2.4.x è possibile montare lo stesso
1106 dispositivo in più punti. Nel caso più di un filesystem sia stato montato
1107 sullo stesso \itindex{mount~point} \textit{mount point} viene smontato quello
1108 che è stato montato per ultimo. Si tenga presente che la funzione fallisce se
1109 il filesystem è ``\textsl{occupato}'', cioè quando ci sono ancora dei file
1110 aperti sul filesystem, se questo contiene la \index{directory~di~lavoro}
1111 directory di lavoro di un qualunque processo o il \itindex{mount~point}
1112 \textit{mount point} di un altro filesystem.
1113
1114 Linux provvede inoltre una seconda funzione di sistema, \funcd{umount2}, che
1115 consente un maggior controllo delle operazioni, come forzare lo smontaggio di
1116 un filesystem anche quando questo risulti occupato; il suo prototipo è:
1117
1118 \begin{funcproto}{
1119 \fhead{sys/mount.h}
1120 \fdecl{umount2(const char *target, int flags)}
1121 \fdesc{Smonta un filesystem.} 
1122 }
1123 {La funzione ritorna  $0$ in caso di successo e $-1$ per un errore,
1124   nel qual caso \var{errno} assumerà uno dei valori: 
1125   \begin{errlist}
1126      \item[\errcode{EAGAIN}] si è chiamata la funzione con \const{MNT\_EXPIRE}
1127        ed il filesystem non era occupato.
1128      \item[\errcode{EBUSY}] \param{target} è la \index{directory~di~lavoro}
1129        directory di lavoro di qualche processo, o contiene dei file aperti, o un
1130        altro mount point.
1131      \item[\errcode{EINVAL}] \param{target} non è un \itindex{mount~point}
1132        \textit{mount point} o si è usato \const{MNT\_EXPIRE} con
1133        \const{MNT\_FORCE} o \const{MNT\_DETACH} o si è specificato un flag non
1134        esistente.
1135   \end{errlist}
1136   e tutti gli altri valori visti per \func{umount} con lo stesso significato.}
1137 \end{funcproto}
1138
1139 Il valore di \param{flags} è una maschera binaria dei flag che controllano le
1140 modalità di smontaggio, che deve essere specificato con un OR aritmetico delle
1141 costanti illustrate in tab.~\ref{tab:umount2_flags}.  Specificando
1142 \const{MNT\_FORCE} la funzione cercherà di liberare il filesystem anche se è
1143 occupato per via di una delle condizioni descritte in precedenza. A seconda
1144 del tipo di filesystem alcune (o tutte) possono essere superate, evitando
1145 l'errore di \errcode{EBUSY}. In tutti i casi prima dello smontaggio viene
1146 eseguita una sincronizzazione dei dati.
1147
1148 \begin{table}[!htb]
1149   \centering
1150   \footnotesize
1151   \begin{tabular}[c]{|l|p{8cm}|}
1152     \hline
1153     \textbf{Costante} & \textbf{Descrizione}\\
1154     \hline
1155     \hline
1156     \const{MNT\_FORCE}  & Forza lo smontaggio del filesystem anche se questo è
1157                           occupato (presente dai kernel della serie 2.2).\\
1158     \const{MNT\_DETACH} & Esegue uno smontaggio ``\textsl{pigro}'', in cui si
1159                           blocca l'accesso ma si aspetta che il filesystem si
1160                           liberi (presente dal kernel 2.4.11 e dalla
1161                           \acr{glibc} 2.11).\\ 
1162     \const{MNT\_EXPIRE} & Se non occupato marca un \itindex{mount~point} 
1163                           \textit{mount point} come ``\textsl{in scadenza}'' in
1164                           modo che ad una successiva chiamata senza utilizzo
1165                           del filesystem questo venga smontato (presente dal
1166                           kernel 2.6.8 e dalla \acr{glibc} 2.11).\\ 
1167     \const{UMOUNT\_NOFOLLOW}& Non dereferenzia \param{target} se questo è un
1168                           collegamento simbolico (vedi
1169                           sez.~\ref{sec:link_symlink_rename}) evitando
1170                           problemi di sicurezza (presente dal kernel 2.6.34).\\ 
1171     \hline
1172   \end{tabular}
1173   \caption{Costanti che identificano i bit dell'argomento \param{flags}
1174     della funzione \func{umount2}.} 
1175   \label{tab:umount2_flags}
1176 \end{table}
1177
1178 Con l'opzione \const{MNT\_DETACH} si richiede invece uno smontaggio
1179 ``\textsl{pigro}'' (o \textit{lazy umount}) in cui il filesystem diventa
1180 inaccessibile per i nuovi processi subito dopo la chiamata della funzione, ma
1181 resta accessibile per quelli che lo hanno ancora in uso e non viene smontato
1182 fintanto che resta occupato.
1183
1184 Con \const{MNT\_EXPIRE}, che non può essere specificato insieme agli altri
1185 due, si marca il \itindex{mount~point} \textit{mount point} di un filesystem
1186 non occupato come ``\textsl{in scadenza}'', in tal caso \func{umount2} ritorna
1187 con un errore di \errcode{EAGAIN}, mentre in caso di filesystem occupato si
1188 sarebbe ricevuto \errcode{EBUSY}.  Una volta marcato, se nel frattempo non
1189 viene fatto nessun uso del filesystem, ad una successiva chiamata con
1190 \const{MNT\_EXPIRE} questo verrà smontato. Questo flag consente di realizzare
1191 un meccanismo che smonti automaticamente i filesystem che restano inutilizzati
1192 per un certo periodo di tempo.
1193
1194 Infine il flag \const{UMOUNT\_NOFOLLOW} non dereferenzia \param{target} se
1195 questo è un collegamento simbolico (vedi
1196 sez.~\ref{sec:link_symlink_rename}). Questa è una misura di sicurezza
1197 introdotta per evitare, per quei filesystem per il quale è prevista una
1198 gestione diretta da parte degli utenti, come quelli basati su
1199 FUSE,\footnote{il \textit{Filesystem in USEr space} (FUSE) è una delle più
1200   interessanti applicazioni del \itindex{Virtual~File~System} VFS che
1201   consente, tramite un opportuno modulo, di implementarne le funzioni in
1202   \textit{user space}, così da rendere possibile l'implementazione di un
1203   qualunque filesystem (con applicazioni di grande interesse come il
1204   filesystem cifrato \textit{encfs} o il filesystem di rete \textit{sshfs})
1205   che possa essere usato direttamente per conto degli utenti.}  che si possano
1206 passare ai programmi che effettuano lo smontaggio dei filesystem, che in
1207 genere sono privilegiati ma consentono di agire solo sui propri \textit{mount
1208   point}, dei collegamenti simbolici che puntano ad altri \textit{mount
1209   point}, ottenendo così la possibilità di smontare qualunque filesystem.
1210
1211
1212 Altre due funzioni di sistema specifiche di Linux,\footnote{esse si trovano
1213   anche su BSD, ma con una struttura diversa.} utili per ottenere in maniera
1214 diretta informazioni riguardo al filesystem su cui si trova un certo file,
1215 sono \funcd{statfs} e \funcd{fstatfs}, i cui prototipi sono:
1216
1217 \begin{funcproto}{
1218 \fhead{sys/vfs.h}
1219 \fdecl{int statfs(const char *path, struct statfs *buf)}
1220 \fdecl{int fstatfs(int fd, struct statfs *buf)}
1221 \fdesc{Restituiscono informazioni relative ad un filesystem.} 
1222 }
1223 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
1224   nel qual caso \var{errno} assumerà uno dei valori: 
1225   \begin{errlist}
1226   \item[\errcode{ENOSYS}] il filesystem su cui si trova il file specificato
1227     non supporta la funzione.
1228   \end{errlist} ed inoltre \errval{EFAULT} ed \errval{EIO} per entrambe,
1229   \errval{EBADF} per \func{fstatfs}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
1230   \errval{ENOENT}, \errval{EACCES}, \errval{ELOOP} per \func{statfs} nel loro
1231   significato generico.}
1232 \end{funcproto}
1233
1234 Queste funzioni permettono di ottenere una serie di informazioni generali
1235 riguardo al filesystem su cui si trova il file specificato con un
1236 \textit{pathname} per \func{statfs} e con un file descriptor (vedi
1237 sez.~\ref{sec:file_fd}) per \func{statfs}.  Le informazioni vengono restituite
1238 all'indirizzo \param{buf} di una struttura \struct{statfs} definita come in
1239 fig.~\ref{fig:sys_statfs}, ed i campi che sono indefiniti per il filesystem in
1240 esame sono impostati a zero.  I valori del campo \var{f\_type} sono definiti
1241 per i vari filesystem nei relativi file di header dei sorgenti del kernel da
1242 costanti del tipo \var{XXX\_SUPER\_MAGIC}, dove \var{XXX} in genere è il nome
1243 del filesystem stesso.
1244
1245 \begin{figure}[!htb]
1246   \footnotesize \centering
1247   \begin{minipage}[c]{0.8\textwidth}
1248     \includestruct{listati/statfs.h}
1249   \end{minipage}
1250   \normalsize 
1251   \caption{La struttura \structd{statfs}.} 
1252   \label{fig:sys_statfs}
1253 \end{figure}
1254
1255 La \acr{glibc} provvede infine una serie di funzioni per la gestione dei due
1256 file \conffile{/etc/fstab}\footnote{più precisamente \funcm{setfsent},
1257   \funcm{getfsent}, \funcm{getfsfile}, \funcm{getfsspec}, \funcm{endfsent}.}
1258 ed \conffile{/etc/mtab}\footnote{più precisamente \funcm{setmntent},
1259   \funcm{getmntent},\funcm{getmntent\_r}, \funcm{addmntent},\funcm{endmntent},
1260   \funcm{hasmntopt}.} che convenzionalmente sono usati in quasi tutti i
1261 sistemi unix-like per mantenere rispettivamente le informazioni riguardo ai
1262 filesystem da montare e a quelli correntemente montati. Le funzioni servono a
1263 leggere il contenuto di questi file in opportune strutture \struct{fstab} e
1264 \struct{mntent}, e, nel caso di \conffile{/etc/mtab}, per inserire e rimuovere
1265 le voci presenti nel file.
1266
1267 In generale si dovrebbero usare queste funzioni, in particolare quelle
1268 relative a \conffile{/etc/mtab}, quando si debba scrivere un programma che
1269 effettua il montaggio di un filesystem. In realtà in questi casi è molto più
1270 semplice invocare direttamente il programma \cmd{mount}. Inoltre l'uso stesso
1271 di \conffile{/etc/mtab} è considerato una pratica obsoleta, in quanto se non
1272 aggiornato correttamente (cosa che è impossibile se la radice è montata in
1273 sola lettura) il suo contenuto diventa fuorviante.
1274
1275 Per questo motivo il suo utilizzo viene deprecato ed in molti casi viene già
1276 oggi sostituito da un collegamento simbolico a \procfile{/proc/mounts}, che
1277 contiene una versione degli stessi contenuti (vale a dire l'elenco dei
1278 filesystem montati) generata direttamente dal kernel, e quindi sempre
1279 disponibile e sempre aggiornata. Per questo motivo tralasceremo la
1280 trattazione, di queste funzioni, rimandando al manuale della \acr{glibc}
1281 \cite{GlibcMan} per la documentazione completa.
1282
1283 % TODO (bassa priorità) scrivere delle funzioni (getfsent e getmntent &C)
1284 % TODO (bassa priorità) documentare ? swapon e swapoff (man 2 ...) 
1285
1286
1287 \section{La gestione di file e directory}
1288 \label{sec:file_dir}
1289
1290 In questa sezione esamineremo le funzioni usate per la manipolazione dei nomi
1291 file e directory, per la creazione di collegamenti simbolici e diretti, per la
1292 gestione e la lettura delle directory.  In particolare ci soffermeremo sulle
1293 conseguenze che derivano dalla architettura di un filesystem unix-like
1294 illustrata in sez.~\ref{sec:file_filesystem} per quanto attiene il
1295 comportamento e gli effetti delle varie funzioni. Tratteremo infine la
1296 directory di lavoro e le funzioni per la gestione di file speciali e
1297 temporanei.
1298
1299
1300
1301 \subsection{La gestione dei nomi dei file}
1302 \label{sec:link_symlink_rename}
1303
1304 % \subsection{Le funzioni \func{link} e \func{unlink}}
1305 % \label{sec:file_link}
1306
1307 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
1308 dei nomi alternativi, come gli alias del vecchio MacOS o i collegamenti di
1309 Windows o i nomi logici del VMS, che permettono di fare riferimento allo
1310 stesso file chiamandolo con nomi diversi o accedendovi da directory diverse.
1311 Questo è possibile anche in ambiente Unix, dove un nome alternativo viene
1312 usualmente chiamato ``\textsl{collegamento}'' (o \textit{link}).  Data
1313 l'architettura del sistema riguardo la gestione dei file vedremo però che ci
1314 sono due metodi sostanzialmente diversi per fare questa operazione.
1315
1316 \itindbeg{hard~link}
1317 \index{collegamento!diretto|(}
1318
1319 In sez.~\ref{sec:file_filesystem} abbiamo spiegato come la capacità di
1320 chiamare un file con nomi diversi sia connaturata con l'architettura di un
1321 filesystem per un sistema Unix, in quanto il nome del file che si trova in una
1322 directory è solo un'etichetta associata ad un puntatore che permette di
1323 ottenere il riferimento ad un \itindex{inode} \textit{inode}, e che è
1324 quest'ultimo che viene usato dal kernel per identificare univocamente gli
1325 oggetti sul filesystem.
1326
1327 Questo significa che fintanto che si resta sullo stesso filesystem la
1328 realizzazione di un \textit{link} è immediata: uno stesso file può avere tanti
1329 nomi diversi, dati da altrettante associazioni diverse allo stesso
1330 \itindex{inode} \textit{inode} effettuate tramite ``etichette'' diverse in
1331 directory diverse. Si noti anche come nessuno di questi nomi possa assumere
1332 una particolare preferenza o originalità rispetto agli altri, in quanto tutti
1333 fanno comunque riferimento allo stesso \itindex{inode} \textit{inode} e quindi
1334 tutti otterranno lo stesso file.
1335
1336 Quando si vuole aggiungere ad una directory una voce che faccia riferimento ad
1337 un file già esistente nella modalità appena descritta, per ottenere quello che
1338 viene denominato ``\textsl{collegamento diretto}'' (o \textit{hard link}), si
1339 deve usare la funzione di sistema \funcd{link}, il cui prototipo è:
1340
1341 \begin{funcproto}{
1342 \fhead{unistd.h}
1343 \fdecl{int link(const char *oldpath, const char *newpath)}
1344 \fdesc{Crea un nuovo collegamento diretto (\textit{hard link}).} 
1345 }
1346 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1347   nel qual caso \var{errno} assumerà uno dei valori: 
1348   \begin{errlist}
1349   \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
1350     esiste già.
1351   \item[\errcode{EMLINK}] ci sono troppi collegamenti al file \param{oldpath}
1352     (il numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
1353     sez.~\ref{sec:sys_limits}).
1354   \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
1355     \param{newpath} non supporta i collegamenti diretti o è una directory.
1356   \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
1357     riferimento ad un filesystem montato sullo stesso \itindex{mount~point}
1358     \textit{mount point}.
1359   \end{errlist} ed inoltre \errval{EACCES}, \errval{EFAULT}, \errval{EIO},
1360   \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM},
1361   \errval{ENOSPC}, \errval{ENOTDIR}, \errval{EROFS} nel loro significato
1362   generico.}
1363 \end{funcproto}
1364
1365 La funzione crea in \param{newpath} un collegamento diretto al file indicato
1366 da \param{oldpath}. Per quanto detto la creazione di un nuovo collegamento
1367 diretto non copia il contenuto del file, ma si limita a creare la voce
1368 specificata da \param{newpath} nella directory corrispondente e l'unica
1369 proprietà del file che verrà modificata sarà il numero di riferimenti al file
1370 (il campo \var{i\_nlink} della struttura \kstruct{inode}, vedi
1371 fig.~\ref{fig:kstruct_inode}) che verrà aumentato di di uno. In questo modo lo
1372 stesso file potrà essere acceduto sia con \param{newpath} che
1373 con \param{oldpath}.
1374
1375 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
1376 collegamento diretto è possibile solo se entrambi i \textit{pathname} sono
1377 nello stesso filesystem ed inoltre esso deve supportare gli \textit{hard link}
1378 (il meccanismo non è disponibile ad esempio con il filesystem \acr{vfat} di
1379 Windows). In realtà la funzione ha un ulteriore requisito, e cioè che non solo
1380 che i due file siano sullo stesso filesystem, ma anche che si faccia
1381 riferimento ad essi all'interno dello stesso \itindex{mount~point}
1382 \textit{mount point}.\footnote{si tenga presente infatti, come detto in
1383   sez.~\ref{sec:filesystem_mounting}, che a partire dal kernel 2.4 uno stesso
1384   filesystem può essere montato più volte su directory diverse.}
1385
1386 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
1387 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
1388 l'amministratore è in grado di creare un collegamento diretto ad un'altra
1389 directory: questo viene fatto perché con una tale operazione è possibile
1390 creare dei \textit{loop} nel filesystem (vedi fig.~\ref{fig:file_link_loop})
1391 che molti programmi non sono in grado di gestire e la cui rimozione
1392 diventerebbe piuttosto complicata.\footnote{in genere per questo tipo di
1393   errori occorre eseguire il programma \cmd{fsck} per riparare il filesystem,
1394   in quanto in caso di \textit{loop} la directory creata non sarebbe vuota e
1395   non si potrebbe più rimuoverla.}
1396
1397 Data la pericolosità di questa operazione e la disponibilità dei collegamenti
1398 simbolici (che vedremo a breve) e dei \itindex{bind~mount} \textit{bind mount}
1399 (già visti in sez.~\ref{sec:filesystem_mounting}) che possono fornire la
1400 stessa funzionalità senza questi problemi, nel caso di Linux questa capacità è
1401 stata completamente disabilitata, e al tentativo di creare un collegamento
1402 diretto ad una directory la funzione \func{link} restituisce sempre l'errore
1403 \errcode{EPERM}.
1404
1405 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
1406 \textit{hard link} ad un collegamento simbolico. In questo caso lo standard
1407 POSIX.1-2001 prevederebbe che quest'ultimo venga risolto e che il collegamento
1408 sia effettuato rispetto al file cui esso punta, e che venga riportato un
1409 errore qualora questo non esista o non sia un file. Questo era anche il
1410 comportamento iniziale di Linux ma a partire dai kernel della serie
1411 2.0.x\footnote{per la precisione il comportamento era quello previsto dallo
1412   standard POSIX fino al kernel di sviluppo 1.3.56, ed è stato temporaneamente
1413   ripristinato anche durante lo sviluppo della serie 2.1.x, per poi tornare al
1414   comportamento attuale fino ad oggi (per riferimento si veda
1415   \url{http://lwn.net/Articles/293902}).} è stato adottato un comportamento
1416 che non segue più lo standard per cui l'\textit{hard link} viene creato nei
1417 confronti del collegamento simbolico, e non del file cui questo punta. La
1418 revisione POSIX.1-2008 lascia invece il comportamento dipendente
1419 dall'implementazione, cosa che rende Linux conforme a questa versione
1420 successiva dello standard.
1421
1422 \itindbeg{symbolic~link}
1423
1424 \index{collegamento!simbolico|(}
1425
1426 La ragione di questa differenza rispetto al vecchio standard, presente anche
1427 in altri sistemi unix-like, è dovuta al fatto che un collegamento simbolico
1428 può fare riferimento anche ad un file non esistente o a una directory, per i
1429 quali l'\textit{hard link} non può essere creato, per cui la scelta di seguire
1430 il collegamento simbolico è stata ritenuta una scelta scorretta nella
1431 progettazione dell'interfaccia.  Infatti se non ci fosse il comportamento
1432 adottato da Linux sarebbe impossibile creare un \textit{hard link} ad un
1433 collegamento simbolico, perché la funzione lo risolverebbe e l'\textit{hard
1434   link} verrebbe creato verso la destinazione. Invece evitando di seguire lo
1435 standard l'operazione diventa possibile, ed anche il comportamento della
1436 funzione risulta molto più comprensibile. Tanto più che se proprio se si vuole
1437 creare un \textit{hard link} rispetto alla destinazione di un collegamento
1438 simbolico è sempre possibile farlo direttamente.\footnote{ciò non toglie che
1439   questo comportamento possa causare problemi, come nell'esempio descritto
1440   nell'articolo citato nella nota precedente, a programmi che non si aspettano
1441   questa differenza rispetto allo standard POSIX.}
1442
1443 Dato che \func{link} crea semplicemente dei nomi che fanno riferimenti agli
1444 \itindex{inode} \textit{inode}, essa può funzionare soltanto per file che
1445 risiedono sullo stesso filesystem e solo per un filesystem di tipo Unix.
1446 Inoltre abbiamo visto che in Linux non è consentito eseguire un collegamento
1447 diretto ad una directory.
1448
1449 Per ovviare a queste limitazioni, come accennato all'inizio, i sistemi
1450 unix-like supportano un'altra forma di collegamento, detta
1451 ``\textsl{collegamento simbolico}'' (o anche \textit{soft link} o
1452 \textit{symbolic link}). In questo caso si tratta, come avviene in altri
1453 sistemi operativi, di file speciali che contengono semplicemente il
1454 riferimento ad un altro file (o directory). In questo modo è possibile
1455 effettuare \textit{link} anche attraverso filesystem diversi, a file posti in
1456 filesystem che non supportano i collegamenti diretti, a delle directory, ed
1457 anche a file che non esistono ancora.
1458
1459 \itindend{hard~link}
1460 \index{collegamento!diretto|)}
1461
1462 Il meccanismo funziona in quanto i \textit{symbolic link} sono riconosciuti
1463 come tali dal kernel\footnote{è uno dei diversi tipi di file visti in
1464   tab.~\ref{tab:file_file_types}, contrassegnato come tale \itindex{inode}
1465   nell'\textit{inode} e riconoscibile dal valore del campo \var{st\_mode}
1466   della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).} e tutta una
1467 serie di funzioni di sistema (come \func{open} o \func{stat}) quando ricevono
1468 come argomento il \textit{pathname} di un collegamento simbolico vanno
1469 automaticamente ad operare sul file da esso specificato. La funzione di
1470 sistema che permette di creare un nuovo collegamento simbolico è
1471 \funcd{symlink}, ed il suo prototipo è:
1472
1473 \begin{funcproto}{
1474 \fhead{unistd.h}
1475 \fdecl{int symlink(const char *oldpath, const char *newpath)}
1476 \fdesc{Crea un nuovo collegamento simbolico (\textit{symbolic link}).} 
1477 }
1478 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1479   nel qual caso \var{errno} assumerà uno dei valori: 
1480   \begin{errlist}
1481   \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
1482   \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
1483     \param{oldpath} è una stringa vuota.
1484   \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
1485     supporta i collegamenti simbolici.
1486   \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
1487     lettura.
1488   \end{errlist} ed inoltre \errval{EACCES}, \errval{EFAULT}, \errval{EIO},
1489   \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOMEM}, \errval{ENOSPC} e
1490   \errval{ENOTDIR} nel loro significato generico.}
1491 \end{funcproto}
1492
1493 La funzione crea un nuovo collegamento simbolico \param{newpath} che fa
1494 riferimento ad \param{oldpath}.  Si tenga presente che la funzione non
1495 effettua nessun controllo sull'esistenza di un file di nome \param{oldpath},
1496 ma si limita ad inserire il \textit{pathname} nel collegamento
1497 simbolico. Pertanto un collegamento simbolico può anche riferirsi ad un file
1498 che non esiste ed in questo caso si ha quello che viene chiamato un
1499 \itindex{dangling~link} \textit{dangling link}, letteralmente un
1500 \index{collegamento!ciondolante} ``\textsl{collegamento ciondolante}''.
1501
1502 Come accennato i collegamenti simbolici sono risolti automaticamente dal
1503 kernel all'invocazione delle varie \textit{system call}. In
1504 tab.~\ref{tab:file_symb_effect} si è riportato un elenco dei comportamenti
1505 delle varie funzioni di sistema che operano sui file nei confronti della
1506 risoluzione dei collegamenti simbolici, specificando quali li seguono e quali
1507 invece possono operare direttamente sui loro contenuti.
1508 \begin{table}[htb]
1509   \centering
1510   \footnotesize
1511   \begin{tabular}[c]{|l|c|c|}
1512     \hline
1513     \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
1514     \hline 
1515     \hline 
1516     \func{access}   & $\bullet$ & --        \\
1517     \func{chdir}    & $\bullet$ & --        \\
1518     \func{chmod}    & $\bullet$ & --        \\
1519     \func{chown}    & --        & $\bullet$ \\
1520     \func{creat}    & $\bullet$ & --        \\
1521     \func{exec}     & $\bullet$ & --        \\
1522     \func{lchown}   & $\bullet$ & --        \\
1523     \func{link}\footnotemark & --        & $\bullet$ \\
1524     \func{lstat}    & --        & $\bullet$ \\
1525     \func{mkdir}    & $\bullet$ & --        \\
1526     \func{mkfifo}   & $\bullet$ & --        \\
1527     \func{mknod}    & $\bullet$ & --        \\
1528     \func{open}     & $\bullet$ & --        \\
1529     \func{opendir}  & $\bullet$ & --        \\
1530     \func{pathconf} & $\bullet$ & --        \\
1531     \func{readlink} & --        & $\bullet$ \\
1532     \func{remove}   & --        & $\bullet$ \\
1533     \func{rename}   & --        & $\bullet$ \\
1534     \func{stat}     & $\bullet$ & --        \\
1535     \func{truncate} & $\bullet$ & --        \\
1536     \func{unlink}   & --        & $\bullet$ \\
1537     \hline 
1538   \end{tabular}
1539   \caption{Uso dei collegamenti simbolici da parte di alcune funzioni.}
1540   \label{tab:file_symb_effect}
1541 \end{table}
1542
1543 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
1544   dallo standard POSIX.1-2001.}
1545
1546 Si noti che non si è specificato il comportamento delle funzioni che operano
1547 con i file descriptor (che tratteremo nel prossimo capitolo), in quanto la
1548 risoluzione del collegamento simbolico viene in genere effettuata dalla
1549 funzione che restituisce il file descriptor (normalmente la \func{open}, vedi
1550 sez.~\ref{sec:file_open_close}) e tutte le operazioni seguenti fanno
1551 riferimento solo a quest'ultimo.
1552
1553 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
1554 \func{open} seguono i collegamenti simbolici, occorrono funzioni apposite per
1555 accedere alle informazioni del collegamento invece che a quelle del file a cui
1556 esso fa riferimento. Quando si vuole leggere il contenuto di un collegamento
1557 simbolico si usa la funzione di sistema \funcd{readlink}, il cui prototipo è:
1558
1559 \begin{funcproto}{
1560 \fhead{unistd.h}
1561 \fdecl{int readlink(const char *path, char *buff, size\_t size)}
1562 \fdesc{Legge il contenuto di un collegamento simbolico.} 
1563 }
1564 {La funzione ritorna il numero di caratteri letti dentro \param{buff} in caso
1565   di successo e $-1$ per un errore,  nel qual caso \var{errno} assumerà uno
1566   dei valori:
1567   \begin{errlist}
1568   \item[\errcode{EINVAL}] \param{path} non è un collegamento simbolico
1569     o \param{size} non è positiva.
1570   \end{errlist} ed inoltre \errval{EACCES}, \errval{EFAULT}, \errval{EIO},
1571   \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM} e
1572   \errval{ENOTDIR} nel loro significato generico.}
1573 \end{funcproto}
1574
1575 La funzione legge il \textit{pathname} a cui fa riferimento il collegamento
1576 simbolico indicato dall'argomento \param{path} scrivendolo sul
1577 buffer \param{buff} di dimensione \param{size}. Si tenga presente che la
1578 funzione non termina la stringa con un carattere nullo e che se questa è
1579 troppo lunga la tronca alla dimensione specificata da \param{size} per evitare
1580 di sovrascrivere oltre le dimensioni del buffer.
1581
1582 \begin{figure}[htb]
1583   \centering
1584   \includegraphics[width=8.5cm]{img/link_loop}
1585   \caption{Esempio di loop nel filesystem creato con un collegamento
1586     simbolico.}
1587   \label{fig:file_link_loop}
1588 \end{figure}
1589
1590 Come accennato uno dei motivi per cui non sono consentiti \textit{hard link}
1591 alle directory è che questi possono creare dei \textit{loop} nella risoluzione
1592 dei nomi che non possono essere eliminati facilmente. Invece è sempre
1593 possibile, ed in genere anche molto utile, creare un collegamento simbolico ad
1594 una directory, anche se in questo caso si potranno ottenere anche dei
1595 \textit{loop}. La situazione è illustrata in fig.~\ref{fig:file_link_loop},
1596 che riporta la struttura della directory \file{/boot}. Come si vede si è
1597 creato al suo interno un collegamento simbolico che punta di nuovo a
1598 \file{/boot}.\footnote{il \textit{loop} mostrato in
1599   fig.~\ref{fig:file_link_loop} è stato usato per poter permettere a
1600   \cmd{grub} (un bootloader in grado di leggere direttamente da vari
1601   filesystem il file da lanciare come sistema operativo) di vedere i file
1602   contenuti nella directory \file{/boot} con lo stesso \textit{pathname} con
1603   cui verrebbero visti dal sistema operativo, anche se essi si trovano, come
1604   accade spesso, su una partizione separata (che \cmd{grub} all'avvio vedrebbe 
1605   come \file{/}).}
1606
1607 Questo però può causare problemi per tutti quei programmi che effettuano la
1608 scansione di una directory senza tener conto dei collegamenti simbolici, ad
1609 esempio se lanciassimo un comando del tipo \code{grep -r linux *}, il loop
1610 nella directory porterebbe il comando ad esaminare \file{/boot},
1611 \file{/boot/boot}, \file{/boot/boot/boot} e così via.
1612
1613 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
1614 un \textit{pathname} possano essere seguiti fino ad un certo numero massimo di
1615 collegamenti simbolici, il cui valore limite è specificato dalla costante
1616 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
1617 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}, che nella
1618 quasi totalità dei casi indica appunto che si è creato un collegamento
1619 simbolico che fa riferimento ad una directory del suo stesso
1620 \textit{pathname}.
1621
1622 Un altro punto da tenere sempre presente è che, come abbiamo accennato, un
1623 collegamento simbolico può fare riferimento anche ad un file che non esiste;
1624 ad esempio possiamo usare il comando \cmd{ln} per creare un collegamento
1625 simbolico nella nostra directory con:
1626 \begin{Console}
1627 piccardi@hain:~/gapil$ \textbf{ln -s /tmp/tmp_file symlink}
1628 \end{Console}
1629 %$
1630 e questo avrà successo anche se \file{/tmp/tmp\_file} non esiste:
1631 \begin{Console}
1632 piccardi@hain:~/gapil$ \textbf{ls symlink}
1633 symlink
1634 \end{Console}
1635 %$
1636 ma questo può generare confusione, perché accedendo in sola lettura a
1637 \file{symlink}, ad esempio con \cmd{cat}, otterremmo un errore:
1638 \begin{Console}
1639 piccardi@hain:~/gapil$ \textbf{cat symlink}
1640 cat: symlink: No such file or directory
1641 \end{Console}
1642 %$
1643 con un errore che può sembrare sbagliato, dato che \cmd{ls} ci ha mostrato
1644 l'esistenza di \file{symlink}, se invece scrivessimo su \file{symlink}
1645 otterremmo la creazione di \file{/tmp/tmp\_file} senza errori.
1646
1647
1648 \itindend{symbolic~link}
1649 \index{collegamento!simbolico|)}
1650
1651
1652 Un'altra funzione relativa alla gestione dei nomi dei file, anche se a prima
1653 vista parrebbe riguardare un argomento completamente diverso, è quella che per
1654 la cancellazione di un file. In realtà una \textit{system call} che serva
1655 proprio a cancellare un file non esiste neanche perché, come accennato in
1656 sez.~\ref{sec:file_filesystem}, quando in un sistema unix-like si richiede la
1657 rimozione di un file quella che si va a cancellare è soltanto la voce che
1658 referenzia il suo \itindex{inode} \textit{inode} all'interno di una directory.
1659
1660 La funzione di sistema che consente di effettuare questa operazione, il cui
1661 nome come si può notare ha poco a che fare con il concetto di rimozione, è
1662 \funcd{unlink}, ed il suo prototipo è:
1663
1664 \begin{funcproto}{
1665 \fhead{unistd.h}
1666 \fdecl{int unlink(const char *pathname)}
1667 \fdesc{Cancella un file.} 
1668 }
1669 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1670   nel qual caso \var{errno} assumerà uno dei valori:\footnotemark  
1671   \begin{errlist}
1672   \item[\errcode{EACCES}] non si ha il permesso di scrittura sulla directory
1673     che contiene \param{pathname} o di attraversamento di una delle directory
1674     superiori. 
1675   \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una
1676     directory.
1677   \item[\errcode{EPERM}] il filesystem non consente l'operazione, o la
1678     directory che contiene \param{pathname} ha lo \itindex{sticky~bit}
1679     \textit{sticky bit} e non si è il proprietario o non si hanno privilegi
1680     amministrativi. 
1681   \end{errlist} ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
1682   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EROFS} nel loro
1683   significato generico.}
1684 \end{funcproto}
1685
1686 \footnotetext{questa funzione su Linux ha alcune peculiarità nei codici di
1687   errore, in particolare riguardo la rimozione delle directory che non è mai
1688   permessa e che causa l'errore \errcode{EISDIR}; questo è un valore specifico
1689   di Linux non conforme allo standard POSIX che prescrive invece l'uso di
1690   \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
1691   abbia privilegi sufficienti, valore che invece Linux usa anche se il
1692   filesystem non supporta la funzione, inoltre il codice \errcode{EBUSY} nel
1693   caso la directory sia occupata su Linux non esiste.}
1694
1695 La funzione elimina il nome specificato dall'argomento \param{pathname} nella
1696 directory che lo contiene e decrementa il numero di riferimenti nel relativo
1697 \itindex{inode} \textit{inode}.\footnote{come per \func{link} queste due
1698   operazioni sono effettuate all'interno della \textit{system call} in maniera
1699   atomica.} Nel caso di socket, fifo o file di dispositivo
1700 \index{file!di~dispositivo} rimuove il nome, ma come per i file normali i
1701 processi che hanno aperto uno di questi oggetti possono continuare ad
1702 utilizzarli.  Nel caso di cancellazione di un collegamento simbolico, che
1703 consiste solo nel rimando ad un altro file, questo viene immediatamente
1704 eliminato.
1705
1706 Per cancellare una voce in una directory è necessario avere il permesso di
1707 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
1708 il diritto di esecuzione/attraversamento sulla directory che la contiene
1709 (affronteremo in dettaglio l'argomento dei permessi di file e directory in
1710 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
1711 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
1712 occorrerà anche essere proprietari del file o proprietari della directory o
1713 avere i privilegi di amministratore.
1714
1715 Si ricordi inoltre che anche se se ne è rimosso il nome da una directory, un
1716 file non viene eliminato dal disco fintanto che tutti i riferimenti ad esso
1717 sono stati cancellati: solo quando il numero di collegamenti mantenuto
1718 \itindex{inode} nell'\textit{inode} diventa nullo, questo viene disallocato e
1719 lo spazio occupato su disco viene liberato. Si tenga presente comunque che a
1720 questo si aggiunge sempre un'ulteriore condizione e cioè che non ci siano
1721 processi che abbiano il suddetto file aperto.\footnote{come vedremo in
1722   sez.~\ref{sec:file_unix_interface} il kernel mantiene anche una tabella dei
1723   file aperti nei vari processi, che a sua volta contiene i riferimenti agli
1724   \itindex{inode} \textit{inode} ad essi relativi; prima di procedere alla
1725   cancellazione dello spazio occupato su disco dal contenuto di un file il
1726   kernel controlla anche questa tabella, per verificare che anche in essa non
1727   ci sia più nessun riferimento all'\textit{inode} in questione.}
1728
1729 Questa caratteristica del sistema può essere usata per essere sicuri di non
1730 lasciare file temporanei su disco in caso di crash di un programma. La tecnica
1731 è quella di aprire un nuovo file e chiamare \func{unlink} su di esso subito
1732 dopo, in questo modo il contenuto del file sarà sempre disponibile all'interno
1733 del processo attraverso il suo file descriptor (vedi sez.~\ref{sec:file_fd}),
1734 ma non ne resta traccia in nessuna directory, e lo spazio occupato su disco
1735 viene immediatamente rilasciato alla conclusione del processo, quando tutti i
1736 file vengono chiusi.
1737
1738 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
1739 la funzione \func{unlink} sulle directory, nel qual caso si otterrebbe un
1740 errore di \errcode{EISDIR}. Per cancellare una directory si deve usare la
1741 apposita funzione di sistema \func{rmdir} (che vedremo in
1742 sez.~\ref{sec:file_dir_creat_rem}), oppure la funzione \func{remove}.
1743 Quest'ultima è la funzione prevista dallo standard ANSI C per effettuare una
1744 cancellazione generica di un file o di una directory e funziona anche per i
1745 sistemi operativo che non supportano gli \textit{hard link}. Nei sistemi
1746 unix-like \funcd{remove} è equivalente ad usare in maniera trasparente
1747 \func{unlink} per i file ed \func{rmdir} per le directory; il suo prototipo è:
1748
1749 \begin{funcproto}{
1750 \fhead{stdio.h}
1751 \fdecl{int remove(const char *pathname)}
1752 \fdesc{Cancella un file o una directory.} 
1753 }
1754 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1755   caso \var{errno} assumerà uno dei valori relativi alla chiamata utilizzata,
1756   pertanto si può fare riferimento a quanto illustrato nelle descrizioni di
1757   \func{unlink} e \func{rmdir}.}
1758 \end{funcproto}
1759
1760 La funzione utilizza la funzione \func{unlink} per cancellare i file e la
1761 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}) per cancellare
1762 le directory.\footnote{questo vale usando la \acr{glibc}; nella libc4 e nella
1763   libc5 la funzione \func{remove} era un semplice alias alla funzione
1764   \func{unlink} e quindi non poteva essere usata per le directory.} Si tenga
1765 presente che per alcune implementazioni del protocollo NFS utilizzare questa
1766 funzione può comportare la scomparsa di file ancora in uso.
1767
1768 Infine per cambiare nome ad un file o a una directory si usa la funzione di
1769 sistema \funcd{rename},\footnote{la funzione è definita dallo standard ANSI C,
1770   ma si applica solo per i file, lo standard POSIX estende la funzione anche
1771   alle directory.} il cui prototipo è:
1772
1773 \begin{funcproto}{
1774 \fhead{stdio.h}
1775 \fdecl{int rename(const char *oldpath, const char *newpath)}
1776 \fdesc{Rinomina un file o una directory.} 
1777 }
1778 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1779   nel qual caso \var{errno} assumerà uno dei valori: 
1780   \begin{errlist}
1781   \item[\errcode{EACCESS}] non c'è permesso di scrivere nelle directory
1782     contenenti \param{oldpath} e \param{newpath} o di attraversare 
1783     quelle dei loro \textit{pathname} o di scrivere su \param{newpath}
1784     se questa è una directory.
1785   \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
1786     parte di qualche processo (come \index{directory~di~lavoro} directory di
1787     lavoro o come radice) o del sistema (come \itindex{mount~point}
1788     \textit{mount point}) ed il sistema non riesce a risolvere la situazione.
1789   \item[\errcode{EEXIST}] \param{newpath} è una directory già esistente e
1790     non è vuota (anche \errcode{ENOTEMPTY}).
1791   \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
1792     \param{oldpath} o più in generale si è cercato di creare una directory come
1793     sotto-directory di sé stessa.
1794   \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
1795     \param{oldpath} non è una directory.
1796   \item[\errcode{ENOTDIR}] uno dei componenti dei \textit{pathname} non è una
1797     directory o \param{oldpath} è una directory e 
1798     \param{newpath} esiste e non è una directory.
1799   \item[\errval{EPERM}] la directory contenente \param{oldpath} o quella
1800     contenente un \param{newpath} esistente hanno lo
1801     \itindex{sticky~bit} \textit{sticky bit} e non si è i proprietari dei
1802     rispettivi file (o non si hanno privilegi amministrativi) oppure il
1803     filesystem non supporta l'operazione. 
1804   \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
1805     stesso filesystem e sotto lo stesso \itindex{mount~point} \textit{mount
1806       point}. 
1807   \end{errlist} ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{EMLINK},
1808   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOSPC} e
1809   \errval{EROFS} nel loro significato generico.}
1810 \end{funcproto}
1811
1812 La funzione rinomina in \param{newpath} il file o la directory indicati
1813 dall'argomento \param{oldpath}. Il nome viene eliminato nella directory
1814 originale e ricreato nella directory di destinazione mantenendo il riferimento
1815 allo stesso \itindex{inode} \textit{inode}. Non viene spostato nessun dato e
1816 \itindex{inode} l'\textit{inode} del file non subisce nessuna modifica in
1817 quanto le modifiche sono eseguite sulle directory che
1818 contengono \param{newpath} ed \param{oldpath}.
1819
1820 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
1821 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
1822 c'è modifica, per quanto temporanea, al \textit{link count} del file e non può
1823 esistere un istante in cui un altro processo possa trovare attivi entrambi i
1824 nomi per lo stesso file se la destinazione non esiste o in cui questa sparisca
1825 temporaneamente se già esiste.
1826
1827 Dato che opera in maniera analoga la funzione è soggetta alle stesse
1828 restrizioni di \func{link}, quindi è necessario che \param{oldpath}
1829 e \param{newpath} siano nello stesso filesystem e facciano riferimento allo
1830 stesso \itindex{mount~point} \textit{mount point}, e che il filesystem
1831 supporti questo tipo di operazione. Qualora questo non avvenga si dovrà
1832 effettuare l'operazione in maniera non atomica copiando il file a destinazione
1833 e poi cancellando l'originale.
1834
1835 Il comportamento della funzione è diverso a seconda che si voglia rinominare
1836 un file o una directory. Se ci riferisce ad un file allora \param{newpath}, se
1837 esiste, non deve essere una directory, altrimenti si avrà un errore di
1838 \errcode{EISDIR}. Se \param{newpath} indica un file già esistente questo verrà
1839 rimpiazzato atomicamente, ma nel caso in cui \func{rename} fallisca il kernel
1840 assicura che esso non sarà toccato. I caso di sovrascrittura però potrà
1841 esistere una breve finestra di tempo in cui sia \param{oldpath}
1842 che \param{newpath} potranno fare entrambi riferimento al file che viene
1843 rinominato.
1844
1845 Se \param{oldpath} è una directory allora \param{newpath}, se esistente, deve
1846 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
1847 (se non è una directory) o \errcode{ENOTEMPTY} o \errcode{EEXIST} (se non è
1848 vuota). Chiaramente \param{newpath} non potrà contenere \param{oldpath} nel
1849 suo \textit{pathname}, non essendo possibile rendere una directory una
1850 sottodirectory di sé stessa, se questo fosse il caso si otterrebbe un errore
1851 di \errcode{EINVAL}.
1852
1853 Se \param{oldpath} si riferisce ad un collegamento simbolico questo sarà
1854 rinominato restando tale senza nessun effetto sul file a cui fa riferimento.
1855 Se invece \param{newpath} esiste ed è un collegamento simbolico verrà
1856 cancellato come qualunque altro file.  Infine qualora \param{oldpath}
1857 e \param{newpath} siano due nomi che già fanno riferimento allo stesso file lo
1858 standard POSIX prevede che la funzione non ritorni un errore, e semplicemente
1859 non faccia nulla, lasciando entrambi i nomi.  Linux segue questo standard,
1860 anche se, come fatto notare dal manuale della \acr{glibc}, il comportamento
1861 più ragionevole sarebbe quello di cancellare \param{oldpath}.
1862
1863 In tutti i casi si dovranno avere i permessi di scrittura nelle directory
1864 contenenti \param{oldpath} e \param{newpath}, e nel caso \param{newpath} sia
1865 una directory vuota già esistente anche su di essa (perché dovrà essere
1866 aggiornata la voce ``\texttt{..}''). Se poi le directory
1867 contenenti \param{oldpath} o \param{newpath} hanno lo \itindex{sticky~bit}
1868 \textit{sticky bit} attivo (vedi sez.~\ref{sec:file_special_perm}) si dovrà
1869 essere i proprietari dei file (o delle directory) che si vogliono rinominare,
1870 o avere i permessi di amministratore.
1871
1872
1873 \subsection{La creazione e la cancellazione delle directory} 
1874 \label{sec:file_dir_creat_rem}
1875
1876 Benché in sostanza le directory non siano altro che dei file contenenti
1877 elenchi di nomi con riferimenti ai rispettivi \itindex{inode} \textit{inode},
1878 non è possibile trattarle come file ordinari e devono essere create
1879 direttamente dal kernel attraverso una opportuna \textit{system
1880   call}.\footnote{questo è quello che permette anche, attraverso l'uso del
1881   \itindex{Virtual~File~System} VFS, l'utilizzo di diversi formati per la
1882   gestione dei suddetti elenchi, dalle semplici liste a strutture complesse
1883   come alberi binari, hash, ecc. che consentono una ricerca veloce quando il
1884   numero di file è molto grande.}  La funzione di sistema usata per creare una
1885 directory è \funcd{mkdir}, ed il suo prototipo è:
1886
1887 \begin{funcproto}{
1888 \fhead{sys/stat.h}
1889 \fhead{sys/types.h}
1890 \fdecl{int mkdir(const char *dirname, mode\_t mode)}
1891 \fdesc{Crea una nuova directory.} 
1892 }
1893 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1894   caso \var{errno} assumerà uno dei valori: 
1895   \begin{errlist}
1896   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
1897     cui si vuole inserire la nuova directory o di attraversamento per le
1898     directory al di sopra di essa.
1899   \item[\errcode{EEXIST}] un file o una directory o un collegamento simbolico
1900     con quel nome esiste già.
1901   \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
1902     directory contiene troppi file; sotto Linux questo normalmente non avviene
1903     perché il filesystem standard consente la creazione di un numero di file
1904     maggiore di quelli che possono essere contenuti nel disco, ma potendo
1905     avere a che fare anche con filesystem di altri sistemi questo errore può
1906     presentarsi.
1907   \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
1908     la nuova directory o si è esaurita la quota disco dell'utente.
1909   \end{errlist}
1910   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
1911   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EPERM},
1912   \errval{EROFS} nel loro significato generico.}
1913 \end{funcproto}
1914
1915 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
1916 standard presenti in ogni directory (``\file{.}'' e ``\file{..}''), con il
1917 nome indicato dall'argomento \param{dirname}. 
1918
1919 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
1920 directory viene creata sono specificati dall'argomento \param{mode}, i cui
1921 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
1922 tenga presente che questi sono modificati dalla maschera di creazione dei file
1923 (si veda sez.~\ref{sec:file_perm_management}).  La titolarità della nuova
1924 directory è impostata secondo quanto illustrato in
1925 sez.~\ref{sec:file_ownership_management}.
1926
1927 Come accennato in precedenza per eseguire la cancellazione di una directory è
1928 necessaria una specifica funzione di sistema, \funcd{rmdir}, il suo prototipo
1929 è:
1930
1931 \begin{funcproto}{
1932 \fhead{sys/stat.h}
1933 \fdecl{int rmdir(const char *dirname)}
1934 \fdesc{Cancella una directory.} 
1935 }
1936 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1937   caso \var{errno} assumerà uno dei valori: 
1938   \begin{errlist}
1939   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
1940     che contiene la directory che si vuole cancellare, o non c'è il permesso
1941     di attraversare (esecuzione) una delle directory specificate in
1942     \param{dirname}.
1943   \item[\errcode{EBUSY}] la directory specificata è la
1944     \index{directory~di~lavoro} directory di lavoro o la radice di qualche
1945     processo o un \itindex{mount~point} \textit{mount point}.
1946   \item[\errcode{EINVAL}] si è usato ``\texttt{.}'' come ultimo componente
1947     di \param{dirname}.
1948   \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
1949     directory, oppure la directory che contiene \param{dirname} ha lo
1950     \itindex{sticky~bit} \textit{sticky bit} impostato e non si è i
1951     proprietari della directory o non si hanno privilegi amministrativi. 
1952   \end{errlist}
1953   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
1954   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errcode{ENOTEMPTY} e
1955   \errval{EROFS} nel loro significato generico.}
1956 \end{funcproto}
1957
1958
1959 La funzione cancella la directory \param{dirname}, che deve essere vuota, la
1960 directory deve cioè contenere le due voci standard ``\file{.}'' e
1961 ``\file{..}'' e niente altro.  Il nome può essere indicato con un
1962 \textit{pathname} assoluto o relativo, ma si deve fare riferimento al nome
1963 nella directory genitrice, questo significa che \textit{pathname} terminanti
1964 in ``\file{.}'' e ``\file{..}'' anche se validi in altri contesti, causeranno
1965 il fallimento della funzione.
1966
1967 Se la directory cancellata risultasse aperta in qualche processo per una
1968 lettura dei suoi contenuti (vedi sez.~\ref{sec:file_dir_read}), pur
1969 scomparendo dal filesystem e non essendo più possibile accedervi o crearvi
1970 altri file, le risorse ad essa associate verrebbero disallocate solo alla
1971 chiusura di tutti questi ulteriori riferimenti.
1972
1973
1974 \subsection{Lettura e scansione delle directory}
1975 \label{sec:file_dir_read}
1976
1977 Benché le directory alla fine non siano altro che dei file che contengono
1978 delle liste di nomi associati ai relativi \itindex{inode} \textit{inode}, per
1979 il ruolo che rivestono nella struttura del sistema non possono essere trattate
1980 come dei normali file di dati. Ad esempio, onde evitare inconsistenze
1981 all'interno del filesystem, solo il kernel può scrivere il contenuto di una
1982 directory, e non può essere un processo a inserirvi direttamente delle voci
1983 con le usuali funzioni di scrittura.
1984
1985 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
1986 kernel, sono molte le situazioni in cui i processi necessitano di poterne
1987 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
1988 in sez.~\ref{sec:file_open_close} che è possibile aprire una directory come se
1989 fosse un file, anche se solo in sola lettura) in generale il formato con cui
1990 esse sono scritte può dipendere dal tipo di filesystem, tanto che, come
1991 riportato in tab.~\ref{tab:file_file_operations}, il
1992 \itindex{Virtual~File~System} VFS prevede una apposita funzione per la lettura
1993 delle directory.
1994
1995 \itindbeg{directory~stream}
1996
1997 Tutto questo si riflette nello standard POSIX\footnote{le funzioni erano
1998   presenti in SVr4 e 4.3BSD, la loro specifica è riportata in POSIX.1-2001.}
1999 che ha introdotto una apposita interfaccia per la lettura delle directory,
2000 basata sui cosiddetti \textit{directory stream}, chiamati così per l'analogia
2001 con i \textit{file stream} dell'interfaccia standard ANSI C che vedremo in
2002 sez.~\ref{sec:files_std_interface}. La prima funzione di questa interfaccia è
2003 \funcd{opendir}, il cui prototipo è:
2004
2005 \begin{funcproto}{
2006 \fhead{sys/types.h}
2007 \fhead{dirent.h}
2008 \fdecl{DIR *opendir(const char *dirname)}
2009 \fdesc{Apre un \textit{directory stream}.} 
2010 }
2011 {La funzione ritorna un puntatore al \textit{directory stream} in caso di
2012   successo e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
2013   dei valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
2014   \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR} nel loro significato
2015   generico.}
2016 \end{funcproto}
2017
2018 La funzione apre un \textit{directory stream} per la directory
2019 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
2020 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
2021 \textit{directory stream}) da usare per tutte le operazioni successive, la
2022 funzione inoltre posiziona lo \textit{stream} sulla prima voce contenuta nella
2023 directory.
2024
2025 Si tenga presente che comunque la funzione opera associando il
2026 \textit{directory stream} ad un opportuno file descriptor sottostante, sul
2027 quale vengono compiute le operazioni. Questo viene sempre aperto impostando il
2028 flag di \itindex{close-on-exec} \textit{close-on-exec} (si ricordi quanto
2029 detto in sez.~\ref{sec:proc_exec}), così da evitare che resti aperto in caso
2030 di esecuzione di un altro programma.
2031
2032 Nel caso in cui sia necessario conoscere il \textit{file descriptor} associato
2033 ad un \textit{directory stream} si può usare la funzione
2034 \funcd{dirfd},\footnote{questa funzione è una estensione introdotta con BSD
2035   4.3-Reno ed è presente in Linux con le libc5 (a partire dalla versione
2036   5.1.2) e con la \acr{glibc} ma non presente in POSIX fino alla revisione
2037   POSIX.1-2008, per questo per poterla utilizzare fino alla versione 2.10
2038   della \acr{glibc} era necessario definire le macro \macro{\_BSD\_SOURCE} o
2039   \macro{\_SVID\_SOURCE}, dalla versione 2.10 si possono usare anche
2040   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o
2041   \texttt{\macro{\_XOPEN\_SOURCE} >= 700}.}  il cui prototipo è:
2042
2043 \begin{funcproto}{
2044 \fhead{sys/types.h}
2045 \fhead{dirent.h}
2046 \fdecl{int dirfd(DIR *dir)}
2047 \fdesc{Legge il file descriptor associato ad un \textit{directory stream}.} 
2048 }
2049 {La funzione ritorna un valore positivo corrispondente al file descriptor in
2050   caso di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà
2051   uno dei valori:
2052   \begin{errlist}
2053   \item[\errcode{EINVAL}] \param{dir} non è un puntatore ad un
2054     \textit{directory stream}. 
2055   \item[\errcode{ENOTSUP}] l'implementazione non supporta l'uso di un file
2056     descriptor per la directory.
2057   \end{errlist}
2058 }
2059 \end{funcproto}
2060
2061 La funzione restituisce il file descriptor associato al \textit{directory
2062   stream} \param{dir}. Di solito si utilizza questa funzione in abbinamento a
2063 funzioni che operano sui file descriptor, ad esempio si potrà usare
2064 \func{fstat} per ottenere le proprietà della directory, o \func{fchdir} per
2065 spostare su di essa la \index{directory~di~lavoro} directory di lavoro (vedi
2066 sez.~\ref{sec:file_work_dir}).
2067
2068 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
2069 possibile associarvi un \textit{directory stream} con la funzione
2070 \funcd{fdopendir},\footnote{questa funzione è però disponibile solo a partire
2071   dalla versione 2.4 della \acr{glibc}, ed è stata introdotta nello standard
2072   POSIX solo a partire dalla revisione POSIX.1-2008, prima della versione 2.10
2073   della \acr{glibc} per poterla utilizzare era necessario definire la macro
2074   \macro{\_GNU\_SOURCE}, dalla versione 2.10 si possono usare anche
2075   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o \texttt{\_XOPEN\_SOURCE >=
2076     700} .}  il cui prototipo è:
2077
2078 \begin{funcproto}{
2079 \fhead{sys/types.h}
2080 \fhead{dirent.h}
2081 \fdecl{DIR *fdopendir(int fd)}
2082 \fdesc{Associa un \textit{directory stream} ad un file descriptor.} 
2083 }
2084 {La funzione ritorna un puntatore al \textit{directory stream} in caso di
2085   successo e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
2086   dei valori \errval{EBADF} o \errval{ENOMEM} nel loro significato generico.}
2087 \end{funcproto}
2088
2089 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
2090   stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
2091 stato aperto in precedenza; la funzione darà un errore qualora questo non
2092 corrisponda ad una directory. L'uso di questa funzione permette di rispondere
2093 agli stessi requisiti delle funzioni ``\textit{at}'' che vedremo in
2094 sez.~\ref{sec:file_openat}.
2095
2096 Una volta utilizzata il file descriptor verrà usato internamente dalle
2097 funzioni che operano sul \textit{directory stream} e non dovrà essere più
2098 utilizzato all'interno del proprio programma. In particolare dovrà essere
2099 chiuso attraverso il \textit{directory stream} con \func{closedir} e non
2100 direttamente. Si tenga presente inoltre che \func{fdopendir} non modifica lo
2101 stato di un eventuale flag di \itindex{close-on-exec} \textit{close-on-exec},
2102 che pertanto dovrà essere impostato esplicitamente in fase di apertura del
2103 file descriptor.
2104
2105 Una volta che si sia aperto un \textit{directory stream} la lettura del
2106 contenuto della directory viene effettuata attraverso la funzione
2107 \funcd{readdir}, il cui prototipo è:
2108
2109 \begin{funcproto}{
2110 \fhead{sys/types.h}
2111 \fhead{dirent.h}
2112 \fdecl{struct dirent *readdir(DIR *dir)}
2113 \fdesc{Legge una voce dal \textit{directory stream}.} 
2114 }
2115 {La funzione ritorna il puntatore alla struttura contenente i dati in caso di
2116   successo e \val{NULL} per un errore o se si è raggiunta la fine dello
2117   \textit{stream}. Il solo codice di errore restituito in \var{errno} è
2118   \errval{EBADF} qualora \param{dir} non indichi un \textit{directory stream}
2119   valido.}
2120 \end{funcproto}
2121
2122 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
2123 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
2124 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
2125 esaurite tutte le voci in essa presenti, che viene segnalata dalla
2126 restituzione di \val{NULL} come valore di ritorno. Si può distinguere questa
2127 condizione da un errore in quanto in questo caso \var{errno} non verrebbe
2128 modificata.
2129
2130 I dati letti da \func{readdir} vengono memorizzati in una struttura
2131 \struct{dirent}, la cui definizione è riportata in
2132 fig.~\ref{fig:file_dirent_struct}.\footnote{la definizione è quella usata da
2133   Linux, che si trova nel file \file{/usr/include/bits/dirent.h}, essa non
2134   contempla la presenza del campo \var{d\_namlen} che indica la lunghezza del
2135   nome del file.} La funzione non è rientrante e restituisce il puntatore ad
2136 una struttura allocata staticamente, che viene sovrascritta tutte le volte che
2137 si ripete la lettura di una voce sullo stesso \textit{directory stream}.
2138
2139 Di questa funzione esiste anche una versione \index{funzioni!rientranti}
2140 rientrante, \funcd{readdir\_r},\footnote{per usarla è necessario definire una
2141   qualunque delle macro \texttt{\macro{\_POSIX\_C\_SOURCE} >= 1},
2142   \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
2143   \macro{\_POSIX\_SOURCE}.} che non usa una struttura allocata staticamente, e
2144 può essere utilizzata anche con i \itindex{thread} \textit{thread}, il suo
2145 prototipo è:
2146
2147 \begin{funcproto}{
2148 \fhead{sys/types.h}
2149 \fhead{dirent.h}
2150 \fdecl{int readdir\_r(DIR *dir, struct dirent *entry, struct dirent **result)}
2151 \fdesc{Legge una voce dal \textit{directory stream}.} 
2152 }
2153 {La funzione ritorna $0$ in caso di successo ed un numero positivo per un
2154   errore, nel qual caso \var{errno} assumerà gli stessi valori di
2155   \func{readdir}.} 
2156 \end{funcproto}
2157
2158 La funzione restituisce in \param{result} come \itindex{value~result~argument}
2159 \textit{value result argument} l'indirizzo della struttura \struct{dirent}
2160 dove sono stati salvati i dati, che deve essere allocata dal chiamante, ed il
2161 cui indirizzo deve essere indicato con l'argomento \param{entry}.  Se si è
2162 raggiunta la fine del \textit{directory stream} invece in \param{result} viene
2163 restituito il valore \val{NULL}.
2164
2165 \begin{figure}[!htb]
2166   \footnotesize \centering
2167   \begin{minipage}[c]{0.8\textwidth}
2168     \includestruct{listati/dirent.c}
2169   \end{minipage} 
2170   \normalsize 
2171   \caption{La struttura \structd{dirent} per la lettura delle informazioni dei 
2172     file.}
2173   \label{fig:file_dirent_struct}
2174 \end{figure}
2175
2176 % Lo spazio per la \struct{dirent} dove vengono restituiti i dati della
2177 % directory deve essere allocato a cura del chiamante, dato che la dimensione
2178
2179
2180 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
2181 presenti nella directory. Sia BSD che SVr4 che POSIX.1-2001\footnote{il
2182   vecchio standard POSIX prevedeva invece solo la presenza del campo
2183   \var{d\_fileno}, identico \var{d\_ino}, che in Linux era definito come alias
2184   di quest'ultimo, mentre il campo \var{d\_name} era considerato dipendente
2185   dall'implementazione.}  prevedono che siano sempre presenti il campo
2186 \var{d\_name}, che contiene il nome del file nella forma di una stringa
2187 terminata da uno zero, ed il campo \var{d\_ino}, che contiene il numero di
2188 \itindex{inode} \textit{inode} cui il file è associato e corrisponde al campo
2189 \var{st\_ino} di \struct{stat}.  La presenza di ulteriori campi opzionali
2190 oltre i due citati è segnalata dalla definizione di altrettante macro nella
2191 forma \code{\_DIRENT\_HAVE\_D\_XXX} dove \code{XXX} è il nome del relativo
2192 campo. Come si può evincere da fig.~\ref{fig:file_dirent_struct} nel caso di
2193 Linux sono pertanto definite le macro \macro{\_DIRENT\_HAVE\_D\_TYPE},
2194 \macro{\_DIRENT\_HAVE\_D\_OFF} e \macro{\_DIRENT\_HAVE\_D\_RECLEN}, mentre non
2195 è definita la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN}.
2196
2197 Dato che possono essere presenti campi opzionali e che lo standard
2198 POSIX.1-2001 non specifica una dimensione definita per il nome dei file (che
2199 può variare a seconda del filesystem), ma solo un limite superiore pari a
2200 \const{NAME\_MAX} (vedi tab.~\ref{tab:sys_file_macro}), in generale per
2201 allocare una struttura \struct{dirent} in maniera portabile occorre eseguire
2202 un calcolo per ottenere le dimensioni appropriate per il proprio
2203 sistema.\footnote{in SVr4 la lunghezza del campo è definita come
2204   \code{NAME\_MAX+1} che di norma porta al valore di 256 byte usato anche in
2205   fig.~\ref{fig:file_dirent_struct}.} Lo standard però richiede che il campo
2206 \var{d\_name} sia sempre l'ultimo della struttura, questo ci consente di
2207 ottenere la dimensione della prima parte con la macro di utilità generica
2208 \macro{offsetof}, che si può usare con il seguente prototipo:
2209
2210 {\centering
2211 \vspace{3pt}
2212 \begin{funcbox}{
2213 \fhead{stddef.h}
2214 \fdecl{size\_t \macro{offsetof}(type, member)}
2215 \fdesc{Restituisce la posizione del campo \param{member} nella
2216   struttura \param{type}.}
2217
2218 \end{funcbox}
2219 }
2220
2221 Ottenuta allora con \code{offsetof(struct dirent, d\_name)} la dimensione
2222 della parte iniziale della struttura, basterà sommarci la dimensione massima
2223 dei nomi dei file nel filesystem che si sta usando, che si può ottenere
2224 attraverso la funzione \func{pathconf} (per la quale si rimanda a
2225 sez.~\ref{sec:sys_file_limits}) più un ulteriore carattere per la terminazione
2226 della stringa.
2227
2228 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
2229 indica il tipo di file (se fifo, directory, collegamento simbolico, ecc.), e
2230 consente di evitare una successiva chiamata a \func{lstat} (vedi
2231 sez.~\ref{sec:file_stat}) per determinarlo. I suoi possibili valori sono
2232 riportati in tab.~\ref{tab:file_dtype_macro}. Si tenga presente che questo
2233 valore è disponibile solo per i filesystem che ne supportano la restituzione
2234 (fra questi i più noti sono \textsl{btrfs}, \textsl{ext2}, \textsl{ext3}, e
2235 \textsl{ext4}), per gli altri si otterrà sempre il valore
2236 \const{DT\_UNKNOWN}.\footnote{inoltre fino alla versione 2.1 della
2237   \acr{glibc}, pur essendo il campo \var{d\_type} presente, il suo uso non era
2238   implementato, e veniva restituito comunque il valore \const{DT\_UNKNOWN}.}
2239
2240 \begin{table}[htb]
2241   \centering
2242   \footnotesize
2243   \begin{tabular}[c]{|l|l|}
2244     \hline
2245     \textbf{Valore} & \textbf{Tipo di file} \\
2246     \hline
2247     \hline
2248     \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
2249     \const{DT\_REG}     & File normale.\\
2250     \const{DT\_DIR}     & Directory.\\
2251     \const{DT\_LNK}     & Collegamento simbolico.\\
2252     \const{DT\_FIFO}    & Fifo.\\
2253     \const{DT\_SOCK}    & Socket.\\
2254     \const{DT\_CHR}     & Dispositivo a caratteri.\\
2255     \const{DT\_BLK}     & Dispositivo a blocchi.\\
2256     \hline    
2257   \end{tabular}
2258   \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
2259     della struttura \struct{dirent}.}
2260   \label{tab:file_dtype_macro}
2261 \end{table}
2262
2263 Per la conversione da e verso l'analogo valore mantenuto dentro il campo
2264 \var{st\_mode} di \struct{stat} (vedi fig.~\ref{fig:file_stat_struct}) sono
2265 definite anche due macro di conversione, \macro{IFTODT} e \macro{DTTOIF}:
2266
2267 {\centering
2268 \vspace{3pt}
2269 \begin{funcbox}{
2270 \fhead{dirent.h}
2271 \fdecl{int \macro{IFTODT}(mode\_t MODE)}
2272 \fdesc{Converte il tipo di file dal formato di \var{st\_mode} a quello di
2273   \var{d\_type}.}
2274 \fdecl{mode\_t \macro{DTTOIF}(int DTYPE)}
2275 \fdesc{Converte il tipo di file dal formato di \var{d\_type} a quello di
2276   \var{st\_mode}.}  
2277
2278 \end{funcbox}
2279 }
2280
2281 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
2282 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
2283 letta. Con questi due campi diventa possibile, determinando la posizione delle
2284 varie voci, spostarsi all'interno dello \textit{stream} usando la funzione
2285 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
2286   estensioni prese da BSD, ed introdotte nello standard POSIX solo a partire
2287   dalla revisione POSIX.1-2001, per poterle utilizzare deve essere definita
2288   una delle macro \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE} o
2289   \macro{\_SVID\_SOURCE}.} il cui prototipo è:
2290
2291 \begin{funcproto}{
2292 \fhead{dirent.h}
2293 \fdecl{void seekdir(DIR *dir, off\_t offset)}
2294 \fdesc{Cambia la posizione all'interno di un \textit{directory stream}.} 
2295 }
2296 {La funzione non ritorna niente e non imposta errori.}
2297 \end{funcproto}
2298
2299 La funzione non ritorna nulla e non segnala errori, è però necessario che il
2300 valore dell'argomento \param{offset} sia valido per lo
2301 \textit{stream} \param{dir}; esso pertanto deve essere stato ottenuto o dal
2302 valore di \var{d\_off} di \struct{dirent} o dal valore restituito dalla
2303 funzione \funcd{telldir}, che legge la posizione corrente; il cui prototipo
2304 è:\footnote{prima della \acr{glibc} 2.1.1 la funzione restituiva un valore di
2305   tipo \type{off\_t}, sostituito a partire dalla versione 2.1.2 da \ctyp{long}
2306   per conformità a POSIX.1-2001.}
2307
2308 \begin{funcproto}{
2309 \fhead{dirent.h}
2310 \fdecl{long telldir(DIR *dir)}
2311 \fdesc{Ritorna la posizione corrente in un \textit{directory stream}.} 
2312 }
2313 {La funzione ritorna la posizione corrente nello \textit{stream} (un numero
2314   positivo) in caso di successo e $-1$ per un errore, nel qual caso
2315   \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
2316   valore errato per \param{dir}.  }
2317 \end{funcproto}
2318
2319 La sola funzione di posizionamento per un \textit{directory stream} prevista
2320 originariamente dallo standard POSIX è \funcd{rewinddir}, che riporta la
2321 posizione a quella iniziale; il suo prototipo è:
2322
2323 \begin{funcproto}{
2324 \fhead{sys/types.h}
2325 \fhead{dirent.h}
2326 \fdecl{void rewinddir(DIR *dir)}
2327 \fdesc{Si posiziona all'inizio di un \textit{directory stream}.} 
2328 }
2329 {La funzione non ritorna niente e non imposta errori.}
2330 \end{funcproto}
2331
2332 Una volta completate le operazioni si può chiudere il \textit{directory
2333   stream}, ed il file descriptor ad esso associato, con la funzione
2334 \funcd{closedir}, il cui prototipo è:
2335
2336 \begin{funcproto}{
2337 \fhead{sys/types.h}
2338 \fhead{dirent.h}
2339 \fdecl{int closedir(DIR *dir)}
2340 \fdesc{Chiude un \textit{directory stream}.} 
2341 }
2342 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2343   caso \var{errno} assume solo il valore \errval{EBADF}.}
2344 \end{funcproto}
2345
2346 A parte queste funzioni di base in BSD 4.3 venne introdotta un'altra funzione
2347 che permette di eseguire una scansione completa, con tanto di ricerca ed
2348 ordinamento, del contenuto di una directory; la funzione è
2349 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
2350   \acr{libc4} e richiede siano definite le macro \macro{\_BSD\_SOURCE} o
2351   \macro{\_SVID\_SOURCE}.} ed il suo prototipo è:
2352
2353 \begin{funcproto}{
2354 \fhead{dirent.h}
2355 \fdecl{int scandir(const char *dir, struct dirent ***namelist, \\
2356 \phantom{int scandir(}int(*filter)(const struct dirent *), \\
2357 \phantom{int scandir(}int(*compar)(const struct dirent **, const struct dirent **))}
2358 \fdesc{Esegue una scansione di un \textit{directory stream}.} 
2359 }
2360 {La funzione ritorna il numero di voci trovate in caso di successo e $-1$ per
2361   un errore, nel qual caso \var{errno} può assumere solo il valore
2362   \errval{ENOMEM}.}
2363 \end{funcproto}
2364
2365 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
2366 prototipo non è molto comprensibile; queste funzioni però sono quelle che
2367 controllano rispettivamente la selezione di una voce, passata con
2368 l'argomento \param{filter}, e l'ordinamento di tutte le voci selezionate,
2369 specificata dell'argomento \param{compar}.
2370
2371 La funzione legge tutte le voci della directory indicata dall'argomento
2372 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
2373 \struct{dirent}) come argomento della funzione di selezione specificata da
2374 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
2375 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
2376 Qualora si specifichi un valore \val{NULL} per l'argomento \param{filter} non
2377 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
2378
2379 Le voci selezionate possono essere riordinate tramite \funcm{qsort}, le
2380 modalità del riordinamento possono essere personalizzate usando la funzione
2381 \param{compar} come criterio di ordinamento di \funcm{qsort}, la funzione
2382 prende come argomenti le due strutture \struct{dirent} da confrontare
2383 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
2384 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
2385 \struct{dirent} viene restituito nell'argomento
2386 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
2387   restituisce, come \itindex{value~result~argument} \textit{value result
2388     argument}, l'indirizzo della stessa; questo significa che \param{namelist}
2389   deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
2390   si deve passare il suo indirizzo.}
2391
2392 \itindend{directory~stream}
2393
2394 Per l'ordinamento, vale a dire come valori possibili per l'argomento
2395 \param{compar}, sono disponibili due funzioni predefinite, \funcd{alphasort} e
2396 \funcd{versionsort}, i cui prototipi sono:
2397
2398 \begin{funcproto}{
2399 \fhead{dirent.h}
2400 \fdecl{int alphasort(const void *a, const void *b)}
2401 \fdecl{int versionsort(const void *a, const void *b)}
2402 \fdesc{Riordinano le voci di \textit{directory stream}.} 
2403 }
2404 {Le funzioni restituiscono un valore minore, uguale o maggiore di zero qualora
2405   il primo argomento sia rispettivamente minore, uguale o maggiore del secondo
2406   e non forniscono errori.}
2407 \end{funcproto}
2408
2409 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
2410 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
2411   argomenti dei puntatori a delle strutture \struct{dirent}; la glibc usa il
2412   prototipo originario di BSD, mostrato anche nella definizione, che prevede
2413   puntatori a \ctyp{void}.} e deve essere specificata come argomento
2414 \param{compar} per ottenere un ordinamento alfabetico secondo il valore del
2415 campo \var{d\_name} delle varie voci. La \acr{glibc} prevede come
2416 estensione\footnote{la \acr{glibc}, a partire dalla versione 2.1, effettua
2417   anche l'ordinamento alfabetico tenendo conto delle varie localizzazioni,
2418   usando \funcm{strcoll} al posto di \funcm{strcmp}.} anche
2419 \func{versionsort}, che ordina i nomi tenendo conto del numero di versione,
2420 cioè qualcosa per cui \texttt{file10} viene comunque dopo \texttt{file4}.
2421
2422 \begin{figure}[!htbp]
2423   \footnotesize \centering
2424   \begin{minipage}[c]{\codesamplewidth}
2425     \includecodesample{listati/my_ls.c}
2426   \end{minipage}
2427   \caption{Esempio di codice per eseguire la lista dei file contenuti in una
2428     directory.} 
2429   \label{fig:file_my_ls}
2430 \end{figure}
2431
2432 Un semplice esempio dell'uso di queste funzioni è riportato in
2433 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
2434 programma che, usando la funzione di scansione illustrata in
2435 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
2436 e la relativa dimensione, in sostanza una versione semplificata del comando
2437 \cmd{ls}.
2438
2439 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
2440 la parte di gestione delle opzioni, che prevede solo l'uso di una funzione per
2441 la stampa della sintassi, anch'essa omessa, ma il codice completo può essere
2442 trovato coi sorgenti allegati alla guida nel file \file{myls.c}.
2443
2444 In sostanza tutto quello che fa il programma, dopo aver controllato
2445 (\texttt{\small 12--15}) di avere almeno un argomento, che indicherà la
2446 directory da esaminare, è chiamare (\texttt{\small 16}) la funzione
2447 \myfunc{dir\_scan} per eseguire la scansione, usando la funzione \code{do\_ls}
2448 (\texttt{\small 22--29}) per fare tutto il lavoro.
2449
2450 Quest'ultima si limita (\texttt{\small 26}) a chiamare \func{stat} sul file
2451 indicato dalla directory entry passata come argomento (il cui nome è appunto
2452 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
2453 dati ad esso relativi, per poi provvedere (\texttt{\small 27}) a stampare il
2454 nome del file e la dimensione riportata in \var{data}.
2455
2456 Dato che la funzione verrà chiamata all'interno di \myfunc{dir\_scan} per ogni
2457 voce presente questo è sufficiente a stampare la lista completa dei file e
2458 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
2459 valore di ritorno per indicare una esecuzione senza errori.
2460
2461 \begin{figure}[!htbp]
2462   \footnotesize \centering
2463   \begin{minipage}[c]{\codesamplewidth}
2464     \includecodesample{listati/dir_scan.c}
2465   \end{minipage}
2466   \caption{Codice della funzione di scansione di una directory contenuta nel
2467     file \file{dir\_scan.c}.} 
2468   \label{fig:file_dirscan}
2469 \end{figure}
2470
2471 Tutto il grosso del lavoro è svolto dalla funzione \myfunc{dir\_scan},
2472 riportata in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e
2473 permette di eseguire una funzione, passata come secondo argomento, su tutte le
2474 voci di una directory.  La funzione inizia con l'aprire (\texttt{\small
2475   18--22}) uno \textit{stream} sulla directory passata come primo argomento,
2476 stampando un messaggio in caso di errore.
2477
2478 Il passo successivo (\texttt{\small 23--24}) è cambiare
2479 \index{directory~di~lavoro} directory di lavoro (vedi
2480 sez.~\ref{sec:file_work_dir}), usando in sequenza le funzioni \func{dirfd} e
2481 \func{fchdir} (in realtà si sarebbe potuto usare direttamente \func{chdir} su
2482 \var{dirname}), in modo che durante il successivo ciclo (\texttt{\small
2483   26--30}) sulle singole voci dello \textit{stream} ci si trovi all'interno
2484 della directory.\footnote{questo è essenziale al funzionamento della funzione
2485   \code{do\_ls}, e ad ogni funzione che debba usare il campo \var{d\_name}, in
2486   quanto i nomi dei file memorizzati all'interno di una struttura
2487   \struct{dirent} sono sempre relativi alla directory in questione, e senza
2488   questo posizionamento non si sarebbe potuto usare \func{stat} per ottenere
2489   le dimensioni.}
2490
2491 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
2492 alla funzione passata come secondo argomento, il ciclo di scansione della
2493 directory è molto semplice; si legge una voce alla volta (\texttt{\small 26})
2494 all'interno di una istruzione di \code{while} e fintanto che si riceve una
2495 voce valida, cioè un puntatore diverso da \val{NULL}, si esegue
2496 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
2497 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
2498   28}) qualora questa presenti una anomalia, identificata da un codice di
2499 ritorno negativo. Una volta terminato il ciclo la funzione si conclude con la
2500 chiusura (\texttt{\small 32}) dello \textit{stream}\footnote{nel nostro caso,
2501   uscendo subito dopo la chiamata, questo non servirebbe, in generale però
2502   l'operazione è necessaria, dato che la funzione può essere invocata molte
2503   volte all'interno dello stesso processo, per cui non chiudere i
2504   \textit{directory stream} comporterebbe un consumo progressivo di risorse,
2505   con conseguente rischio di esaurimento delle stesse.} e la restituzione
2506 (\texttt{\small 32}) del codice di operazioni concluse con successo.
2507
2508
2509
2510 \subsection{La directory di lavoro}
2511 \label{sec:file_work_dir}
2512
2513 \index{directory~di~lavoro|(} 
2514
2515 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
2516 directory nel filesystem,\footnote{questa viene mantenuta all'interno dei dati
2517   della sua \kstruct{task\_struct} (vedi fig.~\ref{fig:proc_task_struct}), più
2518   precisamente nel campo \texttt{pwd} della sotto-struttura
2519   \kstruct{fs\_struct}.} che è chiamata \textsl{directory corrente} o
2520 \textsl{directory di lavoro} (in inglese \textit{current working directory}).
2521 La directory di lavoro è quella da cui si parte quando un
2522 \itindsub{pathname}{relativo} \textit{pathname} è espresso in forma relativa,
2523 dove il ``\textsl{relativa}'' fa riferimento appunto a questa directory.
2524
2525 Quando un utente effettua il login, questa directory viene impostata alla
2526 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
2527 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
2528 comando \cmd{pwd} la stampa sul terminale.  Siccome la directory di lavoro
2529 resta la stessa quando viene creato un processo figlio (vedi
2530 sez.~\ref{sec:proc_fork}), la directory di lavoro della shell diventa anche la
2531 directory di lavoro di qualunque comando da essa lanciato.
2532
2533 Dato che è il kernel che tiene traccia per ciascun processo \itindex{inode}
2534 dell'\textit{inode} della directory di lavoro, per ottenerne il
2535 \textit{pathname} occorre usare una apposita funzione,
2536 \funcd{getcwd},\footnote{con Linux \func{getcwd} è una \textit{system call}
2537   dalla versione 2.1.9, in precedenza il valore doveva essere ottenuto tramite
2538   il filesystem \texttt{/proc} da \procfile{/proc/self/cwd}.} il cui prototipo
2539 è:
2540
2541 \begin{funcproto}{
2542 \fhead{unistd.h}
2543 \fdecl{char *getcwd(char *buffer, size\_t size)}
2544 \fdesc{Legge il \textit{pathname} della directory di lavoro corrente.} 
2545 }
2546 {La funzione ritorna il puntatore a \param{buffer} in caso di successo e
2547   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori: 
2548   \begin{errlist}
2549   \item[\errcode{EACCES}] manca il permesso di lettura o di attraversamento  su
2550     uno dei componenti del \textit{pathname} (cioè su una delle directory
2551     superiori alla corrente).
2552   \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
2553     è nullo.
2554   \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata. 
2555   \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
2556     lunghezza del \textit{pathname}. 
2557   \end{errlist}
2558   ed inoltre \errcode{EFAULT} nel suo significato generico.}
2559 \end{funcproto}
2560
2561 La funzione restituisce il \textit{pathname} completo della directory di
2562 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
2563 precedentemente allocata, per una dimensione massima di \param{size}.  Il
2564 buffer deve essere sufficientemente largo da poter contenere il
2565 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
2566 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
2567 un errore.
2568
2569 Si può anche specificare un puntatore nullo come
2570 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
2571   supportata da Linux e dalla \acr{glibc}.} nel qual caso la stringa sarà
2572 allocata automaticamente per una dimensione pari a \param{size} qualora questa
2573 sia diversa da zero, o della lunghezza esatta del \textit{pathname}
2574 altrimenti. In questo caso ci si deve ricordare di disallocare la stringa con
2575 \func{free} una volta cessato il suo utilizzo.
2576
2577 Un uso comune di \func{getcwd} è quello di salvarsi la directory di lavoro
2578 all'avvio del programma per poi potervi tornare in un tempo successivo, un
2579 metodo alternativo più veloce, se non si è a corto di file descriptor, è
2580 invece quello di aprire all'inizio la directory corrente (vale a dire
2581 ``\texttt{.}'') e tornarvi in seguito con \func{fchdir}.
2582
2583 Di questa funzione esiste una versione alternativa per compatibilità
2584 all'indietro con BSD, \funcm{getwd}, che non prevede l'argomento \param{size}
2585 e quindi non consente di specificare la dimensione di \param{buffer} che
2586 dovrebbe essere allocato in precedenza ed avere una dimensione sufficiente
2587 (per BSD maggiore \const{PATH\_MAX}, che di solito 256 byte, vedi
2588 sez.~\ref{sec:sys_limits}). Il problema è che su Linux non esiste una
2589 dimensione superiore per la lunghezza di un \textit{pathname}, per cui non è
2590 detto che il buffer sia sufficiente a contenere il nome del file, e questa è
2591 la ragione principale per cui questa funzione è deprecata, e non la tratteremo.
2592
2593 Una seconda funzione usata per ottenere la directory di lavoro è
2594 \funcm{get\_current\_dir\_name},\footnote{la funzione è una estensione GNU e
2595   presente solo nella \acr{glibc}.} che non prende nessun argomento ed è
2596 sostanzialmente equivalente ad una \code{getcwd(NULL, 0)}, con la differenza
2597 che se disponibile essa ritorna il valore della variabile di ambiente
2598 \envvar{PWD}, che essendo costruita dalla shell può contenere un
2599 \textit{pathname} comprendente anche dei collegamenti simbolici. Usando
2600 \func{getcwd} infatti, essendo il \textit{pathname} ricavato risalendo
2601 all'indietro l'albero della directory, si perderebbe traccia di ogni passaggio
2602 attraverso eventuali collegamenti simbolici.
2603
2604 Per cambiare la directory di lavoro si può usare la funzione di sistema
2605 \funcd{chdir}, equivalente del comando di shell \cmd{cd}, il cui nome sta
2606 appunto per \textit{change directory}, il suo prototipo è:
2607
2608 \begin{funcproto}{
2609 \fhead{unistd.h}
2610 \fdecl{int chdir(const char *pathname)}
2611 \fdesc{Cambia la directory di lavoro per \textit{pathname}.} 
2612 }
2613 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2614   caso \var{errno} assumerà uno dei valori: 
2615   \begin{errlist}
2616   \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
2617     di \param{pathname}.
2618   \item[\errcode{ENOTDIR}] non si è specificata una directory.
2619   \end{errlist}
2620   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
2621   \errval{ENAMETOOLONG}, \errval{ENOENT} e \errval{ENOMEM} nel loro
2622   significato generico.}
2623 \end{funcproto}
2624
2625 La funzione cambia la directory di lavoro in \param{pathname} ed
2626 ovviamente \param{pathname} deve indicare una directory per la quale si hanno
2627 i permessi di accesso.
2628
2629 Dato che ci si può riferire ad una directory anche tramite un file descriptor,
2630 per cambiare directory di lavoro è disponibile anche la funzione di sistema
2631 \funcd{fchdir}, il cui prototipo è:
2632
2633 \begin{funcproto}{
2634 \fhead{unistd.h}
2635 \fdecl{int fchdir(int fd)}
2636 \fdesc{Cambia la directory di lavoro per file descriptor.} 
2637 }
2638 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2639   caso \var{errno} assumerà i valori \errval{EBADF} o \errval{EACCES} nel loro
2640   significato generico.}
2641 \end{funcproto}
2642
2643 La funzione è identica a \func{chdir}, ma prende come argomento un file
2644 descriptor \param{fd} invece di un \textit{pathname}. Anche in questo
2645 caso \param{fd} deve essere un file descriptor valido che fa riferimento ad
2646 una directory. Inoltre l'unico errore di accesso possibile (tutti gli altri
2647 sarebbero occorsi all'apertura di \param{fd}), è quello in cui il processo non
2648 ha il permesso di attraversamento alla directory specificata da \param{fd}.
2649
2650 \index{directory~di~lavoro|)} 
2651
2652
2653 \subsection{La creazione dei \textsl{file speciali}}
2654 \label{sec:file_mknod}
2655
2656 \index{file!di~dispositivo|(} 
2657 \index{file!speciali|(} 
2658
2659 Finora abbiamo parlato esclusivamente di file, directory e collegamenti
2660 simbolici, ma in sez.~\ref{sec:file_file_types} abbiamo visto che il sistema
2661 prevede anche degli altri tipi di file, che in genere vanno sotto il nome
2662 generico di \textsl{file speciali}, come i file di dispositivo, le fifo ed i
2663 socket.
2664
2665 La manipolazione delle caratteristiche di questi file speciali, il cambiamento
2666 di nome o la loro cancellazione può essere effettuata con le stesse funzioni
2667 che operano sugli altri file, ma quando li si devono creare sono necessarie,
2668 come per le directory, delle funzioni apposite. La prima di queste è la
2669 funzione di sistema \funcd{mknod}, il cui prototipo è:
2670
2671 \begin{funcproto}{
2672 \fhead{sys/types.h}
2673 \fhead{sys/stat.h}
2674 \fhead{fcntl.h}
2675 \fhead{unistd.h}
2676 \fdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)}
2677 \fdesc{Crea un file speciale sul filesystem.} 
2678 }
2679 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2680   caso \var{errno} assumerà uno dei valori: 
2681   \begin{errlist}
2682   \item[\errcode{EEXIST}] \param{pathname} esiste già o è un collegamento
2683     simbolico. 
2684   \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
2685     fifo, un socket o un dispositivo.
2686   \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
2687     \itindex{inode} l'\texttt{inode}, o il filesystem su cui si è cercato di
2688     creare \param{pathname} non supporta l'operazione.
2689   \end{errlist}
2690   ed inoltre \errval{EACCES}, \errval{EFAULT}, \errval{ELOOP},
2691   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOSPC},
2692   \errval{ENOTDIR} e \errval{EROFS} nel loro significato generico.}
2693 \end{funcproto}
2694
2695 La funzione permette di creare un \itindex{inode} \textit{inode} di tipo
2696 generico sul filesystem, e viene in genere utilizzata per creare i file di
2697 dispositivo, ma si può usare anche per creare qualunque tipo di file speciale
2698 ed anche file regolari. L'argomento \param{mode} specifica sia il tipo di file
2699 che si vuole creare che i relativi permessi, secondo i valori riportati in
2700 tab.~\ref{tab:file_mode_flags}, che vanno combinati con un OR aritmetico. I
2701 permessi sono comunque modificati nella maniera usuale dal valore di
2702 \itindex{umask} \textit{umask} (si veda sez.~\ref{sec:file_perm_management}).
2703
2704 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
2705 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
2706 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
2707 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
2708 per una fifo;\footnote{con Linux la funzione non può essere usata per creare
2709   directory o collegamenti simbolici, si dovranno usare le funzioni
2710   \func{mkdir} e \func{symlink} a questo dedicate.} un valore diverso
2711 comporterà l'errore \errcode{EINVAL}. Inoltre \param{pathname} non deve
2712 esistere, neanche come collegamento simbolico.
2713
2714 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
2715 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
2716 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
2717 valore verrà ignorato.  Solo l'amministratore può creare un file di
2718 dispositivo usando questa funzione (il processo deve avere la
2719 \itindex{capabilities} \textit{capability} \const{CAP\_MKNOD}), ma in
2720 Linux\footnote{questo è un comportamento specifico di Linux, la funzione non è
2721   prevista dallo standard POSIX.1 originale, mentre è presente in SVr4 e
2722   4.4BSD, ma esistono differenze nei comportamenti e nei codici di errore,
2723   tanto che questa è stata introdotta in POSIX.1-2001 con una nota che la
2724   definisce portabile solo quando viene usata per creare delle fifo, ma
2725   comunque deprecata essendo utilizzabile a tale scopo la specifica
2726   \func{mkfifo}.} l'uso per la creazione di un file ordinario, di una fifo o
2727 di un socket è consentito anche agli utenti normali.
2728
2729 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
2730 al proprietario e al gruppo del processo (usando \ids{UID} e \ids{GID} del
2731 gruppo effettivo) che li ha creati a meno non sia presente il bit \acr{sgid}
2732 per la directory o sia stata attivata la semantica BSD per il filesystem (si
2733 veda sez.~\ref{sec:file_ownership_management}) in cui si va a creare
2734 \itindex{inode} l'\textit{inode}, nel qual caso per il gruppo verrà usato il
2735 \ids{GID} del proprietario della directory.
2736
2737 Nella creazione di un file di dispositivo occorre poi specificare
2738 correttamente il valore di \param{dev}; questo infatti è di tipo
2739 \type{dev\_t}, che è un tipo primitivo (vedi
2740 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
2741 \textsl{numero} di dispositivo. Il kernel infatti identifica ciascun
2742 dispositivo con un valore numerico, originariamente questo era un intero a 16
2743 bit diviso in due parti di 8 bit chiamate rispettivamente
2744 \itindex{major~number} \textit{major number} e \itindex{minor~number}
2745 \textit{minor number}, che sono poi i due numeri mostrati dal comando
2746 \texttt{ls -l} al posto della dimensione quando lo si esegue su un file di
2747 dispositivo.
2748
2749 Il \itindex{major~number} \textit{major number} identifica una classe di
2750 dispositivi (ad esempio la seriale, o i dischi IDE) e serve in sostanza per
2751 indicare al kernel quale è il modulo che gestisce quella classe di
2752 dispositivi. Per identificare uno specifico dispositivo di quella classe (ad
2753 esempio una singola porta seriale, o uno dei dischi presenti) si usa invece il
2754 \itindex{minor~number} \textit{minor number}. L'elenco aggiornato di questi
2755 numeri con le relative corrispondenze ai vari dispositivi può essere trovato
2756 nel file \texttt{Documentation/devices.txt} allegato alla documentazione dei
2757 sorgenti del kernel.
2758
2759 Data la crescita nel numero di dispositivi supportati, ben presto il limite
2760 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
2761 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
2762 \type{dev\_t}, con delle dimensioni passate a 12 bit per il
2763 \itindex{major~number} \textit{major number} e 20 bit per il
2764 \itindex{minor~number} \textit{minor number}. La transizione però ha
2765 comportato il fatto che \type{dev\_t} è diventato un \index{tipo!opaco} tipo
2766 opaco, e la necessità di specificare il numero tramite delle opportune macro,
2767 così da non avere problemi di compatibilità con eventuali ulteriori
2768 estensioni.
2769
2770 Le macro sono definite nel file \headfile{sys/sysmacros.h},\footnote{se si usa
2771   la \acr{glibc} dalla versione 2.3.3 queste macro sono degli alias alle
2772   versioni specifiche di questa libreria, \macro{gnu\_dev\_major},
2773   \macro{gnu\_dev\_minor} e \macro{gnu\_dev\_makedev} che si possono usare
2774   direttamente, al costo di una minore portabilità.} che viene
2775 automaticamente incluso quando si include \headfile{sys/types.h}. Si possono
2776 pertanto ottenere i valori del \itindex{major~number} \textit{major number} e
2777 \itindex{minor~number} \textit{minor number} di un dispositivo rispettivamente
2778 con le macro \macro{major} e \macro{minor}:
2779
2780 {\centering
2781 \vspace{3pt}
2782 \begin{funcbox}{
2783 \fhead{sys/types.h}
2784 \fdecl{int \macro{major}(dev\_t dev)}
2785 \fdesc{Restituisce il \itindex{major~number} \textit{major number} del
2786   dispositivo \param{dev}.}
2787 \fdecl{int \macro{minor}(dev\_t dev)}
2788 \fdesc{Restituisce il \itindex{minor~number} \textit{minor number} del
2789   dispositivo \param{dev}.}  
2790
2791 \end{funcbox}
2792 }
2793
2794 \noindent mentre una volta che siano noti \itindex{major~number} \textit{major
2795   number} e \itindex{minor~number} \textit{minor number} si potrà costruire il
2796 relativo identificativo con la macro \macro{makedev}:
2797
2798 {\centering
2799 \vspace{3pt}
2800 \begin{funcbox}{
2801 \fhead{sys/types.h}
2802 \fdecl{dev\_t \macro{makedev}(int major, int minor)}
2803 \fdesc{Dati \itindex{major~number} \textit{major number} e
2804   \itindex{minor~number} \textit{minor number} restituisce l'identificativo di
2805   un dispositivo.} 
2806
2807 \end{funcbox}
2808 }
2809
2810 \index{file!di~dispositivo|)}
2811
2812 Dato che la funzione di sistema \func{mknod} presenta diverse varianti nei
2813 vari sistemi unix-like, lo standard POSIX.1-2001 la dichiara portabile solo in
2814 caso di creazione delle fifo, ma anche in questo caso alcune combinazioni
2815 degli argomenti restano non specificate, per cui nello stesso standard è stata
2816 introdotta una funzione specifica per creare una fifo deprecando l'uso di
2817 \func{mknod} a tale riguardo.  La funzione è \funcd{mkfifo} ed il suo
2818 prototipo è:
2819
2820 \begin{funcproto}{
2821 \fhead{sys/types.h}
2822 \fhead{sys/stat.h}
2823 \fdecl{int mkfifo(const char *pathname, mode\_t mode)}
2824 \fdesc{Crea una fifo.} 
2825 }
2826 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2827   caso \var{errno} assumerà \errval{EACCES}, \errval{EEXIST},
2828   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC}, \errval{ENOTDIR} e
2829   \errval{EROFS} nel loro significato generico.}
2830 \end{funcproto}
2831
2832 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
2833 per \func{mknod} il file \param{pathname} non deve esistere (neanche come
2834 collegamento simbolico); al solito i permessi specificati da \param{mode}
2835 vengono modificati dal valore di \itindex{umask} \textit{umask}.
2836
2837 \index{file!speciali|)} 
2838
2839
2840 \subsection{I file temporanei}
2841 \label{sec:file_temp_file}
2842
2843 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
2844 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
2845 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
2846 creare il file dopo aver controllato che questo non esista, nel momento fra il
2847 controllo e la creazione si ha giusto lo spazio per una possibile
2848 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
2849 sez.~\ref{sec:proc_race_cond}).
2850
2851 Molti problemi di sicurezza derivano proprio da una creazione non accorta di
2852 file temporanei che lascia aperta questa \itindex{race~condition} \textit{race
2853   condition}. Un attaccante allora potrà sfruttarla con quello che viene
2854 chiamato \itindex{symlink~attack} ``\textit{symlink attack}'' dove
2855 nell'intervallo fra la generazione di un nome e l'accesso allo stesso, viene
2856 creato un collegamento simbolico con quel nome verso un file diverso,
2857 ottenendo, se il programma sotto attacco ne ha la capacità, un accesso
2858 privilegiato.
2859
2860 La \acr{glibc} provvede varie funzioni per generare nomi di file temporanei,
2861 di cui si abbia certezza di unicità al momento della generazione; storicamente
2862 la prima di queste funzioni create a questo scopo era
2863 \funcd{tmpnam},\footnote{la funzione è stata deprecata nella revisione
2864   POSIX.1-2008 dello standard POSIX.} il cui prototipo è:
2865
2866 \begin{funcproto}{
2867 \fhead{stdio.h}
2868 \fdecl{char *tmpnam(char *string)}
2869 \fdesc{Genera un nome univoco per un file temporaneo.} 
2870 }
2871 {La funzione ritorna il puntatore alla stringa con il nome in caso di successo
2872   e \val{NULL} in caso di fallimento, non sono definiti errori.}
2873 \end{funcproto}
2874
2875 La funzione restituisce il puntatore ad una stringa contente un nome di file
2876 valido e non esistente al momento dell'invocazione. Se si è passato come
2877 argomento \param{string} un puntatore non nullo ad un buffer di caratteri
2878 questo deve essere di dimensione \const{L\_tmpnam} ed il nome generato vi
2879 verrà copiato automaticamente, altrimenti il nome sarà generato in un buffer
2880 statico interno che verrà sovrascritto ad una chiamata successiva.  Successive
2881 invocazioni della funzione continueranno a restituire nomi unici fino ad un
2882 massimo di \const{TMP\_MAX} volte, limite oltre il quale il comportamento è
2883 indefinito. Al nome viene automaticamente aggiunto come prefisso la directory
2884 specificata dalla costante \const{P\_tmpdir}.\footnote{le costanti
2885   \const{L\_tmpnam}, \const{P\_tmpdir} e \const{TMP\_MAX} sono definite in
2886   \headfile{stdio.h}.}
2887
2888 Di questa funzione esiste una versione \index{funzioni!rientranti} rientrante,
2889 \funcm{tmpnam\_r}, che non fa nulla quando si passa \val{NULL} come argomento.
2890 Una funzione simile, \funcd{tempnam}, permette di specificare un prefisso per
2891 il file esplicitamente, il suo prototipo è:
2892
2893 \begin{funcproto}{
2894 \fhead{stdio.h}
2895 \fdecl{char *tempnam(const char *dir, const char *pfx)}
2896 \fdesc{Genera un nome univoco per un file temporaneo.} 
2897 }
2898 {La funzione ritorna il puntatore alla stringa con il nome in caso di successo
2899   e \val{NULL} per un errore, nel qual caso \var{errno} potrà assumere solo il
2900   valore \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
2901 \end{funcproto}
2902
2903 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
2904 per cui è sempre \index{funzioni!rientranti} rientrante, occorre però
2905 ricordarsi di disallocare con \code{free} il puntatore che restituisce.
2906 L'argomento \param{pfx} specifica un prefisso di massimo 5 caratteri per il
2907 nome provvisorio. La funzione assegna come directory per il file temporaneo,
2908 verificando che esista e sia accessibile, la prima valida fra le seguenti:
2909 \begin{itemize*}
2910 \item la variabile di ambiente \envvar{TMPDIR} (non ha effetto se non è
2911   definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
2912   \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}),
2913 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}),
2914 \item il valore della costante \const{P\_tmpdir},
2915 \item la directory \file{/tmp}.
2916 \end{itemize*}
2917
2918 In ogni caso, anche se con queste funzioni la generazione del nome è casuale,
2919 ed è molto difficile ottenere un nome duplicato, nulla assicura che un altro
2920 processo non possa avere creato, fra l'ottenimento del nome e l'apertura del
2921 file, un altro file o un collegamento simbolico con lo stesso nome. Per questo
2922 motivo quando si usa il nome ottenuto da una di queste funzioni occorre sempre
2923 assicurarsi che non si stia usando un collegamento simbolico e aprire il nuovo
2924 file in modalità di esclusione (cioè con l'opzione \const{O\_EXCL} per i file
2925 descriptor o con il flag ``\texttt{x}'' per gli \textit{stream}) che fa
2926 fallire l'apertura in caso il file sia già esistente. Essendo disponibili
2927 alternative migliori l'uso di queste funzioni è deprecato.
2928
2929 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
2930 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
2931 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
2932
2933 \begin{funcproto}{
2934 \fhead{stdio.h}
2935 \fdecl{FILE *tmpfile(void)}
2936 \fdesc{Apre un file temporaneo in lettura/scrittura.} 
2937 }
2938 {La funzione ritorna il puntatore allo \textit{stream} associato al file
2939   temporaneo in caso di successo e \val{NULL} per un errore, nel qual caso
2940   \var{errno} assumerà uno dei valori:
2941   \begin{errlist}
2942     \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
2943     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
2944   \end{errlist}
2945   ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
2946   \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES} nel loro significato
2947   generico.}
2948 \end{funcproto}
2949
2950
2951 La funzione restituisce direttamente uno \textit{stream} già aperto (in
2952 modalità \code{w+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso,
2953 che viene automaticamente cancellato alla sua chiusura o all'uscita dal
2954 programma. Lo standard non specifica in quale directory verrà aperto il file,
2955 ma la \acr{glibc} prima tenta con \const{P\_tmpdir} e poi con
2956 \file{/tmp}. Questa funzione è \index{funzioni!rientranti} rientrante e non
2957 soffre di problemi di \itindex{race~condition} \textit{race condition}.
2958
2959 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
2960 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
2961 modificano una stringa di input che serve da modello e che deve essere
2962 conclusa da 6 caratteri ``\texttt{X}'' che verranno sostituiti da un codice
2963 unico. La prima delle due è analoga a \func{tmpnam} e genera soltanto un nome
2964 casuale, il suo prototipo è:
2965
2966 \begin{funcproto}{
2967 \fhead{stlib.h}
2968 \fdecl{char *mktemp(char *template)}
2969 \fdesc{Genera un nome univoco per un file temporaneo.} 
2970 }
2971 {La funzione ritorna  il puntatore a \param{template} in caso di successo e
2972   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori: 
2973   \begin{errlist}
2974     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2975   \end{errlist}}
2976 \end{funcproto}
2977
2978 La funzione genera un nome univoco sostituendo le \code{XXXXXX} finali di
2979 \param{template}; dato che \param{template} deve poter essere modificata dalla
2980 funzione non si può usare una stringa costante.  Tutte le avvertenze riguardo
2981 alle possibili \itindex{race~condition} \textit{race condition} date per
2982 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
2983 il valore usato per sostituire le \code{XXXXXX} viene formato con il \ids{PID}
2984 del processo più una lettera, il che mette a disposizione solo 26 possibilità
2985 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
2986 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
2987 usata.
2988
2989 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
2990 \func{tmpfile}, ma restituisce un file descriptor invece di un nome; il suo
2991 prototipo è:
2992
2993 \begin{funcproto}{
2994 \fhead{stlib.h}
2995 \fdecl{int mkstemp(char *template)}
2996 \fdesc{Apre un file temporaneo.} 
2997 }
2998
2999 {La funzione ritorna il file descriptor in caso di successo e $-1$ per un
3000   errore, nel qual 
3001   caso \var{errno} assumerà uno dei valori: 
3002   \begin{errlist}
3003     \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
3004       contenuto di \param{template} è indefinito.
3005     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3006   \end{errlist}}
3007 \end{funcproto}
3008
3009
3010 Come per \func{mktemp} anche in questo caso \param{template} non può essere
3011 una stringa costante. La funzione apre un file in lettura/scrittura con la
3012 funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
3013 sez.~\ref{sec:file_open_close}), in questo modo al ritorno della funzione si
3014 ha la certezza di essere stati i creatori del file, i cui permessi (si veda
3015 sez.~\ref{sec:file_perm_overview}) sono impostati al valore \code{0600}
3016 (lettura e scrittura solo per il proprietario).\footnote{questo è vero a
3017   partire dalla \acr{glibc} 2.0.7, le versioni precedenti della \acr{glibc} e
3018   le vecchie \acr{libc5} e \acr{libc4} usavano il valore \code{0666} che
3019   permetteva a chiunque di leggere e scrivere i contenuti del file.}  Di
3020 questa funzione esiste una variante \funcd{mkostemp}, introdotta
3021 specificamente dalla \acr{glibc},\footnote{la funzione è stata introdotta
3022   nella versione 2.7 delle librerie e richiede che sia definita la macro
3023   \macro{\_GNU\_SOURCE}.} il cui prototipo è:
3024
3025 \begin{funcproto}{
3026 \fhead{stlib.h}
3027 \fdecl{int mkostemp(char *template, int flags)}
3028 \fdesc{Apre un file temporaneo.} 
3029 }
3030 {La funzione ritorna un file descriptor in caso di successo e $-1$ per un
3031   errore, nel qual caso \var{errno} assumerà  gli stessi valori di
3032   \func{mkstemp}.} 
3033 \end{funcproto}
3034 \noindent la cui sola differenza è la presenza dell'ulteriore argomento
3035 \var{flags} che consente di specificare i flag da passare ad \func{open}
3036 nell'apertura del file.
3037
3038
3039 In OpenBSD è stata introdotta un'altra funzione simile alle precedenti,
3040 \funcd{mkdtemp}, che crea invece una directory temporanea;\footnote{la
3041   funzione è stata introdotta nella \acr{glibc} a partire dalla versione
3042   2.1.91 ed inserita nello standard POSIX.1-2008.}  il suo prototipo è:
3043
3044 \begin{funcproto}{
3045 \fhead{stlib.h}
3046 \fdecl{char *mkdtemp(char *template)}
3047 \fdesc{Crea una directory temporanea.} 
3048 }
3049 {La funzione ritorna il puntatore al nome della directory in caso di successo
3050   e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei
3051   valori:
3052   \begin{errlist}
3053     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3054   \end{errlist}
3055   più gli altri eventuali codici di errore di \func{mkdir}.}
3056 \end{funcproto}
3057
3058 La funzione crea una directory temporanea il cui nome è ottenuto sostituendo
3059 le \code{XXXXXX} finali di \param{template} con permessi \code{0700} (si veda
3060 sez.~\ref{sec:file_perm_overview} per i dettagli). Dato che la creazione della
3061 directory è sempre esclusiva i precedenti problemi di \itindex{race~condition}
3062 \textit{race condition} non si pongono.
3063
3064
3065
3066
3067
3068 \section{La manipolazione delle caratteristiche dei file}
3069 \label{sec:file_infos}
3070
3071 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
3072 relative alle caratteristiche di ciascun file, a partire dalle informazioni
3073 relative al controllo di accesso, sono mantenute \itindex{inode}
3074 nell'\textit{inode}. Vedremo in questa sezione come sia possibile leggere
3075 tutte queste informazioni usando la funzione \func{stat}, che permette
3076 l'accesso a tutti i dati memorizzati \itindex{inode} nell'\textit{inode};
3077 esamineremo poi le varie funzioni usate per manipolare tutte queste
3078 informazioni, eccetto quelle che riguardano la gestione del controllo di
3079 accesso, trattate in in sez.~\ref{sec:file_access_control}.
3080
3081
3082 \subsection{La lettura delle caratteristiche dei file}
3083 \label{sec:file_stat}
3084
3085 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
3086 delle funzioni \func{stat} che sono quelle che usa il comando \cmd{ls} per
3087 poter ottenere e mostrare tutti i dati relativi ad un file; ne fanno parte le
3088 funzioni di sistema \funcd{stat}, \funcd{fstat} e \funcd{lstat}, i cui
3089 prototipi sono:
3090
3091 \begin{funcproto}{
3092 \fhead{sys/types.h}
3093 \fhead{sys/stat.h}
3094 \fhead{unistd.h}
3095 \fdecl{int stat(const char *file\_name, struct stat *buf)}
3096 \fdecl{int lstat(const char *file\_name, struct stat *buf)}
3097 \fdecl{int fstat(int filedes, struct stat *buf)}
3098 \fdesc{Leggono le informazioni di un file.} 
3099 }
3100 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3101   caso \var{errno} assumerà uno dei valori:
3102   \begin{errlist}
3103     \item[\errcode{EOVERFLOW}] il file ha una dimensione che non può essere
3104       rappresentata nel tipo \type{off\_t} (può avvenire solo in caso di
3105       programmi compilati su piattaforme a 32 bit senza le estensioni
3106       (\texttt{-D \_FILE\_OFFSET\_BITS=64}) per file a 64 bit).
3107   \end{errlist}
3108   ed inoltre \errval{EFAULT} ed \errval{ENOMEM}, per \func{stat} e
3109   \func{lstat} anche \errval{EACCES}, \errval{ELOOP}, \errval{ENAMETOOLONG},
3110   \errval{ENOENT}, \errval{ENOTDIR}, per \func{fstat} anche \errval{EBADF}, 
3111   nel loro significato generico.}
3112 \end{funcproto}
3113
3114 La funzione \func{stat} legge le informazioni del file indicato
3115 da \param{file\_name} e le inserisce nel buffer puntato
3116 dall'argomento \param{buf}; la funzione \func{lstat} è identica a \func{stat}
3117 eccetto che se \param{file\_name} è un collegamento simbolico vengono lette le
3118 informazioni relative ad esso e non al file a cui fa riferimento. Infine
3119 \func{fstat} esegue la stessa operazione su un file già aperto, specificato
3120 tramite il suo file descriptor \param{filedes}.
3121
3122 La struttura \struct{stat} usata da queste funzioni è definita nell'header
3123 \headfile{sys/stat.h} e in generale dipende dall'implementazione; la versione
3124 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
3125 riportata dalla pagina di manuale di \func{stat}. In realtà la definizione
3126 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
3127 riservati per estensioni come tempi dei file più precisi (vedi
3128 sez.~\ref{sec:file_file_times}).
3129
3130 \begin{figure}[!htb]
3131   \footnotesize
3132   \centering
3133   \begin{minipage}[c]{0.8\textwidth}
3134     \includestruct{listati/stat.h}
3135   \end{minipage} 
3136   \normalsize 
3137   \caption{La struttura \structd{stat} per la lettura delle informazioni dei 
3138     file.}
3139   \label{fig:file_stat_struct}
3140 \end{figure}
3141
3142 Si noti come i vari membri della struttura siano specificati come tipi
3143 primitivi del sistema, di quelli definiti in
3144 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \headfile{sys/types.h},
3145 con l'eccezione di \type{blksize\_t} e \type{blkcnt\_t} che sono nuovi tipi
3146 introdotti per rendersi indipendenti dalla piattaforma. 
3147
3148 Benché la descrizione dei commenti di fig.~\ref{fig:file_stat_struct} sia
3149 abbastanza chiara, vale la pena illustrare maggiormente il significato dei
3150 campi di \struct{stat} su cui non torneremo in maggior dettaglio nel resto di
3151 questa sezione:
3152 \begin{itemize*}
3153
3154 \item Il campo \var{st\_nlink} contiene il numero di \textit{hard link} che
3155   fanno riferimento al file (il cosiddetto \textit{link count}) di cui abbiamo
3156   già parlato in numerose occasioni.
3157
3158 \item Il campo \var{st\_ino} contiene il numero di \itindex{inode}
3159   \textit{inode} del file, quello viene usato all'interno del filesystem per
3160   identificarlo e che può essere usato da un programma per determinare se due
3161   \textit{pathname} fanno riferimento allo stesso file.
3162
3163 \item Il campo \var{st\_dev} contiene il numero del dispositivo su cui risiede
3164   il file (o meglio il suo filesystem). Si tratta dello stesso numero che si
3165   usa con \func{mknod} e che può essere decomposto in \itindex{major~number}
3166   \textit{major number} e \itindex{minor~number} \textit{minor number} con le
3167   macro \macro{major} e \macro{minor} viste in sez.~\ref{sec:file_mknod}.
3168
3169 \item Il campo \var{st\_rdev} contiene il numero di dispositivo associato al
3170   file stesso ed ovviamente ha un valore significativo soltanto quando il file
3171   è un dispositivo a caratteri o a blocchi.
3172
3173 \item Il campo \var{st\_blksize} contiene la dimensione dei blocchi di dati
3174   usati nell'I/O su disco, che è anche la dimensione usata per la
3175   bufferizzazione dei dati dalle librerie del C per l'interfaccia degli
3176   \textit{stream}.  Leggere o scrivere blocchi di dati in dimensioni inferiori
3177   a questo valore è inefficiente in quanto le operazioni su disco usano
3178   comunque trasferimenti di questa dimensione.
3179
3180 \end{itemize*}
3181
3182
3183
3184 \subsection{I tipi di file}
3185 \label{sec:file_types}
3186
3187 Abbiamo sottolineato fin dall'introduzione che Linux, come ogni sistema
3188 unix-like, supporta oltre ai file ordinari e alle directory una serie di altri
3189 ``\textsl{tipi}'' di file che possono stare su un filesystem (elencati in
3190 tab.~\ref{tab:file_file_types}).  Il tipo di file viene ritornato dalle
3191 funzioni della famiglia \func{stat} all'interno del campo \var{st\_mode} di
3192 una struttura \struct{stat}. 
3193
3194 Il campo \var{st\_mode} è una maschera binaria in cui l'informazione viene
3195 suddivisa nei vari bit che compongono, ed oltre a quelle sul tipo di file,
3196 contiene anche le informazioni relative ai permessi su cui torneremo in
3197 sez.~\ref{sec:file_perm_overview}. Dato che i valori numerici usati per
3198 definire il tipo di file possono variare a seconda delle implementazioni, lo
3199 standard POSIX definisce un insieme di macro che consentono di verificare il
3200 tipo di file in maniera standardizzata.
3201
3202 \begin{table}[htb]
3203   \centering
3204   \footnotesize
3205   \begin{tabular}[c]{|l|l|}
3206     \hline
3207     \textbf{Macro} & \textbf{Tipo del file} \\
3208     \hline
3209     \hline
3210     \macro{S\_ISREG}\texttt{(m)}  & File normale.\\
3211     \macro{S\_ISDIR}\texttt{(m)}  & Directory.\\
3212     \macro{S\_ISCHR}\texttt{(m)}  & Dispositivo a caratteri.\\
3213     \macro{S\_ISBLK}\texttt{(m)}  & Dispositivo a blocchi.\\
3214     \macro{S\_ISFIFO}\texttt{(m)} & Fifo.\\
3215     \macro{S\_ISLNK}\texttt{(m)}  & Collegamento simbolico.\\
3216     \macro{S\_ISSOCK}\texttt{(m)} & Socket.\\
3217     \hline    
3218   \end{tabular}
3219   \caption{Macro per i tipi di file (definite in \headfile{sys/stat.h}).}
3220   \label{tab:file_type_macro}
3221 \end{table}
3222
3223 Queste macro vengono usate anche da Linux che supporta pure le estensioni allo
3224 standard per i collegamenti simbolici e i socket definite da BSD.\footnote{le
3225   ultime due macro di tab.~\ref{tab:file_type_macro}, che non sono presenti
3226   nello standard POSIX fino alla revisione POSIX.1-1996.}  L'elenco completo
3227 delle macro con cui è possibile estrarre da \var{st\_mode} l'informazione
3228 relativa al tipo di file è riportato in tab.~\ref{tab:file_type_macro}, tutte
3229 le macro restituiscono un valore intero da usare come valore logico e prendono
3230 come argomento il valore di \var{st\_mode}.
3231
3232 \begin{table}[htb]
3233   \centering
3234   \footnotesize
3235   \begin{tabular}[c]{|l|c|l|}
3236     \hline
3237     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
3238     \hline
3239     \hline
3240     \const{S\_IFMT}   &  0170000 & Maschera per i bit del tipo di file.\\
3241     \const{S\_IFSOCK} &  0140000 & Socket.\\
3242     \const{S\_IFLNK}  &  0120000 & Collegamento simbolico.\\
3243     \const{S\_IFREG}  &  0100000 & File regolare.\\ 
3244     \const{S\_IFBLK}  &  0060000 & Dispositivo a blocchi.\\
3245     \const{S\_IFDIR}  &  0040000 & Directory.\\
3246     \const{S\_IFCHR}  &  0020000 & Dispositivo a caratteri.\\
3247     \const{S\_IFIFO}  &  0010000 & Fifo.\\
3248     \hline
3249     \const{S\_ISUID}  &  0004000 & Set user ID \itindex{suid~bit} (\acr{suid})
3250                                    bit.\\ 
3251     \const{S\_ISGID}  &  0002000 & Set group ID \itindex{sgid~bit}
3252                                    (\acr{sgid}) bit.\\
3253     \const{S\_ISVTX}  &  0001000 & \itindex{sticky~bit} \acr{Sticky} bit.\\
3254     \hline
3255     \const{S\_IRWXU}  &  00700   & Maschera per i permessi del proprietario.\\
3256     \const{S\_IRUSR}  &  00400   & Il proprietario ha permesso di lettura.\\
3257     \const{S\_IWUSR}  &  00200   & Il proprietario ha permesso di scrittura.\\
3258     \const{S\_IXUSR}  &  00100   & Il proprietario ha permesso di esecuzione.\\
3259     \hline
3260     \const{S\_IRWXG}  &  00070   & Maschera per i permessi del gruppo.\\
3261     \const{S\_IRGRP}  &  00040   & Il gruppo ha permesso di lettura.\\
3262     \const{S\_IWGRP}  &  00020   & Il gruppo ha permesso di scrittura.\\
3263     \const{S\_IXGRP}  &  00010   & Il gruppo ha permesso di esecuzione.\\
3264     \hline
3265     \const{S\_IRWXO}  &  00007   & Maschera per i permessi di tutti gli altri\\
3266     \const{S\_IROTH}  &  00004   & Gli altri hanno permesso di lettura.\\
3267     \const{S\_IWOTH}  &  00002   & Gli altri hanno permesso di esecuzione.\\
3268     \const{S\_IXOTH}  &  00001   & Gli altri hanno permesso di esecuzione.\\
3269     \hline    
3270   \end{tabular}
3271   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
3272     \var{st\_mode} (definite in \headfile{sys/stat.h}).}
3273   \label{tab:file_mode_flags}
3274 \end{table}
3275
3276 Oltre alle macro di tab.~\ref{tab:file_type_macro}, che semplificano
3277 l'operazione, è possibile usare direttamente il valore di \var{st\_mode} per
3278 ricavare il tipo di file controllando direttamente i vari bit in esso
3279 memorizzati. Per questo sempre in \headfile{sys/stat.h} sono definite le varie
3280 costanti numeriche riportate in tab.~\ref{tab:file_mode_flags}, che
3281 definiscono le maschere che consentono di selezionare non solo i dati relativi
3282 al tipo di file, ma anche le informazioni relative ai permessi su cui
3283 torneremo in sez.~\ref{sec:file_access_control}, ed identificare i rispettivi
3284 valori.
3285
3286 Le costanti che servono per la identificazione del tipo di file sono riportate
3287 nella prima sezione di tab.~\ref{tab:file_mode_flags}, mentre le sezioni
3288 successive attengono alle costanti usate per i permessi.  Il primo valore
3289 dell'elenco è la maschera binaria \const{S\_IFMT} che permette di estrarre da
3290 \var{st\_mode} (con un AND aritmetico) il blocco di bit nei quali viene
3291 memorizzato il tipo di file. I valori successivi sono le costanti
3292 corrispondenti ai vari tipi di file, e possono essere usate per verificare la
3293 presenza del tipo di file voluto ed anche, con opportune combinazioni,
3294 alternative fra più tipi di file. 
3295
3296 Si tenga presente però che a differenza dei permessi, l'informazione relativa
3297 al tipo di file non è una maschera binaria, per questo motivo se si volesse
3298 impostare una condizione che permetta di controllare se un file è una
3299 directory o un file ordinario non si possono controllare dei singoli bit, ma
3300 si dovrebbe usare una macro di preprocessore come:
3301 \includecodesnip{listati/is_regdir.h}
3302 in cui si estraggono ogni volta da \var{st\_mode} i bit relativi al tipo di
3303 file e poi si effettua il confronto con i due possibili tipi di file.
3304
3305
3306 \subsection{Le dimensioni dei file}
3307 \label{sec:file_file_size}
3308
3309 Abbiamo visto in fig.~\ref{fig:file_stat_struct} che campo \var{st\_size} di
3310 una struttura \struct{stat} contiene la dimensione del file in byte. Questo
3311 però è vero solo se si tratta di un file regolare, mentre nel caso di un
3312 collegamento simbolico la dimensione è quella del \textit{pathname} che il
3313 collegamento stesso contiene, infine per le fifo ed i file di dispositivo
3314 questo campo è sempre nullo.
3315
3316 Il campo \var{st\_blocks} invece definisce la lunghezza del file in blocchi di
3317 512 byte. La differenza con \var{st\_size} è che in questo caso si fa
3318 riferimento alla quantità di spazio disco allocata per il file, e non alla
3319 dimensione dello stesso che si otterrebbe leggendolo sequenzialmente.
3320
3321 Si deve tener presente infatti che la lunghezza del file riportata in
3322 \var{st\_size} non è detto che corrisponda all'occupazione dello spazio su
3323 disco, e non solo perché la parte finale del file potrebbe riempire
3324 parzialmente un blocco. In un sistema unix-like infatti è possibile
3325 l'esistenza dei cosiddetti \itindex{sparse~file} \textit{sparse file}, cioè
3326 file in cui sono presenti dei ``\textsl{buchi}'' \index{file!\textit{hole}}
3327 (\textit{holes} nella nomenclatura inglese) che si formano tutte le volte che
3328 si va a scrivere su un file dopo aver eseguito uno spostamento oltre la sua
3329 fine (tratteremo in dettaglio l'argomento in sez.~\ref{sec:file_lseek}).
3330
3331 In questo caso si avranno risultati differenti a seconda del modo in cui si
3332 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
3333 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
3334 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
3335 caso per i ``\textsl{buchi}'' \index{file!\textit{hole}} vengono restituiti
3336 degli zeri, si avrà lo stesso risultato di \cmd{ls}.
3337
3338 Se è sempre possibile allargare un file, scrivendoci sopra o usando la
3339 funzione \func{lseek} (vedi sez.~\ref{sec:file_lseek}) per spostarsi oltre la
3340 sua fine, esistono anche casi in cui si può avere bisogno di effettuare un
3341 troncamento, scartando i dati presenti al di là della dimensione scelta come
3342 nuova fine del file.
3343
3344 Un file può sempre essere troncato a zero aprendolo con il flag
3345 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
3346 dimensione si possono usare le due funzioni di sistema \funcd{truncate} e
3347 \funcd{ftruncate}, i cui prototipi sono:
3348
3349 \begin{funcproto}{
3350 \fhead{unistd.h}
3351 \fdecl{int ftruncate(int fd, off\_t length))}
3352 \fdecl{int truncate(const char *file\_name, off\_t length)}
3353 \fdesc{Troncano un file.} 
3354 }
3355 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3356   caso \var{errno} assumerà uno dei valori: 
3357   \begin{errlist}
3358   \item[\errcode{EINTR}] si è stati interrotti da un segnale.
3359   \item[\errcode{EINVAL}] \param{length} è negativa o maggiore delle
3360     dimensioni massime di un file.
3361   \item[\errcode{EPERM}] il filesystem non supporta il troncamento di un file.
3362   \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
3363   \end{errlist} 
3364   per entrambe, mentre per \func{ftruncate} si avranno anche: 
3365   \begin{errlist}
3366   \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3367   \item[\errcode{EINVAL}] \param{fd} non è un riferimento a un file o non è
3368     aperto in scrittura. 
3369   \end{errlist}
3370   e per \func{truncate} si avranno anche: 
3371   \begin{errlist}
3372   \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file o il
3373     permesso di attraversamento di una delle componenti del \textit{pathname}.
3374   \item[\errcode{EISDIR}] \param{file\_name} fa riferimento ad una directory.
3375   \end{errlist}
3376   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
3377   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR} e \errval{EROFS}
3378   nel loro significato generico.}
3379 \end{funcproto}
3380
3381 Entrambe le funzioni fan sì che la dimensione del file sia troncata ad un
3382 valore massimo specificato da \param{length}, e si distinguono solo per il
3383 fatto che il file viene indicato con un \textit{pathname} per \func{truncate}
3384 e con un file descriptor per \funcd{ftruncate}. Si tenga presente che se il
3385 file è più lungo della lunghezza specificata i dati in eccesso saranno
3386 perduti.
3387
3388 Il comportamento in caso di lunghezza del file inferiore a \param{length} non
3389 è specificato e dipende dall'implementazione: il file può essere lasciato
3390 invariato o esteso fino alla lunghezza scelta. Nel caso di Linux viene esteso
3391 con la creazione di un \index{file!\textit{hole}} \textsl{buco} nel
3392 \itindex{sparse~file} file e ad una lettura si otterranno degli zeri, si tenga
3393 presente però che questo comportamento è supportato solo per filesystem
3394 nativi, ad esempio su un filesystem non nativo come il VFAT di Windows questo
3395 non è possibile.
3396
3397
3398 \subsection{I tempi dei file}
3399 \label{sec:file_file_times}
3400
3401 Il sistema mantiene per ciascun file tre tempi, che sono registrati
3402 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del
3403 file. Questi possono essere letti tramite la funzione \func{stat}, che li
3404 restituisce attraverso tre campi della struttura \struct{stat} di
3405 fig.~\ref{fig:file_stat_struct}. Il significato di questi tempi e dei relativi
3406 campi della struttura \struct{stat} è illustrato nello schema di
3407 tab.~\ref{tab:file_file_times}, dove è anche riportato un esempio delle
3408 funzioni che effettuano cambiamenti su di essi. Il valore del tempo è espresso
3409 nel cosiddetto \itindex{calendar~time} \textit{calendar time}, su cui
3410 torneremo in dettaglio in sez.~\ref{sec:sys_time}.
3411
3412 \begin{table}[htb]
3413   \centering
3414   \footnotesize
3415   \begin{tabular}[c]{|c|l|l|c|}
3416     \hline
3417     \textbf{Membro} & \textbf{Significato} & \textbf{Funzione} 
3418     & \textbf{Opzione di \cmd{ls}} \\
3419     \hline
3420     \hline
3421     \var{st\_atime}& ultimo accesso ai dati del file    &
3422                      \func{read}, \func{utime}          & \cmd{-u}\\
3423     \var{st\_mtime}& ultima modifica ai dati del file   &
3424                      \func{write}, \func{utime}         & default\\
3425     \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
3426                      \func{chmod}, \func{utime}         & \cmd{-c}\\
3427     \hline
3428   \end{tabular}
3429   \caption{I tre tempi associati a ciascun file.}
3430   \label{tab:file_file_times}
3431 \end{table}
3432
3433 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
3434 ultima modifica (il \textit{modification time}) riportato in \var{st\_mtime},
3435 ed il tempo di ultimo cambiamento di stato (il \textit{change status time})
3436 riportato in \var{st\_ctime}. Il primo infatti fa riferimento ad una modifica
3437 del contenuto di un file, mentre il secondo ad una modifica dei metadati
3438 \itindex{inode} dell'\textit{inode}. Dato che esistono molte operazioni, come
3439 la funzione \func{link} e altre che vedremo in seguito, che modificano solo le
3440 informazioni contenute \itindex{inode} nell'\textit{inode} senza toccare il
3441 contenuto del file, diventa necessario l'utilizzo di questo secondo tempo.
3442
3443 Il tempo di ultima modifica viene usato ad esempio da programmi come
3444 \cmd{make} per decidere quali file necessitano di essere ricompilati perché
3445 più recenti dei loro sorgenti oppure dai programmi di backup, talvolta insieme
3446 anche al tempo di cambiamento di stato, per decidere quali file devono essere
3447 aggiornati nell'archiviazione.  Il tempo di ultimo accesso viene di solito
3448 usato per identificare i file che non vengono più utilizzati per un certo
3449 lasso di tempo. Ad esempio un programma come \texttt{leafnode} lo usa per
3450 cancellare gli articoli letti più vecchi, mentre \texttt{mutt} lo usa per
3451 marcare i messaggi di posta che risultano letti.  
3452
3453 Il sistema non tiene mai conto dell'ultimo accesso \itindex{inode}
3454 all'\textit{inode}, pertanto funzioni come \func{access} o \func{stat} non
3455 hanno alcuna influenza sui tre tempi. Il comando \cmd{ls} (quando usato con le
3456 opzioni \cmd{-l} o \cmd{-t}) mostra i tempi dei file secondo lo schema
3457 riportato nell'ultima colonna di tab.~\ref{tab:file_file_times}. Si noti anche
3458 come non esista, a differenza di altri sistemi operativi, un \textsl{tempo di
3459   creazione} di un file.
3460
3461 L'aggiornamento del tempo di ultimo accesso è stato a lungo considerato un
3462 difetto progettuale di Unix, questo infatti comporta la necessità di
3463 effettuare un accesso in scrittura sul disco anche in tutti i casi in cui
3464 questa informazione non interessa e sarebbe possibile avere un semplice
3465 accesso in lettura sui dati bufferizzati. Questo comporta un ovvio costo sia
3466 in termini di prestazioni, che di consumo di risorse come la batteria per i
3467 portatili, o i cicli di riscrittura per i dischi su memorie riscrivibili.
3468
3469
3470 Per questo motivo abbiamo visto in sez.~\ref{sec:filesystem_mounting} come
3471 nello sviluppo del kernel siano stati introdotti degli opportuni \textit{mount
3472   flag} che consentissero di evitare di aggiornare continuamente una
3473 informazione che nella maggior parte dei casi non interessa. Per questo i
3474 valori che si possono trovare per l'\textit{access time} dipendono dalle
3475 opzioni di montaggio, ed anche, essendo stato cambiato il comportamento di
3476 default a partire dalla versione 2.6.30, dal kernel che si sta usando. 
3477
3478 In generale quello che si ha con i kernel più recenti è che il tempo di ultimo
3479 accesso viene aggiornato solo se è precedente al tempo di ultima modifica o
3480 cambiamento, o se è passato più di un giorno dall'ultimo accesso. Così si può
3481 rendere evidente che vi è stato un accesso dopo una modifica e che il file
3482 viene comunque osservato regolarmente, conservando tutte le informazioni
3483 veramente utili senza dover consumare risorse in scritture continue per
3484 mantenere costantemente aggiornata una informazione che a questo punto non ha
3485 più nessuna rilevanza pratica.\footnote{qualora ce ne fosse la necessità è
3486   comunque possibile, tramite l'opzione di montaggio \texttt{strictatime},
3487   richiedere in ogni caso il comportamento tradizionale.}
3488
3489 \begin{table}[htb]
3490   \centering
3491   \footnotesize
3492   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
3493     \hline
3494     \multicolumn{1}{|p{2.8cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
3495     \multicolumn{3}{|p{3.2cm}|}{\centering{
3496         \textbf{File o directory del riferimento}}}&
3497     \multicolumn{3}{|p{3.2cm}|}{\centering{
3498         \textbf{Directory contenente il riferimento}}} 
3499     &\multicolumn{1}{|p{3.4cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
3500     \cline{2-7}
3501     \cline{2-7}
3502     \multicolumn{1}{|p{2.8cm}|}{} 
3503     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(a)}}}
3504     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(m)}}}
3505     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(c)}}}
3506     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(a)}}}
3507     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(m)}}}
3508     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(c)}}}
3509     &\multicolumn{1}{|p{3cm}|}{} \\
3510     \hline
3511     \hline
3512     \func{chmod}, \func{fchmod} 
3513              & --      & --      &$\bullet$& --      & --      & --      &\\
3514     \func{chown}, \func{fchown} 
3515              & --      & --      &$\bullet$& --      & --      & --      &\\
3516     \func{creat}  
3517              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&  
3518              con \const{O\_CREATE} \\
3519     \func{creat}  
3520              & --      &$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&   
3521              con \const{O\_TRUNC} \\
3522     \func{exec}  
3523              &$\bullet$& --      & --      & --      & --      & --      &\\
3524     \func{lchown}  
3525              & --      & --      &$\bullet$& --      & --      & --      &\\
3526     \func{link}
3527              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
3528     \func{mkdir}
3529              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3530     \func{mknod}
3531              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3532     \func{mkfifo}
3533              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3534     \func{open}
3535              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$& 
3536              con \const{O\_CREATE} \\
3537     \func{open}
3538              & --      &$\bullet$&$\bullet$& --      & --      & --      & 
3539              con \const{O\_TRUNC}  \\
3540     \func{pipe}
3541              &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
3542     \func{read}
3543              &$\bullet$& --      & --      & --      & --      & --      &\\
3544     \func{remove}
3545              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
3546              se esegue \func{unlink}\\
3547     \func{remove}
3548               & --      & --      & --      & --      &$\bullet$&$\bullet$& 
3549               se esegue \func{rmdir}\\
3550     \func{rename}
3551               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
3552               per entrambi gli argomenti\\
3553     \func{rmdir}
3554               & --      & --      & --      & --      &$\bullet$&$\bullet$&\\ 
3555     \func{truncate}, \func{ftruncate}
3556               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
3557     \func{unlink}
3558               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\ 
3559     \func{utime}
3560               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\ 
3561     \func{utimes}
3562               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\ 
3563     \func{write}
3564               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
3565     \hline
3566   \end{tabular}
3567   \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo 
3568     accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento di
3569     stato \textsl{(c)} dalle varie funzioni operanti su file e directory.}
3570   \label{tab:file_times_effects}  
3571 \end{table}
3572
3573
3574 L'effetto delle varie funzioni di manipolazione dei file sui relativi tempi è
3575 illustrato in tab.~\ref{tab:file_times_effects}, facendo riferimento al
3576 comportamento classic