Aggiornamento copyright, trattazione degli shared subtree per mount e
[gapil.git] / filedir.tex
1 %% filedir.tex
2 %%
3 %% Copyright (C) 2000-2012 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{La gestione di file e directory}
13 \label{cha:files_and_dirs}
14
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando da un approfondimento dell'architettura del
17 sistema illustrata a grandi linee in sez.~\ref{sec:file_arch_overview} ed
18 illustrando le principali caratteristiche di un filesystem e le interfacce
19 che consentono di controllarne il montaggio e lo smontaggio. 
20
21 Esamineremo poi le funzioni di libreria che si usano per copiare, spostare e
22 cambiare i nomi di file e directory e l'interfaccia che permette la
23 manipolazione dei loro attributi. Tratteremo inoltre la struttura di base del
24 sistema delle protezioni e del controllo dell'accesso ai file e le successive
25 estensioni (\textit{Extended Attributes}, ACL, quote disco,
26 \textit{capabilities}). Tutto quello che riguarda invece la gestione dell'I/O
27 sui file è lasciato al capitolo successivo.
28
29
30
31 \section{L'architettura della gestione dei file}
32 \label{sec:file_arch_func}
33
34 In questa sezione tratteremo con maggiori dettagli rispetto a quanto visto in
35 sez.~\ref{sec:file_arch_overview} il \textit{Virtual File System} di Linux e
36 come il kernel può gestire diversi tipi di filesystem, descrivendo prima le
37 caratteristiche generali di un filesystem di un sistema unix-like, per poi
38 fare una panoramica sul filesystem più usato con Linux, l'\acr{ext2} ed i suoi
39 successori.
40
41
42 \subsection{Il funzionamento del \textit{Virtual File System} di Linux}
43 \label{sec:file_vfs_work}
44
45 % NOTE articolo interessante:
46 % http://www.ibm.com/developerworks/linux/library/l-virtual-filesystem-switch/index.html?ca=dgr-lnxw97Linux-VFSdth-LXdW&S_TACT=105AGX59&S_CMP=GRlnxw97
47
48 \itindbeg{Virtual~File~System}
49
50 Come illustrato brevemente in sez.~\ref{sec:file_arch_overview} in Linux il
51 concetto di \textit{everything is a file} è stato implementato attraverso il
52 \textit{Virtual File System}, la cui struttura generale è illustrata in
53 fig.~\ref{fig:file_VFS_scheme}.  Il VFS definisce un insieme di funzioni che
54 tutti i filesystem devono implementare per l'accesso ai file che contengono e
55 l'interfaccia che consente di eseguire l'I/O sui file, che questi siano di
56 dati o dispositivi. 
57
58 \itindbeg{inode}
59
60 L'interfaccia fornita dal VFS comprende in sostanza tutte le funzioni che
61 riguardano i file, le operazioni implementate dal VFS sono realizzate con una
62 astrazione che prevede quattro tipi di oggetti strettamente correlati: i
63 filesystem, le \textit{dentry}, gli \textit{inode} ed i file. A questi oggetti
64 corrispondono una serie di apposite strutture definite dal kernel che
65 contengono come campi le funzioni di gestione e realizzano l'infrastruttura
66 del VFS. L'interfaccia è molto complessa, ne faremo pertanto una trattazione
67 estremamente semplificata che consenta di comprenderne i principi
68 di funzionamento.
69
70 Il VFS usa una tabella mantenuta dal kernel che contiene il nome di ciascun
71 filesystem supportato, quando si vuole inserire il supporto di un nuovo
72 filesystem tutto quello che occorre è chiamare la funzione
73 \code{register\_filesystem} passando come argomento la struttura
74 \kstruct{file\_system\_type} (la cui definizione è riportata in
75 fig.~\ref{fig:kstruct_file_system_type}) relativa a quel filesystem. Questa
76 verrà inserita nella tabella, ed il nuovo filesystem comparirà in
77 \procfile{/proc/filesystems}.
78
79 \begin{figure}[!htb]
80   \footnotesize \centering
81   \begin{minipage}[c]{\textwidth}
82     \includestruct{listati/file_system_type.h}
83   \end{minipage}
84   \normalsize 
85   \caption{Estratto della struttura \kstructd{file\_system\_type} usata dal
86     VFS (da \texttt{include/linux/fs.h}).}
87   \label{fig:kstruct_file_system_type}
88 \end{figure}
89
90 La struttura \kstruct{file\_system\_type}, oltre ad una serie di dati interni,
91 come il nome del tipo di filesystem nel campo \var{name},\footnote{quello che
92   viene riportato in \procfile{/proc/filesystems} e che viene usato come
93   valore del parametro dell'opzione \texttt{-t} del comando \texttt{mount} che
94   indica il tipo di filesystem.}  contiene i riferimenti alle funzioni di base
95 che consentono l'utilizzo di quel filesystem. In particolare la funzione
96 \code{mount} del quarto campo è quella che verrà invocata tutte le volte che
97 si dovrà effettuare il montaggio di un filesystem di quel tipo. Per ogni nuovo
98 filesystem si dovrà allocare una di queste strutture ed inizializzare i
99 relativi campi con i dati specifici di quel filesystem, ed in particolare si
100 dovrà creare anche la relativa versione della funzione \code{mount}.
101
102 \itindbeg{pathname}
103
104 Come illustrato in fig.~\ref{fig:kstruct_file_system_type} questa funzione
105 restituisce una \textit{dentry}, abbreviazione che sta per \textit{directory
106   entry}. Le \textit{dentry} sono gli oggetti che il kernel usa per eseguire
107 la \textit{pathname resolution}, ciascuna di esse corrisponde ad un
108 \textit{pathname} e contiene il riferimento ad un \textit{inode}, che come
109 vedremo a breve è l'oggetto usato dal kernel per identificare un un
110 file.\footnote{in questo caso si parla di file come di un qualunque oggetto
111   generico che sta sul filesystem e non dell'oggetto file del VFS cui
112   accennavamo prima.} La \textit{dentry} ottenuta dalla chiamata alla funzione
113 \code{mount} sarà inserita in corrispondenza al \textit{pathname} della
114 directory in cui il filesystem è stato montato.
115
116 % NOTA: struct dentry è dichiarata in include/linux/dcache.h
117
118 Le \textit{dentry} sono oggetti del VFS che vivono esclusivamente in memoria,
119 nella cosiddetta \textit{directory entry cache} (spesso chiamata in breve
120 \textit{dcache}). Ogni volta che una \textit{system call} specifica un
121 \textit{pathname} viene effettuata una ricerca nella \textit{dcache} per
122 ottenere immediatamente la \textit{dentry} corrispondente,\footnote{il buon
123   funzionamento della \textit{dcache} è in effetti di una delle parti più
124   critiche per le prestazioni del sistema.} che a sua volta ci darà, tramite
125 l'\textit{inode}, il riferimento al file.
126
127 Dato che normalmente non è possibile mantenere nella \textit{dcache} le
128 informazioni relative a tutto l'albero dei file la procedura della
129 \textit{pathname resolution} richiede un meccanismo con cui riempire gli
130 eventuali vuoti. Il meccanismo prevede che tutte le volte che si arriva ad una
131 \textit{dentry} mancante venga invocata la funzione \texttt{lookup}
132 dell'\textit{inode} associato alla \textit{dentry} precedente nella
133 risoluzione del \textit{pathname},\footnote{che a questo punto è una
134   directory, per cui si può cercare al suo interno il nome di un file.} il cui
135 scopo è risolvere il nome mancante e fornire la sua \textit{dentry} che a
136 questo punto verrà inserita nella cache.
137
138 Dato che tutte le volte che si monta un filesystem la funzione \texttt{mount}
139 della corrispondente \kstruct{file\_system\_type} inserisce la \textit{dentry}
140 iniziale nel \itindex{mount~point} \textit{mount point} dello stesso si avrà
141 comunque un punto di partenza. Inoltre essendo questa \textit{dentry} relativa
142 a quel tipo di filesystem essa farà riferimento ad un \textit{inode} di quel
143 filesystem, e come vedremo questo farà sì che venga eseguita una
144 \texttt{lookup} adatta per effettuare la risoluzione dei nomi per quel
145 filesystem.
146
147 \itindend{pathname}
148
149 % Un secondo effetto della chiamata funzione \texttt{mount} di
150 % \kstruct{file\_system\_type} è quello di allocare una struttura
151 % \kstruct{super\_block} per ciascuna istanza montata, che contiene le
152 % informazioni generali di un qualunque filesystem montato, come le opzioni di
153 % montaggio, le dimensioni dei blocchi, quando il filesystem è stato montato
154 % ecc. Fra queste però viene pure inserta, nel campo \var{s\_op}, una ulteriore
155 % struttura \kstruct{super\_operations}, il cui contenuto sono i puntatori
156 % alle funzioni di gestione di un filesystem, anche inizializzata in modo da
157 % utilizzare le versioni specifiche di quel filesystem.
158
159 L'oggetto più importante per il funzionamento del VFS è probabilmente
160 l'\textit{inode}, ma con questo nome si può fare riferimento a due cose
161 diverse.  La prima è la struttura su disco (su cui torneremo anche in
162 sez.~\ref{sec:file_filesystem}) che fa parte della organizzazione dei dati
163 realizzata dal filesystem e che contiene le informazioni relative alle
164 proprietà (i cosiddetti \textsl{metadati}) di ogni oggetto presente su di esso
165 (si intende al solito uno qualunque dei tipi di file di
166 tab.~\ref{tab:file_file_types}).
167
168 La seconda è la corrispondente struttura \kstruct{inode}, della cui
169 definizione si è riportato un estratto in
170 fig.~\ref{fig:kstruct_inode}.\footnote{l'estratto fa riferimento alla versione
171   del kernel 2.6.37.} Questa struttura viene mantenuta in memoria ed è a
172 questa che facevamo riferimento quando parlavamo dell'\textit{inode} associato
173 a ciascuna \textit{dentry}. Nella struttura in memoria sono presenti gli
174 stessi \textsl{metadati} memorizzati su disco, che vengono letti quando questa
175 struttura viene allocata e trascritti all'indietro se modificati.
176
177 \begin{figure}[!htb]
178   \footnotesize \centering
179   \begin{minipage}[c]{\textwidth}
180     \includestruct{listati/inode.h}
181   \end{minipage}
182   \normalsize 
183   \caption{Estratto della struttura \kstructd{inode} del kernel (da
184     \texttt{include/linux/fs.h}).}
185   \label{fig:kstruct_inode}
186 \end{figure}
187
188 Il fatto che la struttura \kstruct{inode} sia mantenuta in memoria,
189 direttamente associata ad una \textit{dentry}, rende sostanzialmente immediate
190 le operazioni che devono semplicemente effettuare un accesso ai dati in essa
191 contenuti: è così ad esempio che viene realizzata la \textit{system call}
192 \func{stat} che vedremo in sez.~\ref{sec:file_stat}. Rispetto ai dati salvati
193 sul disco questa struttura contiene però anche quanto necessario alla
194 implementazione del VFS, ed in particolare è importante il campo \var{i\_op}
195 che, come illustrato in fig.~\ref{fig:kstruct_inode}, contiene il puntatore ad
196 una struttura di tipo \kstruct{inode\_operation}, la cui definizione si può
197 trovare nel file \texttt{include/kernel/fs.h} dei sorgenti del kernel.
198
199 Questa struttura non è altro che una tabella di funzioni, ogni suo membro cioè
200 è un puntatore ad una funzione e, come suggerisce il nome della struttura
201 stessa, queste funzioni sono quelle che definiscono le operazioni che il VFS
202 può compiere su un \textit{inode}. Si sono riportate in
203 tab.~\ref{tab:file_inode_operations} le più rilevanti.
204
205 \begin{table}[htb]
206   \centering
207   \footnotesize
208   \begin{tabular}[c]{|l|l|}
209     \hline
210     \textbf{Funzione} & \textbf{Operazione} \\
211     \hline
212     \hline
213     \textsl{\code{create}} & Chiamata per creare un nuovo file (vedi
214                              sez.~\ref{sec:file_open}).\\ 
215     \textsl{\code{link}}   & Crea un \textit{hard link} (vedi
216                              sez.~\ref{sec:file_link}).\\
217     \textsl{\code{unlink}} & Cancella un \textit{hard link} (vedi
218                              sez.~\ref{sec:file_link}).\\
219     \textsl{\code{symlink}}& Crea un link simbolico (vedi
220                              sez.~\ref{sec:file_symlink}).\\
221     \textsl{\code{mkdir}}  & Crea una directory (vedi
222                              sez.~\ref{sec:file_dir_creat_rem}).\\
223     \textsl{\code{rmdir}}  & Rimuove una directory (vedi
224                              sez.~\ref{sec:file_dir_creat_rem}).\\
225     \textsl{\code{mknod}}  & Crea un file speciale (vedi
226                              sez.~\ref{sec:file_mknod}).\\
227     \textsl{\code{rename}} & Cambia il nome di un file (vedi
228                              sez.~\ref{sec:file_remove}).\\
229     \textsl{\code{lookup}}&  Risolve il nome di un file.\\
230     \hline
231   \end{tabular}
232   \caption{Le principali operazioni sugli \textit{inode} definite tramite
233     \kstruct{inode\_operation}.} 
234   \label{tab:file_inode_operations}
235 \end{table}
236
237 Possiamo notare come molte di queste funzioni abbiano nomi sostanzialmente
238 identici alle varie \textit{system call} con le quali si gestiscono file e
239 directory, che tratteremo nel resto del capitolo. Quello che succede è che
240 tutte le volte che deve essere eseguita una \textit{system call}, o una
241 qualunque altra operazione su un \textit{inode} (come \texttt{lookup}) il VFS
242 andrà ad utilizzare la funzione corrispondente attraverso il puntatore
243 \var{i\_op}.
244
245 Sarà allora sufficiente che nella realizzazione di un filesystem si crei una
246 implementazione di queste funzioni per quel filesystem e si allochi una
247 opportuna istanza di \kstruct{inode\_operation} contenente i puntatori a dette
248 funzioni. A quel punto le strutture \kstruct{inode} usate per gli oggetti di
249 quel filesystem otterranno il puntatore alla relativa istanza di
250 \kstruct{inode\_operation} e verranno automaticamente usate le funzioni
251 corrette.
252
253 Si noti però come in tab.~\ref{tab:file_inode_operations} non sia presente la
254 funzione \texttt{open} che invece è citata in
255 tab.~\ref{tab:file_file_operations}.\footnote{essa può essere comunque
256   invocata dato che nella struttura \kstruct{inode} è presente anche il
257   puntatore \func{i\_fop} alla struttura \kstruct{file\_operation} che
258   fornisce detta funzione.} Questo avviene perché su Linux l'apertura di un
259 file richiede comunque un'altra operazione che mette in gioco l'omonimo
260 oggetto del VFS: l'allocazione di una struttura di tipo \kstruct{file} che
261 viene associata ad ogni file aperto nel sistema.
262
263 I motivi per cui viene usata una struttura a parte sono diversi, anzitutto,
264 come illustrato in sez.~\ref{sec:file_fd}, questa è necessaria per le
265 operazioni eseguite dai processi con l'interfaccia dei file descriptor; ogni
266 processo infatti mantiene il riferimento ad una struttura \kstruct{file} per
267 ogni file che ha aperto, ed è tramite essa che esegue le operazioni di I/O.
268
269 Inoltre se le operazioni relative agli \textit{inode} fanno riferimento ad
270 oggetti posti all'interno di un filesystem e vi si applicano quindi le
271 funzioni fornite nell'implementazione di quest'ultimo, quando si apre un file
272 questo può essere anche un file di dispositivo, ed in questo caso il VFS
273 invece di usare le operazioni fornite dal filesystem (come farebbe per un file
274 di dati) dovrà invece ricorrere a quelle fornite dal driver del dispositivo.
275
276 \itindend{inode}
277
278 \begin{figure}[!htb]
279   \footnotesize \centering
280   \begin{minipage}[c]{\textwidth}
281     \includestruct{listati/file.h}
282   \end{minipage}
283   \normalsize 
284   \caption{Estratto della struttura \kstructd{file} del kernel (da
285     \texttt{include/linux/fs.h}).}
286   \label{fig:kstruct_file}
287 \end{figure}
288
289 Come si può notare dall'estratto di fig.~\ref{fig:kstruct_file}, la struttura
290 \kstruct{file} contiene, oltre ad alcune informazioni usate dall'interfaccia
291 dei file descriptor il cui significato emergerà più avanti, il puntatore
292 \struct{f\_op} ad una struttura \kstruct{file\_operation}. Questa è l'analoga
293 per i file di \kstruct{inode\_operation}, e definisce le operazioni generiche
294 fornite dal VFS per i file. Si sono riportate in
295 tab.~\ref{tab:file_file_operations} le più significative.
296
297 \begin{table}[htb]
298   \centering
299   \footnotesize
300   \begin{tabular}[c]{|l|p{8cm}|}
301     \hline
302     \textbf{Funzione} & \textbf{Operazione} \\
303     \hline
304     \hline
305     \textsl{\code{open}}   & Apre il file (vedi sez.~\ref{sec:file_open}).\\
306     \textsl{\code{read}}   & Legge dal file (vedi sez.~\ref{sec:file_read}).\\
307     \textsl{\code{write}}  & Scrive sul file (vedi 
308                              sez.~\ref{sec:file_write}).\\
309     \textsl{\code{llseek}} & Sposta la posizione corrente sul file (vedi
310                              sez.~\ref{sec:file_lseek}).\\
311     \textsl{\code{ioctl}}  & Accede alle operazioni di controllo 
312                              (vedi sez.~\ref{sec:file_ioctl}).\\
313     \textsl{\code{readdir}}& Legge il contenuto di una directory (vedi 
314                              sez.~\ref{sec:file_dir_read}).\\
315     \textsl{\code{poll}}   & Usata nell'I/O multiplexing (vedi
316                              sez.~\ref{sec:file_multiplexing}).\\
317     \textsl{\code{mmap}}   & Mappa il file in memoria (vedi 
318                              sez.~\ref{sec:file_memory_map}).\\
319     \textsl{\code{release}}& Chiamata quando l'ultimo riferimento a un file 
320                              aperto è chiuso.\\
321     \textsl{\code{fsync}}  & Sincronizza il contenuto del file (vedi
322                              sez.~\ref{sec:file_sync}).\\
323     \textsl{\code{fasync}} & Abilita l'I/O asincrono (vedi
324                              sez.~\ref{sec:file_asyncronous_io}) sul file.\\
325     \hline
326   \end{tabular}
327   \caption{Operazioni sui file definite tramite \kstruct{file\_operation}.}
328   \label{tab:file_file_operations}
329 \end{table}
330
331 Anche in questo caso tutte le volte che deve essere eseguita una
332 \textit{system call} o una qualunque altra operazione sul file il VFS andrà ad
333 utilizzare la funzione corrispondente attraverso il puntatore
334 \var{f\_op}. Dato che è cura del VFS quando crea la struttura all'apertura del
335 file assegnare a \var{f\_op} il puntatore alla versione di
336 \kstruct{file\_operation} corretta per quel file, sarà possibile scrivere allo
337 stesso modo sulla porta seriale come su un normale file di dati, e lavorare
338 sui file allo stesso modo indipendentemente dal filesystem.
339
340 Il VFS realizza la quasi totalità delle operazioni relative ai file grazie
341 alle funzioni presenti nelle due strutture \kstruct{inode\_operation} e
342 \kstruct{file\_operation}.  Ovviamente non è detto che tutte le operazioni
343 possibili siano poi disponibili in tutti i casi, ad esempio \code{llseek} non
344 sarà presente per un dispositivo come la porta seriale o per una fifo, mentre
345 sui file del filesystem \texttt{vfat} non saranno disponibili i permessi, ma
346 resta il fatto che grazie al VFS le \textit{system call} per le operazioni sui
347 file possono restare sempre le stesse nonostante le enormi differenze che
348 possono esserci negli oggetti a cui si applicano.
349  
350
351 \itindend{Virtual~File~System}
352
353 % NOTE: documentazione interessante:
354 %       * sorgenti del kernel: Documentation/filesystems/vfs.txt
355 %       * http://thecoffeedesk.com/geocities/rkfs.html
356 %       * http://www.linux.it/~rubini/docs/vfs/vfs.html
357
358
359
360 \subsection{Il funzionamento di un filesystem Unix}
361 \label{sec:file_filesystem}
362
363 Come già accennato in sez.~\ref{sec:file_arch_overview} Linux (ed ogni sistema
364 unix-like) organizza i dati che tiene su disco attraverso l'uso di un
365 filesystem. Una delle caratteristiche di Linux rispetto agli altri Unix è
366 quella di poter supportare, grazie al VFS, una enorme quantità di filesystem
367 diversi, ognuno dei quali avrà una sua particolare struttura e funzionalità
368 proprie.  Per questo non entreremo nei dettagli di un filesystem specifico, ma
369 daremo una descrizione a grandi linee che si adatta alle caratteristiche
370 comuni di qualunque filesystem di un sistema unix-like.
371
372 Una possibile strutturazione dell'informazione su un disco è riportata in
373 fig.~\ref{fig:file_disk_filesys}, dove si hanno tre filesystem su tre
374 partizioni. In essa per semplicità si è fatto riferimento alla struttura del
375 filesystem \acr{ext2}, che prevede una suddivisione dei dati in \textit{block
376   group}.  All'interno di ciascun \textit{block group} viene anzitutto
377 replicato il cosiddetto \textit{superblock}, (la struttura che contiene
378 l'indice iniziale del filesystem e che consente di accedere a tutti i dati
379 sottostanti) e creata una opportuna suddivisione dei dati e delle informazioni
380 per accedere agli stessi.  Sulle caratteristiche di \acr{ext2} e derivati
381 torneremo in sez.~\ref{sec:file_ext2}.
382
383 \itindbeg{inode}
384
385 È comunque caratteristica comune di tutti i filesystem per Unix,
386 indipendentemente da come poi viene strutturata nei dettagli questa
387 informazione, prevedere la presenza di due tipi di risorse: gli
388 \textit{inode}, cui abbiamo già accennato in sez.~\ref{sec:file_vfs_work}, che
389 sono le strutture che identificano i singoli oggetti sul filesystem, e i
390 blocchi, che invece attengono allo spazio disco che viene messo a disposizione
391 per i dati in essi contenuti.
392
393 \begin{figure}[!htb]
394   \centering
395   \includegraphics[width=12cm]{img/disk_struct}
396   \caption{Organizzazione dello spazio su un disco in partizioni e
397   filesystem.}
398   \label{fig:file_disk_filesys}
399 \end{figure}
400
401 Se si va ad esaminare con maggiore dettaglio la strutturazione
402 dell'informazione all'interno del filesystem \textsl{ext2}, tralasciando i
403 dettagli relativi al funzionamento del filesystem stesso come la
404 strutturazione in gruppi dei blocchi, il \textit{superblock} e tutti i dati di
405 gestione possiamo esemplificare la situazione con uno schema come quello
406 esposto in fig.~\ref{fig:file_filesys_detail}.
407
408 \begin{figure}[!htb]
409   \centering
410   \includegraphics[width=12cm]{img/filesys_struct}
411   \caption{Strutturazione dei dati all'interno di un filesystem.}
412   \label{fig:file_filesys_detail}
413 \end{figure}
414
415 Da fig.~\ref{fig:file_filesys_detail} si evidenziano alcune delle
416 caratteristiche di base di un filesystem, che restano le stesse anche su
417 filesystem la cui organizzazione dei dati è totalmente diversa da quella
418 illustrata, e sulle quali è bene porre attenzione visto che sono fondamentali
419 per capire il funzionamento delle funzioni che manipolano i file e le
420 directory che tratteremo nel prosieguo del capitolo. In particolare è
421 opportuno tenere sempre presente che:
422
423
424 \begin{enumerate}
425   
426 \item L'\textit{inode} contiene i cosiddetti \textsl{metadati}, vale dire le
427   informazioni riguardanti le proprietà del file come oggetto del filesystem:
428   il tipo di file, i permessi di accesso, le dimensioni, i puntatori ai
429   blocchi fisici che contengono i dati e così via. Le informazioni che la
430   funzione \func{stat} (vedi sez.~\ref{sec:file_stat}) fornisce provengono
431   dall'\textit{inode}.  Dentro una directory si troverà solo il nome del file
432   e il numero dell'\textit{inode} ad esso associato; il nome non è una
433   proprietà del file e non viene mantenuto nell'\textit{inode}. Da da qui in
434   poi chiameremo il nome del file contenuto in una directory
435   ``\textsl{voce}'', come traduzione della nomenclatura inglese
436   \textit{directory entry} che non useremo per evitare confusione con le
437   \textit{dentry} del kernel viste in sez.~\ref{sec:file_vfs_work}.
438   
439 \item Come mostrato in fig.~\ref{fig:file_filesys_detail} per i file
440   \texttt{macro.tex} e \texttt{gapil\_macro.tex}, ci possono avere più voci
441   che fanno riferimento allo stesso \textit{inode}. Fra le proprietà di un
442   file mantenute nell'\textit{inode} c'è anche il contatore con il numero di
443   riferimenti che sono stati fatti ad esso, il cosiddetto \textit{link
444     count}.\footnote{mantenuto anche nel campo \var{i\_nlink} della struttura
445     \kstruct{inode} di fig.~\ref{fig:kstruct_inode}.}  Solo quando questo
446   contatore si annulla i dati del file possono essere effettivamente rimossi
447   dal disco. Per questo la funzione per cancellare un file si chiama
448   \func{unlink} (vedi sez.~\ref{sec:file_link}), ed in realtà non cancella
449   affatto i dati del file, ma si limita ad eliminare la relativa voce da una
450   directory e decrementare il numero di riferimenti nell'\textit{inode}.
451   
452 \item All'interno di ogni filesystem ogni \textit{inode} è identificato da un
453   numero univoco. Il numero di \textit{inode} associato ad una voce in una
454   directory si riferisce ad questo numero e non ci può essere una directory
455   che contiene riferimenti ad \textit{inode} relativi ad altri filesystem.
456   Questa è la ragione che limita l'uso del comando \cmd{ln}, che crea una
457   nuova voce per un file esistente con la funzione \func{link} (vedi
458   sez.~\ref{sec:file_link}) a file nel filesystem corrente.
459   
460 \item Quando si cambia nome ad un file senza cambiare filesystem il contenuto
461   del file non viene spostato fisicamente, viene semplicemente creata una
462   nuova voce per l'\textit{inode} in questione e rimossa la precedente, questa
463   è la modalità in cui opera normalmente il comando \cmd{mv} attraverso la
464   funzione \func{rename} (vedi sez.~\ref{sec:file_remove}). Questa operazione
465   non modifica minimamente neanche l'\textit{inode} del file, dato che non si
466   opera sul file ma sulla directory che lo contiene.
467
468 \item Gli \textit{inode} dei file, che contengono i \textsl{metadati}, ed i
469   blocchi di spazio disco, che contengono i dati, sono risorse indipendenti ed
470   in genere vengono gestite come tali anche dai diversi filesystem; è pertanto
471   possibile esaurire sia lo spazio disco (il caso più comune) che lo spazio
472   per gli \textit{inode}. Nel primo caso non sarà possibile allocare ulteriore
473   spazio, ma si potranno creare file (vuoti), nel secondo non si potranno
474   creare nuovi file, ma si potranno estendere quelli che ci
475   sono.\footnote{questo comportamento non è generale, alcuni filesystem
476     evoluti possono evitare il problema dell'esaurimento degli \textit{inode}
477     riallocando lo spazio disco libero per i blocchi.}
478
479 \end{enumerate}
480
481 \begin{figure}[!htb]
482   \centering 
483   \includegraphics[width=12cm]{img/dir_links}
484   \caption{Organizzazione dei \textit{link} per le directory.}
485   \label{fig:file_dirs_link}
486 \end{figure}
487
488 Infine tenga presente che, essendo file pure loro, il numero di riferimenti
489 esiste anche per le directory. Per questo se a partire dalla situazione
490 mostrata in fig.~\ref{fig:file_filesys_detail} creiamo una nuova directory
491 \file{img} nella directory \file{gapil}, avremo una situazione come quella
492 illustrata in fig.~\ref{fig:file_dirs_link}.
493
494 La nuova directory avrà un numero di riferimenti pari a due, in quanto è
495 referenziata dalla directory da cui si era partiti (in cui è inserita la nuova
496 voce che fa riferimento a \texttt{img}) e dalla voce interna ``\texttt{.}''
497 che è presente in ogni directory.  Questo è il valore che si troverà sempre
498 per ogni directory che non contenga a sua volta altre directory. Al contempo,
499 la directory da cui si era partiti avrà un numero di riferimenti di almeno
500 tre, in quanto adesso sarà referenziata anche dalla voce ``\texttt{..}'' di
501 \texttt{img}. L'aggiunta di una sottodirectory fa cioè crescere di uno il
502 \textit{link count} della directory genitrice.
503
504 \itindend{inode}
505
506
507 \subsection{Alcuni dettagli sul filesystem \textsl{ext2} e successori}
508 \label{sec:file_ext2}
509
510
511 Benché non esista ``il'' filesystem di Linux, dato che esiste un supporto
512 nativo di diversi filesystem che sono in uso da anni, quello che gli avvicina
513 di più è la famiglia di filesystem evolutasi a partire dal \textit{second
514   extended filesystem}, o \acr{ext2}. Il filesystem \acr{ext2} ha subito un
515 grande sviluppo e diverse evoluzioni, fra cui l'aggiunta del
516 \textit{journaling} con \acr{ext3}, probabilmente ancora il filesystem più
517 diffuso, ed una serie di ulteriori miglioramento con il successivo \acr{ext4},
518 che sta iniziando a sostituirlo gradualmente. In futuro è previsto che questo
519 debba essere sostituito da un filesystem completamente diverso, \acr{btrfs},
520 che dovrebbe diventare il filesystem standard di Linux, ma questo al momento è
521 ancora in fase di sviluppo.\footnote{si fa riferimento al momento dell'ultima
522   revisione di di questo paragrafo, l'inizio del 2012.}
523
524 Il filesystem \acr{ext2} nasce come filesystem nativo per Linux a partire
525 dalle prime versioni del kernel e supporta tutte le caratteristiche di un
526 filesystem standard Unix: è in grado di gestire nomi di file lunghi (256
527 caratteri, estensibili a 1012) e supporta una dimensione massima dei file fino
528 a 4~Tb. I successivi filesystem \acr{ext3} ed \acr{ext4} sono evoluzioni di
529 questo filesystem, e sia pure con molti miglioramenti ed estensioni
530 significative ne mantengono le caratteristiche fondamentali.
531
532 Oltre alle caratteristiche standard, \acr{ext2} fornisce alcune estensioni che
533 non sono presenti su un classico filesystem di tipo Unix; le principali sono
534 le seguenti:
535 \begin{itemize}
536 \item i \textit{file attributes} consentono di modificare il comportamento del
537   kernel quando agisce su gruppi di file. Possono essere impostati su file e
538   directory e in quest'ultimo caso i nuovi file creati nella directory
539   ereditano i suoi attributi.
540 \item sono supportate entrambe le semantiche di BSD e SVr4 come opzioni di
541   montaggio. La semantica BSD comporta che i file in una directory sono creati
542   con lo stesso identificatore di gruppo della directory che li contiene. La
543   semantica SVr4 comporta che i file vengono creati con l'identificatore del
544   gruppo primario del processo, eccetto il caso in cui la directory ha il bit
545   di \acr{sgid} impostato (per una descrizione dettagliata del significato di
546   questi termini si veda sez.~\ref{sec:file_access_control}), nel qual caso
547   file e subdirectory ereditano sia il \ids{GID} che lo \acr{sgid}.
548 \item l'amministratore può scegliere la dimensione dei blocchi del filesystem
549   in fase di creazione, a seconda delle sue esigenze: blocchi più grandi
550   permettono un accesso più veloce, ma sprecano più spazio disco.
551 \item il filesystem implementa link simbolici veloci, in cui il nome del file
552   non è salvato su un blocco, ma tenuto all'interno \itindex{inode}
553   dell'\textit{inode} (evitando letture multiple e spreco di spazio), non
554   tutti i nomi però possono essere gestiti così per limiti di spazio (il
555   limite è 60 caratteri).
556 \item vengono supportati i file immutabili (che possono solo essere letti) per
557   la protezione di file di configurazione sensibili, o file
558   \textit{append-only} che possono essere aperti in scrittura solo per
559   aggiungere dati (caratteristica utilizzabile per la protezione dei file di
560   log).
561 \end{itemize}
562
563 La struttura di \acr{ext2} è stata ispirata a quella del filesystem di BSD: un
564 filesystem è composto da un insieme di blocchi, la struttura generale è quella
565 riportata in fig.~\ref{fig:file_filesys_detail}, in cui la partizione è divisa
566 in gruppi di blocchi.
567
568 Ciascun gruppo di blocchi contiene una copia delle informazioni essenziali del
569 filesystem (i \textit{superblock} sono quindi ridondati) per una maggiore
570 affidabilità e possibilità di recupero in caso di corruzione del
571 \textit{superblock} principale. L'utilizzo di raggruppamenti di blocchi ha
572 inoltre degli effetti positivi nelle prestazioni dato che viene ridotta la
573 distanza fra i dati e la tabella degli \itindex{inode} inode.
574
575 \begin{figure}[!htb]
576   \centering
577   \includegraphics[width=9cm]{img/dir_struct}  
578   \caption{Struttura delle directory nel \textit{second extended filesystem}.}
579   \label{fig:file_ext2_dirs}
580 \end{figure}
581
582 Le directory sono implementate come una \itindex{linked~list} \textit{linked
583   list} con voci di dimensione variabile. Ciascuna voce della lista contiene
584 il numero di inode \itindex{inode}, la sua lunghezza, il nome del file e la sua
585 lunghezza, secondo lo schema in fig.~\ref{fig:file_ext2_dirs}; in questo modo
586 è possibile implementare nomi per i file anche molto lunghi (fino a 1024
587 caratteri) senza sprecare spazio disco.
588
589 Con l'introduzione del filesystem \textit{ext3} sono state introdotte diverse
590 modifiche strutturali, la principale di queste è quella che \textit{ext3} è un
591 filesystem \textit{journaled}, è cioè in grado di eseguire una registrazione
592 delle operazioni di scrittura su un giornale (uno speciale file interno) in
593 modo da poter garantire il ripristino della coerenza dei dati del
594 filesystem\footnote{si noti bene che si è parlato di dati \textsl{del}
595   filesystem, non di dati \textsl{nel} filesystem, quello di cui viene
596   garantito un veloce ripristino è relativo ai dati della struttura interna
597   del filesystem, non di eventuali dati contenuti nei file che potrebbero
598   essere stati persi.} in brevissimo tempo in caso di interruzione improvvisa
599 della corrente o di crollo del sistema che abbia causato una interruzione
600 della scrittura dei dati sul disco.
601
602 Oltre a questo \textit{ext3} introduce ulteriori modifiche volte a migliorare
603 sia le prestazioni che la semplicità di gestione del filesystem, in
604 particolare per le directory si è passato all'uso di alberi binari con
605 indicizzazione tramite hash al posto delle \textit{linked list} che abbiamo
606 illustrato, ottenendo un forte guadagno di prestazioni in caso di directory
607 contenenti un gran numero di file.
608
609 % TODO portare a ext3, ext4 e btrfs ed illustrare le problematiche che si
610 % possono incontrare (in particolare quelle relative alla perdita di contenuti
611 % in caso di crash del sistema)
612
613
614 \subsection{La gestione dell'uso dei filesystem}
615 \label{sec:sys_file_config}
616
617 Come accennato in sez.~\ref{sec:file_arch_overview} per poter accedere ai file
618 occorre prima rendere disponibile al sistema il filesystem su cui essi sono
619 memorizzati; l'operazione di attivazione del filesystem è chiamata
620 \textsl{montaggio}, per far questo in Linux si usa la funzione \funcd{mount},
621 il cui prototipo è:\footnote{la funzione è una versione specifica di Linux che
622   usa la omonima \textit{system call} e non è portabile.}
623
624 \begin{funcproto}{ 
625 \fhead{sys/mount.h} 
626 \fdecl{mount(const char *source, const char *target, const char
627   *filesystemtype, \\ 
628 \phantom{mount(}unsigned long mountflags, const void *data)}
629 \fdesc{Monta un filesystem.} 
630 }
631
632 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
633   caso \var{errno} assumerà uno dei valori:
634   \begin{errlist}
635   \item[\errcode{EACCES}] non si ha il permesso di accesso su uno dei
636     componenti del \itindex{pathname} \textit{pathname}, o si è cercato di
637     montare un filesystem disponibile in sola lettura senza aver specificato
638     \const{MS\_RDONLY} o il device \param{source} è su un filesystem montato
639     con l'opzione \const{MS\_NODEV}.
640   \item[\errcode{EBUSY}] \param{source} è già montato, o non può essere
641     rimontato in sola lettura perché ci sono ancora file aperti in scrittura,
642     o non può essere montato su \param{target} perché la directory è ancora in
643     uso.
644   \item[\errcode{EINVAL}] il dispositivo \param{source} presenta un
645     \textit{superblock} non valido, o si è cercato di rimontare un filesystem
646     non ancora montato, o di montarlo senza che \param{target} sia un
647     \itindex{mount~point} \textit{mount point} o di spostarlo
648     quando \param{target} non è un \itindex{mount~point} \textit{mount point}
649     o è la radice.
650   \item[\errcode{ELOOP}] si è cercato di spostare un \itindex{mount~point}
651     \textit{mount point} su una sottodirectory di \param{source} o si sono
652     incontrati troppi link simolici nella risoluzione di un nome.
653   \item[\errcode{EMFILE}] in caso di filesystem virtuale, la tabella dei
654     dispositivi fittizi (chiamati \textit{dummy} nella documentazione inglese)
655     è piena.
656   \item[\errcode{ENODEV}] il tipo \param{filesystemtype} non esiste o non è
657     configurato nel kernel.
658   \item[\errcode{ENOTBLK}] non si è usato un \textit{block device} per
659     \param{source} quando era richiesto.
660   \item[\errcode{ENXIO}] il \itindex{major~number} \textit{major number} del
661     dispositivo \param{source} è sbagliato.
662   \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
663   \end{errlist} 
664   ed inoltre \errval{EFAULT}, \errval{ENOMEM}, \errval{ENAMETOOLONG},
665   \errval{ENOENT}, \errval{ENOTDIR} nel loro significato generico.}
666 \end{funcproto}
667
668 La funzione monta sulla directory indicata da \param{target}, detta
669 \itindex{mount~point} \textit{mount point}, il filesystem contenuto nel file
670 di dispositivo indicato da \param{source}. In entrambi i casi, come daremo per
671 assunto da qui in avanti tutte le volte che si parla di directory o file nel
672 passaggio di un argomento di una funzione, si intende che questi devono essere
673 indicati con la stringa contenente il loro \itindex{pathname}
674 \textit{pathname}.
675
676 Normalmente un filesystem è contenuto su un disco o una partizione, ma come
677 illustrato in sez.~\ref{sec:file_vfs_work} la struttura del
678 \itindex{Virtual~File~System} \textit{Virtual File System} è estremamente
679 flessibile e può essere usata anche per oggetti diversi da un disco. Ad
680 esempio usando il \textit{loop device} si può montare un file qualunque (come
681 l'immagine di un CD-ROM o di un floppy) che contiene l'immagine di un
682 filesystem, inoltre alcuni tipi di filesystem, come \texttt{proc} o
683 \texttt{sysfs} sono virtuali e non hanno un supporto che ne contenga i dati,
684 che invece sono generati al volo ad ogni lettura, e passati indietro al kernel
685 ad ogni scrittura.\footnote{costituiscono quindi un meccanismo di
686   comunicazione, attraverso l'ordinaria interfaccia dei file, con il kernel.}
687
688 Il tipo di filesystem che si vuole montare è specificato
689 dall'argomento \param{filesystemtype}, che deve essere una delle stringhe
690 riportate nel file \procfile{/proc/filesystems} che, come accennato in
691 sez.~\ref{sec:file_vfs_work}, contiene l'elenco dei filesystem supportati dal
692 kernel. Nel caso si sia indicato un filesystem virtuale, che non è associato a
693 nessun file di dispositivo, il contenuto di \param{source} viene ignorato.
694
695 L'argomento \param{data} viene usato per passare le impostazioni relative alle
696 caratteristiche specifiche di ciascun filesystem. Si tratta di una stringa di
697 parole chiave (separate da virgole e senza spazi) che indicano le cosiddette
698 ``\textsl{opzioni}'' del filesystem che devono essere impostate; in genere
699 viene usato direttamente il contenuto del parametro dell'opzione \texttt{-o}
700 del comando \texttt{mount}. I valori utilizzabili dipendono dal tipo di
701 filesystem e ciascuno ha i suoi, pertanto si rimanda alla documentazione della
702 pagina di manuale di questo comando e dei singoli filesystem.
703
704 Dopo l'esecuzione della funzione il contenuto del filesystem viene resto
705 disponibile nella directory specificata come \itindex{mount~point}
706 \textit{mount point}, il precedente contenuto di detta directory viene
707 mascherato dal contenuto della directory radice del filesystem montato. Fino
708 ai kernel della serie 2.2.x non era possibile montare un filesytem se un
709 \textit{mount point} era già in uso. 
710
711 A partire dal kernel 2.4.x inoltre è divenuto possibile sia spostare
712 atomicamente un \itindex{mount~point} \textit{mount point} da una directory ad
713 un'altra, sia montare lo stesso filesystem in diversi \itindex{mount~point}
714 \textit{mount point}, sia montare più filesystem sullo stesso
715 \itindex{mount~point} \textit{mount point} impilandoli l'uno sull'altro, nel
716 qual caso vale comunque quanto detto in precedenza, e cioè che solo il
717 contenuto dell'ultimo filesystem montato sarà visibile.
718
719 Oltre alle opzioni specifiche di ciascun filesystem, che si passano nella
720 forma della lista di parole chiave indicata con l'argomento \param{data},
721 esistono pure alcune opzioni che si possono applicare in generale, anche se
722 non è detto che tutti i filesystem le supportino, che si specificano tramite
723 l'argomento \param{mountflags}.  L'argomento inoltre può essere utilizzato per
724 modificare il comportamento della funzione, facendole compiere una operazione
725 diversa (ad esempio un rimontaggio, invece che un montaggio).
726
727 In Linux \param{mountflags} deve essere un intero a 32 bit; fino ai kernel
728 della serie 2.2.x i 16 più significativi avevano un valore riservato che
729 doveva essere specificato obbligatoriamente,\footnote{il valore era il
730   \itindex{magic~number} \textit{magic number} \code{0xC0ED}, si può usare la
731   costante \const{MS\_MGC\_MSK} per ottenere la parte di \param{mountflags}
732   riservata al \textit{magic number}, mentre per specificarlo si può dare un
733   OR aritmetico con la costante \const{MS\_MGC\_VAL}.} e si potevano usare
734 solo i 16 meno significativi. Oggi invece, con un numero di opzioni superiore,
735 sono utilizzati tutti e 32 i bit, ma qualora nei 16 più significativi sia
736 presente detto valore, che non esprime una combinazione valida, esso viene
737 ignorato. Il valore dell'argomento deve essere espresso come maschera binaria
738 e i vari bit devono essere impostati con un OR aritmetico dei rispettivi flag,
739 identificati dalle costanti riportate nell'elenco seguente:
740
741 \begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}}
742 \itindbeg{bind~mount}
743 \item[\const{MS\_BIND}] Effettua un cosiddetto \textit{bind mount}, in cui è
744   possibile montare una directory di un filesystem in un'altra directory,
745   l'opzione è disponibile a partire dai kernel della serie 2.4. In questo caso
746   verranno presi in considerazione solo gli argomenti \param{source}, che
747   stavolta indicherà la directory che si vuole montare (e non un file di
748   dispositivo) e \param{target} che indicherà la directory su cui verrà
749   effettuato il \textit{bind mount}. Gli argomenti \param{filesystemtype}
750   e \param{data} vengono ignorati.
751
752   In sostanza quello che avviene è che in corrispondenza del \index{pathname}
753   \textit{pathname} indicato da \param{target} viene montato l'\textit{inode}
754   di \param{source}, così che la porzione di albero dei file presente sotto
755   \param{source} diventi visibile allo stesso modo sotto
756   \param{target}. Trattandosi esattamente dei dati dello stesso filesystem,
757   ogni modifica fatta in uno qualunque dei due rami di albero sarà visibile
758   nell'altro, visto che entrambi faranno riferimento agli stessi
759   \textit{inode}.
760
761   Dal punto di vista del \itindex{Virtual~File~System} VFS l'operazione è
762   analoga al montaggio di un filesystem proprio nel fatto che anche in questo
763   caso si inserisce in corripondenza della \textit{dentry} di \texttt{target}
764   un diverso \textit{inode}, che stavolta, invece di essere quello della
765   radice del filesystem indicato da un file di dispositivo, è quello di una
766   directory già montata.
767
768   Si tenga presente che proprio per questo sotto \param{target} comparirà il
769   contenuto che è presente sotto \param{source} all'interno del filesystem in
770   cui quest'ultima è contenuta. Questo potrebbe non corrispondere alla
771   porzione di albero che sta sotto \param{source} qualora in una
772   sottodirectory di quest'ultima si fosse effettuato un altro montaggio. In
773   tal caso infatti nella porzione di albero sotto \param{source} si troverebbe
774   il contenuto del nuovo filesystem (o di un altro \textit{bind mount}) mentre
775   sotto \param{target} ci sarebbe il contenuto presente nel filesystem
776   originale.\footnote{questo evita anche il problema dei \textit{loop} di
777     fig.~\ref{fig:file_link_loop}, dato che se anche si montasse su
778     \param{target} una directory in cui essa è contenuta, il cerchio non
779     potrebbe chiudersi perché ritornati a \param{target} dentro il
780     \textit{bind mount} vi si troverebbe solo il contenuto originale e non si
781     potrebbe tornare indietro.}
782
783   Fino al kernel 2.6.26 questo flag doveva essere usato da solo, in quanto il
784   \textit{bind mount} continuava ad utilizzare le stesse opzioni del montaggio
785   originale, dal 2.6.26 è stato introdotto il supporto per il cosiddetto
786   \textit{read-only bind mount} e viene onorata la presenza del flag
787   \const{MS\_RDONLY}. In questo modo si ottiene che l'accesso ai file sotto
788   \param{target} sia effettuabile esclusivamente in sola lettura.
789
790   Il supporto per il \textit{bind mount} consente di superare i limiti
791   presenti per gli \textit{hard link} (di cui parleremo in
792   sez.~\ref{sec:file_link}) ottenendo un qualcosa di analogo in cui si può
793   fare riferimento alla porzione dell'albero dei file di un filesystem
794   presente a partire da una certa directory utilizzando una qualunque altra
795   directory, anche se questa sta su un filesystem diverso. Si può così fornire
796   una alternativa all'uso dei link simbolici (di cui parleremo in
797   sez.~\ref{sec:file_symlink}) che funziona correttamente anche all'intero di
798   un \textit{chroot} (argomento su cui torneremo in
799   sez.~\ref{sec:file_chroot}.  
800 \itindend{bind~mount}
801
802 \item[\const{MS\_DIRSYNC}] Richiede che ogni modifica al contenuto di una
803   directory venga immediatamente registrata su disco in maniera sincrona
804   (introdotta a partire dai kernel della serie 2.6). L'opzione si applica a
805   tutte le directory del filesystem, ma su alcuni filesystem è possibile
806   impostarla a livello di singole directory o per i sottorami di una directory
807   con il comando \cmd{lsattr}.\footnote{questo avviene tramite delle opportune
808     \texttt{ioctl} (vedi sez.~\ref{sec:file_ioctl}).}
809
810   Questo consente di ridurre al minimo il rischio di perdita dei dati delle
811   directory in caso di crollo improvviso del sistema, al costo di una certa
812   perdita di prestazioni dato che le funzioni di scrittura relative ad
813   operazioni sulle directory non saranno più bufferizzate e si bloccheranno
814   fino all'arrivo dei dati sul disco prima che un programma possa proseguire.
815
816 \item[\const{MS\_MANDLOCK}] Consente l'uso del \textit{mandatory locking}
817   \itindex{mandatory~locking} (vedi sez.~\ref{sec:file_mand_locking}) sui file
818   del filesystem. Per poterlo utilizzare effettivamente però esso dovrà essere
819   comunque attivato esplicitamente per i singoli file impostando i permessi
820   come illustrato in sez.~\ref{sec:file_mand_locking}.
821
822 \item[\const{MS\_MOVE}] Effettua uno del spostamento del \itindex{mount~point}
823   \textit{mount point} di un filesystem. La directory del
824   \itindex{mount~point} \textit{mount point} originale deve essere indicata
825   nell'argomento \param{source}, e la sua nuova posizione
826   nell'argomento \param{target}. Tutti gli altri argomenti della funzione
827   vengono ignorati.
828
829   Lo spostamento avviene atomicamente, ed il ramo di albero presente
830   sotto \param{source} sarà immediatamante visibile sotto \param{target}. Non
831   esiste cioè nessun momento in cui il filesystem non risulti montato in una o
832   nell'altra directory e pertanto è garantito che la risoluzione di
833   \textit{pathname} relativi all'interno del filesystem non possa fallire.
834
835 \item[\const{MS\_NOATIME}] Viene disabilitato sul filesystem l'aggiornamento
836   degli \textit{access time} (vedi sez.~\ref{sec:file_file_times}) per
837   qualunque tipo di file. Dato che l'aggiornamento degli \textit{access time}
838   è una funzionalità la cui utilità è spesso irrilevante ma comporta un costo
839   elevato visto che una qualunque lettura comporta comunque una scrittura su
840   disco,\footnote{e questo ad esempio ha conseguenze molto pesanti nell'uso
841     della batteria sui portatili.} questa opzione consente di disabilitarla
842   completamente. La soluzione può risultare troppo drastica dato che
843   l'informazione viene comunque utilizzata da alcuni programmi, per cui nello
844   sviluppo del kernel sono state introdotte altre opzioni che forniscono
845   soluzioni più appropriate e meno radicali.
846
847 \item[\const{MS\_NODEV}] Viene disabilitato sul filesystem l'accesso ai file
848   di dispositivo eventualmente presenti su di esso. L'opzione viene usata come
849   misura di precauzione per rendere inutile la presenza di eventuali file di
850   dispositivo su filesystem che non dovrebbero contenerne.\footnote{si ricordi
851     che le convenzioni del \itindex{Filesystem~Hierarchy~Standard~(FHS)}
852     \textit{Linux Filesystem Hierarchy Standard} richiedono che questi siano
853     mantenuti esclusivamente sotto \texttt{/dev}.}
854
855   Viene utilizzata, assieme a \const{MS\_NOEXEC} e \const{MS\_NOSUID}, per
856   fornire un accesso più controllato a quei filesystem di cui gli utenti hanno
857   il controllo dei contenuti, in particolar modo quelli posti su dispositivi
858   rimuovibili. In questo modo si evitano alla radice possibili situazioni in
859   cui un utente malizioso inserisce su uno di questi filesystem dei file di
860   dispositivo con permessi ``opportunamente'' ampliati che gli consentano di
861   accedere anche a risorse cui non dovrebbe.
862
863 \item[\const{MS\_NODIRATIME}] Viene disabilitato sul filesystem
864   l'aggiornamento degli \textit{access time} (vedi
865   sez.~\ref{sec:file_file_times}), ma soltanto per le directory. Costituisce
866   una alternativa per \const{MS\_NOATIME}, che elimina l'informazione per le
867   directory, che in pratica che non viene mai utilizzata, mantenendola per i
868   file in cui invece ha un impiego, sia pur limitato.
869
870 \item[\const{MS\_NOEXEC}] Viene disabilitata sul filesystem l'esecuzione di un
871   qualunque file eseguibile eventualmente presente su di esso. L'opzione viene
872   usata come misura di precauzione per rendere impossibile l'uso di programmi
873   posti su filesystem che non dovrebbero contenerne.
874
875   Anche in questo caso viene utilizzata per fornire un accesso più controllato
876   a quei filesystem di cui gli utenti hanno il controllo dei contenuti. Da
877   questo punto di vista l'opzione è meno importante delle analoghe
878   \const{MS\_NODEV} e \const{MS\_NOSUID} in quanto l'esecuzione di un
879   programma creato dall'utente pone un livello di rischio nettamente
880   inferiore, ed è in genere consentita per i file contenuti nella sua home
881   directory.\footnote{cosa che renderebbe superfluo l'attivazione di questa
882     opzione, il cui uso ha senso solo per ambienti molto controllati in cui si
883     vuole che gli utenti eseguano solo i programmi forniti
884     dall'amministratore.}
885
886 \item[\const{MS\_NOSUID}] Viene disabilitato sul filesystem l'effetto dei bit
887   dei permessi \itindex{suid~bit} \acr{suid} e \itindex{sgid~bit} \acr{sgid}
888   (vedi sez.~\ref{sec:file_special_perm}) eventualmente presenti sui file in
889   esso contenuti. L'opzione viene usata come misura di precauzione per rendere
890   inefficace l'effetto di questi bit per filesystem in cui non ci dovrebbero
891   essere file dotati di questi permessi.
892
893   Di nuovo viene utilizzata, analogamente a \const{MS\_NOEXEC} e
894   \const{MS\_NODEV}, per fornire un accesso più controllato a quei filesystem
895   di cui gli utenti hanno il controllo dei contenuti. In questo caso si evita
896   che un utente malizioso possa inserire su uno di questi filesystem un
897   eseguibile con il bit \itindex{suid~bit} \acr{suid} attivo e di proprietà
898   dell'amministratore o di un altro utente, che gli consentirebbe di eseguirlo
899   per conto di quest'ultimo.
900
901 \item[\const{MS\_PRIVATE}] Marca un \textit{mount point} come privato. Si
902   tratta di una delle nuove opzioni (insieme a \const{MS\_SHARED},
903   \const{MS\_SLAVE} e \const{MS\_UNBINDABLE}) facenti parte
904   dell'infrastruttura degli \itindex{shared~subtree} \textit{shared subtree}
905   introdotta a partire dal kernel 2.6.15, che estendono le funzionalità dei
906   \itindex{bind~mount} \textit{bind mount}. In questo caso
907   \param{target} dovrà fare riferimento al \textit{mount point} che si intende
908   marcare, e tutti gli altri argomenti verranno ignorati.
909
910   Di default, finché non lo si marca altrimenti con una delle altre opzioni
911   dell'interfaccia \itindex{shared~subtree} \textit{shared subtree}, ogni
912   \textit{mount point} è privato. Ogni \textit{bind mount} ottenuto da un
913   \textit{mount point} di tipo \textit{private} si comporta come descritto
914   nella trattazione di \const{MS\_BIND}. Si usa questo flag principalmente per
915   revocare gli effetti delle altre opzioni e riportare il comportamento a
916   quello ordinario.
917
918 \item[\const{MS\_RDONLY}] Esegue il montaggio del filesystem in sola lettura,
919   non sarà possibile nessuna modifica ai suoi contenuti. Viene usato tutte le
920   volte che si deve accedere ai contenuti di un filesystem con la certezza che
921   questo non venga modificato (ad esempio per ispezionare un filesystem
922   corrotto). All'avvio di default il kernel monta la radice in questa
923   modalità.
924
925 \item[\const{MS\_REC}] Applica ricorsivamente a tutti i \textit{mount point}
926   presenti al di sotto del \textit{mount point} indicato gli effetti della
927   opzione degli \itindex{shared~subtree} \textit{shared subtree}
928   associata. Anche questo caso l'argomento \param{target} deve fare
929   riferimento ad un \textit{mount point} e tutti gli altri argomenti sono
930   ignorati, ed il flag deve essere indicato assieme ad una fra
931   \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
932   \const{MS\_UNBINDABLE}.
933
934 \item[\const{MS\_RELATIME}] Indica di effettuare l'aggiornamento degli
935   \textit{access time} sul filesystem soltanto quando questo risulti
936   antecendente il valore corrente del \textit{modification time} o del
937   \textit{change time} (per i tempi dei file si veda
938   sez.~\ref{sec:file_file_times}). L'opzione è disponibile a partire dal
939   kernel 2.6.20, mentre dal 2.6.30 questo è diventato il comportamento di
940   default del sistema, che può essere riportato a quello tradizionale con
941   l'uso di \const{MS\_STRICTATIME}. Sempre dal 2.6.30 il comportamento è stato
942   anche modificato e l'\textit{access time} viene comunque aggiornato se è più
943   vecchio di un giorno.
944
945   L'opzione consente di evitare i problemi di prestazioni relativi
946   all'aggiornamento dell'\textit{access time} senza avere impatti negativi
947   riguardo le funzionalità, il comportamento adottato infatti consente di
948   rendere evidente che vi è stato un accesso dopo la scrittura, ed evitando al
949   contempo ulteriori operazioni su disco negli accessi successivi. In questo
950   modo l'informazione relativa al fatto che un file sia stato letto resta
951   disponibile, ed i programmi che ne fanno uso continuano a funzionare. Con
952   l'introduzione di questo comportamento l'uso delle alternative
953   \const{MS\_NOATIME} e \const{MS\_NODIRATIME} è sostanzialmente inutile.
954
955 \item[\const{MS\_REMOUNT}] Consente di rimontare un filesystem già montato
956   cambiandone le opzioni di montaggio in maniera atomica. In questo modo si
957   possono modificare le opzioni del filesystem anche se questo è in uso. Gli
958   argomenti \param{source} e \param{target} devono essere gli stessi usati per
959   il montaggio originale, mentre \param{data} che \param{mountflags}
960   conterranno le nuove opzioni, \param{filesystemtype} viene ignorato.
961
962   Qualunque opzione specifica del filesystem indicata con \param{data} può
963   essere modificata, mentre con \param{mountflags} possono essere modificate
964   solo alcune opzioni generiche. Con i kernel più recenti queste sono soltanto
965   \const{MS\_MANDLOCK}, \const{MS\_RDONLY} e \const{MS\_SYNCHRONOUS}, prima
966   del kernel 2.6.16 potevano essere modificate anche le ulteriori
967   \const{MS\_NOATIME} e \const{MS\_NODIRATIME}, ed infine prima del kernel
968   2.4.10 anche \const{MS\_NODEV}, \const{MS\_NOEXEC} e \const{MS\_NOSUID}.
969
970 \item[\const{MS\_SHARED}] Marca un \textit{mount point} come \textit{shared
971     mount}.  Si tratta di una delle nuove opzioni (insieme a
972   \const{MS\_PRIVATE}, \const{MS\_SLAVE} e \const{MS\_UNBINDABLE}) facenti
973   parte dell'infrastruttura degli \itindex{shared~subtree} \textit{shared
974     subtree} introdotta a partire dal kernel 2.6.15, che estendono le
975   funzionalità dei \itindex{bind~mount} \textit{bind mount}.  In questo caso
976   \param{target} dovrà fare riferimento al \textit{mount point} che si intende
977   marcare, e tutti gli altri argomenti verranno ignorati.
978
979   Lo scopo dell'opzione è ottenere che tutti i successivi \textit{bind mount}
980   effettuati da un \textit{mount point} marcato da essa siano di tipo
981   \textit{shared}, cioè ``\textsl{condividano}'' con l'originale e fra di loro
982   ogni ulteriore operazione di montaggio o smontaggio che avviene su una
983   directory al di sotto di uno qualunque di essi. Le operazioni di montaggio e
984   smontaggio cioè vengono ``\textsl{propagate}'' a tutti i \textit{mount
985     point} della stessa condivisione, e la sezione di albero di file vista al
986   di sotto di ciascuno di essi sarà sempre identica.
987
988 \item[\const{MS\_SILENT}] Richiede la soppressione di alcuni messaggi di
989   avvertimento nei log del kernel (vedi sez.~\ref{sec:sess_daemon}). L'opzione
990   è presente a partire dal kernel 2.6.17 e sostituisce, utilizzando un nome
991   non fuorviante, la precedente \const{MS\_VERBOSE}, introdotta nel kernel
992   2.6.12, che aveva lo stesso effetto.
993
994 \item[\const{MS\_SLAVE}] Marca un \textit{mount point} come \textit{slave
995     mount}. Si tratta di una delle nuove opzioni (insieme a
996   \const{MS\_PRIVATE}, \const{MS\_SHARED} e \const{MS\_UNBINDABLE}) facenti
997   parte dell'infrastruttura degli \itindex{shared~subtree} \textit{shared
998     subtree} introdotta a partire dal kernel 2.6.15, che estendono le
999   funzionalità dei \itindex{bind~mount} \textit{bind mount}.  In questo caso
1000   \param{target} dovrà fare riferimento al \textit{mount point} che si intende
1001   marcare, e tutti gli altri argomenti verranno ignorati.
1002
1003   Lo scopo dell'opzione è ottenere che tutti i successivi \textit{bind mount}
1004   effettuati da un \textit{mount point} marcato da essa siano di tipo
1005   \textit{slave}, cioè ``\textsl{condividano}'' ogni ulteriore operazione di
1006   montaggio o smontaggio che avviene su una directory al di sotto del
1007   \textit{mount point} originale.  Le operazioni di montaggio e smontaggio in
1008   questo caso vengono ``\textsl{propagate}'' soltanto dal \textit{mount point}
1009   originale (detto anche \textit{master}) verso gli \textit{slave}, mentre
1010   essi potranno eseguire al loro interno ulteriori montaggi che non saranno
1011   propagati né negli altri né nel \textit{mount point} originale. 
1012
1013 \item[\const{MS\_STRICTATIME}] Ripristina il comportamento tradizionale per
1014   cui l'\textit{access time} viene aggiornato ad ogni accesso al
1015   file. L'opzione è disponibile solo a partire dal kernel 2.6.30 quando il
1016   comportamento di default del kernel è diventato quello fornito da
1017   \const{MS\_RELATIME}.
1018
1019 \item[\const{MS\_SYNCHRONOUS}] Abilita la scrittura sincrona richiedendo che
1020   ogni modifica al contenuto del filesystem venga immediatamente registrata su
1021   disco. Lo stesso comportamento può essere ottenuto con il flag
1022   \const{O\_SYNC} di \func{open} (vedi sez.~\ref{sec:file_open}).
1023
1024   Questa opzione consente di ridurre al minimo il rischio di perdita dei dati
1025   in caso di crollo improvviso del sistema, al costo di una pesante perdita di
1026   prestazioni dato che tutte le funzioni di scrittura non saranno più
1027   bufferizzate e si bloccheranno fino all'arrivo dei dati sul disco. Per un
1028   compromesso in cui questo comportamento avviene solo per le directory, ed ha
1029   quindi una incidenza nettamente minore, si può usare \const{MS\_DIRSYNC}.
1030
1031 \item[\const{MS\_UNBINDABLE}] Marca un \textit{mount point} come
1032   \textit{unbindable mount}. Si tratta di una delle nuove opzioni (insieme a
1033   \const{MS\_PRIVATE}, \const{MS\_SHARED} e \const{MS\_SLAVE}) facenti parte
1034   dell'infrastruttura degli \itindex{shared~subtree} \textit{shared subtree}
1035   introdotta a partire dal kernel 2.6.15, che estendono le funzionalità dei
1036   \itindex{bind~mount} \textit{bind mount}.  In questo caso
1037   \param{target} dovrà fare riferimento al \textit{mount point} che si intende
1038   marcare, e tutti gli altri argomenti verranno ignorati.
1039
1040   Un \textit{mount point} marcato in questo modo disabilità la capacità di
1041   eseguire dei \itindex{bind~mount} \textit{bind mount}. Si comporta cioè come
1042   allo stesso modo di un \textit{mount point} ordinario di tipo
1043   \textit{private} con in più la restrizione che nessuna sua sottodirectory
1044   (anche se relativa ad un ulteriore montaggio) possa essere utilizzata per un
1045   come sorgente di un \itindex{bind~mount} \textit{bind mount}.
1046
1047 \end{basedescript}
1048
1049
1050 % NOTE per \const{MS\_SLAVE},\const{MS\_SHARE}, \const{MS\_PRIVATE} e
1051 % \const{MS\_UNBINDABLE} dal 2.6.15 vedi shared subtrees, in particolare
1052 %  * http://lwn.net/Articles/159077/ e
1053 %  * Documentation/filesystems/sharedsubtree.txt
1054
1055 % TODO: (bassa priorità) non documentati ma presenti in sys/mount.h:
1056 %       * MS_POSIXACL
1057 %       * MS_KERNMOUNT
1058 %       * MS_I_VERSION
1059 %       * MS_ACTIVE
1060 %       * MS_NOUSER
1061
1062 La funzione \func{mount} può essere utilizzata anche per effettuare il
1063 \textsl{rimontaggio} di un filesystem, cosa che permette di cambiarne al volo
1064 alcune delle caratteristiche di funzionamento (ad esempio passare da sola
1065 lettura a lettura/scrittura). Questa operazione è attivata attraverso uno dei
1066 bit di \param{mountflags}, \const{MS\_REMOUNT}, che se impostato specifica che
1067 deve essere effettuato il rimontaggio del filesystem (con le opzioni
1068 specificate dagli altri bit), anche in questo caso il valore di \param{source}
1069 viene ignorato.
1070
1071 Una volta che non si voglia più utilizzare un certo filesystem è possibile
1072 \textsl{smontarlo} usando la funzione \funcd{umount}, il cui prototipo è:
1073
1074 \begin{funcproto}{ 
1075 \fhead{sys/mount.h}
1076 \fdecl{umount(const char *target)}
1077 \fdesc{Smonta un filesystem.} 
1078 }
1079 {La funzione ritorna  $0$ in caso 
1080   di successo e $-1$  per un errore,
1081   nel qual caso \var{errno} assumerà uno dei valori: 
1082   \begin{errlist}
1083   \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
1084   \item[\errcode{EBUSY}]  \param{target} è la directory di lavoro di qualche
1085   processo, o contiene dei file aperti, o un altro mount point.
1086 \end{errlist}ed inoltre \errval{ENOTDIR}, \errval{EFAULT}, \errval{ENOMEM},
1087 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ELOOP} nel loro
1088   significato generico.}
1089 \end{funcproto}
1090
1091 La funzione prende il nome della directory su cui il filesystem è montato e
1092 non il file o il dispositivo che è stato montato,\footnote{questo è vero a
1093   partire dal kernel 2.3.99-pre7, prima esistevano due chiamate separate e la
1094   funzione poteva essere usata anche specificando il file di dispositivo.} in
1095 quanto con il kernel 2.4.x è possibile montare lo stesso dispositivo in più
1096 punti. Nel caso più di un filesystem sia stato montato sullo stesso
1097 \itindex{mount~point} \textit{mount point} viene smontato quello che è stato
1098 montato per ultimo.
1099
1100 Si tenga presente che la funzione fallisce quando il filesystem è
1101 \textsl{occupato}, questo avviene quando ci sono ancora file aperti sul
1102 filesystem, se questo contiene la directory di lavoro corrente di un qualunque
1103 processo o il \itindex{mount~point} \textit{mount point} di un altro
1104 filesystem; in questo caso l'errore restituito è \errcode{EBUSY}.
1105
1106 Linux provvede inoltre una seconda funzione, \funcd{umount2}, che in alcuni
1107 casi permette di forzare lo smontaggio di un filesystem, anche quando questo
1108 risulti occupato; il suo prototipo è:
1109 \begin{funcproto}{ 
1110 \fhead{sys/mount.h}
1111 \fdecl{umount2(const char *target, int flags)}
1112 \fdesc{Smonta un filesystem.} 
1113 }
1114 {La funzione è identica a \func{umount} per valori di ritorno e codici di
1115   errore. }
1116 \end{funcproto}
1117
1118 Il valore di \param{flags} è una maschera binaria, e al momento l'unico valore
1119 definito è il bit \const{MNT\_FORCE}; gli altri bit devono essere nulli.
1120 Specificando \const{MNT\_FORCE} la funzione cercherà di liberare il filesystem
1121 anche se è occupato per via di una delle condizioni descritte in precedenza. A
1122 seconda del tipo di filesystem alcune (o tutte) possono essere superate,
1123 evitando l'errore di \errcode{EBUSY}.  In tutti i casi prima dello smontaggio
1124 viene eseguita una sincronizzazione dei dati. 
1125
1126 % TODO documentare MNT_DETACH e MNT_EXPIRE ...
1127
1128 Altre due funzioni specifiche di Linux,\footnote{esse si trovano anche su BSD,
1129   ma con una struttura diversa.} utili per ottenere in maniera diretta
1130 informazioni riguardo al filesystem su cui si trova un certo file, sono
1131 \funcd{statfs} e \funcd{fstatfs}, i cui prototipi sono:
1132
1133 \begin{funcproto}{ 
1134 \fhead{sys/vfs.h}
1135 \fdecl{int statfs(const char *path, struct statfs *buf)}
1136 \fdecl{int fstatfs(int fd, struct statfs *buf)}
1137 \fdesc{Restituiscono informazioni relative ad un filesystem.} 
1138 }
1139 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
1140   nel qual caso \var{errno} assumerà uno dei valori: 
1141   \begin{errlist}
1142   \item[\errcode{ENOSYS}] il filesystem su cui si trova il file specificato non
1143   \end{errlist} ed inoltre \errval{EFAULT} ed \errval{EIO} per entrambe,
1144   \errval{EBADF} per \func{fstatfs}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
1145   \errval{ENOENT}, \errval{EACCES}, \errval{ELOOP} per \func{statfs} nel loro
1146   significato generico.}
1147 \end{funcproto}
1148
1149
1150 Queste funzioni permettono di ottenere una serie di informazioni generali
1151 riguardo al filesystem su cui si trova il file specificato; queste vengono
1152 restituite all'indirizzo \param{buf} di una struttura \struct{statfs} definita
1153 come in fig.~\ref{fig:sys_statfs}, ed i campi che sono indefiniti per il
1154 filesystem in esame sono impostati a zero.  I valori del campo \var{f\_type}
1155 sono definiti per i vari filesystem nei relativi file di header dei sorgenti
1156 del kernel da costanti del tipo \var{XXX\_SUPER\_MAGIC}, dove \var{XXX} in
1157 genere è il nome del filesystem stesso.
1158
1159 \begin{figure}[!htb]
1160   \footnotesize \centering
1161   \begin{minipage}[c]{\textwidth}
1162     \includestruct{listati/statfs.h}
1163   \end{minipage}
1164   \normalsize 
1165   \caption{La struttura \structd{statfs}.} 
1166   \label{fig:sys_statfs}
1167 \end{figure}
1168
1169
1170 Le \acr{glibc} provvedono infine una serie di funzioni per la gestione dei due
1171 file \conffile{/etc/fstab} ed \conffile{/etc/mtab}, che convenzionalmente sono
1172 usati in quasi tutti i sistemi unix-like per mantenere rispettivamente le
1173 informazioni riguardo ai filesystem da montare e a quelli correntemente
1174 montati. Le funzioni servono a leggere il contenuto di questi file in
1175 opportune strutture \struct{fstab} e \struct{mntent}, e, per
1176 \conffile{/etc/mtab} per inserire e rimuovere le voci presenti nel file.
1177
1178 In generale si dovrebbero usare queste funzioni (in particolare quelle
1179 relative a \conffile{/etc/mtab}), quando si debba scrivere un programma che
1180 effettua il montaggio di un filesystem; in realtà in questi casi è molto più
1181 semplice invocare direttamente il programma \cmd{mount}, per cui ne
1182 tralasceremo la trattazione, rimandando al manuale delle \acr{glibc}
1183 \cite{glibc} per la documentazione completa.
1184
1185 % TODO scrivere relativamente alle varie funzioni (getfsent e getmntent &C)
1186 % TODO documentare swapon e swapoff (man 2 ...)
1187
1188
1189
1190
1191
1192 \section{La gestione di file e directory}
1193 \label{sec:file_dir}
1194
1195 Come già accennato in sez.~\ref{sec:file_filesystem} in un sistema unix-like
1196 la gestione dei file ha delle caratteristiche specifiche che derivano
1197 direttamente dall'architettura del sistema.  In questa sezione esamineremo le
1198 funzioni usate per la manipolazione di file e directory, per la creazione di
1199 link simbolici e diretti, per la gestione e la lettura delle directory.
1200
1201 In particolare ci soffermeremo sulle conseguenze che derivano
1202 dall'architettura dei filesystem illustrata nel capitolo precedente per quanto
1203 riguarda il comportamento e gli effetti delle varie funzioni.
1204
1205
1206 \subsection{Le funzioni \func{link} e \func{unlink}}
1207 \label{sec:file_link}
1208
1209 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
1210 dei nomi fittizi (come gli alias del vecchio MacOS o i collegamenti di Windows
1211 o i nomi logici del VMS) che permettono di fare riferimento allo stesso file
1212 chiamandolo con nomi diversi o accedendovi da directory diverse.
1213
1214 Questo è possibile anche in ambiente Unix, dove tali collegamenti sono
1215 usualmente chiamati \textit{link}; ma data l'architettura del sistema riguardo
1216 la gestione dei file ci sono due metodi sostanzialmente diversi per fare
1217 questa operazione.
1218
1219 Come spiegato in sez.~\ref{sec:file_filesystem} l'accesso al contenuto di un
1220 file su disco avviene passando attraverso il suo \itindex{inode}
1221 \textit{inode}, che è la struttura usata dal kernel che lo identifica
1222 univocamente all'interno di un singolo filesystem. Il nome del file che si
1223 trova nella voce di una directory è solo un'etichetta, mantenuta all'interno
1224 della directory, che viene associata ad un puntatore che fa riferimento al
1225 suddetto \textit{inode}.
1226
1227 Questo significa che, fintanto che si resta sullo stesso filesystem, la
1228 realizzazione di un link è immediata, ed uno stesso file può avere tanti nomi
1229 diversi, dati da altrettante associazioni diverse allo stesso \itindex{inode}
1230 \textit{inode} effettuate tramite ``etichette'' diverse in directory
1231 diverse. Si noti anche che nessuno di questi nomi viene ad assumere una
1232 particolare preferenza o originalità rispetto agli altri, in quanto tutti
1233 fanno comunque riferimento allo stesso \itindex{inode} \textit{inode}.
1234
1235 Per aggiungere ad una directory una voce che faccia riferimento ad un
1236 \itindex{inode} \textit{inode} già esistente si utilizza la funzione
1237 \func{link}; si suole chiamare questo tipo di associazione un collegamento
1238 diretto, o \textit{hard link}.  Il prototipo della funzione è il seguente:
1239 \begin{prototype}{unistd.h}
1240 {int link(const char *oldpath, const char *newpath)}
1241   Crea un nuovo collegamento diretto.
1242   
1243   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1244     errore nel qual caso \var{errno} viene impostata ai valori:
1245   \begin{errlist}
1246   \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
1247     riferimento ad un filesystem montato sullo stesso \itindex{mount~point}
1248     \textit{mount point}.
1249   \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
1250     \param{newpath} non supporta i link diretti o è una directory.
1251   \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
1252     esiste già.
1253   \item[\errcode{EMLINK}] ci sono troppi link al file \param{oldpath} (il
1254     numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
1255     sez.~\ref{sec:sys_limits}).
1256   \end{errlist}
1257   ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOTDIR},
1258   \errval{EFAULT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
1259   \errval{ENOSPC}, \errval{EIO}.}
1260 \end{prototype}
1261
1262 La funzione crea sul \itindex{pathname} \textit{pathname} \param{newpath} un
1263 collegamento diretto al file indicato da \param{oldpath}.  Per quanto detto la
1264 creazione di un nuovo collegamento diretto non copia il contenuto del file, ma
1265 si limita a creare una voce nella directory specificata da \param{newpath} e
1266 ad aumentare di uno il numero di riferimenti al file (riportato nel campo
1267 \var{st\_nlink} della struttura \struct{stat}, vedi sez.~\ref{sec:file_stat})
1268 aggiungendo il nuovo nome ai precedenti. Si noti che uno stesso file può
1269 essere così chiamato con vari nomi in diverse directory.
1270
1271 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
1272 collegamento diretto è possibile solo se entrambi i \itindex{pathname}
1273 \textit{pathname} sono nello stesso filesystem; inoltre il filesystem deve
1274 supportare i collegamenti diretti (il meccanismo non è disponibile ad esempio
1275 con il filesystem \acr{vfat} di Windows). In realtà la funzione ha un
1276 ulteriore requisito, e cioè che non solo che i due file siano sullo stesso
1277 filesystem, ma anche che si faccia riferimento ad essi sullo stesso
1278 \itindex{mount~point} \textit{mount point}.\footnote{si tenga presente infatti
1279   (vedi sez.~\ref{sec:sys_file_config}) che a partire dal kernel 2.4 uno
1280   stesso filesystem può essere montato più volte su directory diverse.}
1281
1282 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
1283 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
1284 l'amministratore è in grado di creare un collegamento diretto ad un'altra
1285 directory: questo viene fatto perché con una tale operazione è possibile
1286 creare dei \textit{loop} nel filesystem (vedi l'esempio mostrato in
1287 sez.~\ref{sec:file_symlink}, dove riprenderemo il discorso) che molti programmi
1288 non sono in grado di gestire e la cui rimozione diventerebbe estremamente
1289 complicata (in genere per questo tipo di errori occorre far girare il
1290 programma \cmd{fsck} per riparare il filesystem).
1291
1292 Data la pericolosità di questa operazione e la disponibilità dei link
1293 simbolici (che vedremo in sez.~\ref{sec:file_symlink}) e dei
1294 \itindex{bind~mount} \textit{bind mount} (già visti in
1295 sez.~\ref{sec:sys_file_config}) che possono fornire la stessa funzionalità
1296 senza questi problemi, nel caso di Linux questa capacità è stata completamente
1297 disabilitata, e al tentativo di creare un link diretto ad una directory la
1298 funzione \func{link} restituisce l'errore \errcode{EPERM}.
1299
1300 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
1301 \textit{hard link} ad un link simbolico. In questo caso lo standard POSIX
1302 prevederebbe che quest'ultimo venga risolto e che il collegamento sia
1303 effettuato rispetto al file cui esso punta, e che venga riportato un errore
1304 qualora questo non esista o non sia un file. Questo era anche il comportamento
1305 iniziale di Linux ma a partire dai kernel della serie 2.0.x\footnote{per la
1306   precisione il comportamento era quello previsto dallo standard POSIX fino al
1307   kernel di sviluppo 1.3.56, ed è stato temporaneamente ripristinato anche
1308   durante lo sviluppo della serie 2.1.x, per poi tornare al comportamento
1309   attuale fino ad oggi (per riferimento si veda
1310   \url{http://lwn.net/Articles/293902}).} è stato adottato un comportamento
1311 che non segue più lo standard per cui l'\textit{hard link} viene creato
1312 rispetto al link simbolico, e non al file cui questo punta.
1313
1314 La ragione di questa differenza rispetto allo standard, presente anche in
1315 altri sistemi unix-like, sono dovute al fatto che un link simbolico può fare
1316 riferimento anche ad un file non esistente o a una directory, per i quali
1317 l'\textit{hard link} non può essere creato, per cui la scelta di seguire il
1318 link simbolico è stata ritenuta una scelta scorretta nella progettazione
1319 dell'interfaccia.  Infatti se non ci fosse il comportamento adottato da Linux
1320 sarebbe impossibile creare un \textit{hard link} ad un link simbolico, perché
1321 la funzione lo risolverebbe e l'\textit{hard link} verrebbe creato verso la
1322 destinazione. Invece evitando di seguire lo standard l'operazione diventa
1323 possibile, ed anche il comportamento della funzione risulta molto più
1324 comprensibile. Tanto più che se proprio se si vuole creare un \textit{hard
1325   link} rispetto alla destinazione di un link simbolico è sempre possibile
1326 farlo direttamente.\footnote{ciò non toglie che questo comportamento fuori
1327   standard possa causare problemi, come nell'esempio descritto nell'articolo
1328   citato nella nota precedente, a programmi che non si aspettano questa
1329   differenza rispetto allo standard POSIX.}
1330
1331 La rimozione di un file (o più precisamente della voce che lo referenzia
1332 all'interno di una directory) si effettua con la funzione \funcd{unlink}; il
1333 suo prototipo è il seguente:
1334 \begin{prototype}{unistd.h}{int unlink(const char *pathname)}
1335
1336   Cancella un file.
1337   
1338   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1339     errore, nel qual caso il file non viene toccato. La variabile
1340     \var{errno} viene impostata secondo i seguenti codici di errore:
1341   \begin{errlist}
1342   \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una directory.
1343     \footnotemark
1344   \item[\errcode{EROFS}] \param{pathname} è su un filesystem montato in sola
1345   lettura.
1346   \item[\errcode{EISDIR}] \param{pathname} fa riferimento a una directory.
1347   \end{errlist}
1348   ed inoltre: \errval{EACCES}, \errval{EFAULT}, \errval{ENOENT},
1349   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
1350   \errval{EIO}.}
1351 \end{prototype}
1352
1353 \footnotetext{questo è un valore specifico ritornato da Linux che non consente
1354   l'uso di \func{unlink} con le directory (vedi sez.~\ref{sec:file_remove}).
1355   Non è conforme allo standard POSIX, che prescrive invece l'uso di
1356   \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
1357   abbia privilegi sufficienti.}
1358
1359 La funzione cancella il nome specificato da \param{pathname} nella relativa
1360 directory e decrementa il numero di riferimenti nel relativo \itindex{inode}
1361 \textit{inode}. Nel caso di link simbolico cancella il link simbolico; nel
1362 caso di socket, fifo o file di dispositivo \index{file!di~dispositivo} rimuove
1363 il nome, ma come per i file i processi che hanno aperto uno di questi oggetti
1364 possono continuare ad utilizzarlo.
1365
1366 Per cancellare una voce in una directory è necessario avere il permesso di
1367 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
1368 il diritto di esecuzione sulla directory che la contiene (affronteremo in
1369 dettaglio l'argomento dei permessi di file e directory in
1370 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
1371 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
1372 occorrerà anche essere proprietari del file o proprietari della directory (o
1373 root, per cui nessuna delle restrizioni è applicata).
1374
1375 Una delle caratteristiche di queste funzioni è che la creazione/rimozione del
1376 nome dalla directory e l'incremento/decremento del numero di riferimenti
1377 \itindex{inode} nell'\textit{inode} devono essere effettuati in maniera
1378 atomica (si veda sez.~\ref{sec:proc_atom_oper}) senza possibili interruzioni
1379 fra le due operazioni. Per questo entrambe queste funzioni sono realizzate
1380 tramite una singola system call.
1381
1382 Si ricordi infine che un file non viene eliminato dal disco fintanto che tutti
1383 i riferimenti ad esso sono stati cancellati: solo quando il \textit{link
1384   count} mantenuto \itindex{inode} nell'\textit{inode} diventa zero lo spazio
1385 occupato su disco viene rimosso (si ricordi comunque che a questo si aggiunge
1386 sempre un'ulteriore condizione,\footnote{come vedremo in
1387   cap.~\ref{cha:file_unix_interface} il kernel mantiene anche una tabella dei
1388   file aperti nei vari processi, che a sua volta contiene i riferimenti agli
1389   \itindex{inode} \textit{inode} ad essi relativi. Prima di procedere alla
1390   cancellazione dello spazio occupato su disco dal contenuto di un file il
1391   kernel controlla anche questa tabella, per verificare che anche in essa non
1392   ci sia più nessun riferimento all'\textit{inode} in questione.} e cioè che
1393 non ci siano processi che abbiano il suddetto file aperto).
1394
1395 Questa proprietà viene spesso usata per essere sicuri di non lasciare file
1396 temporanei su disco in caso di crash dei programmi; la tecnica è quella di
1397 aprire il file e chiamare \func{unlink} subito dopo, in questo modo il
1398 contenuto del file è sempre disponibile all'interno del processo attraverso il
1399 suo file descriptor (vedi sez.~\ref{sec:file_fd}) fintanto che il processo non
1400 chiude il file, ma non ne resta traccia in nessuna directory, e lo spazio
1401 occupato su disco viene immediatamente rilasciato alla conclusione del
1402 processo (quando tutti i file vengono chiusi).
1403
1404
1405 \subsection{Le funzioni \func{remove} e \func{rename}}
1406 \label{sec:file_remove}
1407
1408 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
1409 \func{unlink} sulle directory; per cancellare una directory si può usare la
1410 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}), oppure la
1411 funzione \funcd{remove}. 
1412
1413 Questa è la funzione prevista dallo standard ANSI C per cancellare un file o
1414 una directory (e funziona anche per i sistemi che non supportano i link
1415 diretti). Per i file è identica a \func{unlink} e per le directory è identica
1416 a \func{rmdir}; il suo prototipo è:
1417 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
1418   Cancella un nome dal filesystem. 
1419   
1420   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1421     errore, nel qual caso il file non viene toccato.
1422     
1423     I codici di errore riportati in \var{errno} sono quelli della chiamata
1424     utilizzata, pertanto si può fare riferimento a quanto illustrato nelle
1425     descrizioni di \func{unlink} e \func{rmdir}.}
1426 \end{prototype}
1427
1428 La funzione utilizza la funzione \func{unlink}\footnote{questo vale usando le
1429   \acr{glibc}; nelle libc4 e nelle libc5 la funzione \func{remove} è un
1430   semplice alias alla funzione \func{unlink} e quindi non può essere usata per
1431   le directory.} per cancellare i file e la funzione \func{rmdir} per
1432 cancellare le directory; si tenga presente che per alcune implementazioni del
1433 protocollo NFS utilizzare questa funzione può comportare la scomparsa di file
1434 ancora in uso.
1435
1436 Per cambiare nome ad un file o a una directory (che devono comunque essere
1437 nello stesso filesystem) si usa invece la funzione \funcd{rename},\footnote{la
1438   funzione è definita dallo standard ANSI C, ma si applica solo per i file, lo
1439   standard POSIX estende la funzione anche alle directory.} il cui prototipo
1440 è:
1441 \begin{prototype}{stdio.h}
1442   {int rename(const char *oldpath, const char *newpath)} 
1443   
1444   Rinomina un file.
1445   
1446   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1447     errore, nel qual caso il file non viene toccato. La variabile
1448     \var{errno} viene impostata secondo i seguenti codici di errore:
1449   \begin{errlist} 
1450   \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
1451     \param{oldpath} non è una directory.
1452   \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
1453     stesso filesystem.
1454   \item[\errcode{ENOTEMPTY}] \param{newpath} è una directory già esistente e
1455     non vuota.
1456   \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
1457     parte di qualche processo (come directory di lavoro o come radice) o del
1458     sistema (come \itindex{mount~point} \textit{mount point}).
1459   \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
1460     \param{oldpath} o più in generale si è cercato di creare una directory come
1461     sotto-directory di se stessa.
1462   \item[\errcode{ENOTDIR}] uno dei componenti dei \itindex{pathname}
1463     \textit{pathname} non è una directory o \param{oldpath} è una directory e
1464     \param{newpath} esiste e non è una directory.
1465   \end{errlist} 
1466   ed inoltre \errval{EACCES}, \errval{EPERM}, \errval{EMLINK},
1467   \errval{ENOENT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP} e
1468   \errval{ENOSPC}.}
1469 \end{prototype}
1470
1471 La funzione rinomina il file \param{oldpath} in \param{newpath}, eseguendo se
1472 necessario lo spostamento di un file fra directory diverse. Eventuali altri
1473 link diretti allo stesso file non vengono influenzati.
1474
1475 Il comportamento della funzione è diverso a seconda che si voglia rinominare
1476 un file o una directory; se ci riferisce ad un file allora \param{newpath}, se
1477 esiste, non deve essere una directory (altrimenti si ha l'errore
1478 \errcode{EISDIR}). Nel caso \param{newpath} indichi un file esistente questo
1479 viene cancellato e rimpiazzato (atomicamente).
1480
1481 Se \param{oldpath} è una directory allora \param{newpath}, se esiste, deve
1482 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
1483 (se non è una directory) o \errcode{ENOTEMPTY} (se non è vuota). Chiaramente
1484 \param{newpath} non può contenere \param{oldpath} altrimenti si avrà un errore
1485 \errcode{EINVAL}.
1486
1487 Se \param{oldpath} si riferisce ad un link simbolico questo sarà rinominato; se
1488 \param{newpath} è un link simbolico verrà cancellato come qualunque altro
1489 file.  Infine qualora \param{oldpath} e \param{newpath} siano due nomi dello
1490 stesso file lo standard POSIX prevede che la funzione non dia errore, e non
1491 faccia nulla, lasciando entrambi i nomi; Linux segue questo standard, anche
1492 se, come fatto notare dal manuale delle \textit{glibc}, il comportamento più
1493 ragionevole sarebbe quello di cancellare \param{oldpath}.
1494
1495 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
1496 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
1497 può esistere cioè nessun istante in cui un altro processo può trovare attivi
1498 entrambi i nomi dello stesso file, o, in caso di sostituzione di un file
1499 esistente, non trovare quest'ultimo prima che la sostituzione sia stata
1500 eseguita.
1501
1502 In ogni caso se \param{newpath} esiste e l'operazione fallisce per un qualche
1503 motivo (come un crash del kernel), \func{rename} garantisce di lasciare
1504 presente un'istanza di \param{newpath}. Tuttavia nella sovrascrittura potrà
1505 esistere una finestra in cui sia \param{oldpath} che \param{newpath} fanno
1506 riferimento allo stesso file.
1507
1508
1509 \subsection{I link simbolici}
1510 \label{sec:file_symlink}
1511
1512 Come abbiamo visto in sez.~\ref{sec:file_link} la funzione \func{link} crea
1513 riferimenti agli \itindex{inode} \textit{inode}, pertanto può funzionare
1514 soltanto per file che risiedono sullo stesso filesystem e solo per un
1515 filesystem di tipo Unix.  Inoltre abbiamo visto che in Linux non è consentito
1516 eseguire un link diretto ad una directory.
1517
1518 Per ovviare a queste limitazioni i sistemi Unix supportano un'altra forma di
1519 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
1520 come avviene in altri sistemi operativi, dei file speciali che contengono
1521 semplicemente il riferimento ad un altro file (o directory). In questo modo è
1522 possibile effettuare link anche attraverso filesystem diversi, a file posti in
1523 filesystem che non supportano i link diretti, a delle directory, ed anche a
1524 file che non esistono ancora.
1525
1526 Il sistema funziona in quanto i link simbolici sono riconosciuti come tali dal
1527 kernel\footnote{è uno dei diversi tipi di file visti in
1528   tab.~\ref{tab:file_file_types}, contrassegnato come tale
1529   nell'\textit{inode}, e riconoscibile dal valore del campo \var{st\_mode}
1530   della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).}  per cui
1531 alcune funzioni di libreria (come \func{open} o \func{stat}) quando ricevono
1532 come argomento un link simbolico vengono automaticamente applicate al file da
1533 esso specificato.  La funzione che permette di creare un nuovo link simbolico
1534 è \funcd{symlink}, ed il suo prototipo è:
1535 \begin{prototype}{unistd.h}
1536   {int symlink(const char *oldpath, const char *newpath)} 
1537   Crea un nuovo link simbolico di nome \param{newpath} il cui contenuto è
1538   \param{oldpath}.
1539   
1540   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1541     errore, nel qual caso la variabile \var{errno} assumerà i valori:
1542   \begin{errlist}
1543   \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
1544     supporta i link simbolici.
1545   \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
1546     \param{oldpath} è una stringa vuota.
1547   \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
1548   \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
1549     lettura.
1550   \end{errlist}
1551   ed inoltre \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
1552   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{ENOSPC} e
1553   \errval{EIO}.}
1554 \end{prototype}
1555
1556 Si tenga presente che la funzione non effettua nessun controllo sull'esistenza
1557 di un file di nome \param{oldpath}, ma si limita ad inserire quella stringa
1558 nel link simbolico. Pertanto un link simbolico può anche riferirsi ad un file
1559 che non esiste: in questo caso si ha quello che viene chiamato un
1560 \textit{dangling link}, letteralmente un \textsl{link ciondolante}.
1561
1562 Come accennato i link simbolici sono risolti automaticamente dal kernel
1563 all'invocazione delle varie system call; in tab.~\ref{tab:file_symb_effect} si
1564 è riportato un elenco dei comportamenti delle varie funzioni di libreria che
1565 operano sui file nei confronti della risoluzione dei link simbolici,
1566 specificando quali seguono il link simbolico e quali invece possono operare
1567 direttamente sul suo contenuto.
1568 \begin{table}[htb]
1569   \centering
1570   \footnotesize
1571   \begin{tabular}[c]{|l|c|c|}
1572     \hline
1573     \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
1574     \hline 
1575     \hline 
1576     \func{access}   & $\bullet$ & --        \\
1577     \func{chdir}    & $\bullet$ & --        \\
1578     \func{chmod}    & $\bullet$ & --        \\
1579     \func{chown}    & --        & $\bullet$ \\
1580     \func{creat}    & $\bullet$ & --        \\
1581     \func{exec}     & $\bullet$ & --        \\
1582     \func{lchown}   & $\bullet$ & --        \\
1583     \func{link}\footnotemark & --        & $\bullet$ \\
1584     \func{lstat}    & --        & $\bullet$ \\
1585     \func{mkdir}    & $\bullet$ & --        \\
1586     \func{mkfifo}   & $\bullet$ & --        \\
1587     \func{mknod}    & $\bullet$ & --        \\
1588     \func{open}     & $\bullet$ & --        \\
1589     \func{opendir}  & $\bullet$ & --        \\
1590     \func{pathconf} & $\bullet$ & --        \\
1591     \func{readlink} & --        & $\bullet$ \\
1592     \func{remove}   & --        & $\bullet$ \\
1593     \func{rename}   & --        & $\bullet$ \\
1594     \func{stat}     & $\bullet$ & --        \\
1595     \func{truncate} & $\bullet$ & --        \\
1596     \func{unlink}   & --        & $\bullet$ \\
1597     \hline 
1598   \end{tabular}
1599   \caption{Uso dei link simbolici da parte di alcune funzioni.}
1600   \label{tab:file_symb_effect}
1601 \end{table}
1602
1603 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
1604   dallo standard POSIX, si veda quanto detto in sez.~\ref{sec:file_link}.}
1605
1606 Si noti che non si è specificato il comportamento delle funzioni che operano
1607 con i file descriptor, in quanto la risoluzione del link simbolico viene in
1608 genere effettuata dalla funzione che restituisce il file descriptor
1609 (normalmente la \func{open}, vedi sez.~\ref{sec:file_open}) e tutte le
1610 operazioni seguenti fanno riferimento solo a quest'ultimo.
1611
1612 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
1613 \func{open} seguono i link simbolici, occorrono funzioni apposite per accedere
1614 alle informazioni del link invece che a quelle del file a cui esso fa
1615 riferimento. Quando si vuole leggere il contenuto di un link simbolico si usa
1616 la funzione \funcd{readlink}, il cui prototipo è:
1617 \begin{prototype}{unistd.h}
1618 {int readlink(const char *path, char *buff, size\_t size)} 
1619   Legge il contenuto del link simbolico indicato da \param{path} nel buffer
1620   \param{buff} di dimensione \param{size}.
1621   
1622   \bodydesc{La funzione restituisce il numero di caratteri letti dentro
1623     \param{buff} o -1 per un errore, nel qual caso la variabile
1624     \var{errno} assumerà i valori:
1625   \begin{errlist}
1626   \item[\errcode{EINVAL}] \param{path} non è un link simbolico o \param{size}
1627     non è positiva.
1628   \end{errlist}
1629   ed inoltre \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1630   \errval{EACCES}, \errval{ELOOP}, \errval{EIO}, \errval{EFAULT} e
1631   \errval{ENOMEM}.}
1632 \end{prototype}
1633
1634 La funzione apre il link simbolico, ne legge il contenuto, lo scrive nel
1635 buffer, e lo richiude. Si tenga presente che la funzione non termina la
1636 stringa con un carattere nullo e la tronca alla dimensione specificata da
1637 \param{size} per evitare di sovrascrivere oltre le dimensioni del buffer.
1638
1639 \begin{figure}[htb]
1640   \centering
1641   \includegraphics[width=8.5cm]{img/link_loop}
1642   \caption{Esempio di loop nel filesystem creato con un link simbolico.}
1643   \label{fig:file_link_loop}
1644 \end{figure}
1645
1646 Un caso comune che si può avere con i link simbolici è la creazione dei
1647 cosiddetti \textit{loop}. La situazione è illustrata in
1648 fig.~\ref{fig:file_link_loop}, che riporta la struttura della directory
1649 \file{/boot}. Come si vede si è creato al suo interno un link simbolico che
1650 punta di nuovo a \file{/boot}.\footnote{il loop mostrato in
1651   fig.~\ref{fig:file_link_loop} è un usato per poter permettere a \cmd{grub}
1652   (un bootloader in grado di leggere direttamente da vari filesystem il file
1653   da lanciare come sistema operativo) di vedere i file contenuti nella
1654   directory \file{/boot} con lo stesso \textit{pathname} con cui verrebbero
1655   visti dal sistema operativo, anche se essi si trovano, come accade spesso,
1656   su una partizione separata (che \cmd{grub}, all'avvio, vede come radice).}
1657
1658 Questo può causare problemi per tutti quei programmi che effettuano la
1659 scansione di una directory senza tener conto dei link simbolici, ad esempio se
1660 lanciassimo un comando del tipo \code{grep -r linux *}, il loop nella
1661 directory porterebbe il comando ad esaminare \file{/boot}, \file{/boot/boot},
1662 \file{/boot/boot/boot} e così via.
1663
1664 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
1665 un \itindex{pathname} \textit{pathname} possano essere seguiti un numero
1666 limitato di link simbolici, il cui valore limite è specificato dalla costante
1667 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
1668 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}.
1669
1670 Un punto da tenere sempre presente è che, come abbiamo accennato, un link
1671 simbolico può fare riferimento anche ad un file che non esiste; ad esempio
1672 possiamo creare un file temporaneo nella nostra directory con un link del
1673 tipo:
1674 \begin{verbatim}
1675 $ ln -s /tmp/tmp_file temporaneo
1676 \end{verbatim}%$
1677 anche se \file{/tmp/tmp\_file} non esiste. Questo può generare confusione, in
1678 quanto aprendo in scrittura \file{temporaneo} verrà creato
1679 \file{/tmp/tmp\_file} e scritto; ma accedendo in sola lettura a
1680 \file{temporaneo}, ad esempio con \cmd{cat}, otterremmo:
1681 \begin{verbatim}
1682 $ cat temporaneo
1683 cat: temporaneo: No such file or directory
1684 \end{verbatim}%$
1685 con un errore che può sembrare sbagliato, dato che un'ispezione con \cmd{ls}
1686 ci mostrerebbe invece l'esistenza di \file{temporaneo}.
1687
1688
1689 \subsection{La creazione e la cancellazione delle directory} 
1690 \label{sec:file_dir_creat_rem}
1691
1692 Benché in sostanza le directory non siano altro che dei file contenenti
1693 elenchi di nomi ed \itindex{inode} \textit{inode}, non è possibile trattarle
1694 come file ordinari e devono essere create direttamente dal kernel attraverso
1695 una opportuna system call.\footnote{questo è quello che permette anche,
1696   attraverso l'uso del VFS, l'utilizzo di diversi formati per la gestione dei
1697   suddetti elenchi, dalle semplici liste a strutture complesse come alberi
1698   binari, hash, ecc. che consentono una ricerca veloce quando il numero di
1699   file è molto grande.}  La funzione usata per creare una directory è
1700 \funcd{mkdir}, ed il suo prototipo è:
1701 \begin{functions}
1702   \headdecl{sys/stat.h}
1703   \headdecl{sys/types.h}
1704   \funcdecl{int mkdir(const char *dirname, mode\_t mode)} 
1705
1706   Crea una nuova directory.
1707   
1708   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1709     errore, nel qual caso \var{errno} assumerà i valori:
1710   \begin{errlist}
1711   \item[\errcode{EEXIST}] un file (o una directory) con quel nome esiste di
1712     già.
1713   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
1714     cui si vuole inserire la nuova directory.
1715   \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
1716     directory contiene troppi file; sotto Linux questo normalmente non avviene
1717     perché il filesystem standard consente la creazione di un numero di file
1718     maggiore di quelli che possono essere contenuti nel disco, ma potendo
1719     avere a che fare anche con filesystem di altri sistemi questo errore può
1720     presentarsi.
1721   \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
1722     la nuova directory o si è esaurita la quota disco dell'utente.
1723   \end{errlist}
1724   ed inoltre anche \errval{EPERM}, \errval{EFAULT}, \errval{ENAMETOOLONG},
1725   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1726   \errval{EROFS}.}
1727 \end{functions}
1728
1729 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
1730 standard presenti in ogni directory (cioè ``\file{.}'' e ``\file{..}''), con
1731 il nome indicato dall'argomento \param{dirname}. Il nome può essere indicato
1732 sia come \itindex{pathname} \textit{pathname} assoluto che come
1733 \itindex{pathname} \textit{pathname} relativo.
1734
1735 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
1736 directory viene creata sono specificati dall'argomento \param{mode}, i cui
1737 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
1738 tenga presente che questi sono modificati dalla maschera di creazione dei file
1739 (si veda sez.~\ref{sec:file_perm_management}).  La titolarità della nuova
1740 directory è impostata secondo quanto riportato in
1741 sez.~\ref{sec:file_ownership_management}.
1742
1743 La funzione che permette la cancellazione di una directory è invece
1744 \funcd{rmdir}, ed il suo prototipo è:
1745 \begin{prototype}{sys/stat.h}{int rmdir(const char *dirname)} 
1746   Cancella una directory.
1747
1748   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1749     errore, nel qual caso \var{errno} assumerà i valori:
1750   \begin{errlist}
1751   \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
1752     directory, oppure la directory che contiene \param{dirname} ha lo
1753     \itindex{sticky~bit} \textit{sticky bit} impostato e l'\ids{UID} effettivo
1754     del processo non corrisponde al proprietario della directory.
1755   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
1756     che contiene la directory che si vuole cancellare, o non c'è il permesso
1757     di attraversare (esecuzione) una delle directory specificate in
1758     \param{dirname}.
1759   \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o la
1760     radice di qualche processo.
1761   \item[\errcode{ENOTEMPTY}] la directory non è vuota.
1762   \end{errlist}
1763   ed inoltre anche \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1764   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{EROFS}.}
1765 \end{prototype}
1766
1767 La funzione cancella la directory \param{dirname}, che deve essere vuota (la
1768 directory deve cioè contenere soltanto le due voci standard ``\file{.}'' e
1769 ``\file{..}'').  Il nome può essere indicato con il \itindex{pathname}
1770 \textit{pathname} assoluto o relativo.
1771
1772 La modalità con cui avviene la cancellazione è analoga a quella di
1773 \func{unlink}: fintanto che il numero di link \itindex{inode}
1774 all'\textit{inode} della directory non diventa nullo e nessun processo ha la
1775 directory aperta lo spazio occupato su disco non viene rilasciato. Se un
1776 processo ha la directory aperta la funzione rimuove il link \itindex{inode}
1777 all'\textit{inode} e nel caso sia l'ultimo, pure le voci standard ``\file{.}''
1778 e ``\file{..}'', a questo punto il kernel non consentirà di creare più nuovi
1779 file nella directory.
1780
1781
1782 \subsection{La creazione di file speciali}
1783 \label{sec:file_mknod}
1784
1785 \index{file!di~dispositivo|(} 
1786
1787 Finora abbiamo parlato esclusivamente di file, directory e link simbolici; in
1788 sez.~\ref{sec:file_file_types} abbiamo visto però che il sistema prevede pure
1789 degli altri tipi di file speciali, come i file di dispositivo, le fifo ed i
1790 socket (questi ultimi sono un caso a parte, essendo associati anche alla
1791 comunicazione via rete, per cui ci saranno trattati in dettaglio a partire da
1792 cap.~\ref{cha:socket_intro}).
1793
1794 La manipolazione delle caratteristiche di questi diversi tipi di file e la
1795 loro cancellazione può essere effettuata con le stesse funzioni che operano
1796 sui file regolari; ma quando li si devono creare sono necessarie delle
1797 funzioni apposite. La prima di queste funzioni è \funcd{mknod}, il cui
1798 prototipo è:
1799 \begin{functions}
1800   \headdecl{sys/types.h}
1801   \headdecl{sys/stat.h}
1802   \headdecl{fcntl.h}
1803   \headdecl{unistd.h}
1804   \funcdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)} 
1805   
1806   Crea un \textit{inode} del tipo specificato sul filesystem.
1807   
1808   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1809     errore, nel qual caso \var{errno} assumerà i valori:
1810   \begin{errlist}
1811   \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
1812     l'\texttt{inode}, o il filesystem su cui si è cercato di
1813     creare \param{pathname} non supporta l'operazione.
1814   \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
1815     fifo, un socket o un dispositivo.
1816   \item[\errcode{EEXIST}] \param{pathname} esiste già o è un link simbolico.
1817   \end{errlist}
1818   ed inoltre anche \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
1819   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1820   \errval{ENOSPC}, \errval{EROFS}.}
1821 \end{functions}
1822
1823 La funzione, come suggerisce il nome, permette di creare un ``\textsl{nodo}''
1824 sul filesystem, e viene in genere utilizzata per creare i file di dispositivo,
1825 ma si può usare anche per creare file regolari. L'argomento
1826 \param{mode} specifica sia il tipo di file che si vuole creare che i relativi
1827 permessi, secondo i valori riportati in tab.~\ref{tab:file_mode_flags}, che
1828 vanno combinati con un OR binario. I permessi sono comunque modificati nella
1829 maniera usuale dal valore di \itindex{umask} \textit{umask} (si veda
1830 sez.~\ref{sec:file_perm_management}).
1831
1832 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
1833 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
1834 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
1835 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
1836 per una fifo;\footnote{con Linux la funzione non può essere usata per creare
1837   directory o link simbolici, si dovranno usare le funzioni \func{mkdir} e
1838   \func{symlink} a questo dedicate.} un valore diverso comporterà l'errore
1839 \errcode{EINVAL}.  
1840
1841 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
1842 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
1843 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
1844 valore verrà ignorato.  Solo l'amministratore può creare un file di
1845 dispositivo usando questa funzione (il processo deve avere la
1846 \itindex{capabilities} \textit{capability} \const{CAP\_MKNOD}), ma in
1847 Linux\footnote{questo è un comportamento specifico di Linux, la funzione non è
1848   prevista dallo standard POSIX.1 originale, mentre è presente in SVr4 e
1849   4.4BSD, ma esistono differenze nei comportamenti e nei codici di errore,
1850   tanto che questa è stata introdotta in POSIX.1-2001 con una nota che la
1851   definisce portabile solo quando viene usata per creare delle fifo, ma
1852   comunque deprecata essendo utilizzabile a tale scopo la specifica
1853   \func{mkfifo}.} l'uso per la creazione di un file ordinario, di una fifo o
1854 di un socket è consentito anche agli utenti normali.
1855
1856 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
1857 al proprietario e al gruppo del processo che li ha creati, a meno che non si
1858 sia attivato il bit \acr{sgid} per la directory o sia stata attivata la
1859 semantica BSD per il filesystem (si veda
1860 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
1861 \itindex{inode} l'\textit{inode}.
1862
1863 Nella creazione di un file di dispositivo occorre poi specificare
1864 correttamente il valore di \param{dev}; questo infatti è di tipo
1865 \type{dev\_t}, che è un tipo primitivo (vedi
1866 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
1867 \textsl{numero} di dispositivo; il kernel infatti identifica ciascun
1868 dispositivo con un valore numerico. Originariamente questo era un intero a 16
1869 bit diviso in due parti di 8 bit chiamate rispettivamente
1870 \itindex{major~number} \textit{major number} e \itindex{minor~number}
1871 \textit{minor number}, che sono poi i due numeri mostrati dal comando
1872 \texttt{ls -l} al posto della dimensione quando lo si esegue su un file di
1873 dispositivo.
1874
1875 Il \itindex{major~number} \textit{major number} identifica una classe di
1876 dispositivi (ad esempio la seriale, o i dischi IDE) e serve in sostanza per
1877 indicare al kernel quale è il modulo che gestisce quella classe di
1878 dispositivi; per identificare uno specifico dispositivo di quella classe (ad
1879 esempio una singola porta seriale, o una partizione di un disco) si usa invece
1880 il \itindex{minor~number} \textit{minor number}. L'elenco aggiornato di questi
1881 numeri con le relative corrispondenze ai vari dispositivi può essere trovato
1882 nel file \texttt{Documentation/devices.txt} allegato alla documentazione dei
1883 sorgenti del kernel.
1884
1885 Data la crescita nel numero di dispositivi supportati, ben presto il limite
1886 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
1887 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
1888 \type{dev\_t}, con delle dimensioni passate a 12 bit per il
1889 \itindex{major~number} \textit{major number} e 20 bit per il
1890 \itindex{minor~number} \textit{minor number}. La transizione però ha anche
1891 comportato il passaggio di \type{dev\_t} a \index{tipo!opaco} tipo opaco, e la
1892 necessità di specificare il numero tramite delle opportune macro, così da non
1893 avere problemi di compatibilità con eventuali ulteriori estensioni.
1894
1895 Le macro sono definite nel file \file{sys/sysmacros.h}, che viene
1896 automaticamente incluso quando si include \file{sys/types.h}; si possono
1897 pertanto ottenere i valori del \itindex{major~number} \textit{major number} e
1898 \itindex{minor~number} \textit{minor number} di un dispositivo rispettivamente
1899 con le macro \macro{major} e \macro{minor}:
1900 \begin{functions}
1901   \headdecl{sys/types.h}
1902   \funcdecl{int \macro{major}(dev\_t dev)}
1903   Restituisce il \itindex{major~number} \textit{major number} del dispositivo
1904   \param{dev}.
1905   
1906   \funcdecl{int \macro{minor}(dev\_t dev)}
1907   Restituisce il \itindex{minor~number} \textit{minor number} del dispositivo
1908   \param{dev}.
1909 \end{functions}
1910 \noindent mentre una volta che siano noti \itindex{major~number} \textit{major
1911   number} e \itindex{minor~number} \textit{minor number} si potrà costruire il
1912 relativo identificativo con la macro \macro{makedev}:
1913 \begin{functions}
1914   \headdecl{sys/types.h}
1915   \funcdecl{dev\_t \macro{minor}(int major, int minor)}
1916
1917   Restituisce l'identificativo di un dispositivo dati \itindex{major~number}
1918   \textit{major number} e \itindex{minor~number} \textit{minor number}.
1919 \end{functions}
1920
1921 \index{file!di~dispositivo|)}
1922
1923 Infine con lo standard POSIX.1-2001 è stata introdotta una funzione specifica
1924 per creare una fifo (tratteremo le fifo in in sez.~\ref{sec:ipc_named_pipe});
1925 la funzione è \funcd{mkfifo} ed il suo prototipo è:
1926 \begin{functions}
1927   \headdecl{sys/types.h} \headdecl{sys/stat.h} 
1928   
1929   \funcdecl{int mkfifo(const char *pathname, mode\_t mode)} 
1930   
1931   Crea una fifo.
1932   
1933   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1934     errore, nel qual caso \var{errno} assumerà i valori \errval{EACCES},
1935     \errval{EEXIST}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC},
1936     \errval{ENOTDIR} e \errval{EROFS}.}
1937 \end{functions}
1938
1939 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
1940 per \func{mknod} il file \param{pathname} non deve esistere (neanche come link
1941 simbolico); al solito i permessi specificati da \param{mode} vengono
1942 modificati dal valore di \itindex{umask} \textit{umask}.
1943
1944
1945
1946 \subsection{Accesso alle directory}
1947 \label{sec:file_dir_read}
1948
1949 Benché le directory alla fine non siano altro che dei file che contengono
1950 delle liste di nomi ed \itindex{inode} \textit{inode}, per il ruolo che
1951 rivestono nella struttura del sistema, non possono essere trattate come dei
1952 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
1953 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
1954 può essere un processo a inserirvi direttamente delle voci con le usuali
1955 funzioni di scrittura.
1956
1957 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
1958 kernel, sono molte le situazioni in cui i processi necessitano di poterne
1959 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
1960 in sez.~\ref{sec:file_open} che è possibile aprire una directory come se fosse
1961 un file, anche se solo in sola lettura) in generale il formato con cui esse
1962 sono scritte può dipendere dal tipo di filesystem, tanto che, come riportato
1963 in tab.~\ref{tab:file_file_operations}, il VFS del kernel prevede una apposita
1964 funzione per la lettura delle directory.
1965
1966 Tutto questo si riflette nello standard POSIX\footnote{le funzioni erano
1967   presenti in SVr4 e 4.3BSD, la loro specifica è riportata in POSIX.1-2001.}
1968 che ha introdotto una apposita interfaccia per la lettura delle directory,
1969 basata sui cosiddetti \textit{directory stream} (chiamati così per l'analogia
1970 con i file stream dell'interfaccia standard ANSI C di
1971 cap.~\ref{cha:files_std_interface}). La prima funzione di questa interfaccia è
1972 \funcd{opendir}, il cui prototipo è:
1973 \begin{functions}
1974   \headdecl{sys/types.h} \headdecl{dirent.h} 
1975   
1976   \funcdecl{DIR * opendir(const char *dirname)} 
1977   
1978   Apre un \textit{directory stream}.
1979   
1980   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
1981     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
1982     assumerà i valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
1983     \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}.}
1984 \end{functions}
1985
1986 La funzione apre un \textit{directory stream} per la directory
1987 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
1988 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
1989 \textit{directory stream}) da usare per tutte le operazioni successive, la
1990 funzione inoltre posiziona lo stream sulla prima voce contenuta nella
1991 directory. 
1992
1993 Si tenga presente che comunque la funzione opera associando il
1994 \textit{directory stream} ad un opportuno file descriptor sottostante, sul
1995 quale vengono compiute le operazioni. Questo viene sempre aperto impostando il
1996 flag di \itindex{close-on-exec} \textit{close-on-exec}, così da evitare che
1997 resti aperto in caso di esecuzione di un altro programma.
1998
1999 Nel caso in cui sia necessario conoscere il \textit{file descriptor} associato
2000 ad un \textit{directory stream} si può usare la funzione
2001 \funcd{dirfd},\footnote{questa funzione è una estensione introdotta con BSD
2002   4.3-Reno ed è presente in Linux con le libc5 (a partire dalla versione
2003   5.1.2) e con le \acr{glibc} ma non presente in POSIX fino alla revisione
2004   POSIX.1-2008, per questo per poterla utilizzare fino alla versione 2.10
2005   delle \acr{glibc} era necessario definire le macro \macro{\_BSD\_SOURCE} o
2006   \macro{\_SVID\_SOURCE}, dalla versione 2.10 si possono usare anche
2007   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o
2008   \texttt{\macro{\_XOPEN\_SOURCE} >= 700}.}  il cui prototipo è:
2009 \begin{functions}
2010   \headdecl{sys/types.h} \headdecl{dirent.h} 
2011   
2012   \funcdecl{int dirfd(DIR * dir)} 
2013   
2014   Restituisce il file descriptor associato ad un \textit{directory stream}.
2015   
2016   \bodydesc{La funzione restituisce il file descriptor (un valore positivo) in
2017     caso di successo e -1 in caso di errore.}
2018 \end{functions}
2019
2020 La funzione restituisce il file descriptor associato al \textit{directory
2021   stream} \param{dir}. Di solito si utilizza questa funzione in abbinamento a
2022 funzioni che operano sui file descriptor, ad esempio si potrà usare
2023 \func{fstat} per ottenere le proprietà della directory, o \func{fchdir} per
2024 spostare su di essa la directory di lavoro (vedi
2025 sez.~\ref{sec:file_work_dir}).
2026
2027 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
2028 possibile associarvi un \textit{directory stream} con la funzione
2029 \funcd{fdopendir},\footnote{questa funzione è però disponibile solo a partire
2030   dalla versione 2.4 delle \acr{glibc}, ed è stata introdotta nello standard
2031   POSIX solo a partire dalla revisione POSIX.1-2008, prima della versione 2.10
2032   delle \acr{glibc} per poterla utilizzare era necessario definire la macro
2033   \macro{\_GNU\_SOURCE}, dalla versione 2.10 si possono usare anche
2034   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o \texttt{\_XOPEN\_SOURCE >=
2035     700} .}  il cui prototipo è:
2036 \begin{functions}
2037   \headdecl{sys/types.h} \headdecl{dirent.h}
2038   
2039   \funcdecl{DIR * fdopendir(int fd)} 
2040   
2041   Associa un \textit{directory stream} al file descriptor \param{fd}.
2042   
2043   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
2044     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
2045     assumerà il valore \errval{EBADF}.}
2046 \end{functions}
2047
2048 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
2049   stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
2050 stato aperto in precedenza; la funzione darà un errore qualora questo non
2051 corrisponda ad una directory. L'uso di questa funzione permette di rispondere
2052 agli stessi requisiti delle funzioni ``\textit{at}'' che vedremo in
2053 sez.~\ref{sec:file_openat}.
2054
2055 Una volta utilizzata il file descriptor verrà usato internamente dalle
2056 funzioni che operano sul \textit{directory stream} e non dovrà essere più
2057 utilizzato all'interno del proprio programma; in particolare dovrà essere
2058 chiuso con \func{closedir} e non direttamente. Si tenga presente inoltre che
2059 \func{fdopendir} non modifica lo stato di un eventuale flag di
2060 \itindex{close-on-exec} \textit{close-on-exec}, che pertanto dovrà essere
2061 impostato esplicitamente in fase di apertura del file descriptor.
2062
2063 Una volta che si sia aperto un \textit{directory stream} la lettura del
2064 contenuto della directory viene effettuata attraverso la funzione
2065 \funcd{readdir}; il suo prototipo è:
2066 \begin{functions}
2067   \headdecl{sys/types.h} \headdecl{dirent.h} 
2068   
2069   \funcdecl{struct dirent *readdir(DIR *dir)}
2070   
2071   Legge una voce dal \textit{directory stream}.
2072   
2073   \bodydesc{La funzione restituisce il puntatore alla struttura contenente i
2074     dati in caso di successo e \val{NULL} altrimenti, in caso di
2075     \textit{directory stream} non valido \var{errno} assumerà il valore
2076     \errval{EBADF}, il valore \val{NULL} viene restituito anche quando si
2077     raggiunge la fine dello stream.}
2078 \end{functions}
2079
2080 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
2081 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
2082 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
2083 esaurite tutte le voci in essa presenti.
2084
2085 \begin{figure}[!htb]
2086   \footnotesize \centering
2087   \begin{minipage}[c]{\textwidth}
2088     \includestruct{listati/dirent.c}
2089   \end{minipage} 
2090   \normalsize 
2091   \caption{La struttura \structd{dirent} per la lettura delle informazioni dei 
2092     file.}
2093   \label{fig:file_dirent_struct}
2094 \end{figure}
2095
2096 I dati vengono memorizzati in una struttura \struct{dirent}, la cui
2097 definizione è riportata in fig.~\ref{fig:file_dirent_struct}.\footnote{la
2098   definizione è quella usata da Linux, che si trova nel file
2099   \file{/usr/include/bits/dirent.h}, essa non contempla la presenza del campo
2100   \var{d\_namlen} che indica la lunghezza del nome del file.} La funzione
2101 restituisce il puntatore alla struttura; si tenga presente però che
2102 quest'ultima è allocata staticamente, per cui viene sovrascritta tutte le
2103 volte che si ripete la lettura di una voce sullo stesso \textit{directory
2104   stream}.
2105
2106 Di questa funzione esiste anche una versione \index{funzioni!rientranti}
2107 rientrante, \func{readdir\_r},\footnote{per usarla è necessario definire una
2108   qualunque delle macro \texttt{\macro{\_POSIX\_C\_SOURCE} >= 1},
2109   \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
2110   \macro{\_POSIX\_SOURCE}.} che non usa una struttura allocata staticamente, e
2111 può essere utilizzata anche con i \itindex{thread} \textit{thread}, il suo
2112 prototipo è:
2113 \begin{functions}
2114   \headdecl{sys/types.h} \headdecl{dirent.h} 
2115   
2116   \funcdecl{int readdir\_r(DIR *dir, struct dirent *entry,
2117           struct dirent **result)}
2118   
2119   Legge una voce dal \textit{directory stream}.
2120   
2121   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2122     errore, gli errori sono gli stessi di \func{readdir}.}
2123 \end{functions}
2124
2125 La funzione restituisce in \param{result} (come
2126 \itindex{value~result~argument} \textit{value result argument}) l'indirizzo
2127 dove sono stati salvati i dati, che di norma corrisponde a quello della
2128 struttura precedentemente allocata e specificata dall'argomento \param{entry},
2129 anche se non è assicurato che la funzione usi lo spazio fornito dall'utente.
2130
2131 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
2132 presenti nella directory; sia BSD che SVr4 prevedono che siano sempre presenti
2133 il campo \var{d\_name},\footnote{lo standard POSIX prevede invece solo la
2134   presenza del campo \var{d\_fileno}, identico \var{d\_ino}, che in Linux è
2135   definito come alias di quest'ultimo; il campo \var{d\_name} è considerato
2136   dipendente dall'implementazione.} che contiene il nome del file nella forma
2137 di una stringa terminata da uno zero,\footnote{lo standard POSIX non specifica
2138   una lunghezza, ma solo un limite \const{NAME\_MAX}; in SVr4 la lunghezza del
2139   campo è definita come \code{NAME\_MAX+1} che di norma porta al valore di 256
2140   byte usato anche in Linux.} ed il campo \var{d\_ino}, che contiene il numero
2141 di \textit{inode} cui il file è associato e corrisponde al campo \var{st\_ino}
2142 di \struct{stat}.
2143
2144 La presenza di ulteriori campi opzionali oltre i due citati è segnalata dalla
2145 definizione di altrettante macro nella forma \code{\_DIRENT\_HAVE\_D\_XXX}
2146 dove \code{XXX} è il nome del relativo campo; nel caso di Linux sono pertanto
2147 definite le macro \macro{\_DIRENT\_HAVE\_D\_TYPE},
2148 \macro{\_DIRENT\_HAVE\_D\_OFF} e \macro{\_DIRENT\_HAVE\_D\_RECLEN}, mentre non
2149 è definita la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN}.
2150
2151 \begin{table}[htb]
2152   \centering
2153   \footnotesize
2154   \begin{tabular}[c]{|l|l|}
2155     \hline
2156     \textbf{Valore} & \textbf{Tipo di file} \\
2157     \hline
2158     \hline
2159     \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
2160     \const{DT\_REG}     & File normale.\\
2161     \const{DT\_DIR}     & Directory.\\
2162     \const{DT\_LNK}     & Link simbolico.\\
2163     \const{DT\_FIFO}    & Fifo.\\
2164     \const{DT\_SOCK}    & Socket.\\
2165     \const{DT\_CHR}     & Dispositivo a caratteri.\\
2166     \const{DT\_BLK}     & Dispositivo a blocchi.\\
2167     \hline    
2168   \end{tabular}
2169   \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
2170     della struttura \struct{dirent}.}
2171   \label{tab:file_dtype_macro}
2172 \end{table}
2173
2174 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
2175 indica il tipo di file (se fifo, directory, link simbolico, ecc.), e consente
2176 di evitare una successiva chiamata a \func{lstat} per determinarlo. I suoi
2177 possibili valori sono riportati in tab.~\ref{tab:file_dtype_macro}. Si tenga
2178 presente che questo valore è disponibile solo per i filesystem che ne
2179 supportano la restituzione (fra questi i più noti sono \textsl{btrfs},
2180 \textsl{ext2}, \textsl{ext3}, e \textsl{ext4}), per gli altri si otterrà
2181 sempre il valore \const{DT\_UNKNOWN}.\footnote{inoltre fino alla versione 2.1
2182   delle \acr{glibc}, pur essendo il campo \var{d\_type} presente, il suo uso
2183   non era implementato, e veniva restituito comunque il valore
2184   \const{DT\_UNKNOWN}.}
2185
2186 Per la conversione da e verso l'analogo valore mantenuto dentro il campo
2187 \var{st\_mode} di \struct{stat} sono definite anche due macro di conversione,
2188 \macro{IFTODT} e \macro{DTTOIF}:
2189 \begin{functions}
2190   \funcdecl{int IFTODT(mode\_t MODE)} Converte il tipo di file dal formato di
2191   \var{st\_mode} a quello di \var{d\_type}.
2192   
2193   \funcdecl{mode\_t DTTOIF(int DTYPE)} Converte il tipo di file dal formato di
2194   \var{d\_type} a quello di \var{st\_mode}.
2195 \end{functions}
2196
2197 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
2198 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
2199 letta. Con questi due campi diventa possibile, determinando la posizione delle
2200 varie voci, spostarsi all'interno dello stream usando la funzione
2201 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
2202   estensioni prese da BSD, ed introdotte nello standard POSIX solo a partire
2203   dalla revisione POSIX.1-2001, per poterle utilizzare deve essere definita
2204   una delle macro \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE} o
2205   \macro{\_SVID\_SOURCE}.} il cui prototipo è:
2206 \begin{prototype}{dirent.h}{void seekdir(DIR *dir, off\_t offset)}
2207   Cambia la posizione all'interno di un \textit{directory stream}.
2208 \end{prototype}
2209
2210 La funzione non ritorna nulla e non segnala errori, è però necessario che il
2211 valore dell'argomento \param{offset} sia valido per lo stream \param{dir};
2212 esso pertanto deve essere stato ottenuto o dal valore di \var{d\_off} di
2213 \struct{dirent} o dal valore restituito dalla funzione \funcd{telldir}, che
2214 legge la posizione corrente; il prototipo di quest'ultima è:\footnote{prima
2215   delle \acr{glibc} 2.1.1 la funzione restituiva un valore di tipo
2216   \type{off\_t}, sostituito a partire dalla versione 2.1.2 da \ctyp{long} per
2217   conformità a POSIX.1-2001.}
2218 \begin{prototype}{dirent.h}{long telldir(DIR *dir)}
2219   Ritorna la posizione corrente in un \textit{directory stream}.
2220   
2221   \bodydesc{La funzione restituisce la posizione corrente nello stream (un
2222     numero positivo) in caso di successo, e -1 altrimenti, nel qual caso
2223     \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
2224     valore errato per \param{dir}.}
2225 \end{prototype}
2226
2227 La sola funzione di posizionamento nello stream prevista originariamente dallo
2228 standard POSIX è \funcd{rewinddir}, che riporta la posizione a quella
2229 iniziale; il suo prototipo è:
2230 \begin{functions}
2231   \headdecl{sys/types.h} \headdecl{dirent.h} 
2232   
2233   \funcdecl{void rewinddir(DIR *dir)}
2234   
2235   Si posiziona all'inizio di un \textit{directory stream}.
2236 \end{functions}
2237
2238 Una volta completate le operazioni si può chiudere il \textit{directory
2239   stream}, ed il file descriptor ad esso associato, con la funzione
2240 \funcd{closedir}, il cui prototipo è:
2241 \begin{functions}
2242   \headdecl{sys/types.h} \headdecl{dirent.h} 
2243   
2244   \funcdecl{int closedir(DIR * dir)} 
2245   
2246   Chiude un \textit{directory stream}.
2247   
2248   \bodydesc{La funzione restituisce 0 in caso di successo e -1 altrimenti, nel
2249     qual caso \var{errno} assume il valore \errval{EBADF}.}
2250 \end{functions}
2251
2252 A parte queste funzioni di base in BSD 4.3 venne introdotta un'altra funzione
2253 che permette di eseguire una scansione completa, con tanto di ricerca ed
2254 ordinamento, del contenuto di una directory; la funzione è
2255 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
2256   \acr{libc4} e richiede siano definite le macro \macro{\_BSD\_SOURCE} o
2257   \macro{\_SVID\_SOURCE}.} ed il suo prototipo è:
2258 \begin{prototype}{dirent.h}{int scandir(const char *dir, 
2259     struct dirent ***namelist, int(*filter)(const struct dirent *),
2260     int(*compar)(const struct dirent **, const struct dirent **))} 
2261   
2262   Esegue una scansione di un \textit{directory stream}.
2263   
2264   \bodydesc{La funzione restituisce in caso di successo il numero di voci
2265     trovate, e -1 altrimenti.}
2266 \end{prototype}
2267
2268 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
2269 prototipo non è molto comprensibile; queste funzioni però sono quelle che
2270 controllano rispettivamente la selezione di una voce (quella passata con
2271 l'argomento \param{filter}) e l'ordinamento di tutte le voci selezionate
2272 (quella specificata dell'argomento \param{compar}).
2273
2274 La funzione legge tutte le voci della directory indicata dall'argomento
2275 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
2276 \struct{dirent}) come argomento della funzione di selezione specificata da
2277 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
2278 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
2279 Qualora si specifichi un valore \val{NULL} per l'argomento \func{filter} non
2280 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
2281
2282 Le voci selezionate possono essere riordinate tramite \func{qsort}, le modalità
2283 del riordinamento possono essere personalizzate usando la funzione
2284 \param{compar} come criterio di ordinamento di \func{qsort}, la funzione
2285 prende come argomenti le due strutture \struct{dirent} da confrontare
2286 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
2287 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
2288 \struct{dirent} viene restituito nell'argomento
2289 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
2290   restituisce, come \itindex{value~result~argument} \textit{value result
2291     argument}, l'indirizzo della stessa; questo significa che \param{namelist}
2292   deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
2293   si deve passare il suo indirizzo.}
2294
2295 Per l'ordinamento, vale a dire come valori possibili per l'argomento
2296 \param{compar} sono disponibili due funzioni predefinite, \funcd{alphasort} e
2297 \funcd{versionsort}, i cui prototipi sono:
2298 \begin{functions}
2299   \headdecl{dirent.h} 
2300   
2301   \funcdecl{int alphasort(const void *a, const void *b)} 
2302
2303   \funcdecl{int versionsort(const void *a, const void *b)} 
2304   
2305   Funzioni per l'ordinamento delle voci di \textit{directory stream}.
2306   
2307   \bodydesc{Le funzioni restituiscono un valore minore, uguale o maggiore di
2308     zero qualora il primo argomento sia rispettivamente minore, uguale o
2309     maggiore del secondo.}
2310 \end{functions}
2311
2312 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
2313 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
2314   argomenti dei puntatori a delle strutture \struct{dirent}; le glibc usano il
2315   prototipo originario di BSD, mostrato anche nella definizione, che prevede
2316   puntatori a \ctyp{void}.} e deve essere specificata come argomento
2317 \param{compar} per ottenere un ordinamento alfabetico (secondo il valore del
2318 campo \var{d\_name} delle varie voci). Le \acr{glibc} prevedono come
2319 estensione\footnote{le glibc, a partire dalla versione 2.1, effettuano anche
2320   l'ordinamento alfabetico tenendo conto delle varie localizzazioni, usando
2321   \func{strcoll} al posto di \func{strcmp}.} anche \func{versionsort}, che
2322 ordina i nomi tenendo conto del numero di versione (cioè qualcosa per cui
2323 \texttt{file10} viene comunque dopo \texttt{file4}.)
2324
2325 \begin{figure}[!htbp]
2326   \footnotesize \centering
2327   \begin{minipage}[c]{\codesamplewidth}
2328     \includecodesample{listati/my_ls.c}
2329   \end{minipage}
2330   \caption{Esempio di codice per eseguire la lista dei file contenuti in una
2331     directory.} 
2332   \label{fig:file_my_ls}
2333 \end{figure}
2334
2335 Un semplice esempio dell'uso di queste funzioni è riportato in
2336 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
2337 programma che, usando la funzione di scansione illustrata in
2338 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
2339 e la relativa dimensione (in sostanza una versione semplificata del comando
2340 \cmd{ls}).
2341
2342 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
2343 la parte di gestione delle opzioni (che prevede solo l'uso di una funzione per
2344 la stampa della sintassi, anch'essa omessa) ma il codice completo potrà essere
2345 trovato coi sorgenti allegati nel file \file{myls.c}.
2346
2347 In sostanza tutto quello che fa il programma, dopo aver controllato
2348 (\texttt{\small 12--15}) di avere almeno un argomento (che indicherà la
2349 directory da esaminare) è chiamare (\texttt{\small 16}) la funzione
2350 \func{DirScan} per eseguire la scansione, usando la funzione \code{do\_ls}
2351 (\texttt{\small 22--29}) per fare tutto il lavoro.
2352
2353 Quest'ultima si limita (\texttt{\small 26}) a chiamare \func{stat} sul file
2354 indicato dalla directory entry passata come argomento (il cui nome è appunto
2355 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
2356 dati ad esso relativi, per poi provvedere (\texttt{\small 27}) a stampare il
2357 nome del file e la dimensione riportata in \var{data}.
2358
2359 Dato che la funzione verrà chiamata all'interno di \func{DirScan} per ogni
2360 voce presente questo è sufficiente a stampare la lista completa dei file e
2361 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
2362 valore di ritorno per indicare una esecuzione senza errori.
2363
2364 \begin{figure}[!htbp]
2365   \footnotesize \centering
2366   \begin{minipage}[c]{\codesamplewidth}
2367     \includecodesample{listati/DirScan.c}
2368   \end{minipage}
2369   \caption{Codice della funzione di scansione di una directory contenuta nel
2370     file \file{DirScan.c}.} 
2371   \label{fig:file_dirscan}
2372 \end{figure}
2373
2374 Tutto il grosso del lavoro è svolto dalla funzione \func{DirScan}, riportata
2375 in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e permette
2376 di eseguire una funzione, passata come secondo argomento, su tutte le voci di
2377 una directory.  La funzione inizia con l'aprire (\texttt{\small 18--22}) uno
2378 stream sulla directory passata come primo argomento, stampando un messaggio in
2379 caso di errore.
2380
2381 Il passo successivo (\texttt{\small 23--24}) è cambiare directory di lavoro
2382 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzioni
2383 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
2384 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
2385 (\texttt{\small 26--30}) sulle singole voci dello stream ci si trovi
2386 all'interno della directory.\footnote{questo è essenziale al funzionamento
2387   della funzione \code{do\_ls}, e ad ogni funzione che debba usare il campo
2388   \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
2389   struttura \struct{dirent} sono sempre relativi alla directory in questione,
2390   e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
2391   ottenere le dimensioni.}
2392
2393 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
2394 alla funzione passata come secondo argomento, il ciclo di scansione della
2395 directory è molto semplice; si legge una voce alla volta (\texttt{\small 26})
2396 all'interno di una istruzione di \code{while} e fintanto che si riceve una
2397 voce valida, cioè un puntatore diverso da \val{NULL}, si esegue
2398 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
2399 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
2400   28}) qualora questa presenti una anomalia, identificata da un codice di
2401 ritorno negativo. Una volta terminato il ciclo la funzione si conclude con la
2402 chiusura (\texttt{\small 32}) dello stream\footnote{nel nostro caso, uscendo
2403   subito dopo la chiamata, questo non servirebbe, in generale però
2404   l'operazione è necessaria, dato che la funzione può essere invocata molte
2405   volte all'interno dello stesso processo, per cui non chiudere i
2406   \textit{directory stream} comporterebbe un consumo progressivo di risorse,
2407   con conseguente rischio di esaurimento delle stesse.} e la restituzione
2408 (\texttt{\small 32}) del codice di operazioni concluse con successo.
2409
2410
2411 \subsection{La directory di lavoro}
2412 \label{sec:file_work_dir}
2413
2414 \itindbeg{pathname}
2415
2416 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
2417 directory nel filesystem,\footnote{questa viene mantenuta all'interno dei dati
2418   della sua \struct{task\_struct} (vedi fig.~\ref{fig:proc_task_struct}), più
2419   precisamente nel campo \texttt{pwd} della sotto-struttura
2420   \struct{fs\_struct}.} che è chiamata \textsl{directory corrente} o
2421 \textsl{directory di lavoro} (in inglese \textit{current working directory}).
2422 La directory di lavoro è quella da cui si parte quando un
2423 \itindsub{pathname}{relativo} \textit{pathname} è espresso in forma relativa,
2424 dove il ``\textsl{relativa}'' fa riferimento appunto a questa directory.
2425
2426 Quando un utente effettua il login, questa directory viene impostata alla
2427 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
2428 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
2429 comando \cmd{pwd} la stampa sul terminale.  Siccome la directory corrente
2430 resta la stessa quando viene creato un processo figlio (vedi
2431 sez.~\ref{sec:proc_fork}), la directory corrente della shell diventa anche la
2432 directory corrente di qualunque comando da essa lanciato.
2433
2434 Dato che è il kernel che tiene traccia per ciascun processo \itindex{inode}
2435 dell'\textit{inode} della directory di lavoro, per ottenerne il
2436 \textit{pathname} occorre usare una apposita funzione di libreria,
2437 \funcd{getcwd},\footnote{con Linux \func{getcwd} è una \textit{system call}
2438   dalla versione 2.1.9, in precedenza il valore doveva essere ottenuto tramite
2439   il filesystem \texttt{/proc} da \procfile{/proc/self/cwd}.} il cui prototipo
2440 è:
2441 \begin{prototype}{unistd.h}{char *getcwd(char *buffer, size\_t size)}
2442   Legge il \textit{pathname} della directory di lavoro corrente.
2443   
2444   \bodydesc{La funzione restituisce il puntatore \param{buffer} se riesce,
2445     \val{NULL} se fallisce, in quest'ultimo caso la variabile
2446     \var{errno} è impostata con i seguenti codici di errore:
2447   \begin{errlist}
2448   \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
2449     è nullo.
2450   \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
2451     lunghezza del \textit{pathname}. 
2452   \item[\errcode{EACCES}] manca il permesso di lettura o di ricerca su uno dei
2453     componenti del \textit{pathname} (cioè su una delle directory superiori
2454     alla corrente).
2455   \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata.
2456   \end{errlist}}
2457 \end{prototype}
2458
2459 La funzione restituisce il \textit{pathname} completo della directory di
2460 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
2461 precedentemente allocata, per una dimensione massima di \param{size}.  Il
2462 buffer deve essere sufficientemente largo da poter contenere il
2463 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
2464 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
2465 un errore.
2466
2467 Si può anche specificare un puntatore nullo come
2468 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
2469   supportata da Linux e dalla \acr{glibc}.} nel qual caso la stringa sarà
2470 allocata automaticamente per una dimensione pari a \param{size} qualora questa
2471 sia diversa da zero, o della lunghezza esatta del \textit{pathname}
2472 altrimenti. In questo caso ci si deve ricordare di disallocare la stringa una
2473 volta cessato il suo utilizzo.
2474
2475 Di questa funzione esiste una versione \code{char *getwd(char *buffer)} fatta
2476 per compatibilità all'indietro con BSD, che non consente di specificare la
2477 dimensione del buffer; esso deve essere allocato in precedenza ed avere una
2478 dimensione superiore a \const{PATH\_MAX} (di solito 256 byte, vedi
2479 sez.~\ref{sec:sys_limits}); il problema è che in Linux non esiste una
2480 dimensione superiore per un \textit{pathname}, per cui non è detto che il
2481 buffer sia sufficiente a contenere il nome del file, e questa è la ragione
2482 principale per cui questa funzione è deprecata.
2483
2484 Un uso comune di \func{getcwd} è quello di salvare la directory di lavoro
2485 iniziale per poi potervi tornare in un tempo successivo, un metodo alternativo
2486 più veloce, se non si è a corto di file descriptor, è invece quello di aprire
2487 la directory corrente (vale a dire ``\texttt{.}'') e tornarvi in seguito con
2488 \func{fchdir}. 
2489
2490 Una seconda usata per ottenere la directory di lavoro è \code{char
2491   *get\_current\_dir\_name(void)} che è sostanzialmente equivalente ad una
2492 \code{getcwd(NULL, 0)}, con la sola differenza che essa ritorna il valore
2493 della variabile di ambiente \val{PWD}, che essendo costruita dalla shell può
2494 contenere un \textit{pathname} comprendente anche dei link simbolici. Usando
2495 \func{getcwd} infatti, essendo il \textit{pathname} ricavato risalendo
2496 all'indietro l'albero della directory, si perderebbe traccia di ogni passaggio
2497 attraverso eventuali link simbolici.
2498
2499 Per cambiare la directory di lavoro si può usare la funzione \funcd{chdir}
2500 (equivalente del comando di shell \cmd{cd}) il cui nome sta appunto per
2501 \textit{change directory}, il suo prototipo è:
2502 \begin{prototype}{unistd.h}{int chdir(const char *pathname)} 
2503   Cambia la directory di lavoro in \param{pathname}.
2504   
2505   \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
2506     nel qual caso \var{errno} assumerà i valori:
2507   \begin{errlist}
2508   \item[\errcode{ENOTDIR}] non si è specificata una directory.
2509   \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
2510     di \param{path}.
2511   \end{errlist}
2512   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2513   \errval{ENOMEM}, \errval{ELOOP} e \errval{EIO}.}
2514 \end{prototype}
2515 \noindent ed ovviamente \param{pathname} deve indicare una directory per la
2516 quale si hanno i permessi di accesso.
2517
2518 Dato che anche le directory sono file, è possibile riferirsi ad esse anche
2519 tramite il file descriptor, e non solo tramite il \textit{pathname}, per fare
2520 questo si usa \funcd{fchdir}, il cui prototipo è:
2521 \begin{prototype}{unistd.h}{int fchdir(int fd)} 
2522   Identica a \func{chdir}, ma usa il file descriptor \param{fd} invece del
2523   \textit{pathname}.
2524   
2525   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
2526     errore, in caso di errore \var{errno} assumerà i valori \errval{EBADF} o
2527     \errval{EACCES}.}
2528 \end{prototype}
2529 \noindent anche in questo caso \param{fd} deve essere un file descriptor
2530 valido che fa riferimento ad una directory. Inoltre l'unico errore di accesso
2531 possibile (tutti gli altri sarebbero occorsi all'apertura di \param{fd}), è
2532 quello in cui il processo non ha il permesso di accesso alla directory
2533 specificata da \param{fd}.
2534
2535 \itindend{pathname}
2536
2537
2538
2539 \subsection{I file temporanei}
2540 \label{sec:file_temp_file}
2541
2542 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
2543 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
2544 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
2545 creare il file dopo aver controllato che questo non esista, nel momento fra il
2546 controllo e la creazione si ha giusto lo spazio per una possibile
2547 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
2548 sez.~\ref{sec:proc_race_cond}).
2549
2550 Le \acr{glibc} provvedono varie funzioni per generare nomi di file temporanei,
2551 di cui si abbia certezza di unicità al momento della generazione; storicamente
2552 la prima di queste funzioni create a questo scopo era
2553 \funcd{tmpnam},\footnote{la funzione è stata deprecata nella revisione
2554   POSIX.1-2008 dello standard POSIX.} il cui prototipo è:
2555 \begin{prototype}{stdio.h}{char *tmpnam(char *string)}
2556   Genera un nome univoco per un file temporaneo.
2557  
2558   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
2559   \val{NULL} in caso di fallimento. Non sono definiti errori.}
2560 \end{prototype}
2561
2562 La funzione restituisce il puntatore ad una stringa contente un nome di file
2563 valido e non esistente al momento dell'invocazione; se si è passato come
2564 argomento \param{string} un puntatore non nullo ad un buffer di caratteri
2565 questo deve essere di dimensione \const{L\_tmpnam} ed il nome generato vi
2566 verrà copiato automaticamente; altrimenti il nome sarà generato in un buffer
2567 statico interno che verrà sovrascritto ad una chiamata successiva.  Successive
2568 invocazioni della funzione continueranno a restituire nomi unici fino ad un
2569 massimo di \const{TMP\_MAX} volte, limite oltre il quale il comportamento è
2570 indefinito. Al nome viene automaticamente aggiunto come prefisso la directory
2571 specificata dalla costante \const{P\_tmpdir}.\footnote{le costanti
2572   \const{L\_tmpnam}, \const{P\_tmpdir} e \const{TMP\_MAX} sono definite in
2573   \file{stdio.h}.}
2574
2575 Di questa funzione esiste una versione \index{funzioni!rientranti} rientrante,
2576 \func{tmpnam\_r}, che non fa nulla quando si passa \val{NULL} come argomento.
2577 Una funzione simile, \funcd{tempnam}, permette di specificare un prefisso per
2578 il file esplicitamente, il suo prototipo è:
2579 \begin{prototype}{stdio.h}{char *tempnam(const char *dir, const char *pfx)}
2580   Genera un nome univoco per un file temporaneo.
2581
2582   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
2583   \val{NULL} in caso di fallimento, \var{errno} viene impostata a
2584   \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
2585 \end{prototype}
2586
2587 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
2588 per cui è sempre \index{funzioni!rientranti} rientrante, occorre però
2589 ricordarsi di disallocare con \code{free} il puntatore che restituisce.
2590 L'argomento \param{pfx} specifica un prefisso di massimo 5 caratteri per il
2591 nome provvisorio. La funzione assegna come directory per il file temporaneo,
2592 verificando che esista e sia accessibile, la prima valida fra le seguenti:
2593 \begin{itemize*}
2594 \item La variabile di ambiente \const{TMPDIR} (non ha effetto se non è
2595   definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
2596   \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}).
2597 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}).
2598 \item Il valore della costante \const{P\_tmpdir}.
2599 \item la directory \file{/tmp}.
2600 \end{itemize*}
2601
2602 In ogni caso, anche se la generazione del nome è casuale, ed è molto difficile
2603 ottenere un nome duplicato, nulla assicura che un altro processo non possa
2604 avere creato, fra l'ottenimento del nome e l'apertura del file, un altro file
2605 con lo stesso nome; per questo motivo quando si usa il nome ottenuto da una di
2606 queste funzioni occorre sempre aprire il nuovo file in modalità di esclusione
2607 (cioè con l'opzione \const{O\_EXCL} per i file descriptor o con il flag
2608 \code{x} per gli stream) che fa fallire l'apertura in caso il file sia già
2609 esistente.
2610
2611 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
2612 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
2613 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
2614 \begin{prototype}{stdio.h}{FILE *tmpfile(void)}
2615   Restituisce un file temporaneo aperto in lettura/scrittura.
2616   
2617   \bodydesc{La funzione ritorna il puntatore allo stream associato al file
2618     temporaneo in caso di successo e \val{NULL} in caso di errore, nel qual
2619     caso \var{errno} assumerà i valori:
2620     \begin{errlist}
2621     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
2622     \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
2623     \end{errlist}
2624     ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
2625     \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES}.}
2626 \end{prototype}
2627
2628 La funzione restituisce direttamente uno stream già aperto (in modalità
2629 \code{r+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso, che viene
2630 automaticamente cancellato alla sua chiusura o all'uscita dal programma. Lo
2631 standard non specifica in quale directory verrà aperto il file, ma le
2632 \acr{glibc} prima tentano con \const{P\_tmpdir} e poi con \file{/tmp}. Questa
2633 funzione è \index{funzioni!rientranti} rientrante e non soffre di problemi di
2634 \itindex{race~condition} \textit{race condition}.
2635
2636 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
2637 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
2638 modificano una stringa di input che serve da modello e che deve essere
2639 conclusa da 6 caratteri \code{X} che verranno sostituiti da un codice
2640 unico. La prima delle due è analoga a \func{tmpnam} e genera un nome casuale,
2641 il suo prototipo è:
2642 \begin{prototype}{stlib.h}{char *mktemp(char *template)}
2643   Genera un nome univoco per un file temporaneo.
2644   
2645   \bodydesc{La funzione ritorna il puntatore \param{template} in caso di
2646     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
2647     assumerà i valori:
2648     \begin{errlist}
2649     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2650     \end{errlist}}
2651 \end{prototype}
2652
2653 La funzionane genera un nome univoco sostituendo le \code{XXXXXX} finali di
2654 \param{template}; dato che \param{template} deve poter essere modificata dalla
2655 funzione non si può usare una stringa costante.  Tutte le avvertenze riguardo
2656 alle possibili \itindex{race~condition} \textit{race condition} date per
2657 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
2658 il valore usato per sostituire le \code{XXXXXX} viene formato con il \ids{PID}
2659 del processo più una lettera, il che mette a disposizione solo 26 possibilità
2660 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
2661 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
2662 usata.
2663
2664 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
2665 \func{tmpfile}, ma restituisce un file descriptor invece di un nome; il suo
2666 prototipo è:
2667 \begin{prototype}{stlib.h}{int mkstemp(char *template)}
2668   Genera un file temporaneo.
2669   
2670   \bodydesc{La funzione ritorna il file descriptor in caso di successo e
2671     -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
2672     \begin{errlist}
2673     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2674     \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
2675       contenuto di \param{template} è indefinito.
2676     \end{errlist}}
2677 \end{prototype}
2678
2679 Come per \func{mktemp} anche in questo caso \param{template} non può essere
2680 una stringa costante. La funzione apre un file in lettura/scrittura con la
2681 funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
2682 sez.~\ref{sec:file_open}), in questo modo al ritorno della funzione si ha la
2683 certezza di essere stati i creatori del file, i cui permessi (si veda
2684 sez.~\ref{sec:file_perm_overview}) sono impostati al valore \code{0600}
2685 (lettura e scrittura solo per il proprietario).\footnote{questo è vero a
2686   partire dalle \acr{glibc} 2.0.7, le versioni precedenti delle \acr{glibc} e
2687   le vecchie \acr{libc5} e \acr{libc4} usavano il valore \code{0666} che
2688   permetteva a chiunque di leggere e scrivere i contenuti del file.}  Di
2689 questa funzione esiste una variante \funcd{mkostemp}, introdotta
2690 specificamente dalla \acr{glibc},\footnote{la funzione è stata introdotta
2691   nella versione 2.7 delle librerie e richiede che sia definita la macro
2692   \const{\_GNU\_SOURCE}.} il cui prototipo è:
2693 \begin{prototype}{stlib.h}{int mkostemp(char *template, int flags)}
2694   Genera un file temporaneo.
2695   
2696   \bodydesc{La funzione ritorna il file descriptor in caso di successo e
2697     -1 in caso di errore, con gli stessi errori di \func{mkstemp}.}
2698 \end{prototype}
2699 \noindent la cui sola differenza è la presenza dell'ulteriore argomento
2700 \var{flags} che consente di specificare i flag da passare ad \func{open}
2701 nell'apertura del file.
2702
2703
2704 In OpenBSD è stata introdotta un'altra funzione simile alle precedenti,
2705 \funcd{mkdtemp}, che crea invece una directory temporanea;\footnote{la
2706   funzione è stata introdotta nelle \acr{glibc} a partire dalla versione
2707   2.1.91 ed inserita nello standard POSIX.1-2008.}  il suo prototipo è:
2708 \begin{prototype}{stlib.h}{char *mkdtemp(char *template)}
2709   Genera una directory temporanea.
2710   
2711   \bodydesc{La funzione ritorna il puntatore al nome della directory in caso
2712     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
2713     assumerà i valori:
2714     \begin{errlist}
2715     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2716     \end{errlist}
2717     più gli altri eventuali codici di errore di \func{mkdir}.}
2718 \end{prototype}
2719
2720 La funzione genera una directory il cui nome è ottenuto sostituendo le
2721 \code{XXXXXX} finali di \param{template} con permessi \code{0700} (al solito
2722 si veda cap.~\ref{cha:file_unix_interface} per i dettagli); dato che la
2723 creazione della directory è sempre esclusiva i precedenti problemi di
2724 \itindex{race~condition} \textit{race condition} non si pongono.
2725
2726
2727 \section{La manipolazione delle caratteristiche dei file}
2728 \label{sec:file_infos}
2729
2730 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
2731 relative alle caratteristiche di ciascun file, a partire dalle informazioni
2732 relative al controllo di accesso, sono mantenute \itindex{inode}
2733 nell'\textit{inode}.
2734
2735 Vedremo in questa sezione come sia possibile leggere tutte queste informazioni
2736 usando la funzione \func{stat}, che permette l'accesso a tutti i dati
2737 memorizzati \itindex{inode} nell'\textit{inode}; esamineremo poi le varie
2738 funzioni usate per manipolare tutte queste informazioni (eccetto quelle che
2739 riguardano la gestione del controllo di accesso, trattate in in
2740 sez.~\ref{sec:file_access_control}).
2741
2742
2743 \subsection{La lettura delle caratteristiche dei file}
2744 \label{sec:file_stat}
2745
2746 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
2747 delle funzioni \func{stat} che sono quelle che usa il comando \cmd{ls} per
2748 poter ottenere e mostrare tutti i dati relativi ad un file; ne fanno parte le
2749 funzioni \funcd{stat}, \funcd{fstat} e \funcd{lstat}, i cui prototipi sono:
2750 \begin{functions}
2751   \headdecl{sys/types.h} 
2752   \headdecl{sys/stat.h} 
2753   \headdecl{unistd.h}
2754
2755   \funcdecl{int stat(const char *file\_name, struct stat *buf)} 
2756   \funcdecl{int lstat(const char *file\_name, struct stat *buf)} 
2757   \funcdecl{int fstat(int filedes, struct stat *buf)} 
2758   Legge le informazioni di un file.
2759
2760   \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
2761     errore, nel qual caso \var{errno} assumerà uno dei valori: \errval{EBADF},
2762     \errval{ENOENT}, \errval{ENOTDIR}, \errval{ELOOP}, \errval{EFAULT},
2763     \errval{EACCES}, \errval{ENOMEM}, \errval{ENAMETOOLONG}.}
2764 \end{functions}
2765
2766 La funzione \func{stat} legge le informazioni del file il cui pathname è
2767 specificato dalla stringa puntata da \param{file\_name} e le inserisce nel
2768 buffer puntato dall'argomento \param{buf}; la funzione \func{lstat} è identica
2769 a \func{stat} eccetto che se \param{file\_name} è un link simbolico vengono
2770 lette le informazioni relative ad esso e non al file a cui fa
2771 riferimento. Infine \func{fstat} esegue la stessa operazione su un file già
2772 aperto, specificato tramite il suo file descriptor \param{filedes}.
2773
2774 La struttura \struct{stat} usata da queste funzioni è definita nell'header
2775 \file{sys/stat.h} e in generale dipende dall'implementazione; la versione
2776 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
2777 riportata dalla pagina di manuale di \func{stat}; in realtà la definizione
2778 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
2779 riservati per estensioni come tempi dei file più precisi (vedi
2780 sez.~\ref{sec:file_file_times}), o per il padding dei campi.
2781
2782 \begin{figure}[!htb]
2783   \footnotesize
2784   \centering
2785   \begin{minipage}[c]{\textwidth}
2786     \includestruct{listati/stat.h}
2787   \end{minipage} 
2788   \normalsize 
2789   \caption{La struttura \structd{stat} per la lettura delle informazioni dei 
2790     file.}
2791   \label{fig:file_stat_struct}
2792 \end{figure}
2793
2794 Si noti come i vari membri della struttura siano specificati come tipi
2795 primitivi del sistema (di quelli definiti in
2796 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \file{sys/types.h}).
2797
2798 \subsection{I tipi di file}
2799 \label{sec:file_types}
2800
2801 Come riportato in tab.~\ref{tab:file_file_types} in Linux oltre ai file e alle
2802 directory esistono altri oggetti che possono stare su un filesystem.  Il tipo
2803 di file è ritornato dalla funzione \func{stat} come maschera binaria nel campo
2804 \var{st\_mode} (che contiene anche le informazioni relative ai permessi) di
2805 una struttura \struct{stat}.
2806
2807 Dato che il valore numerico può variare a seconda delle implementazioni, lo
2808 standard POSIX definisce un insieme di macro per verificare il tipo di file,
2809 queste vengono usate anche da Linux che supporta pure le estensioni allo
2810 standard per i link simbolici e i socket definite da BSD; l'elenco completo
2811 delle macro con cui è possibile estrarre l'informazione da \var{st\_mode} è
2812 riportato in tab.~\ref{tab:file_type_macro}.
2813 \begin{table}[htb]
2814   \centering
2815   \footnotesize
2816   \begin{tabular}[c]{|l|l|}
2817     \hline
2818     \textbf{Macro} & \textbf{Tipo del file} \\
2819     \hline
2820     \hline
2821     \macro{S\_ISREG}\texttt{(m)}  & file normale.\\
2822     \macro{S\_ISDIR}\texttt{(m)}  & directory.\\
2823     \macro{S\_ISCHR}\texttt{(m)}  & dispositivo a caratteri.\\
2824     \macro{S\_ISBLK}\texttt{(m)}  & dispositivo a blocchi.\\
2825     \macro{S\_ISFIFO}\texttt{(m)} & fifo.\\
2826     \macro{S\_ISLNK}\texttt{(m)}  & link simbolico.\\
2827     \macro{S\_ISSOCK}\texttt{(m)} & socket.\\
2828     \hline    
2829   \end{tabular}
2830   \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h}).}
2831   \label{tab:file_type_macro}
2832 \end{table}
2833
2834 Oltre alle macro di tab.~\ref{tab:file_type_macro} è possibile usare
2835 direttamente il valore di \var{st\_mode} per ricavare il tipo di file
2836 controllando direttamente i vari bit in esso memorizzati. Per questo sempre in
2837 \file{sys/stat.h} sono definite le costanti numeriche riportate in
2838 tab.~\ref{tab:file_mode_flags}.
2839
2840 Il primo valore dell'elenco di tab.~\ref{tab:file_mode_flags} è la maschera
2841 binaria che permette di estrarre i bit nei quali viene memorizzato il tipo di
2842 file, i valori successivi sono le costanti corrispondenti ai singoli bit, e
2843 possono essere usati per effettuare la selezione sul tipo di file voluto, con
2844 un'opportuna combinazione.
2845
2846 \begin{table}[htb]
2847   \centering
2848   \footnotesize
2849   \begin{tabular}[c]{|l|c|l|}
2850     \hline
2851     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
2852     \hline
2853     \hline
2854     \const{S\_IFMT}   &  0170000 & Maschera per i bit del tipo di file.\\
2855     \const{S\_IFSOCK} &  0140000 & Socket.\\
2856     \const{S\_IFLNK}  &  0120000 & Link simbolico.\\
2857     \const{S\_IFREG}  &  0100000 & File regolare.\\ 
2858     \const{S\_IFBLK}  &  0060000 & Dispositivo a blocchi.\\
2859     \const{S\_IFDIR}  &  0040000 & Directory.\\
2860     \const{S\_IFCHR}  &  0020000 & Dispositivo a caratteri.\\
2861     \const{S\_IFIFO}  &  0010000 & Fifo.\\
2862     \hline
2863     \const{S\_ISUID}  &  0004000 & Set UID bit \itindex{suid~bit}.\\
2864     \const{S\_ISGID}  &  0002000 & Set GID bit \itindex{sgid~bit}.\\
2865     \const{S\_ISVTX}  &  0001000 & Sticky bit \itindex{sticky~bit}.\\
2866     \hline
2867 %    \const{S\_IRWXU}  &  00700   & Bitmask per i permessi del proprietario.\\
2868     \const{S\_IRUSR}  &  00400   & Il proprietario ha permesso di lettura.\\
2869     \const{S\_IWUSR}  &  00200   & Il proprietario ha permesso di scrittura.\\
2870     \const{S\_IXUSR}  &  00100   & Il proprietario ha permesso di esecuzione.\\
2871     \hline
2872 %    \const{S\_IRWXG}  &  00070   & Bitmask per i permessi del gruppo.\\
2873     \const{S\_IRGRP}  &  00040   & Il gruppo ha permesso di lettura.\\
2874     \const{S\_IWGRP}  &  00020   & Il gruppo ha permesso di scrittura.\\
2875     \const{S\_IXGRP}  &  00010   & Il gruppo ha permesso di esecuzione.\\
2876     \hline
2877 %    \const{S\_IRWXO}  &  00007   & Bitmask per i permessi di tutti gli altri\\
2878     \const{S\_IROTH}  &  00004   & Gli altri hanno permesso di lettura.\\
2879     \const{S\_IWOTH}  &  00002   & Gli altri hanno permesso di esecuzione.\\
2880     \const{S\_IXOTH}  &  00001   & Gli altri hanno permesso di esecuzione.\\
2881     \hline    
2882   \end{tabular}
2883   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
2884     \var{st\_mode} (definite in \file{sys/stat.h}).}
2885   \label{tab:file_mode_flags}
2886 \end{table}
2887
2888 Ad esempio se si volesse impostare una condizione che permetta di controllare
2889 se un file è una directory o un file ordinario si potrebbe definire la macro
2890 di preprocessore:
2891 \includecodesnip{listati/is_file_dir.h}
2892 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
2893 poi si effettua il confronto con la combinazione di tipi scelta.
2894
2895
2896 \subsection{Le dimensioni dei file}
2897 \label{sec:file_file_size}
2898
2899 Il campo \var{st\_size} di una struttura \struct{stat} contiene la dimensione
2900 del file in byte, se si tratta di un file regolare. Nel caso di un link
2901 simbolico la dimensione è quella del \itindex{pathname} \textit{pathname} che
2902 il link stesso contiene; per le fifo questo campo è sempre nullo.
2903
2904 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
2905 byte. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
2906 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
2907 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
2908 dimensione inferiore sarebbe inefficiente.
2909
2910 Si tenga conto che la lunghezza del file riportata in \var{st\_size} non è
2911 detto che corrisponda all'occupazione dello spazio su disco per via della
2912 possibile esistenza dei cosiddetti \index{file!\textit{hole}} \textit{holes}
2913 (letteralmente \textsl{buchi}) che si formano tutte le volte che si va a
2914 scrivere su un \itindex{sparse~file} file dopo aver eseguito uno spostamento
2915 oltre la sua fine (tratteremo in dettaglio l'argomento in
2916 sez.~\ref{sec:file_lseek}).
2917
2918 In questo caso si avranno risultati differenti a seconda del modo in cui si
2919 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
2920 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
2921 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
2922 caso per le parti non scritte vengono restituiti degli zeri, si avrà lo stesso
2923 risultato di \cmd{ls}.
2924
2925 Se è sempre possibile allargare un file, scrivendoci sopra od usando la
2926 funzione \func{lseek} per spostarsi oltre la sua fine, esistono anche casi in
2927 cui si può avere bisogno di effettuare un troncamento, scartando i dati
2928 presenti al di là della dimensione scelta come nuova fine del file.
2929
2930 Un file può sempre essere troncato a zero aprendolo con il flag
2931 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
2932 dimensione si possono usare le due funzioni \funcd{truncate} e
2933 \funcd{ftruncate}, i cui prototipi sono:
2934 \begin{functions}
2935   \headdecl{unistd.h} 
2936
2937   \funcdecl{int truncate(const char *file\_name, off\_t length)} 
2938
2939   \funcdecl{int ftruncate(int fd, off\_t length))} 
2940
2941   Troncano un file alla lunghezza \param{length}.
2942
2943   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per un
2944     errore, nel qual caso \var{errno} viene impostata opportunamente; per
2945     \func{ftruncate} si hanno i valori:
2946   \begin{errlist}
2947   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
2948   \item[\errcode{EINVAL}] \param{fd} è un riferimento ad un socket, non a un
2949     file o non è aperto in scrittura.
2950   \end{errlist}
2951   per \func{truncate} si hanno:
2952   \begin{errlist}
2953   \item[\errcode{EACCES}] il file non ha permesso di scrittura o non si ha il
2954     permesso di esecuzione una delle directory del \itindex{pathname}
2955     \textit{pathname}.
2956   \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
2957   \end{errlist}
2958   ed anche \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2959   \errval{EROFS}, \errval{EIO}, \errval{EFAULT}, \errval{ELOOP}.}
2960 \end{functions}
2961
2962 Entrambe le funzioni fan sì che la dimensione del file sia troncata ad un
2963 valore massimo specificato da \param{length}, e si distinguono solo per il
2964 fatto che il file viene indicato con il pathname \param{file\_name} per
2965 \func{truncate} e con il file descriptor \param{fd} per \funcd{ftruncate}; se
2966 il file è più lungo della lunghezza specificata i dati in eccesso saranno
2967 perduti.
2968
2969 Il comportamento in caso di lunghezza inferiore non è specificato e dipende
2970 dall'implementazione: il file può essere lasciato invariato o esteso fino alla
2971 lunghezza scelta; nel caso di Linux viene esteso con la creazione di un
2972 \index{file!\textit{hole}} \textsl{buco} nel \itindex{sparse~file} file e ad
2973 una lettura si otterranno degli zeri; si tenga presente però che questo
2974 comportamento è supportato solo per filesystem nativi, ad esempio su un
2975 filesystem non nativo come il VFAT di Windows questo non è possibile.
2976
2977 \subsection{I tempi dei file}
2978 \label{sec:file_file_times}
2979
2980 Il sistema mantiene per ciascun file tre tempi, questi sono registrati
2981 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del file e
2982 possono essere letti tramite la funzione \func{stat}, che li restituisce
2983 attraverso tre specifici campi della struttura \struct{stat} di
2984 fig.~\ref{fig:file_stat_struct}. Il significato di detti tempi e dei relativi
2985 campi è riportato nello schema in tab.~\ref{tab:file_file_times}, dove è anche
2986 riportato un esempio delle funzioni che effettuano cambiamenti su di essi. Il
2987 valore è espresso nel cosiddetto \itindex{calendar~time} \textit{calendar
2988   time}, su cui torneremo in dettaglio in sez.~\ref{sec:sys_time}.
2989
2990 \begin{table}[htb]
2991   \centering
2992   \footnotesize
2993   \begin{tabular}[c]{|c|l|l|c|}
2994     \hline
2995     \textbf{Membro} & \textbf{Significato} & \textbf{Funzione} 
2996     & \textbf{Opzione di \cmd{ls}} \\
2997     \hline
2998     \hline
2999     \var{st\_atime}& ultimo accesso ai dati del file    &
3000                      \func{read}, \func{utime}          & \cmd{-u}\\
3001     \var{st\_mtime}& ultima modifica ai dati del file   &
3002                      \func{write}, \func{utime}         & default\\
3003     \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
3004                      \func{chmod}, \func{utime}         & \cmd{-c}\\
3005     \hline
3006   \end{tabular}
3007   \caption{I tre tempi associati a ciascun file.}
3008   \label{tab:file_file_times}
3009 \end{table}
3010
3011 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
3012 ultima modifica (il \textit{modification time}, \var{st\_mtime}) e il tempo di
3013 ultimo cambiamento di stato (il \textit{change time}, \var{st\_ctime}). Il
3014 primo infatti fa riferimento ad una modifica del contenuto di un file, mentre
3015 il secondo ad una modifica \itindex{inode} dell'\textit{inode}. Dato che
3016 esistono molte operazioni, come la funzione \func{link} e altre che vedremo in
3017 seguito, che modificano solo le informazioni contenute \itindex{inode}
3018 nell'\textit{inode} senza toccare il contenuto del file, diventa necessario
3019 l'utilizzo di questo secondo tempo.
3020
3021 Il tempo di ultima modifica viene usato ad esempio da programmi come
3022 \cmd{make} per decidere quali file necessitano di essere ricompilati o
3023 (talvolta insieme anche al tempo di cambiamento di stato) per decidere quali
3024 file devono essere archiviati per il backup. Il tempo di ultimo accesso viene
3025 di solito usato per identificare i file che non vengono più utilizzati per un
3026 certo lasso di tempo. Ad esempio un programma come \texttt{leafnode} lo usa
3027 per cancellare gli articoli letti più vecchi, mentre \texttt{mutt} lo usa per
3028 marcare i messaggi di posta che risultano letti.  Il sistema non tiene conto
3029 dell'ultimo accesso \itindex{inode} all'\textit{inode}, pertanto funzioni come
3030 \func{access} o \func{stat} non hanno alcuna influenza sui tre tempi. Il
3031 comando \cmd{ls} (quando usato con le opzioni \cmd{-l} o \cmd{-t}) mostra i
3032 tempi dei file secondo lo schema riportato nell'ultima colonna di
3033 tab.~\ref{tab:file_file_times}.
3034
3035 L'aggiornamento del tempo di ultimo accesso è stato a lungo considerato un
3036 difetto progettuale di Unix, questo infatti comporta la necessità di
3037 effettuare un accesso in scrittura sul disco anche in tutti i casi in cui
3038 questa informazione non interessa e sarebbe possibile avere un semplice
3039 accesso in lettura sui dati bufferizzati. Questo comporta un ovvio costo sia
3040 in termini di prestazioni, che di consumo di risorse come la batteria per i
3041 portatili, o cicli di riscrittura per i dischi su memorie riscrivibili.
3042
3043 % TODO aggiustare per il contenuto duplicato con le analoghe MS_*
3044
3045 Per questo motivo, onde evitare di mantenere una informazione che nella
3046 maggior parte dei casi non interessa, è sempre stato possibile disabilitare
3047 l'aggiornamento del tempo di ultimo accesso con l'opzione di montaggio
3048 \texttt{noatime}. Dato però che questo può creare problemi a qualche
3049 programma, in Linux è stata introdotta la opzione \texttt{relatime} che esegue
3050 l'aggiornamento soltanto se il tempo di ultimo accesso è precedente al tempo di
3051 ultima modifica o cambiamento, così da rendere evidente che vi è stato un
3052 accesso dopo la scrittura, ed evitando al contempo ulteriori operazioni su
3053 disco negli accessi successivi. In questo modo l'informazione relativa al
3054 fatto che un file sia stato letto resta disponibile, e ad esempio i programmi
3055 citati in precedenza continuano a funzionare. Questa opzione, a partire dal
3056 kernel 2.6.30, è diventata il comportamento di default e non deve più essere
3057 specificata esplicitamente.\footnote{si può comunque riottenere il vecchio
3058   comportamento usando la opzione di montaggio \texttt{strictatime}.}
3059
3060 \begin{table}[htb]
3061   \centering
3062   \footnotesize
3063   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
3064     \hline
3065     \multicolumn{1}{|p{3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
3066     \multicolumn{3}{|p{3.6cm}|}{\centering{
3067         \textbf{File o directory del riferimento}}}&
3068     \multicolumn{3}{|p{3.6cm}|}{\centering{
3069         \textbf{Directory contenente il riferimento}}} 
3070     &\multicolumn{1}{|p{3.6cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
3071     \cline{2-7}
3072     \cline{2-7}
3073     \multicolumn{1}{|p{3cm}|}{} 
3074     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
3075     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
3076     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
3077     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
3078     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
3079     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
3080     &\multicolumn{1}{|p{3cm}|}{} \\
3081     \hline
3082     \hline
3083     \func{chmod}, \func{fchmod} 
3084              & --      & --      &$\bullet$& --      & --      & --      &\\
3085     \func{chown}, \func{fchown} 
3086              & --      & --      &$\bullet$& --      & --      & --      &\\
3087     \func{creat}  
3088              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&  
3089              con \const{O\_CREATE} \\
3090     \func{creat}  
3091              & --      &$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&   
3092              con \const{O\_TRUNC} \\
3093     \func{exec}  
3094              &$\bullet$& --      & --      & --      & --      & --      &\\
3095     \func{lchown}  
3096              & --      & --      &$\bullet$& --      & --      & --      &\\
3097     \func{link}
3098              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
3099     \func{mkdir}
3100              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3101     \func{mkfifo}
3102              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3103     \func{open}
3104              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$& 
3105              con \const{O\_CREATE} \\
3106     \func{open}
3107              & --      &$\bullet$&$\bullet$& --      & --      & --      & 
3108              con \const{O\_TRUNC}  \\
3109     \func{pipe}
3110              &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
3111     \func{read}
3112              &$\bullet$& --      & --      & --      & --      & --      &\\
3113     \func{remove}
3114              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
3115              se esegue \func{unlink}\\
3116     \func{remove}
3117               & --      & --      & --      & --      &$\bullet$&$\bullet$& 
3118               se esegue \func{rmdir}\\
3119     \func{rename}
3120               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
3121               per entrambi gli argomenti\\
3122     \func{rmdir}
3123               & --      & --      & --      & --      &$\bullet$&$\bullet$&\\ 
3124     \func{truncate}, \func{ftruncate}
3125               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
3126     \func{unlink}
3127               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\ 
3128     \func{utime}
3129               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\ 
3130     \func{write}
3131               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
3132     \hline
3133   \end{tabular}
3134   \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo 
3135     accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento
3136     \textsl{(c)} dalle varie funzioni operanti su file e directory.}
3137   \label{tab:file_times_effects}  
3138 \end{table}
3139
3140
3141 L'effetto delle varie funzioni di manipolazione dei file sui relativi tempi è
3142 illustrato in tab.~\ref{tab:file_times_effects}, facendo riferimento al
3143 comportamento classico per quanto riguarda \var{st\_atime}. Si sono riportati
3144 gli effetti sia per il file a cui si fa riferimento, sia per la directory che
3145 lo contiene; questi ultimi possono essere capiti se si tiene conto di quanto
3146 già detto, e cioè che anche le directory sono anch'esse file che contengono
3147 una lista di nomi, che il sistema tratta in maniera del tutto analoga a tutti
3148 gli altri.
3149
3150 Per questo motivo tutte le volte che compiremo un'operazione su un file che
3151 comporta una modifica del nome contenuto nella directory, andremo anche a
3152 scrivere sulla directory che lo contiene cambiandone il tempo di modifica. Un
3153 esempio di questo tipo di operazione può essere la cancellazione di un file,
3154 invece leggere o scrivere o cambiare i permessi di un file ha effetti solo sui
3155 tempi di quest'ultimo.
3156
3157 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
3158 creazione del file, usato in molti altri sistemi operativi, ma che in Unix non
3159 esiste. Per questo motivo quando si copia un file, a meno di preservare
3160 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
3161 avrà sempre il tempo corrente come data di ultima modifica.
3162
3163 I tempi di ultimo accesso e modifica possono essere modificati esplicitamente
3164 usando la funzione \funcd{utime}, il cui prototipo è:
3165 \begin{prototype}{utime.h}
3166   {int utime(const char *filename, struct utimbuf *times)} 
3167   Modifica i tempi di ultimo accesso e modifica di un file.
3168
3169   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3170     errore, nel qual caso \var{errno} assumerà uno dei valori:
3171     \begin{errlist}
3172     \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
3173     \item[\errcode{EPERM}] non si è proprietari del file.
3174     \end{errlist}
3175     ed inoltre \errval{EROFS} e \errval{ENOENT}.}
3176 \end{prototype}
3177
3178 La funzione cambia i tempi di ultimo accesso e modifica del file specificato
3179 dall'argomento \param{filename}, e richiede come secondo argomento il
3180 puntatore ad una struttura \struct{utimbuf}, la cui definizione è riportata in
3181 fig.~\ref{fig:struct_utimebuf}, con i nuovi valori di detti tempi
3182 (rispettivamente  nei campi \var{actime} e \var{modtime}). Se si passa un
3183 puntatore nullo verrà impostato il tempo corrente.
3184
3185 \begin{figure}[!htb]
3186   \footnotesize \centering
3187   \begin{minipage}[c]{\textwidth}
3188     \includestruct{listati/utimbuf.h}
3189   \end{minipage} 
3190   \normalsize 
3191   \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
3192     i tempi dei file.}
3193   \label{fig:struct_utimebuf}
3194 \end{figure}
3195
3196 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
3197 cosa è l'argomento \param{times}; se è \val{NULL} la funzione imposta il
3198 tempo corrente ed è sufficiente avere accesso in scrittura al file; se invece
3199 si è specificato un valore la funzione avrà successo solo se si è proprietari
3200 del file o si hanno i privilegi di amministratore.
3201
3202 Si tenga presente che non è comunque possibile specificare il tempo di
3203 cambiamento di stato del file, che viene aggiornato direttamente dal kernel
3204 tutte le volte che si modifica \itindex{inode} l'\textit{inode} (quindi anche
3205 alla chiamata di \func{utime}).  Questo serve anche come misura di sicurezza
3206 per evitare che si possa modificare un file nascondendo completamente le
3207 proprie tracce. In realtà la cosa resta possibile se si è in grado di accedere
3208 al \index{file!di~dispositivo} file di dispositivo, scrivendo direttamente sul
3209 disco senza passare attraverso il filesystem, ma ovviamente in questo modo la
3210 cosa è più complicata da realizzare.
3211
3212 A partire dal kernel 2.6 la risoluzione dei tempi dei file, che nei campi di
3213 tab.~\ref{tab:file_file_times} è espressa in secondi, è stata portata ai
3214 nanosecondi per la gran parte dei filesystem. La ulteriore informazione può
3215 essere acceduta attraverso altri campi appositamente aggiunti alla struttura
3216 \struct{stat}. Se si sono definite le macro \macro{\_BSD\_SOURCE} o
3217 \macro{\_SVID\_SOURCE} questi sono \var{st\_atim.tv\_nsec},
3218 \var{st\_mtim.tv\_nsec} e \var{st\_ctim.tv\_nsec} se queste non sono definite,
3219 \var{st\_atimensec}, \var{st\_mtimensec} e \var{st\_mtimensec}. Qualora il
3220 supporto per questa maggior precisione sia assente questi campi aggiuntivi
3221 saranno nulli.
3222
3223 Per la gestione di questi nuovi valori è stata definita una seconda funzione
3224 di modifica, \funcd{utimes}, che consente di specificare tempi con maggior
3225 precisione; il suo prototipo è:
3226 \begin{prototype}
3227   {sys/time.h}
3228   {int utimes(const char *filename, struct timeval times[2])} 
3229   Modifica i tempi di ultimo accesso e modifica di un file.
3230
3231   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3232     errore, nel qual caso \var{errno} assumerà uno dei valori:
3233     \begin{errlist}
3234     \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
3235     \item[\errcode{EPERM}] non si è proprietari del file.
3236     \end{errlist} 
3237     ed inoltre \errval{EROFS} e \errval{ENOENT}.}
3238 \end{prototype}
3239
3240 La funzione è del tutto analoga alla precedente \func{utime} ma usa come
3241 secondo argomento un vettore di due strutture \struct{timeval}, la cui
3242 definizione è riportata in fig.~\ref{fig:sys_timeval_struct}, che consentono
3243 di indicare i tempi con una precisione del microsecondo. Il primo elemento
3244 di \param{times} indica il valore per il tempo di ultimo accesso, il secondo
3245 quello per il tempo di ultima modifica. Se si indica come secondo argomento un
3246 puntatore nullo di nuovo verrà utilizzato il tempo corrente.
3247
3248 \begin{figure}[!htb]
3249   \footnotesize \centering
3250   \begin{minipage}[c]{\textwidth}
3251     \includestruct{listati/timeval.h}
3252   \end{minipage} 
3253   \normalsize 
3254   \caption{La struttura \structd{timeval} usata per indicare valori di tempo
3255     con la precisione del microsecondo.}
3256   \label{fig:sys_timeval_struct}
3257 \end{figure}
3258
3259 Oltre ad \func{utimes} su Linux sono presenti altre due funzioni,\footnote{le
3260   due funzioni non sono definite in nessuno standard, ma sono presenti, oltre
3261   che su Linux, anche su BSD.} \funcd{futimes} e \funcd{lutimes}, che
3262 consentono rispettivamente di effettuare la modifica utilizzando un file
3263 già aperto o di eseguirla direttamente su un link simbolico. I relativi
3264 prototipi sono:
3265 \begin{functions}
3266   \headdecl{sys/time.h} 
3267   
3268   \funcdecl{int futimes(int fd, const struct timeval tv[2])} Cambia i tempi
3269   di un file già aperto specificato tramite il file descriptor \param{fd}.
3270
3271   \funcdecl{int lutimes(const char *filename, const struct timeval tv[2])}
3272   Cambia i tempi di \param{filename} anche se questo è un link simbolico.
3273   
3274   
3275   \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
3276     errore, nel qual caso \var{errno} assumerà gli stessi valori di
3277     \func{utimes}, con in più per \func{futimes}:
3278   \begin{errlist}
3279   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
3280   \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3281   \end{errlist}}
3282 \end{functions}
3283
3284 Le due funzioni anno lo stesso comportamento di \texttt{utimes} e richiedono
3285 gli stessi privilegi per poter operare, la differenza è che con \func{futimes}
3286 si può indicare il file su cui operare facendo riferimento al relativo file
3287 descriptor mentre con \func{lutimes} nel caso in cui \param{filename} sia un
3288 link simbolico saranno modificati i suoi tempi invece di quelli del file a cui
3289 esso punta.
3290
3291 Nonostante il kernel, come accennato, supporti risoluzioni dei tempi dei file
3292 fino al nanosecondo, le funzioni fin qui esaminate non consentono di impostare
3293 valori con questa precisione. Per questo sono state introdotte due nuove
3294 funzioni, \funcd{futimens} e \func{utimensat}, in grado di eseguire questo
3295 compito; i rispettivi prototipi sono:
3296 \begin{functions}
3297   \headdecl{sys/time.h} 
3298   
3299   \funcdecl{futimens(int fd, const struct timespec times[2])} Cambia i tempi
3300   di un file già aperto, specificato dal file descriptor \param{fd}.
3301
3302   \funcdecl{int utimensat(int dirfd, const char *pathname, const struct
3303     timespec times[2], int flags)} Cambia i tempi del file \param{pathname}.
3304   
3305   
3306   \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
3307     errore, nel qual caso \var{errno} assumerà gli stessi valori di
3308     \func{utimes}, con in più per \func{futimes}:
3309   \begin{errlist}
3310   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
3311   \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3312   \end{errlist}}
3313 \end{functions}
3314
3315 Entrambe le funzioni utilizzano per indicare i valori dei tempi un
3316 vettore \param{times} di due strutture \struct{timespec} che permette di
3317 specificare un valore di tempo con una precisione fino al nanosecondo, la cui
3318 definizione è riportata in fig.~\ref{fig:sys_timespec_struct}.
3319
3320 \begin{figure}[!htb]
3321   \footnotesize \centering
3322   \begin{minipage}[c]{\textwidth}
3323     \includestruct{listati/timespec.h}
3324   \end{minipage} 
3325   \normalsize 
3326   \caption{La struttura \structd{timespec} usata per indicare valori di tempo
3327     con la precisione del nanosecondo.}
3328   \label{fig:sys_timespec_struct}
3329 \end{figure}
3330
3331 Come per le precedenti funzioni il primo elemento di \param{times} indica il
3332 tempo di ultimo accesso ed il secondo quello di ultima modifica, e se si usa
3333 il valore \val{NULL} verrà impostato il tempo corrente sia per l'ultimo
3334 accesso che per l'ultima modifica. Nei singoli elementi di \param{times} si
3335 possono inoltre utilizzare due valori speciali per il campo \var{tv\_nsec}:
3336 con \const{UTIME\_NOW} si richiede l'uso del tempo corrente, mentre con
3337 \const{UTIME\_OMIT} si richiede di non impostare il tempo. Si può così
3338 aggiornare in maniera specifica soltanto uno fra il tempo di ultimo accesso e
3339 quello di ultima modifica. Quando si usa uno di questi valori speciali per
3340 \var{tv\_nsec} il corrispondente valore di \var{tv\_sec} viene ignorato.
3341
3342 Queste due funzioni sono una estensione definita in una recente revisione
3343 dello standard POSIX (la POSIX.1-2008); sono state introdotte a partire dal
3344 kernel 2.6.22, e supportate dalle \acr{glibc} a partire dalla versione
3345 2.6.\footnote{in precedenza, a partire dal kernel 2.6.16, era stata introdotta
3346   la funzione \func{futimesat} seguendo una bozza della revisione dello
3347   standard poi modificata, questa funzione, sostituita da \func{utimensat}, è
3348   stata dichiarata obsoleta, non è supportata da nessuno standard e non deve
3349   essere più utilizzata: pertanto non la tratteremo.} La prima è
3350 sostanzialmente una estensione di \func{futimes} che consente di specificare i
3351 tempi con precisione maggiore, la seconda supporta invece, rispetto ad
3352 \func{utimes}, una sintassi più complessa che, come vedremo in
3353 sez.~\ref{sec:file_openat} consente una indicazione sicura dei
3354 \textit{pathname relativi} specificando la directory da usare come riferimento
3355 in \param{dirfd} e la possibilità di usare \param{flags} per indicare alla
3356 funzione di dereferenziare o meno i link simbolici; si rimanda pertanto la
3357 spiegazione del significato degli argomenti aggiuntivi alla trattazione
3358 generica delle varie funzioni che usano la stessa sintassi, effettuata in
3359 sez.~\ref{sec:file_openat}.
3360
3361
3362 \section{Il controllo di accesso ai file}
3363 \label{sec:file_access_control}
3364
3365 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
3366 del controllo di accesso ai file, che viene implementato per qualunque
3367 filesystem standard.\footnote{per standard si intende che implementa le
3368   caratteristiche previste dallo standard POSIX; in Linux sono disponibili
3369   anche una serie di altri filesystem, come quelli di Windows e del Mac, che
3370   non supportano queste caratteristiche.} In questa sezione ne esamineremo i
3371 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
3372
3373
3374 \subsection{I permessi per l'accesso ai file}
3375 \label{sec:file_perm_overview}
3376
3377 Ad ogni file Linux associa sempre l'utente che ne è proprietario (il
3378 cosiddetto \textit{owner}) ed un gruppo di appartenenza, secondo il meccanismo
3379 degli identificatori di utente e gruppo (\ids{UID} e \ids{GID}). Questi valori
3380 sono accessibili da programma tramite la funzione \func{stat}, e sono
3381 mantenuti nei campi \var{st\_uid} e \var{st\_gid} della struttura
3382 \struct{stat} (si veda sez.~\ref{sec:file_stat}).\footnote{questo è vero solo
3383   per filesystem di tipo Unix, ad esempio non è vero per il filesystem vfat di
3384   Windows, che non fornisce nessun supporto per l'accesso multiutente, e per
3385   il quale i permessi vengono assegnati in maniera fissa con un opzione in
3386   fase di montaggio.}
3387
3388 Il controllo di accesso ai file segue un modello abbastanza semplice che
3389 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
3390 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
3391     Control List} che sono state aggiunte ai filesystem standard con opportune
3392   estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
3393   controllo ancora più sofisticati come il \textit{mandatory access control}
3394   di SE-Linux.} ma nella maggior parte dei casi il meccanismo standard è più
3395 che sufficiente a soddisfare tutte le necessità più comuni.  I tre permessi di
3396 base associati ad ogni file sono:
3397 \begin{itemize*}
3398 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
3399   \textit{read}).
3400 \item il permesso di scrittura (indicato con la lettera \texttt{w},
3401   dall'inglese \textit{write}).
3402 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
3403   dall'inglese \textit{execute}).
3404 \end{itemize*}
3405 mentre i tre livelli su cui sono divisi i privilegi sono:
3406 \begin{itemize*}
3407 \item i privilegi per l'utente proprietario del file.
3408 \item i privilegi per un qualunque utente faccia parte del gruppo cui
3409   appartiene il file.
3410 \item i privilegi per tutti gli altri utenti.
3411 \end{itemize*}
3412
3413 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
3414 meno significativi sono usati a gruppi di tre per indicare i permessi base di
3415 lettura, scrittura ed esecuzione e sono applicati rispettivamente
3416 rispettivamente al proprietario, al gruppo, a tutti gli altri.
3417
3418 \begin{figure}[htb]
3419   \centering
3420   \includegraphics[width=6cm]{img/fileperm}
3421   \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
3422     contenuti nel campo \var{st\_mode} di \struct{stat}.}
3423   \label{fig:file_perm_bit}
3424 \end{figure}
3425
3426 I restanti tre bit (noti come \itindex{suid~bit} \textit{suid bit},
3427 \itindex{sgid~bit} \textit{sgid bit}, e \itindex{sticky~bit} \textit{sticky
3428   bit}) sono usati per indicare alcune caratteristiche più complesse del
3429 meccanismo del controllo di accesso su cui torneremo in seguito (in
3430 sez.~\ref{sec:file_special_perm}); lo schema di allocazione dei bit è
3431 riportato in fig.~\ref{fig:file_perm_bit}.
3432
3433 Anche i permessi, come tutte le altre informazioni pertinenti al file, sono
3434 memorizzati \itindex{inode} nell'\textit{inode}; in particolare essi sono
3435 contenuti in alcuni bit del campo \var{st\_mode} della struttura \struct{stat}
3436 (si veda di nuovo fig.~\ref{fig:file_stat_struct}).
3437
3438 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
3439 \cmd{u} (per \textit{user}), \cmd{g} (per \textit{group}) e \cmd{o} (per
3440 \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti insieme
3441 si usa la lettera \cmd{a} (per \textit{all}). Si tenga ben presente questa
3442 distinzione dato che in certi casi, mutuando la terminologia in uso nel VMS,
3443 si parla dei permessi base come di permessi per \textit{owner}, \textit{group}
3444 ed \textit{all}, le cui iniziali possono dar luogo a confusione.  Le costanti
3445 che permettono di accedere al valore numerico di questi bit nel campo
3446 \var{st\_mode} sono riportate in tab.~\ref{tab:file_bit_perm}.
3447
3448 \begin{table}[htb]
3449   \centering
3450     \footnotesize
3451   \begin{tabular}[c]{|c|l|}
3452     \hline
3453     \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
3454     \hline 
3455     \hline 
3456     \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
3457     \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
3458     \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\ 
3459     \hline            
3460     \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
3461     \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
3462     \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
3463     \hline            
3464     \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
3465     \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
3466     \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
3467     \hline              
3468   \end{tabular}
3469   \caption{I bit dei permessi di accesso ai file, come definiti in 
3470     \texttt{<sys/stat.h>}}
3471   \label{tab:file_bit_perm}
3472 \end{table}
3473
3474 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
3475 che si riferiscano a dei file, dei link simbolici o delle directory; qui ci
3476 limiteremo ad un riassunto delle regole generali, entrando nei dettagli più
3477 avanti.
3478
3479 La prima regola è che per poter accedere ad un file attraverso il suo
3480 \itindex{pathname} \textit{pathname} occorre il permesso di esecuzione in
3481 ciascuna delle directory che compongono il \textit{pathname}; lo stesso vale
3482 per aprire un file nella directory corrente (per la quale appunto serve il
3483 diritto di esecuzione).
3484
3485 Per una directory infatti il permesso di esecuzione significa che essa può
3486 essere attraversata nella risoluzione del \itindex{pathname}
3487 \textit{pathname}, ed è distinto dal permesso di lettura che invece implica
3488 che si può leggere il contenuto della directory.
3489
3490 Questo significa che se si ha il permesso di esecuzione senza permesso di
3491 lettura si potrà lo stesso aprire un file in una directory (se si hanno i
3492 permessi opportuni per il medesimo) ma non si potrà vederlo con \cmd{ls}
3493 (mentre per crearlo occorrerà anche il permesso di scrittura per la
3494 directory).
3495
3496 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
3497 (si veda quanto riportato in tab.~\ref{tab:file_open_flags}) di sola lettura o
3498 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
3499 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
3500 il contenuto, lo stesso permesso è necessario per poter troncare il file.
3501
3502 Non si può creare un file fintanto che non si disponga del permesso di
3503 esecuzione e di quello di scrittura per la directory di destinazione; gli
3504 stessi permessi occorrono per cancellare un file da una directory (si ricordi
3505 che questo non implica necessariamente la rimozione del contenuto del file dal
3506 disco), non è necessario nessun tipo di permesso per il file stesso (infatti
3507 esso non viene toccato, viene solo modificato il contenuto della directory,
3508 rimuovendo la voce che ad esso fa riferimento).
3509
3510 Per poter eseguire un file (che sia un programma compilato od uno script di
3511 shell, od un altro tipo di file eseguibile riconosciuto dal kernel), occorre
3512 avere il permesso di esecuzione, inoltre solo i file regolari possono essere
3513 eseguiti.
3514
3515 I permessi per un link simbolico sono ignorati, contano quelli del file a cui
3516 fa riferimento; per questo in genere il comando \cmd{ls} riporta per un link
3517 simbolico tutti i permessi come concessi; utente e gruppo a cui esso
3518 appartiene vengono pure ignorati quando il link viene risolto, vengono
3519 controllati solo quando viene richiesta la rimozione del link e quest'ultimo è
3520 in una directory con lo \itindex{sticky~bit} \textit{sticky bit} impostato (si
3521 veda sez.~\ref{sec:file_special_perm}).
3522
3523 La procedura con cui il kernel stabilisce se un processo possiede un certo
3524 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
3525 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
3526 \var{st\_gid} accennati in precedenza) e l'\ids{UID} effettivo, il \ids{GID}
3527 effettivo e gli eventuali \ids{GID} supplementari del processo.\footnote{in
3528   realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
3529   identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
3530   sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
3531   eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
3532   differenza.}
3533
3534 Per una spiegazione dettagliata degli identificatori associati ai processi si
3535 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
3536 sez.~\ref{sec:file_special_perm}, l'\ids{UID} effettivo e il \ids{GID} effettivo
3537 corrispondono ai valori dell'\ids{UID} e del \ids{GID} dell'utente che ha
3538 lanciato il processo, mentre i \ids{GID} supplementari sono quelli dei gruppi
3539 cui l'utente appartiene.
3540
3541 I passi attraverso i quali viene stabilito se il processo possiede il diritto
3542 di accesso sono i seguenti:
3543 \begin{enumerate}
3544 \item Se l'\ids{UID} effettivo del processo è zero (corrispondente
3545   all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
3546   controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
3547   tutti i file.
3548 \item Se l'\ids{UID} effettivo del processo è uguale all'\ids{UID} del
3549   proprietario del file (nel qual caso si dice che il processo è proprietario
3550   del file) allora:
3551   \begin{itemize*}
3552   \item se il relativo\footnote{per relativo si intende il bit di user-read se
3553       il processo vuole accedere in lettura, quello di user-write per
3554       l'accesso in scrittura, ecc.} bit dei permessi d'accesso dell'utente è
3555     impostato, l'accesso è consentito
3556   \item altrimenti l'accesso è negato
3557   \end{itemize*}
3558 \item Se il \ids{GID} effettivo del processo o uno dei \ids{GID} supplementari
3559   dei processi corrispondono al \ids{GID} del file allora:
3560   \begin{itemize*}
3561   \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
3562     consentito, 
3563   \item altrimenti l'accesso è negato
3564   \end{itemize*}
3565 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
3566   l'accesso è consentito, altrimenti l'accesso è negato.
3567 \end{enumerate}
3568