Varie correzioni, completata revisione capitolo sull'I/O su file
[gapil.git] / filedir.tex
1 %% filedir.tex
2 %%
3 %% Copyright (C) 2000-2019 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{La gestione di file e directory}
13 \label{cha:files_and_dirs}
14
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando da un approfondimento dell'architettura del
17 sistema illustrata a grandi linee in sez.~\ref{sec:file_arch_overview} ed
18 illustrando le principali caratteristiche di un filesystem e le interfacce
19 che consentono di controllarne il montaggio e lo smontaggio. 
20
21 Esamineremo poi le funzioni di libreria che si usano per copiare, spostare e
22 cambiare i nomi di file e directory e l'interfaccia che permette la
23 manipolazione dei loro attributi. Tratteremo inoltre la struttura di base del
24 sistema delle protezioni e del controllo dell'accesso ai file e le successive
25 estensioni (\textit{Extended Attributes}, ACL, quote disco). Tutto quello che
26 riguarda invece la gestione dell'I/O sui file è lasciato al capitolo
27 successivo.
28
29
30
31 \section{L'architettura della gestione dei file}
32 \label{sec:file_arch_func}
33
34 In questa sezione tratteremo con maggiori dettagli rispetto a quanto visto in
35 sez.~\ref{sec:file_arch_overview} il \textit{Virtual File System} di Linux e
36 come il kernel può gestire diversi tipi di filesystem, descrivendo prima le
37 caratteristiche generali di un filesystem di un sistema unix-like, per poi
38 fare una panoramica sul filesystem tradizionalmente più usato con Linux,
39 l'\acr{ext2} ed i suoi successori.
40
41
42 \subsection{Il funzionamento del \textit{Virtual File System} di Linux}
43 \label{sec:file_vfs_work}
44
45 % NOTE articolo interessante:
46 % http://www.ibm.com/developerworks/linux/library/l-virtual-filesystem-switch/index.html?ca=dgr-lnxw97Linux-VFSdth-LXdW&S_TACT=105AGX59&S_CMP=GRlnxw97
47
48 \itindbeg{Virtual~File~System~(VFS)}
49
50 Come illustrato brevemente in sez.~\ref{sec:file_arch_overview} in Linux il
51 concetto di \textit{everything is a file} è stato implementato attraverso il
52 \textit{Virtual File System}, la cui struttura generale è illustrata in
53 fig.~\ref{fig:file_VFS_scheme}.  Il VFS definisce un insieme di funzioni che
54 tutti i filesystem devono implementare per l'accesso ai file che contengono e
55 l'interfaccia che consente di eseguire l'I/O sui file, che questi siano di
56 dati o dispositivi. 
57
58 \itindbeg{inode}
59
60 L'interfaccia fornita dal VFS comprende in sostanza tutte le funzioni che
61 riguardano i file, le operazioni implementate dal VFS sono realizzate con una
62 astrazione che prevede quattro tipi di oggetti strettamente correlati: i
63 filesystem, le \textit{dentry}, gli \textit{inode} ed i file. A questi oggetti
64 corrispondono una serie di apposite strutture definite dal kernel che
65 contengono come campi le funzioni di gestione e realizzano l'infrastruttura
66 del VFS. L'interfaccia è molto complessa, ne faremo pertanto una trattazione
67 estremamente semplificata che consenta di comprenderne i principi
68 di funzionamento.
69
70 Il VFS usa una tabella mantenuta dal kernel che contiene il nome di ciascun
71 filesystem supportato, quando si vuole inserire il supporto di un nuovo
72 filesystem tutto quello che occorre è chiamare la funzione
73 \code{register\_filesystem} passando come argomento la struttura
74 \kstruct{file\_system\_type} (la cui definizione è riportata in
75 fig.~\ref{fig:kstruct_file_system_type}) relativa a quel filesystem. Questa
76 verrà inserita nella tabella, ed il nuovo filesystem comparirà in
77 \procfile{/proc/filesystems}.
78
79 \begin{figure}[!htb]
80   \footnotesize \centering
81   \begin{minipage}[c]{0.80\textwidth}
82     \includestruct{listati/file_system_type.h}
83   \end{minipage}
84   \normalsize 
85   \caption{Estratto della struttura \kstructd{file\_system\_type} usata dal
86     VFS (da \texttt{include/linux/fs.h}).}
87   \label{fig:kstruct_file_system_type}
88 \end{figure}
89
90 La struttura \kstruct{file\_system\_type}, oltre ad una serie di dati interni,
91 come il nome del tipo di filesystem nel campo \var{name},\footnote{quello che
92   viene riportato in \procfile{/proc/filesystems} e che viene usato come
93   valore del parametro dell'opzione \texttt{-t} del comando \texttt{mount} che
94   indica il tipo di filesystem.}  contiene i riferimenti alle funzioni di base
95 che consentono l'utilizzo di quel filesystem. In particolare la funzione
96 \code{mount} del quarto campo è quella che verrà invocata tutte le volte che
97 si dovrà effettuare il montaggio di un filesystem di quel tipo. Per ogni nuovo
98 filesystem si dovrà allocare una di queste strutture ed inizializzare i
99 relativi campi con i dati specifici di quel filesystem, ed in particolare si
100 dovrà creare anche la relativa versione della funzione \code{mount}.
101
102 \itindbeg{pathname}
103 \itindbeg{pathname~resolution}
104
105 Come illustrato in fig.~\ref{fig:kstruct_file_system_type} questa funzione
106 restituisce una \textit{dentry}, abbreviazione che sta per \textit{directory
107   entry}. Le \textit{dentry} sono gli oggetti che il kernel usa per eseguire
108 la \textit{pathname resolution}, ciascuna di esse corrisponde ad un
109 \textit{pathname} e contiene il riferimento ad un \textit{inode}, che come
110 vedremo a breve è l'oggetto usato dal kernel per identificare un
111 file.\footnote{in questo caso si parla di file come di un qualunque oggetto
112   generico che sta sul filesystem e non dell'oggetto file del VFS cui
113   accennavamo prima.} La \textit{dentry} ottenuta dalla chiamata alla funzione
114 \code{mount} sarà inserita in corrispondenza al \textit{pathname} della
115 directory in cui il filesystem è stato montato.
116
117 % NOTA: struct dentry è dichiarata in include/linux/dcache.h
118
119 Le \textit{dentry} sono oggetti del VFS che vivono esclusivamente in memoria,
120 nella cosiddetta \textit{directory entry cache} (spesso chiamata in breve
121 \textit{dcache}). Ogni volta che una \textit{system call} specifica un
122 \textit{pathname} viene effettuata una ricerca nella \textit{dcache} per
123 ottenere immediatamente la \textit{dentry} corrispondente,\footnote{il buon
124   funzionamento della \textit{dcache} è in effetti di una delle parti più
125   critiche per le prestazioni del sistema.} che a sua volta ci darà, tramite
126 l'\textit{inode}, il riferimento al file.
127
128 Dato che normalmente non è possibile mantenere nella \textit{dcache} le
129 informazioni relative a tutto l'albero dei file la procedura della
130 \textit{pathname resolution} richiede un meccanismo con cui riempire gli
131 eventuali vuoti. Il meccanismo prevede che tutte le volte che si arriva ad una
132 \textit{dentry} mancante venga invocata la funzione \texttt{lookup}
133 dell'\textit{inode} associato alla \textit{dentry} precedente nella
134 risoluzione del \textit{pathname},\footnote{che a questo punto è una
135   directory, per cui si può cercare al suo interno il nome di un file.} il cui
136 scopo è risolvere il nome mancante e fornire la sua \textit{dentry} che a
137 questo punto verrà inserita nella cache.
138
139 Dato che tutte le volte che si monta un filesystem la funzione \texttt{mount}
140 (vedi sez.~\ref{sec:filesystem_mounting}) della corrispondente
141 \kstruct{file\_system\_type} inserisce la \textit{dentry} iniziale nel
142 \textit{mount point} dello stesso, si avrà comunque un punto di
143 partenza. Inoltre essendo questa \textit{dentry} relativa a quel tipo di
144 filesystem essa farà riferimento ad un \textit{inode} di quel filesystem, e
145 come vedremo questo farà sì che venga eseguita una \texttt{lookup} adatta per
146 effettuare la risoluzione dei nomi per quel filesystem.
147
148 \itindend{pathname}
149 \itindend{pathname~resolution}
150
151 % Un secondo effetto della chiamata funzione \texttt{mount} di
152 % \kstruct{file\_system\_type} è quello di allocare una struttura
153 % \kstruct{super\_block} per ciascuna istanza montata, che contiene le
154 % informazioni generali di un qualunque filesystem montato, come le opzioni di
155 % montaggio, le dimensioni dei blocchi, quando il filesystem è stato montato
156 % ecc. Fra queste però viene pure inserta, nel campo \var{s\_op}, una ulteriore
157 % struttura \kstruct{super\_operations}, il cui contenuto sono i puntatori
158 % alle funzioni di gestione di un filesystem, anche inizializzata in modo da
159 % utilizzare le versioni specifiche di quel filesystem.
160
161 L'oggetto più importante per il funzionamento del VFS è probabilmente
162 l'\textit{inode}, ma con questo nome si può fare riferimento a due cose
163 diverse.  La prima è la struttura su disco (su cui torneremo anche in
164 sez.~\ref{sec:file_filesystem}) che fa parte della organizzazione dei dati
165 realizzata dal filesystem e che contiene le informazioni relative alle
166 proprietà (i cosiddetti \textsl{metadati}) di ogni oggetto presente su di esso
167 (si intende al solito uno qualunque dei tipi di file di
168 tab.~\ref{tab:file_file_types}).
169
170 La seconda è la corrispondente struttura \kstruct{inode}, della cui
171 definizione si è riportato un estratto in
172 fig.~\ref{fig:kstruct_inode}.\footnote{l'estratto fa riferimento alla versione
173   del kernel 2.6.37.} Questa struttura viene mantenuta in memoria ed è a
174 questa che facevamo riferimento quando parlavamo dell'\textit{inode} associato
175 a ciascuna \textit{dentry}. Nella struttura in memoria sono presenti gli
176 stessi \textsl{metadati} memorizzati su disco, che vengono letti quando questa
177 struttura viene allocata e trascritti all'indietro se modificati.
178
179 \begin{figure}[!htb]
180   \footnotesize \centering
181   \begin{minipage}[c]{0.8\textwidth}
182     \includestruct{listati/inode.h}
183   \end{minipage}
184   \normalsize 
185   \caption{Estratto della struttura \kstructd{inode} del kernel (da
186     \texttt{include/linux/fs.h}).}
187   \label{fig:kstruct_inode}
188 \end{figure}
189
190 Il fatto che la struttura \kstruct{inode} sia mantenuta in memoria,
191 direttamente associata ad una \textit{dentry}, rende sostanzialmente immediate
192 le operazioni che devono semplicemente effettuare un accesso ai dati in essa
193 contenuti: è così ad esempio che viene realizzata la \textit{system call}
194 \func{stat} che vedremo in sez.~\ref{sec:file_stat}. Rispetto ai dati salvati
195 sul disco questa struttura contiene però anche quanto necessario alla
196 implementazione del VFS, ed in particolare è importante il campo \var{i\_op}
197 che, come illustrato in fig.~\ref{fig:kstruct_inode}, contiene il puntatore ad
198 una struttura di tipo \kstruct{inode\_operation}, la cui definizione si può
199 trovare nel file \texttt{include/kernel/fs.h} dei sorgenti del kernel.
200
201 Questa struttura non è altro che una tabella di funzioni, ogni suo membro cioè
202 è un puntatore ad una funzione e, come suggerisce il nome della struttura
203 stessa, queste funzioni sono quelle che definiscono le operazioni che il VFS
204 può compiere su un \textit{inode}. Si sono riportate in
205 tab.~\ref{tab:file_inode_operations} le più rilevanti.
206
207 \begin{table}[htb]
208   \centering
209   \footnotesize
210   \begin{tabular}[c]{|l|l|}
211     \hline
212     \textbf{Funzione} & \textbf{Operazione} \\
213     \hline
214     \hline
215     \textsl{\code{create}} & Chiamata per creare un nuovo file (vedi
216                              sez.~\ref{sec:file_open_close}).\\ 
217     \textsl{\code{link}}   & Crea un \textit{hard link} (vedi
218                              sez.~\ref{sec:link_symlink_rename}).\\
219     \textsl{\code{unlink}} & Cancella un \textit{hard link} (vedi
220                              sez.~\ref{sec:link_symlink_rename}).\\
221     \textsl{\code{symlink}}& Crea un collegamento simbolico (vedi
222                              sez.~\ref{sec:link_symlink_rename}).\\
223     \textsl{\code{mkdir}}  & Crea una directory (vedi
224                              sez.~\ref{sec:file_dir_creat_rem}).\\
225     \textsl{\code{rmdir}}  & Rimuove una directory (vedi
226                              sez.~\ref{sec:file_dir_creat_rem}).\\
227     \textsl{\code{mknod}}  & Crea un file speciale (vedi
228                              sez.~\ref{sec:file_mknod}).\\
229     \textsl{\code{rename}} & Cambia il nome di un file (vedi
230                              sez.~\ref{sec:link_symlink_rename}).\\
231     \textsl{\code{lookup}}&  Risolve il nome di un file.\\
232     \hline
233   \end{tabular}
234   \caption{Le principali operazioni sugli \textit{inode} definite tramite
235     \kstructd{inode\_operation}.} 
236   \label{tab:file_inode_operations}
237 \end{table}
238
239 Possiamo notare come molte di queste funzioni abbiano nomi sostanzialmente
240 identici alle varie \textit{system call} con le quali si gestiscono file e
241 directory, che tratteremo nel resto del capitolo. Quello che succede è che
242 tutte le volte che deve essere eseguita una \textit{system call}, o una
243 qualunque altra operazione su un \textit{inode} (come \texttt{lookup}) il VFS
244 andrà ad utilizzare la funzione corrispondente attraverso il puntatore
245 \var{i\_op}.
246
247 Sarà allora sufficiente che nella realizzazione di un filesystem si crei una
248 implementazione di queste funzioni per quel filesystem e si allochi una
249 opportuna istanza di \kstruct{inode\_operation} contenente i puntatori a dette
250 funzioni. A quel punto le strutture \kstruct{inode} usate per gli oggetti di
251 quel filesystem otterranno il puntatore alla relativa istanza di
252 \kstruct{inode\_operation} e verranno automaticamente usate le funzioni
253 corrette.
254
255 Si noti però come in tab.~\ref{tab:file_inode_operations} non sia presente la
256 funzione \texttt{open} che invece è citata in
257 tab.~\ref{tab:file_file_operations}.\footnote{essa può essere comunque
258   invocata dato che nella struttura \kstruct{inode} è presente anche il
259   puntatore \var{i\_fop} alla struttura \kstruct{file\_operation} che fornisce
260   detta funzione.} Questo avviene perché su Linux l'apertura di un file
261 richiede comunque un'altra operazione che mette in gioco l'omonimo oggetto del
262 VFS: l'allocazione di una struttura di tipo \kstruct{file} che viene associata
263 ad ogni file aperto nel sistema.  I motivi per cui viene usata una struttura a
264 parte sono diversi, anzitutto, come illustrato in sez.~\ref{sec:file_fd},
265 questa è necessaria per le operazioni eseguite dai processi con l'interfaccia
266 dei file descriptor. Ogni processo infatti mantiene il riferimento ad una
267 struttura \kstruct{file} per ogni file che ha aperto, ed è tramite essa che
268 esegue le operazioni di I/O. Inoltre il kernel mantiene un elenco di tutti i
269 file aperti nella \textit{file table} (torneremo su questo in
270 sez.~\ref{sec:file_fd}).
271
272 Inoltre se le operazioni relative agli \textit{inode} fanno riferimento ad
273 oggetti posti all'interno di un filesystem e vi si applicano quindi le
274 funzioni fornite nell'implementazione di quest'ultimo, quando si apre un file
275 questo può essere anche un file di dispositivo, ed in questo caso il VFS
276 invece di usare le operazioni fornite dal filesystem (come farebbe per un file
277 di dati) dovrà invece ricorrere a quelle fornite dal driver del dispositivo.
278
279 \itindend{inode}
280
281 \begin{figure}[!htb]
282   \footnotesize \centering
283   \begin{minipage}[c]{0.8\textwidth}
284     \includestruct{listati/file.h}
285   \end{minipage}
286   \normalsize 
287   \caption{Estratto della struttura \kstructd{file} del kernel (da
288     \texttt{include/linux/fs.h}).}
289   \label{fig:kstruct_file}
290 \end{figure}
291
292 Come si può notare dall'estratto di fig.~\ref{fig:kstruct_file}, la struttura
293 \kstruct{file} contiene, oltre ad alcune informazioni usate dall'interfaccia
294 dei file descriptor il cui significato emergerà più avanti (vedi
295 sez.~\ref{sec:file_unix_interface}), il puntatore \var{f\_op} ad una struttura
296 \kstruct{file\_operation}. Questa è l'analoga per i file di
297 \kstruct{inode\_operation}, e definisce le operazioni generiche fornite dal
298 VFS per i file. Si sono riportate in tab.~\ref{tab:file_file_operations} le
299 più significative.
300
301 \begin{table}[htb]
302   \centering
303   \footnotesize
304   \begin{tabular}[c]{|l|p{8cm}|}
305     \hline
306     \textbf{Funzione} & \textbf{Operazione} \\
307     \hline
308     \hline
309     \textsl{\code{open}}   & Apre il file (vedi
310                              sez.~\ref{sec:file_open_close}).\\ 
311     \textsl{\code{read}}   & Legge dal file (vedi sez.~\ref{sec:file_read}).\\
312     \textsl{\code{write}}  & Scrive sul file (vedi 
313                              sez.~\ref{sec:file_write}).\\
314     \textsl{\code{llseek}} & Sposta la posizione corrente sul file (vedi
315                              sez.~\ref{sec:file_lseek}).\\
316     \textsl{\code{ioctl}}  & Accede alle operazioni di controllo 
317                              (vedi sez.~\ref{sec:file_fcntl_ioctl}).\\
318     \textsl{\code{readdir}}& Legge il contenuto di una directory (vedi 
319                              sez.~\ref{sec:file_dir_read}).\\
320     \textsl{\code{poll}}   & Usata nell'I/O multiplexing (vedi
321                              sez.~\ref{sec:file_multiplexing}).\\
322     \textsl{\code{mmap}}   & Mappa il file in memoria (vedi 
323                              sez.~\ref{sec:file_memory_map}).\\
324     \textsl{\code{release}}& Chiamata quando l'ultimo riferimento a un file 
325                              aperto è chiuso.\\
326     \textsl{\code{fsync}}  & Sincronizza il contenuto del file (vedi
327                              sez.~\ref{sec:file_sync}).\\
328     \textsl{\code{fasync}} & Abilita l'I/O asincrono (vedi
329                              sez.~\ref{sec:file_asyncronous_io}) sul file.\\
330     \hline
331   \end{tabular}
332   \caption{Operazioni sui file definite tramite \kstructd{file\_operation}.}
333   \label{tab:file_file_operations}
334 \end{table}
335
336 Anche in questo caso tutte le volte che deve essere eseguita una
337 \textit{system call} o una qualunque altra operazione sul file il VFS andrà ad
338 utilizzare la funzione corrispondente attraverso il puntatore
339 \var{f\_op}. Dato che è cura del VFS quando crea la struttura all'apertura del
340 file assegnare a \var{f\_op} il puntatore alla versione di
341 \kstruct{file\_operation} corretta per quel file, sarà possibile scrivere allo
342 stesso modo sulla porta seriale come su un normale file di dati, e lavorare
343 sui file allo stesso modo indipendentemente dal filesystem.
344
345 Il VFS realizza la quasi totalità delle operazioni relative ai file grazie
346 alle funzioni presenti nelle due strutture \kstruct{inode\_operation} e
347 \kstruct{file\_operation}.  Ovviamente non è detto che tutte le operazioni
348 possibili siano poi disponibili in tutti i casi, ad esempio \code{llseek} non
349 sarà presente per un dispositivo come la porta seriale o per una
350 \textit{fifo}, mentre sui file del filesystem \texttt{vfat} non saranno
351 disponibili i permessi, ma resta il fatto che grazie al VFS le \textit{system
352   call} per le operazioni sui file possono restare sempre le stesse nonostante
353 le enormi differenze che possono esserci negli oggetti a cui si applicano.
354  
355
356 \itindend{Virtual~File~System~(VFS)}
357
358 % NOTE: documentazione interessante:
359 %       * sorgenti del kernel: Documentation/filesystems/vfs.txt
360 %       * http://thecoffeedesk.com/geocities/rkfs.html
361 %       * http://www.linux.it/~rubini/docs/vfs/vfs.html
362
363
364
365 \subsection{Il funzionamento di un filesystem Unix}
366 \label{sec:file_filesystem}
367
368 Come già accennato in sez.~\ref{sec:file_arch_overview} Linux (ed ogni sistema
369 unix-like) organizza i dati che tiene su disco attraverso l'uso di un
370 filesystem. Una delle caratteristiche di Linux rispetto agli altri Unix è
371 quella di poter supportare, grazie al VFS, una enorme quantità di filesystem
372 diversi, ognuno dei quali avrà una sua particolare struttura e funzionalità
373 proprie.  Per questo non entreremo nei dettagli di un filesystem specifico, ma
374 daremo una descrizione a grandi linee che si adatta alle caratteristiche
375 comuni di qualunque filesystem di un sistema unix-like.
376
377 \itindbeg{superblock}
378
379 Una possibile strutturazione dell'informazione su un disco è riportata in
380 fig.~\ref{fig:file_disk_filesys}, dove si hanno tre filesystem su tre
381 partizioni. In essa per semplicità si è fatto riferimento alla struttura del
382 filesystem \acr{ext2}, che prevede una suddivisione dei dati in \textit{block
383   group}.  All'interno di ciascun \textit{block group} viene anzitutto
384 replicato il cosiddetto \textit{superblock}, (la struttura che contiene
385 l'indice iniziale del filesystem e che consente di accedere a tutti i dati
386 sottostanti) e creata una opportuna suddivisione dei dati e delle informazioni
387 per accedere agli stessi.  Sulle caratteristiche di \acr{ext2} e derivati
388 torneremo in sez.~\ref{sec:file_ext2}.
389
390 \itindend{superblock}
391 \itindbeg{inode}
392
393 È comunque caratteristica comune di tutti i filesystem per Unix,
394 indipendentemente da come poi viene strutturata nei dettagli questa
395 informazione, prevedere la presenza di due tipi di risorse: gli
396 \textit{inode}, cui abbiamo già accennato in sez.~\ref{sec:file_vfs_work}, che
397 sono le strutture che identificano i singoli oggetti sul filesystem, e i
398 blocchi, che invece attengono allo spazio disco che viene messo a disposizione
399 per i dati in essi contenuti.
400
401 \begin{figure}[!htb]
402   \centering
403   \includegraphics[width=11cm]{img/disk_struct}
404   \caption{Organizzazione dello spazio su un disco in partizioni e
405   filesystem.}
406   \label{fig:file_disk_filesys}
407 \end{figure}
408
409 Se si va ad esaminare con maggiore dettaglio la strutturazione
410 dell'informazione all'interno del filesystem \acr{ext2}, tralasciando i
411 dettagli relativi al funzionamento del filesystem stesso come la
412 strutturazione in gruppi dei blocchi, il \textit{superblock} e tutti i dati di
413 gestione possiamo esemplificare la situazione con uno schema come quello
414 esposto in fig.~\ref{fig:file_filesys_detail}.
415
416 \begin{figure}[!htb]
417   \centering
418   \includegraphics[width=11cm]{img/filesys_struct}
419   \caption{Strutturazione dei dati all'interno di un filesystem.}
420   \label{fig:file_filesys_detail}
421 \end{figure}
422
423 Da fig.~\ref{fig:file_filesys_detail} si evidenziano alcune delle
424 caratteristiche di base di un filesystem, che restano le stesse anche su
425 filesystem la cui organizzazione dei dati è totalmente diversa da quella
426 illustrata, e sulle quali è bene porre attenzione visto che sono fondamentali
427 per capire il funzionamento delle funzioni che manipolano i file e le
428 directory che tratteremo nel prosieguo del capitolo. In particolare è
429 opportuno tenere sempre presente che:
430
431
432 \begin{enumerate*}
433   
434 \item L'\textit{inode} contiene i cosiddetti \textsl{metadati}, vale dire le
435   informazioni riguardanti le proprietà del file come oggetto del filesystem:
436   il tipo di file, i permessi di accesso, le dimensioni, i puntatori ai
437   blocchi fisici che contengono i dati e così via. Le informazioni che la
438   funzione \func{stat} (vedi sez.~\ref{sec:file_stat}) fornisce provengono
439   dall'\textit{inode}.  Dentro una directory si troverà solo il nome del file
440   e il numero dell'\textit{inode} ad esso associato; il nome non è una
441   proprietà del file e non viene mantenuto nell'\textit{inode}. Da da qui in
442   poi chiameremo il nome del file contenuto in una directory
443   ``\textsl{voce}'', come traduzione della nomenclatura inglese
444   \textit{directory entry} che non useremo per evitare confusione con le
445   \textit{dentry} del kernel viste in sez.~\ref{sec:file_vfs_work}.
446   
447 \item Come mostrato in fig.~\ref{fig:file_filesys_detail} per i file
448   \texttt{macro.tex} e \texttt{gapil\_macro.tex}, ci possono avere più voci
449   che fanno riferimento allo stesso \textit{inode}. Fra le proprietà di un
450   file mantenute nell'\textit{inode} c'è anche il contatore con il numero di
451   riferimenti che sono stati fatti ad esso, il cosiddetto \textit{link
452     count}.\footnote{mantenuto anche nel campo \var{i\_nlink} della struttura
453     \kstruct{inode} di fig.~\ref{fig:kstruct_inode}.}  Solo quando questo
454   contatore si annulla i dati del file possono essere effettivamente rimossi
455   dal disco. Per questo la funzione per cancellare un file si chiama
456   \func{unlink} (vedi sez.~\ref{sec:link_symlink_rename}), ed in realtà non
457   cancella affatto i dati del file, ma si limita ad eliminare la relativa voce
458   da una directory e decrementare il numero di riferimenti
459   nell'\textit{inode}.
460   
461 \item All'interno di ogni filesystem ogni \textit{inode} è identificato da un
462   numero univoco. Il numero di \textit{inode} associato ad una voce in una
463   directory si riferisce ad questo numero e non ci può essere una directory
464   che contiene riferimenti ad \textit{inode} relativi ad altri filesystem.
465   Questa è la ragione che limita l'uso del comando \cmd{ln}, che crea una
466   nuova voce per un file esistente con la funzione \func{link} (vedi
467   sez.~\ref{sec:link_symlink_rename}), a operare su file nel filesystem
468   corrente.
469   
470 \item Quando si cambia nome ad un file senza cambiare filesystem il contenuto
471   del file non viene spostato fisicamente, viene semplicemente creata una
472   nuova voce per l'\textit{inode} in questione e rimossa la precedente, questa
473   è la modalità in cui opera normalmente il comando \cmd{mv} attraverso la
474   funzione \func{rename} (vedi sez.~\ref{sec:link_symlink_rename}). Questa
475   operazione non modifica minimamente neanche l'\textit{inode} del file, dato
476   che non si opera sul file ma sulla directory che lo contiene.
477
478 \item Gli \textit{inode} dei file, che contengono i \textsl{metadati}, ed i
479   blocchi di spazio disco, che contengono i dati, sono risorse indipendenti ed
480   in genere vengono gestite come tali anche dai diversi filesystem; è pertanto
481   possibile esaurire sia lo spazio disco (il caso più comune) che lo spazio
482   per gli \textit{inode}. Nel primo caso non sarà possibile allocare ulteriore
483   spazio, ma si potranno creare file (vuoti), nel secondo non si potranno
484   creare nuovi file, ma si potranno estendere quelli che ci
485   sono.\footnote{questo comportamento non è generale, alcuni filesystem più
486     sofisticati possono evitare il problema dell'esaurimento degli
487     \textit{inode} riallocando lo spazio disco libero per i blocchi.}
488
489 \end{enumerate*}
490
491 \begin{figure}[!htb]
492   \centering 
493   \includegraphics[width=12cm]{img/dir_links}
494   \caption{Organizzazione dei \textit{link} per le directory.}
495   \label{fig:file_dirs_link}
496 \end{figure}
497
498 Infine tenga presente che, essendo file pure loro, il numero di riferimenti
499 esiste anche per le directory. Per questo se a partire dalla situazione
500 mostrata in fig.~\ref{fig:file_filesys_detail} creiamo una nuova directory
501 \file{img} nella directory \file{gapil}, avremo una situazione come quella
502 illustrata in fig.~\ref{fig:file_dirs_link}.
503
504 La nuova directory avrà un numero di riferimenti pari a due, in quanto è
505 referenziata dalla directory da cui si era partiti (in cui è inserita la nuova
506 voce che fa riferimento a \texttt{img}) e dalla voce interna ``\texttt{.}''
507 che è presente in ogni directory.  Questo è il valore che si troverà sempre
508 per ogni directory che non contenga a sua volta altre directory. Al contempo,
509 la directory da cui si era partiti avrà un numero di riferimenti di almeno
510 tre, in quanto adesso sarà referenziata anche dalla voce ``\texttt{..}'' di
511 \texttt{img}. L'aggiunta di una sottodirectory fa cioè crescere di uno il
512 \textit{link count} della directory genitrice.
513
514 \itindend{inode}
515
516
517 \subsection{Alcuni dettagli sul filesystem \acr{ext2} e successori}
518 \label{sec:file_ext2}
519
520 Benché non esista ``il'' filesystem di Linux, dato che esiste un supporto
521 nativo di diversi filesystem che sono in uso da anni, quello che gli avvicina
522 di più è la famiglia di filesystem evolutasi a partire dal \textit{second
523   extended filesystem}, o \acr{ext2}. Il filesystem \acr{ext2} ha subito un
524 grande sviluppo e diverse evoluzioni, fra cui l'aggiunta del
525 \textit{journaling} con il passaggio ad \acr{ext3}, che probabilmente è ancora
526 il filesystem più diffuso, ed una serie di ulteriori miglioramenti con il
527 successivo \acr{ext4}. In futuro è previsto che questo debba essere sostituito
528 da un filesystem completamente diverso, \acr{Btrfs}, che dovrebbe diventare il
529 filesystem standard di Linux, ma questo al momento è ancora in fase di
530 sviluppo.\footnote{si fa riferimento al momento dell'ultima revisione di
531   questo paragrafo, l'inizio del 2012.}
532
533 Il filesystem \acr{ext2} nasce come filesystem nativo per Linux a partire
534 dalle prime versioni del kernel e supporta tutte le caratteristiche di un
535 filesystem standard Unix: è in grado di gestire nomi di file lunghi (256
536 caratteri, estensibili a 1012) e supporta una dimensione massima dei file fino
537 a 4~Tb. I successivi filesystem \acr{ext3} ed \acr{ext4} sono evoluzioni di
538 questo filesystem, e sia pure con molti miglioramenti ed estensioni
539 significative ne mantengono le caratteristiche fondamentali.
540
541 Oltre alle caratteristiche standard, \acr{ext2} fornisce alcune estensioni che
542 non sono presenti su un classico filesystem di tipo Unix; le principali sono
543 le seguenti:
544 \begin{itemize*}
545 \item gli attributi estesi (vedi sez.~\ref{sec:file_xattr}) che consentono di
546   estendere le informazioni salvabili come metadati e le ACL (vedi
547   sez.~\ref{sec:file_ACL}) che consentono di estendere il modello tradizionale
548   dei permessi sui file.
549 \item sono supportate entrambe le semantiche di BSD e SVr4 come opzioni di
550   montaggio. La semantica BSD comporta che i file in una directory sono creati
551   con lo stesso identificatore di gruppo della directory che li contiene. La
552   semantica SVr4 comporta che i file vengono creati con l'identificatore del
553   gruppo primario del processo, eccetto il caso in cui la directory ha il bit
554   di \acr{sgid} impostato (per una descrizione dettagliata del significato di
555   questi termini si veda sez.~\ref{sec:file_access_control}), nel qual caso
556   file e subdirectory ereditano sia il \ids{GID} che lo \acr{sgid}.
557 \item l'amministratore può scegliere la dimensione dei blocchi del filesystem
558   in fase di creazione, a seconda delle sue esigenze: blocchi più grandi
559   permettono un accesso più veloce, ma sprecano più spazio disco.
560 \item il filesystem implementa collegamenti simbolici veloci, in cui il nome
561   del file non è salvato su un blocco, ma tenuto all'interno
562   dell'\textit{inode} (evitando letture multiple e spreco di spazio), non
563   tutti i nomi però possono essere gestiti così per limiti di spazio (il
564   limite è 60 caratteri).
565 \item vengono supportati i cosiddetti \textit{file attributes} (vedi
566   sez.~\ref{sec:file_perm_overview}) che attivano comportamenti specifici per
567   i file su cui vengono attivati come marcarli come immutabili (che possono
568   cioè essere soltanto letti) per la protezione di file di configurazione
569   sensibili, o come \textit{append-only} (che possono essere aperti in
570   scrittura solo per aggiungere dati) per la protezione dei file di log.
571 \end{itemize*}
572
573 La struttura di \acr{ext2} è stata ispirata a quella del filesystem di BSD: un
574 filesystem è composto da un insieme di blocchi, la struttura generale è quella
575 riportata in fig.~\ref{fig:file_filesys_detail}, in cui la partizione è divisa
576 in gruppi di blocchi.
577
578 Ciascun gruppo di blocchi contiene una copia delle informazioni essenziali del
579 filesystem (i \textit{superblock} sono quindi ridondati) per una maggiore
580 affidabilità e possibilità di recupero in caso di corruzione del
581 \textit{superblock} principale. L'utilizzo di raggruppamenti di blocchi ha
582 inoltre degli effetti positivi nelle prestazioni dato che viene ridotta la
583 distanza fra i dati e la tabella degli \textit{inode}.
584
585 \begin{figure}[!htb]
586   \centering
587   \includegraphics[width=9cm]{img/dir_struct}  
588   \caption{Struttura delle directory nel \textit{second extended filesystem}.}
589   \label{fig:file_ext2_dirs}
590 \end{figure}
591
592
593 Le directory sono implementate come una \textit{linked list} con voci di
594 dimensione variabile. Ciascuna voce della lista contiene il numero di
595 \textit{inode}, la sua lunghezza, il nome del file e la sua lunghezza, secondo
596 lo schema in fig.~\ref{fig:file_ext2_dirs}; in questo modo è possibile
597 implementare nomi per i file anche molto lunghi (fino a 1024 caratteri) senza
598 sprecare spazio disco.
599
600 Con l'introduzione del filesystem \acr{ext3} sono state introdotte diverse
601 modifiche strutturali, la principale di queste è quella che \acr{ext3} è un
602 filesystem \textit{journaled}, è cioè in grado di eseguire una registrazione
603 delle operazioni di scrittura su un giornale (uno speciale file interno) in
604 modo da poter garantire il ripristino della coerenza dei dati del
605 filesystem\footnote{si noti bene che si è parlato di dati \textsl{del}
606   filesystem, non di dati \textsl{nel} filesystem, quello di cui viene
607   garantito un veloce ripristino è relativo ai dati della struttura interna
608   del filesystem, non di eventuali dati contenuti nei file che potrebbero
609   essere stati persi.} in brevissimo tempo in caso di interruzione improvvisa
610 della corrente o di crollo del sistema che abbia causato una interruzione
611 della scrittura dei dati sul disco.
612
613 Oltre a questo \acr{ext3} introduce ulteriori modifiche volte a migliorare
614 sia le prestazioni che la semplicità di gestione del filesystem, in
615 particolare per le directory si è passato all'uso di alberi binari con
616 indicizzazione tramite \textit{hash} al posto delle \textit{linked list} che
617 abbiamo illustrato, ottenendo un forte guadagno di prestazioni in caso di
618 directory contenenti un gran numero di file.
619
620 % TODO (bassa priorità) portare a ext3, ext4 e btrfs ed illustrare le
621 % problematiche che si possono incontrare (in particolare quelle relative alla
622 % perdita di contenuti in caso di crash del sistema)
623 % TODO (media priorità) trattare btrfs quando sarà usato come stabile
624
625
626 \subsection{La gestione dell'uso dei filesystem}
627 \label{sec:filesystem_mounting}
628
629 Come accennato in sez.~\ref{sec:file_arch_overview} per poter accedere ai file
630 occorre rendere disponibile al sistema il filesystem su cui essi sono
631 memorizzati. L'operazione di attivazione del filesystem è chiamata
632 \textsl{montaggio} e per far questo in Linux si usa la funzione di sistema
633 \funcd{mount}, il cui prototipo è:\footnote{la funzione è una versione
634   specifica di Linux che usa la omonima \textit{system call} e non è
635   portabile.}
636
637 \begin{funcproto}{
638 \fhead{sys/mount.h} 
639 \fdecl{mount(const char *source, const char *target, const char
640   *filesystemtype, \\ 
641 \phantom{mount(}unsigned long mountflags, const void *data)}
642 \fdesc{Monta un filesystem.} 
643 }
644 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
645   caso \var{errno} assumerà uno dei valori:
646   \begin{errlist}
647   \item[\errcode{EACCES}] non si ha il permesso di accesso su uno dei
648     componenti del \textit{pathname}, o si è cercato di montare un filesystem
649     disponibile in sola lettura senza aver specificato \const{MS\_RDONLY} o il
650     device \param{source} è su un filesystem montato con l'opzione
651     \const{MS\_NODEV}.
652   \item[\errcode{EBUSY}] \param{source} è già montato, o non può essere
653     rimontato in sola lettura perché ci sono ancora file aperti in scrittura,
654     o non può essere montato su \param{target} perché la directory è ancora in
655     uso.
656   \item[\errcode{EINVAL}] il dispositivo \param{source} presenta un
657     \textit{superblock} non valido, o si è cercato di rimontare un filesystem
658     non ancora montato, o di montarlo senza che \param{target} sia un
659     \textit{mount point} o di spostarlo quando \param{target} non è un
660     \textit{mount point} o è la radice o si è usato un valore di
661     \param{mountflags} non valido.
662   \item[\errcode{ELOOP}] si è cercato di spostare un \textit{mount point} su
663     una sottodirectory di \param{source} o si sono incontrati troppi
664     collegamenti simbolici nella risoluzione di un nome.
665   \item[\errcode{EMFILE}] in caso di filesystem virtuale, la tabella dei
666     dispositivi fittizi (chiamati \textit{dummy} nella documentazione inglese)
667     è piena.
668   \item[\errcode{ENODEV}] il tipo \param{filesystemtype} non esiste o non è
669     configurato nel kernel.
670   \item[\errcode{ENOTBLK}] non si è usato un \textit{block device} per
671     \param{source} quando era richiesto.
672   \item[\errcode{ENXIO}] il \textit{major number} del
673     dispositivo \param{source} è sbagliato.
674   \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
675   \end{errlist} 
676   ed inoltre \errval{EFAULT}, \errval{ENOMEM}, \errval{ENAMETOOLONG},
677   \errval{ENOENT}, \errval{ENOTDIR} nel loro significato generico.}
678 \end{funcproto}
679
680 \itindbeg{mount~point}
681
682 L'uso più comune della funzione è quello di montare sulla directory indicata
683 da \param{target}, detta \textit{mount point}, il filesystem contenuto nel
684 file di dispositivo indicato da \param{source}. In entrambi i casi, come
685 daremo per assunto da qui in avanti tutte le volte che si parla di directory o
686 file nel passaggio di un argomento di una funzione, si intende che questi
687 devono essere indicati con la stringa contenente il loro \textit{pathname}.
688
689 Normalmente un filesystem è contenuto su un disco o una partizione, ma come
690 illustrato in sez.~\ref{sec:file_vfs_work} la struttura del \textit{Virtual
691   File System} è estremamente flessibile e può essere usata anche per oggetti
692 diversi da un disco. Ad esempio usando il \textit{loop device} si può montare
693 un file qualunque (come l'immagine di un CD-ROM o di un floppy) che contiene
694 l'immagine di un filesystem, inoltre alcuni tipi di filesystem, come
695 \texttt{proc} o \texttt{sysfs} sono virtuali e non hanno un supporto che ne
696 contenga i dati che sono generati al volo dal kernel ad ogni lettura, e
697 inviati al kernel ad ogni scrittura (costituiscono quindi un meccanismo di
698 comunicazione, attraverso l'ordinaria interfaccia dei file, con il kernel).
699
700 Il tipo di filesystem che si vuole montare è specificato
701 dall'argomento \param{filesystemtype}, che deve essere una delle stringhe
702 riportate nel file \procfilem{/proc/filesystems} che, come accennato in
703 sez.~\ref{sec:file_vfs_work}, contiene l'elenco dei filesystem supportati dal
704 kernel. Nel caso si sia indicato un filesystem virtuale, che non è associato a
705 nessun file di dispositivo, il contenuto di \param{source} viene ignorato.
706
707 L'argomento \param{data} viene usato per passare le impostazioni relative alle
708 caratteristiche specifiche di ciascun filesystem. Si tratta di una stringa di
709 parole chiave (separate da virgole e senza spazi) che indicano le cosiddette
710 ``\textsl{opzioni}'' del filesystem che devono essere impostate; in genere
711 viene usato direttamente il contenuto del parametro dell'opzione \texttt{-o}
712 del comando \texttt{mount}. I valori utilizzabili dipendono dal tipo di
713 filesystem e ciascuno ha i suoi, pertanto si rimanda alla documentazione della
714 pagina di manuale di questo comando e dei singoli filesystem.
715
716 Dopo l'esecuzione della funzione il contenuto del filesystem viene reso
717 disponibile nella directory specificata come \textit{mount point} ed il
718 precedente contenuto di detta directory viene mascherato dal contenuto della
719 directory radice del filesystem montato. Fino ai kernel della serie 2.2.x non
720 era possibile montare un filesystem se un \textit{mount point} era già in uso,
721 coi kernel successivi è possibile montare più filesystem sullo stesso
722 \textit{mount point} impilandoli l'uno sull'altro, anche in questo caso vale
723 quanto appena detto, e solo il contenuto dell'ultimo filesystem montato sarà
724 visibile, mascherando quelli sottostanti.
725
726 In realtà quella di montare un filesystem è solo una delle operazioni che si
727 possono effettuare con \func{mount}, la funzione infatti è dedicata a tutte le
728 operazioni relative alla gestione del montaggio dei filesystem e dei
729 \textit{mount point}. Ad esempio fin dalle sue origini poteva essere
730 utilizzata per effettuare il rimontaggio di un filesystem con opzioni diverse,
731 ed a partire dal kernel 2.4.x è divenuto possibile usarla per spostare
732 atomicamente un \textit{mount point} da una directory ad un'altra, per montare
733 lo stesso filesystem in diversi \textit{mount point}, per montare una
734 directory su un'altra (il cosiddetto \textit{bind mount}).
735
736 \itindend{mount~point}
737
738 Il tipo di operazione compiuto da \func{mount} viene stabilito in base al
739 valore dell'argomento \param{mountflags}, che oltre alla selezione del tipo di
740 operazione da compiere, consente anche di indicare alcune opzioni generiche
741 valide per qualunque filesystem.\footnote{benché queste siano espresse nel
742   comando \cmd{mount} con l'opzione \texttt{-o} esse non vengono impostate nei
743   valori di \param{data}, che serve solo per le opzioni specifiche di ogni
744   filesystem.}  Il valore dell'argomento deve essere espresso come maschera
745 binaria e i vari bit che lo compongono, detti anche \textit{mount flags},
746 devono essere impostati con un OR aritmetico dei valori dalle opportune
747 costanti che illustreremo a breve.
748
749 In Linux \param{mountflags} deve essere un intero a 32 bit;
750 fino ai kernel della serie 2.2.x i 16 più significativi avevano un valore
751 riservato che doveva essere specificato obbligatoriamente,\footnote{il valore
752   era il \textit{magic number} \code{0xC0ED}, si può usare la costante
753   \constd{MS\_MGC\_MSK} per ottenere la parte di \param{mountflags} riservata
754   al \textit{magic number}, mentre per specificarlo si può dare un OR
755   aritmetico con la costante \constd{MS\_MGC\_VAL}.} e si potevano usare solo
756 i 16 meno significativi. Oggi invece, con un numero di opzioni superiore, sono
757 utilizzati tutti e 32 i bit, ma qualora nei 16 più significativi sia presente
758 detto valore, che non esprime una combinazione valida, esso viene ignorato.
759
760 Come accennato il tipo di operazione eseguito da \func{mount} viene stabilito
761 in base al contenuto di \param{mountflags}, la scelta viene effettuata
762 controllando nell'ordine:
763 \begin{enumerate*}
764 \item se è presente il flag \const{MS\_REMOUNT}, nel qual caso verrà eseguito
765   il rimontaggio del filesystem, con le nuove opzioni indicate da \param{data}
766   e dagli altri flag di \param{mountflags};
767 \item se è presente il flag \const{MS\_BIND}, nel qual caso verrà eseguito un
768   \textit{bind mount} (argomento che tratteremo più avanti);
769 \item se è presente uno fra \const{MS\_SHARED}, \const{MS\_PRIVATE},
770   \const{MS\_SLAVE}, \const{MS\_UNBINDABLE}, nel qual caso verrà cambiata la
771   modalità di propagazione del montaggio (detti valori sono mutualmente
772   esclusivi).
773 \item se è presente \const{MS\_MOVE}, nel qual caso verrà effettuato uno
774   spostamento del \textit{mount point};
775 \item se nessuno dei precedenti è presente si tratta di una ordinaria
776   operazione di montaggio di un filesystem.
777 \end{enumerate*}
778
779 Il fatto che questi valori vengano controllati in quest'ordine significa che
780 l'effetto di alcuni di questi flag possono cambiare se usati in combinazione
781 con gli altri che vengono prima nella sequenza (è quanto avviene ad esempio
782 per \const{MS\_BIND} usato con \const{MS\_REMOUNT}). Tratteremo questi
783 \textit{mount flags} speciali per primi, nell'ordine appena illustrato,
784 tornando sugli altri più avanti.
785
786 Usando il flag \constd{MS\_REMOUNT} si richiede a \func{mount} di rimontare un
787 filesystem già montato cambiandone le opzioni di montaggio in maniera atomica
788 (non è cioè necessario smontare e rimontare il filesystem per effettuare il
789 cambiamento). Questa operazione consente di modificare le opzioni del
790 filesystem anche se questo è in uso. Gli argomenti \param{source} e
791 \param{target} devono essere gli stessi usati per il montaggio originale,
792 mentre sia \param{data} che \param{mountflags} conterranno le nuove opzioni,
793 \param{filesystemtype} viene ignorato.  Perché l'operazione abbia successo
794 occorre comunque che il cambiamento sia possibile (ad esempio non sarà
795 possibile rimontare in sola lettura un filesystem su cui sono aperti file per
796 la lettura/scrittura).
797
798 Qualunque opzione specifica del filesystem indicata con \param{data} può
799 essere modificata (ma si dovranno rielencare tutte quelle volute), mentre con
800 \param{mountflags} possono essere modificate solo alcune opzioni generiche:
801 \const{MS\_LAZYTIME}, \const{MS\_MANDLOCK}, \const{MS\_NOATIME},
802 \const{MS\_NODEV}, \const{MS\_NODIRATIME}, \const{MS\_NOEXEC},
803 \const{MS\_NOSUID}, \const{MS\_RELATIME}, \const{MS\_RDONLY},
804 \const{MS\_STRICTATIME} e \const{MS\_SYNCHRONOUS}. Inoltre dal kernel 3.17 il
805 comportamento relativo alle opzioni che operano sui tempi di ultimo accesso
806 dei file (vedi sez.~\ref{sec:file_file_times}) è cambiato e se non si è
807 indicato nessuno dei vari \texttt{MS\_*ATIME} vengono mantenute le
808 impostazioni esistenti anziché forzare l'uso di \const{MS\_RELATIME}.
809
810 \itindbeg{bind~mount}
811
812 Usando il flag \constd{MS\_BIND} si richiede a \func{mount} di effettuare un
813 cosiddetto \textit{bind mount}, l'operazione che consente di montare una
814 directory di un filesystem in un'altra directory. L'opzione è disponibile a
815 partire dai kernel della serie 2.4. In questo caso verranno presi in
816 considerazione solo gli argomenti \param{source}, che stavolta indicherà la
817 directory che si vuole montare e non un file di dispositivo, e \param{target}
818 che indicherà la directory su cui verrà effettuato il \textit{bind mount}. Gli
819 argomenti \param{filesystemtype} e \param{data} vengono ignorati.
820
821 Quello che avviene con questa operazione è che in corrispondenza del
822 \textit{pathname} indicato da \param{target} viene montato l'\textit{inode} di
823 \param{source}, così che la porzione di albero dei file presente sotto
824 \param{source} diventi visibile allo stesso modo sotto
825 \param{target}. Trattandosi esattamente dei dati dello stesso filesystem, ogni
826 modifica fatta in uno qualunque dei due rami di albero sarà visibile
827 nell'altro, visto che entrambi faranno riferimento agli stessi \textit{inode}.
828
829 Dal punto di vista del VFS l'operazione è analoga al montaggio di un
830 filesystem proprio nel fatto che anche in questo caso si inserisce in
831 corrispondenza della \textit{dentry} di \texttt{target} un diverso
832 \textit{inode}, che stavolta, invece di essere quello della radice del
833 filesystem indicato da un file di dispositivo, è quello di una directory già
834 montata.
835
836 Si tenga presente che proprio per questo sotto \param{target} comparirà il
837 contenuto che è presente sotto \param{source} all'interno del filesystem in
838 cui quest'ultima è contenuta. Questo potrebbe non corrispondere alla porzione
839 di albero che sta sotto \param{source} qualora in una sottodirectory di
840 quest'ultima si fosse effettuato un altro montaggio. In tal caso infatti nella
841 porzione di albero sotto \param{source} si troverebbe il contenuto del nuovo
842 filesystem (o di un altro \textit{bind mount}) mentre sotto \param{target} ci
843 sarebbe il contenuto presente nel filesystem originale.
844
845 L'unico altro \textit{mount flag} usabile direttamente con \const{MS\_BIND} è
846 \const{MS\_REC} che consente di eseguire una operazione di \textit{bind mount}
847 ricorsiva, in cui sotto \param{target} vengono montati ricorsivamente anche
848 tutti gli eventuali ulteriori \textit{bind mount} già presenti sotto
849 \param{source}.
850
851 E' però possibile, a partire dal kernel 2.6.26, usare questo flag insieme a
852 \const{MS\_REMOUNT}, nel qual caso consente di effettuare una modifica delle
853 opzioni di montaggio del \textit{bind mount} ed in particolare effettuare il
854 cosiddetto \textit{read-only bind mount} in cui viene onorata anche la
855 presenza aggiuntiva del flag \const{MS\_RDONLY}. In questo modo si ottiene che
856 l'accesso ai file sotto \param{target} sia effettuabile esclusivamente in sola
857 lettura, mantenendo il normale accesso in lettura/scrittura sotto
858 \param{source}.
859
860 Il supporto per il \textit{bind mount} consente di superare i limiti presenti
861 per gli \textit{hard link} (di cui parleremo in
862 sez.~\ref{sec:link_symlink_rename}) con la possibilità di fare riferimento
863 alla porzione dell'albero dei file di un filesystem presente a partire da una
864 certa directory utilizzando una qualunque altra directory, anche se questa sta
865 su un filesystem diverso.\footnote{e non c'è neanche il problema di non esser
866   più in grado di cancellare un \textit{hard link} ad una directory sullo
867   stesso filesystem (vedi sez.~\ref{sec:link_symlink_rename}), per cui su
868   Linux questi non sono possibili, dato che in questo caso per la rimozione
869   del collegamento basta smontare \param{target}.} Si può così fornire una
870 alternativa all'uso dei collegamenti simbolici (di cui parleremo in
871 sez.~\ref{sec:link_symlink_rename}) che funziona correttamente anche
872 all'intero di un \textit{chroot} (argomento su cui torneremo in
873 sez.~\ref{sec:file_chroot}).
874
875 \itindend{bind~mount}
876 \itindbeg{shared~subtree}
877
878 I quattro flag \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
879 \const{MS\_UNBINDABLE} sono stati introdotti a partire dal kernel 2.6.15 per
880 realizzare l'infrastruttura dei cosiddetti \textit{shared subtree}, che
881 estendono le funzionalità dei \textit{bind mount}.  La funzionalità nasce
882 dalle esigenze di poter utilizzare a pieno le funzionalità di isolamento
883 fornite dal kernel per i processi (i \textit{namespace}, che tratteremo in
884 sez.~\ref{sec:process_namespaces}) in particolare per quanto riguarda la
885 possibilità di far avere ad un processo una visione ristretta dei filesystem
886 montati (il \textit{mount namespace}), ma l'applicazione è comunque rilevante
887 anche con un classico \textit{chroot} (vedi sez.~\ref{sec:file_chroot}).
888
889 \itindbeg{submount}
890
891 Abbiamo visto come nella modalità ordinaria in cui si esegue un
892 \textit{bind mount} sotto \param{target} compaia lo stesso ramo di albero dei
893 file presente sotto \param{source}, ma limitato a quanto presente nel
894 filesystem di \param{source}; i risultati di un eventuale
895 ``\textit{submount}'' effettuato all'interno di \param{source} non saranno
896 visibili. Ed anche se quelli presenti al momento dell'uso di \const{MS\_BIND}
897 possono essere riottenuti usando \const{MS\_REC}, ogni eventuale
898 ``\textit{submount}'' successivo (che avvenga sotto \param{source} o sotto
899 \param{target}) resterà ``\textsl{privato}'' al ramo di albero su cui è
900 avvenuto.
901
902 \itindend{submount}
903 \itindbeg{mount peer group}
904
905 Ci sono casi però in cui può risultare utile che eventuali
906 ``\textit{submount}'' siano visibili sui rami di albero presenti al di sotto
907 di tutte le directory coinvolte in un \textit{bind mount}, anche se effettuati
908 in un secondo tempo. Per poter ottenere questa funzionalità i
909 \textit{bind mount} sono stati estesi introducendo i \textit{mount peer
910   group}, che consentono di raggrupparli in modo da poter inviare a ciascuno
911 di essi tutti gli eventi relativi a montaggi o smontaggi effettuati al loro
912 interno ed avere sempre una propagazione degli stessi che li renda coerenti.
913
914 Quando si effettua un montaggio ordinario, o si esegue un \textit{bind mount},
915 di default non viene utilizzato nessun \textit{mount peer group} ed il
916 \textit{mount point} viene classificato come ``\textsl{privato}'', nel senso
917 che abbiamo appena visto.  Si può però marcare un \textit{mount point} come
918 ``\textsl{condiviso}'', ed in questo modo esso verrà associato ad un
919 \textit{mount peer group} insieme a tutti gli altri ulteriori \textit{mount
920   point} per i quali sia stato eseguito un \textit{bind mount}. Questo fa sì
921 che tutte le volte che si effettua un montaggio o uno smontaggio all'interno
922 di uno qualunque dei \textit{mount point} del gruppo, questo venga propagato
923 anche su tutti gli altri e sotto tutti sia visibile sempre lo stesso ramo di
924 albero dei file.
925
926 A completare l'infrastruttura degli \textit{shared subtree} sono state
927 previste due ulteriori funzionalità: la prima è quella di marcare un
928 \textit{mount point} come ``\textit{slave}'', in tal caso le operazioni di
929 montaggio e smontaggio effettuate al suo interno non verranno più propagate
930 agli altri membri del \textit{mount peer group} di cui fa parte, ma continuerà
931 a ricevere quelle eseguite negli altri membri.
932
933 La seconda funzionalità è quella di marcare un \textit{mount point} come
934 ``\textit{unbindable}''; questo anzitutto impedirà che possa essere usato come
935 sorgente di un \textit{bind mount} ed inoltre lo renderà privato, con la
936 conseguenza che quando è presente all'interno di altri \textit{bind mount},
937 all'interno di questi si vedrà solo il contenuto originale e non quello
938 risultante da eventuali ulteriori montaggi effettuati al suo interno.
939
940 \itindend{mount peer group}
941
942 I \textit{mount flag} che controllano le operazioni relative agli
943 \textit{shared subtree} sono descritti nella lista seguente. Si ricordi che
944 sono mutuamente esclusivi, e compatibili solo con l'uso degli ulteriori flag
945 \const{MS\_REC} (che applica ricorsivamente l'operazione a tutti gli eventuali
946 \textit{mount point} sottostanti) e \const{MS\_SILENT}; in tutti gli altri
947 casi \func{mount} fallirà con un errore di \errval{EINVAL}. L'unico altro
948 argomento che deve essere specificato quando li si usano è \param{target};
949 \param{source}, \param{data} e \param{filesystem} sono ignorati.
950
951 \begin{basedescript}{\desclabelwidth{1.9cm}\desclabelstyle{\nextlinelabel}}
952
953 \item[\constd{MS\_PRIVATE}] Marca un \textit{mount point} come \textit{private
954     mount}.  Di default, finché non lo si marca altrimenti con una delle altre
955   opzioni dell'interfaccia, ogni \textit{mount point} è privato. Ogni
956   \textit{bind mount} ottenuto da un \textit{mount point} privato si comporta
957   come descritto nella trattazione di \const{MS\_BIND}. Si usa questo flag
958   principalmente per revocare gli effetti delle altre opzioni e riportare il
959   comportamento a quello ordinario.
960
961 \item[\constd{MS\_SHARED}] Marca un \textit{mount point} come \textit{shared
962     mount}.  Lo scopo dell'opzione è ottenere che tutti i successivi
963   \textit{bind mount} ottenuti da un \textit{mount point} così marcato siano
964   di tipo \textit{shared} e vengano inseriti nello stesso \textit{mount peer
965     group} in modo da ``\textsl{condividere}'' ogni ulteriore operazione di
966   montaggio o smontaggio. Con questa opzione le operazioni di montaggio e
967   smontaggio effettuate al di sotto di uno \textit{shared mount} vengono
968   automaticamente ``\textsl{propagate}'' a tutti gli altri membri del
969   \textit{mount peer group} di cui fa parte, in modo che la sezione di albero
970   dei file visibile al di sotto di ciascuno di essi sia sempre la stessa.
971
972 \item[\constd{MS\_SLAVE}] Marca un \textit{mount point} come \textit{slave
973     mount}. Se il \textit{mount point} è parte di un \textit{mount peer group}
974   esso diventerà di tipo \textit{slave}: le operazioni di montaggio e
975   smontaggio al suo interno non verranno più propagate agli altri membri del
976   gruppo, ma continuerà a ricevere quelle eseguite negli altri membri. Se non
977   esistono altri membri nel gruppo il \textit{mount point} diventerà privato,
978   negli altri casi non subirà nessun cambiamento.
979
980 \item[\constd{MS\_UNBINDABLE}] Marca un \textit{mount point} come
981   \textit{unbindable mount}.  Un \textit{mount point} marcato in questo modo
982   non può essere usato per un \textit{bind mount} del suo contenuto. Si
983   comporta cioè come allo stesso modo di un \textit{mount point} ordinario di
984   tipo \textit{private} con in più la restrizione che nessuna sua
985   sottodirectory (anche se relativa ad un ulteriore montaggio) possa essere
986   utilizzata come sorgente di un \textit{bind mount}.
987   
988 \end{basedescript}
989 \itindend{shared~subtree}
990
991 L'ultimo \textit{mount flag} che controlla una modalità operativa di
992 \func{mount} è \constd{MS\_MOVE}, che consente di effettuare lo spostamento
993 del \textit{mount point} di un filesystem. La directory del \textit{mount
994   point} originale deve essere indicata nell'argomento \param{source}, e la
995 sua nuova posizione nell'argomento \param{target}. Tutti gli altri argomenti
996 della funzione vengono ignorati.
997
998 Lo spostamento avviene atomicamente, ed il ramo di albero presente sotto
999 \param{source} sarà immediatamente visibile sotto \param{target}. Non esiste
1000 cioè nessun momento in cui il filesystem non risulti montato in una o
1001 nell'altra directory e pertanto è garantito che la risoluzione di
1002 \textit{pathname} relativi all'interno del filesystem non possa fallire.
1003
1004 Elenchiamo infine i restanti \textit{mount flag}, il cui utilizzo non attiene
1005 alle operazioni di \func{mount}, ma soltanto l'impostazione di opzioni
1006 generiche relative al funzionamento di un filesystem e che vengono per lo più
1007 utilizzati solo in fase di montaggio:
1008
1009 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
1010 \item[\constd{MS\_DIRSYNC}] Richiede che ogni modifica al contenuto di una
1011   directory venga immediatamente registrata su disco in maniera sincrona
1012   (introdotta a partire dai kernel della serie 2.6). L'opzione si applica a
1013   tutte le directory del filesystem, ma su alcuni filesystem è possibile
1014   impostarla a livello di singole directory o per i sotto-rami di una directory
1015   con il comando \cmd{chattr}.\footnote{questo avviene tramite delle opportune
1016     \texttt{ioctl} (vedi sez.~\ref{sec:file_fcntl_ioctl}).}
1017
1018   Questo consente di ridurre al minimo il rischio di perdita dei dati delle
1019   directory in caso di crollo improvviso del sistema, al costo di una certa
1020   perdita di prestazioni dato che le funzioni di scrittura relative ad
1021   operazioni sulle directory non saranno più bufferizzate e si bloccheranno
1022   fino all'arrivo dei dati sul disco prima che un programma possa proseguire.
1023
1024 \item[\constd{MS\_LAZYTIME}] Modifica la modalità di registrazione di tempi
1025   dei file (vedi sez.~\ref{sec:file_file_times}) per ridurre al massimo gli
1026   accessi a disco (particolarmente utile per i portatili). Attivandolo i tempi
1027   dei file vengono mantenuti in memoria e vengono salvati su disco solo in
1028   quattro casi: quando c'è da eseguire un aggiornamento dei dati
1029   dell'\textit{inode} per altri motivi, se viene usata una delle funzioni di
1030   sincronizzazione dei dati su disco (vedi sez.~\ref{sec:file_sync}), se
1031   l'\textit{inode} viene rimosso dalla memoria, o se è passato un giorno
1032   dall'ultima registrazione. Introdotto a partire dal kernel 4.0.
1033
1034   In questo modo si possono ridurre significativamente le scritture su disco
1035   mantenendo tutte le informazioni riguardo ai tempi dei file, riducendo anche
1036   l'impatto dell'uso di \const{MS\_STRICTATIME}. Il costo da pagare è il
1037   rischio, in caso di crash del sistema, di avere dati vecchi fino a 24 ore
1038   per quel che riguarda i tempi dei file.
1039   
1040 \item[\constd{MS\_MANDLOCK}] Consente l'uso del \textit{mandatory locking}
1041   (vedi sez.~\ref{sec:file_mand_locking}) sui file del filesystem. Per poterlo
1042   utilizzare effettivamente però esso dovrà essere comunque attivato
1043   esplicitamente per i singoli file impostando i permessi come illustrato in
1044   sez.~\ref{sec:file_mand_locking}.
1045
1046 \item[\constd{MS\_NOATIME}] Viene disabilitato sul filesystem l'aggiornamento
1047   dell'\textit{access time} (vedi sez.~\ref{sec:file_file_times}) per
1048   qualunque tipo di file. Dato che l'aggiornamento dell'\textit{access time} è
1049   una funzionalità la cui utilità è spesso irrilevante ma comporta un costo
1050   elevato visto che una qualunque lettura comporta comunque una scrittura su
1051   disco, questa opzione consente di disabilitarla completamente. La soluzione
1052   può risultare troppo drastica dato che l'informazione viene comunque
1053   utilizzata da alcuni programmi, per cui nello sviluppo del kernel sono state
1054   introdotte altre opzioni che forniscono soluzioni più appropriate e meno
1055   radicali.
1056
1057 \item[\constd{MS\_NODEV}] Viene disabilitato sul filesystem l'accesso ai file
1058   di dispositivo eventualmente presenti su di esso. L'opzione viene usata come
1059   misura di precauzione per rendere inutile la presenza di eventuali file di
1060   dispositivo su filesystem che non dovrebbero contenerne.\footnote{si ricordi
1061     che le convenzioni del \textit{Linux Filesystem Hierarchy Standard}
1062     richiedono che questi siano mantenuti esclusivamente sotto \texttt{/dev}.}
1063
1064   Viene utilizzata, assieme a \const{MS\_NOEXEC} e \const{MS\_NOSUID}, per
1065   fornire un accesso più controllato a quei filesystem di cui gli utenti hanno
1066   il controllo dei contenuti, in particolar modo quelli posti su dispositivi
1067   rimuovibili. In questo modo si evitano alla radice possibili situazioni in
1068   cui un utente malizioso inserisce su uno di questi filesystem dei file di
1069   dispositivo con permessi ``opportunamente'' ampliati che gli consentirebbero
1070   di accedere anche a risorse cui non dovrebbe.
1071
1072 \item[\constd{MS\_NODIRATIME}] Viene disabilitato sul filesystem
1073   l'aggiornamento dell'\textit{access time} (vedi
1074   sez.~\ref{sec:file_file_times}) ma soltanto per le directory. Costituisce
1075   una alternativa per \const{MS\_NOATIME}, che elimina l'informazione per le
1076   directory, che in pratica che non viene mai utilizzata, mantenendola per i
1077   file in cui invece ha un impiego, sia pur limitato.
1078
1079 \item[\constd{MS\_NOEXEC}] Viene disabilitata sul filesystem l'esecuzione di un
1080   qualunque file eseguibile eventualmente presente su di esso. L'opzione viene
1081   usata come misura di precauzione per rendere impossibile l'uso di programmi
1082   posti su filesystem che non dovrebbero contenerne.
1083
1084   Anche in questo caso viene utilizzata per fornire un accesso più controllato
1085   a quei filesystem di cui gli utenti hanno il controllo dei contenuti. Da
1086   questo punto di vista l'opzione è meno importante delle analoghe
1087   \const{MS\_NODEV} e \const{MS\_NOSUID} in quanto l'esecuzione di un
1088   programma creato dall'utente pone un livello di rischio nettamente
1089   inferiore, ed è in genere consentita per i file contenuti nella sua home
1090   directory.\footnote{cosa che renderebbe superfluo l'attivazione di questa
1091     opzione, il cui uso ha senso solo per ambienti molto controllati in cui si
1092     vuole che gli utenti eseguano solo i programmi forniti
1093     dall'amministratore.}
1094
1095 \item[\constd{MS\_NOSUID}] Viene disabilitato sul filesystem l'effetto dei bit
1096   dei permessi \acr{suid} e \acr{sgid} (vedi sez.~\ref{sec:file_special_perm})
1097   eventualmente presenti sui file in esso contenuti. L'opzione viene usata
1098   come misura di precauzione per rendere inefficace l'effetto di questi bit
1099   per filesystem in cui non ci dovrebbero essere file dotati di questi
1100   permessi.
1101
1102   Di nuovo viene utilizzata, analogamente a \const{MS\_NOEXEC} e
1103   \const{MS\_NODEV}, per fornire un accesso più controllato a quei filesystem
1104   di cui gli utenti hanno il controllo dei contenuti. In questo caso si evita
1105   che un utente malizioso possa inserire su uno di questi filesystem un
1106   eseguibile con il bit \acr{suid} attivo e di proprietà dell'amministratore o
1107   di un altro utente, che gli consentirebbe di eseguirlo per conto di
1108   quest'ultimo.
1109
1110 \item[\constd{MS\_RDONLY}] Esegue il montaggio del filesystem in sola lettura,
1111   non sarà possibile nessuna modifica ai suoi contenuti. Viene usato tutte le
1112   volte che si deve accedere ai contenuti di un filesystem con la certezza che
1113   questo non venga modificato (ad esempio per ispezionare un filesystem
1114   corrotto). All'avvio di default il kernel monta la radice in questa
1115   modalità. Si tenga presente che se non viene indicato il filesystem verrà
1116   montato, o rimontato nel caso lo si usi con \const{MS\_REMOUNT}, in
1117   lettura/scrittura; questo significa in sostanza che non esiste una opzione
1118   separata per indicare il montaggio in lettura/scrittura.
1119
1120 \item[\constd{MS\_REC}] Applica ricorsivamente a tutti i \textit{mount point}
1121   presenti al di sotto del \textit{mount point} indicato gli effetti della
1122   opzione degli \textit{shared subtree} associata. In questo caso l'argomento
1123   \param{target} deve fare riferimento ad un \textit{mount point} e tutti gli
1124   altri argomenti sono ignorati, ed il flag deve essere indicato con uno fra
1125   \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
1126   \const{MS\_UNBINDABLE}. Può anche essere usato con \const{MS\_BIND} per
1127   richiedere il montaggio ricorsivo anche degli eventuali ulteriori
1128   \textit{bind mount} presenti sotto \param{target}.
1129
1130 \item[\constd{MS\_RELATIME}] Indica di effettuare l'aggiornamento
1131   dell'\textit{access time} sul filesystem soltanto quando questo risulti
1132   antecedente il valore corrente del \textit{modification time} o del
1133   \textit{change time} (per i tempi dei file si veda
1134   sez.~\ref{sec:file_file_times}). L'opzione è disponibile a partire dal
1135   kernel 2.6.20, mentre dal 2.6.30 questo è diventato il comportamento di
1136   default del sistema, che può essere riportato a quello tradizionale con
1137   l'uso di \const{MS\_STRICTATIME}. Sempre dal 2.6.30 il comportamento è stato
1138   anche modificato e l'\textit{access time} viene comunque aggiornato se è più
1139   vecchio di un giorno.
1140
1141   L'opzione consente di evitare i problemi di prestazioni relativi
1142   all'aggiornamento dell'\textit{access time} senza avere impatti negativi
1143   riguardo le funzionalità, il comportamento adottato infatti consente di
1144   rendere evidente che vi è stato un accesso dopo la scrittura, ed evitando al
1145   contempo ulteriori operazioni su disco negli accessi successivi. In questo
1146   modo l'informazione relativa al fatto che un file sia stato letto resta
1147   disponibile, ed i programmi che ne fanno uso continuano a funzionare. Con
1148   l'introduzione di questo comportamento l'uso delle alternative
1149   \const{MS\_NOATIME} e \const{MS\_NODIRATIME} è sostanzialmente inutile.
1150
1151 \item[\constd{MS\_SILENT}] Richiede la soppressione di alcuni messaggi di
1152   avvertimento nei log del kernel (vedi sez.~\ref{sec:sess_daemon}). L'opzione
1153   è presente a partire dal kernel 2.6.17 e sostituisce, utilizzando un nome
1154   non fuorviante, la precedente \const{MS\_VERBOSE}, introdotta nel kernel
1155   2.6.12, che aveva lo stesso effetto.
1156
1157 \item[\constd{MS\_STRICTATIME}] Ripristina il comportamento tradizionale per
1158   cui l'\textit{access time} viene aggiornato ad ogni accesso al
1159   file. L'opzione è disponibile solo a partire dal kernel 2.6.30 quando il
1160   comportamento di default del kernel è diventato quello fornito da
1161   \const{MS\_RELATIME}.
1162
1163 \item[\constd{MS\_SYNCHRONOUS}] Abilita la scrittura sincrona richiedendo che
1164   ogni modifica al contenuto del filesystem venga immediatamente registrata su
1165   disco. Lo stesso comportamento può essere ottenuto con il flag
1166   \const{O\_SYNC} di \func{open} (vedi sez.~\ref{sec:file_open_close}).
1167
1168   Questa opzione consente di ridurre al minimo il rischio di perdita dei dati
1169   in caso di crollo improvviso del sistema, al costo di una pesante perdita di
1170   prestazioni dato che tutte le funzioni di scrittura non saranno più
1171   bufferizzate e si bloccheranno fino all'arrivo dei dati sul disco. Per un
1172   compromesso in cui questo comportamento avviene solo per le directory, ed ha
1173   quindi una incidenza nettamente minore, si può usare \const{MS\_DIRSYNC}.
1174
1175 \end{basedescript}
1176
1177 % NOTE: per l'opzione \texttt{lazytime} introdotta con il kernel 4.0,
1178 % vedi http://lwn.net/Articles/621046/
1179
1180 % NOTE per \const{MS\_SLAVE},\const{MS\_SHARE}, \const{MS\_PRIVATE} e
1181 % \const{MS\_UNBINDABLE} dal 2.6.15 vedi shared subtrees, in particolare
1182 %  * http://lwn.net/Articles/159077/ e
1183 %  * Documentation/filesystems/sharedsubtree.txt
1184
1185 % TODO: (bassa priorità) non documentati ma presenti in sys/mount.h:
1186 %       * MS_POSIXACL
1187 %       * MS_KERNMOUNT
1188 %       * MS_I_VERSION
1189 %       * MS_ACTIVE
1190 %       * MS_NOUSER
1191
1192
1193 Una volta che non si voglia più utilizzare un certo filesystem è possibile
1194 ``\textsl{smontarlo}'' usando la funzione di sistema \funcd{umount}, il cui
1195 prototipo è:
1196
1197 \begin{funcproto}{
1198 \fhead{sys/mount.h}
1199 \fdecl{umount(const char *target)}
1200 \fdesc{Smonta un filesystem.} 
1201 }
1202 {La funzione ritorna  $0$ in caso di successo e $-1$ per un errore,
1203   nel qual caso \var{errno} assumerà uno dei valori: 
1204   \begin{errlist}
1205   \item[\errcode{EBUSY}] il filesystem è occupato.
1206   \item[\errcode{EINVAL}] \param{target} non è un \textit{mount point}.
1207   \item[\errcode{EPERM}] il processo non ha i privilegi di
1208     amministratore.\footnotemark 
1209   \end{errlist}
1210   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
1211   \errval{ENOENT}, \errval{ENOMEM} nel loro significato generico.  }
1212 \end{funcproto}
1213
1214 \footnotetext{più precisamente la capacità \const{CAP\_SYS\_ADMIN}, vedi
1215   sez.~\ref{sec:proc_capabilities}.}
1216
1217 La funzione prende il nome della directory su cui il filesystem è montato e
1218 non il file o il dispositivo che è stato montato,\footnote{questo è vero a
1219   partire dal kernel 2.3.99-pre7, prima esistevano due chiamate separate e la
1220   funzione poteva essere usata anche specificando il file di dispositivo.} in
1221 quanto a partire dai kernel della serie 2.4.x è possibile montare lo stesso
1222 dispositivo in più punti. Nel caso più di un filesystem sia stato montato
1223 sullo stesso \textit{mount point} viene smontato quello che è stato montato
1224 per ultimo. Si tenga presente che la funzione fallisce se il filesystem è
1225 ``\textsl{occupato}'', cioè quando ci sono ancora dei file aperti sul
1226 filesystem, se questo contiene la directory di lavoro (vedi
1227 sez.~\ref{sec:file_work_dir}) di un qualunque processo o il \textit{mount
1228   point} di un altro filesystem.
1229
1230 Linux provvede inoltre una seconda funzione di sistema, \funcd{umount2}, che
1231 consente un maggior controllo delle operazioni, come forzare lo smontaggio di
1232 un filesystem anche quando questo risulti occupato; il suo prototipo è:
1233
1234 \begin{funcproto}{
1235 \fhead{sys/mount.h}
1236 \fdecl{umount2(const char *target, int flags)}
1237 \fdesc{Smonta un filesystem.} 
1238 }
1239 {La funzione ritorna  $0$ in caso di successo e $-1$ per un errore,
1240   nel qual caso \var{errno} assumerà uno dei valori: 
1241   \begin{errlist}
1242      \item[\errcode{EAGAIN}] si è chiamata la funzione con \const{MNT\_EXPIRE}
1243        ed il filesystem non era occupato.
1244      \item[\errcode{EBUSY}] \param{target} è la directory di lavoro di qualche
1245        processo, o contiene dei file aperti, o un altro \textit{mount point}.
1246      \item[\errcode{EINVAL}] \param{target} non è un \textit{mount point} o si
1247        è usato \const{MNT\_EXPIRE} con \const{MNT\_FORCE} o
1248        \const{MNT\_DETACH} o si è specificato un flag non esistente.
1249   \end{errlist}
1250   e tutti gli altri valori visti per \func{umount} con lo stesso significato.}
1251 \end{funcproto}
1252
1253 Il valore di \param{flags} è una maschera binaria dei flag che controllano le
1254 modalità di smontaggio, che deve essere specificato con un OR aritmetico delle
1255 costanti illustrate in tab.~\ref{tab:umount2_flags}.  Specificando
1256 \constd{MNT\_FORCE} la funzione cercherà di liberare il filesystem anche se è
1257 occupato per via di una delle condizioni descritte in precedenza. A seconda
1258 del tipo di filesystem alcune (o tutte) possono essere superate, evitando
1259 l'errore di \errcode{EBUSY}. In tutti i casi prima dello smontaggio viene
1260 eseguita una sincronizzazione dei dati.
1261
1262 \begin{table}[!htb]
1263   \centering
1264   \footnotesize
1265   \begin{tabular}[c]{|l|p{8cm}|}
1266     \hline
1267     \textbf{Costante} & \textbf{Descrizione}\\
1268     \hline
1269     \hline
1270     \const{MNT\_FORCE}  & Forza lo smontaggio del filesystem anche se questo è
1271                            occupato (presente dai kernel della serie 2.2).\\
1272     \const{MNT\_DETACH} & Esegue uno smontaggio ``\textsl{pigro}'', in cui si
1273                            blocca l'accesso ma si aspetta che il filesystem si
1274                            liberi (presente dal kernel 2.4.11 e dalla
1275                            \acr{glibc} 2.11).\\ 
1276     \const{MNT\_EXPIRE} & Se non occupato marca un \textit{mount point} come
1277                            ``\textsl{in scadenza}'' in modo che ad una
1278                            successiva chiamata senza utilizzo del filesystem
1279                            questo venga smontato (presente dal 
1280                            kernel 2.6.8 e dalla \acr{glibc} 2.11).\\ 
1281     \const{UMOUNT\_NOFOLLOW}& Non dereferenzia \param{target} se questo è un
1282                                collegamento simbolico (vedi
1283                                sez.~\ref{sec:link_symlink_rename}) evitando
1284                                problemi di sicurezza (presente dal kernel
1285                                2.6.34).\\  
1286     \hline
1287   \end{tabular}
1288   \caption{Costanti che identificano i bit dell'argomento \param{flags}
1289     della funzione \func{umount2}.} 
1290   \label{tab:umount2_flags}
1291 \end{table}
1292
1293 Con l'opzione \constd{MNT\_DETACH} si richiede invece uno smontaggio
1294 ``\textsl{pigro}'' (o \textit{lazy umount}) in cui il filesystem diventa
1295 inaccessibile per i nuovi processi subito dopo la chiamata della funzione, ma
1296 resta accessibile per quelli che lo hanno ancora in uso e non viene smontato
1297 fintanto che resta occupato.
1298
1299 Con \constd{MNT\_EXPIRE}, che non può essere specificato insieme agli altri
1300 due, si marca il \textit{mount point} di un filesystem non occupato come
1301 ``\textsl{in scadenza}'', in tal caso \func{umount2} ritorna con un errore di
1302 \errcode{EAGAIN}, mentre in caso di filesystem occupato si sarebbe ricevuto
1303 \errcode{EBUSY}.  Una volta marcato, se nel frattempo non viene fatto nessun
1304 uso del filesystem, ad una successiva chiamata con \const{MNT\_EXPIRE} questo
1305 verrà smontato. Questo flag consente di realizzare un meccanismo che smonti
1306 automaticamente i filesystem che restano inutilizzati per un certo periodo di
1307 tempo.
1308
1309 Infine il flag \constd{UMOUNT\_NOFOLLOW} non dereferenzia \param{target} se
1310 questo è un collegamento simbolico (vedi
1311 sez.~\ref{sec:link_symlink_rename}). Questa è una misura di sicurezza
1312 introdotta per evitare, per quei filesystem per il quale è prevista una
1313 gestione diretta da parte degli utenti, come quelli basati su \itindex{FUSE}
1314 FUSE,\footnote{il \textit{Filesystem in USEr space} (FUSE) è una delle più
1315   interessanti applicazioni del VFS che consente, tramite un opportuno modulo,
1316   di implementarne le funzioni in \textit{user space}, così da rendere
1317   possibile l'implementazione di un qualunque filesystem (con applicazioni di
1318   grande interesse come il filesystem cifrato \textit{encfs} o il filesystem
1319   di rete \textit{sshfs}) che possa essere usato direttamente per conto degli
1320   utenti.}  che si possano passare ai programmi che effettuano lo smontaggio
1321 dei filesystem, che in genere sono privilegiati ma consentono di agire solo
1322 sui propri \textit{mount point}, dei collegamenti simbolici che puntano ad
1323 altri \textit{mount point}, ottenendo così la possibilità di smontare
1324 qualunque filesystem.
1325
1326
1327 Altre due funzioni di sistema specifiche di Linux,\footnote{esse si trovano
1328   anche su BSD, ma con una struttura diversa.} utili per ottenere in maniera
1329 diretta informazioni riguardo al filesystem su cui si trova un certo file,
1330 sono \funcd{statfs} e \funcd{fstatfs}, i cui prototipi sono:
1331
1332 \begin{funcproto}{
1333 \fhead{sys/vfs.h}
1334 \fdecl{int statfs(const char *path, struct statfs *buf)}
1335 \fdecl{int fstatfs(int fd, struct statfs *buf)}
1336 \fdesc{Restituiscono informazioni relative ad un filesystem.} 
1337 }
1338 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
1339   nel qual caso \var{errno} assumerà uno dei valori: 
1340   \begin{errlist}
1341   \item[\errcode{ENOSYS}] il filesystem su cui si trova il file specificato
1342     non supporta la funzione.
1343   \end{errlist} ed inoltre \errval{EFAULT} ed \errval{EIO} per entrambe,
1344   \errval{EBADF} per \func{fstatfs}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
1345   \errval{ENOENT}, \errval{EACCES}, \errval{ELOOP} per \func{statfs} nel loro
1346   significato generico.}
1347 \end{funcproto}
1348
1349 Queste funzioni permettono di ottenere una serie di informazioni generali
1350 riguardo al filesystem su cui si trova il file specificato con un
1351 \textit{pathname} per \func{statfs} e con un file descriptor (vedi
1352 sez.~\ref{sec:file_fd}) per \func{statfs}.  Le informazioni vengono restituite
1353 all'indirizzo \param{buf} di una struttura \struct{statfs} definita come in
1354 fig.~\ref{fig:sys_statfs}, ed i campi che sono indefiniti per il filesystem in
1355 esame sono impostati a zero.  I valori del campo \var{f\_type} sono definiti
1356 per i vari filesystem nei relativi file di header dei sorgenti del kernel da
1357 costanti del tipo \var{XXX\_SUPER\_MAGIC}, dove \var{XXX} in genere è il nome
1358 del filesystem stesso.
1359
1360 \begin{figure}[!htb]
1361   \footnotesize \centering
1362   \begin{minipage}[c]{0.8\textwidth}
1363     \includestruct{listati/statfs.h}
1364   \end{minipage}
1365   \normalsize 
1366   \caption{La struttura \structd{statfs}.} 
1367   \label{fig:sys_statfs}
1368 \end{figure}
1369
1370 \conffilebeg{/etc/mtab} 
1371
1372 La \acr{glibc} provvede infine una serie di funzioni per la gestione dei due
1373 file \conffiled{/etc/fstab}\footnote{più precisamente \funcm{setfsent},
1374   \funcm{getfsent}, \funcm{getfsfile}, \funcm{getfsspec}, \funcm{endfsent}.}
1375 ed \conffile{/etc/mtab}\footnote{più precisamente \funcm{setmntent},
1376   \funcm{getmntent},\funcm{getmntent\_r}, \funcm{addmntent},\funcm{endmntent},
1377   \funcm{hasmntopt}.} che convenzionalmente sono usati in quasi tutti i
1378 sistemi unix-like per mantenere rispettivamente le informazioni riguardo ai
1379 filesystem da montare e a quelli correntemente montati. Le funzioni servono a
1380 leggere il contenuto di questi file in opportune strutture \structd{fstab} e
1381 \structd{mntent}, e, nel caso di \conffile{/etc/mtab}, per inserire e
1382 rimuovere le voci presenti nel file.
1383
1384 In generale si dovrebbero usare queste funzioni, in particolare quelle
1385 relative a \conffile{/etc/mtab}, quando si debba scrivere un programma che
1386 effettua il montaggio di un filesystem. In realtà in questi casi è molto più
1387 semplice invocare direttamente il programma \cmd{mount}. Inoltre l'uso stesso
1388 di \conffile{/etc/mtab} è considerato una pratica obsoleta, in quanto se non
1389 aggiornato correttamente (cosa che è impossibile se la radice è montata in
1390 sola lettura) il suo contenuto diventa fuorviante.
1391
1392 Per questo motivo il suo utilizzo viene deprecato ed in molti casi viene già
1393 oggi sostituito da un collegamento simbolico a \procfile{/proc/mounts}, che
1394 contiene una versione degli stessi contenuti (vale a dire l'elenco dei
1395 filesystem montati) generata direttamente dal kernel, e quindi sempre
1396 disponibile e sempre aggiornata. Per questo motivo tralasceremo la
1397 trattazione, di queste funzioni, rimandando al manuale della \acr{glibc}
1398 \cite{GlibcMan} per la documentazione completa.
1399
1400 \conffileend{/etc/mtab}
1401
1402 % TODO (bassa priorità) scrivere delle funzioni (getfsent e getmntent &C)
1403 % TODO (bassa priorità) documentare ? swapon e swapoff (man 2 ...) 
1404
1405 % TODO con il 5.2 è stata introdotta una serie di nuove syscall per montare un
1406 % filesystem, vedi https://lwn.net/Articles/759499/ e
1407 % https://git.kernel.org/linus/f1b5618e013a 
1408
1409
1410 \section{La gestione di file e directory}
1411 \label{sec:file_dir}
1412
1413 In questa sezione esamineremo le funzioni usate per la manipolazione dei nomi
1414 file e directory, per la creazione di collegamenti simbolici e diretti, per la
1415 gestione e la lettura delle directory.  In particolare ci soffermeremo sulle
1416 conseguenze che derivano dalla architettura di un filesystem unix-like
1417 illustrata in sez.~\ref{sec:file_filesystem} per quanto attiene il
1418 comportamento e gli effetti delle varie funzioni. Tratteremo infine la
1419 directory di lavoro e le funzioni per la gestione di file speciali e
1420 temporanei.
1421
1422
1423 \subsection{La gestione dei nomi dei file}
1424 \label{sec:link_symlink_rename}
1425
1426 % \subsection{Le funzioni \func{link} e \func{unlink}}
1427 % \label{sec:file_link}
1428
1429 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
1430 dei nomi alternativi, come gli alias del vecchio MacOS o i collegamenti di
1431 Windows o i nomi logici del VMS, che permettono di fare riferimento allo
1432 stesso file chiamandolo con nomi diversi o accedendovi da directory diverse.
1433 Questo è possibile anche in ambiente Unix, dove un nome alternativo viene
1434 usualmente chiamato ``\textsl{collegamento}'' (o \textit{link}).  Data
1435 l'architettura del sistema riguardo la gestione dei file vedremo però che ci
1436 sono due metodi sostanzialmente diversi per fare questa operazione.
1437
1438 \itindbeg{hard~link}
1439 \index{collegamento!diretto|(}
1440
1441 In sez.~\ref{sec:file_filesystem} abbiamo spiegato come la capacità di
1442 chiamare un file con nomi diversi sia connaturata con l'architettura di un
1443 filesystem per un sistema Unix, in quanto il nome del file che si trova in una
1444 directory è solo un'etichetta associata ad un puntatore che permette di
1445 ottenere il riferimento ad un \textit{inode}, e che è quest'ultimo che viene
1446 usato dal kernel per identificare univocamente gli oggetti sul filesystem.
1447
1448 Questo significa che fintanto che si resta sullo stesso filesystem la
1449 realizzazione di un \textit{link} è immediata: uno stesso file può avere tanti
1450 nomi diversi, dati da altrettante associazioni diverse allo stesso
1451 \textit{inode} effettuate tramite ``etichette'' diverse in directory
1452 diverse. Si noti anche come nessuno di questi nomi possa assumere una
1453 particolare preferenza o originalità rispetto agli altri, in quanto tutti
1454 fanno comunque riferimento allo stesso \textit{inode} e quindi tutti
1455 otterranno lo stesso file.
1456
1457 Quando si vuole aggiungere ad una directory una voce che faccia riferimento ad
1458 un file già esistente come appena descritto, per ottenere quello che viene
1459 denominato ``\textsl{collegamento diretto}'' (o \textit{hard link}), si deve
1460 usare la funzione di sistema \funcd{link}, il cui prototipo è:
1461
1462 \begin{funcproto}{
1463 \fhead{unistd.h}
1464 \fdecl{int link(const char *oldpath, const char *newpath)}
1465 \fdesc{Crea un nuovo collegamento diretto (\textit{hard link}).} 
1466 }
1467 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1468   nel qual caso \var{errno} assumerà uno dei valori: 
1469   \begin{errlist}
1470   \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
1471     esiste già.
1472   \item[\errcode{EMLINK}] ci sono troppi collegamenti al file \param{oldpath}
1473     (il numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
1474     sez.~\ref{sec:sys_limits}).
1475   \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
1476     \param{newpath} non supporta i collegamenti diretti, è una directory o per
1477     \param{oldpath} non si rispettano i criteri per i \textit{protected
1478       hardlink}.\footnotemark 
1479   \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
1480     riferimento ad un filesystem montato sullo stesso 
1481     \textit{mount point}.
1482   \end{errlist} ed inoltre \errval{EACCES}, \errval{EDQUOT}, \errval{EFAULT},
1483   \errval{EIO}, \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1484   \errval{ENOMEM}, \errval{ENOSPC}, \errval{ENOTDIR}, \errval{EROFS} nel loro
1485   significato generico.}
1486 \end{funcproto}
1487
1488 \footnotetext{i \textit{protected hardlink} sono una funzionalità di
1489   protezione introdotta con il kernel 3.16 (si veda
1490   sez.~\ref{sec:procadv_security_misc} per i dettagli) che limita la capacità
1491   di creare un \textit{hard link} ad un file qualunque.}
1492
1493 La funzione crea in \param{newpath} un collegamento diretto al file indicato
1494 da \param{oldpath}. Per quanto detto la creazione di un nuovo collegamento
1495 diretto non copia il contenuto del file, ma si limita a creare la voce
1496 specificata da \param{newpath} nella directory corrispondente e l'unica
1497 proprietà del file che verrà modificata sarà il numero di riferimenti al file
1498 (il campo \var{i\_nlink} della struttura \kstruct{inode}, vedi
1499 fig.~\ref{fig:kstruct_inode}) che verrà aumentato di uno. In questo modo lo
1500 stesso file potrà essere acceduto sia con \param{newpath} che
1501 con \param{oldpath}.
1502
1503 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
1504 collegamento diretto è possibile solo se entrambi i \textit{pathname} sono
1505 nello stesso filesystem ed inoltre esso deve supportare gli \textit{hard link}
1506 (il meccanismo non è disponibile ad esempio con il filesystem \acr{vfat} di
1507 Windows). In realtà la funzione ha un ulteriore requisito, e cioè che non solo
1508 che i due file siano sullo stesso filesystem, ma anche che si faccia
1509 riferimento ad essi all'interno dello stesso \textit{mount point}.\footnote{si
1510   tenga presente infatti, come detto in sez.~\ref{sec:filesystem_mounting},
1511   che a partire dal kernel 2.4 uno stesso filesystem può essere montato più
1512   volte su directory diverse.}
1513 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
1514 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
1515 l'amministratore è in grado di creare un collegamento diretto ad un'altra
1516 directory: questo viene fatto perché con una tale operazione è possibile
1517 creare dei \textit{loop} nel filesystem (vedi fig.~\ref{fig:file_link_loop})
1518 la cui rimozione diventerebbe piuttosto complicata.\footnote{occorrerebbe
1519   infatti eseguire il programma \cmd{fsck} per riparare il filesystem, perché
1520   in caso di \textit{loop} la directory non potrebbe essere più svuotata,
1521   contenendo comunque se stessa, e quindi non potrebbe essere rimossa.}
1522
1523 Data la pericolosità di questa operazione, e visto che i collegamenti
1524 simbolici (che tratteremo a breve) ed i \textit{bind mount} (già visti in
1525 sez.~\ref{sec:filesystem_mounting}) possono fornire la stessa funzionalità
1526 senza questi problemi, nel caso di Linux questa capacità è stata completamente
1527 disabilitata, e al tentativo di creare un collegamento diretto ad una
1528 directory la funzione \func{link} restituisce sempre l'errore \errcode{EPERM}.
1529
1530 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
1531 \textit{hard link} ad un collegamento simbolico. In questo caso lo standard
1532 POSIX.1-2001 prevederebbe che quest'ultimo venga risolto e che il collegamento
1533 sia effettuato rispetto al file cui esso punta, e che venga riportato un
1534 errore qualora questo non esista o non sia un file. Questo era anche il
1535 comportamento iniziale di Linux ma a partire dai kernel della serie
1536 2.0.x\footnote{per la precisione il comportamento era quello previsto dallo
1537   standard POSIX fino al kernel di sviluppo 1.3.56, ed è stato temporaneamente
1538   ripristinato anche durante lo sviluppo della serie 2.1.x, per poi tornare al
1539   comportamento attuale fino ad oggi (per riferimento si veda
1540   \url{http://lwn.net/Articles/293902}).} è stato adottato un comportamento
1541 che non segue più lo standard per cui l'\textit{hard link} viene creato nei
1542 confronti del collegamento simbolico, e non del file cui questo punta. La
1543 revisione POSIX.1-2008 lascia invece il comportamento dipendente
1544 dall'implementazione, cosa che rende Linux conforme a questa versione
1545 successiva dello standard.
1546
1547 \itindbeg{symbolic~link}
1548 \index{collegamento!simbolico|(}
1549
1550 La ragione di questa differenza rispetto al vecchio standard, presente anche
1551 in altri sistemi unix-like, è dovuta al fatto che un collegamento simbolico
1552 può fare riferimento anche ad un file non esistente o a una directory, per i
1553 quali l'\textit{hard link} non può essere creato, per cui la scelta di seguire
1554 il collegamento simbolico è stata ritenuta una scelta scorretta nella
1555 progettazione dell'interfaccia.  Infatti se non ci fosse il comportamento
1556 adottato da Linux sarebbe impossibile creare un \textit{hard link} ad un
1557 collegamento simbolico, perché la funzione lo risolverebbe e l'\textit{hard
1558   link} verrebbe creato verso la destinazione. Invece evitando di seguire lo
1559 standard l'operazione diventa possibile, ed anche il comportamento della
1560 funzione risulta molto più comprensibile. Tanto più che se proprio se si vuole
1561 creare un \textit{hard link} rispetto alla destinazione di un collegamento
1562 simbolico è sempre possibile farlo direttamente.\footnote{ciò non toglie che
1563   questo comportamento possa causare problemi, come nell'esempio descritto
1564   nell'articolo citato nella nota precedente, a programmi che non si aspettano
1565   questa differenza rispetto allo standard POSIX.}
1566
1567 Dato che \func{link} crea semplicemente dei nomi che fanno riferimenti agli
1568 \textit{inode}, essa può funzionare soltanto per file che risiedono sullo
1569 stesso filesystem e solo per un filesystem di tipo Unix.  Inoltre abbiamo
1570 visto che in Linux non è consentito eseguire un collegamento diretto ad una
1571 directory.
1572
1573 Per ovviare a queste limitazioni, come accennato all'inizio, i sistemi
1574 unix-like supportano un'altra forma di collegamento, detta
1575 ``\textsl{collegamento simbolico}'' (o anche \textit{soft link} o
1576 \textit{symbolic link}). In questo caso si tratta, come avviene in altri
1577 sistemi operativi, di file speciali che contengono semplicemente il
1578 riferimento ad un altro file (o directory). In questo modo è possibile
1579 effettuare \textit{link} anche attraverso filesystem diversi, a file posti in
1580 filesystem che non supportano i collegamenti diretti, a delle directory, ed
1581 anche a file che non esistono ancora.
1582
1583 \itindend{hard~link}
1584 \index{collegamento!diretto|)}
1585
1586 Il meccanismo funziona in quanto i \textit{symbolic link} sono riconosciuti
1587 come tali dal kernel\footnote{è uno dei diversi tipi di file visti in
1588   tab.~\ref{tab:file_file_types}, contrassegnato come tale nell'\textit{inode}
1589   e riconoscibile dal valore del campo \var{st\_mode} della struttura
1590   \struct{stat} (vedi sez.~\ref{sec:file_stat}).} e tutta una serie di
1591 funzioni di sistema (come \func{open} o \func{stat}) quando ricevono come
1592 argomento il \textit{pathname} di un collegamento simbolico vanno
1593 automaticamente ad operare sul file da esso specificato. La funzione di
1594 sistema che permette di creare un nuovo collegamento simbolico è
1595 \funcd{symlink}, ed il suo prototipo è:
1596
1597 \begin{funcproto}{
1598 \fhead{unistd.h}
1599 \fdecl{int symlink(const char *oldpath, const char *newpath)}
1600 \fdesc{Crea un nuovo collegamento simbolico (\textit{symbolic link}).} 
1601 }
1602 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1603   nel qual caso \var{errno} assumerà uno dei valori: 
1604   \begin{errlist}
1605   \item[\errcode{EACCES}]  o non si hanno i permessi sulla directory in cui
1606     creare il \textit{link}.
1607   \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
1608   \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
1609     \param{oldpath} è una stringa vuota.
1610   \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
1611     supporta i collegamenti simbolici.
1612   \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
1613     lettura.
1614   \end{errlist} ed inoltre \errval{EDQUOT}, \errval{EFAULT}, \errval{EIO},
1615   \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOMEM}, \errval{ENOSPC} e
1616   \errval{ENOTDIR} nel loro significato generico.}
1617 \end{funcproto}
1618
1619
1620 La funzione crea un nuovo collegamento simbolico \param{newpath} che fa
1621 riferimento ad \param{oldpath}.  Si tenga presente che la funzione non
1622 effettua nessun controllo sull'esistenza di un file di nome \param{oldpath},
1623 ma si limita ad inserire il \textit{pathname} nel collegamento
1624 simbolico. Pertanto un collegamento simbolico può anche riferirsi ad un file
1625 che non esiste ed in questo caso si ha quello che viene chiamato un
1626 \itindex{dangling~link} \textit{dangling link}, letteralmente un
1627 \index{collegamento!ciondolante} ``\textsl{collegamento ciondolante}''. Ad
1628 esempio possiamo usare il comando \cmd{ln} per creare un collegamento
1629 simbolico nella nostra directory con:
1630 \begin{Console}
1631 piccardi@hain:~/gapil$ \textbf{ln -s /tmp/tmp_file symlink}
1632 \end{Console}
1633 %$
1634 e questo avrà successo anche se \file{/tmp/tmp\_file} non esiste:
1635 \begin{Console}
1636 piccardi@hain:~/gapil$ \textbf{ls symlink}
1637 symlink
1638 \end{Console}
1639 %$
1640 ma questo può generare confusione, perché accedendo in lettura a
1641 \file{symlink}, ad esempio con \cmd{cat}, otterremmo:
1642 \begin{Console}
1643 piccardi@hain:~/gapil$ \textbf{cat symlink}
1644 cat: symlink: No such file or directory
1645 \end{Console}
1646 %$
1647 con un errore che può sembrare sbagliato, dato che \cmd{ls} ci ha mostrato in
1648 precedenza l'esistenza di \file{symlink}. Se invece andassimo a scrivere su
1649 \file{symlink}, l'effetto sarebbe quello di ottenere la creazione di
1650 \file{/tmp/tmp\_file} (che a quel punto verrebbe creato) senza errori.
1651
1652 Come accennato i collegamenti simbolici sono risolti automaticamente dal
1653 kernel all'invocazione delle varie \textit{system call}. In
1654 tab.~\ref{tab:file_symb_effect} si è riportato un elenco dei comportamenti
1655 delle varie funzioni di sistema che operano sui file nei confronti della
1656 risoluzione dei collegamenti simbolici, specificando quali li seguono e quali
1657 invece possono operare direttamente sui loro contenuti.
1658 \begin{table}[htb]
1659   \centering
1660   \footnotesize
1661   \begin{tabular}[c]{|l|c|c|}
1662     \hline
1663     \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
1664     \hline 
1665     \hline 
1666     \func{access}   & $\bullet$ & --        \\
1667     \func{chdir}    & $\bullet$ & --        \\
1668     \func{chmod}    & $\bullet$ & --        \\
1669     \func{chown}    & --        & $\bullet$ \\
1670     \func{creat}    & $\bullet$ & --        \\
1671     \func{exec}     & $\bullet$ & --        \\
1672     \func{lchown}   & $\bullet$ & --        \\
1673     \func{link}\footnotemark & --        & $\bullet$ \\
1674     \func{lstat}    & --        & $\bullet$ \\
1675     \func{mkdir}    & $\bullet$ & --        \\
1676     \func{mkfifo}   & $\bullet$ & --        \\
1677     \func{mknod}    & $\bullet$ & --        \\
1678     \func{open}     & $\bullet$ & --        \\
1679     \func{opendir}  & $\bullet$ & --        \\
1680     \func{pathconf} & $\bullet$ & --        \\
1681     \func{readlink} & --        & $\bullet$ \\
1682     \func{remove}   & --        & $\bullet$ \\
1683     \func{rename}   & --        & $\bullet$ \\
1684     \func{stat}     & $\bullet$ & --        \\
1685     \func{truncate} & $\bullet$ & --        \\
1686     \func{unlink}   & --        & $\bullet$ \\
1687     \hline 
1688   \end{tabular}
1689   \caption{Uso dei collegamenti simbolici da parte di alcune funzioni.}
1690   \label{tab:file_symb_effect}
1691 \end{table}
1692
1693 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
1694   dallo standard POSIX.1-2001.}
1695
1696 Si noti che non si è specificato il comportamento delle funzioni che operano
1697 con i file descriptor (che tratteremo nel prossimo capitolo), in quanto la
1698 risoluzione del collegamento simbolico viene in genere effettuata dalla
1699 funzione che restituisce il file descriptor (normalmente la \func{open}, vedi
1700 sez.~\ref{sec:file_open_close}) e tutte le operazioni seguenti fanno
1701 riferimento solo a quest'ultimo.
1702
1703 Si tenga anche presente che a partire dal kernel 3.16, se si abilita la
1704 funzionalità dei \textit{protected symlinks} (attiva di default in tutte le
1705 distribuzioni più recenti) la risoluzione dei nomi attraverso un collegamento
1706 simbolico può fallire per una serie di restrizione di sicurezza aggiuntive
1707 imposte dal meccanismo (si consulti sez.~\ref{sec:procadv_security_misc} per i
1708 dettagli).
1709
1710 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
1711 \func{open} seguono i collegamenti simbolici, occorrono funzioni apposite per
1712 accedere alle informazioni del collegamento invece che a quelle del file a cui
1713 esso fa riferimento. Quando si vuole leggere il contenuto di un collegamento
1714 simbolico si usa la funzione di sistema \funcd{readlink}, il cui prototipo è:
1715
1716 \begin{funcproto}{
1717 \fhead{unistd.h}
1718 \fdecl{int readlink(const char *pathname, char *buff, size\_t size)}
1719 \fdesc{Legge il contenuto di un collegamento simbolico.} 
1720 }
1721 {La funzione ritorna il numero di caratteri letti dentro \param{buff} in caso
1722   di successo e $-1$ per un errore,  nel qual caso \var{errno} assumerà uno
1723   dei valori:
1724   \begin{errlist}
1725   \item[\errcode{EACCES}] non si hanno i permessi di attraversamento di una
1726     delle directory del pathname
1727   \item[\errcode{EINVAL}] \param{pathname} non è un collegamento simbolico
1728     o \param{size} non è positiva.
1729   \end{errlist} ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
1730   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}
1731   nel loro significato generico.}
1732 \end{funcproto}
1733
1734 La funzione legge il \textit{pathname} a cui fa riferimento il collegamento
1735 simbolico indicato dall'argomento \param{pathname} scrivendolo sul buffer
1736 \param{buff} di dimensione \param{size}. Si tenga presente che la funzione non
1737 termina la stringa con un carattere nullo e che se questa è troppo lunga la
1738 tronca alla dimensione specificata da \param{size} per evitare di scrivere
1739 dati oltre le dimensioni del buffer.
1740
1741 \begin{figure}[htb]
1742   \centering
1743   \includegraphics[width=8cm]{img/link_loop}
1744   \caption{Esempio di loop nel filesystem creato con un collegamento
1745     simbolico.}
1746   \label{fig:file_link_loop}
1747 \end{figure}
1748
1749 Come accennato uno dei motivi per cui non sono consentiti \textit{hard link}
1750 alle directory è che questi possono creare dei \textit{loop} nella risoluzione
1751 dei nomi che non possono essere eliminati facilmente. Invece è sempre
1752 possibile, ed in genere anche molto utile, creare un collegamento simbolico ad
1753 una directory, anche se in questo caso si potranno ottenere anche dei
1754 \textit{loop}.
1755
1756 La situazione è illustrata in fig.~\ref{fig:file_link_loop}, che riporta la
1757 struttura della directory \file{/boot}. Come si vede si è creato al suo
1758 interno un collegamento simbolico che punta di nuovo a
1759 \file{/boot}.\footnote{il \textit{loop} mostrato in
1760   fig.~\ref{fig:file_link_loop} è stato usato per poter permettere a al
1761   \textit{bootloader} \cmd{grub} di vedere i file contenuti nella directory
1762   \file{/boot} con lo stesso \textit{pathname} con cui verrebbero visti dal
1763   sistema operativo, anche quando si trovano, come accade spesso, su una
1764   partizione separata (che \cmd{grub} all'avvio vedrebbe come \file{/}).} Un
1765 \textit{loop} di di questo tipo però può causare problemi per tutti i
1766 programmi che effettuano la scansione di una directory, e ad esempio se
1767 lanciassimo un comando come \code{grep -r linux *}, il \textit{loop} nella
1768 directory porterebbe ad esaminare \file{/boot}, \file{/boot/boot},
1769 \file{/boot/boot/boot} e così via.
1770
1771 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
1772 un \textit{pathname} possano essere seguiti fino ad un certo numero massimo di
1773 collegamenti simbolici, il cui valore limite è specificato dalla costante
1774 \constd{MAXSYMLINKS}. Se il limite viene superato si ha un errore ed
1775 \var{errno} viene impostata al valore \errcode{ELOOP}, che nella quasi
1776 totalità dei casi indica appunto che si è creato un collegamento simbolico che
1777 fa riferimento ad una directory del suo stesso \textit{pathname}.
1778
1779
1780 \itindend{symbolic~link}
1781 \index{collegamento!simbolico|)}
1782
1783 Un'altra funzione relativa alla gestione dei nomi dei file, anche se a prima
1784 vista parrebbe riguardare un argomento completamente diverso, è quella per la
1785 cancellazione di un file. In realtà una \textit{system call} che serva proprio
1786 a cancellare un file non esiste neanche perché, come accennato in
1787 sez.~\ref{sec:file_filesystem}, quando in un sistema unix-like si richiede la
1788 rimozione di un file, quello che si va a cancellare è soltanto la voce che
1789 referenzia il suo \textit{inode} all'interno di una directory.
1790
1791 La funzione di sistema che consente di effettuare questa operazione, il cui
1792 nome come si può notare ha poco a che fare con il concetto di rimozione, è
1793 \funcd{unlink}, ed il suo prototipo è:
1794
1795 \begin{funcproto}{
1796 \fhead{unistd.h}
1797 \fdecl{int unlink(const char *pathname)}
1798 \fdesc{Cancella un file.} 
1799 }
1800 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1801   nel qual caso \var{errno} assumerà uno dei valori:\footnotemark  
1802   \begin{errlist}
1803   \item[\errcode{EACCES}] non si ha il permesso di scrittura sulla directory
1804     che contiene \param{pathname} o quello di attraversamento per una delle
1805     directory superiori.
1806   \item[\errcode{EBUSY}] \param{pathname} non può essere rimosso perché è in
1807     uso da parte del sistema (in particolare per i cosiddetti \textit{silly
1808       renames} di NFS).
1809   \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una
1810     directory.
1811   \item[\errcode{EPERM}] il filesystem non consente l'operazione, o la
1812     directory che contiene \param{pathname} ha lo \textit{sticky bit} e non si
1813     è il proprietario del file o non si hanno privilegi amministrativi. 
1814   \end{errlist} ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
1815   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EROFS} nel loro
1816   significato generico.}
1817 \end{funcproto}
1818
1819 \footnotetext{questa funzione su Linux ha alcune peculiarità nei codici di
1820   errore, in particolare riguardo la rimozione delle directory che non è mai
1821   permessa e che causa l'errore \errcode{EISDIR}; questo è un valore specifico
1822   di Linux non conforme allo standard POSIX che prescrive invece l'uso di
1823   \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
1824   abbia privilegi sufficienti, valore che invece Linux usa anche se il
1825   filesystem non supporta la funzione, inoltre il codice \errcode{EBUSY} nel
1826   caso la directory sia occupata su Linux non esiste.}
1827
1828 La funzione elimina il nome specificato dall'argomento \param{pathname} nella
1829 directory che lo contiene e decrementa il numero di riferimenti nel relativo
1830 \textit{inode}; come per \func{link} queste due operazioni sono effettuate
1831 all'interno della \textit{system call} in maniera atomica rispetto ai
1832 processi.
1833
1834 Si ricordi che, anche se se ne è rimosso il nome, un file viene realmente
1835 cancellato soltanto quando il numero di collegamenti mantenuto
1836 nell'\textit{inode} diventa nullo; solo allora l'\textit{inode} viene
1837 disallocato e lo spazio che il file occupava sul disco viene liberato.
1838
1839 Si tenga presente comunque che a questo si aggiunge sempre un'ulteriore
1840 condizione e cioè che non ci siano processi che stiano ancora lavorando sul il
1841 file. Come vedremo in sez.~\ref{sec:file_unix_interface} il kernel una tabella
1842 di tutti file aperti da ciascun processo, che a sua volta contiene i
1843 riferimenti agli \textit{inode} ad essi relativi. Prima di procedere alla
1844 cancellazione dello spazio occupato su disco dal contenuto di un file il
1845 kernel controlla anche questa tabella, per verificare che anche in essa non ci
1846 sia più nessun riferimento all'\textit{inode} in questione, assicurandosi con
1847 questo che nessun processo stia ancora usando il file.
1848
1849 Nel caso di socket, \textit{fifo} o file di dispositivo la funzione rimuove il
1850 nome, e come per i file normali i processi che hanno aperto uno di questi
1851 oggetti possono continuare ad utilizzarli.  Nel caso di cancellazione di un
1852 \textit{link} simbolico, che consiste solo nel rimando ad un altro file,
1853 questo viene immediatamente eliminato e non sarà più utilizzabile. 
1854
1855 Per cancellare una voce in una directory è necessario avere il permesso di
1856 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
1857 il diritto di esecuzione/attraversamento sulla directory che la contiene
1858 (affronteremo in dettaglio l'argomento dei permessi di file e directory in
1859 sez.~\ref{sec:file_access_control}). Se inoltre per la directory è impostato
1860 lo \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}), occorrerà
1861 anche essere proprietari del file o proprietari della directory o avere i
1862 privilegi di amministratore.
1863
1864 Questa caratteristica del sistema, che consente di usare un file anche se lo
1865 si è ``cancellato'', può essere usata per essere sicuri di non lasciare file
1866 temporanei su disco in caso di uscita imprevista di un programma. La tecnica è
1867 quella di aprire un nuovo file e chiamare \func{unlink} su di esso subito
1868 dopo, in questo modo il contenuto del file sarà sempre disponibile all'interno
1869 del processo attraverso il suo file descriptor (vedi sez.~\ref{sec:file_fd}),
1870 ma non ne resterà traccia in nessuna directory, inoltre lo spazio occupato su
1871 disco verrà immediatamente rilasciato alla conclusione del processo, quando
1872 tutti i file vengono chiusi.
1873
1874 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
1875 la funzione \func{unlink} sulle directory, che in tal caso fallisce con un
1876 errore di \errcode{EISDIR}. Per cancellare una directory si deve usare la
1877 apposita funzione di sistema \func{rmdir} (che vedremo in
1878 sez.~\ref{sec:file_dir_creat_rem}), oppure la funzione \func{remove}.
1879
1880 Quest'ultima è la funzione prevista dallo standard ANSI C per effettuare una
1881 cancellazione generica di un file o di una directory e viene usata in generale
1882 anche per i sistemi operativi che non supportano gli \textit{hard link}. Nei
1883 sistemi unix-like \funcd{remove} è equivalente ad usare in maniera trasparente
1884 \func{unlink} per i file ed \func{rmdir} per le directory; il suo prototipo è:
1885
1886 \begin{funcproto}{
1887 \fhead{stdio.h}
1888 \fdecl{int remove(const char *pathname)}
1889 \fdesc{Cancella un file o una directory.} 
1890 }
1891 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1892   caso \var{errno} assumerà uno dei valori relativi alla chiamata utilizzata,
1893   pertanto si può fare riferimento a quanto illustrato nelle descrizioni di
1894   \func{unlink} e \func{rmdir}.}
1895 \end{funcproto}
1896
1897 La funzione utilizza la funzione \func{unlink} per cancellare i file (e si
1898 applica anche a link simbolici, socket, \textit{fifo} e file di dispositivo) e
1899 la funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}) per
1900 cancellare le directory.\footnote{questo vale usando la \acr{glibc}; nella
1901   \acr{libc4} e nella \acr{libc5} la funzione \func{remove} era un semplice
1902   alias alla funzione \func{unlink} e quindi non poteva essere usata per le
1903   directory.}  Si tenga presente che, per alcune limitazioni del protocollo
1904 NFS, utilizzare questa funzione su file che usano questo filesystem di rete
1905 può comportare la scomparsa di file ancora in uso.
1906
1907 Infine per cambiare nome ad un file o a una directory si usa la funzione di
1908 sistema \funcd{rename},\footnote{la funzione è definita dallo standard ANSI C,
1909   ma si applica solo per i file, lo standard POSIX estende la funzione anche
1910   alle directory.} il cui prototipo è:
1911
1912 \begin{funcproto}{
1913 \fhead{stdio.h}
1914 \fdecl{int rename(const char *oldpath, const char *newpath)}
1915 \fdesc{Rinomina un file o una directory.} 
1916 }
1917 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1918   nel qual caso \var{errno} assumerà uno dei valori: 
1919   \begin{errlist}
1920   \item[\errcode{EACCESS}] manca il permesso di scrittura sulle directory
1921     contenenti \param{oldpath} e \param{newpath} o di attraversare 
1922     il loro \textit{pathname} o di scrivere su \param{newpath}
1923     se questa è una directory.
1924   \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
1925     parte di qualche processo (come directory di lavoro o come radice) o del
1926     sistema (come \textit{mount point}) ed il sistema non riesce a risolvere
1927     la situazione.
1928   \item[\errcode{EEXIST}] \param{newpath} è una directory già esistente e
1929     non è vuota (anche \errcode{ENOTEMPTY}).
1930   \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
1931     \param{oldpath} o più in generale si è cercato di creare una directory come
1932     sotto-directory di sé stessa.
1933   \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
1934     \param{oldpath} non è una directory.
1935   \item[\errcode{ENOTDIR}] uno dei componenti dei \textit{pathname} non è una
1936     directory o \param{oldpath} è una directory e 
1937     \param{newpath} esiste e non è una directory.
1938   \item[\errval{EPERM}] la directory contenente \param{oldpath} o quella
1939     contenente un \param{newpath} esistente hanno lo \textit{sticky bit} e non
1940     si è i proprietari dei rispettivi file (o non si hanno privilegi
1941     amministrativi) oppure il filesystem non supporta l'operazione. 
1942   \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
1943     stesso filesystem e sotto lo stesso \textit{mount point}. 
1944   \end{errlist} ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{EMLINK},
1945   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOSPC} e
1946   \errval{EROFS} nel loro significato generico.}
1947 \end{funcproto}
1948
1949 La funzione rinomina in \param{newpath} il file o la directory indicati
1950 dall'argomento \param{oldpath}. Il nome viene eliminato nella directory
1951 originale e ricreato nella directory di destinazione mantenendo il riferimento
1952 allo stesso \textit{inode}. Non viene spostato nessun dato e l'\textit{inode}
1953 del file non subisce nessuna modifica in quanto le modifiche sono eseguite
1954 sulle directory che contengono \param{newpath} ed \param{oldpath}.
1955
1956 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
1957 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
1958 c'è modifica, per quanto temporanea, al \textit{link count} del file e non può
1959 esistere un istante in cui un altro processo possa trovare attivi entrambi i
1960 nomi per lo stesso file se la destinazione non esiste o in cui questa sparisca
1961 temporaneamente se già esiste.
1962
1963 Dato che opera in maniera analoga la funzione è soggetta alle stesse
1964 restrizioni di \func{link}, quindi è necessario che \param{oldpath}
1965 e \param{newpath} siano nello stesso filesystem e facciano riferimento allo
1966 stesso \textit{mount point}, e che il filesystem supporti questo tipo di
1967 operazione. Qualora questo non avvenga si dovrà effettuare l'operazione in
1968 maniera non atomica copiando il file a destinazione e poi cancellando
1969 l'originale.
1970
1971 Il comportamento della funzione è diverso a seconda che si voglia rinominare
1972 un file o una directory. Se ci riferisce ad un file allora \param{newpath}, se
1973 esiste, non deve essere una directory, altrimenti si avrà un errore di
1974 \errcode{EISDIR}. Se \param{newpath} indica un file già esistente questo verrà
1975 rimpiazzato atomicamente, ma nel caso in cui \func{rename} fallisca il kernel
1976 assicura che esso non sarà toccato. I caso di sovrascrittura però potrà
1977 esistere una breve finestra di tempo in cui sia \param{oldpath}
1978 che \param{newpath} potranno fare entrambi riferimento al file che viene
1979 rinominato.
1980
1981 Se \param{oldpath} è una directory allora \param{newpath}, se esistente, deve
1982 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
1983 (se non è una directory) o \errcode{ENOTEMPTY} o \errcode{EEXIST} (se non è
1984 vuota). Chiaramente \param{newpath} non potrà contenere \param{oldpath} nel
1985 suo \textit{pathname}, non essendo possibile rendere una directory una
1986 sottodirectory di sé stessa, se questo fosse il caso si otterrebbe un errore
1987 di \errcode{EINVAL}.
1988
1989 Se \param{oldpath} si riferisce ad un collegamento simbolico questo sarà
1990 rinominato restando tale senza nessun effetto sul file a cui fa riferimento.
1991 Se invece \param{newpath} esiste ed è un collegamento simbolico verrà
1992 cancellato come qualunque altro file.  Infine qualora \param{oldpath}
1993 e \param{newpath} siano due nomi che già fanno riferimento allo stesso file lo
1994 standard POSIX prevede che la funzione non ritorni un errore, e semplicemente
1995 non faccia nulla, lasciando entrambi i nomi.  Linux segue questo standard,
1996 anche se, come fatto notare dal manuale della \acr{glibc}, il comportamento
1997 più ragionevole sarebbe quello di cancellare \param{oldpath}.
1998
1999 In tutti i casi si dovranno avere i permessi di scrittura nelle directory
2000 contenenti \param{oldpath} e \param{newpath}, e nel caso \param{newpath} sia
2001 una directory vuota già esistente anche su di essa (perché dovrà essere
2002 aggiornata la voce ``\texttt{..}''). Se poi le directory
2003 contenenti \param{oldpath} o \param{newpath} hanno lo \textit{sticky bit}
2004 attivo (vedi sez.~\ref{sec:file_special_perm}) si dovrà essere i proprietari
2005 dei file (o delle directory) che si vogliono rinominare, o avere i permessi di
2006 amministratore.
2007
2008
2009 \subsection{La creazione e la cancellazione delle directory} 
2010 \label{sec:file_dir_creat_rem}
2011
2012 Benché in sostanza le directory non siano altro che dei file contenenti
2013 elenchi di nomi con riferimenti ai rispettivi \textit{inode}, non è possibile
2014 trattarle come file ordinari e devono essere create direttamente dal kernel
2015 attraverso una opportuna \textit{system call}.\footnote{questo è quello che
2016   permette anche, attraverso l'uso del VFS, l'utilizzo di diversi formati per
2017   la gestione dei suddetti elenchi, dalle semplici liste a strutture complesse
2018   come alberi binari, hash, ecc. che consentono una ricerca veloce quando il
2019   numero di file è molto grande.}  La funzione di sistema usata per creare una
2020 directory è \funcd{mkdir}, ed il suo prototipo è:
2021
2022 \begin{funcproto}{
2023 \fhead{sys/stat.h}
2024 \fhead{sys/types.h}
2025 \fdecl{int mkdir(const char *dirname, mode\_t mode)}
2026 \fdesc{Crea una nuova directory.} 
2027 }
2028 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2029   caso \var{errno} assumerà uno dei valori: 
2030   \begin{errlist}
2031   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
2032     cui si vuole inserire la nuova directory o di attraversamento per le
2033     directory al di sopra di essa.
2034   \item[\errcode{EEXIST}] un file o una directory o un collegamento simbolico
2035     con quel nome esiste già.
2036   \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
2037     directory contiene troppi file; sotto Linux questo normalmente non avviene
2038     perché il filesystem standard consente la creazione di un numero di file
2039     maggiore di quelli che possono essere contenuti nel disco, ma potendo
2040     avere a che fare anche con filesystem di altri sistemi questo errore può
2041     presentarsi.
2042   \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
2043     la nuova directory o si è esaurita la quota disco dell'utente.
2044   \end{errlist}
2045   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
2046   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EPERM},
2047   \errval{EROFS} nel loro significato generico.}
2048 \end{funcproto}
2049
2050 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
2051 standard presenti in ogni directory (``\file{.}'' e ``\file{..}''), con il
2052 nome indicato dall'argomento \param{dirname}. 
2053
2054 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
2055 directory viene creata sono specificati dall'argomento \param{mode}, i cui
2056 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
2057 tenga presente che questi sono modificati dalla maschera di creazione dei file
2058 (si veda sez.~\ref{sec:file_perm_management}).  La titolarità della nuova
2059 directory è impostata secondo quanto illustrato in
2060 sez.~\ref{sec:file_ownership_management}.
2061
2062 Come accennato in precedenza per eseguire la cancellazione di una directory è
2063 necessaria una specifica funzione di sistema, \funcd{rmdir}, il suo prototipo
2064 è:
2065
2066 \begin{funcproto}{
2067 \fhead{sys/stat.h}
2068 \fdecl{int rmdir(const char *dirname)}
2069 \fdesc{Cancella una directory.} 
2070 }
2071 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2072   caso \var{errno} assumerà uno dei valori: 
2073   \begin{errlist}
2074   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
2075     che contiene la directory che si vuole cancellare, o non c'è il permesso
2076     di attraversare (esecuzione) una delle directory specificate in
2077     \param{dirname}.
2078   \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o
2079     la radice di qualche processo o un \textit{mount point}.
2080   \item[\errcode{EINVAL}] si è usato ``\texttt{.}'' come ultimo componente
2081     di \param{dirname}.
2082   \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
2083     directory, oppure la directory che contiene \param{dirname} ha lo
2084     \textit{sticky bit} impostato e non si è i proprietari della directory o
2085     non si hanno privilegi amministrativi.
2086   \end{errlist}
2087   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
2088   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errcode{ENOTEMPTY} e
2089   \errval{EROFS} nel loro significato generico.}
2090 \end{funcproto}
2091
2092
2093 La funzione cancella la directory \param{dirname}, che deve essere vuota, la
2094 directory deve cioè contenere le due voci standard ``\file{.}'' e
2095 ``\file{..}'' e niente altro.  Il nome può essere indicato con un
2096 \textit{pathname} assoluto o relativo, ma si deve fare riferimento al nome
2097 nella directory genitrice, questo significa che \textit{pathname} terminanti
2098 in ``\file{.}'' e ``\file{..}'' anche se validi in altri contesti, causeranno
2099 il fallimento della funzione.
2100
2101 Inoltre per eseguire la cancellazione, oltre ad essere vuota, occorre anche
2102 che la directory non sia utilizzata, questo vuol dire anche che non deve
2103 essere la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}) o la
2104 directory radice (vedi sez.~\ref{sec:file_chroot}) di nessun processo, od
2105 essere utilizzata come \textit{mount point}.
2106
2107 Se la directory cancellata risultasse aperta in qualche processo per una
2108 lettura dei suoi contenuti (vedi sez.~\ref{sec:file_dir_read}), pur
2109 scomparendo dal filesystem e non essendo più possibile accedervi o crearvi
2110 altri file, le risorse ad essa associate verrebbero disallocate solo alla
2111 chiusura di tutti questi ulteriori riferimenti.
2112
2113
2114 \subsection{Lettura e scansione delle directory}
2115 \label{sec:file_dir_read}
2116
2117 Benché le directory alla fine non siano altro che dei file che contengono
2118 delle liste di nomi associati ai relativi \textit{inode}, per il ruolo che
2119 rivestono nella struttura del sistema non possono essere trattate come dei
2120 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
2121 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
2122 può essere un processo a inserirvi direttamente delle voci con le usuali
2123 funzioni di scrittura.
2124
2125 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
2126 kernel, sono molte le situazioni in cui i processi necessitano di poterne
2127 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
2128 in sez.~\ref{sec:file_open_close} che è possibile aprire una directory come se
2129 fosse un file, anche se solo in sola lettura) in generale il formato con cui
2130 esse sono scritte può dipendere dal tipo di filesystem, tanto che, come
2131 riportato in tab.~\ref{tab:file_file_operations}, il VFS prevede una apposita
2132 funzione per la lettura delle directory.
2133
2134 \itindbeg{directory~stream}
2135
2136 Tutto questo si riflette nello standard POSIX\footnote{le funzioni erano
2137   presenti in SVr4 e 4.3BSD, la loro specifica è riportata in POSIX.1-2001.}
2138 che ha introdotto una apposita interfaccia per la lettura delle directory,
2139 basata sui cosiddetti \textit{directory stream}, chiamati così per l'analogia
2140 con i \textit{file stream} dell'interfaccia standard ANSI C che vedremo in
2141 sez.~\ref{sec:files_std_interface}. La prima funzione di questa interfaccia è
2142 \funcd{opendir}, il cui prototipo è:
2143
2144 \begin{funcproto}{
2145 \fhead{sys/types.h}
2146 \fhead{dirent.h}
2147 \fdecl{DIR *opendir(const char *dirname)}
2148 \fdesc{Apre un \textit{directory stream}.} 
2149 }
2150 {La funzione ritorna un puntatore al \textit{directory stream} in caso di
2151   successo e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
2152   dei valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
2153   \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR} nel loro significato
2154   generico.}
2155 \end{funcproto}
2156
2157 La funzione apre un \textit{directory stream} per la directory
2158 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \typed{DIR} (che
2159 è il tipo opaco usato dalle librerie per gestire i \textit{directory stream})
2160 da usare per tutte le operazioni successive, la funzione inoltre posiziona lo
2161 \textit{stream} sulla prima voce contenuta nella directory.
2162
2163 Si tenga presente che comunque la funzione opera associando il
2164 \textit{directory stream} ad un opportuno file descriptor (vedi
2165 sez.~\ref{sec:file_fd}) sottostante, sul quale vengono compiute le
2166 operazioni. Questo viene sempre aperto impostando il flag di
2167 \textit{close-on-exec} (si ricordi quanto detto in sez.~\ref{sec:proc_exec}),
2168 così da evitare che resti aperto in caso di esecuzione di un altro programma.
2169
2170 Nel caso in cui sia necessario conoscere il file descriptor associato ad un
2171 \textit{directory stream} si può usare la funzione
2172 \funcd{dirfd},\footnote{questa funzione è una estensione introdotta con BSD
2173   4.3-Reno ed è presente in Linux con le libc5 (a partire dalla versione
2174   5.1.2) e con la \acr{glibc} ma non presente in POSIX fino alla revisione
2175   POSIX.1-2008, per questo per poterla utilizzare fino alla versione 2.10
2176   della \acr{glibc} era necessario definire le macro \macro{\_BSD\_SOURCE} o
2177   \macro{\_SVID\_SOURCE}, dalla versione 2.10 si possono usare anche
2178   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o
2179   \texttt{\macro{\_XOPEN\_SOURCE} >= 700}.}  il cui prototipo è:
2180
2181 \begin{funcproto}{
2182 \fhead{sys/types.h}
2183 \fhead{dirent.h}
2184 \fdecl{int dirfd(DIR *dir)}
2185 \fdesc{Legge il file descriptor associato ad un \textit{directory stream}.} 
2186 }
2187 {La funzione ritorna un valore positivo corrispondente al file descriptor in
2188   caso di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà
2189   uno dei valori:
2190   \begin{errlist}
2191   \item[\errcode{EINVAL}] \param{dir} non è un puntatore ad un
2192     \textit{directory stream}. 
2193   \item[\errcode{ENOTSUP}] l'implementazione non supporta l'uso di un file
2194     descriptor per la directory.
2195   \end{errlist}
2196 }
2197 \end{funcproto}
2198
2199 La funzione restituisce il file descriptor associato al \textit{directory
2200   stream} \param{dir}. Di solito si utilizza questa funzione in abbinamento a
2201 funzioni che operano sui file descriptor, ad esempio si potrà usare
2202 \func{fstat} per ottenere le proprietà della directory, o \func{fchdir} per
2203 spostare su di essa la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}).
2204
2205 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
2206 possibile associarvi un \textit{directory stream} con la funzione
2207 \funcd{fdopendir},\footnote{questa funzione è però disponibile solo a partire
2208   dalla versione 2.4 della \acr{glibc}, ed è stata introdotta nello standard
2209   POSIX solo a partire dalla revisione POSIX.1-2008, prima della versione 2.10
2210   della \acr{glibc} per poterla utilizzare era necessario definire la macro
2211   \macro{\_GNU\_SOURCE}, dalla versione 2.10 si possono usare anche
2212   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o \texttt{\_XOPEN\_SOURCE >=
2213     700} .}  il cui prototipo è:
2214
2215 \begin{funcproto}{
2216 \fhead{sys/types.h}
2217 \fhead{dirent.h}
2218 \fdecl{DIR *fdopendir(int fd)}
2219 \fdesc{Associa un \textit{directory stream} ad un file descriptor.} 
2220 }
2221 {La funzione ritorna un puntatore al \textit{directory stream} in caso di
2222   successo e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
2223   dei valori \errval{EBADF} o \errval{ENOMEM} nel loro significato generico.}
2224 \end{funcproto}
2225
2226 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
2227   stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
2228 stato aperto in precedenza; la funzione darà un errore qualora questo non
2229 corrisponda ad una directory. L'uso di questa funzione permette di rispondere
2230 agli stessi requisiti delle funzioni ``\textit{at}'' che vedremo in
2231 sez.~\ref{sec:file_openat}.
2232
2233 Una volta utilizzata il file descriptor verrà usato internamente dalle
2234 funzioni che operano sul \textit{directory stream} e non dovrà essere più
2235 utilizzato all'interno del proprio programma. In particolare dovrà essere
2236 chiuso attraverso il \textit{directory stream} con \func{closedir} e non
2237 direttamente. Si tenga presente inoltre che \func{fdopendir} non modifica lo
2238 stato di un eventuale flag di \textit{close-on-exec}, che pertanto dovrà
2239 essere impostato esplicitamente in fase di apertura del file descriptor.
2240
2241 Una volta che si sia aperto un \textit{directory stream} la lettura del
2242 contenuto della directory viene effettuata attraverso la funzione
2243 \funcd{readdir}, il cui prototipo è:
2244
2245 \begin{funcproto}{
2246 \fhead{sys/types.h}
2247 \fhead{dirent.h}
2248 \fdecl{struct dirent *readdir(DIR *dir)}
2249 \fdesc{Legge una voce dal \textit{directory stream}.} 
2250 }
2251 {La funzione ritorna il puntatore alla struttura contenente i dati in caso di
2252   successo e \val{NULL} per un errore o se si è raggiunta la fine dello
2253   \textit{stream}. Il solo codice di errore restituito in \var{errno} è
2254   \errval{EBADF} qualora \param{dir} non indichi un \textit{directory stream}
2255   valido.}
2256 \end{funcproto}
2257
2258 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
2259 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
2260 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
2261 esaurite tutte le voci in essa presenti, che viene segnalata dalla
2262 restituzione di \val{NULL} come valore di ritorno. Si può distinguere questa
2263 condizione da un errore in quanto in questo caso \var{errno} non verrebbe
2264 modificata.
2265
2266 I dati letti da \func{readdir} vengono memorizzati in una struttura
2267 \struct{dirent}, la cui definizione è riportata in
2268 fig.~\ref{fig:file_dirent_struct}.\footnote{la definizione è quella usata da
2269   Linux, che si trova nel file \file{/usr/include/bits/dirent.h}, essa non
2270   contempla la presenza del campo \var{d\_namlen} che indica la lunghezza del
2271   nome del file.} La funzione non è rientrante e restituisce il puntatore ad
2272 una struttura allocata staticamente, che viene sovrascritta tutte le volte che
2273 si ripete la lettura di una voce sullo stesso \textit{directory stream}.
2274
2275 Di questa funzione esiste anche una versione rientrante,
2276 \funcd{readdir\_r},\footnote{per usarla è necessario definire una qualunque
2277   delle macro \texttt{\macro{\_POSIX\_C\_SOURCE} >= 1},
2278   \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
2279   \macro{\_POSIX\_SOURCE}.} che non usa una struttura allocata staticamente, e
2280 può essere utilizzata anche con i \textit{thread}, il suo prototipo è:
2281
2282 \begin{funcproto}{
2283 \fhead{sys/types.h}
2284 \fhead{dirent.h}
2285 \fdecl{int readdir\_r(DIR *dir, struct dirent *entry, struct dirent **result)}
2286 \fdesc{Legge una voce dal \textit{directory stream}.} 
2287 }
2288 {La funzione ritorna $0$ in caso di successo ed un numero positivo per un
2289   errore, nel qual caso \var{errno} assumerà gli stessi valori di
2290   \func{readdir}.} 
2291 \end{funcproto}
2292
2293 La funzione restituisce in \param{result} come \textit{value result argument}
2294 l'indirizzo della struttura \struct{dirent} dove sono stati salvati i dati,
2295 che deve essere allocata dal chiamante, ed il cui indirizzo deve essere
2296 indicato con l'argomento \param{entry}.  Se si è raggiunta la fine del
2297 \textit{directory stream} invece in \param{result} viene restituito il valore
2298 \val{NULL}.
2299
2300 \begin{figure}[!htb]
2301   \footnotesize \centering
2302   \begin{minipage}[c]{0.8\textwidth}
2303     \includestruct{listati/dirent.c}
2304   \end{minipage} 
2305   \normalsize 
2306   \caption{La struttura \structd{dirent} per la lettura delle informazioni dei 
2307     file.}
2308   \label{fig:file_dirent_struct}
2309 \end{figure}
2310
2311 % Lo spazio per la \struct{dirent} dove vengono restituiti i dati della
2312 % directory deve essere allocato a cura del chiamante, dato che la dimensione
2313
2314
2315 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
2316 presenti nella directory. Sia BSD che SVr4 che POSIX.1-2001\footnote{il
2317   vecchio standard POSIX prevedeva invece solo la presenza del campo
2318   \var{d\_fileno}, identico \var{d\_ino}, che in Linux era definito come alias
2319   di quest'ultimo, mentre il campo \var{d\_name} era considerato dipendente
2320   dall'implementazione.}  prevedono che siano sempre presenti il campo
2321 \var{d\_name}, che contiene il nome del file nella forma di una stringa
2322 terminata da uno zero, ed il campo \var{d\_ino}, che contiene il numero di
2323 \textit{inode} cui il file è associato e corrisponde al campo \var{st\_ino} di
2324 \struct{stat}.  La presenza di ulteriori campi opzionali oltre i due citati è
2325 segnalata dalla definizione di altrettante macro nella forma
2326 \code{\_DIRENT\_HAVE\_D\_XXX} dove \code{XXX} è il nome del relativo
2327 campo. Come si può evincere da fig.~\ref{fig:file_dirent_struct} nel caso di
2328 Linux sono pertanto definite le macro \macrod{\_DIRENT\_HAVE\_D\_TYPE},
2329 \macrod{\_DIRENT\_HAVE\_D\_OFF} e \macrod{\_DIRENT\_HAVE\_D\_RECLEN}, mentre non
2330 è definita la macro \macrod{\_DIRENT\_HAVE\_D\_NAMLEN}.
2331
2332 Dato che possono essere presenti campi opzionali e che lo standard
2333 POSIX.1-2001 non specifica una dimensione definita per il nome dei file (che
2334 può variare a seconda del filesystem), ma solo un limite superiore pari a
2335 \const{NAME\_MAX} (vedi tab.~\ref{tab:sys_file_macro}), in generale per
2336 allocare una struttura \struct{dirent} in maniera portabile occorre eseguire
2337 un calcolo per ottenere le dimensioni appropriate per il proprio
2338 sistema.\footnote{in SVr4 la lunghezza del campo è definita come
2339   \code{NAME\_MAX+1} che di norma porta al valore di 256 byte usato anche in
2340   fig.~\ref{fig:file_dirent_struct}.} Lo standard però richiede che il campo
2341 \var{d\_name} sia sempre l'ultimo della struttura, questo ci consente di
2342 ottenere la dimensione della prima parte con la macro di utilità generica
2343 \macro{offsetof}, che si può usare con il seguente prototipo:
2344
2345 {\centering
2346 \vspace{3pt}
2347 \begin{funcbox}{
2348 \fhead{stddef.h}
2349 \fdecl{size\_t \macrod{offsetof}(type, member)}
2350 \fdesc{Restituisce la posizione del campo \param{member} nella
2351   struttura \param{type}.}
2352
2353 \end{funcbox}
2354 }
2355
2356 Ottenuta allora con \code{offsetof(struct dirent, d\_name)} la dimensione
2357 della parte iniziale della struttura, basterà sommarci la dimensione massima
2358 dei nomi dei file nel filesystem che si sta usando, che si può ottenere
2359 attraverso la funzione \func{pathconf} (per la quale si rimanda a
2360 sez.~\ref{sec:sys_file_limits}) più un ulteriore carattere per la terminazione
2361 della stringa.
2362
2363 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
2364 indica il tipo di file (se \textit{fifo}, directory, collegamento simbolico,
2365 ecc.), e consente di evitare una successiva chiamata a \func{lstat} (vedi
2366 sez.~\ref{sec:file_stat}) per determinarlo. I suoi possibili valori sono
2367 riportati in tab.~\ref{tab:file_dtype_macro}. Si tenga presente che questo
2368 valore è disponibile solo per i filesystem che ne supportano la restituzione
2369 (fra questi i più noti sono \acr{Btrfs}, \acr{ext2}, \acr{ext3}, e
2370 \acr{ext4}), per gli altri si otterrà sempre il valore
2371 \const{DT\_UNKNOWN}.\footnote{inoltre fino alla versione 2.1 della
2372   \acr{glibc}, pur essendo il campo \var{d\_type} presente, il suo uso non era
2373   implementato, e veniva restituito comunque il valore \const{DT\_UNKNOWN}.}
2374
2375 \begin{table}[htb]
2376   \centering
2377   \footnotesize
2378   \begin{tabular}[c]{|l|l|}
2379     \hline
2380     \textbf{Valore} & \textbf{Tipo di file} \\
2381     \hline
2382     \hline
2383     \constd{DT\_UNKNOWN} & Tipo sconosciuto.\\
2384     \constd{DT\_REG}     & File normale.\\
2385     \constd{DT\_DIR}     & Directory.\\
2386     \constd{DT\_LNK}     & Collegamento simbolico.\\
2387     \constd{DT\_FIFO}    & \textit{Fifo}.\\
2388     \constd{DT\_SOCK}    & Socket.\\
2389     \constd{DT\_CHR}     & Dispositivo a caratteri.\\
2390     \constd{DT\_BLK}     & Dispositivo a blocchi.\\
2391     \hline    
2392   \end{tabular}
2393   \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
2394     della struttura \struct{dirent}.}
2395   \label{tab:file_dtype_macro}
2396 \end{table}
2397
2398 Per la conversione da e verso l'analogo valore mantenuto dentro il campo
2399 \var{st\_mode} di \struct{stat} (vedi fig.~\ref{fig:file_stat_struct}) sono
2400 definite anche due macro di conversione, \macro{IFTODT} e \macro{DTTOIF}:
2401
2402 {\centering
2403 \vspace{3pt}
2404 \begin{funcbox}{
2405 \fhead{dirent.h}
2406 \fdecl{int \macrod{IFTODT}(mode\_t MODE)}
2407 \fdesc{Converte il tipo di file dal formato di \var{st\_mode} a quello di
2408   \var{d\_type}.}
2409 \fdecl{mode\_t \macrod{DTTOIF}(int DTYPE)}
2410 \fdesc{Converte il tipo di file dal formato di \var{d\_type} a quello di
2411   \var{st\_mode}.}  
2412
2413 \end{funcbox}
2414 }
2415
2416 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
2417 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
2418 letta. Con questi due campi diventa possibile, determinando la posizione delle
2419 varie voci, spostarsi all'interno dello \textit{stream} usando la funzione
2420 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
2421   estensioni prese da BSD, ed introdotte nello standard POSIX solo a partire
2422   dalla revisione POSIX.1-2001, per poterle utilizzare deve essere definita
2423   una delle macro \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE} o
2424   \macro{\_SVID\_SOURCE}.} il cui prototipo è:
2425
2426 \begin{funcproto}{
2427 \fhead{dirent.h}
2428 \fdecl{void seekdir(DIR *dir, off\_t offset)}
2429 \fdesc{Cambia la posizione all'interno di un \textit{directory stream}.} 
2430 }
2431 {La funzione non ritorna niente e non imposta errori.}
2432 \end{funcproto}
2433
2434 La funzione non ritorna nulla e non segnala errori, è però necessario che il
2435 valore dell'argomento \param{offset} sia valido per lo
2436 \textit{stream} \param{dir}; esso pertanto deve essere stato ottenuto o dal
2437 valore di \var{d\_off} di \struct{dirent} o dal valore restituito dalla
2438 funzione \funcd{telldir}, che legge la posizione corrente; il cui prototipo
2439 è:\footnote{prima della \acr{glibc} 2.1.1 la funzione restituiva un valore di
2440   tipo \type{off\_t}, sostituito a partire dalla versione 2.1.2 da \ctyp{long}
2441   per conformità a POSIX.1-2001.}
2442
2443 \begin{funcproto}{
2444 \fhead{dirent.h}
2445 \fdecl{long telldir(DIR *dir)}
2446 \fdesc{Ritorna la posizione corrente in un \textit{directory stream}.} 
2447 }
2448 {La funzione ritorna la posizione corrente nello \textit{stream} (un numero
2449   positivo) in caso di successo e $-1$ per un errore, nel qual caso
2450   \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
2451   valore errato per \param{dir}.  }
2452 \end{funcproto}
2453
2454 La sola funzione di posizionamento per un \textit{directory stream} prevista
2455 originariamente dallo standard POSIX è \funcd{rewinddir}, che riporta la
2456 posizione a quella iniziale; il suo prototipo è:
2457
2458 \begin{funcproto}{
2459 \fhead{sys/types.h}
2460 \fhead{dirent.h}
2461 \fdecl{void rewinddir(DIR *dir)}
2462 \fdesc{Si posiziona all'inizio di un \textit{directory stream}.} 
2463 }
2464 {La funzione non ritorna niente e non imposta errori.}
2465 \end{funcproto}
2466
2467 Una volta completate le operazioni si può chiudere il \textit{directory
2468   stream}, ed il file descriptor ad esso associato, con la funzione
2469 \funcd{closedir}, il cui prototipo è:
2470
2471 \begin{funcproto}{
2472 \fhead{sys/types.h}
2473 \fhead{dirent.h}
2474 \fdecl{int closedir(DIR *dir)}
2475 \fdesc{Chiude un \textit{directory stream}.} 
2476 }
2477 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2478   caso \var{errno} assume solo il valore \errval{EBADF}.}
2479 \end{funcproto}
2480
2481 A parte queste funzioni di base in BSD 4.3 venne introdotta un'altra funzione
2482 che permette di eseguire una scansione completa, con tanto di ricerca ed
2483 ordinamento, del contenuto di una directory; la funzione è
2484 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
2485   \acr{libc4} e richiede siano definite le macro \macro{\_BSD\_SOURCE} o
2486   \macro{\_SVID\_SOURCE}.} ed il suo prototipo è:
2487
2488 \begin{funcproto}{
2489 \fhead{dirent.h}
2490 \fdecl{int scandir(const char *dir, struct dirent ***namelist, \\
2491 \phantom{int scandir(}int(*filter)(const struct dirent *), \\
2492 \phantom{int scandir(}int(*compar)(const struct dirent **, const struct dirent **))}
2493 \fdesc{Esegue una scansione di un \textit{directory stream}.} 
2494 }
2495 {La funzione ritorna il numero di voci trovate in caso di successo e $-1$ per
2496   un errore, nel qual caso \var{errno} può assumere solo il valore
2497   \errval{ENOMEM}.}
2498 \end{funcproto}
2499
2500 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
2501 prototipo non è molto comprensibile; queste funzioni però sono quelle che
2502 controllano rispettivamente la selezione di una voce, passata con
2503 l'argomento \param{filter}, e l'ordinamento di tutte le voci selezionate,
2504 specificata dell'argomento \param{compar}.
2505
2506 La funzione legge tutte le voci della directory indicata dall'argomento
2507 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
2508 \struct{dirent}) come argomento della funzione di selezione specificata da
2509 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
2510 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
2511 Qualora si specifichi un valore \val{NULL} per l'argomento \param{filter} non
2512 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
2513
2514 Le voci selezionate possono essere riordinate tramite \funcm{qsort}, le
2515 modalità del riordinamento possono essere personalizzate usando la funzione
2516 \param{compar} come criterio di ordinamento di \funcm{qsort}, la funzione
2517 prende come argomenti le due strutture \struct{dirent} da confrontare
2518 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
2519 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
2520 \struct{dirent} viene restituito nell'argomento
2521 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
2522   restituisce, come \textit{value result argument}, l'indirizzo della stessa;
2523   questo significa che \param{namelist} deve essere dichiarato come
2524   \code{struct dirent **namelist} ed alla funzione si deve passare il suo
2525   indirizzo.}
2526
2527 \itindend{directory~stream}
2528
2529 Per l'ordinamento, vale a dire come valori possibili per l'argomento
2530 \param{compar}, sono disponibili due funzioni predefinite, \funcd{alphasort} e
2531 \funcd{versionsort}, i cui prototipi sono:
2532
2533 \begin{funcproto}{
2534 \fhead{dirent.h}
2535 \fdecl{int alphasort(const void *a, const void *b)}
2536 \fdecl{int versionsort(const void *a, const void *b)}
2537 \fdesc{Riordinano le voci di \textit{directory stream}.} 
2538 }
2539 {Le funzioni restituiscono un valore minore, uguale o maggiore di zero qualora
2540   il primo argomento sia rispettivamente minore, uguale o maggiore del secondo
2541   e non forniscono errori.}
2542 \end{funcproto}
2543
2544 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
2545 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
2546   argomenti dei puntatori a delle strutture \struct{dirent}; la glibc usa il
2547   prototipo originario di BSD, mostrato anche nella definizione, che prevede
2548   puntatori a \ctyp{void}.} e deve essere specificata come argomento
2549 \param{compar} per ottenere un ordinamento alfabetico secondo il valore del
2550 campo \var{d\_name} delle varie voci. La \acr{glibc} prevede come
2551 estensione\footnote{la \acr{glibc}, a partire dalla versione 2.1, effettua
2552   anche l'ordinamento alfabetico tenendo conto delle varie localizzazioni,
2553   usando \funcm{strcoll} al posto di \funcm{strcmp}.} anche
2554 \func{versionsort}, che ordina i nomi tenendo conto del numero di versione,
2555 cioè qualcosa per cui \texttt{file10} viene comunque dopo \texttt{file4}.
2556
2557 \begin{figure}[!htb]
2558   \footnotesize \centering
2559   \begin{minipage}[c]{\codesamplewidth}
2560     \includecodesample{listati/my_ls.c}
2561   \end{minipage}
2562   \caption{Esempio di codice per eseguire la lista dei file contenuti in una
2563     directory.} 
2564   \label{fig:file_my_ls}
2565 \end{figure}
2566
2567 Un semplice esempio dell'uso di queste funzioni è riportato in
2568 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
2569 programma che, usando la funzione di scansione illustrata in
2570 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
2571 e la relativa dimensione, in sostanza una versione semplificata del comando
2572 \cmd{ls}.
2573
2574 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
2575 la parte di gestione delle opzioni, che prevede solo l'uso di una funzione per
2576 la stampa della sintassi, anch'essa omessa, ma il codice completo può essere
2577 trovato coi sorgenti allegati alla guida nel file \file{myls.c}.
2578
2579 In sostanza tutto quello che fa il programma, dopo aver controllato
2580 (\texttt{\small 12-15}) di avere almeno un argomento, che indicherà la
2581 directory da esaminare, è chiamare (\texttt{\small 16}) la funzione
2582 \myfunc{dir\_scan} per eseguire la scansione, usando la funzione \code{do\_ls}
2583 (\texttt{\small 22-29}) per fare tutto il lavoro.
2584
2585 Quest'ultima si limita (\texttt{\small 26}) a chiamare \func{stat} sul file
2586 indicato dalla directory entry passata come argomento (il cui nome è appunto
2587 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
2588 dati ad esso relativi, per poi provvedere (\texttt{\small 27}) a stampare il
2589 nome del file e la dimensione riportata in \var{data}.
2590
2591 Dato che la funzione verrà chiamata all'interno di \myfunc{dir\_scan} per ogni
2592 voce presente, questo è sufficiente a stampare la lista completa dei file e
2593 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
2594 valore di ritorno per indicare una esecuzione senza errori.
2595
2596 \begin{figure}[!htb]
2597   \footnotesize \centering
2598   \begin{minipage}[c]{\codesamplewidth}
2599     \includecodesample{listati/dir_scan.c}
2600   \end{minipage}
2601   \caption{Codice della funzione di scansione di una directory contenuta nel
2602     file \file{dir\_scan.c}.} 
2603   \label{fig:file_dirscan}
2604 \end{figure}
2605
2606 Tutto il grosso del lavoro è svolto dalla funzione \myfunc{dir\_scan},
2607 riportata in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e
2608 permette di eseguire una funzione, passata come secondo argomento, su tutte le
2609 voci di una directory.  La funzione inizia con l'aprire (\texttt{\small
2610   18-22}) uno \textit{stream} sulla directory passata come primo argomento,
2611 stampando un messaggio in caso di errore.
2612
2613 Il passo successivo (\texttt{\small 23-24}) è cambiare directory di lavoro
2614 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzioni
2615 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
2616 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
2617 (\texttt{\small 26-30}) sulle singole voci dello \textit{stream} ci si trovi
2618 all'interno della directory.\footnote{questo è essenziale al funzionamento
2619   della funzione \code{do\_ls}, e ad ogni funzione che debba usare il campo
2620   \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
2621   struttura \struct{dirent} sono sempre relativi alla directory in questione,
2622   e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
2623   ottenere le dimensioni.}
2624
2625 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
2626 alla funzione passata come secondo argomento, il ciclo di scansione della
2627 directory è molto semplice; si legge una voce alla volta (\texttt{\small 26})
2628 all'interno di una istruzione di \code{while} e fintanto che si riceve una
2629 voce valida, cioè un puntatore diverso da \val{NULL}, si esegue
2630 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
2631 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
2632   28}) qualora questa presenti una anomalia, identificata da un codice di
2633 ritorno negativo. Una volta terminato il ciclo la funzione si conclude con la
2634 chiusura (\texttt{\small 31}) dello \textit{stream}\footnote{nel nostro caso,
2635   uscendo subito dopo la chiamata, questo non servirebbe, in generale però
2636   l'operazione è necessaria, dato che la funzione può essere invocata molte
2637   volte all'interno dello stesso processo, per cui non chiudere i
2638   \textit{directory stream} comporterebbe un consumo progressivo di risorse,
2639   con conseguente rischio di esaurimento delle stesse.} e la restituzione
2640 (\texttt{\small 32}) del codice di operazioni concluse con successo.
2641
2642
2643
2644 \subsection{La directory di lavoro}
2645 \label{sec:file_work_dir}
2646
2647 \index{directory~di~lavoro|(} 
2648
2649 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
2650 directory nell'albero dei file,\footnote{questa viene mantenuta all'interno
2651   dei dati della sua \kstruct{task\_struct} (vedi
2652   fig.~\ref{fig:proc_task_struct}), più precisamente nel campo \texttt{pwd}
2653   della sotto-struttura \kstruct{fs\_struct}.} che è chiamata
2654 \textsl{directory corrente} o \textsl{directory di lavoro} (in inglese
2655 \textit{current working directory}).  La directory di lavoro è quella da cui
2656 si parte quando un \textit{pathname} è espresso in forma relativa, dove il
2657 ``\textsl{relativa}'' fa riferimento appunto a questa directory.
2658
2659 Quando un utente effettua il login, questa directory viene impostata alla
2660 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
2661 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
2662 comando \cmd{pwd} la stampa sul terminale.  Siccome la directory di lavoro
2663 resta la stessa quando viene creato un processo figlio (vedi
2664 sez.~\ref{sec:proc_fork}), la directory di lavoro della shell diventa anche la
2665 directory di lavoro di qualunque comando da essa lanciato.
2666
2667 Dato che è il kernel che tiene traccia dell'\textit{inode} della directory di
2668 lavoro di ciascun processo, per ottenerne il \textit{pathname} occorre usare
2669 una apposita funzione, \funcd{getcwd},\footnote{con Linux \func{getcwd} è una
2670   \textit{system call} dalla versione 2.1.9, in precedenza il valore doveva
2671   essere ottenuto tramite il filesystem \texttt{/proc} da
2672   \procfile{/proc/self/cwd}.} il cui prototipo è:
2673
2674 \begin{funcproto}{
2675 \fhead{unistd.h}
2676 \fdecl{char *getcwd(char *buffer, size\_t size)}
2677 \fdesc{Legge il \textit{pathname} della directory di lavoro corrente.} 
2678 }
2679 {La funzione ritorna il puntatore a \param{buffer} in caso di successo e
2680   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori: 
2681   \begin{errlist}
2682   \item[\errcode{EACCES}] manca il permesso di lettura o di attraversamento  su
2683     uno dei componenti del \textit{pathname} (cioè su una delle directory
2684     superiori alla corrente).
2685   \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
2686     è nullo.
2687   \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata. 
2688   \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
2689     lunghezza del \textit{pathname}. 
2690   \end{errlist}
2691   ed inoltre \errcode{EFAULT} ed \errcode{ENOMEM} nel loro significato
2692   generico.}
2693 \end{funcproto}
2694
2695 La funzione restituisce il \textit{pathname} completo della directory di
2696 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
2697 precedentemente allocata, per una dimensione massima di \param{size}.  Il
2698 buffer deve essere sufficientemente largo da poter contenere il
2699 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
2700 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
2701 un errore.
2702
2703 A partire dal kernel Linux 2.6.36 il nome può avere come prefisso la stringa
2704 \texttt{(unreachable)} se la directory di lavoro resta fuori dalla directory
2705 radice del processo dopo un \func{chroot} (torneremo su questi argomenti in
2706 sez.~\ref{sec:file_chroot}); pertanto è sempre opportuno controllare il primo
2707 carattere della stringa restituita dalla funzione per evitare di interpretare
2708 mare un \textit{pathname} irraggiungibile.
2709
2710 Come estensione allo standard POSIX.1, supportata da Linux e dalla
2711 \acr{glibc}, si può anche specificare un puntatore nullo come \param{buffer}
2712 nel qual caso la stringa sarà allocata automaticamente per una dimensione pari
2713 a \param{size} qualora questa sia diversa da zero, o della lunghezza esatta
2714 del \textit{pathname} altrimenti. In questo caso ci si deve ricordare di
2715 disallocare la stringa con \func{free} una volta cessato il suo utilizzo.
2716
2717 Un uso comune di \func{getcwd} è quello di salvarsi la directory di lavoro
2718 all'avvio del programma per poi potervi tornare in un tempo successivo, un
2719 metodo alternativo più veloce, se non si è a corto di file descriptor, è
2720 invece quello di aprire all'inizio la directory corrente (vale a dire
2721 ``\texttt{.}'') e tornarvi in seguito con \func{fchdir}.
2722
2723 Di questa funzione esiste una versione alternativa per compatibilità
2724 all'indietro con BSD, \funcm{getwd}, che non prevede l'argomento \param{size}
2725 e quindi non consente di specificare la dimensione di \param{buffer} che
2726 dovrebbe essere allocato in precedenza ed avere una dimensione sufficiente
2727 (per BSD maggiore \const{PATH\_MAX}, che di solito 256 byte, vedi
2728 sez.~\ref{sec:sys_limits}). Il problema è che su Linux non esiste una
2729 dimensione superiore per la lunghezza di un \textit{pathname}, per cui non è
2730 detto che il buffer sia sufficiente a contenere il nome del file, e questa è
2731 la ragione principale per cui questa funzione è deprecata, e non la tratteremo.
2732
2733 Una seconda funzione usata per ottenere la directory di lavoro è
2734 \funcm{get\_current\_dir\_name} (la funzione è una estensione GNU e presente
2735 solo nella \acr{glibc}) che non prende nessun argomento ed è sostanzialmente
2736 equivalente ad una \code{getcwd(NULL, 0)}, con la differenza che se
2737 disponibile essa ritorna il valore della variabile di ambiente \envvar{PWD},
2738 che essendo costruita dalla shell può contenere un \textit{pathname}
2739 comprendente anche dei collegamenti simbolici. Usando \func{getcwd} infatti,
2740 essendo il \textit{pathname} ricavato risalendo all'indietro l'albero della
2741 directory, si perderebbe traccia di ogni passaggio attraverso eventuali
2742 collegamenti simbolici.
2743
2744 Per cambiare la directory di lavoro si può usare la funzione di sistema
2745 \funcd{chdir}, equivalente del comando di shell \cmd{cd}, il cui nome sta
2746 appunto per \textit{change directory}, il suo prototipo è:
2747
2748 \begin{funcproto}{
2749 \fhead{unistd.h}
2750 \fdecl{int chdir(const char *pathname)}
2751 \fdesc{Cambia la directory di lavoro per \textit{pathname}.} 
2752 }
2753 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2754   caso \var{errno} assumerà uno dei valori: 
2755   \begin{errlist}
2756   \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
2757     di \param{pathname}.
2758   \item[\errcode{ENAMETOOLONG}] il nome indicato in \param{path} è troppo lungo.
2759   \item[\errcode{ENOTDIR}] non si è specificata una directory.
2760   \end{errlist}
2761   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP}, \errval{ENOENT} e
2762   \errval{ENOMEM} nel loro significato generico.}
2763 \end{funcproto}
2764
2765 La funzione cambia la directory di lavoro in \param{pathname} ed
2766 ovviamente \param{pathname} deve indicare una directory per la quale si hanno
2767 i permessi di accesso.
2768
2769 Dato che ci si può riferire ad una directory anche tramite un file descriptor,
2770 per cambiare directory di lavoro è disponibile anche la funzione di sistema
2771 \funcd{fchdir}, il cui prototipo è:
2772
2773 \begin{funcproto}{
2774 \fhead{unistd.h}
2775 \fdecl{int fchdir(int fd)}
2776 \fdesc{Cambia la directory di lavoro per file descriptor.} 
2777 }
2778 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2779   caso \var{errno} assumerà i valori \errval{EBADF} o \errval{EACCES} nel loro
2780   significato generico.}
2781 \end{funcproto}
2782
2783 La funzione è identica a \func{chdir}, ma prende come argomento un file
2784 descriptor \param{fd} invece di un \textit{pathname}. Anche in questo
2785 caso \param{fd} deve essere un file descriptor valido che fa riferimento ad
2786 una directory. Inoltre l'unico errore di accesso possibile (tutti gli altri
2787 sarebbero occorsi all'apertura di \param{fd}), è quello in cui il processo non
2788 ha il permesso di attraversamento alla directory specificata da \param{fd}.
2789
2790 \index{directory~di~lavoro|)} 
2791
2792
2793 \subsection{La creazione dei \textsl{file speciali}}
2794 \label{sec:file_mknod}
2795
2796 \index{file!di~dispositivo|(} 
2797 \index{file!speciali|(} 
2798
2799 Finora abbiamo parlato esclusivamente di file, directory e collegamenti
2800 simbolici, ma in sez.~\ref{sec:file_file_types} abbiamo visto che il sistema
2801 prevede anche degli altri tipi di file, che in genere vanno sotto il nome
2802 generico di \textsl{file speciali}, come i file di dispositivo, le
2803 \textit{fifo} ed i socket.
2804
2805 La manipolazione delle caratteristiche di questi file speciali, il cambiamento
2806 di nome o la loro cancellazione può essere effettuata con le stesse funzioni
2807 che operano sugli altri file, ma quando li si devono creare sono necessarie,
2808 come per le directory, delle funzioni apposite. La prima di queste è la
2809 funzione di sistema \funcd{mknod}, il cui prototipo è:
2810
2811 \begin{funcproto}{
2812 \fhead{sys/types.h}
2813 \fhead{sys/stat.h}
2814 \fhead{fcntl.h}
2815 \fhead{unistd.h}
2816 \fdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)}
2817 \fdesc{Crea un file speciale sul filesystem.} 
2818 }
2819 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2820   caso \var{errno} assumerà uno dei valori: 
2821   \begin{errlist}
2822   \item[\errcode{EEXIST}] \param{pathname} esiste già o è un collegamento
2823     simbolico. 
2824   \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
2825     \textit{fifo}, un socket o un dispositivo.
2826   \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
2827     l'\texttt{inode}, o il filesystem su cui si è cercato di
2828     creare \param{pathname} non supporta l'operazione.
2829   \end{errlist}
2830   ed inoltre \errval{EACCES}, \errval{EFAULT}, \errval{ELOOP},
2831   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOSPC},
2832   \errval{ENOTDIR} e \errval{EROFS} nel loro significato generico.}
2833 \end{funcproto}
2834
2835 La funzione permette di creare un \textit{inode} di tipo generico sul
2836 filesystem, e viene in genere utilizzata per creare i file di dispositivo, ma
2837 si può usare anche per creare qualunque tipo di file speciale ed anche file
2838 regolari. L'argomento \param{mode} specifica sia il tipo di file che si vuole
2839 creare che i relativi permessi, secondo i valori riportati in
2840 tab.~\ref{tab:file_mode_flags}, che vanno combinati con un OR aritmetico. I
2841 permessi sono comunque modificati nella maniera usuale dal valore di
2842 \textit{umask} (si veda sez.~\ref{sec:file_perm_management}).
2843
2844 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
2845 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
2846 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
2847 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
2848 per una \textit{fifo};\footnote{con Linux la funzione non può essere usata per
2849   creare directory o collegamenti simbolici, si dovranno usare le funzioni
2850   \func{mkdir} e \func{symlink} a questo dedicate.} un valore diverso
2851 comporterà l'errore \errcode{EINVAL}. Inoltre \param{pathname} non deve
2852 esistere, neanche come collegamento simbolico.
2853
2854 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
2855 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
2856 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
2857 valore verrà ignorato.  Solo l'amministratore può creare un file di
2858 dispositivo usando questa funzione (il processo deve avere la capacità
2859 \const{CAP\_MKNOD}), ma in Linux\footnote{questo è un comportamento specifico
2860   di Linux, la funzione non è prevista dallo standard POSIX.1 originale,
2861   mentre è presente in SVr4 e 4.4BSD, ma esistono differenze nei comportamenti
2862   e nei codici di errore, tanto che questa è stata introdotta in POSIX.1-2001
2863   con una nota che la definisce portabile solo quando viene usata per creare
2864   delle \textit{fifo}, ma comunque deprecata essendo utilizzabile a tale scopo
2865   la specifica \func{mkfifo}.} l'uso per la creazione di un file ordinario, di
2866 una \textit{fifo} o di un socket è consentito anche agli utenti normali.
2867
2868 Gli \textit{inode} creati con \func{mknod} apparterranno al proprietario e al
2869 gruppo del processo (usando \ids{UID} e \ids{GID} del gruppo effettivo) che li
2870 ha creati a meno non sia presente il bit \acr{sgid} per la directory o sia
2871 stata attivata la semantica BSD per il filesystem (si veda
2872 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
2873 l'\textit{inode}, nel qual caso per il gruppo verrà usato il \ids{GID} del
2874 proprietario della directory.
2875
2876 \itindbeg{major~number}
2877 \itindbeg{minor~number}
2878
2879 Nella creazione di un file di dispositivo occorre poi specificare
2880 correttamente il valore di \param{dev}; questo infatti è di tipo
2881 \type{dev\_t}, che è un tipo primitivo (vedi
2882 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
2883 \textsl{numero} di dispositivo. Il kernel infatti identifica ciascun
2884 dispositivo con un valore numerico, originariamente questo era un intero a 16
2885 bit diviso in due parti di 8 bit chiamate rispettivamente \textit{major
2886   number} e \textit{minor number}, che sono poi i due numeri mostrati dal
2887 comando \texttt{ls -l} al posto della dimensione quando lo si esegue su un
2888 file di dispositivo.
2889
2890 Il \textit{major number} identifica una classe di dispositivi (ad esempio la
2891 seriale, o i dischi IDE) e serve in sostanza per indicare al kernel quale è il
2892 modulo che gestisce quella classe di dispositivi. Per identificare uno
2893 specifico dispositivo di quella classe (ad esempio una singola porta seriale,
2894 o uno dei dischi presenti) si usa invece il \textit{minor number}. L'elenco
2895 aggiornato di questi numeri con le relative corrispondenze ai vari dispositivi
2896 può essere trovato nel file \texttt{Documentation/devices.txt} allegato alla
2897 documentazione dei sorgenti del kernel.
2898
2899 Data la crescita nel numero di dispositivi supportati, ben presto il limite
2900 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
2901 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
2902 \type{dev\_t}, con delle dimensioni passate a 12 bit per il \textit{major
2903   number} e 20 bit per il \textit{minor number}. La transizione però ha
2904 comportato il fatto che \type{dev\_t} è diventato un tipo opaco, e la
2905 necessità di specificare il numero tramite delle opportune macro, così da non
2906 avere problemi di compatibilità con eventuali ulteriori estensioni.
2907
2908 Le macro sono definite nel file \headfiled{sys/sysmacros.h},\footnote{se si
2909   usa la \acr{glibc} dalla versione 2.3.3 queste macro sono degli alias alle
2910   versioni specifiche di questa libreria, \macrod{gnu\_dev\_major},
2911   \macrod{gnu\_dev\_minor} e \macrod{gnu\_dev\_makedev} che si possono usare
2912   direttamente, al costo di una minore portabilità.} che viene automaticamente
2913 incluso quando si include \headfile{sys/types.h}. Si possono pertanto ottenere
2914 i valori del \textit{major number} e \textit{minor number} di un dispositivo
2915 rispettivamente con le macro \macro{major} e \macro{minor}:
2916
2917 {\centering
2918 \vspace{3pt}
2919 \begin{funcbox}{
2920 \fhead{sys/types.h}
2921 \fdecl{int \macrod{major}(dev\_t dev)}
2922 \fdesc{Restituisce il \textit{major number} del dispositivo \param{dev}.}
2923 \fdecl{int \macrod{minor}(dev\_t dev)}
2924 \fdesc{Restituisce il \textit{minor number} del dispositivo \param{dev}.}  
2925
2926 \end{funcbox}
2927 }
2928
2929 \noindent mentre una volta che siano noti \textit{major number} e
2930 \textit{minor number} si potrà costruire il relativo identificativo con la
2931 macro \macro{makedev}:
2932
2933 {\centering
2934 \vspace{3pt}
2935 \begin{funcbox}{
2936 \fhead{sys/types.h}
2937 \fdecl{dev\_t \macrod{makedev}(int major, int minor)}
2938 \fdesc{Dati \textit{major number} e \textit{minor number} restituisce
2939   l'identificativo di un dispositivo.} 
2940
2941 \end{funcbox}
2942 }
2943
2944
2945 \itindend{major~number}
2946 \itindend{minor~number}
2947 \index{file!di~dispositivo|)}
2948
2949 Dato che la funzione di sistema \func{mknod} presenta diverse varianti nei
2950 vari sistemi unix-like, lo standard POSIX.1-2001 la dichiara portabile solo in
2951 caso di creazione delle \textit{fifo}, ma anche in questo caso alcune
2952 combinazioni degli argomenti restano non specificate, per cui nello stesso
2953 standard è stata introdotta una funzione specifica per creare una
2954 \textit{fifo} deprecando l'uso di \func{mknod} a tale riguardo.  La funzione è
2955 \funcd{mkfifo} ed il suo prototipo è:
2956
2957 \begin{funcproto}{
2958 \fhead{sys/types.h}
2959 \fhead{sys/stat.h}
2960 \fdecl{int mkfifo(const char *pathname, mode\_t mode)}
2961 \fdesc{Crea una \textit{fifo}.} 
2962 }
2963 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2964   caso \var{errno} assumerà \errval{EACCES}, \errval{EEXIST},
2965   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC}, \errval{ENOTDIR} e
2966   \errval{EROFS} nel loro significato generico.}
2967 \end{funcproto}
2968
2969 La funzione crea la \textit{fifo} \param{pathname} con i
2970 permessi \param{mode}. Come per \func{mknod} il file \param{pathname} non deve
2971 esistere (neanche come collegamento simbolico); al solito i permessi
2972 specificati da \param{mode} vengono modificati dal valore di \textit{umask}
2973 (vedi sez.~\ref{sec:file_perm_management}).
2974
2975 \index{file!speciali|)} 
2976
2977
2978 \subsection{I file temporanei}
2979 \label{sec:file_temp_file}
2980
2981 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
2982 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
2983 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
2984 creare il file dopo aver controllato che questo non esista, nel momento fra il
2985 controllo e la creazione si ha giusto lo spazio per una possibile \textit{race
2986   condition} (si ricordi quanto visto in sez.~\ref{sec:proc_race_cond}).
2987
2988 \itindbeg{symlink~attack}
2989
2990 Molti problemi di sicurezza derivano proprio da una creazione non accorta di
2991 file temporanei che lascia aperta questa \textit{race condition}. Un
2992 attaccante allora potrà sfruttarla con quello che viene chiamato
2993 ``\textit{symlink attack}'' dove nell'intervallo fra la generazione di un nome
2994 e l'accesso allo stesso, viene creato un collegamento simbolico con quel nome
2995 verso un file diverso, ottenendo, se il programma sotto attacco ne ha la
2996 capacità, un accesso privilegiato.\footnote{dal kernel 3.6 sono state
2997   introdotte delle contromisure, illustrate in
2998   sez.~\ref{sec:procadv_security_misc}, che rendono impraticabili questo tipo
2999   di attacchi, ma questa non è una buona scusa per ignorare il problema.}
3000
3001 \itindend{symlink~attack}
3002
3003 La \acr{glibc} provvede varie funzioni per generare nomi di file temporanei,
3004 di cui si abbia certezza di unicità al momento della generazione; storicamente
3005 la prima di queste funzioni create a questo scopo era
3006 \funcd{tmpnam},\footnote{la funzione è stata deprecata nella revisione
3007   POSIX.1-2008 dello standard POSIX.} il cui prototipo è:
3008
3009 \begin{funcproto}{
3010 \fhead{stdio.h}
3011 \fdecl{char *tmpnam(char *string)}
3012 \fdesc{Genera un nome univoco per un file temporaneo.} 
3013 }
3014 {La funzione ritorna il puntatore alla stringa con il nome in caso di successo
3015   e \val{NULL} in caso di fallimento, non sono definiti errori.}
3016 \end{funcproto}
3017
3018 La funzione restituisce il puntatore ad una stringa contente un nome di file
3019 valido e non esistente al momento dell'invocazione. Se si è passato come
3020 argomento \param{string} un puntatore non nullo ad un buffer di caratteri
3021 questo deve essere di dimensione \constd{L\_tmpnam} ed il nome generato vi
3022 verrà copiato automaticamente, altrimenti il nome sarà generato in un buffer
3023 statico interno che verrà sovrascritto ad una chiamata successiva.  Successive
3024 invocazioni della funzione continueranno a restituire nomi unici fino ad un
3025 massimo di \constd{TMP\_MAX} volte, limite oltre il quale il comportamento è
3026 indefinito. Al nome viene automaticamente aggiunto come prefisso la directory
3027 specificata dalla costante \constd{P\_tmpdir}.\footnote{le costanti
3028   \const{L\_tmpnam}, \const{P\_tmpdir} e \const{TMP\_MAX} sono definite in
3029   \headfile{stdio.h}.}
3030
3031 Di questa funzione esiste una versione rientrante, \funcm{tmpnam\_r}, che non
3032 fa nulla quando si passa \val{NULL} come argomento.  Una funzione simile,
3033 \funcd{tempnam}, permette di specificare un prefisso per il file
3034 esplicitamente, il suo prototipo è:
3035
3036 \begin{funcproto}{
3037 \fhead{stdio.h}
3038 \fdecl{char *tempnam(const char *dir, const char *pfx)}
3039 \fdesc{Genera un nome univoco per un file temporaneo.} 
3040 }
3041 {La funzione ritorna il puntatore alla stringa con il nome in caso di successo
3042   e \val{NULL} per un errore, nel qual caso \var{errno} potrà assumere solo il
3043   valore \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
3044 \end{funcproto}
3045
3046 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
3047 per cui è sempre rientrante, occorre però ricordarsi di disallocare con
3048 \code{free} il puntatore che restituisce.  L'argomento \param{pfx} specifica
3049 un prefisso di massimo 5 caratteri per il nome provvisorio. La funzione
3050 assegna come directory per il file temporaneo, verificando che esista e sia
3051 accessibile, la prima valida fra le seguenti:
3052 \begin{itemize*}
3053 \item la variabile di ambiente \envvar{TMPDIR} (non ha effetto se non è
3054   definita o se il programma chiamante è \acr{suid} o \acr{sgid}, vedi
3055   sez.~\ref{sec:file_special_perm}),
3056 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}),
3057 \item il valore della costante \const{P\_tmpdir},
3058 \item la directory \file{/tmp}.
3059 \end{itemize*}
3060
3061 In ogni caso, anche se con queste funzioni la generazione del nome è casuale,
3062 ed è molto difficile ottenere un nome duplicato, nulla assicura che un altro
3063 processo non possa avere creato, fra l'ottenimento del nome e l'apertura del
3064 file, un altro file o un collegamento simbolico con lo stesso nome. Per questo
3065 motivo quando si usa il nome ottenuto da una di queste funzioni occorre sempre
3066 assicurarsi che non si stia usando un collegamento simbolico e aprire il nuovo
3067 file in modalità di esclusione (cioè con l'opzione \const{O\_EXCL} per i file
3068 descriptor o con il flag ``\texttt{x}'' per gli \textit{stream}) che fa
3069 fallire l'apertura in caso il file sia già esistente. Essendo disponibili
3070 alternative migliori l'uso di queste funzioni è deprecato.
3071
3072 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
3073 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
3074 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
3075
3076 \begin{funcproto}{
3077 \fhead{stdio.h}
3078 \fdecl{FILE *tmpfile(void)}
3079 \fdesc{Apre un file temporaneo in lettura/scrittura.} 
3080 }
3081 {La funzione ritorna il puntatore allo \textit{stream} associato al file
3082   temporaneo in caso di successo e \val{NULL} per un errore, nel qual caso
3083   \var{errno} assumerà uno dei valori:
3084   \begin{errlist}
3085     \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
3086     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
3087   \end{errlist}
3088   ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
3089   \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES} nel loro significato
3090   generico.}
3091 \end{funcproto}
3092
3093
3094 La funzione restituisce direttamente uno \textit{stream} già aperto (in
3095 modalità \code{w+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso,
3096 che viene automaticamente cancellato alla sua chiusura o all'uscita dal
3097 programma. Lo standard non specifica in quale directory verrà aperto il file,
3098 ma la \acr{glibc} prima tenta con \const{P\_tmpdir} e poi con
3099 \file{/tmp}. Questa funzione è rientrante e non soffre di problemi di
3100 \textit{race condition}.
3101
3102 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
3103 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
3104 modificano una stringa di input che serve da modello e che deve essere
3105 conclusa da 6 caratteri ``\texttt{X}'' che verranno sostituiti da un codice
3106 unico. La prima delle due è analoga a \func{tmpnam} e genera soltanto un nome
3107 casuale, il suo prototipo è:
3108
3109 \begin{funcproto}{
3110 \fhead{stlib.h}
3111 \fdecl{char *mktemp(char *template)}
3112 \fdesc{Genera un nome univoco per un file temporaneo.} 
3113 }
3114 {La funzione ritorna  il puntatore a \param{template} in caso di successo e
3115   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori: 
3116   \begin{errlist}
3117     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3118   \end{errlist}}
3119 \end{funcproto}
3120
3121 La funzione genera un nome univoco sostituendo le \code{XXXXXX} finali di
3122 \param{template}; dato che \param{template} deve poter essere modificata dalla
3123 funzione non si può usare una stringa costante.  Tutte le avvertenze riguardo
3124 alle possibili \textit{race condition} date per \func{tmpnam} continuano a
3125 valere; inoltre in alcune vecchie implementazioni il valore usato per
3126 sostituire le \code{XXXXXX} viene formato con il \ids{PID} del processo più
3127 una lettera, il che mette a disposizione solo 26 possibilità diverse per il
3128 nome del file, e rende il nome temporaneo facile da indovinare.  Per tutti
3129 questi motivi la funzione è deprecata e non dovrebbe mai essere usata.
3130
3131 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
3132 \func{tmpfile}, ma restituisce un file descriptor invece di un nome; il suo
3133 prototipo è:
3134
3135 \begin{funcproto}{
3136 \fhead{stlib.h}
3137 \fdecl{int mkstemp(char *template)}
3138 \fdesc{Apre un file temporaneo.} 
3139 }
3140
3141 {La funzione ritorna il file descriptor in caso di successo e $-1$ per un
3142   errore, nel qual 
3143   caso \var{errno} assumerà uno dei valori: 
3144   \begin{errlist}
3145     \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
3146       contenuto di \param{template} è indefinito.
3147     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3148   \end{errlist}}
3149 \end{funcproto}
3150
3151 Come per \func{mktemp} anche in questo caso \param{template} non può essere
3152 una stringa costante. La funzione apre un file in lettura/scrittura con la
3153 funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
3154 sez.~\ref{sec:file_open_close}), in questo modo al ritorno della funzione si
3155 ha la certezza di essere stati i creatori del file, i cui permessi (si veda
3156 sez.~\ref{sec:file_perm_overview}) sono impostati al valore \code{0600}
3157 (lettura e scrittura solo per il proprietario).\footnote{questo è vero a
3158   partire dalla \acr{glibc} 2.0.7, le versioni precedenti della \acr{glibc} e
3159   le vecchie \acr{libc5} e \acr{libc4} usavano il valore \code{0666} che
3160   permetteva a chiunque di leggere e scrivere i contenuti del file.}  Di
3161 questa funzione esiste una variante \funcd{mkostemp}, introdotta
3162 specificamente dalla \acr{glibc},\footnote{la funzione è stata introdotta
3163   nella versione 2.7 delle librerie e richiede che sia definita la macro
3164   \macro{\_GNU\_SOURCE}.} il cui prototipo è:
3165
3166 \begin{funcproto}{
3167 \fhead{stlib.h}
3168 \fdecl{int mkostemp(char *template, int flags)}
3169 \fdesc{Apre un file temporaneo.} 
3170 }
3171 {La funzione ritorna un file descriptor in caso di successo e $-1$ per un
3172   errore, nel qual caso \var{errno} assumerà  gli stessi valori di
3173   \func{mkstemp}.} 
3174 \end{funcproto}
3175 \noindent la cui sola differenza è la presenza dell'ulteriore argomento
3176 \var{flags} che consente di specificare alcuni ulteriori flag (come
3177 \const{O\_APPEND}, \const{O\_CLOEXEC}, \const{O\_SYNC}, il cui significato
3178 vedremo in sez.~\ref{sec:file_open_close}) da passare ad \func{open}
3179 nell'apertura del file.\footnote{si tenga presente che \func{mkostemp}
3180   utilizza già \const{O\_CREAT}, \const{O\_EXCL} e \const{O\_RDWR}, che non è
3181   il caso di riindicare, dato che ciò potrebbe portare ad errori in altri
3182   sistemi operativi.}
3183
3184 Di queste due funzioni sono state poi introdotte, a partire dalla \acr{glibc}
3185 2.11 due varianti, \funcd{mkstemps} e \funcd{mkostemps}, che consentono di
3186 indicare anche un suffisso, i loro prototipi sono:
3187
3188 \begin{funcproto}{
3189 \fhead{stlib.h}
3190 \fdecl{int mkstemps(char *template, int suffixlen)}
3191 \fdesc{Apre un file temporaneo.} 
3192 \fdecl{int mkostemps(char *template, int suffixlen, int flags)}
3193 \fdesc{Apre un file temporaneo.} 
3194 }
3195
3196 {Le funzioni hanno gli stessi valori di ritorno e gli stessi errori di
3197   \func{mkstemp} con lo stesso significato, tranne \errval{EINVAL} che viene
3198   restituito se \param{template} non è di lunghezza pari ad almeno
3199   $6+$\param{suffixlen} ed i 6 caratteri prima del suffisso non sono
3200   \code{XXXXXX}.}
3201 \end{funcproto}
3202
3203 Le due funzioni, un'estensione non standard fornita dalla \acr{glibc}, sono
3204 identiche a \funcd{mkstemp} e \funcd{mkostemp}, ma consentono di avere un nome
3205 del file nella forma \texttt{prefissoXXXXXXsuffisso} dove la lunghezza del
3206 suffisso deve essere indicata con \param{suffixlen}.
3207
3208 Infine con OpenBSD è stata introdotta un'altra funzione simile alle
3209 precedenti, \funcd{mkdtemp}, che crea invece una directory
3210 temporanea;\footnote{la funzione è stata introdotta nella \acr{glibc} a
3211   partire dalla versione 2.1.91 ed inserita nello standard POSIX.1-2008.}  il
3212 suo prototipo è:
3213
3214 \begin{funcproto}{
3215 \fhead{stlib.h}
3216 \fdecl{char *mkdtemp(char *template)}
3217 \fdesc{Crea una directory temporanea.} 
3218 }
3219 {La funzione ritorna il puntatore al nome della directory in caso di successo
3220   e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei
3221   valori:
3222   \begin{errlist}
3223     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3224   \end{errlist}
3225   più gli altri eventuali codici di errore di \func{mkdir}.}
3226 \end{funcproto}
3227
3228 La funzione crea una directory temporanea il cui nome è ottenuto sostituendo
3229 le \code{XXXXXX} finali di \param{template} con permessi \code{0700} (si veda
3230 sez.~\ref{sec:file_perm_overview} per i dettagli). Dato che la creazione della
3231 directory è sempre atomica i precedenti problemi di \textit{race condition}
3232 non si pongono.
3233
3234
3235 \section{La manipolazione delle caratteristiche dei file}
3236 \label{sec:file_infos}
3237
3238 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
3239 relative alle caratteristiche di ciascun file, a partire dalle informazioni
3240 relative al controllo di accesso, sono mantenute nell'\textit{inode}. Vedremo
3241 in questa sezione come sia possibile leggere tutte queste informazioni usando
3242 la funzione \func{stat}, che permette l'accesso a tutti i dati memorizzati
3243 nell'\textit{inode}; esamineremo poi le varie funzioni usate per manipolare
3244 tutte queste informazioni, eccetto quelle che riguardano la gestione del
3245 controllo di accesso, trattate in sez.~\ref{sec:file_access_control}.
3246
3247
3248 \subsection{La lettura delle caratteristiche dei file}
3249 \label{sec:file_stat}
3250
3251 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
3252 delle funzioni \func{stat} che sono quelle che usa il comando \cmd{ls} per
3253 poter ottenere e mostrare tutti i dati relativi ad un file; ne fanno parte le
3254 funzioni di sistema \funcd{stat}, \funcd{fstat} e \funcd{lstat}, i cui
3255 prototipi sono:
3256
3257 \begin{funcproto}{
3258 \fhead{sys/types.h}
3259 \fhead{sys/stat.h}
3260 \fhead{unistd.h}
3261 \fdecl{int stat(const char *file\_name, struct stat *buf)}
3262 \fdecl{int lstat(const char *file\_name, struct stat *buf)}
3263 \fdecl{int fstat(int filedes, struct stat *buf)}
3264 \fdesc{Leggono le informazioni di un file.} 
3265 }
3266 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3267   caso \var{errno} assumerà uno dei valori:
3268   \begin{errlist}
3269     \item[\errcode{EOVERFLOW}] il file ha una dimensione che non può essere
3270       rappresentata nel tipo \type{off\_t} (può avvenire solo in caso di
3271       programmi compilati su piattaforme a 32 bit senza le estensioni
3272       (\texttt{-D \_FILE\_OFFSET\_BITS=64}) per file a 64 bit).
3273   \end{errlist}
3274   ed inoltre \errval{EFAULT} ed \errval{ENOMEM}, per \func{stat} e
3275   \func{lstat} anche \errval{EACCES}, \errval{ELOOP}, \errval{ENAMETOOLONG},
3276   \errval{ENOENT}, \errval{ENOTDIR}, per \func{fstat} anche \errval{EBADF}, 
3277   nel loro significato generico.}
3278 \end{funcproto}
3279
3280 La funzione \func{stat} legge le informazioni del file indicato
3281 da \param{file\_name} e le inserisce nel buffer puntato
3282 dall'argomento \param{buf}; la funzione \func{lstat} è identica a \func{stat}
3283 eccetto che se \param{file\_name} è un collegamento simbolico vengono lette le
3284 informazioni relative ad esso e non al file a cui fa riferimento. Infine
3285 \func{fstat} esegue la stessa operazione su un file già aperto, specificato
3286 tramite il suo file descriptor \param{filedes}.
3287
3288 La struttura \struct{stat} usata da queste funzioni è definita nell'header
3289 \headfiled{sys/stat.h} e in generale dipende dall'implementazione; la versione
3290 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
3291 riportata dalla pagina di manuale di \func{stat}. In realtà la definizione
3292 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
3293 riservati per estensioni come tempi dei file più precisi (vedi
3294 sez.~\ref{sec:file_file_times}).
3295
3296 \begin{figure}[!htb]
3297   \footnotesize
3298   \centering
3299   \begin{minipage}[c]{0.8\textwidth}
3300     \includestruct{listati/stat.h}
3301   \end{minipage} 
3302   \normalsize 
3303   \caption{La struttura \structd{stat} per la lettura delle informazioni dei 
3304     file.}
3305   \label{fig:file_stat_struct}
3306 \end{figure}
3307
3308 Si noti come i vari membri della struttura siano specificati come tipi
3309 primitivi del sistema, di quelli definiti in
3310 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \headfile{sys/types.h},
3311 con l'eccezione di \typed{blksize\_t} e \typed{blkcnt\_t} che sono nuovi tipi
3312 introdotti per rendersi indipendenti dalla piattaforma. 
3313
3314 Benché la descrizione dei commenti di fig.~\ref{fig:file_stat_struct} sia
3315 abbastanza chiara, vale la pena illustrare maggiormente il significato dei
3316 campi di \struct{stat} su cui non torneremo in maggior dettaglio nel resto di
3317 questa sezione:
3318 \begin{itemize*}
3319 \item Il campo \var{st\_nlink} contiene il numero di \textit{hard link} che
3320   fanno riferimento al file (il cosiddetto \textit{link count}) di cui abbiamo
3321   già parlato in numerose occasioni.
3322 \item Il campo \var{st\_ino} contiene il numero di \textit{inode} del file,
3323   quello viene usato all'interno del filesystem per identificarlo e che può
3324   essere usato da un programma per determinare se due \textit{pathname} fanno
3325   riferimento allo stesso file.
3326 \item Il campo \var{st\_dev} contiene il numero del dispositivo su cui risiede
3327   il file (o meglio il suo filesystem). Si tratta dello stesso numero che si
3328   usa con \func{mknod} e che può essere decomposto in \textit{major number} e
3329   \textit{minor number} con le macro \macro{major} e \macro{minor} viste in
3330   sez.~\ref{sec:file_mknod}.
3331 \item Il campo \var{st\_rdev} contiene il numero di dispositivo associato al
3332   file stesso ed ovviamente ha un valore significativo soltanto quando il file
3333   è un dispositivo a caratteri o a blocchi.
3334 \item Il campo \var{st\_blksize} contiene la dimensione dei blocchi di dati
3335   usati nell'I/O su disco, che è anche la dimensione usata per la
3336   bufferizzazione dei dati dalle librerie del C per l'interfaccia degli
3337   \textit{stream}.  Leggere o scrivere blocchi di dati in dimensioni inferiori
3338   a questo valore è inefficiente in quanto le operazioni su disco usano
3339   comunque trasferimenti di questa dimensione.
3340 \end{itemize*}
3341
3342 Nell'evoluzione del kernel la \textit{system call} che fornisce \func{stat} è
3343 stata modificata più volte per tener conto dei cambiamenti fatti alla
3344 struttura \struct{stat},\footnote{questo ha significato l'utilizzo a basso
3345   livello di diverse \textit{system call} e diverse versioni della struttura.}
3346 in particolare a riguardo ai tempi dei file, di cui è stata aumentata la
3347 precisione (torneremo su questo in sez.~\ref{sec:file_file_times}) ma anche
3348 per gli aggiornamenti fatti ai campi \var{st\_ino}, \var{st\_uid} e
3349 \var{st\_gid}.
3350
3351 Sulle piattaforme a 32 bit questi cambiamenti, che han visto un aumento delle
3352 dimensioni dei campi della struttura per adattarli alle nuove esigenze, sono
3353 mascherati dalla \acr{glibc} che attraverso \func{stat} invoca la versione più
3354 recente della \textit{system call} e rimpacchetta i dati se questo è
3355 necessario per eseguire dei vecchi programmi. Nelle piattaforme a 64 bit
3356 invece è presente un'unica versione della \textit{system call} e la struttura
3357 \struct{stat} ha campi di dimensione sufficiente.
3358
3359 Infine a partire dal kernel 2.6.16 è stata introdotta una ulteriore funzione
3360 della famiglia, \func{fstatat} che consente di trattare con sicurezza i
3361 \textit{pathname} relativi, la tratteremo in sez.~\ref{sec:file_openat},
3362 insieme alla nuova \textit{system call} \func{statx}, introdotta dal kernel
3363 4.11 per estendere l'interfaccia di \func{stat} e le informazioni che essa può
3364 restituire.
3365
3366
3367 \subsection{I tipi di file}
3368 \label{sec:file_types}
3369
3370 Abbiamo sottolineato fin dall'introduzione che Linux, come ogni sistema
3371 unix-like, supporta oltre ai file ordinari e alle directory una serie di altri
3372 ``\textsl{tipi}'' di file che possono stare su un filesystem (elencati in
3373 tab.~\ref{tab:file_file_types}).  Il tipo di file viene ritornato dalle
3374 funzioni della famiglia \func{stat} all'interno del campo \var{st\_mode} di
3375 una struttura \struct{stat}. 
3376
3377 \begin{table}[htb]
3378   \centering
3379   \footnotesize
3380   \begin{tabular}[c]{|l|l|}
3381     \hline
3382     \textbf{Macro} & \textbf{Tipo del file} \\
3383     \hline
3384     \hline
3385     \macrod{S\_ISREG}\texttt{(m)}  & File normale.\\
3386     \macrod{S\_ISDIR}\texttt{(m)}  & Directory.\\
3387     \macrod{S\_ISCHR}\texttt{(m)}  & Dispositivo a caratteri.\\
3388     \macrod{S\_ISBLK}\texttt{(m)}  & Dispositivo a blocchi.\\
3389     \macrod{S\_ISFIFO}\texttt{(m)} & \textit{Fifo}.\\
3390     \macrod{S\_ISLNK}\texttt{(m)}  & Collegamento simbolico.\\
3391     \macrod{S\_ISSOCK}\texttt{(m)} & Socket.\\
3392     \hline    
3393   \end{tabular}
3394   \caption{Macro per i tipi di file (definite in \headfile{sys/stat.h}).}
3395   \label{tab:file_type_macro}
3396 \end{table}
3397
3398 Il campo \var{st\_mode} è una maschera binaria in cui l'informazione viene
3399 suddivisa nei vari bit che compongono, ed oltre a quelle sul tipo di file,
3400 contiene anche le informazioni relative ai permessi su cui torneremo in
3401 sez.~\ref{sec:file_perm_overview}. Dato che i valori numerici usati per
3402 definire il tipo di file possono variare a seconda delle implementazioni, lo
3403 standard POSIX definisce un insieme di macro che consentono di verificare il
3404 tipo di file in maniera standardizzata.
3405
3406 Queste macro vengono usate anche da Linux che supporta pure le estensioni allo
3407 standard per i collegamenti simbolici e i socket definite da BSD.\footnote{le
3408   ultime due macro di tab.~\ref{tab:file_type_macro}, che non sono presenti
3409   nello standard POSIX fino alla revisione POSIX.1-1996.}  L'elenco completo
3410 delle macro con cui è possibile estrarre da \var{st\_mode} l'informazione
3411 relativa al tipo di file è riportato in tab.~\ref{tab:file_type_macro}, tutte
3412 le macro restituiscono un valore intero da usare come valore logico e prendono
3413 come argomento il valore di \var{st\_mode}.
3414
3415 \begin{table}[htb]
3416   \centering
3417   \footnotesize
3418   \begin{tabular}[c]{|l|c|l|}
3419     \hline
3420     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
3421     \hline
3422     \hline
3423     \constd{S\_IFMT}   &  0170000 & Maschera per i bit del tipo di file.\\
3424     \constd{S\_IFSOCK} &  0140000 & Socket.\\
3425     \constd{S\_IFLNK}  &  0120000 & Collegamento simbolico.\\
3426     \constd{S\_IFREG}  &  0100000 & File regolare.\\ 
3427     \constd{S\_IFBLK}  &  0060000 & Dispositivo a blocchi.\\
3428     \constd{S\_IFDIR}  &  0040000 & Directory.\\
3429     \constd{S\_IFCHR}  &  0020000 & Dispositivo a caratteri.\\
3430     \constd{S\_IFIFO}  &  0010000 & \textit{Fifo}.\\
3431     \hline
3432     \constd{S\_ISUID}  &  0004000 & Set user ID (\acr{suid}) bit, vedi
3433                                    sez.~\ref{sec:file_special_perm}).\\
3434     \constd{S\_ISGID}  &  0002000 & Set group ID (\acr{sgid}) bit, vedi
3435                                    sez.~\ref{sec:file_special_perm}).\\
3436     \constd{S\_ISVTX}  &  0001000 & \acr{Sticky} bit, vedi
3437                                    sez.~\ref{sec:file_special_perm}).\\
3438     \hline
3439     \constd{S\_IRWXU}  &  00700   & Maschera per i permessi del proprietario.\\
3440     \constd{S\_IRUSR}  &  00400   & Il proprietario ha permesso di lettura.\\
3441     \constd{S\_IWUSR}  &  00200   & Il proprietario ha permesso di scrittura.\\
3442     \constd{S\_IXUSR}  &  00100   & Il proprietario ha permesso di esecuzione.\\
3443     \hline
3444     \constd{S\_IRWXG}  &  00070   & Maschera per i permessi del gruppo.\\
3445     \constd{S\_IRGRP}  &  00040   & Il gruppo ha permesso di lettura.\\
3446     \constd{S\_IWGRP}  &  00020   & Il gruppo ha permesso di scrittura.\\
3447     \constd{S\_IXGRP}  &  00010   & Il gruppo ha permesso di esecuzione.\\
3448     \hline
3449     \constd{S\_IRWXO}  &  00007   & Maschera per i permessi di tutti gli altri\\
3450     \constd{S\_IROTH}  &  00004   & Gli altri hanno permesso di lettura.\\
3451     \constd{S\_IWOTH}  &  00002   & Gli altri hanno permesso di esecuzione.\\
3452     \constd{S\_IXOTH}  &  00001   & Gli altri hanno permesso di esecuzione.\\
3453     \hline    
3454   \end{tabular}
3455   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
3456     \var{st\_mode} (definite in \headfile{sys/stat.h}).}
3457   \label{tab:file_mode_flags}
3458 \end{table}
3459
3460 Oltre alle macro di tab.~\ref{tab:file_type_macro}, che semplificano
3461 l'operazione, è possibile usare direttamente il valore di \var{st\_mode} per
3462 ricavare il tipo di file controllando direttamente i vari bit in esso
3463 memorizzati. Per questo sempre in \headfile{sys/stat.h} sono definite le varie
3464 costanti numeriche riportate in tab.~\ref{tab:file_mode_flags}, che
3465 definiscono le maschere che consentono di selezionare non solo i dati relativi
3466 al tipo di file, ma anche le informazioni relative ai permessi su cui
3467 torneremo in sez.~\ref{sec:file_access_control}, ed identificare i rispettivi
3468 valori.
3469
3470 Le costanti che servono per la identificazione del tipo di file sono riportate
3471 nella prima sezione di tab.~\ref{tab:file_mode_flags}, mentre le sezioni
3472 successive attengono alle costanti usate per i permessi.  Il primo valore
3473 dell'elenco è la maschera binaria \const{S\_IFMT} che permette di estrarre da
3474 \var{st\_mode} (con un AND aritmetico) il blocco di bit nei quali viene
3475 memorizzato il tipo di file. I valori successivi sono le costanti
3476 corrispondenti ai vari tipi di file, e possono essere usate per verificare la
3477 presenza del tipo di file voluto ed anche, con opportune combinazioni,
3478 alternative fra più tipi di file. 
3479
3480 Si tenga presente però che a differenza dei permessi, l'informazione relativa
3481 al tipo di file non è una maschera binaria, per questo motivo se si volesse
3482 impostare una condizione che permetta di controllare se un file è una
3483 directory o un file ordinario non si possono controllare dei singoli bit, ma
3484 si dovrebbe usare una macro di preprocessore come:
3485 \includecodesnip{listati/is_regdir.h}
3486 in cui si estraggono ogni volta da \var{st\_mode} i bit relativi al tipo di
3487 file e poi si effettua il confronto con i due possibili tipi di file.
3488
3489
3490 \subsection{Le dimensioni dei file}
3491 \label{sec:file_file_size}
3492
3493 Abbiamo visto in fig.~\ref{fig:file_stat_struct} che campo \var{st\_size} di
3494 una struttura \struct{stat} contiene la dimensione del file in byte. In realtà
3495 questo è vero solo se si tratta di un file regolare contenente dei dati; nel
3496 caso di un collegamento simbolico invece la dimensione è quella del
3497 \textit{pathname} che il collegamento stesso contiene, e per una directory
3498 quella dello spazio occupato per le voci della stessa (che dipende da come
3499 queste vengono mantenute dal filesystem), infine per le \textit{fifo}, i socket
3500 ed i file di dispositivo questo campo è sempre nullo.
3501
3502 Il campo \var{st\_blocks} invece definisce la lunghezza del file espressa in
3503 numero di blocchi di 512 byte. La differenza con \var{st\_size} è che in
3504 questo caso si fa riferimento alla quantità di spazio disco allocata per il
3505 file, e non alla dimensione dello stesso che si otterrebbe leggendolo
3506 sequenzialmente.
3507
3508 Si deve tener presente infatti che la lunghezza del file riportata in
3509 \var{st\_size} non è detto che corrisponda all'occupazione dello spazio su
3510 disco, e non solo perché la parte finale del file potrebbe riempire
3511 parzialmente un blocco. In un sistema unix-like infatti è possibile
3512 l'esistenza dei cosiddetti \textit{sparse file}, cioè file in cui sono
3513 presenti dei ``\textsl{buchi}'' (\textit{holes} nella nomenclatura inglese)
3514 che si formano tutte le volte che si va a scrivere su un file dopo aver
3515 eseguito uno spostamento oltre la sua fine (tratteremo in dettaglio
3516 l'argomento in sez.~\ref{sec:file_lseek}).
3517
3518 In questo caso si avranno risultati differenti a seconda del modo in cui si
3519 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
3520 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
3521 legge il contenuto del file (ad esempio usando il comando \cmd{wc -c}), dato
3522 che in tal caso per i ``\textsl{buchi}'' vengono restituiti degli zeri, si
3523 avrà lo stesso risultato di \cmd{ls}.
3524
3525 Se è sempre possibile allargare un file, scrivendoci sopra o usando la
3526 funzione \func{lseek} (vedi sez.~\ref{sec:file_lseek}) per spostarsi oltre la
3527 sua fine, esistono anche casi in cui si può avere bisogno di effettuare un
3528 troncamento, scartando i dati presenti al di là della dimensione scelta come
3529 nuova fine del file.
3530
3531 Un file può sempre essere troncato a zero aprendolo con il flag
3532 \const{O\_TRUNC} (vedi sez.~\ref{sec:file_open_close}), ma questo è un caso
3533 particolare; per qualunque altra dimensione si possono usare le due funzioni
3534 di sistema \funcd{truncate} e \funcd{ftruncate}, i cui prototipi sono:
3535
3536 \begin{funcproto}{
3537 \fhead{unistd.h}
3538 \fdecl{int ftruncate(int fd, off\_t length))}
3539 \fdecl{int truncate(const char *file\_name, off\_t length)}
3540 \fdesc{Troncano un file.} 
3541 }
3542 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3543   caso \var{errno} assumerà uno dei valori: 
3544   \begin{errlist}
3545   \item[\errcode{EINTR}] si è stati interrotti da un segnale.
3546   \item[\errcode{EINVAL}] \param{length} è negativa o maggiore delle
3547     dimensioni massime di un file.
3548   \item[\errcode{EPERM}] il filesystem non supporta il troncamento di un file.
3549   \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
3550   \end{errlist} 
3551   per entrambe, mentre per \func{ftruncate} si avranno anche: 
3552   \begin{errlist}
3553   \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3554   \item[\errcode{EINVAL}] \param{fd} non è un riferimento a un file o non è
3555     aperto in scrittura. 
3556   \end{errlist}
3557   e per \func{truncate} si avranno anche: 
3558   \begin{errlist}
3559   \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file o il
3560     permesso di attraversamento di una delle componenti del \textit{pathname}.
3561   \item[\errcode{EISDIR}] \param{file\_name} fa riferimento ad una directory.
3562   \end{errlist}
3563   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
3564   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR} e \errval{EROFS}
3565   nel loro significato generico.}
3566 \end{funcproto}
3567
3568 Entrambe le funzioni fan sì che la dimensione del file sia troncata ad un
3569 valore massimo specificato da \param{length}, e si distinguono solo per il
3570 fatto che il file viene indicato con un \textit{pathname} per \func{truncate}
3571 e con un file descriptor per \funcd{ftruncate}. Si tenga presente che se il
3572 file è più lungo della lunghezza specificata i dati in eccesso saranno
3573 perduti.
3574
3575 Il comportamento in caso di lunghezza del file inferiore a \param{length} non
3576 è specificato e dipende dall'implementazione: il file può essere lasciato
3577 invariato o esteso fino alla lunghezza scelta. Nel caso di Linux viene esteso
3578 con la creazione di un \textsl{buco} nel file e ad una lettura si otterranno
3579 degli zeri, si tenga presente però che questo comportamento è supportato solo
3580 per filesystem nativi, ad esempio su un filesystem non nativo come il VFAT di
3581 Windows questo non è possibile.
3582
3583
3584 \subsection{I tempi dei file}
3585 \label{sec:file_file_times}
3586
3587 Il sistema mantiene per ciascun file tre tempi, che sono registrati