ec7ad75218655b5f223b2452dfd51ad3c0a662e2
[gapil.git] / filedir.tex
1 %% filedir.tex
2 %%
3 %% Copyright (C) 2000-2018 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{La gestione di file e directory}
13 \label{cha:files_and_dirs}
14
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando da un approfondimento dell'architettura del
17 sistema illustrata a grandi linee in sez.~\ref{sec:file_arch_overview} ed
18 illustrando le principali caratteristiche di un filesystem e le interfacce
19 che consentono di controllarne il montaggio e lo smontaggio. 
20
21 Esamineremo poi le funzioni di libreria che si usano per copiare, spostare e
22 cambiare i nomi di file e directory e l'interfaccia che permette la
23 manipolazione dei loro attributi. Tratteremo inoltre la struttura di base del
24 sistema delle protezioni e del controllo dell'accesso ai file e le successive
25 estensioni (\textit{Extended Attributes}, ACL, quote disco). Tutto quello che
26 riguarda invece la gestione dell'I/O sui file è lasciato al capitolo
27 successivo.
28
29
30
31 \section{L'architettura della gestione dei file}
32 \label{sec:file_arch_func}
33
34 In questa sezione tratteremo con maggiori dettagli rispetto a quanto visto in
35 sez.~\ref{sec:file_arch_overview} il \textit{Virtual File System} di Linux e
36 come il kernel può gestire diversi tipi di filesystem, descrivendo prima le
37 caratteristiche generali di un filesystem di un sistema unix-like, per poi
38 fare una panoramica sul filesystem tradizionalmente più usato con Linux,
39 l'\acr{ext2} ed i suoi successori.
40
41
42 \subsection{Il funzionamento del \textit{Virtual File System} di Linux}
43 \label{sec:file_vfs_work}
44
45 % NOTE articolo interessante:
46 % http://www.ibm.com/developerworks/linux/library/l-virtual-filesystem-switch/index.html?ca=dgr-lnxw97Linux-VFSdth-LXdW&S_TACT=105AGX59&S_CMP=GRlnxw97
47
48 \itindbeg{Virtual~File~System~(VFS)}
49
50 Come illustrato brevemente in sez.~\ref{sec:file_arch_overview} in Linux il
51 concetto di \textit{everything is a file} è stato implementato attraverso il
52 \textit{Virtual File System}, la cui struttura generale è illustrata in
53 fig.~\ref{fig:file_VFS_scheme}.  Il VFS definisce un insieme di funzioni che
54 tutti i filesystem devono implementare per l'accesso ai file che contengono e
55 l'interfaccia che consente di eseguire l'I/O sui file, che questi siano di
56 dati o dispositivi. 
57
58 \itindbeg{inode}
59
60 L'interfaccia fornita dal VFS comprende in sostanza tutte le funzioni che
61 riguardano i file, le operazioni implementate dal VFS sono realizzate con una
62 astrazione che prevede quattro tipi di oggetti strettamente correlati: i
63 filesystem, le \textit{dentry}, gli \textit{inode} ed i file. A questi oggetti
64 corrispondono una serie di apposite strutture definite dal kernel che
65 contengono come campi le funzioni di gestione e realizzano l'infrastruttura
66 del VFS. L'interfaccia è molto complessa, ne faremo pertanto una trattazione
67 estremamente semplificata che consenta di comprenderne i principi
68 di funzionamento.
69
70 Il VFS usa una tabella mantenuta dal kernel che contiene il nome di ciascun
71 filesystem supportato, quando si vuole inserire il supporto di un nuovo
72 filesystem tutto quello che occorre è chiamare la funzione
73 \code{register\_filesystem} passando come argomento la struttura
74 \kstruct{file\_system\_type} (la cui definizione è riportata in
75 fig.~\ref{fig:kstruct_file_system_type}) relativa a quel filesystem. Questa
76 verrà inserita nella tabella, ed il nuovo filesystem comparirà in
77 \procfile{/proc/filesystems}.
78
79 \begin{figure}[!htb]
80   \footnotesize \centering
81   \begin{minipage}[c]{0.80\textwidth}
82     \includestruct{listati/file_system_type.h}
83   \end{minipage}
84   \normalsize 
85   \caption{Estratto della struttura \kstructd{file\_system\_type} usata dal
86     VFS (da \texttt{include/linux/fs.h}).}
87   \label{fig:kstruct_file_system_type}
88 \end{figure}
89
90 La struttura \kstruct{file\_system\_type}, oltre ad una serie di dati interni,
91 come il nome del tipo di filesystem nel campo \var{name},\footnote{quello che
92   viene riportato in \procfile{/proc/filesystems} e che viene usato come
93   valore del parametro dell'opzione \texttt{-t} del comando \texttt{mount} che
94   indica il tipo di filesystem.}  contiene i riferimenti alle funzioni di base
95 che consentono l'utilizzo di quel filesystem. In particolare la funzione
96 \code{mount} del quarto campo è quella che verrà invocata tutte le volte che
97 si dovrà effettuare il montaggio di un filesystem di quel tipo. Per ogni nuovo
98 filesystem si dovrà allocare una di queste strutture ed inizializzare i
99 relativi campi con i dati specifici di quel filesystem, ed in particolare si
100 dovrà creare anche la relativa versione della funzione \code{mount}.
101
102 \itindbeg{pathname}
103 \itindbeg{pathname~resolution}
104
105 Come illustrato in fig.~\ref{fig:kstruct_file_system_type} questa funzione
106 restituisce una \textit{dentry}, abbreviazione che sta per \textit{directory
107   entry}. Le \textit{dentry} sono gli oggetti che il kernel usa per eseguire
108 la \textit{pathname resolution}, ciascuna di esse corrisponde ad un
109 \textit{pathname} e contiene il riferimento ad un \textit{inode}, che come
110 vedremo a breve è l'oggetto usato dal kernel per identificare un
111 file.\footnote{in questo caso si parla di file come di un qualunque oggetto
112   generico che sta sul filesystem e non dell'oggetto file del VFS cui
113   accennavamo prima.} La \textit{dentry} ottenuta dalla chiamata alla funzione
114 \code{mount} sarà inserita in corrispondenza al \textit{pathname} della
115 directory in cui il filesystem è stato montato.
116
117 % NOTA: struct dentry è dichiarata in include/linux/dcache.h
118
119 Le \textit{dentry} sono oggetti del VFS che vivono esclusivamente in memoria,
120 nella cosiddetta \textit{directory entry cache} (spesso chiamata in breve
121 \textit{dcache}). Ogni volta che una \textit{system call} specifica un
122 \textit{pathname} viene effettuata una ricerca nella \textit{dcache} per
123 ottenere immediatamente la \textit{dentry} corrispondente,\footnote{il buon
124   funzionamento della \textit{dcache} è in effetti di una delle parti più
125   critiche per le prestazioni del sistema.} che a sua volta ci darà, tramite
126 l'\textit{inode}, il riferimento al file.
127
128 Dato che normalmente non è possibile mantenere nella \textit{dcache} le
129 informazioni relative a tutto l'albero dei file la procedura della
130 \textit{pathname resolution} richiede un meccanismo con cui riempire gli
131 eventuali vuoti. Il meccanismo prevede che tutte le volte che si arriva ad una
132 \textit{dentry} mancante venga invocata la funzione \texttt{lookup}
133 dell'\textit{inode} associato alla \textit{dentry} precedente nella
134 risoluzione del \textit{pathname},\footnote{che a questo punto è una
135   directory, per cui si può cercare al suo interno il nome di un file.} il cui
136 scopo è risolvere il nome mancante e fornire la sua \textit{dentry} che a
137 questo punto verrà inserita nella cache.
138
139 Dato che tutte le volte che si monta un filesystem la funzione \texttt{mount}
140 (vedi sez.~\ref{sec:filesystem_mounting}) della corrispondente
141 \kstruct{file\_system\_type} inserisce la \textit{dentry} iniziale nel
142 \textit{mount point} dello stesso, si avrà comunque un punto di
143 partenza. Inoltre essendo questa \textit{dentry} relativa a quel tipo di
144 filesystem essa farà riferimento ad un \textit{inode} di quel filesystem, e
145 come vedremo questo farà sì che venga eseguita una \texttt{lookup} adatta per
146 effettuare la risoluzione dei nomi per quel filesystem.
147
148 \itindend{pathname}
149 \itindend{pathname~resolution}
150
151 % Un secondo effetto della chiamata funzione \texttt{mount} di
152 % \kstruct{file\_system\_type} è quello di allocare una struttura
153 % \kstruct{super\_block} per ciascuna istanza montata, che contiene le
154 % informazioni generali di un qualunque filesystem montato, come le opzioni di
155 % montaggio, le dimensioni dei blocchi, quando il filesystem è stato montato
156 % ecc. Fra queste però viene pure inserta, nel campo \var{s\_op}, una ulteriore
157 % struttura \kstruct{super\_operations}, il cui contenuto sono i puntatori
158 % alle funzioni di gestione di un filesystem, anche inizializzata in modo da
159 % utilizzare le versioni specifiche di quel filesystem.
160
161 L'oggetto più importante per il funzionamento del VFS è probabilmente
162 l'\textit{inode}, ma con questo nome si può fare riferimento a due cose
163 diverse.  La prima è la struttura su disco (su cui torneremo anche in
164 sez.~\ref{sec:file_filesystem}) che fa parte della organizzazione dei dati
165 realizzata dal filesystem e che contiene le informazioni relative alle
166 proprietà (i cosiddetti \textsl{metadati}) di ogni oggetto presente su di esso
167 (si intende al solito uno qualunque dei tipi di file di
168 tab.~\ref{tab:file_file_types}).
169
170 La seconda è la corrispondente struttura \kstruct{inode}, della cui
171 definizione si è riportato un estratto in
172 fig.~\ref{fig:kstruct_inode}.\footnote{l'estratto fa riferimento alla versione
173   del kernel 2.6.37.} Questa struttura viene mantenuta in memoria ed è a
174 questa che facevamo riferimento quando parlavamo dell'\textit{inode} associato
175 a ciascuna \textit{dentry}. Nella struttura in memoria sono presenti gli
176 stessi \textsl{metadati} memorizzati su disco, che vengono letti quando questa
177 struttura viene allocata e trascritti all'indietro se modificati.
178
179 \begin{figure}[!htb]
180   \footnotesize \centering
181   \begin{minipage}[c]{0.8\textwidth}
182     \includestruct{listati/inode.h}
183   \end{minipage}
184   \normalsize 
185   \caption{Estratto della struttura \kstructd{inode} del kernel (da
186     \texttt{include/linux/fs.h}).}
187   \label{fig:kstruct_inode}
188 \end{figure}
189
190 Il fatto che la struttura \kstruct{inode} sia mantenuta in memoria,
191 direttamente associata ad una \textit{dentry}, rende sostanzialmente immediate
192 le operazioni che devono semplicemente effettuare un accesso ai dati in essa
193 contenuti: è così ad esempio che viene realizzata la \textit{system call}
194 \func{stat} che vedremo in sez.~\ref{sec:file_stat}. Rispetto ai dati salvati
195 sul disco questa struttura contiene però anche quanto necessario alla
196 implementazione del VFS, ed in particolare è importante il campo \var{i\_op}
197 che, come illustrato in fig.~\ref{fig:kstruct_inode}, contiene il puntatore ad
198 una struttura di tipo \kstruct{inode\_operation}, la cui definizione si può
199 trovare nel file \texttt{include/kernel/fs.h} dei sorgenti del kernel.
200
201 Questa struttura non è altro che una tabella di funzioni, ogni suo membro cioè
202 è un puntatore ad una funzione e, come suggerisce il nome della struttura
203 stessa, queste funzioni sono quelle che definiscono le operazioni che il VFS
204 può compiere su un \textit{inode}. Si sono riportate in
205 tab.~\ref{tab:file_inode_operations} le più rilevanti.
206
207 \begin{table}[htb]
208   \centering
209   \footnotesize
210   \begin{tabular}[c]{|l|l|}
211     \hline
212     \textbf{Funzione} & \textbf{Operazione} \\
213     \hline
214     \hline
215     \textsl{\code{create}} & Chiamata per creare un nuovo file (vedi
216                              sez.~\ref{sec:file_open_close}).\\ 
217     \textsl{\code{link}}   & Crea un \textit{hard link} (vedi
218                              sez.~\ref{sec:link_symlink_rename}).\\
219     \textsl{\code{unlink}} & Cancella un \textit{hard link} (vedi
220                              sez.~\ref{sec:link_symlink_rename}).\\
221     \textsl{\code{symlink}}& Crea un collegamento simbolico (vedi
222                              sez.~\ref{sec:link_symlink_rename}).\\
223     \textsl{\code{mkdir}}  & Crea una directory (vedi
224                              sez.~\ref{sec:file_dir_creat_rem}).\\
225     \textsl{\code{rmdir}}  & Rimuove una directory (vedi
226                              sez.~\ref{sec:file_dir_creat_rem}).\\
227     \textsl{\code{mknod}}  & Crea un file speciale (vedi
228                              sez.~\ref{sec:file_mknod}).\\
229     \textsl{\code{rename}} & Cambia il nome di un file (vedi
230                              sez.~\ref{sec:link_symlink_rename}).\\
231     \textsl{\code{lookup}}&  Risolve il nome di un file.\\
232     \hline
233   \end{tabular}
234   \caption{Le principali operazioni sugli \textit{inode} definite tramite
235     \kstructd{inode\_operation}.} 
236   \label{tab:file_inode_operations}
237 \end{table}
238
239 Possiamo notare come molte di queste funzioni abbiano nomi sostanzialmente
240 identici alle varie \textit{system call} con le quali si gestiscono file e
241 directory, che tratteremo nel resto del capitolo. Quello che succede è che
242 tutte le volte che deve essere eseguita una \textit{system call}, o una
243 qualunque altra operazione su un \textit{inode} (come \texttt{lookup}) il VFS
244 andrà ad utilizzare la funzione corrispondente attraverso il puntatore
245 \var{i\_op}.
246
247 Sarà allora sufficiente che nella realizzazione di un filesystem si crei una
248 implementazione di queste funzioni per quel filesystem e si allochi una
249 opportuna istanza di \kstruct{inode\_operation} contenente i puntatori a dette
250 funzioni. A quel punto le strutture \kstruct{inode} usate per gli oggetti di
251 quel filesystem otterranno il puntatore alla relativa istanza di
252 \kstruct{inode\_operation} e verranno automaticamente usate le funzioni
253 corrette.
254
255 Si noti però come in tab.~\ref{tab:file_inode_operations} non sia presente la
256 funzione \texttt{open} che invece è citata in
257 tab.~\ref{tab:file_file_operations}.\footnote{essa può essere comunque
258   invocata dato che nella struttura \kstruct{inode} è presente anche il
259   puntatore \var{i\_fop} alla struttura \kstruct{file\_operation} che fornisce
260   detta funzione.} Questo avviene perché su Linux l'apertura di un file
261 richiede comunque un'altra operazione che mette in gioco l'omonimo oggetto del
262 VFS: l'allocazione di una struttura di tipo \kstruct{file} che viene associata
263 ad ogni file aperto nel sistema.  I motivi per cui viene usata una struttura a
264 parte sono diversi, anzitutto, come illustrato in sez.~\ref{sec:file_fd},
265 questa è necessaria per le operazioni eseguite dai processi con l'interfaccia
266 dei file descriptor. Ogni processo infatti mantiene il riferimento ad una
267 struttura \kstruct{file} per ogni file che ha aperto, ed è tramite essa che
268 esegue le operazioni di I/O. Inoltre il kernel mantiene un elenco di tutti i
269 file aperti nella \textit{file table} (torneremo su questo in
270 sez.~\ref{sec:file_fd}).
271
272 Inoltre se le operazioni relative agli \textit{inode} fanno riferimento ad
273 oggetti posti all'interno di un filesystem e vi si applicano quindi le
274 funzioni fornite nell'implementazione di quest'ultimo, quando si apre un file
275 questo può essere anche un file di dispositivo, ed in questo caso il VFS
276 invece di usare le operazioni fornite dal filesystem (come farebbe per un file
277 di dati) dovrà invece ricorrere a quelle fornite dal driver del dispositivo.
278
279 \itindend{inode}
280
281 \begin{figure}[!htb]
282   \footnotesize \centering
283   \begin{minipage}[c]{0.8\textwidth}
284     \includestruct{listati/file.h}
285   \end{minipage}
286   \normalsize 
287   \caption{Estratto della struttura \kstructd{file} del kernel (da
288     \texttt{include/linux/fs.h}).}
289   \label{fig:kstruct_file}
290 \end{figure}
291
292 Come si può notare dall'estratto di fig.~\ref{fig:kstruct_file}, la struttura
293 \kstruct{file} contiene, oltre ad alcune informazioni usate dall'interfaccia
294 dei file descriptor il cui significato emergerà più avanti, il puntatore
295 \var{f\_op} ad una struttura \kstruct{file\_operation}. Questa è l'analoga per
296 i file di \kstruct{inode\_operation}, e definisce le operazioni generiche
297 fornite dal VFS per i file. Si sono riportate in
298 tab.~\ref{tab:file_file_operations} le più significative.
299
300 \begin{table}[htb]
301   \centering
302   \footnotesize
303   \begin{tabular}[c]{|l|p{8cm}|}
304     \hline
305     \textbf{Funzione} & \textbf{Operazione} \\
306     \hline
307     \hline
308     \textsl{\code{open}}   & Apre il file (vedi
309                              sez.~\ref{sec:file_open_close}).\\ 
310     \textsl{\code{read}}   & Legge dal file (vedi sez.~\ref{sec:file_read}).\\
311     \textsl{\code{write}}  & Scrive sul file (vedi 
312                              sez.~\ref{sec:file_write}).\\
313     \textsl{\code{llseek}} & Sposta la posizione corrente sul file (vedi
314                              sez.~\ref{sec:file_lseek}).\\
315     \textsl{\code{ioctl}}  & Accede alle operazioni di controllo 
316                              (vedi sez.~\ref{sec:file_fcntl_ioctl}).\\
317     \textsl{\code{readdir}}& Legge il contenuto di una directory (vedi 
318                              sez.~\ref{sec:file_dir_read}).\\
319     \textsl{\code{poll}}   & Usata nell'I/O multiplexing (vedi
320                              sez.~\ref{sec:file_multiplexing}).\\
321     \textsl{\code{mmap}}   & Mappa il file in memoria (vedi 
322                              sez.~\ref{sec:file_memory_map}).\\
323     \textsl{\code{release}}& Chiamata quando l'ultimo riferimento a un file 
324                              aperto è chiuso.\\
325     \textsl{\code{fsync}}  & Sincronizza il contenuto del file (vedi
326                              sez.~\ref{sec:file_sync}).\\
327     \textsl{\code{fasync}} & Abilita l'I/O asincrono (vedi
328                              sez.~\ref{sec:file_asyncronous_io}) sul file.\\
329     \hline
330   \end{tabular}
331   \caption{Operazioni sui file definite tramite \kstructd{file\_operation}.}
332   \label{tab:file_file_operations}
333 \end{table}
334
335 Anche in questo caso tutte le volte che deve essere eseguita una
336 \textit{system call} o una qualunque altra operazione sul file il VFS andrà ad
337 utilizzare la funzione corrispondente attraverso il puntatore
338 \var{f\_op}. Dato che è cura del VFS quando crea la struttura all'apertura del
339 file assegnare a \var{f\_op} il puntatore alla versione di
340 \kstruct{file\_operation} corretta per quel file, sarà possibile scrivere allo
341 stesso modo sulla porta seriale come su un normale file di dati, e lavorare
342 sui file allo stesso modo indipendentemente dal filesystem.
343
344 Il VFS realizza la quasi totalità delle operazioni relative ai file grazie
345 alle funzioni presenti nelle due strutture \kstruct{inode\_operation} e
346 \kstruct{file\_operation}.  Ovviamente non è detto che tutte le operazioni
347 possibili siano poi disponibili in tutti i casi, ad esempio \code{llseek} non
348 sarà presente per un dispositivo come la porta seriale o per una
349 \textit{fifo}, mentre sui file del filesystem \texttt{vfat} non saranno
350 disponibili i permessi, ma resta il fatto che grazie al VFS le \textit{system
351   call} per le operazioni sui file possono restare sempre le stesse nonostante
352 le enormi differenze che possono esserci negli oggetti a cui si applicano.
353  
354
355 \itindend{Virtual~File~System~(VFS)}
356
357 % NOTE: documentazione interessante:
358 %       * sorgenti del kernel: Documentation/filesystems/vfs.txt
359 %       * http://thecoffeedesk.com/geocities/rkfs.html
360 %       * http://www.linux.it/~rubini/docs/vfs/vfs.html
361
362
363
364 \subsection{Il funzionamento di un filesystem Unix}
365 \label{sec:file_filesystem}
366
367 Come già accennato in sez.~\ref{sec:file_arch_overview} Linux (ed ogni sistema
368 unix-like) organizza i dati che tiene su disco attraverso l'uso di un
369 filesystem. Una delle caratteristiche di Linux rispetto agli altri Unix è
370 quella di poter supportare, grazie al VFS, una enorme quantità di filesystem
371 diversi, ognuno dei quali avrà una sua particolare struttura e funzionalità
372 proprie.  Per questo non entreremo nei dettagli di un filesystem specifico, ma
373 daremo una descrizione a grandi linee che si adatta alle caratteristiche
374 comuni di qualunque filesystem di un sistema unix-like.
375
376 \itindbeg{superblock}
377
378 Una possibile strutturazione dell'informazione su un disco è riportata in
379 fig.~\ref{fig:file_disk_filesys}, dove si hanno tre filesystem su tre
380 partizioni. In essa per semplicità si è fatto riferimento alla struttura del
381 filesystem \acr{ext2}, che prevede una suddivisione dei dati in \textit{block
382   group}.  All'interno di ciascun \textit{block group} viene anzitutto
383 replicato il cosiddetto \textit{superblock}, (la struttura che contiene
384 l'indice iniziale del filesystem e che consente di accedere a tutti i dati
385 sottostanti) e creata una opportuna suddivisione dei dati e delle informazioni
386 per accedere agli stessi.  Sulle caratteristiche di \acr{ext2} e derivati
387 torneremo in sez.~\ref{sec:file_ext2}.
388
389 \itindend{superblock}
390 \itindbeg{inode}
391
392 È comunque caratteristica comune di tutti i filesystem per Unix,
393 indipendentemente da come poi viene strutturata nei dettagli questa
394 informazione, prevedere la presenza di due tipi di risorse: gli
395 \textit{inode}, cui abbiamo già accennato in sez.~\ref{sec:file_vfs_work}, che
396 sono le strutture che identificano i singoli oggetti sul filesystem, e i
397 blocchi, che invece attengono allo spazio disco che viene messo a disposizione
398 per i dati in essi contenuti.
399
400 \begin{figure}[!htb]
401   \centering
402   \includegraphics[width=11cm]{img/disk_struct}
403   \caption{Organizzazione dello spazio su un disco in partizioni e
404   filesystem.}
405   \label{fig:file_disk_filesys}
406 \end{figure}
407
408 Se si va ad esaminare con maggiore dettaglio la strutturazione
409 dell'informazione all'interno del filesystem \textsl{ext2}, tralasciando i
410 dettagli relativi al funzionamento del filesystem stesso come la
411 strutturazione in gruppi dei blocchi, il \textit{superblock} e tutti i dati di
412 gestione possiamo esemplificare la situazione con uno schema come quello
413 esposto in fig.~\ref{fig:file_filesys_detail}.
414
415 \begin{figure}[!htb]
416   \centering
417   \includegraphics[width=11cm]{img/filesys_struct}
418   \caption{Strutturazione dei dati all'interno di un filesystem.}
419   \label{fig:file_filesys_detail}
420 \end{figure}
421
422 Da fig.~\ref{fig:file_filesys_detail} si evidenziano alcune delle
423 caratteristiche di base di un filesystem, che restano le stesse anche su
424 filesystem la cui organizzazione dei dati è totalmente diversa da quella
425 illustrata, e sulle quali è bene porre attenzione visto che sono fondamentali
426 per capire il funzionamento delle funzioni che manipolano i file e le
427 directory che tratteremo nel prosieguo del capitolo. In particolare è
428 opportuno tenere sempre presente che:
429
430
431 \begin{enumerate*}
432   
433 \item L'\textit{inode} contiene i cosiddetti \textsl{metadati}, vale dire le
434   informazioni riguardanti le proprietà del file come oggetto del filesystem:
435   il tipo di file, i permessi di accesso, le dimensioni, i puntatori ai
436   blocchi fisici che contengono i dati e così via. Le informazioni che la
437   funzione \func{stat} (vedi sez.~\ref{sec:file_stat}) fornisce provengono
438   dall'\textit{inode}.  Dentro una directory si troverà solo il nome del file
439   e il numero dell'\textit{inode} ad esso associato; il nome non è una
440   proprietà del file e non viene mantenuto nell'\textit{inode}. Da da qui in
441   poi chiameremo il nome del file contenuto in una directory
442   ``\textsl{voce}'', come traduzione della nomenclatura inglese
443   \textit{directory entry} che non useremo per evitare confusione con le
444   \textit{dentry} del kernel viste in sez.~\ref{sec:file_vfs_work}.
445   
446 \item Come mostrato in fig.~\ref{fig:file_filesys_detail} per i file
447   \texttt{macro.tex} e \texttt{gapil\_macro.tex}, ci possono avere più voci
448   che fanno riferimento allo stesso \textit{inode}. Fra le proprietà di un
449   file mantenute nell'\textit{inode} c'è anche il contatore con il numero di
450   riferimenti che sono stati fatti ad esso, il cosiddetto \textit{link
451     count}.\footnote{mantenuto anche nel campo \var{i\_nlink} della struttura
452     \kstruct{inode} di fig.~\ref{fig:kstruct_inode}.}  Solo quando questo
453   contatore si annulla i dati del file possono essere effettivamente rimossi
454   dal disco. Per questo la funzione per cancellare un file si chiama
455   \func{unlink} (vedi sez.~\ref{sec:link_symlink_rename}), ed in realtà non
456   cancella affatto i dati del file, ma si limita ad eliminare la relativa voce
457   da una directory e decrementare il numero di riferimenti
458   nell'\textit{inode}.
459   
460 \item All'interno di ogni filesystem ogni \textit{inode} è identificato da un
461   numero univoco. Il numero di \textit{inode} associato ad una voce in una
462   directory si riferisce ad questo numero e non ci può essere una directory
463   che contiene riferimenti ad \textit{inode} relativi ad altri filesystem.
464   Questa è la ragione che limita l'uso del comando \cmd{ln}, che crea una
465   nuova voce per un file esistente con la funzione \func{link} (vedi
466   sez.~\ref{sec:link_symlink_rename}), a operare su file nel filesystem
467   corrente.
468   
469 \item Quando si cambia nome ad un file senza cambiare filesystem il contenuto
470   del file non viene spostato fisicamente, viene semplicemente creata una
471   nuova voce per l'\textit{inode} in questione e rimossa la precedente, questa
472   è la modalità in cui opera normalmente il comando \cmd{mv} attraverso la
473   funzione \func{rename} (vedi sez.~\ref{sec:link_symlink_rename}). Questa
474   operazione non modifica minimamente neanche l'\textit{inode} del file, dato
475   che non si opera sul file ma sulla directory che lo contiene.
476
477 \item Gli \textit{inode} dei file, che contengono i \textsl{metadati}, ed i
478   blocchi di spazio disco, che contengono i dati, sono risorse indipendenti ed
479   in genere vengono gestite come tali anche dai diversi filesystem; è pertanto
480   possibile esaurire sia lo spazio disco (il caso più comune) che lo spazio
481   per gli \textit{inode}. Nel primo caso non sarà possibile allocare ulteriore
482   spazio, ma si potranno creare file (vuoti), nel secondo non si potranno
483   creare nuovi file, ma si potranno estendere quelli che ci
484   sono.\footnote{questo comportamento non è generale, alcuni filesystem più
485     sofisticati possono evitare il problema dell'esaurimento degli
486     \textit{inode} riallocando lo spazio disco libero per i blocchi.}
487
488 \end{enumerate*}
489
490 \begin{figure}[!htb]
491   \centering 
492   \includegraphics[width=12cm]{img/dir_links}
493   \caption{Organizzazione dei \textit{link} per le directory.}
494   \label{fig:file_dirs_link}
495 \end{figure}
496
497 Infine tenga presente che, essendo file pure loro, il numero di riferimenti
498 esiste anche per le directory. Per questo se a partire dalla situazione
499 mostrata in fig.~\ref{fig:file_filesys_detail} creiamo una nuova directory
500 \file{img} nella directory \file{gapil}, avremo una situazione come quella
501 illustrata in fig.~\ref{fig:file_dirs_link}.
502
503 La nuova directory avrà un numero di riferimenti pari a due, in quanto è
504 referenziata dalla directory da cui si era partiti (in cui è inserita la nuova
505 voce che fa riferimento a \texttt{img}) e dalla voce interna ``\texttt{.}''
506 che è presente in ogni directory.  Questo è il valore che si troverà sempre
507 per ogni directory che non contenga a sua volta altre directory. Al contempo,
508 la directory da cui si era partiti avrà un numero di riferimenti di almeno
509 tre, in quanto adesso sarà referenziata anche dalla voce ``\texttt{..}'' di
510 \texttt{img}. L'aggiunta di una sottodirectory fa cioè crescere di uno il
511 \textit{link count} della directory genitrice.
512
513 \itindend{inode}
514
515
516 \subsection{Alcuni dettagli sul filesystem \textsl{ext2} e successori}
517 \label{sec:file_ext2}
518
519 Benché non esista ``il'' filesystem di Linux, dato che esiste un supporto
520 nativo di diversi filesystem che sono in uso da anni, quello che gli avvicina
521 di più è la famiglia di filesystem evolutasi a partire dal \textit{second
522   extended filesystem}, o \acr{ext2}. Il filesystem \acr{ext2} ha subito un
523 grande sviluppo e diverse evoluzioni, fra cui l'aggiunta del
524 \textit{journaling} con il passaggio ad \acr{ext3}, che probabilmente è ancora
525 il filesystem più diffuso, ed una serie di ulteriori miglioramenti con il
526 successivo \acr{ext4}. In futuro è previsto che questo debba essere sostituito
527 da un filesystem completamente diverso, \acr{btrfs}, che dovrebbe diventare il
528 filesystem standard di Linux, ma questo al momento è ancora in fase di
529 sviluppo.\footnote{si fa riferimento al momento dell'ultima revisione di
530   questo paragrafo, l'inizio del 2012.}
531
532 Il filesystem \acr{ext2} nasce come filesystem nativo per Linux a partire
533 dalle prime versioni del kernel e supporta tutte le caratteristiche di un
534 filesystem standard Unix: è in grado di gestire nomi di file lunghi (256
535 caratteri, estensibili a 1012) e supporta una dimensione massima dei file fino
536 a 4~Tb. I successivi filesystem \acr{ext3} ed \acr{ext4} sono evoluzioni di
537 questo filesystem, e sia pure con molti miglioramenti ed estensioni
538 significative ne mantengono le caratteristiche fondamentali.
539
540 Oltre alle caratteristiche standard, \acr{ext2} fornisce alcune estensioni che
541 non sono presenti su un classico filesystem di tipo Unix; le principali sono
542 le seguenti:
543 \begin{itemize*}
544 \item gli attributi estesi (vedi sez.~\ref{sec:file_xattr}) che consentono di
545   estendere le informazioni salvabili come metadati e le ACL (vedi
546   sez.~\ref{sec:file_ACL}) che consentono di estendere il modello tradizionale
547   dei permessi sui file.
548 \item sono supportate entrambe le semantiche di BSD e SVr4 come opzioni di
549   montaggio. La semantica BSD comporta che i file in una directory sono creati
550   con lo stesso identificatore di gruppo della directory che li contiene. La
551   semantica SVr4 comporta che i file vengono creati con l'identificatore del
552   gruppo primario del processo, eccetto il caso in cui la directory ha il bit
553   di \acr{sgid} impostato (per una descrizione dettagliata del significato di
554   questi termini si veda sez.~\ref{sec:file_access_control}), nel qual caso
555   file e subdirectory ereditano sia il \ids{GID} che lo \acr{sgid}.
556 \item l'amministratore può scegliere la dimensione dei blocchi del filesystem
557   in fase di creazione, a seconda delle sue esigenze: blocchi più grandi
558   permettono un accesso più veloce, ma sprecano più spazio disco.
559 \item il filesystem implementa collegamenti simbolici veloci, in cui il nome
560   del file non è salvato su un blocco, ma tenuto all'interno
561   dell'\textit{inode} (evitando letture multiple e spreco di spazio), non
562   tutti i nomi però possono essere gestiti così per limiti di spazio (il
563   limite è 60 caratteri).
564 \item vengono supportati i cosiddetti \textit{file attributes} (vedi
565   sez.~\ref{sec:file_perm_overview}) che attivano comportamenti specifici per
566   i file su cui vengono attivati come marcarli come immutabili (che possono
567   cioè essere soltanto letti) per la protezione di file di configurazione
568   sensibili, o come \textit{append-only} (che possono essere aperti in
569   scrittura solo per aggiungere dati) per la protezione dei file di log.
570 \end{itemize*}
571
572 La struttura di \acr{ext2} è stata ispirata a quella del filesystem di BSD: un
573 filesystem è composto da un insieme di blocchi, la struttura generale è quella
574 riportata in fig.~\ref{fig:file_filesys_detail}, in cui la partizione è divisa
575 in gruppi di blocchi.
576
577 Ciascun gruppo di blocchi contiene una copia delle informazioni essenziali del
578 filesystem (i \textit{superblock} sono quindi ridondati) per una maggiore
579 affidabilità e possibilità di recupero in caso di corruzione del
580 \textit{superblock} principale. L'utilizzo di raggruppamenti di blocchi ha
581 inoltre degli effetti positivi nelle prestazioni dato che viene ridotta la
582 distanza fra i dati e la tabella degli \textit{inode}.
583
584 \begin{figure}[!htb]
585   \centering
586   \includegraphics[width=9cm]{img/dir_struct}  
587   \caption{Struttura delle directory nel \textit{second extended filesystem}.}
588   \label{fig:file_ext2_dirs}
589 \end{figure}
590
591
592 Le directory sono implementate come una \textit{linked list} con voci di
593 dimensione variabile. Ciascuna voce della lista contiene il numero di
594 \textit{inode}, la sua lunghezza, il nome del file e la sua lunghezza, secondo
595 lo schema in fig.~\ref{fig:file_ext2_dirs}; in questo modo è possibile
596 implementare nomi per i file anche molto lunghi (fino a 1024 caratteri) senza
597 sprecare spazio disco.
598
599 Con l'introduzione del filesystem \textit{ext3} sono state introdotte diverse
600 modifiche strutturali, la principale di queste è quella che \textit{ext3} è un
601 filesystem \textit{journaled}, è cioè in grado di eseguire una registrazione
602 delle operazioni di scrittura su un giornale (uno speciale file interno) in
603 modo da poter garantire il ripristino della coerenza dei dati del
604 filesystem\footnote{si noti bene che si è parlato di dati \textsl{del}
605   filesystem, non di dati \textsl{nel} filesystem, quello di cui viene
606   garantito un veloce ripristino è relativo ai dati della struttura interna
607   del filesystem, non di eventuali dati contenuti nei file che potrebbero
608   essere stati persi.} in brevissimo tempo in caso di interruzione improvvisa
609 della corrente o di crollo del sistema che abbia causato una interruzione
610 della scrittura dei dati sul disco.
611
612 Oltre a questo \textit{ext3} introduce ulteriori modifiche volte a migliorare
613 sia le prestazioni che la semplicità di gestione del filesystem, in
614 particolare per le directory si è passato all'uso di alberi binari con
615 indicizzazione tramite \textit{hash} al posto delle \textit{linked list} che
616 abbiamo illustrato, ottenendo un forte guadagno di prestazioni in caso di
617 directory contenenti un gran numero di file.
618
619 % TODO (bassa priorità) portare a ext3, ext4 e btrfs ed illustrare le
620 % problematiche che si possono incontrare (in particolare quelle relative alla
621 % perdita di contenuti in caso di crash del sistema)
622 % TODO (media priorità) trattare btrfs quando sarà usato come stabile
623
624
625 \subsection{La gestione dell'uso dei filesystem}
626 \label{sec:filesystem_mounting}
627
628 Come accennato in sez.~\ref{sec:file_arch_overview} per poter accedere ai file
629 occorre rendere disponibile al sistema il filesystem su cui essi sono
630 memorizzati. L'operazione di attivazione del filesystem è chiamata
631 \textsl{montaggio} e per far questo in Linux si usa la funzione di sistema
632 \funcd{mount}, il cui prototipo è:\footnote{la funzione è una versione
633   specifica di Linux che usa la omonima \textit{system call} e non è
634   portabile.}
635
636 \begin{funcproto}{
637 \fhead{sys/mount.h} 
638 \fdecl{mount(const char *source, const char *target, const char
639   *filesystemtype, \\ 
640 \phantom{mount(}unsigned long mountflags, const void *data)}
641 \fdesc{Monta un filesystem.} 
642 }
643 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
644   caso \var{errno} assumerà uno dei valori:
645   \begin{errlist}
646   \item[\errcode{EACCES}] non si ha il permesso di accesso su uno dei
647     componenti del \textit{pathname}, o si è cercato di montare un filesystem
648     disponibile in sola lettura senza aver specificato \const{MS\_RDONLY} o il
649     device \param{source} è su un filesystem montato con l'opzione
650     \const{MS\_NODEV}.
651   \item[\errcode{EBUSY}] \param{source} è già montato, o non può essere
652     rimontato in sola lettura perché ci sono ancora file aperti in scrittura,
653     o non può essere montato su \param{target} perché la directory è ancora in
654     uso.
655   \item[\errcode{EINVAL}] il dispositivo \param{source} presenta un
656     \textit{superblock} non valido, o si è cercato di rimontare un filesystem
657     non ancora montato, o di montarlo senza che \param{target} sia un
658     \textit{mount point} o di spostarlo quando \param{target} non è un
659     \textit{mount point} o è la radice o si è usato un valore di
660     \param{mountflags} non valido.
661   \item[\errcode{ELOOP}] si è cercato di spostare un \textit{mount point} su
662     una sottodirectory di \param{source} o si sono incontrati troppi
663     collegamenti simbolici nella risoluzione di un nome.
664   \item[\errcode{EMFILE}] in caso di filesystem virtuale, la tabella dei
665     dispositivi fittizi (chiamati \textit{dummy} nella documentazione inglese)
666     è piena.
667   \item[\errcode{ENODEV}] il tipo \param{filesystemtype} non esiste o non è
668     configurato nel kernel.
669   \item[\errcode{ENOTBLK}] non si è usato un \textit{block device} per
670     \param{source} quando era richiesto.
671   \item[\errcode{ENXIO}] il \textit{major number} del
672     dispositivo \param{source} è sbagliato.
673   \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
674   \end{errlist} 
675   ed inoltre \errval{EFAULT}, \errval{ENOMEM}, \errval{ENAMETOOLONG},
676   \errval{ENOENT}, \errval{ENOTDIR} nel loro significato generico.}
677 \end{funcproto}
678
679 \itindbeg{mount~point}
680
681 L'uso più comune della funzione è quello di montare sulla directory indicata
682 da \param{target}, detta \textit{mount point}, il filesystem contenuto nel
683 file di dispositivo indicato da \param{source}. In entrambi i casi, come
684 daremo per assunto da qui in avanti tutte le volte che si parla di directory o
685 file nel passaggio di un argomento di una funzione, si intende che questi
686 devono essere indicati con la stringa contenente il loro \textit{pathname}.
687
688 Normalmente un filesystem è contenuto su un disco o una partizione, ma come
689 illustrato in sez.~\ref{sec:file_vfs_work} la struttura del \textit{Virtual
690   File System} è estremamente flessibile e può essere usata anche per oggetti
691 diversi da un disco. Ad esempio usando il \textit{loop device} si può montare
692 un file qualunque (come l'immagine di un CD-ROM o di un floppy) che contiene
693 l'immagine di un filesystem, inoltre alcuni tipi di filesystem, come
694 \texttt{proc} o \texttt{sysfs} sono virtuali e non hanno un supporto che ne
695 contenga i dati che sono generati al volo dal kernel ad ogni lettura, e
696 inviati al kernel ad ogni scrittura (costituiscono quindi un meccanismo di
697 comunicazione, attraverso l'ordinaria interfaccia dei file, con il kernel).
698
699 Il tipo di filesystem che si vuole montare è specificato
700 dall'argomento \param{filesystemtype}, che deve essere una delle stringhe
701 riportate nel file \procfilem{/proc/filesystems} che, come accennato in
702 sez.~\ref{sec:file_vfs_work}, contiene l'elenco dei filesystem supportati dal
703 kernel. Nel caso si sia indicato un filesystem virtuale, che non è associato a
704 nessun file di dispositivo, il contenuto di \param{source} viene ignorato.
705
706 L'argomento \param{data} viene usato per passare le impostazioni relative alle
707 caratteristiche specifiche di ciascun filesystem. Si tratta di una stringa di
708 parole chiave (separate da virgole e senza spazi) che indicano le cosiddette
709 ``\textsl{opzioni}'' del filesystem che devono essere impostate; in genere
710 viene usato direttamente il contenuto del parametro dell'opzione \texttt{-o}
711 del comando \texttt{mount}. I valori utilizzabili dipendono dal tipo di
712 filesystem e ciascuno ha i suoi, pertanto si rimanda alla documentazione della
713 pagina di manuale di questo comando e dei singoli filesystem.
714
715 Dopo l'esecuzione della funzione il contenuto del filesystem viene reso
716 disponibile nella directory specificata come \textit{mount point} ed il
717 precedente contenuto di detta directory viene mascherato dal contenuto della
718 directory radice del filesystem montato. Fino ai kernel della serie 2.2.x non
719 era possibile montare un filesystem se un \textit{mount point} era già in uso,
720 coi kernel successivi è possibile montare più filesystem sullo stesso
721 \textit{mount point} impilandoli l'uno sull'altro, anche in questo caso vale
722 quanto appena detto, e solo il contenuto dell'ultimo filesystem montato sarà
723 visibile, mascherando quelli sottostanti.
724
725 In realtà quella di montare un filesystem è solo una delle operazioni che si
726 possono effettuare con \func{mount}, la funzione infatti è dedicata a tutte le
727 operazioni relative alla gestione del montaggio dei filesystem e dei
728 \textit{mount point}. Ad esempio fin dalle sue origini poteva essere
729 utilizzata per effettuare il rimontaggio di un filesystem con opzioni diverse,
730 ed a partire dal kernel 2.4.x è divenuto possibile usarla per spostare
731 atomicamente un \textit{mount point} da una directory ad un'altra, per montare
732 lo stesso filesystem in diversi \textit{mount point}, per montare una
733 directory su un'altra (il cosiddetto \textit{bind mount}).
734
735 \itindend{mount~point}
736
737 Il tipo di operazione compiuto da \func{mount} viene stabilito in base al
738 valore dell'argomento \param{mountflags}, che oltre alla selezione del tipo di
739 operazione da compiere, consente anche di indicare alcune opzioni generiche
740 valide per qualunque filesystem.\footnote{benché queste siano espresse nel
741   comando \cmd{mount} con l'opzione \texttt{-o} esse non vengono impostate nei
742   valori di \param{data}, che serve solo per le opzioni specifiche di ogni
743   filesystem.}  Il valore dell'argomento deve essere espresso come maschera
744 binaria e i vari bit che lo compongono, detti anche \textit{mount flags},
745 devono essere impostati con un OR aritmetico dei valori dalle opportune
746 costanti che illustreremo a breve.
747
748 In Linux \param{mountflags} deve essere un intero a 32 bit;
749 fino ai kernel della serie 2.2.x i 16 più significativi avevano un valore
750 riservato che doveva essere specificato obbligatoriamente,\footnote{il valore
751   era il \textit{magic number} \code{0xC0ED}, si può usare la costante
752   \constd{MS\_MGC\_MSK} per ottenere la parte di \param{mountflags} riservata
753   al \textit{magic number}, mentre per specificarlo si può dare un OR
754   aritmetico con la costante \constd{MS\_MGC\_VAL}.} e si potevano usare solo
755 i 16 meno significativi. Oggi invece, con un numero di opzioni superiore, sono
756 utilizzati tutti e 32 i bit, ma qualora nei 16 più significativi sia presente
757 detto valore, che non esprime una combinazione valida, esso viene ignorato.
758
759 Come accennato il tipo di operazione eseguito da \func{mount} viene stabilito
760 in base al contenuto di \param{mountflags}, la scelta viene effettuata
761 controllando nell'ordine:
762 \begin{enumerate*}
763 \item se è presente il flag \const{MS\_REMOUNT}, nel qual caso verrà eseguito
764   il rimontaggio del filesystem, con le nuove opzioni indicate da \param{data}
765   e dagli altri flag di \param{mountflags};
766 \item se è presente il flag \const{MS\_BIND}, nel qual caso verrà eseguito un
767   \textit{bind mount} (argomento che tratteremo più avanti);
768 \item se è presente uno fra \const{MS\_SHARED}, \const{MS\_PRIVATE},
769   \const{MS\_SLAVE}, \const{MS\_UNBINDABLE}, nel qual caso verrà cambiata la
770   modalità di propagazione del montaggio (detti valori sono mutualmente
771   esclusivi).
772 \item se è presente \const{MS\_MOVE}, nel qual caso verrà effettuato uno
773   spostamento del \textit{mount point};
774 \item se nessuno dei precedenti è presente si tratta di una ordinaria
775   operazione di montaggio di un filesystem.
776 \end{enumerate*}
777
778 Il fatto che questi valori vengano controllati in quest'ordine significa che
779 l'effetto di alcuni di questi flag possono cambiare se usati in combinazione
780 con gli altri che vengono prima nella sequenza (è quanto avviene ad esempio
781 per \const{MS\_BIND} usato con \const{MS\_REMOUNT}). Tratteremo questi
782 \textit{mount flags} speciali per primi, nell'ordine appena illustrato,
783 tornando sugli altri più avanti.
784
785 Usando il flag \constd{MS\_REMOUNT} si richiede a \func{mount} di rimontare un
786 filesystem già montato cambiandone le opzioni di montaggio in maniera atomica
787 (non è cioè necessario smontare e rimontare il filesystem per effettuare il
788 cambiamento). Questa operazione consente di modificare le opzioni del
789 filesystem anche se questo è in uso. Gli argomenti \param{source} e
790 \param{target} devono essere gli stessi usati per il montaggio originale,
791 mentre sia \param{data} che \param{mountflags} conterranno le nuove opzioni,
792 \param{filesystemtype} viene ignorato.  Perché l'operazione abbia successo
793 occorre comunque che il cambiamento sia possibile (ad esempio non sarà
794 possibile rimontare in sola lettura un filesystem su cui sono aperti file per
795 la lettura/scrittura).
796
797 Qualunque opzione specifica del filesystem indicata con \param{data} può
798 essere modificata (ma si dovranno rielencare tutte quelle volute), mentre con
799 \param{mountflags} possono essere modificate solo alcune opzioni generiche:
800 \const{MS\_LAZYTIME}, \const{MS\_MANDLOCK}, \const{MS\_NOATIME},
801 \const{MS\_NODEV}, \const{MS\_NODIRATIME}, \const{MS\_NOEXEC},
802 \const{MS\_NOSUID}, \const{MS\_RELATIME}, \const{MS\_RDONLY},
803 \const{MS\_STRICTATIME} e \const{MS\_SYNCHRONOUS}. Inoltre dal kernel 3.17 il
804 comportamento relativo alle opzioni che operano sui tempi di ultimo accesso
805 dei file (vedi sez.~\ref{sec:file_file_times}) è cambiato e se non si è
806 indicato nessuno dei vari \texttt{MS\_*ATIME} vengono mantenute le
807 impostazioni esistenti anziché forzare l'uso di \const{MS\_RELATIME}.
808
809 \itindbeg{bind~mount}
810
811 Usando il flag \constd{MS\_BIND} si richiede a \func{mount} di effettuare un
812 cosiddetto \textit{bind mount}, l'operazione che consente di montare una
813 directory di un filesystem in un'altra directory. L'opzione è disponibile a
814 partire dai kernel della serie 2.4. In questo caso verranno presi in
815 considerazione solo gli argomenti \param{source}, che stavolta indicherà la
816 directory che si vuole montare e non un file di dispositivo, e \param{target}
817 che indicherà la directory su cui verrà effettuato il \textit{bind mount}. Gli
818 argomenti \param{filesystemtype} e \param{data} vengono ignorati.
819
820 Quello che avviene con questa operazione è che in corrispondenza del
821 \textit{pathname} indicato da \param{target} viene montato l'\textit{inode} di
822 \param{source}, così che la porzione di albero dei file presente sotto
823 \param{source} diventi visibile allo stesso modo sotto
824 \param{target}. Trattandosi esattamente dei dati dello stesso filesystem, ogni
825 modifica fatta in uno qualunque dei due rami di albero sarà visibile
826 nell'altro, visto che entrambi faranno riferimento agli stessi \textit{inode}.
827
828 Dal punto di vista del VFS l'operazione è analoga al montaggio di un
829 filesystem proprio nel fatto che anche in questo caso si inserisce in
830 corrispondenza della \textit{dentry} di \texttt{target} un diverso
831 \textit{inode}, che stavolta, invece di essere quello della radice del
832 filesystem indicato da un file di dispositivo, è quello di una directory già
833 montata.
834
835 Si tenga presente che proprio per questo sotto \param{target} comparirà il
836 contenuto che è presente sotto \param{source} all'interno del filesystem in
837 cui quest'ultima è contenuta. Questo potrebbe non corrispondere alla porzione
838 di albero che sta sotto \param{source} qualora in una sottodirectory di
839 quest'ultima si fosse effettuato un altro montaggio. In tal caso infatti nella
840 porzione di albero sotto \param{source} si troverebbe il contenuto del nuovo
841 filesystem (o di un altro \textit{bind mount}) mentre sotto \param{target} ci
842 sarebbe il contenuto presente nel filesystem originale.
843
844 L'unico altro \textit{mount flag} usabile direttamente con \const{MS\_BIND} è
845 \const{MS\_REC} che consente di eseguire una operazione di \textit{bind mount}
846 ricorsiva, in cui sotto \param{target} vengono montati ricorsivamente anche
847 tutti gli eventuali ulteriori \textit{bind mount} già presenti sotto
848 \param{source}.
849
850 E' però possibile, a partire dal kernel 2.6.26, usare questo flag insieme a
851 \const{MS\_REMOUNT}, nel qual caso consente di effettuare una modifica delle
852 opzioni di montaggio del \textit{bind mount} ed in particolare effettuare il
853 cosiddetto \textit{read-only bind mount} in cui viene onorata anche la
854 presenza aggiuntiva del flag \const{MS\_RDONLY}. In questo modo si ottiene che
855 l'accesso ai file sotto \param{target} sia effettuabile esclusivamente in sola
856 lettura, mantenendo il normale accesso in lettura/scrittura sotto
857 \param{source}.
858
859 Il supporto per il \textit{bind mount} consente di superare i limiti presenti
860 per gli \textit{hard link} (di cui parleremo in
861 sez.~\ref{sec:link_symlink_rename}) con la possibilità di fare riferimento
862 alla porzione dell'albero dei file di un filesystem presente a partire da una
863 certa directory utilizzando una qualunque altra directory, anche se questa sta
864 su un filesystem diverso.\footnote{e non c'è neanche il problema di non esser
865   più in grado di cancellare un \textit{hard link} ad una directory sullo
866   stesso filesystem (vedi sez.~\ref{sec:link_symlink_rename}), per cui su
867   Linux questi non sono possibili, dato che in questo caso per la rimozione
868   del collegamento basta smontare \param{target}.} Si può così fornire una
869 alternativa all'uso dei collegamenti simbolici (di cui parleremo in
870 sez.~\ref{sec:link_symlink_rename}) che funziona correttamente anche
871 all'intero di un \textit{chroot} (argomento su cui torneremo in
872 sez.~\ref{sec:file_chroot}).
873
874 \itindend{bind~mount}
875 \itindbeg{shared~subtree}
876
877 I quattro flag \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
878 \const{MS\_UNBINDABLE} sono stati introdotti a partire dal kernel 2.6.15 per
879 realizzare l'infrastruttura dei cosiddetti \textit{shared subtree}, che
880 estendono le funzionalità dei \textit{bind mount}.  La funzionalità nasce
881 dalle esigenze di poter utilizzare a pieno le funzionalità di isolamento
882 fornite dal kernel per i processi (i \textit{namespace}, che tratteremo in
883 sez.~\ref{sec:process_namespaces}) in particolare per quanto riguarda la
884 possibilità di far avere ad un processo una visione ristretta dei filesystem
885 montati (il \textit{mount namespace}), ma l'applicazione è comunque rilevante
886 anche con un classico \textit{chroot} (vedi sez.~\ref{sec:file_chroot}).
887
888 \itindbeg{submount}
889
890 Abbiamo visto come nella modalità ordinaria in cui si esegue un
891 \textit{bind mount} sotto \param{target} compaia lo stesso ramo di albero dei
892 file presente sotto \param{source}, ma limitato a quanto presente nel
893 filesystem di \param{source}; i risultati di un eventuale
894 ``\textit{submount}'' effettuato all'interno di \param{source} non saranno
895 visibili. Ed anche se quelli presenti al momento dell'uso di \const{MS\_BIND}
896 possono essere riottenuti usando \const{MS\_REC}, ogni eventuale
897 ``\textit{submount}'' successivo (che avvenga sotto \param{source} o sotto
898 \param{target}) resterà ``\textsl{privato}'' al ramo di albero su cui è
899 avvenuto.
900
901 \itindend{submount}
902 \itindbeg{mount peer group}
903
904 Ci sono casi però in cui può risultare utile che eventuali
905 ``\textit{submount}'' siano visibili sui rami di albero presenti al di sotto
906 di tutte le directory coinvolte in un \textit{bind mount}, anche se effettuati
907 in un secondo tempo. Per poter ottenere questa funzionalità i
908 \textit{bind mount} sono stati estesi introducendo i \textit{mount peer
909   group}, che consentono di raggrupparli in modo da poter inviare a ciascuno
910 di essi tutti gli eventi relativi a montaggi o smontaggi effettuati al loro
911 interno ed avere sempre una propagazione degli stessi che li renda coerenti.
912
913 Quando si effettua un montaggio ordinario, o si esegue un \textit{bind mount},
914 di default non viene utilizzato nessun \textit{mount peer group} ed il
915 \textit{mount point} viene classificato come ``\textsl{privato}'', nel senso
916 che abbiamo appena visto.  Si può però marcare un \textit{mount point} come
917 ``\textsl{condiviso}'', ed in questo modo esso verrà associato ad un
918 \textit{mount peer group} insieme a tutti gli altri ulteriori \textit{mount
919   point} per i quali sia stato eseguito un \textit{bind mount}. Questo fa sì
920 che tutte le volte che si effettua un montaggio o uno smontaggio all'interno
921 di uno qualunque dei \textit{mount point} del gruppo, questo venga propagato
922 anche su tutti gli altri e sotto tutti sia visibile sempre lo stesso ramo di
923 albero dei file.
924
925 A completare l'infrastruttura degli \textit{shared subtree} sono state
926 previste due ulteriori funzionalità: la prima è quella di marcare un
927 \textit{mount point} come ``\textit{slave}'', in tal caso le operazioni di
928 montaggio e smontaggio effettuate al suo interno non verranno più propagate
929 agli altri membri del \textit{mount peer group} di cui fa parte, ma continuerà
930 a ricevere quelle eseguite negli altri membri.
931
932 La seconda funzionalità è quella di marcare un \textit{mount point} come
933 ``\textit{unbindable}''; questo anzitutto impedirà che possa essere usato come
934 sorgente di un \textit{bind mount} ed inoltre lo renderà privato, con la
935 conseguenza che quando è presente all'interno di altri \textit{bind mount},
936 all'interno di questi si vedrà solo il contenuto originale e non quello
937 risultante da eventuali ulteriori montaggi effettuati al suo interno.
938
939 \itindend{mount peer group}
940
941 I \textit{mount flag} che controllano le operazioni relative agli
942 \textit{shared subtree} sono descritti nella lista seguente. Si ricordi che
943 sono mutuamente esclusivi, e compatibili solo con l'uso degli ulteriori flag
944 \const{MS\_REC} (che applica ricorsivamente l'operazione a tutti gli eventuali
945 \textit{mount point} sottostanti) e \const{MS\_SILENT}; in tutti gli altri
946 casi \func{mount} fallirà con un errore di \errval{EINVAL}. L'unico altro
947 argomento che deve essere specificato quando li si usano è \param{target};
948 \param{source}, \param{data} e \param{filesystem} sono ignorati.
949
950 \begin{basedescript}{\desclabelwidth{1.9cm}\desclabelstyle{\nextlinelabel}}
951
952 \item[\constd{MS\_PRIVATE}] Marca un \textit{mount point} come \textit{private
953     mount}.  Di default, finché non lo si marca altrimenti con una delle altre
954   opzioni dell'interfaccia, ogni \textit{mount point} è privato. Ogni
955   \textit{bind mount} ottenuto da un \textit{mount point} privato si comporta
956   come descritto nella trattazione di \const{MS\_BIND}. Si usa questo flag
957   principalmente per revocare gli effetti delle altre opzioni e riportare il
958   comportamento a quello ordinario.
959
960 \item[\constd{MS\_SHARED}] Marca un \textit{mount point} come \textit{shared
961     mount}.  Lo scopo dell'opzione è ottenere che tutti i successivi
962   \textit{bind mount} ottenuti da un \textit{mount point} così marcato siano
963   di tipo \textit{shared} e vengano inseriti nello stesso \textit{mount peer
964     group} in modo da ``\textsl{condivere}'' ogni ulteriore operazione di
965   montaggio o smontaggio. Con questa opzione le operazioni di montaggio e
966   smontaggio effettuate al di sotto di uno \textit{shared mount} vengono
967   automaticamente ``\textsl{propagate}'' a tutti gli altri membri del
968   \textit{mount peer group} di cui fa parte, in modo che la sezione di albero
969   dei file visibile al di sotto di ciascuno di essi sia sempre la stessa.
970
971 \item[\constd{MS\_SLAVE}] Marca un \textit{mount point} come \textit{slave
972     mount}. Se il \textit{mount point} è parte di un \textit{mount peer group}
973   esso diventerà di tipo \textit{slave}: le operazioni di montaggio e
974   smontaggio al suo interno non verranno più propagate agli altri membri del
975   gruppo, ma continuerà a ricevere quelle eseguite negli altri membri. Se non
976   esistono altri membri nel gruppo il \textit{mount point} diventerà privato,
977   negli altri casi non subirà nessun cambiamento.
978
979 \item[\constd{MS\_UNBINDABLE}] Marca un \textit{mount point} come
980   \textit{unbindable mount}.  Un \textit{mount point} marcato in questo modo
981   non può essere usato per un \textit{bind mount} del suo contenuto. Si
982   comporta cioè come allo stesso modo di un \textit{mount point} ordinario di
983   tipo \textit{private} con in più la restrizione che nessuna sua
984   sottodirectory (anche se relativa ad un ulteriore montaggio) possa essere
985   utilizzata come sorgente di un \textit{bind mount}.
986   
987 \end{basedescript}
988 \itindend{shared~subtree}
989
990 L'ultimo \textit{mount flag} che controlla una modalità operativa di
991 \func{mount} è \constd{MS\_MOVE}, che consente di effettuare lo spostamento
992 del \textit{mount point} di un filesystem. La directory del \textit{mount
993   point} originale deve essere indicata nell'argomento \param{source}, e la
994 sua nuova posizione nell'argomento \param{target}. Tutti gli altri argomenti
995 della funzione vengono ignorati.
996
997 Lo spostamento avviene atomicamente, ed il ramo di albero presente sotto
998 \param{source} sarà immediatamente visibile sotto \param{target}. Non esiste
999 cioè nessun momento in cui il filesystem non risulti montato in una o
1000 nell'altra directory e pertanto è garantito che la risoluzione di
1001 \textit{pathname} relativi all'interno del filesystem non possa fallire.
1002
1003 Elenchiamo infine i restanti \textit{mount flag}, il cui utilizzo non attiene
1004 alle operazioni di \func{mount}, ma soltanto l'impostazione di opzioni
1005 generiche relative al funzionamento di un filesystem e che vengono per lo più
1006 utilizzati solo in fase di montaggio:
1007
1008 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
1009 \item[\constd{MS\_DIRSYNC}] Richiede che ogni modifica al contenuto di una
1010   directory venga immediatamente registrata su disco in maniera sincrona
1011   (introdotta a partire dai kernel della serie 2.6). L'opzione si applica a
1012   tutte le directory del filesystem, ma su alcuni filesystem è possibile
1013   impostarla a livello di singole directory o per i sotto-rami di una directory
1014   con il comando \cmd{chattr}.\footnote{questo avviene tramite delle opportune
1015     \texttt{ioctl} (vedi sez.~\ref{sec:file_fcntl_ioctl}).}
1016
1017   Questo consente di ridurre al minimo il rischio di perdita dei dati delle
1018   directory in caso di crollo improvviso del sistema, al costo di una certa
1019   perdita di prestazioni dato che le funzioni di scrittura relative ad
1020   operazioni sulle directory non saranno più bufferizzate e si bloccheranno
1021   fino all'arrivo dei dati sul disco prima che un programma possa proseguire.
1022
1023 \item[\constd{MS\_LAZYTIME}] Modifica la modalità di registrazione di tempi
1024   dei file (vedi sez.~\ref{sec:file_file_times}) per ridurre al massimo gli
1025   accessi a disco (particolarmente utile per i portatili). Attivandolo i tempi
1026   dei file vengono mantenuti in memoria e vengono salvati su disco solo in
1027   quattro casi: quando c'è da eseguire un aggiornamento dei dati
1028   dell'\textit{inode} per altri motivi, se viene usata una delle funzioni di
1029   sincronizzazione dei dati su disco (vedi sez.~\ref{sec:file_sync}), se
1030   l'\textit{inode} viene rimosso dalla memoria, o se è passato un giorno
1031   dall'ultima registrazione. Introdotto a partire dal kernel 4.0.
1032
1033   In questo modo si possono ridurre significativamente le scritture su disco
1034   mantenendo tutte le informazioni riguardo ai tempi dei file, riducendo anche
1035   l'impatto dell'uso di \const{MS\_STRICTATIME}. Il costo da pagare è il
1036   rischio, in caso di crash del sistema, di avere dati vecchi fino a 24 ore
1037   per quel che riguarda i tempi dei file.
1038   
1039 \item[\constd{MS\_MANDLOCK}] Consente l'uso del \textit{mandatory locking}
1040   (vedi sez.~\ref{sec:file_mand_locking}) sui file del filesystem. Per poterlo
1041   utilizzare effettivamente però esso dovrà essere comunque attivato
1042   esplicitamente per i singoli file impostando i permessi come illustrato in
1043   sez.~\ref{sec:file_mand_locking}.
1044
1045 \item[\constd{MS\_NOATIME}] Viene disabilitato sul filesystem l'aggiornamento
1046   dell'\textit{access time} (vedi sez.~\ref{sec:file_file_times}) per
1047   qualunque tipo di file. Dato che l'aggiornamento dell'\textit{access time} è
1048   una funzionalità la cui utilità è spesso irrilevante ma comporta un costo
1049   elevato visto che una qualunque lettura comporta comunque una scrittura su
1050   disco, questa opzione consente di disabilitarla completamente. La soluzione
1051   può risultare troppo drastica dato che l'informazione viene comunque
1052   utilizzata da alcuni programmi, per cui nello sviluppo del kernel sono state
1053   introdotte altre opzioni che forniscono soluzioni più appropriate e meno
1054   radicali.
1055
1056 \item[\constd{MS\_NODEV}] Viene disabilitato sul filesystem l'accesso ai file
1057   di dispositivo eventualmente presenti su di esso. L'opzione viene usata come
1058   misura di precauzione per rendere inutile la presenza di eventuali file di
1059   dispositivo su filesystem che non dovrebbero contenerne.\footnote{si ricordi
1060     che le convenzioni del \textit{Linux Filesystem Hierarchy Standard}
1061     richiedono che questi siano mantenuti esclusivamente sotto \texttt{/dev}.}
1062
1063   Viene utilizzata, assieme a \const{MS\_NOEXEC} e \const{MS\_NOSUID}, per
1064   fornire un accesso più controllato a quei filesystem di cui gli utenti hanno
1065   il controllo dei contenuti, in particolar modo quelli posti su dispositivi
1066   rimuovibili. In questo modo si evitano alla radice possibili situazioni in
1067   cui un utente malizioso inserisce su uno di questi filesystem dei file di
1068   dispositivo con permessi ``opportunamente'' ampliati che gli consentirebbero
1069   di accedere anche a risorse cui non dovrebbe.
1070
1071 \item[\constd{MS\_NODIRATIME}] Viene disabilitato sul filesystem
1072   l'aggiornamento dell'\textit{access time} (vedi
1073   sez.~\ref{sec:file_file_times}) ma soltanto per le directory. Costituisce
1074   una alternativa per \const{MS\_NOATIME}, che elimina l'informazione per le
1075   directory, che in pratica che non viene mai utilizzata, mantenendola per i
1076   file in cui invece ha un impiego, sia pur limitato.
1077
1078 \item[\constd{MS\_NOEXEC}] Viene disabilitata sul filesystem l'esecuzione di un
1079   qualunque file eseguibile eventualmente presente su di esso. L'opzione viene
1080   usata come misura di precauzione per rendere impossibile l'uso di programmi
1081   posti su filesystem che non dovrebbero contenerne.
1082
1083   Anche in questo caso viene utilizzata per fornire un accesso più controllato
1084   a quei filesystem di cui gli utenti hanno il controllo dei contenuti. Da
1085   questo punto di vista l'opzione è meno importante delle analoghe
1086   \const{MS\_NODEV} e \const{MS\_NOSUID} in quanto l'esecuzione di un
1087   programma creato dall'utente pone un livello di rischio nettamente
1088   inferiore, ed è in genere consentita per i file contenuti nella sua home
1089   directory.\footnote{cosa che renderebbe superfluo l'attivazione di questa
1090     opzione, il cui uso ha senso solo per ambienti molto controllati in cui si
1091     vuole che gli utenti eseguano solo i programmi forniti
1092     dall'amministratore.}
1093
1094 \item[\constd{MS\_NOSUID}] Viene disabilitato sul filesystem l'effetto dei bit
1095   dei permessi \acr{suid} e \acr{sgid} (vedi sez.~\ref{sec:file_special_perm})
1096   eventualmente presenti sui file in esso contenuti. L'opzione viene usata
1097   come misura di precauzione per rendere inefficace l'effetto di questi bit
1098   per filesystem in cui non ci dovrebbero essere file dotati di questi
1099   permessi.
1100
1101   Di nuovo viene utilizzata, analogamente a \const{MS\_NOEXEC} e
1102   \const{MS\_NODEV}, per fornire un accesso più controllato a quei filesystem
1103   di cui gli utenti hanno il controllo dei contenuti. In questo caso si evita
1104   che un utente malizioso possa inserire su uno di questi filesystem un
1105   eseguibile con il bit \acr{suid} attivo e di proprietà dell'amministratore o
1106   di un altro utente, che gli consentirebbe di eseguirlo per conto di
1107   quest'ultimo.
1108
1109 \item[\constd{MS\_RDONLY}] Esegue il montaggio del filesystem in sola lettura,
1110   non sarà possibile nessuna modifica ai suoi contenuti. Viene usato tutte le
1111   volte che si deve accedere ai contenuti di un filesystem con la certezza che
1112   questo non venga modificato (ad esempio per ispezionare un filesystem
1113   corrotto). All'avvio di default il kernel monta la radice in questa
1114   modalità. Si tenga presente che se non viene indicato il filesystem verrà
1115   montato, o rimontato nel caso lo si usi con \const{MS\_REMOUNT}, in
1116   lettura/scrittura; questo significa in sostanza che non esiste una opzione
1117   separata per indicare il montaggio in lettura/scrittura.
1118
1119 \item[\constd{MS\_REC}] Applica ricorsivamente a tutti i \textit{mount point}
1120   presenti al di sotto del \textit{mount point} indicato gli effetti della
1121   opzione degli \textit{shared subtree} associata. In questo caso l'argomento
1122   \param{target} deve fare riferimento ad un \textit{mount point} e tutti gli
1123   altri argomenti sono ignorati, ed il flag deve essere indicato con uno fra
1124   \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
1125   \const{MS\_UNBINDABLE}. Può anche essere usato con \const{MS\_BIND} per
1126   richiedere il montaggio ricorsivo anche degli eventuali ulteriori
1127   \textit{bind mount} presenti sotto \param{target}.
1128
1129 \item[\constd{MS\_RELATIME}] Indica di effettuare l'aggiornamento
1130   dell'\textit{access time} sul filesystem soltanto quando questo risulti
1131   antecedente il valore corrente del \textit{modification time} o del
1132   \textit{change time} (per i tempi dei file si veda
1133   sez.~\ref{sec:file_file_times}). L'opzione è disponibile a partire dal
1134   kernel 2.6.20, mentre dal 2.6.30 questo è diventato il comportamento di
1135   default del sistema, che può essere riportato a quello tradizionale con
1136   l'uso di \const{MS\_STRICTATIME}. Sempre dal 2.6.30 il comportamento è stato
1137   anche modificato e l'\textit{access time} viene comunque aggiornato se è più
1138   vecchio di un giorno.
1139
1140   L'opzione consente di evitare i problemi di prestazioni relativi
1141   all'aggiornamento dell'\textit{access time} senza avere impatti negativi
1142   riguardo le funzionalità, il comportamento adottato infatti consente di
1143   rendere evidente che vi è stato un accesso dopo la scrittura, ed evitando al
1144   contempo ulteriori operazioni su disco negli accessi successivi. In questo
1145   modo l'informazione relativa al fatto che un file sia stato letto resta
1146   disponibile, ed i programmi che ne fanno uso continuano a funzionare. Con
1147   l'introduzione di questo comportamento l'uso delle alternative
1148   \const{MS\_NOATIME} e \const{MS\_NODIRATIME} è sostanzialmente inutile.
1149
1150 \item[\constd{MS\_SILENT}] Richiede la soppressione di alcuni messaggi di
1151   avvertimento nei log del kernel (vedi sez.~\ref{sec:sess_daemon}). L'opzione
1152   è presente a partire dal kernel 2.6.17 e sostituisce, utilizzando un nome
1153   non fuorviante, la precedente \const{MS\_VERBOSE}, introdotta nel kernel
1154   2.6.12, che aveva lo stesso effetto.
1155
1156 \item[\constd{MS\_STRICTATIME}] Ripristina il comportamento tradizionale per
1157   cui l'\textit{access time} viene aggiornato ad ogni accesso al
1158   file. L'opzione è disponibile solo a partire dal kernel 2.6.30 quando il
1159   comportamento di default del kernel è diventato quello fornito da
1160   \const{MS\_RELATIME}.
1161
1162 \item[\constd{MS\_SYNCHRONOUS}] Abilita la scrittura sincrona richiedendo che
1163   ogni modifica al contenuto del filesystem venga immediatamente registrata su
1164   disco. Lo stesso comportamento può essere ottenuto con il flag
1165   \const{O\_SYNC} di \func{open} (vedi sez.~\ref{sec:file_open_close}).
1166
1167   Questa opzione consente di ridurre al minimo il rischio di perdita dei dati
1168   in caso di crollo improvviso del sistema, al costo di una pesante perdita di
1169   prestazioni dato che tutte le funzioni di scrittura non saranno più
1170   bufferizzate e si bloccheranno fino all'arrivo dei dati sul disco. Per un
1171   compromesso in cui questo comportamento avviene solo per le directory, ed ha
1172   quindi una incidenza nettamente minore, si può usare \const{MS\_DIRSYNC}.
1173
1174 \end{basedescript}
1175
1176 % NOTE: per l'opzione \texttt{lazytime} introdotta con il kernel 4.0,
1177 % vedi http://lwn.net/Articles/621046/
1178
1179 % NOTE per \const{MS\_SLAVE},\const{MS\_SHARE}, \const{MS\_PRIVATE} e
1180 % \const{MS\_UNBINDABLE} dal 2.6.15 vedi shared subtrees, in particolare
1181 %  * http://lwn.net/Articles/159077/ e
1182 %  * Documentation/filesystems/sharedsubtree.txt
1183
1184 % TODO: (bassa priorità) non documentati ma presenti in sys/mount.h:
1185 %       * MS_POSIXACL
1186 %       * MS_KERNMOUNT
1187 %       * MS_I_VERSION
1188 %       * MS_ACTIVE
1189 %       * MS_NOUSER
1190
1191
1192 Una volta che non si voglia più utilizzare un certo filesystem è possibile
1193 ``\textsl{smontarlo}'' usando la funzione di sistema \funcd{umount}, il cui
1194 prototipo è:
1195
1196 \begin{funcproto}{
1197 \fhead{sys/mount.h}
1198 \fdecl{umount(const char *target)}
1199 \fdesc{Smonta un filesystem.} 
1200 }
1201 {La funzione ritorna  $0$ in caso di successo e $-1$ per un errore,
1202   nel qual caso \var{errno} assumerà uno dei valori: 
1203   \begin{errlist}
1204   \item[\errcode{EBUSY}] il filesystem è occupato.
1205   \item[\errcode{EINVAL}] \param{target} non è un \textit{mount point}.
1206   \item[\errcode{EPERM}] il processo non ha i privilegi di
1207     amministratore.\footnotemark 
1208   \end{errlist}
1209   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
1210   \errval{ENOENT}, \errval{ENOMEM} nel loro significato generico.  }
1211 \end{funcproto}
1212
1213 \footnotetext{più precisamente la capacità \const{CAP\_SYS\_ADMIN}, vedi
1214   sez.~\ref{sec:proc_capabilities}.}
1215
1216 La funzione prende il nome della directory su cui il filesystem è montato e
1217 non il file o il dispositivo che è stato montato,\footnote{questo è vero a
1218   partire dal kernel 2.3.99-pre7, prima esistevano due chiamate separate e la
1219   funzione poteva essere usata anche specificando il file di dispositivo.} in
1220 quanto a partire dai kernel della serie 2.4.x è possibile montare lo stesso
1221 dispositivo in più punti. Nel caso più di un filesystem sia stato montato
1222 sullo stesso \textit{mount point} viene smontato quello che è stato montato
1223 per ultimo. Si tenga presente che la funzione fallisce se il filesystem è
1224 ``\textsl{occupato}'', cioè quando ci sono ancora dei file aperti sul
1225 filesystem, se questo contiene la directory di lavoro (vedi
1226 sez.~\ref{sec:file_work_dir}) di un qualunque processo o il \textit{mount
1227   point} di un altro filesystem.
1228
1229 Linux provvede inoltre una seconda funzione di sistema, \funcd{umount2}, che
1230 consente un maggior controllo delle operazioni, come forzare lo smontaggio di
1231 un filesystem anche quando questo risulti occupato; il suo prototipo è:
1232
1233 \begin{funcproto}{
1234 \fhead{sys/mount.h}
1235 \fdecl{umount2(const char *target, int flags)}
1236 \fdesc{Smonta un filesystem.} 
1237 }
1238 {La funzione ritorna  $0$ in caso di successo e $-1$ per un errore,
1239   nel qual caso \var{errno} assumerà uno dei valori: 
1240   \begin{errlist}
1241      \item[\errcode{EAGAIN}] si è chiamata la funzione con \const{MNT\_EXPIRE}
1242        ed il filesystem non era occupato.
1243      \item[\errcode{EBUSY}] \param{target} è la directory di lavoro di qualche
1244        processo, o contiene dei file aperti, o un altro \textit{mount point}.
1245      \item[\errcode{EINVAL}] \param{target} non è un \textit{mount point} o si
1246        è usato \const{MNT\_EXPIRE} con \const{MNT\_FORCE} o
1247        \const{MNT\_DETACH} o si è specificato un flag non esistente.
1248   \end{errlist}
1249   e tutti gli altri valori visti per \func{umount} con lo stesso significato.}
1250 \end{funcproto}
1251
1252 Il valore di \param{flags} è una maschera binaria dei flag che controllano le
1253 modalità di smontaggio, che deve essere specificato con un OR aritmetico delle
1254 costanti illustrate in tab.~\ref{tab:umount2_flags}.  Specificando
1255 \constd{MNT\_FORCE} la funzione cercherà di liberare il filesystem anche se è
1256 occupato per via di una delle condizioni descritte in precedenza. A seconda
1257 del tipo di filesystem alcune (o tutte) possono essere superate, evitando
1258 l'errore di \errcode{EBUSY}. In tutti i casi prima dello smontaggio viene
1259 eseguita una sincronizzazione dei dati.
1260
1261 \begin{table}[!htb]
1262   \centering
1263   \footnotesize
1264   \begin{tabular}[c]{|l|p{8cm}|}
1265     \hline
1266     \textbf{Costante} & \textbf{Descrizione}\\
1267     \hline
1268     \hline
1269     \const{MNT\_FORCE}  & Forza lo smontaggio del filesystem anche se questo è
1270                            occupato (presente dai kernel della serie 2.2).\\
1271     \const{MNT\_DETACH} & Esegue uno smontaggio ``\textsl{pigro}'', in cui si
1272                            blocca l'accesso ma si aspetta che il filesystem si
1273                            liberi (presente dal kernel 2.4.11 e dalla
1274                            \acr{glibc} 2.11).\\ 
1275     \const{MNT\_EXPIRE} & Se non occupato marca un \textit{mount point} come
1276                            ``\textsl{in scadenza}'' in modo che ad una
1277                            successiva chiamata senza utilizzo del filesystem
1278                            questo venga smontato (presente dal 
1279                            kernel 2.6.8 e dalla \acr{glibc} 2.11).\\ 
1280     \const{UMOUNT\_NOFOLLOW}& Non dereferenzia \param{target} se questo è un
1281                                collegamento simbolico (vedi
1282                                sez.~\ref{sec:link_symlink_rename}) evitando
1283                                problemi di sicurezza (presente dal kernel
1284                                2.6.34).\\  
1285     \hline
1286   \end{tabular}
1287   \caption{Costanti che identificano i bit dell'argomento \param{flags}
1288     della funzione \func{umount2}.} 
1289   \label{tab:umount2_flags}
1290 \end{table}
1291
1292 Con l'opzione \constd{MNT\_DETACH} si richiede invece uno smontaggio
1293 ``\textsl{pigro}'' (o \textit{lazy umount}) in cui il filesystem diventa
1294 inaccessibile per i nuovi processi subito dopo la chiamata della funzione, ma
1295 resta accessibile per quelli che lo hanno ancora in uso e non viene smontato
1296 fintanto che resta occupato.
1297
1298 Con \constd{MNT\_EXPIRE}, che non può essere specificato insieme agli altri
1299 due, si marca il \textit{mount point} di un filesystem non occupato come
1300 ``\textsl{in scadenza}'', in tal caso \func{umount2} ritorna con un errore di
1301 \errcode{EAGAIN}, mentre in caso di filesystem occupato si sarebbe ricevuto
1302 \errcode{EBUSY}.  Una volta marcato, se nel frattempo non viene fatto nessun
1303 uso del filesystem, ad una successiva chiamata con \const{MNT\_EXPIRE} questo
1304 verrà smontato. Questo flag consente di realizzare un meccanismo che smonti
1305 automaticamente i filesystem che restano inutilizzati per un certo periodo di
1306 tempo.
1307
1308 Infine il flag \constd{UMOUNT\_NOFOLLOW} non dereferenzia \param{target} se
1309 questo è un collegamento simbolico (vedi
1310 sez.~\ref{sec:link_symlink_rename}). Questa è una misura di sicurezza
1311 introdotta per evitare, per quei filesystem per il quale è prevista una
1312 gestione diretta da parte degli utenti, come quelli basati su \itindex{FUSE}
1313 FUSE,\footnote{il \textit{Filesystem in USEr space} (FUSE) è una delle più
1314   interessanti applicazioni del VFS che consente, tramite un opportuno modulo,
1315   di implementarne le funzioni in \textit{user space}, così da rendere
1316   possibile l'implementazione di un qualunque filesystem (con applicazioni di
1317   grande interesse come il filesystem cifrato \textit{encfs} o il filesystem
1318   di rete \textit{sshfs}) che possa essere usato direttamente per conto degli
1319   utenti.}  che si possano passare ai programmi che effettuano lo smontaggio
1320 dei filesystem, che in genere sono privilegiati ma consentono di agire solo
1321 sui propri \textit{mount point}, dei collegamenti simbolici che puntano ad
1322 altri \textit{mount point}, ottenendo così la possibilità di smontare
1323 qualunque filesystem.
1324
1325
1326 Altre due funzioni di sistema specifiche di Linux,\footnote{esse si trovano
1327   anche su BSD, ma con una struttura diversa.} utili per ottenere in maniera
1328 diretta informazioni riguardo al filesystem su cui si trova un certo file,
1329 sono \funcd{statfs} e \funcd{fstatfs}, i cui prototipi sono:
1330
1331 \begin{funcproto}{
1332 \fhead{sys/vfs.h}
1333 \fdecl{int statfs(const char *path, struct statfs *buf)}
1334 \fdecl{int fstatfs(int fd, struct statfs *buf)}
1335 \fdesc{Restituiscono informazioni relative ad un filesystem.} 
1336 }
1337 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
1338   nel qual caso \var{errno} assumerà uno dei valori: 
1339   \begin{errlist}
1340   \item[\errcode{ENOSYS}] il filesystem su cui si trova il file specificato
1341     non supporta la funzione.
1342   \end{errlist} ed inoltre \errval{EFAULT} ed \errval{EIO} per entrambe,
1343   \errval{EBADF} per \func{fstatfs}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
1344   \errval{ENOENT}, \errval{EACCES}, \errval{ELOOP} per \func{statfs} nel loro
1345   significato generico.}
1346 \end{funcproto}
1347
1348 Queste funzioni permettono di ottenere una serie di informazioni generali
1349 riguardo al filesystem su cui si trova il file specificato con un
1350 \textit{pathname} per \func{statfs} e con un file descriptor (vedi
1351 sez.~\ref{sec:file_fd}) per \func{statfs}.  Le informazioni vengono restituite
1352 all'indirizzo \param{buf} di una struttura \struct{statfs} definita come in
1353 fig.~\ref{fig:sys_statfs}, ed i campi che sono indefiniti per il filesystem in
1354 esame sono impostati a zero.  I valori del campo \var{f\_type} sono definiti
1355 per i vari filesystem nei relativi file di header dei sorgenti del kernel da
1356 costanti del tipo \var{XXX\_SUPER\_MAGIC}, dove \var{XXX} in genere è il nome
1357 del filesystem stesso.
1358
1359 \begin{figure}[!htb]
1360   \footnotesize \centering
1361   \begin{minipage}[c]{0.8\textwidth}
1362     \includestruct{listati/statfs.h}
1363   \end{minipage}
1364   \normalsize 
1365   \caption{La struttura \structd{statfs}.} 
1366   \label{fig:sys_statfs}
1367 \end{figure}
1368
1369 \conffilebeg{/etc/mtab} 
1370
1371 La \acr{glibc} provvede infine una serie di funzioni per la gestione dei due
1372 file \conffiled{/etc/fstab}\footnote{più precisamente \funcm{setfsent},
1373   \funcm{getfsent}, \funcm{getfsfile}, \funcm{getfsspec}, \funcm{endfsent}.}
1374 ed \conffile{/etc/mtab}\footnote{più precisamente \funcm{setmntent},
1375   \funcm{getmntent},\funcm{getmntent\_r}, \funcm{addmntent},\funcm{endmntent},
1376   \funcm{hasmntopt}.} che convenzionalmente sono usati in quasi tutti i
1377 sistemi unix-like per mantenere rispettivamente le informazioni riguardo ai
1378 filesystem da montare e a quelli correntemente montati. Le funzioni servono a
1379 leggere il contenuto di questi file in opportune strutture \structd{fstab} e
1380 \structd{mntent}, e, nel caso di \conffile{/etc/mtab}, per inserire e
1381 rimuovere le voci presenti nel file.
1382
1383 In generale si dovrebbero usare queste funzioni, in particolare quelle
1384 relative a \conffile{/etc/mtab}, quando si debba scrivere un programma che
1385 effettua il montaggio di un filesystem. In realtà in questi casi è molto più
1386 semplice invocare direttamente il programma \cmd{mount}. Inoltre l'uso stesso
1387 di \conffile{/etc/mtab} è considerato una pratica obsoleta, in quanto se non
1388 aggiornato correttamente (cosa che è impossibile se la radice è montata in
1389 sola lettura) il suo contenuto diventa fuorviante.
1390
1391 Per questo motivo il suo utilizzo viene deprecato ed in molti casi viene già
1392 oggi sostituito da un collegamento simbolico a \procfile{/proc/mounts}, che
1393 contiene una versione degli stessi contenuti (vale a dire l'elenco dei
1394 filesystem montati) generata direttamente dal kernel, e quindi sempre
1395 disponibile e sempre aggiornata. Per questo motivo tralasceremo la
1396 trattazione, di queste funzioni, rimandando al manuale della \acr{glibc}
1397 \cite{GlibcMan} per la documentazione completa.
1398
1399 \conffileend{/etc/mtab}
1400
1401 % TODO (bassa priorità) scrivere delle funzioni (getfsent e getmntent &C)
1402 % TODO (bassa priorità) documentare ? swapon e swapoff (man 2 ...) 
1403
1404
1405
1406 \section{La gestione di file e directory}
1407 \label{sec:file_dir}
1408
1409 In questa sezione esamineremo le funzioni usate per la manipolazione dei nomi
1410 file e directory, per la creazione di collegamenti simbolici e diretti, per la
1411 gestione e la lettura delle directory.  In particolare ci soffermeremo sulle
1412 conseguenze che derivano dalla architettura di un filesystem unix-like
1413 illustrata in sez.~\ref{sec:file_filesystem} per quanto attiene il
1414 comportamento e gli effetti delle varie funzioni. Tratteremo infine la
1415 directory di lavoro e le funzioni per la gestione di file speciali e
1416 temporanei.
1417
1418
1419 \subsection{La gestione dei nomi dei file}
1420 \label{sec:link_symlink_rename}
1421
1422 % \subsection{Le funzioni \func{link} e \func{unlink}}
1423 % \label{sec:file_link}
1424
1425 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
1426 dei nomi alternativi, come gli alias del vecchio MacOS o i collegamenti di
1427 Windows o i nomi logici del VMS, che permettono di fare riferimento allo
1428 stesso file chiamandolo con nomi diversi o accedendovi da directory diverse.
1429 Questo è possibile anche in ambiente Unix, dove un nome alternativo viene
1430 usualmente chiamato ``\textsl{collegamento}'' (o \textit{link}).  Data
1431 l'architettura del sistema riguardo la gestione dei file vedremo però che ci
1432 sono due metodi sostanzialmente diversi per fare questa operazione.
1433
1434 \itindbeg{hard~link}
1435 \index{collegamento!diretto|(}
1436
1437 In sez.~\ref{sec:file_filesystem} abbiamo spiegato come la capacità di
1438 chiamare un file con nomi diversi sia connaturata con l'architettura di un
1439 filesystem per un sistema Unix, in quanto il nome del file che si trova in una
1440 directory è solo un'etichetta associata ad un puntatore che permette di
1441 ottenere il riferimento ad un \textit{inode}, e che è quest'ultimo che viene
1442 usato dal kernel per identificare univocamente gli oggetti sul filesystem.
1443
1444 Questo significa che fintanto che si resta sullo stesso filesystem la
1445 realizzazione di un \textit{link} è immediata: uno stesso file può avere tanti
1446 nomi diversi, dati da altrettante associazioni diverse allo stesso
1447 \textit{inode} effettuate tramite ``etichette'' diverse in directory
1448 diverse. Si noti anche come nessuno di questi nomi possa assumere una
1449 particolare preferenza o originalità rispetto agli altri, in quanto tutti
1450 fanno comunque riferimento allo stesso \textit{inode} e quindi tutti
1451 otterranno lo stesso file.
1452
1453 Quando si vuole aggiungere ad una directory una voce che faccia riferimento ad
1454 un file già esistente come appena descritto, per ottenere quello che viene
1455 denominato ``\textsl{collegamento diretto}'' (o \textit{hard link}), si deve
1456 usare la funzione di sistema \funcd{link}, il cui prototipo è:
1457
1458 \begin{funcproto}{
1459 \fhead{unistd.h}
1460 \fdecl{int link(const char *oldpath, const char *newpath)}
1461 \fdesc{Crea un nuovo collegamento diretto (\textit{hard link}).} 
1462 }
1463 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1464   nel qual caso \var{errno} assumerà uno dei valori: 
1465   \begin{errlist}
1466   \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
1467     esiste già.
1468   \item[\errcode{EMLINK}] ci sono troppi collegamenti al file \param{oldpath}
1469     (il numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
1470     sez.~\ref{sec:sys_limits}).
1471   \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
1472     \param{newpath} non supporta i collegamenti diretti, è una directory o per
1473     \param{oldpath} non si rispettano i criteri per i \textit{protected
1474       hardlink}.\footnotemark 
1475   \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
1476     riferimento ad un filesystem montato sullo stesso 
1477     \textit{mount point}.
1478   \end{errlist} ed inoltre \errval{EACCES}, \errval{EDQUOT}, \errval{EFAULT},
1479   \errval{EIO}, \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1480   \errval{ENOMEM}, \errval{ENOSPC}, \errval{ENOTDIR}, \errval{EROFS} nel loro
1481   significato generico.}
1482 \end{funcproto}
1483
1484 \footnotetext{i \textit{protected hardlink} sono una funzionalità di
1485   protezione introdotta con il kernel 3.16 (si veda
1486   sez.~\ref{sec:procadv_security_misc} per i dettagli) che limita la capacità
1487   di creare un \textit{hard link} ad un file qualunque.}
1488
1489 La funzione crea in \param{newpath} un collegamento diretto al file indicato
1490 da \param{oldpath}. Per quanto detto la creazione di un nuovo collegamento
1491 diretto non copia il contenuto del file, ma si limita a creare la voce
1492 specificata da \param{newpath} nella directory corrispondente e l'unica
1493 proprietà del file che verrà modificata sarà il numero di riferimenti al file
1494 (il campo \var{i\_nlink} della struttura \kstruct{inode}, vedi
1495 fig.~\ref{fig:kstruct_inode}) che verrà aumentato di uno. In questo modo lo
1496 stesso file potrà essere acceduto sia con \param{newpath} che
1497 con \param{oldpath}.
1498
1499 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
1500 collegamento diretto è possibile solo se entrambi i \textit{pathname} sono
1501 nello stesso filesystem ed inoltre esso deve supportare gli \textit{hard link}
1502 (il meccanismo non è disponibile ad esempio con il filesystem \acr{vfat} di
1503 Windows). In realtà la funzione ha un ulteriore requisito, e cioè che non solo
1504 che i due file siano sullo stesso filesystem, ma anche che si faccia
1505 riferimento ad essi all'interno dello stesso \textit{mount point}.\footnote{si
1506   tenga presente infatti, come detto in sez.~\ref{sec:filesystem_mounting},
1507   che a partire dal kernel 2.4 uno stesso filesystem può essere montato più
1508   volte su directory diverse.}
1509 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
1510 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
1511 l'amministratore è in grado di creare un collegamento diretto ad un'altra
1512 directory: questo viene fatto perché con una tale operazione è possibile
1513 creare dei \textit{loop} nel filesystem (vedi fig.~\ref{fig:file_link_loop})
1514 la cui rimozione diventerebbe piuttosto complicata.\footnote{occorrerebbe
1515   infatti eseguire il programma \cmd{fsck} per riparare il filesystem, perché
1516   in caso di \textit{loop} la directory non potrebbe essere più svuotata,
1517   contenendo comunque se stessa, e quindi non potrebbe essere rimossa.}
1518
1519 Data la pericolosità di questa operazione, e visto che i collegamenti
1520 simbolici (che tratteremo a breve) ed i \textit{bind mount} (già visti in
1521 sez.~\ref{sec:filesystem_mounting}) possono fornire la stessa funzionalità
1522 senza questi problemi, nel caso di Linux questa capacità è stata completamente
1523 disabilitata, e al tentativo di creare un collegamento diretto ad una
1524 directory la funzione \func{link} restituisce sempre l'errore \errcode{EPERM}.
1525
1526 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
1527 \textit{hard link} ad un collegamento simbolico. In questo caso lo standard
1528 POSIX.1-2001 prevederebbe che quest'ultimo venga risolto e che il collegamento
1529 sia effettuato rispetto al file cui esso punta, e che venga riportato un
1530 errore qualora questo non esista o non sia un file. Questo era anche il
1531 comportamento iniziale di Linux ma a partire dai kernel della serie
1532 2.0.x\footnote{per la precisione il comportamento era quello previsto dallo
1533   standard POSIX fino al kernel di sviluppo 1.3.56, ed è stato temporaneamente
1534   ripristinato anche durante lo sviluppo della serie 2.1.x, per poi tornare al
1535   comportamento attuale fino ad oggi (per riferimento si veda
1536   \url{http://lwn.net/Articles/293902}).} è stato adottato un comportamento
1537 che non segue più lo standard per cui l'\textit{hard link} viene creato nei
1538 confronti del collegamento simbolico, e non del file cui questo punta. La
1539 revisione POSIX.1-2008 lascia invece il comportamento dipendente
1540 dall'implementazione, cosa che rende Linux conforme a questa versione
1541 successiva dello standard.
1542
1543 \itindbeg{symbolic~link}
1544 \index{collegamento!simbolico|(}
1545
1546 La ragione di questa differenza rispetto al vecchio standard, presente anche
1547 in altri sistemi unix-like, è dovuta al fatto che un collegamento simbolico
1548 può fare riferimento anche ad un file non esistente o a una directory, per i
1549 quali l'\textit{hard link} non può essere creato, per cui la scelta di seguire
1550 il collegamento simbolico è stata ritenuta una scelta scorretta nella
1551 progettazione dell'interfaccia.  Infatti se non ci fosse il comportamento
1552 adottato da Linux sarebbe impossibile creare un \textit{hard link} ad un
1553 collegamento simbolico, perché la funzione lo risolverebbe e l'\textit{hard
1554   link} verrebbe creato verso la destinazione. Invece evitando di seguire lo
1555 standard l'operazione diventa possibile, ed anche il comportamento della
1556 funzione risulta molto più comprensibile. Tanto più che se proprio se si vuole
1557 creare un \textit{hard link} rispetto alla destinazione di un collegamento
1558 simbolico è sempre possibile farlo direttamente.\footnote{ciò non toglie che
1559   questo comportamento possa causare problemi, come nell'esempio descritto
1560   nell'articolo citato nella nota precedente, a programmi che non si aspettano
1561   questa differenza rispetto allo standard POSIX.}
1562
1563 Dato che \func{link} crea semplicemente dei nomi che fanno riferimenti agli
1564 \textit{inode}, essa può funzionare soltanto per file che risiedono sullo
1565 stesso filesystem e solo per un filesystem di tipo Unix.  Inoltre abbiamo
1566 visto che in Linux non è consentito eseguire un collegamento diretto ad una
1567 directory.
1568
1569 Per ovviare a queste limitazioni, come accennato all'inizio, i sistemi
1570 unix-like supportano un'altra forma di collegamento, detta
1571 ``\textsl{collegamento simbolico}'' (o anche \textit{soft link} o
1572 \textit{symbolic link}). In questo caso si tratta, come avviene in altri
1573 sistemi operativi, di file speciali che contengono semplicemente il
1574 riferimento ad un altro file (o directory). In questo modo è possibile
1575 effettuare \textit{link} anche attraverso filesystem diversi, a file posti in
1576 filesystem che non supportano i collegamenti diretti, a delle directory, ed
1577 anche a file che non esistono ancora.
1578
1579 \itindend{hard~link}
1580 \index{collegamento!diretto|)}
1581
1582 Il meccanismo funziona in quanto i \textit{symbolic link} sono riconosciuti
1583 come tali dal kernel\footnote{è uno dei diversi tipi di file visti in
1584   tab.~\ref{tab:file_file_types}, contrassegnato come tale nell'\textit{inode}
1585   e riconoscibile dal valore del campo \var{st\_mode} della struttura
1586   \struct{stat} (vedi sez.~\ref{sec:file_stat}).} e tutta una serie di
1587 funzioni di sistema (come \func{open} o \func{stat}) quando ricevono come
1588 argomento il \textit{pathname} di un collegamento simbolico vanno
1589 automaticamente ad operare sul file da esso specificato. La funzione di
1590 sistema che permette di creare un nuovo collegamento simbolico è
1591 \funcd{symlink}, ed il suo prototipo è:
1592
1593 \begin{funcproto}{
1594 \fhead{unistd.h}
1595 \fdecl{int symlink(const char *oldpath, const char *newpath)}
1596 \fdesc{Crea un nuovo collegamento simbolico (\textit{symbolic link}).} 
1597 }
1598 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1599   nel qual caso \var{errno} assumerà uno dei valori: 
1600   \begin{errlist}
1601   \item[\errcode{EACCES}]  o non si hanno i permessi sulla directory in cui
1602     creare il \textit{link}.
1603   \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
1604   \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
1605     \param{oldpath} è una stringa vuota.
1606   \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
1607     supporta i collegamenti simbolici.
1608   \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
1609     lettura.
1610   \end{errlist} ed inoltre \errval{EDQUOT}, \errval{EFAULT}, \errval{EIO},
1611   \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOMEM}, \errval{ENOSPC} e
1612   \errval{ENOTDIR} nel loro significato generico.}
1613 \end{funcproto}
1614
1615
1616 La funzione crea un nuovo collegamento simbolico \param{newpath} che fa
1617 riferimento ad \param{oldpath}.  Si tenga presente che la funzione non
1618 effettua nessun controllo sull'esistenza di un file di nome \param{oldpath},
1619 ma si limita ad inserire il \textit{pathname} nel collegamento
1620 simbolico. Pertanto un collegamento simbolico può anche riferirsi ad un file
1621 che non esiste ed in questo caso si ha quello che viene chiamato un
1622 \itindex{dangling~link} \textit{dangling link}, letteralmente un
1623 \index{collegamento!ciondolante} ``\textsl{collegamento ciondolante}''. Ad
1624 esempio possiamo usare il comando \cmd{ln} per creare un collegamento
1625 simbolico nella nostra directory con:
1626 \begin{Console}
1627 piccardi@hain:~/gapil$ \textbf{ln -s /tmp/tmp_file symlink}
1628 \end{Console}
1629 %$
1630 e questo avrà successo anche se \file{/tmp/tmp\_file} non esiste:
1631 \begin{Console}
1632 piccardi@hain:~/gapil$ \textbf{ls symlink}
1633 symlink
1634 \end{Console}
1635 %$
1636 ma questo può generare confusione, perché accedendo in lettura a
1637 \file{symlink}, ad esempio con \cmd{cat}, otterremmo:
1638 \begin{Console}
1639 piccardi@hain:~/gapil$ \textbf{cat symlink}
1640 cat: symlink: No such file or directory
1641 \end{Console}
1642 %$
1643 con un errore che può sembrare sbagliato, dato che \cmd{ls} ci ha mostrato in
1644 prcedenza l'esistenza di \file{symlink}. Se invece andassimo a scrivere su
1645 \file{symlink}, l'effetto sarebbe quello di ottenere la creazione di
1646 \file{/tmp/tmp\_file} (che a quel punto verrebbe creato) senza errori.
1647
1648 Come accennato i collegamenti simbolici sono risolti automaticamente dal
1649 kernel all'invocazione delle varie \textit{system call}. In
1650 tab.~\ref{tab:file_symb_effect} si è riportato un elenco dei comportamenti
1651 delle varie funzioni di sistema che operano sui file nei confronti della
1652 risoluzione dei collegamenti simbolici, specificando quali li seguono e quali
1653 invece possono operare direttamente sui loro contenuti.
1654 \begin{table}[htb]
1655   \centering
1656   \footnotesize
1657   \begin{tabular}[c]{|l|c|c|}
1658     \hline
1659     \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
1660     \hline 
1661     \hline 
1662     \func{access}   & $\bullet$ & --        \\
1663     \func{chdir}    & $\bullet$ & --        \\
1664     \func{chmod}    & $\bullet$ & --        \\
1665     \func{chown}    & --        & $\bullet$ \\
1666     \func{creat}    & $\bullet$ & --        \\
1667     \func{exec}     & $\bullet$ & --        \\
1668     \func{lchown}   & $\bullet$ & --        \\
1669     \func{link}\footnotemark & --        & $\bullet$ \\
1670     \func{lstat}    & --        & $\bullet$ \\
1671     \func{mkdir}    & $\bullet$ & --        \\
1672     \func{mkfifo}   & $\bullet$ & --        \\
1673     \func{mknod}    & $\bullet$ & --        \\
1674     \func{open}     & $\bullet$ & --        \\
1675     \func{opendir}  & $\bullet$ & --        \\
1676     \func{pathconf} & $\bullet$ & --        \\
1677     \func{readlink} & --        & $\bullet$ \\
1678     \func{remove}   & --        & $\bullet$ \\
1679     \func{rename}   & --        & $\bullet$ \\
1680     \func{stat}     & $\bullet$ & --        \\
1681     \func{truncate} & $\bullet$ & --        \\
1682     \func{unlink}   & --        & $\bullet$ \\
1683     \hline 
1684   \end{tabular}
1685   \caption{Uso dei collegamenti simbolici da parte di alcune funzioni.}
1686   \label{tab:file_symb_effect}
1687 \end{table}
1688
1689 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
1690   dallo standard POSIX.1-2001.}
1691
1692 Si noti che non si è specificato il comportamento delle funzioni che operano
1693 con i file descriptor (che tratteremo nel prossimo capitolo), in quanto la
1694 risoluzione del collegamento simbolico viene in genere effettuata dalla
1695 funzione che restituisce il file descriptor (normalmente la \func{open}, vedi
1696 sez.~\ref{sec:file_open_close}) e tutte le operazioni seguenti fanno
1697 riferimento solo a quest'ultimo.
1698
1699 Si tenga anche presente che a partire dal kernel 3.16, se si abilita la
1700 funzionalità dei \textit{protected symlinks} (attiva di default in tutte le
1701 distribuzioni più recenti) la risoluzione dei nomi attraverso un collegamento
1702 simbolico può fallire per una serie di restrizione di sicurezza agguntive
1703 imposte dal meccanismo (si consulti sez.~\ref{sec:procadv_security_misc} per i
1704 dettagli del meccanismo).
1705
1706 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
1707 \func{open} seguono i collegamenti simbolici, occorrono funzioni apposite per
1708 accedere alle informazioni del collegamento invece che a quelle del file a cui
1709 esso fa riferimento. Quando si vuole leggere il contenuto di un collegamento
1710 simbolico si usa la funzione di sistema \funcd{readlink}, il cui prototipo è:
1711
1712 \begin{funcproto}{
1713 \fhead{unistd.h}
1714 \fdecl{int readlink(const char *pathname, char *buff, size\_t size)}
1715 \fdesc{Legge il contenuto di un collegamento simbolico.} 
1716 }
1717 {La funzione ritorna il numero di caratteri letti dentro \param{buff} in caso
1718   di successo e $-1$ per un errore,  nel qual caso \var{errno} assumerà uno
1719   dei valori:
1720   \begin{errlist}
1721   \item[\errcode{EACCES}] non si hanno i permessi di attraversamento di una
1722     delle directory del pathname
1723   \item[\errcode{EINVAL}] \param{pathname} non è un collegamento simbolico
1724     o \param{size} non è positiva.
1725   \end{errlist} ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
1726   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}
1727   nel loro significato generico.}
1728 \end{funcproto}
1729
1730 La funzione legge il \textit{pathname} a cui fa riferimento il collegamento
1731 simbolico indicato dall'argomento \param{pathname} scrivendolo sul buffer
1732 \param{buff} di dimensione \param{size}. Si tenga presente che la funzione non
1733 termina la stringa con un carattere nullo e che se questa è troppo lunga la
1734 tronca alla dimensione specificata da \param{size} per evitare di scrivere
1735 dati oltre le dimensioni del buffer.
1736
1737 \begin{figure}[htb]
1738   \centering
1739   \includegraphics[width=8cm]{img/link_loop}
1740   \caption{Esempio di loop nel filesystem creato con un collegamento
1741     simbolico.}
1742   \label{fig:file_link_loop}
1743 \end{figure}
1744
1745 Come accennato uno dei motivi per cui non sono consentiti \textit{hard link}
1746 alle directory è che questi possono creare dei \textit{loop} nella risoluzione
1747 dei nomi che non possono essere eliminati facilmente. Invece è sempre
1748 possibile, ed in genere anche molto utile, creare un collegamento simbolico ad
1749 una directory, anche se in questo caso si potranno ottenere anche dei
1750 \textit{loop}.
1751
1752 La situazione è illustrata in fig.~\ref{fig:file_link_loop}, che riporta la
1753 struttura della directory \file{/boot}. Come si vede si è creato al suo
1754 interno un collegamento simbolico che punta di nuovo a
1755 \file{/boot}.\footnote{il \textit{loop} mostrato in
1756   fig.~\ref{fig:file_link_loop} è stato usato per poter permettere a al
1757   \textit{bootloader} \cmd{grub} di vedere i file contenuti nella directory
1758   \file{/boot} con lo stesso \textit{pathname} con cui verrebbero visti dal
1759   sistema operativo, anche quando si trovano, come accade spesso, su una
1760   partizione separata (che \cmd{grub} all'avvio vedrebbe come \file{/}).} Un
1761 \textit{loop} di di questo tipo però può causare problemi per tutti i
1762 programmi che effettuano la scansione di una directory, e ad esempio se
1763 lanciassimo un comando come \code{grep -r linux *}, il \textit{loop} nella
1764 directory porterebbe ad esaminare \file{/boot}, \file{/boot/boot},
1765 \file{/boot/boot/boot} e così via.
1766
1767 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
1768 un \textit{pathname} possano essere seguiti fino ad un certo numero massimo di
1769 collegamenti simbolici, il cui valore limite è specificato dalla costante
1770 \constd{MAXSYMLINKS}. Se il limite viene superato si ha un errore ed
1771 \var{errno} viene impostata al valore \errcode{ELOOP}, che nella quasi
1772 totalità dei casi indica appunto che si è creato un collegamento simbolico che
1773 fa riferimento ad una directory del suo stesso \textit{pathname}.
1774
1775
1776 \itindend{symbolic~link}
1777 \index{collegamento!simbolico|)}
1778
1779 Un'altra funzione relativa alla gestione dei nomi dei file, anche se a prima
1780 vista parrebbe riguardare un argomento completamente diverso, è quella per la
1781 cancellazione di un file. In realtà una \textit{system call} che serva proprio
1782 a cancellare un file non esiste neanche perché, come accennato in
1783 sez.~\ref{sec:file_filesystem}, quando in un sistema unix-like si richiede la
1784 rimozione di un file, quello che si va a cancellare è soltanto la voce che
1785 referenzia il suo \textit{inode} all'interno di una directory.
1786
1787 La funzione di sistema che consente di effettuare questa operazione, il cui
1788 nome come si può notare ha poco a che fare con il concetto di rimozione, è
1789 \funcd{unlink}, ed il suo prototipo è:
1790
1791 \begin{funcproto}{
1792 \fhead{unistd.h}
1793 \fdecl{int unlink(const char *pathname)}
1794 \fdesc{Cancella un file.} 
1795 }
1796 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1797   nel qual caso \var{errno} assumerà uno dei valori:\footnotemark  
1798   \begin{errlist}
1799   \item[\errcode{EACCES}] non si ha il permesso di scrittura sulla directory
1800     che contiene \param{pathname} o quello di attraversamento per una delle
1801     directory superiori.
1802   \item[\errcode{EBUSY}] \param{pathname} non può essere rimosso perché è in
1803     uso da parte del sistema (in particolare per i cosidetti \textit{silly
1804       renames} di NFS).
1805   \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una
1806     directory.
1807   \item[\errcode{EPERM}] il filesystem non consente l'operazione, o la
1808     directory che contiene \param{pathname} ha lo \textit{sticky bit} e non si
1809     è il proprietario del file o non si hanno privilegi amministrativi. 
1810   \end{errlist} ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
1811   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EROFS} nel loro
1812   significato generico.}
1813 \end{funcproto}
1814
1815 \footnotetext{questa funzione su Linux ha alcune peculiarità nei codici di
1816   errore, in particolare riguardo la rimozione delle directory che non è mai
1817   permessa e che causa l'errore \errcode{EISDIR}; questo è un valore specifico
1818   di Linux non conforme allo standard POSIX che prescrive invece l'uso di
1819   \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
1820   abbia privilegi sufficienti, valore che invece Linux usa anche se il
1821   filesystem non supporta la funzione, inoltre il codice \errcode{EBUSY} nel
1822   caso la directory sia occupata su Linux non esiste.}
1823
1824 La funzione elimina il nome specificato dall'argomento \param{pathname} nella
1825 directory che lo contiene e decrementa il numero di riferimenti nel relativo
1826 \textit{inode}; come per \func{link} queste due operazioni sono effettuate
1827 all'interno della \textit{system call} in maniera atomica rispetto ai
1828 processi.
1829
1830 Si ricordi che, anche se se ne è rimosso il nome, un file viene realmente
1831 cancellato soltanto quando il numero di collegamenti mantenuto
1832 nell'\textit{inode} diventa nullo; solo allora l'\textit{inode} viene
1833 disallocato e lo spazio che il file occupava sul disco viene liberato.
1834
1835 Si tenga presente comunque che a questo si aggiunge sempre un'ulteriore
1836 condizione e cioè che non ci siano processi che stiano ancora lavorando sul il
1837 file. Come vedremo in sez.~\ref{sec:file_unix_interface} il kernel una tabella
1838 di tutti file aperti da ciascun processo, che a sua volta contiene i
1839 riferimenti agli \textit{inode} ad essi relativi. Prima di procedere alla
1840 cancellazione dello spazio occupato su disco dal contenuto di un file il
1841 kernel controlla anche questa tabella, per verificare che anche in essa non ci
1842 sia più nessun riferimento all'\textit{inode} in questione, assicurandosi con
1843 questo che nessun processo stia ancora usando il file.
1844
1845 Nel caso di socket, \textit{fifo} o file di dispositivo la funzione rimuove il
1846 nome, e come per i file normali i processi che hanno aperto uno di questi
1847 oggetti possono continuare ad utilizzarli.  Nel caso di cancellazione di un
1848 \textit{link} simbolico, che consiste solo nel rimando ad un altro file,
1849 questo viene immediatamente eliminato e non sarà più utilizzabile. 
1850
1851 Per cancellare una voce in una directory è necessario avere il permesso di
1852 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
1853 il diritto di esecuzione/attraversamento sulla directory che la contiene
1854 (affronteremo in dettaglio l'argomento dei permessi di file e directory in
1855 sez.~\ref{sec:file_access_control}). Se inoltre per la directory è impostato
1856 lo \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}), occorrerà
1857 anche essere proprietari del file o proprietari della directory o avere i
1858 privilegi di amministratore.
1859
1860 Questa caratteristica del sistema, che consente di usare un file anche se lo
1861 si è ``cancellato'', può essere usata per essere sicuri di non lasciare file
1862 temporanei su disco in caso di uscita imprevista di un programma. La tecnica è
1863 quella di aprire un nuovo file e chiamare \func{unlink} su di esso subito
1864 dopo, in questo modo il contenuto del file sarà sempre disponibile all'interno
1865 del processo attraverso il suo file descriptor (vedi sez.~\ref{sec:file_fd}),
1866 ma non ne resterà traccia in nessuna directory, inoltre lo spazio occupato su
1867 disco verrà immediatamente rilasciato alla conclusione del processo, quando
1868 tutti i file vengono chiusi.
1869
1870 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
1871 la funzione \func{unlink} sulle directory, che in tal caso fallisce con un
1872 errore di \errcode{EISDIR}. Per cancellare una directory si deve usare la
1873 apposita funzione di sistema \func{rmdir} (che vedremo in
1874 sez.~\ref{sec:file_dir_creat_rem}), oppure la funzione \func{remove}.
1875
1876 Quest'ultima è la funzione prevista dallo standard ANSI C per effettuare una
1877 cancellazione generica di un file o di una directory e viene usata in generale
1878 anche per i sistemi operativi che non supportano gli \textit{hard link}. Nei
1879 sistemi unix-like \funcd{remove} è equivalente ad usare in maniera trasparente
1880 \func{unlink} per i file ed \func{rmdir} per le directory; il suo prototipo è:
1881
1882 \begin{funcproto}{
1883 \fhead{stdio.h}
1884 \fdecl{int remove(const char *pathname)}
1885 \fdesc{Cancella un file o una directory.} 
1886 }
1887 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1888   caso \var{errno} assumerà uno dei valori relativi alla chiamata utilizzata,
1889   pertanto si può fare riferimento a quanto illustrato nelle descrizioni di
1890   \func{unlink} e \func{rmdir}.}
1891 \end{funcproto}
1892
1893 La funzione utilizza la funzione \func{unlink} per cancellare i file (e si
1894 applica anche a link simbolici, socket, \textit{fifo} e file di dispostivo) e
1895 la funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}) per
1896 cancellare le directory.\footnote{questo vale usando la \acr{glibc}; nella
1897   \acr{libc4} e nella \acr{libc5} la funzione \func{remove} era un semplice
1898   alias alla funzione \func{unlink} e quindi non poteva essere usata per le
1899   directory.}  Si tenga presente che per alcune limitazioni del protocollo
1900 NFS, utilizzare questa funzione su file che usano questo filesystem di rete
1901 può comportare la scomparsa di file ancora in uso.
1902
1903 Infine per cambiare nome ad un file o a una directory si usa la funzione di
1904 sistema \funcd{rename},\footnote{la funzione è definita dallo standard ANSI C,
1905   ma si applica solo per i file, lo standard POSIX estende la funzione anche
1906   alle directory.} il cui prototipo è:
1907
1908 \begin{funcproto}{
1909 \fhead{stdio.h}
1910 \fdecl{int rename(const char *oldpath, const char *newpath)}
1911 \fdesc{Rinomina un file o una directory.} 
1912 }
1913 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1914   nel qual caso \var{errno} assumerà uno dei valori: 
1915   \begin{errlist}
1916   \item[\errcode{EACCESS}] manca il permesso di scrittura sulle directory
1917     contenenti \param{oldpath} e \param{newpath} o di attraversare 
1918     il loro \textit{pathname} o di scrivere su \param{newpath}
1919     se questa è una directory.
1920   \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
1921     parte di qualche processo (come directory di lavoro o come radice) o del
1922     sistema (come \textit{mount point}) ed il sistema non riesce a risolvere
1923     la situazione.
1924   \item[\errcode{EEXIST}] \param{newpath} è una directory già esistente e
1925     non è vuota (anche \errcode{ENOTEMPTY}).
1926   \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
1927     \param{oldpath} o più in generale si è cercato di creare una directory come
1928     sotto-directory di sé stessa.
1929   \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
1930     \param{oldpath} non è una directory.
1931   \item[\errcode{ENOTDIR}] uno dei componenti dei \textit{pathname} non è una
1932     directory o \param{oldpath} è una directory e 
1933     \param{newpath} esiste e non è una directory.
1934   \item[\errval{EPERM}] la directory contenente \param{oldpath} o quella
1935     contenente un \param{newpath} esistente hanno lo \textit{sticky bit} e non
1936     si è i proprietari dei rispettivi file (o non si hanno privilegi
1937     amministrativi) oppure il filesystem non supporta l'operazione. 
1938   \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
1939     stesso filesystem e sotto lo stesso \textit{mount point}. 
1940   \end{errlist} ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{EMLINK},
1941   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOSPC} e
1942   \errval{EROFS} nel loro significato generico.}
1943 \end{funcproto}
1944
1945 La funzione rinomina in \param{newpath} il file o la directory indicati
1946 dall'argomento \param{oldpath}. Il nome viene eliminato nella directory
1947 originale e ricreato nella directory di destinazione mantenendo il riferimento
1948 allo stesso \textit{inode}. Non viene spostato nessun dato e l'\textit{inode}
1949 del file non subisce nessuna modifica in quanto le modifiche sono eseguite
1950 sulle directory che contengono \param{newpath} ed \param{oldpath}.
1951
1952 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
1953 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
1954 c'è modifica, per quanto temporanea, al \textit{link count} del file e non può
1955 esistere un istante in cui un altro processo possa trovare attivi entrambi i
1956 nomi per lo stesso file se la destinazione non esiste o in cui questa sparisca
1957 temporaneamente se già esiste.
1958
1959 Dato che opera in maniera analoga la funzione è soggetta alle stesse
1960 restrizioni di \func{link}, quindi è necessario che \param{oldpath}
1961 e \param{newpath} siano nello stesso filesystem e facciano riferimento allo
1962 stesso \textit{mount point}, e che il filesystem supporti questo tipo di
1963 operazione. Qualora questo non avvenga si dovrà effettuare l'operazione in
1964 maniera non atomica copiando il file a destinazione e poi cancellando
1965 l'originale.
1966
1967 Il comportamento della funzione è diverso a seconda che si voglia rinominare
1968 un file o una directory. Se ci riferisce ad un file allora \param{newpath}, se
1969 esiste, non deve essere una directory, altrimenti si avrà un errore di
1970 \errcode{EISDIR}. Se \param{newpath} indica un file già esistente questo verrà
1971 rimpiazzato atomicamente, ma nel caso in cui \func{rename} fallisca il kernel
1972 assicura che esso non sarà toccato. I caso di sovrascrittura però potrà
1973 esistere una breve finestra di tempo in cui sia \param{oldpath}
1974 che \param{newpath} potranno fare entrambi riferimento al file che viene
1975 rinominato.
1976
1977 Se \param{oldpath} è una directory allora \param{newpath}, se esistente, deve
1978 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
1979 (se non è una directory) o \errcode{ENOTEMPTY} o \errcode{EEXIST} (se non è
1980 vuota). Chiaramente \param{newpath} non potrà contenere \param{oldpath} nel
1981 suo \textit{pathname}, non essendo possibile rendere una directory una
1982 sottodirectory di sé stessa, se questo fosse il caso si otterrebbe un errore
1983 di \errcode{EINVAL}.
1984
1985 Se \param{oldpath} si riferisce ad un collegamento simbolico questo sarà
1986 rinominato restando tale senza nessun effetto sul file a cui fa riferimento.
1987 Se invece \param{newpath} esiste ed è un collegamento simbolico verrà
1988 cancellato come qualunque altro file.  Infine qualora \param{oldpath}
1989 e \param{newpath} siano due nomi che già fanno riferimento allo stesso file lo
1990 standard POSIX prevede che la funzione non ritorni un errore, e semplicemente
1991 non faccia nulla, lasciando entrambi i nomi.  Linux segue questo standard,
1992 anche se, come fatto notare dal manuale della \acr{glibc}, il comportamento
1993 più ragionevole sarebbe quello di cancellare \param{oldpath}.
1994
1995 In tutti i casi si dovranno avere i permessi di scrittura nelle directory
1996 contenenti \param{oldpath} e \param{newpath}, e nel caso \param{newpath} sia
1997 una directory vuota già esistente anche su di essa (perché dovrà essere
1998 aggiornata la voce ``\texttt{..}''). Se poi le directory
1999 contenenti \param{oldpath} o \param{newpath} hanno lo \textit{sticky bit}
2000 attivo (vedi sez.~\ref{sec:file_special_perm}) si dovrà essere i proprietari
2001 dei file (o delle directory) che si vogliono rinominare, o avere i permessi di
2002 amministratore.
2003
2004
2005 \subsection{La creazione e la cancellazione delle directory} 
2006 \label{sec:file_dir_creat_rem}
2007
2008 Benché in sostanza le directory non siano altro che dei file contenenti
2009 elenchi di nomi con riferimenti ai rispettivi \textit{inode}, non è possibile
2010 trattarle come file ordinari e devono essere create direttamente dal kernel
2011 attraverso una opportuna \textit{system call}.\footnote{questo è quello che
2012   permette anche, attraverso l'uso del VFS, l'utilizzo di diversi formati per
2013   la gestione dei suddetti elenchi, dalle semplici liste a strutture complesse
2014   come alberi binari, hash, ecc. che consentono una ricerca veloce quando il
2015   numero di file è molto grande.}  La funzione di sistema usata per creare una
2016 directory è \funcd{mkdir}, ed il suo prototipo è:
2017
2018 \begin{funcproto}{
2019 \fhead{sys/stat.h}
2020 \fhead{sys/types.h}
2021 \fdecl{int mkdir(const char *dirname, mode\_t mode)}
2022 \fdesc{Crea una nuova directory.} 
2023 }
2024 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2025   caso \var{errno} assumerà uno dei valori: 
2026   \begin{errlist}
2027   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
2028     cui si vuole inserire la nuova directory o di attraversamento per le
2029     directory al di sopra di essa.
2030   \item[\errcode{EEXIST}] un file o una directory o un collegamento simbolico
2031     con quel nome esiste già.
2032   \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
2033     directory contiene troppi file; sotto Linux questo normalmente non avviene
2034     perché il filesystem standard consente la creazione di un numero di file
2035     maggiore di quelli che possono essere contenuti nel disco, ma potendo
2036     avere a che fare anche con filesystem di altri sistemi questo errore può
2037     presentarsi.
2038   \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
2039     la nuova directory o si è esaurita la quota disco dell'utente.
2040   \end{errlist}
2041   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
2042   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EPERM},
2043   \errval{EROFS} nel loro significato generico.}
2044 \end{funcproto}
2045
2046 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
2047 standard presenti in ogni directory (``\file{.}'' e ``\file{..}''), con il
2048 nome indicato dall'argomento \param{dirname}. 
2049
2050 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
2051 directory viene creata sono specificati dall'argomento \param{mode}, i cui
2052 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
2053 tenga presente che questi sono modificati dalla maschera di creazione dei file
2054 (si veda sez.~\ref{sec:file_perm_management}).  La titolarità della nuova
2055 directory è impostata secondo quanto illustrato in
2056 sez.~\ref{sec:file_ownership_management}.
2057
2058 Come accennato in precedenza per eseguire la cancellazione di una directory è
2059 necessaria una specifica funzione di sistema, \funcd{rmdir}, il suo prototipo
2060 è:
2061
2062 \begin{funcproto}{
2063 \fhead{sys/stat.h}
2064 \fdecl{int rmdir(const char *dirname)}
2065 \fdesc{Cancella una directory.} 
2066 }
2067 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2068   caso \var{errno} assumerà uno dei valori: 
2069   \begin{errlist}
2070   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
2071     che contiene la directory che si vuole cancellare, o non c'è il permesso
2072     di attraversare (esecuzione) una delle directory specificate in
2073     \param{dirname}.
2074   \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o
2075     la radice di qualche processo o un \textit{mount point}.
2076   \item[\errcode{EINVAL}] si è usato ``\texttt{.}'' come ultimo componente
2077     di \param{dirname}.
2078   \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
2079     directory, oppure la directory che contiene \param{dirname} ha lo
2080     \textit{sticky bit} impostato e non si è i proprietari della directory o
2081     non si hanno privilegi amministrativi.
2082   \end{errlist}
2083   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
2084   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errcode{ENOTEMPTY} e
2085   \errval{EROFS} nel loro significato generico.}
2086 \end{funcproto}
2087
2088
2089 La funzione cancella la directory \param{dirname}, che deve essere vuota, la
2090 directory deve cioè contenere le due voci standard ``\file{.}'' e
2091 ``\file{..}'' e niente altro.  Il nome può essere indicato con un
2092 \textit{pathname} assoluto o relativo, ma si deve fare riferimento al nome
2093 nella directory genitrice, questo significa che \textit{pathname} terminanti
2094 in ``\file{.}'' e ``\file{..}'' anche se validi in altri contesti, causeranno
2095 il fallimento della funzione.
2096
2097 Se la directory cancellata risultasse aperta in qualche processo per una
2098 lettura dei suoi contenuti (vedi sez.~\ref{sec:file_dir_read}), pur
2099 scomparendo dal filesystem e non essendo più possibile accedervi o crearvi
2100 altri file, le risorse ad essa associate verrebbero disallocate solo alla
2101 chiusura di tutti questi ulteriori riferimenti.
2102
2103
2104 \subsection{Lettura e scansione delle directory}
2105 \label{sec:file_dir_read}
2106
2107 Benché le directory alla fine non siano altro che dei file che contengono
2108 delle liste di nomi associati ai relativi \textit{inode}, per il ruolo che
2109 rivestono nella struttura del sistema non possono essere trattate come dei
2110 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
2111 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
2112 può essere un processo a inserirvi direttamente delle voci con le usuali
2113 funzioni di scrittura.
2114
2115 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
2116 kernel, sono molte le situazioni in cui i processi necessitano di poterne
2117 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
2118 in sez.~\ref{sec:file_open_close} che è possibile aprire una directory come se
2119 fosse un file, anche se solo in sola lettura) in generale il formato con cui
2120 esse sono scritte può dipendere dal tipo di filesystem, tanto che, come
2121 riportato in tab.~\ref{tab:file_file_operations}, il VFS prevede una apposita
2122 funzione per la lettura delle directory.
2123
2124 \itindbeg{directory~stream}
2125
2126 Tutto questo si riflette nello standard POSIX\footnote{le funzioni erano
2127   presenti in SVr4 e 4.3BSD, la loro specifica è riportata in POSIX.1-2001.}
2128 che ha introdotto una apposita interfaccia per la lettura delle directory,
2129 basata sui cosiddetti \textit{directory stream}, chiamati così per l'analogia
2130 con i \textit{file stream} dell'interfaccia standard ANSI C che vedremo in
2131 sez.~\ref{sec:files_std_interface}. La prima funzione di questa interfaccia è
2132 \funcd{opendir}, il cui prototipo è:
2133
2134 \begin{funcproto}{
2135 \fhead{sys/types.h}
2136 \fhead{dirent.h}
2137 \fdecl{DIR *opendir(const char *dirname)}
2138 \fdesc{Apre un \textit{directory stream}.} 
2139 }
2140 {La funzione ritorna un puntatore al \textit{directory stream} in caso di
2141   successo e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
2142   dei valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
2143   \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR} nel loro significato
2144   generico.}
2145 \end{funcproto}
2146
2147 La funzione apre un \textit{directory stream} per la directory
2148 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \typed{DIR} (che
2149 è il tipo opaco usato dalle librerie per gestire i \textit{directory stream})
2150 da usare per tutte le operazioni successive, la funzione inoltre posiziona lo
2151 \textit{stream} sulla prima voce contenuta nella directory.
2152
2153 Si tenga presente che comunque la funzione opera associando il
2154 \textit{directory stream} ad un opportuno file descriptor sottostante, sul
2155 quale vengono compiute le operazioni. Questo viene sempre aperto impostando il
2156 flag di \textit{close-on-exec} (si ricordi quanto detto in
2157 sez.~\ref{sec:proc_exec}), così da evitare che resti aperto in caso di
2158 esecuzione di un altro programma.
2159
2160 Nel caso in cui sia necessario conoscere il \textit{file descriptor} associato
2161 ad un \textit{directory stream} si può usare la funzione
2162 \funcd{dirfd},\footnote{questa funzione è una estensione introdotta con BSD
2163   4.3-Reno ed è presente in Linux con le libc5 (a partire dalla versione
2164   5.1.2) e con la \acr{glibc} ma non presente in POSIX fino alla revisione
2165   POSIX.1-2008, per questo per poterla utilizzare fino alla versione 2.10
2166   della \acr{glibc} era necessario definire le macro \macro{\_BSD\_SOURCE} o
2167   \macro{\_SVID\_SOURCE}, dalla versione 2.10 si possono usare anche
2168   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o
2169   \texttt{\macro{\_XOPEN\_SOURCE} >= 700}.}  il cui prototipo è:
2170
2171 \begin{funcproto}{
2172 \fhead{sys/types.h}
2173 \fhead{dirent.h}
2174 \fdecl{int dirfd(DIR *dir)}
2175 \fdesc{Legge il file descriptor associato ad un \textit{directory stream}.} 
2176 }
2177 {La funzione ritorna un valore positivo corrispondente al file descriptor in
2178   caso di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà
2179   uno dei valori:
2180   \begin{errlist}
2181   \item[\errcode{EINVAL}] \param{dir} non è un puntatore ad un
2182     \textit{directory stream}. 
2183   \item[\errcode{ENOTSUP}] l'implementazione non supporta l'uso di un file
2184     descriptor per la directory.
2185   \end{errlist}
2186 }
2187 \end{funcproto}
2188
2189 La funzione restituisce il file descriptor associato al \textit{directory
2190   stream} \param{dir}. Di solito si utilizza questa funzione in abbinamento a
2191 funzioni che operano sui file descriptor, ad esempio si potrà usare
2192 \func{fstat} per ottenere le proprietà della directory, o \func{fchdir} per
2193 spostare su di essa la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}).
2194
2195 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
2196 possibile associarvi un \textit{directory stream} con la funzione
2197 \funcd{fdopendir},\footnote{questa funzione è però disponibile solo a partire
2198   dalla versione 2.4 della \acr{glibc}, ed è stata introdotta nello standard
2199   POSIX solo a partire dalla revisione POSIX.1-2008, prima della versione 2.10
2200   della \acr{glibc} per poterla utilizzare era necessario definire la macro
2201   \macro{\_GNU\_SOURCE}, dalla versione 2.10 si possono usare anche
2202   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o \texttt{\_XOPEN\_SOURCE >=
2203     700} .}  il cui prototipo è:
2204
2205 \begin{funcproto}{
2206 \fhead{sys/types.h}
2207 \fhead{dirent.h}
2208 \fdecl{DIR *fdopendir(int fd)}
2209 \fdesc{Associa un \textit{directory stream} ad un file descriptor.} 
2210 }
2211 {La funzione ritorna un puntatore al \textit{directory stream} in caso di
2212   successo e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
2213   dei valori \errval{EBADF} o \errval{ENOMEM} nel loro significato generico.}
2214 \end{funcproto}
2215
2216 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
2217   stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
2218 stato aperto in precedenza; la funzione darà un errore qualora questo non
2219 corrisponda ad una directory. L'uso di questa funzione permette di rispondere
2220 agli stessi requisiti delle funzioni ``\textit{at}'' che vedremo in
2221 sez.~\ref{sec:file_openat}.
2222
2223 Una volta utilizzata il file descriptor verrà usato internamente dalle
2224 funzioni che operano sul \textit{directory stream} e non dovrà essere più
2225 utilizzato all'interno del proprio programma. In particolare dovrà essere
2226 chiuso attraverso il \textit{directory stream} con \func{closedir} e non
2227 direttamente. Si tenga presente inoltre che \func{fdopendir} non modifica lo
2228 stato di un eventuale flag di \textit{close-on-exec}, che pertanto dovrà
2229 essere impostato esplicitamente in fase di apertura del file descriptor.
2230
2231 Una volta che si sia aperto un \textit{directory stream} la lettura del
2232 contenuto della directory viene effettuata attraverso la funzione
2233 \funcd{readdir}, il cui prototipo è:
2234
2235 \begin{funcproto}{
2236 \fhead{sys/types.h}
2237 \fhead{dirent.h}
2238 \fdecl{struct dirent *readdir(DIR *dir)}
2239 \fdesc{Legge una voce dal \textit{directory stream}.} 
2240 }
2241 {La funzione ritorna il puntatore alla struttura contenente i dati in caso di
2242   successo e \val{NULL} per un errore o se si è raggiunta la fine dello
2243   \textit{stream}. Il solo codice di errore restituito in \var{errno} è
2244   \errval{EBADF} qualora \param{dir} non indichi un \textit{directory stream}
2245   valido.}
2246 \end{funcproto}
2247
2248 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
2249 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
2250 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
2251 esaurite tutte le voci in essa presenti, che viene segnalata dalla
2252 restituzione di \val{NULL} come valore di ritorno. Si può distinguere questa
2253 condizione da un errore in quanto in questo caso \var{errno} non verrebbe
2254 modificata.
2255
2256 I dati letti da \func{readdir} vengono memorizzati in una struttura
2257 \struct{dirent}, la cui definizione è riportata in
2258 fig.~\ref{fig:file_dirent_struct}.\footnote{la definizione è quella usata da
2259   Linux, che si trova nel file \file{/usr/include/bits/dirent.h}, essa non
2260   contempla la presenza del campo \var{d\_namlen} che indica la lunghezza del
2261   nome del file.} La funzione non è rientrante e restituisce il puntatore ad
2262 una struttura allocata staticamente, che viene sovrascritta tutte le volte che
2263 si ripete la lettura di una voce sullo stesso \textit{directory stream}.
2264
2265 Di questa funzione esiste anche una versione rientrante,
2266 \funcd{readdir\_r},\footnote{per usarla è necessario definire una qualunque
2267   delle macro \texttt{\macro{\_POSIX\_C\_SOURCE} >= 1},
2268   \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
2269   \macro{\_POSIX\_SOURCE}.} che non usa una struttura allocata staticamente, e
2270 può essere utilizzata anche con i \textit{thread}, il suo prototipo è:
2271
2272 \begin{funcproto}{
2273 \fhead{sys/types.h}
2274 \fhead{dirent.h}
2275 \fdecl{int readdir\_r(DIR *dir, struct dirent *entry, struct dirent **result)}
2276 \fdesc{Legge una voce dal \textit{directory stream}.} 
2277 }
2278 {La funzione ritorna $0$ in caso di successo ed un numero positivo per un
2279   errore, nel qual caso \var{errno} assumerà gli stessi valori di
2280   \func{readdir}.} 
2281 \end{funcproto}
2282
2283 La funzione restituisce in \param{result} come \textit{value result argument}
2284 l'indirizzo della struttura \struct{dirent} dove sono stati salvati i dati,
2285 che deve essere allocata dal chiamante, ed il cui indirizzo deve essere
2286 indicato con l'argomento \param{entry}.  Se si è raggiunta la fine del
2287 \textit{directory stream} invece in \param{result} viene restituito il valore
2288 \val{NULL}.
2289
2290 \begin{figure}[!htb]
2291   \footnotesize \centering
2292   \begin{minipage}[c]{0.8\textwidth}
2293     \includestruct{listati/dirent.c}
2294   \end{minipage} 
2295   \normalsize 
2296   \caption{La struttura \structd{dirent} per la lettura delle informazioni dei 
2297     file.}
2298   \label{fig:file_dirent_struct}
2299 \end{figure}
2300
2301 % Lo spazio per la \struct{dirent} dove vengono restituiti i dati della
2302 % directory deve essere allocato a cura del chiamante, dato che la dimensione
2303
2304
2305 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
2306 presenti nella directory. Sia BSD che SVr4 che POSIX.1-2001\footnote{il
2307   vecchio standard POSIX prevedeva invece solo la presenza del campo
2308   \var{d\_fileno}, identico \var{d\_ino}, che in Linux era definito come alias
2309   di quest'ultimo, mentre il campo \var{d\_name} era considerato dipendente
2310   dall'implementazione.}  prevedono che siano sempre presenti il campo
2311 \var{d\_name}, che contiene il nome del file nella forma di una stringa
2312 terminata da uno zero, ed il campo \var{d\_ino}, che contiene il numero di
2313 \textit{inode} cui il file è associato e corrisponde al campo \var{st\_ino} di
2314 \struct{stat}.  La presenza di ulteriori campi opzionali oltre i due citati è
2315 segnalata dalla definizione di altrettante macro nella forma
2316 \code{\_DIRENT\_HAVE\_D\_XXX} dove \code{XXX} è il nome del relativo
2317 campo. Come si può evincere da fig.~\ref{fig:file_dirent_struct} nel caso di
2318 Linux sono pertanto definite le macro \macrod{\_DIRENT\_HAVE\_D\_TYPE},
2319 \macrod{\_DIRENT\_HAVE\_D\_OFF} e \macrod{\_DIRENT\_HAVE\_D\_RECLEN}, mentre non
2320 è definita la macro \macrod{\_DIRENT\_HAVE\_D\_NAMLEN}.
2321
2322 Dato che possono essere presenti campi opzionali e che lo standard
2323 POSIX.1-2001 non specifica una dimensione definita per il nome dei file (che
2324 può variare a seconda del filesystem), ma solo un limite superiore pari a
2325 \const{NAME\_MAX} (vedi tab.~\ref{tab:sys_file_macro}), in generale per
2326 allocare una struttura \struct{dirent} in maniera portabile occorre eseguire
2327 un calcolo per ottenere le dimensioni appropriate per il proprio
2328 sistema.\footnote{in SVr4 la lunghezza del campo è definita come
2329   \code{NAME\_MAX+1} che di norma porta al valore di 256 byte usato anche in
2330   fig.~\ref{fig:file_dirent_struct}.} Lo standard però richiede che il campo
2331 \var{d\_name} sia sempre l'ultimo della struttura, questo ci consente di
2332 ottenere la dimensione della prima parte con la macro di utilità generica
2333 \macro{offsetof}, che si può usare con il seguente prototipo:
2334
2335 {\centering
2336 \vspace{3pt}
2337 \begin{funcbox}{
2338 \fhead{stddef.h}
2339 \fdecl{size\_t \macrod{offsetof}(type, member)}
2340 \fdesc{Restituisce la posizione del campo \param{member} nella
2341   struttura \param{type}.}
2342
2343 \end{funcbox}
2344 }
2345
2346 Ottenuta allora con \code{offsetof(struct dirent, d\_name)} la dimensione
2347 della parte iniziale della struttura, basterà sommarci la dimensione massima
2348 dei nomi dei file nel filesystem che si sta usando, che si può ottenere
2349 attraverso la funzione \func{pathconf} (per la quale si rimanda a
2350 sez.~\ref{sec:sys_file_limits}) più un ulteriore carattere per la terminazione
2351 della stringa.
2352
2353 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
2354 indica il tipo di file (se \textit{fifo}, directory, collegamento simbolico,
2355 ecc.), e consente di evitare una successiva chiamata a \func{lstat} (vedi
2356 sez.~\ref{sec:file_stat}) per determinarlo. I suoi possibili valori sono
2357 riportati in tab.~\ref{tab:file_dtype_macro}. Si tenga presente che questo
2358 valore è disponibile solo per i filesystem che ne supportano la restituzione
2359 (fra questi i più noti sono \textsl{btrfs}, \textsl{ext2}, \textsl{ext3}, e
2360 \textsl{ext4}), per gli altri si otterrà sempre il valore
2361 \const{DT\_UNKNOWN}.\footnote{inoltre fino alla versione 2.1 della
2362   \acr{glibc}, pur essendo il campo \var{d\_type} presente, il suo uso non era
2363   implementato, e veniva restituito comunque il valore \const{DT\_UNKNOWN}.}
2364
2365 \begin{table}[htb]
2366   \centering
2367   \footnotesize
2368   \begin{tabular}[c]{|l|l|}
2369     \hline
2370     \textbf{Valore} & \textbf{Tipo di file} \\
2371     \hline
2372     \hline
2373     \constd{DT\_UNKNOWN} & Tipo sconosciuto.\\
2374     \constd{DT\_REG}     & File normale.\\
2375     \constd{DT\_DIR}     & Directory.\\
2376     \constd{DT\_LNK}     & Collegamento simbolico.\\
2377     \constd{DT\_FIFO}    & \textit{Fifo}.\\
2378     \constd{DT\_SOCK}    & Socket.\\
2379     \constd{DT\_CHR}     & Dispositivo a caratteri.\\
2380     \constd{DT\_BLK}     & Dispositivo a blocchi.\\
2381     \hline    
2382   \end{tabular}
2383   \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
2384     della struttura \struct{dirent}.}
2385   \label{tab:file_dtype_macro}
2386 \end{table}
2387
2388 Per la conversione da e verso l'analogo valore mantenuto dentro il campo
2389 \var{st\_mode} di \struct{stat} (vedi fig.~\ref{fig:file_stat_struct}) sono
2390 definite anche due macro di conversione, \macro{IFTODT} e \macro{DTTOIF}:
2391
2392 {\centering
2393 \vspace{3pt}
2394 \begin{funcbox}{
2395 \fhead{dirent.h}
2396 \fdecl{int \macrod{IFTODT}(mode\_t MODE)}
2397 \fdesc{Converte il tipo di file dal formato di \var{st\_mode} a quello di
2398   \var{d\_type}.}
2399 \fdecl{mode\_t \macrod{DTTOIF}(int DTYPE)}
2400 \fdesc{Converte il tipo di file dal formato di \var{d\_type} a quello di
2401   \var{st\_mode}.}  
2402
2403 \end{funcbox}
2404 }
2405
2406 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
2407 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
2408 letta. Con questi due campi diventa possibile, determinando la posizione delle
2409 varie voci, spostarsi all'interno dello \textit{stream} usando la funzione
2410 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
2411   estensioni prese da BSD, ed introdotte nello standard POSIX solo a partire
2412   dalla revisione POSIX.1-2001, per poterle utilizzare deve essere definita
2413   una delle macro \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE} o
2414   \macro{\_SVID\_SOURCE}.} il cui prototipo è:
2415
2416 \begin{funcproto}{
2417 \fhead{dirent.h}
2418 \fdecl{void seekdir(DIR *dir, off\_t offset)}
2419 \fdesc{Cambia la posizione all'interno di un \textit{directory stream}.} 
2420 }
2421 {La funzione non ritorna niente e non imposta errori.}
2422 \end{funcproto}
2423
2424 La funzione non ritorna nulla e non segnala errori, è però necessario che il
2425 valore dell'argomento \param{offset} sia valido per lo
2426 \textit{stream} \param{dir}; esso pertanto deve essere stato ottenuto o dal
2427 valore di \var{d\_off} di \struct{dirent} o dal valore restituito dalla
2428 funzione \funcd{telldir}, che legge la posizione corrente; il cui prototipo
2429 è:\footnote{prima della \acr{glibc} 2.1.1 la funzione restituiva un valore di
2430   tipo \type{off\_t}, sostituito a partire dalla versione 2.1.2 da \ctyp{long}
2431   per conformità a POSIX.1-2001.}
2432
2433 \begin{funcproto}{
2434 \fhead{dirent.h}
2435 \fdecl{long telldir(DIR *dir)}
2436 \fdesc{Ritorna la posizione corrente in un \textit{directory stream}.} 
2437 }
2438 {La funzione ritorna la posizione corrente nello \textit{stream} (un numero
2439   positivo) in caso di successo e $-1$ per un errore, nel qual caso
2440   \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
2441   valore errato per \param{dir}.  }
2442 \end{funcproto}
2443
2444 La sola funzione di posizionamento per un \textit{directory stream} prevista
2445 originariamente dallo standard POSIX è \funcd{rewinddir}, che riporta la
2446 posizione a quella iniziale; il suo prototipo è:
2447
2448 \begin{funcproto}{
2449 \fhead{sys/types.h}
2450 \fhead{dirent.h}
2451 \fdecl{void rewinddir(DIR *dir)}
2452 \fdesc{Si posiziona all'inizio di un \textit{directory stream}.} 
2453 }
2454 {La funzione non ritorna niente e non imposta errori.}
2455 \end{funcproto}
2456
2457 Una volta completate le operazioni si può chiudere il \textit{directory
2458   stream}, ed il file descriptor ad esso associato, con la funzione
2459 \funcd{closedir}, il cui prototipo è:
2460
2461 \begin{funcproto}{
2462 \fhead{sys/types.h}
2463 \fhead{dirent.h}
2464 \fdecl{int closedir(DIR *dir)}
2465 \fdesc{Chiude un \textit{directory stream}.} 
2466 }
2467 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2468   caso \var{errno} assume solo il valore \errval{EBADF}.}
2469 \end{funcproto}
2470
2471 A parte queste funzioni di base in BSD 4.3 venne introdotta un'altra funzione
2472 che permette di eseguire una scansione completa, con tanto di ricerca ed
2473 ordinamento, del contenuto di una directory; la funzione è
2474 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
2475   \acr{libc4} e richiede siano definite le macro \macro{\_BSD\_SOURCE} o
2476   \macro{\_SVID\_SOURCE}.} ed il suo prototipo è:
2477
2478 \begin{funcproto}{
2479 \fhead{dirent.h}
2480 \fdecl{int scandir(const char *dir, struct dirent ***namelist, \\
2481 \phantom{int scandir(}int(*filter)(const struct dirent *), \\
2482 \phantom{int scandir(}int(*compar)(const struct dirent **, const struct dirent **))}
2483 \fdesc{Esegue una scansione di un \textit{directory stream}.} 
2484 }
2485 {La funzione ritorna il numero di voci trovate in caso di successo e $-1$ per
2486   un errore, nel qual caso \var{errno} può assumere solo il valore
2487   \errval{ENOMEM}.}
2488 \end{funcproto}
2489
2490 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
2491 prototipo non è molto comprensibile; queste funzioni però sono quelle che
2492 controllano rispettivamente la selezione di una voce, passata con
2493 l'argomento \param{filter}, e l'ordinamento di tutte le voci selezionate,
2494 specificata dell'argomento \param{compar}.
2495
2496 La funzione legge tutte le voci della directory indicata dall'argomento
2497 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
2498 \struct{dirent}) come argomento della funzione di selezione specificata da
2499 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
2500 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
2501 Qualora si specifichi un valore \val{NULL} per l'argomento \param{filter} non
2502 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
2503
2504 Le voci selezionate possono essere riordinate tramite \funcm{qsort}, le
2505 modalità del riordinamento possono essere personalizzate usando la funzione
2506 \param{compar} come criterio di ordinamento di \funcm{qsort}, la funzione
2507 prende come argomenti le due strutture \struct{dirent} da confrontare
2508 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
2509 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
2510 \struct{dirent} viene restituito nell'argomento
2511 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
2512   restituisce, come \textit{value result argument}, l'indirizzo della stessa;
2513   questo significa che \param{namelist} deve essere dichiarato come
2514   \code{struct dirent **namelist} ed alla funzione si deve passare il suo
2515   indirizzo.}
2516
2517 \itindend{directory~stream}
2518
2519 Per l'ordinamento, vale a dire come valori possibili per l'argomento
2520 \param{compar}, sono disponibili due funzioni predefinite, \funcd{alphasort} e
2521 \funcd{versionsort}, i cui prototipi sono:
2522
2523 \begin{funcproto}{
2524 \fhead{dirent.h}
2525 \fdecl{int alphasort(const void *a, const void *b)}
2526 \fdecl{int versionsort(const void *a, const void *b)}
2527 \fdesc{Riordinano le voci di \textit{directory stream}.} 
2528 }
2529 {Le funzioni restituiscono un valore minore, uguale o maggiore di zero qualora
2530   il primo argomento sia rispettivamente minore, uguale o maggiore del secondo
2531   e non forniscono errori.}
2532 \end{funcproto}
2533
2534 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
2535 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
2536   argomenti dei puntatori a delle strutture \struct{dirent}; la glibc usa il
2537   prototipo originario di BSD, mostrato anche nella definizione, che prevede
2538   puntatori a \ctyp{void}.} e deve essere specificata come argomento
2539 \param{compar} per ottenere un ordinamento alfabetico secondo il valore del
2540 campo \var{d\_name} delle varie voci. La \acr{glibc} prevede come
2541 estensione\footnote{la \acr{glibc}, a partire dalla versione 2.1, effettua
2542   anche l'ordinamento alfabetico tenendo conto delle varie localizzazioni,
2543   usando \funcm{strcoll} al posto di \funcm{strcmp}.} anche
2544 \func{versionsort}, che ordina i nomi tenendo conto del numero di versione,
2545 cioè qualcosa per cui \texttt{file10} viene comunque dopo \texttt{file4}.
2546
2547 \begin{figure}[!htbp]
2548   \footnotesize \centering
2549   \begin{minipage}[c]{\codesamplewidth}
2550     \includecodesample{listati/my_ls.c}
2551   \end{minipage}
2552   \caption{Esempio di codice per eseguire la lista dei file contenuti in una
2553     directory.} 
2554   \label{fig:file_my_ls}
2555 \end{figure}
2556
2557 Un semplice esempio dell'uso di queste funzioni è riportato in
2558 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
2559 programma che, usando la funzione di scansione illustrata in
2560 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
2561 e la relativa dimensione, in sostanza una versione semplificata del comando
2562 \cmd{ls}.
2563
2564 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
2565 la parte di gestione delle opzioni, che prevede solo l'uso di una funzione per
2566 la stampa della sintassi, anch'essa omessa, ma il codice completo può essere
2567 trovato coi sorgenti allegati alla guida nel file \file{myls.c}.
2568
2569 In sostanza tutto quello che fa il programma, dopo aver controllato
2570 (\texttt{\small 12-15}) di avere almeno un argomento, che indicherà la
2571 directory da esaminare, è chiamare (\texttt{\small 16}) la funzione
2572 \myfunc{dir\_scan} per eseguire la scansione, usando la funzione \code{do\_ls}
2573 (\texttt{\small 22-29}) per fare tutto il lavoro.
2574
2575 Quest'ultima si limita (\texttt{\small 26}) a chiamare \func{stat} sul file
2576 indicato dalla directory entry passata come argomento (il cui nome è appunto
2577 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
2578 dati ad esso relativi, per poi provvedere (\texttt{\small 27}) a stampare il
2579 nome del file e la dimensione riportata in \var{data}.
2580
2581 Dato che la funzione verrà chiamata all'interno di \myfunc{dir\_scan} per ogni
2582 voce presente questo è sufficiente a stampare la lista completa dei file e
2583 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
2584 valore di ritorno per indicare una esecuzione senza errori.
2585
2586 \begin{figure}[!htbp]
2587   \footnotesize \centering
2588   \begin{minipage}[c]{\codesamplewidth}
2589     \includecodesample{listati/dir_scan.c}
2590   \end{minipage}
2591   \caption{Codice della funzione di scansione di una directory contenuta nel
2592     file \file{dir\_scan.c}.} 
2593   \label{fig:file_dirscan}
2594 \end{figure}
2595
2596 Tutto il grosso del lavoro è svolto dalla funzione \myfunc{dir\_scan},
2597 riportata in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e
2598 permette di eseguire una funzione, passata come secondo argomento, su tutte le
2599 voci di una directory.  La funzione inizia con l'aprire (\texttt{\small
2600   18-22}) uno \textit{stream} sulla directory passata come primo argomento,
2601 stampando un messaggio in caso di errore.
2602
2603 Il passo successivo (\texttt{\small 23-24}) è cambiare directory di lavoro
2604 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzioni
2605 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
2606 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
2607 (\texttt{\small 26-30}) sulle singole voci dello \textit{stream} ci si trovi
2608 all'interno della directory.\footnote{questo è essenziale al funzionamento
2609   della funzione \code{do\_ls}, e ad ogni funzione che debba usare il campo
2610   \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
2611   struttura \struct{dirent} sono sempre relativi alla directory in questione,
2612   e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
2613   ottenere le dimensioni.}
2614
2615 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
2616 alla funzione passata come secondo argomento, il ciclo di scansione della
2617 directory è molto semplice; si legge una voce alla volta (\texttt{\small 26})
2618 all'interno di una istruzione di \code{while} e fintanto che si riceve una
2619 voce valida, cioè un puntatore diverso da \val{NULL}, si esegue
2620 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
2621 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
2622   28}) qualora questa presenti una anomalia, identificata da un codice di
2623 ritorno negativo. Una volta terminato il ciclo la funzione si conclude con la
2624 chiusura (\texttt{\small 32}) dello \textit{stream}\footnote{nel nostro caso,
2625   uscendo subito dopo la chiamata, questo non servirebbe, in generale però
2626   l'operazione è necessaria, dato che la funzione può essere invocata molte
2627   volte all'interno dello stesso processo, per cui non chiudere i
2628   \textit{directory stream} comporterebbe un consumo progressivo di risorse,
2629   con conseguente rischio di esaurimento delle stesse.} e la restituzione
2630 (\texttt{\small 32}) del codice di operazioni concluse con successo.
2631
2632
2633
2634 \subsection{La directory di lavoro}
2635 \label{sec:file_work_dir}
2636
2637 \index{directory~di~lavoro|(} 
2638
2639 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
2640 directory nel filesystem,\footnote{questa viene mantenuta all'interno dei dati
2641   della sua \kstruct{task\_struct} (vedi fig.~\ref{fig:proc_task_struct}), più
2642   precisamente nel campo \texttt{pwd} della sotto-struttura
2643   \kstruct{fs\_struct}.} che è chiamata \textsl{directory corrente} o
2644 \textsl{directory di lavoro} (in inglese \textit{current working directory}).
2645 La directory di lavoro è quella da cui si parte quando un \textit{pathname} è
2646 espresso in forma relativa, dove il ``\textsl{relativa}'' fa riferimento
2647 appunto a questa directory.
2648
2649 Quando un utente effettua il login, questa directory viene impostata alla
2650 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
2651 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
2652 comando \cmd{pwd} la stampa sul terminale.  Siccome la directory di lavoro
2653 resta la stessa quando viene creato un processo figlio (vedi
2654 sez.~\ref{sec:proc_fork}), la directory di lavoro della shell diventa anche la
2655 directory di lavoro di qualunque comando da essa lanciato.
2656
2657 Dato che è il kernel che tiene traccia per ciascun processo
2658 dell'\textit{inode} della directory di lavoro, per ottenerne il
2659 \textit{pathname} occorre usare una apposita funzione,
2660 \funcd{getcwd},\footnote{con Linux \func{getcwd} è una \textit{system call}
2661   dalla versione 2.1.9, in precedenza il valore doveva essere ottenuto tramite
2662   il filesystem \texttt{/proc} da \procfile{/proc/self/cwd}.} il cui prototipo
2663 è:
2664
2665 \begin{funcproto}{
2666 \fhead{unistd.h}
2667 \fdecl{char *getcwd(char *buffer, size\_t size)}
2668 \fdesc{Legge il \textit{pathname} della directory di lavoro corrente.} 
2669 }
2670 {La funzione ritorna il puntatore a \param{buffer} in caso di successo e
2671   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori: 
2672   \begin{errlist}
2673   \item[\errcode{EACCES}] manca il permesso di lettura o di attraversamento  su
2674     uno dei componenti del \textit{pathname} (cioè su una delle directory
2675     superiori alla corrente).
2676   \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
2677     è nullo.
2678   \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata. 
2679   \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
2680     lunghezza del \textit{pathname}. 
2681   \end{errlist}
2682   ed inoltre \errcode{EFAULT} nel suo significato generico.}
2683 \end{funcproto}
2684
2685 La funzione restituisce il \textit{pathname} completo della directory di
2686 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
2687 precedentemente allocata, per una dimensione massima di \param{size}.  Il
2688 buffer deve essere sufficientemente largo da poter contenere il
2689 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
2690 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
2691 un errore.
2692
2693 Si può anche specificare un puntatore nullo come
2694 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
2695   supportata da Linux e dalla \acr{glibc}.} nel qual caso la stringa sarà
2696 allocata automaticamente per una dimensione pari a \param{size} qualora questa
2697 sia diversa da zero, o della lunghezza esatta del \textit{pathname}
2698 altrimenti. In questo caso ci si deve ricordare di disallocare la stringa con
2699 \func{free} una volta cessato il suo utilizzo.
2700
2701 Un uso comune di \func{getcwd} è quello di salvarsi la directory di lavoro
2702 all'avvio del programma per poi potervi tornare in un tempo successivo, un
2703 metodo alternativo più veloce, se non si è a corto di file descriptor, è
2704 invece quello di aprire all'inizio la directory corrente (vale a dire
2705 ``\texttt{.}'') e tornarvi in seguito con \func{fchdir}.
2706
2707 Di questa funzione esiste una versione alternativa per compatibilità
2708 all'indietro con BSD, \funcm{getwd}, che non prevede l'argomento \param{size}
2709 e quindi non consente di specificare la dimensione di \param{buffer} che
2710 dovrebbe essere allocato in precedenza ed avere una dimensione sufficiente
2711 (per BSD maggiore \const{PATH\_MAX}, che di solito 256 byte, vedi
2712 sez.~\ref{sec:sys_limits}). Il problema è che su Linux non esiste una
2713 dimensione superiore per la lunghezza di un \textit{pathname}, per cui non è
2714 detto che il buffer sia sufficiente a contenere il nome del file, e questa è
2715 la ragione principale per cui questa funzione è deprecata, e non la tratteremo.
2716
2717 Una seconda funzione usata per ottenere la directory di lavoro è
2718 \funcm{get\_current\_dir\_name},\footnote{la funzione è una estensione GNU e
2719   presente solo nella \acr{glibc}.} che non prende nessun argomento ed è
2720 sostanzialmente equivalente ad una \code{getcwd(NULL, 0)}, con la differenza
2721 che se disponibile essa ritorna il valore della variabile di ambiente
2722 \envvar{PWD}, che essendo costruita dalla shell può contenere un
2723 \textit{pathname} comprendente anche dei collegamenti simbolici. Usando
2724 \func{getcwd} infatti, essendo il \textit{pathname} ricavato risalendo
2725 all'indietro l'albero della directory, si perderebbe traccia di ogni passaggio
2726 attraverso eventuali collegamenti simbolici.
2727
2728 Per cambiare la directory di lavoro si può usare la funzione di sistema
2729 \funcd{chdir}, equivalente del comando di shell \cmd{cd}, il cui nome sta
2730 appunto per \textit{change directory}, il suo prototipo è:
2731
2732 \begin{funcproto}{
2733 \fhead{unistd.h}
2734 \fdecl{int chdir(const char *pathname)}
2735 \fdesc{Cambia la directory di lavoro per \textit{pathname}.} 
2736 }
2737 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2738   caso \var{errno} assumerà uno dei valori: 
2739   \begin{errlist}
2740   \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
2741     di \param{pathname}.
2742   \item[\errcode{ENOTDIR}] non si è specificata una directory.
2743   \end{errlist}
2744   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
2745   \errval{ENAMETOOLONG}, \errval{ENOENT} e \errval{ENOMEM} nel loro
2746   significato generico.}
2747 \end{funcproto}
2748
2749 La funzione cambia la directory di lavoro in \param{pathname} ed
2750 ovviamente \param{pathname} deve indicare una directory per la quale si hanno
2751 i permessi di accesso.
2752
2753 Dato che ci si può riferire ad una directory anche tramite un file descriptor,
2754 per cambiare directory di lavoro è disponibile anche la funzione di sistema
2755 \funcd{fchdir}, il cui prototipo è:
2756
2757 \begin{funcproto}{
2758 \fhead{unistd.h}
2759 \fdecl{int fchdir(int fd)}
2760 \fdesc{Cambia la directory di lavoro per file descriptor.} 
2761 }
2762 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2763   caso \var{errno} assumerà i valori \errval{EBADF} o \errval{EACCES} nel loro
2764   significato generico.}
2765 \end{funcproto}
2766
2767 La funzione è identica a \func{chdir}, ma prende come argomento un file
2768 descriptor \param{fd} invece di un \textit{pathname}. Anche in questo
2769 caso \param{fd} deve essere un file descriptor valido che fa riferimento ad
2770 una directory. Inoltre l'unico errore di accesso possibile (tutti gli altri
2771 sarebbero occorsi all'apertura di \param{fd}), è quello in cui il processo non
2772 ha il permesso di attraversamento alla directory specificata da \param{fd}.
2773
2774 \index{directory~di~lavoro|)} 
2775
2776
2777 \subsection{La creazione dei \textsl{file speciali}}
2778 \label{sec:file_mknod}
2779
2780 \index{file!di~dispositivo|(} 
2781 \index{file!speciali|(} 
2782
2783 Finora abbiamo parlato esclusivamente di file, directory e collegamenti
2784 simbolici, ma in sez.~\ref{sec:file_file_types} abbiamo visto che il sistema
2785 prevede anche degli altri tipi di file, che in genere vanno sotto il nome
2786 generico di \textsl{file speciali}, come i file di dispositivo, le \textit{fifo} ed i
2787 socket.
2788
2789 La manipolazione delle caratteristiche di questi file speciali, il cambiamento
2790 di nome o la loro cancellazione può essere effettuata con le stesse funzioni
2791 che operano sugli altri file, ma quando li si devono creare sono necessarie,
2792 come per le directory, delle funzioni apposite. La prima di queste è la
2793 funzione di sistema \funcd{mknod}, il cui prototipo è:
2794
2795 \begin{funcproto}{
2796 \fhead{sys/types.h}
2797 \fhead{sys/stat.h}
2798 \fhead{fcntl.h}
2799 \fhead{unistd.h}
2800 \fdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)}
2801 \fdesc{Crea un file speciale sul filesystem.} 
2802 }
2803 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2804   caso \var{errno} assumerà uno dei valori: 
2805   \begin{errlist}
2806   \item[\errcode{EEXIST}] \param{pathname} esiste già o è un collegamento
2807     simbolico. 
2808   \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
2809     \textit{fifo}, un socket o un dispositivo.
2810   \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
2811     l'\texttt{inode}, o il filesystem su cui si è cercato di
2812     creare \param{pathname} non supporta l'operazione.
2813   \end{errlist}
2814   ed inoltre \errval{EACCES}, \errval{EFAULT}, \errval{ELOOP},
2815   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOSPC},
2816   \errval{ENOTDIR} e \errval{EROFS} nel loro significato generico.}
2817 \end{funcproto}
2818
2819 La funzione permette di creare un \textit{inode} di tipo generico sul
2820 filesystem, e viene in genere utilizzata per creare i file di dispositivo, ma
2821 si può usare anche per creare qualunque tipo di file speciale ed anche file
2822 regolari. L'argomento \param{mode} specifica sia il tipo di file che si vuole
2823 creare che i relativi permessi, secondo i valori riportati in
2824 tab.~\ref{tab:file_mode_flags}, che vanno combinati con un OR aritmetico. I
2825 permessi sono comunque modificati nella maniera usuale dal valore di
2826 \textit{umask} (si veda sez.~\ref{sec:file_perm_management}).
2827
2828 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
2829 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
2830 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
2831 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
2832 per una \textit{fifo};\footnote{con Linux la funzione non può essere usata per
2833   creare directory o collegamenti simbolici, si dovranno usare le funzioni
2834   \func{mkdir} e \func{symlink} a questo dedicate.} un valore diverso
2835 comporterà l'errore \errcode{EINVAL}. Inoltre \param{pathname} non deve
2836 esistere, neanche come collegamento simbolico.
2837
2838 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
2839 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
2840 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
2841 valore verrà ignorato.  Solo l'amministratore può creare un file di
2842 dispositivo usando questa funzione (il processo deve avere la capacità
2843 \const{CAP\_MKNOD}), ma in Linux\footnote{questo è un comportamento specifico
2844   di Linux, la funzione non è prevista dallo standard POSIX.1 originale,
2845   mentre è presente in SVr4 e 4.4BSD, ma esistono differenze nei comportamenti
2846   e nei codici di errore, tanto che questa è stata introdotta in POSIX.1-2001
2847   con una nota che la definisce portabile solo quando viene usata per creare
2848   delle \textit{fifo}, ma comunque deprecata essendo utilizzabile a tale scopo
2849   la specifica \func{mkfifo}.} l'uso per la creazione di un file ordinario, di
2850 una \textit{fifo} o di un socket è consentito anche agli utenti normali.
2851
2852 I nuovi \textit{inode} creati con \func{mknod} apparterranno al proprietario e
2853 al gruppo del processo (usando \ids{UID} e \ids{GID} del gruppo effettivo) che
2854 li ha creati a meno non sia presente il bit \acr{sgid} per la directory o sia
2855 stata attivata la semantica BSD per il filesystem (si veda
2856 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
2857 l'\textit{inode}, nel qual caso per il gruppo verrà usato il \ids{GID} del
2858 proprietario della directory.
2859
2860 \itindbeg{major~number}
2861 \itindbeg{minor~number}
2862
2863 Nella creazione di un file di dispositivo occorre poi specificare
2864 correttamente il valore di \param{dev}; questo infatti è di tipo
2865 \type{dev\_t}, che è un tipo primitivo (vedi
2866 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
2867 \textsl{numero} di dispositivo. Il kernel infatti identifica ciascun
2868 dispositivo con un valore numerico, originariamente questo era un intero a 16
2869 bit diviso in due parti di 8 bit chiamate rispettivamente \textit{major
2870   number} e \textit{minor number}, che sono poi i due numeri mostrati dal
2871 comando \texttt{ls -l} al posto della dimensione quando lo si esegue su un
2872 file di dispositivo.
2873
2874 Il \textit{major number} identifica una classe di dispositivi (ad esempio la
2875 seriale, o i dischi IDE) e serve in sostanza per indicare al kernel quale è il
2876 modulo che gestisce quella classe di dispositivi. Per identificare uno
2877 specifico dispositivo di quella classe (ad esempio una singola porta seriale,
2878 o uno dei dischi presenti) si usa invece il \textit{minor number}. L'elenco
2879 aggiornato di questi numeri con le relative corrispondenze ai vari dispositivi
2880 può essere trovato nel file \texttt{Documentation/devices.txt} allegato alla
2881 documentazione dei sorgenti del kernel.
2882
2883 Data la crescita nel numero di dispositivi supportati, ben presto il limite
2884 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
2885 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
2886 \type{dev\_t}, con delle dimensioni passate a 12 bit per il \textit{major
2887   number} e 20 bit per il \textit{minor number}. La transizione però ha
2888 comportato il fatto che \type{dev\_t} è diventato un tipo opaco, e la
2889 necessità di specificare il numero tramite delle opportune macro, così da non
2890 avere problemi di compatibilità con eventuali ulteriori estensioni.
2891
2892 Le macro sono definite nel file \headfiled{sys/sysmacros.h},\footnote{se si
2893   usa la \acr{glibc} dalla versione 2.3.3 queste macro sono degli alias alle
2894   versioni specifiche di questa libreria, \macrod{gnu\_dev\_major},
2895   \macrod{gnu\_dev\_minor} e \macrod{gnu\_dev\_makedev} che si possono usare
2896   direttamente, al costo di una minore portabilità.} che viene automaticamente
2897 incluso quando si include \headfile{sys/types.h}. Si possono pertanto ottenere
2898 i valori del \textit{major number} e \textit{minor number} di un dispositivo
2899 rispettivamente con le macro \macro{major} e \macro{minor}:
2900
2901 {\centering
2902 \vspace{3pt}
2903 \begin{funcbox}{
2904 \fhead{sys/types.h}
2905 \fdecl{int \macrod{major}(dev\_t dev)}
2906 \fdesc{Restituisce il \textit{major number} del dispositivo \param{dev}.}
2907 \fdecl{int \macrod{minor}(dev\_t dev)}
2908 \fdesc{Restituisce il \textit{minor number} del dispositivo \param{dev}.}  
2909
2910 \end{funcbox}
2911 }
2912
2913 \noindent mentre una volta che siano noti \textit{major number} e
2914 \textit{minor number} si potrà costruire il relativo identificativo con la
2915 macro \macro{makedev}:
2916
2917 {\centering
2918 \vspace{3pt}
2919 \begin{funcbox}{
2920 \fhead{sys/types.h}
2921 \fdecl{dev\_t \macrod{makedev}(int major, int minor)}
2922 \fdesc{Dati \textit{major number} e \textit{minor number} restituisce
2923   l'identificativo di un dispositivo.} 
2924
2925 \end{funcbox}
2926 }
2927
2928
2929 \itindend{major~number}
2930 \itindend{minor~number}
2931 \index{file!di~dispositivo|)}
2932
2933 Dato che la funzione di sistema \func{mknod} presenta diverse varianti nei
2934 vari sistemi unix-like, lo standard POSIX.1-2001 la dichiara portabile solo in
2935 caso di creazione delle \textit{fifo}, ma anche in questo caso alcune
2936 combinazioni degli argomenti restano non specificate, per cui nello stesso
2937 standard è stata introdotta una funzione specifica per creare una
2938 \textit{fifo} deprecando l'uso di \func{mknod} a tale riguardo.  La funzione è
2939 \funcd{mkfifo} ed il suo prototipo è:
2940
2941 \begin{funcproto}{
2942 \fhead{sys/types.h}
2943 \fhead{sys/stat.h}
2944 \fdecl{int mkfifo(const char *pathname, mode\_t mode)}
2945 \fdesc{Crea una \textit{fifo}.} 
2946 }
2947 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2948   caso \var{errno} assumerà \errval{EACCES}, \errval{EEXIST},
2949   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC}, \errval{ENOTDIR} e
2950   \errval{EROFS} nel loro significato generico.}
2951 \end{funcproto}
2952
2953 La funzione crea la \textit{fifo} \param{pathname} con i
2954 permessi \param{mode}. Come per \func{mknod} il file \param{pathname} non deve
2955 esistere (neanche come collegamento simbolico); al solito i permessi
2956 specificati da \param{mode} vengono modificati dal valore di \textit{umask}
2957 (vedi sez.~\ref{sec:file_perm_management}).
2958
2959 \index{file!speciali|)} 
2960
2961
2962 \subsection{I file temporanei}
2963 \label{sec:file_temp_file}
2964
2965 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
2966 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
2967 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
2968 creare il file dopo aver controllato che questo non esista, nel momento fra il
2969 controllo e la creazione si ha giusto lo spazio per una possibile \textit{race
2970   condition} (si ricordi quanto visto in sez.~\ref{sec:proc_race_cond}).
2971
2972 \itindbeg{symlink~attack}
2973
2974 Molti problemi di sicurezza derivano proprio da una creazione non accorta di
2975 file temporanei che lascia aperta questa \textit{race condition}. Un
2976 attaccante allora potrà sfruttarla con quello che viene chiamato
2977 ``\textit{symlink attack}'' dove nell'intervallo fra la generazione di un nome
2978 e l'accesso allo stesso, viene creato un collegamento simbolico con quel nome
2979 verso un file diverso, ottenendo, se il programma sotto attacco ne ha la
2980 capacità, un accesso privilegiato.
2981
2982 \itindend{symlink~attack}
2983
2984 La \acr{glibc} provvede varie funzioni per generare nomi di file temporanei,
2985 di cui si abbia certezza di unicità al momento della generazione; storicamente
2986 la prima di queste funzioni create a questo scopo era
2987 \funcd{tmpnam},\footnote{la funzione è stata deprecata nella revisione
2988   POSIX.1-2008 dello standard POSIX.} il cui prototipo è:
2989
2990 \begin{funcproto}{
2991 \fhead{stdio.h}
2992 \fdecl{char *tmpnam(char *string)}
2993 \fdesc{Genera un nome univoco per un file temporaneo.} 
2994 }
2995 {La funzione ritorna il puntatore alla stringa con il nome in caso di successo
2996   e \val{NULL} in caso di fallimento, non sono definiti errori.}
2997 \end{funcproto}
2998
2999 La funzione restituisce il puntatore ad una stringa contente un nome di file
3000 valido e non esistente al momento dell'invocazione. Se si è passato come
3001 argomento \param{string} un puntatore non nullo ad un buffer di caratteri
3002 questo deve essere di dimensione \constd{L\_tmpnam} ed il nome generato vi
3003 verrà copiato automaticamente, altrimenti il nome sarà generato in un buffer
3004 statico interno che verrà sovrascritto ad una chiamata successiva.  Successive
3005 invocazioni della funzione continueranno a restituire nomi unici fino ad un
3006 massimo di \constd{TMP\_MAX} volte, limite oltre il quale il comportamento è
3007 indefinito. Al nome viene automaticamente aggiunto come prefisso la directory
3008 specificata dalla costante \constd{P\_tmpdir}.\footnote{le costanti
3009   \const{L\_tmpnam}, \const{P\_tmpdir} e \const{TMP\_MAX} sono definite in
3010   \headfile{stdio.h}.}
3011
3012 Di questa funzione esiste una versione rientrante, \funcm{tmpnam\_r}, che non
3013 fa nulla quando si passa \val{NULL} come argomento.  Una funzione simile,
3014 \funcd{tempnam}, permette di specificare un prefisso per il file
3015 esplicitamente, il suo prototipo è:
3016
3017 \begin{funcproto}{
3018 \fhead{stdio.h}
3019 \fdecl{char *tempnam(const char *dir, const char *pfx)}
3020 \fdesc{Genera un nome univoco per un file temporaneo.} 
3021 }
3022 {La funzione ritorna il puntatore alla stringa con il nome in caso di successo
3023   e \val{NULL} per un errore, nel qual caso \var{errno} potrà assumere solo il
3024   valore \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
3025 \end{funcproto}
3026
3027 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
3028 per cui è sempre rientrante, occorre però ricordarsi di disallocare con
3029 \code{free} il puntatore che restituisce.  L'argomento \param{pfx} specifica
3030 un prefisso di massimo 5 caratteri per il nome provvisorio. La funzione
3031 assegna come directory per il file temporaneo, verificando che esista e sia
3032 accessibile, la prima valida fra le seguenti:
3033 \begin{itemize*}
3034 \item la variabile di ambiente \envvar{TMPDIR} (non ha effetto se non è
3035   definita o se il programma chiamante è \acr{suid} o \acr{sgid}, vedi
3036   sez.~\ref{sec:file_special_perm}),
3037 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}),
3038 \item il valore della costante \const{P\_tmpdir},
3039 \item la directory \file{/tmp}.
3040 \end{itemize*}
3041
3042 In ogni caso, anche se con queste funzioni la generazione del nome è casuale,
3043 ed è molto difficile ottenere un nome duplicato, nulla assicura che un altro
3044 processo non possa avere creato, fra l'ottenimento del nome e l'apertura del
3045 file, un altro file o un collegamento simbolico con lo stesso nome. Per questo
3046 motivo quando si usa il nome ottenuto da una di queste funzioni occorre sempre
3047 assicurarsi che non si stia usando un collegamento simbolico e aprire il nuovo
3048 file in modalità di esclusione (cioè con l'opzione \const{O\_EXCL} per i file
3049 descriptor o con il flag ``\texttt{x}'' per gli \textit{stream}) che fa
3050 fallire l'apertura in caso il file sia già esistente. Essendo disponibili
3051 alternative migliori l'uso di queste funzioni è deprecato.
3052
3053 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
3054 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
3055 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
3056
3057 \begin{funcproto}{
3058 \fhead{stdio.h}
3059 \fdecl{FILE *tmpfile(void)}
3060 \fdesc{Apre un file temporaneo in lettura/scrittura.} 
3061 }
3062 {La funzione ritorna il puntatore allo \textit{stream} associato al file
3063   temporaneo in caso di successo e \val{NULL} per un errore, nel qual caso
3064   \var{errno} assumerà uno dei valori:
3065   \begin{errlist}
3066     \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
3067     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
3068   \end{errlist}
3069   ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
3070   \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES} nel loro significato
3071   generico.}
3072 \end{funcproto}
3073
3074
3075 La funzione restituisce direttamente uno \textit{stream} già aperto (in
3076 modalità \code{w+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso,
3077 che viene automaticamente cancellato alla sua chiusura o all'uscita dal
3078 programma. Lo standard non specifica in quale directory verrà aperto il file,
3079 ma la \acr{glibc} prima tenta con \const{P\_tmpdir} e poi con
3080 \file{/tmp}. Questa funzione è rientrante e non soffre di problemi di
3081 \textit{race condition}.
3082
3083 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
3084 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
3085 modificano una stringa di input che serve da modello e che deve essere
3086 conclusa da 6 caratteri ``\texttt{X}'' che verranno sostituiti da un codice
3087 unico. La prima delle due è analoga a \func{tmpnam} e genera soltanto un nome
3088 casuale, il suo prototipo è:
3089
3090 \begin{funcproto}{
3091 \fhead{stlib.h}
3092 \fdecl{char *mktemp(char *template)}
3093 \fdesc{Genera un nome univoco per un file temporaneo.} 
3094 }
3095 {La funzione ritorna  il puntatore a \param{template} in caso di successo e
3096   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori: 
3097   \begin{errlist}
3098     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3099   \end{errlist}}
3100 \end{funcproto}
3101
3102 La funzione genera un nome univoco sostituendo le \code{XXXXXX} finali di
3103 \param{template}; dato che \param{template} deve poter essere modificata dalla
3104 funzione non si può usare una stringa costante.  Tutte le avvertenze riguardo
3105 alle possibili \textit{race condition} date per \func{tmpnam} continuano a
3106 valere; inoltre in alcune vecchie implementazioni il valore usato per
3107 sostituire le \code{XXXXXX} viene formato con il \ids{PID} del processo più
3108 una lettera, il che mette a disposizione solo 26 possibilità diverse per il
3109 nome del file, e rende il nome temporaneo facile da indovinare.  Per tutti
3110 questi motivi la funzione è deprecata e non dovrebbe mai essere usata.
3111
3112 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
3113 \func{tmpfile}, ma restituisce un file descriptor invece di un nome; il suo
3114 prototipo è:
3115
3116 \begin{funcproto}{
3117 \fhead{stlib.h}
3118 \fdecl{int mkstemp(char *template)}
3119 \fdesc{Apre un file temporaneo.} 
3120 }
3121
3122 {La funzione ritorna il file descriptor in caso di successo e $-1$ per un
3123   errore, nel qual 
3124   caso \var{errno} assumerà uno dei valori: 
3125   \begin{errlist}
3126     \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
3127       contenuto di \param{template} è indefinito.
3128     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3129   \end{errlist}}
3130 \end{funcproto}
3131
3132
3133 Come per \func{mktemp} anche in questo caso \param{template} non può essere
3134 una stringa costante. La funzione apre un file in lettura/scrittura con la
3135 funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
3136 sez.~\ref{sec:file_open_close}), in questo modo al ritorno della funzione si
3137 ha la certezza di essere stati i creatori del file, i cui permessi (si veda
3138 sez.~\ref{sec:file_perm_overview}) sono impostati al valore \code{0600}
3139 (lettura e scrittura solo per il proprietario).\footnote{questo è vero a
3140   partire dalla \acr{glibc} 2.0.7, le versioni precedenti della \acr{glibc} e
3141   le vecchie \acr{libc5} e \acr{libc4} usavano il valore \code{0666} che
3142   permetteva a chiunque di leggere e scrivere i contenuti del file.}  Di
3143 questa funzione esiste una variante \funcd{mkostemp}, introdotta
3144 specificamente dalla \acr{glibc},\footnote{la funzione è stata introdotta
3145   nella versione 2.7 delle librerie e richiede che sia definita la macro
3146   \macro{\_GNU\_SOURCE}.} il cui prototipo è:
3147
3148 \begin{funcproto}{
3149 \fhead{stlib.h}
3150 \fdecl{int mkostemp(char *template, int flags)}
3151 \fdesc{Apre un file temporaneo.} 
3152 }
3153 {La funzione ritorna un file descriptor in caso di successo e $-1$ per un
3154   errore, nel qual caso \var{errno} assumerà  gli stessi valori di
3155   \func{mkstemp}.} 
3156 \end{funcproto}
3157 \noindent la cui sola differenza è la presenza dell'ulteriore argomento
3158 \var{flags} che consente di specificare i flag da passare ad \func{open}
3159 nell'apertura del file.
3160
3161
3162 In OpenBSD è stata introdotta un'altra funzione simile alle precedenti,
3163 \funcd{mkdtemp}, che crea invece una directory temporanea;\footnote{la
3164   funzione è stata introdotta nella \acr{glibc} a partire dalla versione
3165   2.1.91 ed inserita nello standard POSIX.1-2008.}  il suo prototipo è:
3166
3167 \begin{funcproto}{
3168 \fhead{stlib.h}
3169 \fdecl{char *mkdtemp(char *template)}
3170 \fdesc{Crea una directory temporanea.} 
3171 }
3172 {La funzione ritorna il puntatore al nome della directory in caso di successo
3173   e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei
3174   valori:
3175   \begin{errlist}
3176     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3177   \end{errlist}
3178   più gli altri eventuali codici di errore di \func{mkdir}.}
3179 \end{funcproto}
3180
3181 La funzione crea una directory temporanea il cui nome è ottenuto sostituendo
3182 le \code{XXXXXX} finali di \param{template} con permessi \code{0700} (si veda
3183 sez.~\ref{sec:file_perm_overview} per i dettagli). Dato che la creazione della
3184 directory è sempre esclusiva i precedenti problemi di \textit{race condition}
3185 non si pongono.
3186
3187
3188
3189 \section{La manipolazione delle caratteristiche dei file}
3190 \label{sec:file_infos}
3191
3192 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
3193 relative alle caratteristiche di ciascun file, a partire dalle informazioni
3194 relative al controllo di accesso, sono mantenute nell'\textit{inode}. Vedremo
3195 in questa sezione come sia possibile leggere tutte queste informazioni usando
3196 la funzione \func{stat}, che permette l'accesso a tutti i dati memorizzati
3197 nell'\textit{inode}; esamineremo poi le varie funzioni usate per manipolare
3198 tutte queste informazioni, eccetto quelle che riguardano la gestione del
3199 controllo di accesso, trattate in sez.~\ref{sec:file_access_control}.
3200
3201
3202 \subsection{La lettura delle caratteristiche dei file}
3203 \label{sec:file_stat}
3204
3205 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
3206 delle funzioni \func{stat} che sono quelle che usa il comando \cmd{ls} per
3207 poter ottenere e mostrare tutti i dati relativi ad un file; ne fanno parte le
3208 funzioni di sistema \funcd{stat}, \funcd{fstat} e \funcd{lstat}, i cui
3209 prototipi sono:
3210
3211 \begin{funcproto}{
3212 \fhead{sys/types.h}
3213 \fhead{sys/stat.h}
3214 \fhead{unistd.h}
3215 \fdecl{int stat(const char *file\_name, struct stat *buf)}
3216 \fdecl{int lstat(const char *file\_name, struct stat *buf)}
3217 \fdecl{int fstat(int filedes, struct stat *buf)}
3218 \fdesc{Leggono le informazioni di un file.} 
3219 }
3220 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3221   caso \var{errno} assumerà uno dei valori:
3222   \begin{errlist}
3223     \item[\errcode{EOVERFLOW}] il file ha una dimensione che non può essere
3224       rappresentata nel tipo \type{off\_t} (può avvenire solo in caso di
3225       programmi compilati su piattaforme a 32 bit senza le estensioni
3226       (\texttt{-D \_FILE\_OFFSET\_BITS=64}) per file a 64 bit).
3227   \end{errlist}
3228   ed inoltre \errval{EFAULT} ed \errval{ENOMEM}, per \func{stat} e
3229   \func{lstat} anche \errval{EACCES}, \errval{ELOOP}, \errval{ENAMETOOLONG},
3230   \errval{ENOENT}, \errval{ENOTDIR}, per \func{fstat} anche \errval{EBADF}, 
3231   nel loro significato generico.}
3232 \end{funcproto}
3233
3234 La funzione \func{stat} legge le informazioni del file indicato
3235 da \param{file\_name} e le inserisce nel buffer puntato
3236 dall'argomento \param{buf}; la funzione \func{lstat} è identica a \func{stat}
3237 eccetto che se \param{file\_name} è un collegamento simbolico vengono lette le
3238 informazioni relative ad esso e non al file a cui fa riferimento. Infine
3239 \func{fstat} esegue la stessa operazione su un file già aperto, specificato
3240 tramite il suo file descriptor \param{filedes}.
3241
3242 La struttura \struct{stat} usata da queste funzioni è definita nell'header
3243 \headfiled{sys/stat.h} e in generale dipende dall'implementazione; la versione
3244 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
3245 riportata dalla pagina di manuale di \func{stat}. In realtà la definizione
3246 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
3247 riservati per estensioni come tempi dei file più precisi (vedi
3248 sez.~\ref{sec:file_file_times}).
3249
3250 \begin{figure}[!htb]
3251   \footnotesize
3252   \centering
3253   \begin{minipage}[c]{0.8\textwidth}
3254     \includestruct{listati/stat.h}
3255   \end{minipage} 
3256   \normalsize 
3257   \caption{La struttura \structd{stat} per la lettura delle informazioni dei 
3258     file.}
3259   \label{fig:file_stat_struct}
3260 \end{figure}
3261
3262 Si noti come i vari membri della struttura siano specificati come tipi
3263 primitivi del sistema, di quelli definiti in
3264 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \headfile{sys/types.h},
3265 con l'eccezione di \typed{blksize\_t} e \typed{blkcnt\_t} che sono nuovi tipi
3266 introdotti per rendersi indipendenti dalla piattaforma. 
3267
3268 Benché la descrizione dei commenti di fig.~\ref{fig:file_stat_struct} sia
3269 abbastanza chiara, vale la pena illustrare maggiormente il significato dei
3270 campi di \struct{stat} su cui non torneremo in maggior dettaglio nel resto di
3271 questa sezione:
3272 \begin{itemize*}
3273
3274 \item Il campo \var{st\_nlink} contiene il numero di \textit{hard link} che
3275   fanno riferimento al file (il cosiddetto \textit{link count}) di cui abbiamo
3276   già parlato in numerose occasioni.
3277
3278 \item Il campo \var{st\_ino} contiene il numero di \textit{inode} del file,
3279   quello viene usato all'interno del filesystem per identificarlo e che può
3280   essere usato da un programma per determinare se due \textit{pathname} fanno
3281   riferimento allo stesso file.
3282
3283 \item Il campo \var{st\_dev} contiene il numero del dispositivo su cui risiede
3284   il file (o meglio il suo filesystem). Si tratta dello stesso numero che si
3285   usa con \func{mknod} e che può essere decomposto in \textit{major number} e
3286   \textit{minor number} con le macro \macro{major} e \macro{minor} viste in
3287   sez.~\ref{sec:file_mknod}.
3288
3289 \item Il campo \var{st\_rdev} contiene il numero di dispositivo associato al
3290   file stesso ed ovviamente ha un valore significativo soltanto quando il file
3291   è un dispositivo a caratteri o a blocchi.
3292
3293 \item Il campo \var{st\_blksize} contiene la dimensione dei blocchi di dati
3294   usati nell'I/O su disco, che è anche la dimensione usata per la
3295   bufferizzazione dei dati dalle librerie del C per l'interfaccia degli
3296   \textit{stream}.  Leggere o scrivere blocchi di dati in dimensioni inferiori
3297   a questo valore è inefficiente in quanto le operazioni su disco usano
3298   comunque trasferimenti di questa dimensione.
3299
3300 \end{itemize*}
3301
3302 % TODO trattare anche statx, aggiunta con il kernel 4.11 (vedi
3303 % https://lwn.net/Articles/707602/ e
3304 % https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=a528d35e8bfcc521d7cb70aaf03e1bd296c8493f) 
3305
3306
3307 \subsection{I tipi di file}
3308 \label{sec:file_types}
3309
3310 Abbiamo sottolineato fin dall'introduzione che Linux, come ogni sistema
3311 unix-like, supporta oltre ai file ordinari e alle directory una serie di altri
3312 ``\textsl{tipi}'' di file che possono stare su un filesystem (elencati in
3313 tab.~\ref{tab:file_file_types}).  Il tipo di file viene ritornato dalle
3314 funzioni della famiglia \func{stat} all'interno del campo \var{st\_mode} di
3315 una struttura \struct{stat}. 
3316
3317 Il campo \var{st\_mode} è una maschera binaria in cui l'informazione viene
3318 suddivisa nei vari bit che compongono, ed oltre a quelle sul tipo di file,
3319 contiene anche le informazioni relative ai permessi su cui torneremo in
3320 sez.~\ref{sec:file_perm_overview}. Dato che i valori numerici usati per
3321 definire il tipo di file possono variare a seconda delle implementazioni, lo
3322 standard POSIX definisce un insieme di macro che consentono di verificare il
3323 tipo di file in maniera standardizzata.
3324
3325 \begin{table}[htb]
3326   \centering
3327   \footnotesize
3328   \begin{tabular}[c]{|l|l|}
3329     \hline
3330     \textbf{Macro} & \textbf{Tipo del file} \\
3331     \hline
3332     \hline
3333     \macrod{S\_ISREG}\texttt{(m)}  & File normale.\\
3334     \macrod{S\_ISDIR}\texttt{(m)}  & Directory.\\
3335     \macrod{S\_ISCHR}\texttt{(m)}  & Dispositivo a caratteri.\\
3336     \macrod{S\_ISBLK}\texttt{(m)}  & Dispositivo a blocchi.\\
3337     \macrod{S\_ISFIFO}\texttt{(m)} & \textit{Fifo}.\\
3338     \macrod{S\_ISLNK}\texttt{(m)}  & Collegamento simbolico.\\
3339     \macrod{S\_ISSOCK}\texttt{(m)} & Socket.\\
3340     \hline    
3341   \end{tabular}
3342   \caption{Macro per i tipi di file (definite in \headfile{sys/stat.h}).}
3343   \label{tab:file_type_macro}
3344 \end{table}
3345
3346 Queste macro vengono usate anche da Linux che supporta pure le estensioni allo
3347 standard per i collegamenti simbolici e i socket definite da BSD.\footnote{le
3348   ultime due macro di tab.~\ref{tab:file_type_macro}, che non sono presenti
3349   nello standard POSIX fino alla revisione POSIX.1-1996.}  L'elenco completo
3350 delle macro con cui è possibile estrarre da \var{st\_mode} l'informazione
3351 relativa al tipo di file è riportato in tab.~\ref{tab:file_type_macro}, tutte
3352 le macro restituiscono un valore intero da usare come valore logico e prendono
3353 come argomento il valore di \var{st\_mode}.
3354
3355 \begin{table}[htb]
3356   \centering
3357   \footnotesize
3358   \begin{tabular}[c]{|l|c|l|}
3359     \hline
3360     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
3361     \hline
3362     \hline
3363     \constd{S\_IFMT}   &  0170000 & Maschera per i bit del tipo di file.\\
3364     \constd{S\_IFSOCK} &  0140000 & Socket.\\
3365     \constd{S\_IFLNK}  &  0120000 & Collegamento simbolico.\\
3366     \constd{S\_IFREG}  &  0100000 & File regolare.\\ 
3367     \constd{S\_IFBLK}  &  0060000 & Dispositivo a blocchi.\\
3368     \constd{S\_IFDIR}  &  0040000 & Directory.\\
3369     \constd{S\_IFCHR}  &  0020000 & Dispositivo a caratteri.\\
3370     \constd{S\_IFIFO}  &  0010000 & \textit{Fifo}.\\
3371     \hline
3372     \constd{S\_ISUID}  &  0004000 & Set user ID (\acr{suid}) bit, vedi
3373                                    sez.~\ref{sec:file_special_perm}).\\
3374     \constd{S\_ISGID}  &  0002000 & Set group ID (\acr{sgid}) bit, vedi
3375                                    sez.~\ref{sec:file_special_perm}).\\
3376     \constd{S\_ISVTX}  &  0001000 & \acr{Sticky} bit, vedi
3377                                    sez.~\ref{sec:file_special_perm}).\\
3378     \hline
3379     \constd{S\_IRWXU}  &  00700   & Maschera per i permessi del proprietario.\\
3380     \constd{S\_IRUSR}  &  00400   & Il proprietario ha permesso di lettura.\\
3381     \constd{S\_IWUSR}  &  00200   & Il proprietario ha permesso di scrittura.\\
3382     \constd{S\_IXUSR}  &  00100   & Il proprietario ha permesso di esecuzione.\\
3383     \hline
3384     \constd{S\_IRWXG}  &  00070   & Maschera per i permessi del gruppo.\\
3385     \constd{S\_IRGRP}  &  00040   & Il gruppo ha permesso di lettura.\\
3386     \constd{S\_IWGRP}  &  00020   & Il gruppo ha permesso di scrittura.\\
3387     \constd{S\_IXGRP}  &  00010   & Il gruppo ha permesso di esecuzione.\\
3388     \hline
3389     \constd{S\_IRWXO}  &  00007   & Maschera per i permessi di tutti gli altri\\
3390     \constd{S\_IROTH}  &  00004   & Gli altri hanno permesso di lettura.\\
3391     \constd{S\_IWOTH}  &  00002   & Gli altri hanno permesso di esecuzione.\\
3392     \constd{S\_IXOTH}  &  00001   & Gli altri hanno permesso di esecuzione.\\
3393     \hline    
3394   \end{tabular}
3395   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
3396     \var{st\_mode} (definite in \headfile{sys/stat.h}).}
3397   \label{tab:file_mode_flags}
3398 \end{table}
3399
3400 Oltre alle macro di tab.~\ref{tab:file_type_macro}, che semplificano
3401 l'operazione, è possibile usare direttamente il valore di \var{st\_mode} per
3402 ricavare il tipo di file controllando direttamente i vari bit in esso
3403 memorizzati. Per questo sempre in \headfile{sys/stat.h} sono definite le varie
3404 costanti numeriche riportate in tab.~\ref{tab:file_mode_flags}, che
3405 definiscono le maschere che consentono di selezionare non solo i dati relativi
3406 al tipo di file, ma anche le informazioni relative ai permessi su cui
3407 torneremo in sez.~\ref{sec:file_access_control}, ed identificare i rispettivi
3408 valori.
3409
3410 Le costanti che servono per la identificazione del tipo di file sono riportate
3411 nella prima sezione di tab.~\ref{tab:file_mode_flags}, mentre le sezioni
3412 successive attengono alle costanti usate per i permessi.  Il primo valore
3413 dell'elenco è la maschera binaria \const{S\_IFMT} che permette di estrarre da
3414 \var{st\_mode} (con un AND aritmetico) il blocco di bit nei quali viene
3415 memorizzato il tipo di file. I valori successivi sono le costanti
3416 corrispondenti ai vari tipi di file, e possono essere usate per verificare la
3417 presenza del tipo di file voluto ed anche, con opportune combinazioni,
3418 alternative fra più tipi di file. 
3419
3420 Si tenga presente però che a differenza dei permessi, l'informazione relativa
3421 al tipo di file non è una maschera binaria, per questo motivo se si volesse
3422 impostare una condizione che permetta di controllare se un file è una
3423 directory o un file ordinario non si possono controllare dei singoli bit, ma
3424 si dovrebbe usare una macro di preprocessore come:
3425 \includecodesnip{listati/is_regdir.h}
3426 in cui si estraggono ogni volta da \var{st\_mode} i bit relativi al tipo di
3427 file e poi si effettua il confronto con i due possibili tipi di file.
3428
3429
3430 \subsection{Le dimensioni dei file}
3431 \label{sec:file_file_size}
3432
3433 Abbiamo visto in fig.~\ref{fig:file_stat_struct} che campo \var{st\_size} di
3434 una struttura \struct{stat} contiene la dimensione del file in byte. Questo
3435 però è vero solo se si tratta di un file regolare, mentre nel caso di un
3436 collegamento simbolico la dimensione è quella del \textit{pathname} che il
3437 collegamento stesso contiene, infine per le \textit{fifo} ed i file di dispositivo
3438 questo campo è sempre nullo.
3439
3440 Il campo \var{st\_blocks} invece definisce la lunghezza del file in blocchi di
3441 512 byte. La differenza con \var{st\_size} è che in questo caso si fa
3442 riferimento alla quantità di spazio disco allocata per il file, e non alla
3443 dimensione dello stesso che si otterrebbe leggendolo sequenzialmente.
3444
3445 Si deve tener presente infatti che la lunghezza del file riportata in
3446 \var{st\_size} non è detto che corrisponda all'occupazione dello spazio su
3447 disco, e non solo perché la parte finale del file potrebbe riempire
3448 parzialmente un blocco. In un sistema unix-like infatti è possibile
3449 l'esistenza dei cosiddetti \textit{sparse file}, cioè file in cui sono
3450 presenti dei ``\textsl{buchi}'' (\textit{holes} nella nomenclatura inglese)
3451 che si formano tutte le volte che si va a scrivere su un file dopo aver
3452 eseguito uno spostamento oltre la sua fine (tratteremo in dettaglio
3453 l'argomento in sez.~\ref{sec:file_lseek}).
3454
3455 In questo caso si avranno risultati differenti a seconda del modo in cui si
3456 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
3457 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
3458 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
3459 caso per i ``\textsl{buchi}'' vengono restituiti degli zeri, si avrà lo stesso
3460 risultato di \cmd{ls}.
3461
3462 Se è sempre possibile allargare un file, scrivendoci sopra o usando la
3463 funzione \func{lseek} (vedi sez.~\ref{sec:file_lseek}) per spostarsi oltre la
3464 sua fine, esistono anche casi in cui si può avere bisogno di effettuare un
3465 troncamento, scartando i dati presenti al di là della dimensione scelta come
3466 nuova fine del file.
3467
3468 Un file può sempre essere troncato a zero aprendolo con il flag
3469 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
3470 dimensione si possono usare le due funzioni di sistema \funcd{truncate} e
3471 \funcd{ftruncate}, i cui prototipi sono:
3472
3473 \begin{funcproto}{
3474 \fhead{unistd.h}
3475 \fdecl{int ftruncate(int fd, off\_t length))}
3476 \fdecl{int truncate(const char *file\_name, off\_t length)}
3477 \fdesc{Troncano un file.} 
3478 }
3479 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3480   caso \var{errno} assumerà uno dei valori: 
3481   \begin{errlist}
3482   \item[\errcode{EINTR}] si è stati interrotti da un segnale.
3483   \item[\errcode{EINVAL}] \param{length} è negativa o maggiore delle
3484     dimensioni massime di un file.
3485   \item[\errcode{EPERM}] il filesystem non supporta il troncamento di un file.
3486   \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
3487   \end{errlist} 
3488   per entrambe, mentre per \func{ftruncate} si avranno anche: 
3489   \begin{errlist}
3490   \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3491   \item[\errcode{EINVAL}] \param{fd} non è un riferimento a un file o non è
3492     aperto in scrittura. 
3493   \end{errlist}
3494   e per \func{truncate} si avranno anche: 
3495   \begin{errlist}
3496   \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file o il
3497     permesso di attraversamento di una delle componenti del \textit{pathname}.
3498   \item[\errcode{EISDIR}] \param{file\_name} fa riferimento ad una directory.
3499   \end{errlist}
3500   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
3501   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR} e \errval{EROFS}
3502   nel loro significato generico.}
3503 \end{funcproto}
3504
3505 Entrambe le funzioni fan sì che la dimensione del file sia troncata ad un
3506 valore massimo specificato da \param{length}, e si distinguono solo per il
3507 fatto che il file viene indicato con un \textit{pathname} per \func{truncate}
3508 e con un file descriptor per \funcd{ftruncate}. Si tenga presente che se il
3509 file è più lungo della lunghezza specificata i dati in eccesso saranno
3510 perduti.
3511
3512 Il comportamento in caso di lunghezza del file inferiore a \param{length} non
3513 è specificato e dipende dall'implementazione: il file può essere lasciato
3514 invariato o esteso fino alla lunghezza scelta. Nel caso di Linux viene esteso
3515 con la creazione di un \textsl{buco} nel file e ad una lettura si otterranno
3516 degli zeri, si tenga presente però che questo comportamento è supportato solo
3517 per filesystem nativi, ad esempio su un filesystem non nativo come il VFAT di
3518 Windows questo non è possibile.
3519
3520
3521 \subsection{I tempi dei file}
3522 \label{sec:file_file_times}
3523
3524 Il sistema mantiene per ciascun file tre tempi, che sono registrati
3525 nell'\textit{inode} insieme agli altri attributi del file. Questi possono
3526 essere letti tramite la funzione \func{stat}, che li restituisce attraverso
3527 tre campi della struttura \struct{stat} di fig.~\ref{fig:file_stat_struct}. Il
3528 significato di questi tempi e dei relativi campi della struttura \struct{stat}
3529 è illustrato nello schema di tab.~\ref{tab:file_file_times}, dove è anche
3530 riportato un esempio delle funzioni che effettuano cambiamenti su di essi. Il
3531 valore del tempo è espresso nel cosiddetto \textit{calendar time}, su cui
3532 torneremo in dettaglio in sez.~\ref{sec:sys_time}.
3533
3534 \begin{table}[htb]
3535   \centering
3536   \footnotesize
3537   \begin{tabular}[c]{|c|l|l|c|}
3538     \hline
3539     \textbf{Membro} & \textbf{Significato} & \textbf{Funzione} 
3540     & \textbf{Opzione di \cmd{ls}} \\
3541     \hline
3542     \hline
3543     \var{st\_atime}& ultimo accesso ai dati del file    &
3544                      \func{read}, \func{utime}          & \cmd{-u}\\
3545     \var{st\_mtime}& ultima modifica ai dati del file   &
3546                      \func{write}, \func{utime}         & default\\
3547     \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
3548                      \func{chmod}, \func{utime}         & \cmd{-c}\\
3549     \hline
3550   \end{tabular}
3551   \caption{I tre tempi associati a ciascun file.}
3552   \label{tab:file_file_times}
3553 \end{table}
3554
3555 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
3556 ultima modifica (il \textit{modification time}) riportato in \var{st\_mtime},
3557 ed il tempo di ultimo cambiamento di stato (il \textit{change status time})
3558 riportato in \var{st\_ctime}. Il primo infatti fa riferimento ad una modifica
3559 del contenuto di un file, mentre il secondo ad una modifica dei metadati
3560 dell'\textit{inode}. Dato che esistono molte operazioni, come la funzione
3561 \func{link} e altre che vedremo in seguito, che modificano solo le
3562 informazioni contenute nell'\textit{inode} senza toccare il contenuto del
3563 file, diventa necessario l'utilizzo di questo secondo tempo.
3564
3565 Il tempo di ultima modifica viene usato ad esempio da programmi come
3566 \cmd{make} per decidere quali file necessitano di essere ricompilati perché
3567 più recenti dei loro sorgenti oppure dai programmi di backup, talvolta insieme
3568 anche al tempo di cambiamento di stato, per decidere quali file devono essere
3569 aggiornati nell'archiviazione.  Il tempo di ultimo accesso viene di solito
3570 usato per identificare i file che non vengono più utilizzati per un certo
3571 lasso di tempo. Ad esempio un programma come \texttt{leafnode} lo usa per
3572 cancellare gli articoli letti più vecchi, mentre \texttt{mutt} lo usa per
3573 marcare i messaggi di posta che risultano letti.  
3574
3575 Il sistema non tiene mai conto dell'ultimo accesso all'\textit{inode},
3576 pertanto funzioni come \func{access} o \func{stat} non hanno alcuna influenza
3577 sui tre tempi. Il comando \cmd{ls} (quando usato con le opzioni \cmd{-l} o
3578 \cmd{-t}) mostra i tempi dei file secondo lo schema riportato nell'ultima
3579 colonna di tab.~\ref{tab:file_file_times}. Si noti anche come non esista, a
3580 differenza di altri sistemi operativi, un \textsl{tempo di creazione} di un
3581 file.
3582
3583 L'aggiornamento del tempo di ultimo accesso è stato a lungo considerato un
3584 difetto progettuale di Unix, questo infatti comporta la necessità di
3585 effettuare un accesso in scrittura sul disco anche in tutti i casi in cui
3586 questa informazione non interessa e sarebbe possibile avere un semplice
3587 accesso in lettura sui dati bufferizzati. Questo comporta un ovvio costo sia
3588 in termini di prestazioni, che di consumo di risorse come la batteria per i
3589 portatili, o i cicli di riscrittura per i dischi su memorie riscrivibili.
3590
3591
3592 Per questo motivo abbiamo visto in sez.~\ref{sec:filesystem_mounting} come
3593 nello sviluppo del kernel siano stati introdotti degli opportuni \textit{mount
3594   flag} che consentissero di evitare di aggiornare continuamente una
3595 informazione che nella maggior parte dei casi non interessa. Per questo i
3596 valori che si possono trovare per l'\textit{access time} dipendono dalle
3597 opzioni di montaggio, ed anche, essendo stato cambiato il comportamento di
3598 default a partire dalla versione 2.6.30, dal kernel che si sta usando. 
3599
3600 In generale quello che si ha con i kernel più recenti è che il tempo di ultimo
3601 accesso viene aggiornato solo se è precedente al tempo di ultima modifica o
3602 cambiamento, o se è passato più di un giorno dall'ultimo accesso. Così si può
3603 rendere evidente che vi è stato un accesso dopo una modifica e che il file
3604 viene comunque osservato regolarmente, conservando tutte le informazioni
3605 veramente utili senza dover consumare risorse in scritture continue per
3606 mantenere costantemente aggiornata una informazione che a questo punto non ha
3607 più nessuna rilevanza pratica.\footnote{qualora ce ne fosse la necessità è
3608   comunque possibile, tramite l'opzione di montaggio \texttt{strictatime},
3609   richiedere in ogni caso il comportamento tradizionale.}
3610
3611 \begin{table}[htb]
3612   \centering
3613   \footnotesize
3614   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
3615     \hline
3616     \multicolumn{1}{|p{2.3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
3617     \multicolumn{3}{|p{3.2cm}|}{\centering{
3618         \textbf{File o directory del riferimento}}}&
3619     \multicolumn{3}{|p{3.2cm}|}{\centering{
3620         \textbf{Directory contenente il riferimento}}} 
3621     &\multicolumn{1}{|p{3.cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
3622     \cline{2-7}
3623     \cline{2-7}
3624     \multicolumn{1}{|p{2.3cm}|}{} 
3625     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(a)}}}
3626     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(m)}}}
3627     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(c)}}}
3628     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(a)}}}
3629     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(m)}}}
3630     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(c)}}}
3631     &\multicolumn{1}{|p{3cm}|}{} \\
3632     \hline
3633     \hline
3634     \func{chmod}, \func{fchmod} 
3635              & --      & --      &$\bullet$& --      & --      & --      &\\
3636     \func{chown}, \func{fchown} 
3637              & --      & --      &$\bullet$& --      & --      & --      &\\
3638     \func{creat}  
3639              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&  
3640              con \const{O\_CREATE} \\
3641     \func{creat}  
3642              & --      &$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&   
3643              con \const{O\_TRUNC} \\
3644     \func{exec}  
3645              &$\bullet$& --      & --      & --      & --      & --      &\\
3646     \func{lchown}  
3647              & --      & --      &$\bullet$& --      & --      & --      &\\
3648     \func{link}
3649              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
3650     \func{mkdir}
3651              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3652     \func{mknod}
3653              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3654     \func{mkfifo}
3655              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3656     \func{open}
3657              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$& 
3658              con \const{O\_CREATE} \\
3659     \func{open}
3660              & --      &$\bullet$&$\bullet$& --      & --      & --      & 
3661              con \const{O\_TRUNC}  \\
3662     \func{pipe}
3663              &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
3664     \func{read}
3665              &$\bullet$& --      & --      & --      & --      & --      &\\
3666     \func{remove}
3667              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
3668              se esegue \func{unlink}\\
3669     \func{remove}
3670               & --      & --      & --      & --      &$\bullet$&$\bullet$& 
3671               se esegue \func{rmdir}\\
3672     \func{rename}
3673               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
3674               per ambo gli argomenti\\
3675     \func{rmdir}
3676               & --      & --      & --      & --      &$\bullet$&$\bullet$&\\ 
3677     \func{truncate}
3678               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
3679     \func{ftruncate}
3680               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
3681     \func{unlink}
3682               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\ 
3683     \func{utime}
3684               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\ 
3685     \func{utimes}
3686               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\ 
3687     \func{write}
3688               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
3689     \hline
3690   \end{tabular}
3691   \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo 
3692     accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento di
3693     stato \textsl{(c)} dalle varie funzioni operanti su file e directory.}
3694   \label{tab:file_times_effects}  
3695 \end{table}
3696
3697
3698 L'effetto delle varie funzioni di manipolazione dei file sui relativi tempi è
3699 illustrato in tab.~\ref{tab:file_times_effects}, facendo riferimento al
3700 comportamento classico per quanto riguarda \var{st\_atime}. Si sono riportati
3701 gli effetti sia per il file a cui si fa riferimento, sia per la directory che
3702 lo contiene. Questi ultimi possono essere capiti immediatamente se si tiene
3703 conto di quanto già detto e ripetuto a partire da
3704 sez.~\ref{sec:file_filesystem}, e cioè che anche le directory sono anch'esse
3705 file che contengono una lista di nomi, che il sistema tratta in maniera del
3706 tutto analoga a tutti gli altri.
3707
3708 Per questo motivo tutte le volte che compiremo un'operazione su un file che
3709 comporta una modifica del nome contenuto nella directory, andremo anche a
3710 scrivere sulla directory che lo contiene cambiandone il tempo di ultima
3711 modifica. Un esempio di questo tipo di operazione può essere la cancellazione
3712 di un file, invece leggere o scrivere o cambiare i permessi di un file ha
3713 effetti solo sui tempi di quest'ultimo.
3714
3715 Si ricordi infine come \var{st\_ctime} non è il tempo di creazione del file,
3716 che in Unix non esiste, anche se può corrispondervi per file che non sono mai
3717 stati modificati. Per questo motivo, a differenza di quanto avviene con altri
3718 sistemi operativi, quando si copia un file, a meno di preservare
3719 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
3720 avrà sempre il tempo corrente in cui si è effettuata la copia come data di
3721 ultima modifica.
3722
3723 I tempi di ultimo accesso ed ultima modifica possono essere modificati
3724 esplicitamente usando la funzione di sistema \funcd{utime}, il cui prototipo
3725 è:
3726
3727 \begin{funcproto}{
3728 \fhead{utime.h}
3729 \fdecl{int utime(const char *filename, struct utimbuf *times)}
3730 \fdesc{Modifica i tempi di ultimo accesso ed ultima modifica di un file.} 
3731 }
3732
3733 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3734   caso \var{errno} assumerà uno dei valori: 
3735   \begin{errlist}
3736   \item[\errcode{EACCES}] non c'è il permesso di attraversamento per uno dei
3737     componenti di \param{filename} o \param{times} è \val{NULL} e non si ha il
3738     permesso di scrittura sul file, o non si è proprietari del file o non si
3739     hanno i privilegi di amministratore.
3740   \item[\errcode{EPERM}] \param{times} non è \val{NULL}, e non si è
3741     proprietari del file o non si hanno i privilegi di amministratore.
3742   \end{errlist}
3743   ed inoltre \errval{ENOENT} e \errval{EROFS} nel loro significato generico.}
3744 \end{funcproto}
3745
3746 La funzione cambia i tempi di ultimo accesso e di ultima modifica del file
3747 specificato dall'argomento \param{filename}, e richiede come secondo argomento
3748 il puntatore ad una struttura \struct{utimbuf}, la cui definizione è riportata
3749 in fig.~\ref{fig:struct_utimebuf}, con i nuovi valori di detti tempi
3750 (rispettivamente nei campi \var{actime} e \var{modtime}). Se si passa un
3751 puntatore nullo verrà impostato il tempo corrente.
3752
3753 \begin{figure}[!htb]
3754   \footnotesize \centering
3755   \begin{minipage}[c]{0.8\textwidth}
3756     \includestruct{listati/utimbuf.h}
3757   \end{minipage} 
3758   \normalsize 
3759   \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
3760     i tempi dei file.}
3761   \label{fig:struct_utimebuf}
3762 \end{figure}
3763
3764 L'effetto della funzione ed i privilegi necessari per eseguirla dipendono dal
3765 valore dell'argomento \param{times}. Se è \val{NULL} la funzione imposta il
3766 tempo corrente ed è sufficiente avere accesso in scrittura al file o essere
3767 proprietari del file o avere i privilegi di amministratore. Se invece si è
3768 specificato un valore diverso la funzione avrà successo solo se si è
3769 proprietari del file o se si hanno i privilegi di amministratore.\footnote{per
3770   essere precisi la capacità \const{CAP\_FOWNER}, vedi
3771   sez.~\ref{sec:proc_capabilities}.} In entrambi i casi per verificare la
3772 proprietà del file viene utilizzato l'\ids{UID} effettivo del processo.
3773
3774 Si tenga presente che non è possibile modificare manualmente il tempo di
3775 cambiamento di stato del file, che viene aggiornato direttamente dal kernel
3776 tutte le volte che si modifica l'\textit{inode}, e quindi anche alla chiamata
3777 di \func{utime}.  Questo serve anche come misura di sicurezza per evitare che
3778 si possa modificare un file nascondendo completamente le proprie tracce. In
3779 realtà la cosa resta possibile se si è in grado di accedere al file di
3780 dispositivo, scrivendo direttamente sul disco senza passare attraverso il
3781 filesystem, ma ovviamente in questo modo la cosa è più complicata da
3782 realizzare.\footnote{esistono comunque molti programmi che consentono di farlo
3783   con relativa semplicità per cui non si dia per scontato che il valore sia
3784   credibile in caso di macchina compromessa.}
3785
3786 A partire dal kernel 2.6 la risoluzione dei tempi dei file, che nei campi di
3787 tab.~\ref{tab:file_file_times} è espressa in secondi, è stata portata ai
3788 nanosecondi per la gran parte dei filesystem. La ulteriore informazione può
3789 essere acceduta attraverso altri campi appositamente aggiunti alla struttura
3790 \struct{stat}. Se si sono definite le macro \macro{\_BSD\_SOURCE} o
3791 \macro{\_SVID\_SOURCE} questi sono \var{st\_atim.tv\_nsec},
3792 \var{st\_mtim.tv\_nsec} e \var{st\_ctim.tv\_nsec} se queste non sono definite,
3793 \var{st\_atimensec}, \var{st\_mtimensec} e \var{st\_mtimensec}. Qualora il
3794 supporto per questa maggior precisione sia assente questi campi aggiuntivi
3795 saranno nulli.
3796
3797 Per la gestione di questi nuovi valori è stata definita una seconda funzione
3798 di sistema, \funcd{utimes}, che consente di specificare tempi con maggior
3799 precisione; il suo prototipo è:
3800
3801 \begin{funcproto}{
3802 \fhead{sys/time.h}
3803 \fdecl{int utimes(const char *filename, struct timeval times[2])}
3804 \fdesc{Modifica i tempi di ultimo accesso e ultima modifica di un file.} 
3805 }
3806 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3807   caso \var{errno} assumerà gli stessi valori di \func{utime}.}  
3808 \end{funcproto}
3809  
3810 La funzione è del tutto analoga alla precedente \func{utime} ma usa come
3811 secondo argomento un vettore di due strutture \struct{timeval}, la cui
3812 definizione è riportata in fig.~\ref{fig:sys_timeval_struct}, che consentono
3813 di indicare i tempi con una precisione del microsecondo. Il primo elemento
3814 di \param{times} indica il valore per il tempo di ultimo accesso, il secondo
3815 quello per il tempo di ultima modifica. Se si indica come secondo argomento un
3816 puntatore nullo di nuovo verrà utilizzato il tempo corrente.
3817
3818 \begin{figure}[!htb]
3819   \footnotesize \centering
3820   \begin{minipage}[c]{0.8\textwidth}
3821     \includestruct{listati/timeval.h}
3822   \end{minipage} 
3823   \normalsize 
3824   \caption{La struttura \structd{timeval} usata per indicare valori di tempo
3825     con la precisione del microsecondo.}
3826   \label{fig:sys_timeval_struct}
3827 \end{figure}
3828
3829 Oltre ad \func{utimes} su Linux sono presenti altre due funzioni,\footnote{le
3830   due funzioni non sono definite in nessuno standard, ma sono presenti, oltre
3831   che su Linux, anche su BSD.} \funcd{futimes} e \funcd{lutimes}, che
3832 consentono rispettivamente di effettuare la modifica utilizzando un file già
3833 aperto o di eseguirla direttamente su un collegamento simbolico. I relativi
3834 prototipi sono:
3835
3836 \begin{funcproto}{
3837 \fhead{sys/time.h}
3838 \fdecl{int futimes(int fd, const struct timeval tv[2])}
3839 \fdesc{Cambia i tempi di un file già aperto.} 
3840 \fdecl{int lutimes(const char *filename, const struct timeval tv[2])}
3841 \fdesc{Cambia i tempi di un collegamento simbolico.} 
3842 }
3843
3844 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3845   caso \var{errno} assumerà uno gli stessi valori di \func{utimes}, con in più
3846   per \func{futimes}:
3847   \begin{errlist}
3848   \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3849   \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3850   \end{errlist}}  
3851 \end{funcproto}
3852
3853 Le due funzioni hanno lo stesso comportamento di \texttt{utimes} e richiedono
3854 gli stessi privilegi per poter operare, la differenza è che con \func{futimes}
3855 si può indicare il file su cui operare se questo è già aperto facendo
3856 riferimento al suo file descriptor, mentre con \func{lutimes} nel caso in
3857 cui \param{filename} sia un collegamento simbolico saranno modificati i suoi
3858 tempi invece di quelli del file a cui esso punta.
3859
3860 Nonostante il kernel nelle versioni più recenti supporti, come accennato,
3861 risoluzioni dei tempi dei file fino al nanosecondo, le funzioni fin qui
3862 esaminate non consentono di impostare valori con questa precisione. Per questo
3863 sono state introdotte due nuove funzioni di sistema, \funcd{futimens} e
3864 \funcd{utimensat}, in grado di eseguire questo compito; i rispettivi prototipi
3865 sono:
3866
3867 \begin{funcproto}{
3868 \fhead{sys/time.h}
3869 \fdecl{futimens(int fd, const struct timespec times[2])}
3870 \fdesc{Cambia i tempi di un file già aperto.} 
3871 \fdecl{int utimensat(int dirfd, const char *pathname, const struct
3872     timespec times[2], int flags)}
3873 \fdesc{Cambia i tempi di un file.} 
3874 }
3875
3876 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3877   caso \var{errno} assumerà uno dei valori: 
3878   \begin{errlist}
3879   \item[\errcode{EACCES}] si è richiesta l'impostazione del tempo corrente ma
3880     non si ha il permesso di scrittura sul file, o non si è proprietari del
3881     file o non si hanno i privilegi di amministratore; oppure il file è
3882     immutabile (vedi sez.~\ref{sec:file_perm_overview}).
3883   \item[\errcode{EBADF}] \param{fd} non è un file descriptor valido (solo
3884     \func{futimens}), oppure \param{dirfd} non è \const{AT\_FDCWD} o un file
3885     descriptor valido (solo \func{utimensat}).
3886   \item[\errcode{EFAULT}] \param{times} non è un puntatore valido (per
3887     entrambe), oppure \param{dirfd} è \const{AT\_FDCWD} ma \param{pathname} è
3888     \var{NULL} o non è un puntatore valido (solo \func{utimensat}).
3889   \item[\errcode{EINVAL}] si sono usati dei valori non corretti per i tempi
3890     di \param{times} (per entrambe), oppure è si usato un valore non valido
3891     per \param{flags}, oppure \param{pathname} è \var{NULL}, \param{dirfd} non
3892     è \const{AT\_FDCWD} e \param{flags} contiene \const{AT\_SYMLINK\_NOFOLLOW}
3893     (solo \func{utimensat}).
3894   \item[\errcode{EPERM}] si è richiesto un cambiamento nei tempi non al tempo
3895     corrente, ma non si è proprietari del file o non si hanno i privilegi di
3896     amministratore; oppure il file è immutabile o \textit{append-only} (vedi
3897     sez.~\ref{sec:file_perm_overview}).
3898   \item[\errcode{ESRCH}] non c'è il permesso di attraversamento per una delle
3899     componenti di \param{pathname} (solo \func{utimensat})
3900   \end{errlist}
3901   ed inoltre per entrambe \errval{EROFS} e per \func{utimensat}
3902   \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR} nel
3903   loro significato generico.}
3904 \end{funcproto}
3905
3906 Entrambe le funzioni utilizzano per indicare i valori dei tempi un
3907 vettore \param{times} di due strutture \struct{timespec}, la cui definizione è
3908 riportata in fig.~\ref{fig:sys_timespec_struct}, che permette di specificare
3909 un valore dei tempi con una precisione fino al nanosecondo.
3910
3911 \begin{figure}[!htb]
3912   \footnotesize \centering
3913   \begin{minipage}[c]{0.8\textwidth}
3914     \includestruct{listati/timespec.h}
3915   \end{minipage} 
3916   \normalsize 
3917   \caption{La struttura \structd{timespec} usata per indicare valori di tempo
3918     con la precisione del nanosecondo.}
3919   \label{fig:sys_timespec_struct}
3920 \end{figure}
3921
3922 Come per le precedenti funzioni il primo elemento di \param{times} indica il
3923 tempo di ultimo accesso ed il secondo quello di ultima modifica, e se si usa
3924 il valore \val{NULL} verrà impostato il tempo corrente sia per l'ultimo
3925 accesso che per l'ultima modifica. Nei singoli elementi di \param{times} si
3926 possono inoltre utilizzare due valori speciali per il campo \var{tv\_nsec}:
3927 con \constd{UTIME\_NOW} si richiede l'uso del tempo corrente, mentre con
3928 \constd{UTIME\_OMIT} si richiede di non impostare il tempo. Si può così
3929 aggiornare in maniera specifica soltanto uno fra il tempo di ultimo accesso e
3930 quello di ultima modifica. Quando si usa uno di questi valori speciali per
3931 \var{tv\_nsec} il corrispondente valore di \var{tv\_sec} viene ignorato.
3932
3933 Queste due funzioni sono una estensione definita nella revisione POSIX.1-2008
3934 dello standard POSIX, in Linux sono state introdotte a partire dal kernel
3935 2.6.22,\footnote{si tenga presente però che per kernel precedenti il 2.6.26 le
3936   due funzioni sono difettose nel rispetto di alcuni requisiti minori dello
3937   standard e nel controllo della correttezza dei tempi, per i dettagli dei
3938   quali si rimanda alla pagina di manuale.} e supportate dalla \acr{glibc} a
3939 partire dalla versione 2.6.\footnote{in precedenza, a partire dal kernel
3940   2.6.16, era stata introdotta una \textit{system call} \funcm{futimesat}
3941   seguendo una bozza della revisione dello standard poi modificata; questa
3942   funzione, sostituita da \func{utimensat}, è stata dichiarata obsoleta, non è
3943   supportata da nessuno standard e non deve essere più utilizzata: pertanto
3944   non ne parleremo.} La prima è sostanzialmente una estensione di
3945 \func{futimes} che consente di specificare i tempi con precisione maggiore, la
3946 seconda supporta invece, rispetto ad \func{utimes}, una sintassi più complessa
3947 che consente una indicazione sicura del file su cui operare specificando la
3948 directory su cui si trova tramite il file descriptor \param{dirfd} ed il suo
3949 nome come \textit{pathname relativo} in \param{pathname}.\footnote{su Linux
3950   solo \func{utimensat} è una \textit{system call} e \func{futimens} è una
3951   funzione di libreria, infatti se \param{pathname} è \var{NULL} \param{dirfd}
3952   viene considerato un file descriptor ordinario e il cambiamento del tempo
3953   applicato al file sottostante, qualunque esso sia, per cui
3954   \code{futimens(fd, times}) è del tutto equivalente a \code{utimensat(fd,
3955     NULL, times, 0)}.}
3956
3957 Torneremo su questa sintassi e sulla sua motivazione in
3958 sez.~\ref{sec:file_openat}, quando tratteremo tutte le altre funzioni (le
3959 cosiddette \textit{at-functions}) che la utilizzano; essa prevede comunque
3960 anche la presenza dell'argomento \param{flags} con cui attivare flag di
3961 controllo che modificano il comportamento della funzione, nel caso specifico
3962 l'unico valore consentito è \const{AT\_SYMLINK\_NOFOLLOW} che indica alla
3963 funzione di non dereferenziare i collegamenti simbolici, cosa che le permette
3964 di riprodurre le funzionalità di \func{lutimes}.
3965
3966
3967
3968
3969 \section{Il controllo di accesso ai file}
3970 \label{sec:file_access_control}
3971
3972 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
3973 del controllo di accesso ai file, che viene implementato per qualunque
3974 filesystem standard.\footnote{per standard si intende che implementa le
3975   caratteristiche previste dallo standard POSIX; in Linux sono utilizzabili
3976   anche filesystem di altri sistemi operativi, che non supportano queste
3977   caratteristiche.} In questa sezione ne esamineremo i concetti essenziali e
3978 le funzioni usate per gestirne i vari aspetti.
3979
3980
3981 \subsection{I permessi per l'accesso ai file}
3982 \label{sec:file_perm_overview}
3983
3984 Ad ogni file Linux associa sempre, oltre ad un insieme di permessi, l'utente
3985 che ne è proprietario (il cosiddetto \textit{owner}) ed un gruppo di
3986 appartenenza, indicati dagli identificatori di utente e gruppo (\ids{UID} e
3987 \ids{GID}) di cui abbiamo già parlato in
3988 sez.~\ref{sec:proc_access_id}.\footnote{questo è vero solo per filesystem di
3989   tipo Unix, ad esempio non è vero per il filesystem VFAT di Windows, che non
3990   fornisce nessun supporto per l'accesso multiutente, e per il quale queste
3991   proprietà vengono assegnate in maniera fissa con opportune opzioni di
3992   montaggio.}  Anche questi sono mantenuti sull'\textit{inode} insieme alle
3993 altre proprietà e sono accessibili da programma tramite la funzione
3994 \func{stat} (trattata in sez.~\ref{sec:file_stat}), che restituisce l'utente
3995 proprietario nel campo \var{st\_uid} ed il gruppo proprietario nel campo
3996 \var{st\_gid} della omonima struttura \struct{stat}.
3997
3998 Il controllo di accesso ai file segue un modello abbastanza semplice che
3999 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
4000 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
4001     Control List} che sono state aggiunte ai filesystem standard con opportune
4002   estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
4003   controllo ancora più sofisticati come il \textit{Mandatory Access Control}
4004   di \textit{SELinux} e delle altre estensioni come \textit{Smack} o
4005   \textit{AppArmor}.} ma nella maggior parte dei casi il meccanismo standard è
4006 più che sufficiente a soddisfare tutte le necessità più comuni.  I tre
4007 permessi di base associati ad ogni file sono:
4008 \begin{itemize*}
4009 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
4010   \textit{read}).
4011 \item il permesso di scrittura (indicato con la lettera \texttt{w},
4012   dall'inglese \textit{write}).
4013 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
4014   dall'inglese \textit{execute}).
4015 \end{itemize*}
4016 mentre i tre livelli su cui sono divisi i privilegi sono:
4017 \begin{itemize*}
4018 \item i privilegi per l'utente proprietario del file.
4019 \item i privilegi per un qualunque utente faccia parte del gruppo cui
4020   appartiene il file.
4021 \item i privilegi per tutti gli altri utenti.
4022 \end{itemize*}
4023
4024 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
4025 meno significativi sono usati a gruppi di tre per indicare i permessi base di
4026 lettura, scrittura ed esecuzione e sono applicati rispettivamente
4027 rispettivamente al proprietario, al gruppo, a tutti gli altri.
4028
4029 \begin{figure}[htb]
4030   \centering
4031   \includegraphics[width=6cm]{img/fileperm}
4032   \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
4033     contenuti nel campo \var{st\_mode} di \struct{stat}.}
4034   \label{fig:file_perm_bit}
4035 \end{figure}
4036
4037 I restanti tre bit (noti come \textit{suid bit}, \textit{sgid bit}, e
4038 \textit{sticky bit}) sono usati per indicare alcune caratteristiche più
4039 complesse del meccanismo del controllo di accesso su cui torneremo in seguito
4040 (in sez.~\ref{sec:file_special_perm}), lo schema di allocazione dei bit è
4041 riportato in fig.~\ref{fig:file_perm_bit}.  Come tutte le altre proprietà di
4042 un file anche i permessi sono memorizzati nell'\textit{inode}, e come
4043 accennato in sez.~\ref{sec:file_types} essi sono vengono restituiti in una
4044 parte del campo \var{st\_mode} della struttura \struct{stat} (si veda di nuovo
4045 fig.~\ref{fig:file_stat_struct}).
4046
4047 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
4048 \texttt{u} (per \textit{user}), \texttt{g} (per \textit{group}) e \texttt{o}
4049 (per \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti
4050 insieme si usa la lettera \texttt{a} (per \textit{all}). Si tenga ben presente
4051 questa distinzione dato che in certi casi, mutuando la terminologia in uso a
4052 suo tempo nel VMS, si parla dei permessi base come di permessi per
4053 \textit{owner}, \textit{group} ed \textit{all}, le cui iniziali possono dar
4054 luogo a confusione.  Le costanti che permettono di accedere al valore numerico
4055 di questi bit nel campo \var{st\_mode}, già viste in
4056 tab.~\ref{tab:file_mode_flags}, sono riportate per chiarezza una seconda volta
4057 in tab.~\ref{tab:file_bit_perm}.
4058
4059 \begin{table}[htb]
4060   \centering
4061     \footnotesize
4062   \begin{tabular}[c]{|c|l|}
4063     \hline
4064     \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
4065     \hline 
4066     \hline 
4067     \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
4068     \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
4069     \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\ 
4070     \hline            
4071     \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
4072     \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
4073     \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
4074     \hline            
4075     \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
4076     \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
4077     \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
4078     \hline              
4079   \end{tabular}
4080   \caption{I bit dei permessi di accesso ai file, come definiti in 
4081     \texttt{<sys/stat.h>}}
4082   \label{tab:file_bit_perm}
4083 \end{table}
4084
4085 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
4086 che si riferiscano a dei file, dei collegamenti simbolici o delle directory;
4087 qui ci limiteremo ad un riassunto delle regole generali, entrando nei dettagli
4088 più avanti.
4089
4090 La prima regola è che per poter accedere ad un file attraverso il suo
4091 \textit{pathname} occorre il permesso di esecuzione in ciascuna delle
4092 directory che compongono il \textit{pathname}; lo stesso vale per aprire un
4093 file nella directory corrente (per la quale appunto serve il diritto di
4094 esecuzione). Per una directory infatti il permesso di esecuzione significa che
4095 essa può essere attraversata nella risoluzione del \textit{pathname}, e per
4096 questo viene anche chiamato permesso di attraversamento. Esso è sempre
4097 distinto dal permesso di lettura che invece implica che si può leggere il
4098 contenuto della directory.
4099
4100 Questo significa che se si ha il permesso di esecuzione senza permesso di
4101 lettura si potrà lo stesso aprire un file all'interno di una directory (se si
4102 hanno i permessi adeguati per il medesimo) ma non si potrà vederlo con
4103 \cmd{ls} mancando il permesso di leggere il contenuto della directory. Per
4104 crearlo o rinominarlo o cancellarlo invece occorrerà avere anche il permesso
4105 di scrittura per la directory.
4106
4107 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
4108 (si veda quanto riportato in sez.~\ref{sec:file_open_close}) di sola lettura o
4109 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
4110 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
4111 il contenuto, lo stesso permesso è necessario per poter troncare il file o per
4112 aggiornare il suo tempo di ultima modifica al tempo corrente, ma non per
4113 modificare arbitrariamente quest'ultimo, operazione per la quale, come per
4114 buona parte delle modifiche effettuate sui metadati del file, occorre esserne
4115 i proprietari.
4116
4117 Non si può creare un file fintanto che non si disponga del permesso di
4118 esecuzione e di quello di scrittura per la directory di destinazione. Gli
4119 stessi permessi occorrono per cancellare un file da una directory (si ricordi
4120 che questo non implica necessariamente la rimozione del contenuto del file dal
4121 disco). Per la cancellazione non è necessario nessun tipo di permesso per il
4122 file stesso dato che, come illustrato in sez.~\ref{sec:link_symlink_rename}
4123 esso non viene toccato, nella cancellazione infatti viene solo modificato il
4124 contenuto della directory, rimuovendo la voce che ad esso fa riferimento. Lo
4125 stesso vale per poter rinominare o spostare il file in altra directory, in
4126 entrambi i casi occorrerà il permesso di scrittura sulle directory che si
4127 vanno a modificare.
4128
4129 Per poter eseguire un file, che sia un programma compilato od uno script di
4130 shell, od un altro tipo di file eseguibile riconosciuto dal kernel, occorre
4131 oltre al permesso di lettura per accedere al contenuto avere anche il permesso
4132 di esecuzione. Inoltre solo i file regolari possono essere eseguiti. Per i
4133 file di dispositivo i permessi validi sono solo quelli di lettura e scrittura,
4134 che corrispondono al poter eseguire dette operazioni sulla periferica
4135 sottostante. 
4136
4137 I permessi per un collegamento simbolico sono ignorati, contano quelli del
4138 file a cui fa riferimento; per questo in genere il comando \cmd{ls} riporta
4139 per un collegamento simbolico tutti i permessi come concessi. Utente e gruppo
4140 a cui esso appartiene vengono pure ignorati quando il collegamento viene
4141 risolto, vengono controllati solo quando viene richiesta la rimozione del
4142 collegamento e quest'ultimo è in una directory con lo \textit{sticky bit}
4143 impostato (si veda sez.~\ref{sec:file_special_perm}).
4144
4145 La procedura con cui il kernel stabilisce se un processo possiede un certo
4146 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
4147 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
4148 \var{st\_gid} accennati in precedenza) e l'\ids{UID} effettivo, il \ids{GID}
4149 effettivo e gli eventuali \ids{GID} supplementari del processo.\footnote{in
4150   realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
4151   identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
4152   sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
4153   eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
4154   differenza.}
4155
4156 Per una spiegazione dettagliata degli identificatori associati ai processi si
4157 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
4158 sez.~\ref{sec:file_special_perm}, l'\ids{UID} effettivo e il \ids{GID} effettivo
4159 corrispondono ai valori dell'\ids{UID} e del \ids{GID} dell'utente che ha
4160 lanciato il processo, mentre i \ids{GID} supplementari sono quelli dei gruppi
4161 cui l'utente appartiene.
4162
4163 I passi attraverso i quali viene stabilito se il processo possiede il diritto
4164 di accesso sono i seguenti:
4165 \begin{enumerate*}
4166 \item Se l'\ids{UID} effettivo del processo è zero (corrispondente
4167   all'amministratore) l'accesso è sempre garantito senza nessun controllo. Per
4168   questo motivo l'amministratore ha piena libertà di accesso a tutti i file.
4169 \item Se l'\ids{UID} effettivo del processo è uguale all'\ids{UID} del
4170   proprietario del file (nel qual caso si dice che il processo è proprietario
4171   del file) allora:
4172   \begin{itemize*}
4173   \item se il relativo\footnote{per relativo si intende il bit di
4174       \textit{user-read} se il processo vuole accedere in lettura, quello di
4175       \textit{user-write} per l'accesso in scrittura, ecc.} bit dei permessi
4176     d'accesso dell'utente è impostato, l'accesso è consentito;
4177   \item altrimenti l'accesso è negato.
4178   \end{itemize*}
4179 \item Se il \ids{GID} effettivo del processo o uno dei \ids{GID} supplementari
4180   del processo corrispondono al \ids{GID} del file allora:
4181   \begin{itemize*}
4182   \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
4183     consentito;
4184   \item altrimenti l'accesso è negato.
4185   \end{itemize*}
4186 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
4187   l'accesso è consentito, altrimenti l'accesso è negato.
4188 \end{enumerate*}
4189
4190 Si tenga presente che questi passi vengono eseguiti esattamente in
4191 quest'ordine. Questo vuol dire che se un processo è il proprietario di un
4192 file, l'accesso è consentito o negato solo sulla base dei permessi per
4193 l'utente; i permessi per il gruppo non vengono neanche controllati. Lo stesso
4194 vale se il processo appartiene ad un gruppo appropriato, in questo caso i
4195 permessi per tutti gli altri non vengono controllati. 
4196
4197 Questo significa che se si è proprietari di un file ma non si ha il permesso
4198 di scrittura, non vi si potrà scrivere anche se questo fosse scrivibile per
4199 tutti gli altri. Permessi di questo tipo sono ovviamente poco ortodossi, e
4200 comunque, come vedremo in sez.~\ref{sec:file_perm_management}, il proprietario
4201 di un file può sempre modificarne i permessi, e riassegnarsi un eventuale
4202 permesso di scrittura mancante.
4203
4204 \itindbeg{file~attributes} 
4205
4206 A questi che sono i permessi ordinari si aggiungono, per i filesystem che
4207 supportano questa estensione, due permessi speciali mantenuti nei cosiddetti
4208 \textit{file attributes}, che si possono leggere ed impostare con i comandi
4209 \cmd{lsattr} e \cmd{chattr}.\footnote{per l'utilizzo di questi comandi e per
4210   le spiegazioni riguardo tutti gli altri \textit{file attributes} si rimanda
4211   alla sezione 1.4.4 di \cite{AGL}.}
4212
4213 Il primo è il cosiddetto attributo di immutabilità (\textit{immutable},