d9c98d85fd4da0a24ba3f66216d61d4d3aa065b8
[gapil.git] / filedir.tex
1 %% filedir.tex
2 %%
3 %% Copyright (C) 2000-2011 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{La gestione di file e directory}
13 \label{cha:files_and_dirs}
14
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando da un approfondimento dell'architettura del
17 sistema illustrata a grandi linee in sez.~\ref{sec:file_arch_overview} ed
18 illustrando le principali caratteristiche di un filesystem e le interfacce
19 che consentono di controllarne il montaggio e lo smontaggio. 
20
21 Esamineremo poi le funzioni di libreria che si usano per copiare, spostare e
22 cambiare i nomi di file e directory e l'interfaccia che permette la
23 manipolazione dei loro attributi. Tratteremo inoltre la struttura di base del
24 sistema delle protezioni e del controllo dell'accesso ai file e le successive
25 estensioni (\textit{Extended Attributes}, ACL, quote disco,
26 \textit{capabilities}). Tutto quello che riguarda invece la gestione dell'I/O
27 sui file è lasciato al capitolo successivo.
28
29
30
31 \section{L'architettura della gestione dei file}
32 \label{sec:file_arch_func}
33
34 In questa sezione tratteremo con maggiori dettagli rispetto a quanto visto in
35 sez.~\ref{sec:file_arch_overview} il \textit{Virtual File System} di Linux e
36 come il kernel può gestire diversi tipi di filesystem, descrivendo prima le
37 caratteristiche generali di un filesystem di un sistema unix-like, per poi
38 fare una panoramica sul filesystem più usato con Linux, l'\acr{ext2} ed i suoi
39 successori.
40
41
42 \subsection{Il funzionamento del \textit{Virtual File System} di Linux}
43 \label{sec:file_vfs_work}
44
45 % NOTE articolo interessante:
46 % http://www.ibm.com/developerworks/linux/library/l-virtual-filesystem-switch/index.html?ca=dgr-lnxw97Linux-VFSdth-LXdW&S_TACT=105AGX59&S_CMP=GRlnxw97
47
48 \itindbeg{Virtual~File~System}
49
50 Come illustrato brevemente in sez.~\ref{sec:file_arch_overview} in Linux il
51 concetto di \textit{everything is a file} è stato implementato attraverso il
52 \textit{Virtual File System}, la cui struttura generale è illustrata in
53 fig.~\ref{fig:file_VFS_scheme}.  Il VFS definisce un insieme di funzioni che
54 tutti i filesystem devono implementare per l'accesso ai file che contengono e
55 l'interfaccia che consente di eseguire l'I/O sui file, che questi siano di
56 dati o dispositivi. 
57
58 \itindbeg{inode}
59
60 L'interfaccia fornita dal VFS comprende in sostanza tutte le funzioni che
61 riguardano i file, le operazioni implementate dal VFS sono realizzate con una
62 astrazione che prevede quattro tipi di oggetti strettamente correlati: i
63 filesystem, le \textit{dentry}, gli \textit{inode} ed i file. A questi oggetti
64 corrispondono una serie di apposite strutture definite dal kernel che
65 contengono come campi le funzioni di gestione e realizzano l'infrastruttura
66 del VFS. L'interfaccia è molto complessa, ne faremo pertanto una trattazione
67 estremamente semplificata che consenta di comprenderne i principi
68 di funzionamento.
69
70 Il VFS usa una tabella mantenuta dal kernel che contiene il nome di ciascun
71 filesystem supportato, quando si vuole inserire il supporto di un nuovo
72 filesystem tutto quello che occorre è chiamare la funzione
73 \code{register\_filesystem} passando come argomento la struttura
74 \kstruct{file\_system\_type} (la cui definizione è riportata in
75 fig.~\ref{fig:kstruct_file_system_type}) relativa a quel filesystem. Questa
76 verrà inserita nella tabella, ed il nuovo filesystem comparirà in
77 \procfile{/proc/filesystems}.
78
79 \begin{figure}[!htb]
80   \footnotesize \centering
81   \begin{minipage}[c]{\textwidth}
82     \includestruct{listati/file_system_type.h}
83   \end{minipage}
84   \normalsize 
85   \caption{Estratto della struttura \kstructd{file\_system\_type} usata dal
86     VFS (da \texttt{include/linux/fs.h}).}
87   \label{fig:kstruct_file_system_type}
88 \end{figure}
89
90 La struttura \kstruct{file\_system\_type}, oltre ad una serie di dati interni,
91 come il nome del tipo di filesystem nel campo \var{name},\footnote{quello che
92   viene riportato in \procfile{/proc/filesystems} e che viene usato come
93   valore del parametro dell'opzione \texttt{-t} del comando \texttt{mount} che
94   indica il tipo di filesystem.}  contiene i riferimenti alle funzioni di base
95 che consentono l'utilizzo di quel filesystem. In particolare la funzione
96 \code{mount} del quarto campo è quella che verrà invocata tutte le volte che
97 si dovrà effettuare il montaggio di un filesystem di quel tipo. Per ogni nuovo
98 filesystem si dovrà allocare una di queste strutture ed inizializzare i
99 relativi campi con i dati specifici di quel filesystem, ed in particolare si
100 dovrà creare anche la relativa versione della funzione \code{mount}.
101
102 \itindbeg{pathname}
103
104 Come illustrato in fig.~\ref{fig:kstruct_file_system_type} questa funzione
105 restituisce una \textit{dentry}, abbreviazione che sta per \textit{directory
106   entry}. Le \textit{dentry} sono gli oggetti che il kernel usa per eseguire
107 la \textit{pathname resolution}, ciascuna di esse corrisponde ad un
108 \textit{pathname} e contiene il riferimento ad un \textit{inode}, che come
109 vedremo a breve è l'oggetto usato dal kernel per identificare un un
110 file.\footnote{in questo caso si parla di file come di un qualunque oggetto
111   generico che sta sul filesystem e non dell'oggetto file del VFS cui
112   accennavamo prima.} La \textit{dentry} ottenuta dalla chiamata alla funzione
113 \code{mount} sarà inserita in corrispondenza al \textit{pathname} della
114 directory in cui il filesystem è stato montato.
115
116 % NOTA: struct dentry è dichiarata in include/linux/dcache.h
117
118 Le \textit{dentry} sono oggetti del VFS che vivono esclusivamente in memoria,
119 nella cosiddetta \textit{directory entry cache} (spesso chiamata in breve
120 \textit{dcache}). Ogni volta che una \textit{system call} specifica un
121 \textit{pathname} viene effettuata una ricerca nella \textit{dcache} per
122 ottenere immediatamente la \textit{dentry} corrispondente,\footnote{il buon
123   funzionamento della \textit{dcache} è in effetti di una delle parti più
124   critiche per le prestazioni del sistema.} che a sua volta ci darà, tramite
125 l'\textit{inode}, il riferimento al file.
126
127 Dato che normalmente non è possibile mantenere nella \textit{dcache} le
128 informazioni relative a tutto l'albero dei file la procedura della
129 \textit{pathname resolution} richiede un meccanismo con cui riempire gli
130 eventuali vuoti. Il meccanismo prevede che tutte le volte che si arriva ad una
131 \textit{dentry} mancante venga invocata la funzione \texttt{lookup}
132 dell'\textit{inode} associato alla \textit{dentry} precedente nella
133 risoluzione del \textit{pathname},\footnote{che a questo punto è una
134   directory, per cui si può cercare al suo interno il nome di un file.} il cui
135 scopo è risolvere il nome mancante e fornire la sua \textit{dentry} che a
136 questo punto verrà inserita nella cache.
137
138 Dato che tutte le volte che si monta un filesystem la funzione \texttt{mount}
139 della corrispondente \kstruct{file\_system\_type} inserisce la \textit{dentry}
140 iniziale nel \itindex{mount~point} \textit{mount point} dello stesso si avrà
141 comunque un punto di partenza. Inoltre essendo questa \textit{dentry} relativa
142 a quel tipo di filesystem essa farà riferimento ad un \textit{inode} di quel
143 filesystem, e come vedremo questo farà sì che venga eseguita una
144 \texttt{lookup} adatta per effettuare la risoluzione dei nomi per quel
145 filesystem.
146
147 \itindend{pathname}
148
149 % Un secondo effetto della chiamata funzione \texttt{mount} di
150 % \kstruct{file\_system\_type} è quello di allocare una struttura
151 % \kstruct{super\_block} per ciascuna istanza montata, che contiene le
152 % informazioni generali di un qualunque filesystem montato, come le opzioni di
153 % montaggio, le dimensioni dei blocchi, quando il filesystem è stato montato
154 % ecc. Fra queste però viene pure inserta, nel campo \var{s\_op}, una ulteriore
155 % struttura \kstruct{super\_operations}, il cui contenuto sono i puntatori
156 % alle funzioni di gestione di un filesystem, anche inizializzata in modo da
157 % utilizzare le versioni specifiche di quel filesystem.
158
159 L'oggetto più importante per il funzionamento del VFS è probabilmente
160 l'\textit{inode}, ma con questo nome si può fare riferimento a due cose
161 diverse.  La prima è la struttura su disco (su cui torneremo anche in
162 sez.~\ref{sec:file_filesystem}) che fa parte della organizzazione dei dati
163 realizzata dal filesystem e che contiene le informazioni relative alle
164 proprietà (i cosiddetti \textsl{metadati}) di ogni oggetto presente su di esso
165 (si intende al solito uno qualunque dei tipi di file di
166 tab.~\ref{tab:file_file_types}).
167
168 La seconda è la corrispondente struttura \kstruct{inode}, della cui
169 definizione si è riportato un estratto in
170 fig.~\ref{fig:kstruct_inode}.\footnote{l'estratto fa riferimento alla versione
171   del kernel 2.6.37.} Questa struttura viene mantenuta in memoria ed è a
172 questa che facevamo riferimento quando parlavamo dell'\textit{inode} associato
173 a ciascuna \textit{dentry}. Nella struttura in memoria sono presenti gli
174 stessi \textsl{metadati} memorizzati su disco, che vengono letti quando questa
175 struttura viene allocata e trascritti all'indietro se modificati.
176
177 \begin{figure}[!htb]
178   \footnotesize \centering
179   \begin{minipage}[c]{\textwidth}
180     \includestruct{listati/inode.h}
181   \end{minipage}
182   \normalsize 
183   \caption{Estratto della struttura \kstructd{inode} del kernel (da
184     \texttt{include/linux/fs.h}).}
185   \label{fig:kstruct_inode}
186 \end{figure}
187
188 Il fatto che la struttura \kstruct{inode} sia mantenuta in memoria,
189 direttamente associata ad una \textit{dentry}, rende sostanzialmente immediate
190 le operazioni che devono semplicemente effettuare un accesso ai dati in essa
191 contenuti: è così ad esempio che viene realizzata la \textit{system call}
192 \func{stat} che vedremo in sez.~\ref{sec:file_stat}. Rispetto ai dati salvati
193 sul disco questa struttura contiene però anche quanto necessario alla
194 implementazione del VFS, ed in particolare è importante il campo \var{i\_op}
195 che, come illustrato in fig.~\ref{fig:kstruct_inode}, contiene il puntatore ad
196 una struttura di tipo \kstruct{inode\_operation}, la cui definizione si può
197 trovare nel file \texttt{include/kernel/fs.h} dei sorgenti del kernel.
198
199 Questa struttura non è altro che una tabella di funzioni, ogni suo membro cioè
200 è un puntatore ad una funzione e, come suggerisce il nome della struttura
201 stessa, queste funzioni sono quelle che definiscono le operazioni che il VFS
202 può compiere su un \textit{inode}. Si sono riportate in
203 tab.~\ref{tab:file_inode_operations} le più rilevanti.
204
205 \begin{table}[htb]
206   \centering
207   \footnotesize
208   \begin{tabular}[c]{|l|l|}
209     \hline
210     \textbf{Funzione} & \textbf{Operazione} \\
211     \hline
212     \hline
213     \textsl{\code{create}} & Chiamata per creare un nuovo file (vedi
214                              sez.~\ref{sec:file_open}).\\ 
215     \textsl{\code{link}}   & Crea un \textit{hard link} (vedi
216                              sez.~\ref{sec:file_link}).\\
217     \textsl{\code{unlink}} & Cancella un \textit{hard link} (vedi
218                              sez.~\ref{sec:file_link}).\\
219     \textsl{\code{symlink}}& Crea un link simbolico (vedi
220                              sez.~\ref{sec:file_symlink}).\\
221     \textsl{\code{mkdir}}  & Crea una directory (vedi
222                              sez.~\ref{sec:file_dir_creat_rem}).\\
223     \textsl{\code{rmdir}}  & Rimuove una directory (vedi
224                              sez.~\ref{sec:file_dir_creat_rem}).\\
225     \textsl{\code{mknod}}  & Crea un file speciale (vedi
226                              sez.~\ref{sec:file_mknod}).\\
227     \textsl{\code{rename}} & Cambia il nome di un file (vedi
228                              sez.~\ref{sec:file_remove}).\\
229     \textsl{\code{lookup}}&  Risolve il nome di un file.\\
230     \hline
231   \end{tabular}
232   \caption{Le principali operazioni sugli \textit{inode} definite tramite
233     \kstruct{inode\_operation}.} 
234   \label{tab:file_inode_operations}
235 \end{table}
236
237 Possiamo notare come molte di queste funzioni abbiano nomi sostanzialmente
238 identici alle varie \textit{system call} con le quali si gestiscono file e
239 directory, che tratteremo nel resto del capitolo. Quello che succede è che
240 tutte le volte che deve essere eseguita una \textit{system call}, o una
241 qualunque altra operazione su un \textit{inode} (come \texttt{lookup}) il VFS
242 andrà ad utilizzare la funzione corrispondente attraverso il puntatore
243 \var{i\_op}.
244
245 Sarà allora sufficiente che nella realizzazione di un filesystem si crei una
246 implementazione di queste funzioni per quel filesystem e si allochi una
247 opportuna istanza di \kstruct{inode\_operation} contenente i puntatori a dette
248 funzioni. A quel punto le strutture \kstruct{inode} usate per gli oggetti di
249 quel filesystem otterranno il puntatore alla relativa istanza di
250 \kstruct{inode\_operation} e verranno automaticamente usate le funzioni
251 corrette.
252
253 Si noti però come in tab.~\ref{tab:file_inode_operations} non sia presente la
254 funzione \texttt{open} che invece è citata in
255 tab.~\ref{tab:file_file_operations}.\footnote{essa può essere comunque
256   invocata dato che nella struttura \kstruct{inode} è presente anche il
257   puntatore \func{i\_fop} alla struttura \kstruct{file\_operation} che
258   fornisce detta funzione.} Questo avviene perché su Linux l'apertura di un
259 file richiede comunque un'altra operazione che mette in gioco l'omonimo
260 oggetto del VFS: l'allocazione di una struttura di tipo \kstruct{file} che
261 viene associata ad ogni file aperto nel sistema.
262
263 I motivi per cui viene usata una struttura a parte sono diversi, anzitutto,
264 come illustrato in sez.~\ref{sec:file_fd}, questa è necessaria per le
265 operazioni eseguite dai processi con l'interfaccia dei file descriptor; ogni
266 processo infatti mantiene il riferimento ad una struttura \kstruct{file} per
267 ogni file che ha aperto, ed è tramite essa che esegue le operazioni di I/O.
268
269 Inoltre se le operazioni relative agli \textit{inode} fanno riferimento ad
270 oggetti posti all'interno di un filesystem e vi si applicano quindi le
271 funzioni fornite nell'implementazione di quest'ultimo, quando si apre un file
272 questo può essere anche un file di dispositivo, ed in questo caso il VFS
273 invece di usare le operazioni fornite dal filesystem (come farebbe per un file
274 di dati) dovrà invece ricorrere a quelle fornite dal driver del dispositivo.
275
276 \itindend{inode}
277
278 \begin{figure}[!htb]
279   \footnotesize \centering
280   \begin{minipage}[c]{\textwidth}
281     \includestruct{listati/file.h}
282   \end{minipage}
283   \normalsize 
284   \caption{Estratto della struttura \kstructd{file} del kernel (da
285     \texttt{include/linux/fs.h}).}
286   \label{fig:kstruct_file}
287 \end{figure}
288
289 Come si può notare dall'estratto di fig.~\ref{fig:kstruct_file}, la struttura
290 \kstruct{file} contiene, oltre ad alcune informazioni usate dall'interfaccia
291 dei file descriptor il cui significato emergerà più avanti, il puntatore
292 \struct{f\_op} ad una struttura \kstruct{file\_operation}. Questa è l'analoga
293 per i file di \kstruct{inode\_operation}, e definisce le operazioni generiche
294 fornite dal VFS per i file. Si sono riportate in
295 tab.~\ref{tab:file_file_operations} le più significative.
296
297 \begin{table}[htb]
298   \centering
299   \footnotesize
300   \begin{tabular}[c]{|l|p{8cm}|}
301     \hline
302     \textbf{Funzione} & \textbf{Operazione} \\
303     \hline
304     \hline
305     \textsl{\code{open}}   & Apre il file (vedi sez.~\ref{sec:file_open}).\\
306     \textsl{\code{read}}   & Legge dal file (vedi sez.~\ref{sec:file_read}).\\
307     \textsl{\code{write}}  & Scrive sul file (vedi 
308                              sez.~\ref{sec:file_write}).\\
309     \textsl{\code{llseek}} & Sposta la posizione corrente sul file (vedi
310                              sez.~\ref{sec:file_lseek}).\\
311     \textsl{\code{ioctl}}  & Accede alle operazioni di controllo 
312                              (vedi sez.~\ref{sec:file_ioctl}).\\
313     \textsl{\code{readdir}}& Legge il contenuto di una directory (vedi 
314                              sez.~\ref{sec:file_dir_read}).\\
315     \textsl{\code{poll}}   & Usata nell'I/O multiplexing (vedi
316                              sez.~\ref{sec:file_multiplexing}).\\
317     \textsl{\code{mmap}}   & Mappa il file in memoria (vedi 
318                              sez.~\ref{sec:file_memory_map}).\\
319     \textsl{\code{release}}& Chiamata quando l'ultimo riferimento a un file 
320                              aperto è chiuso.\\
321     \textsl{\code{fsync}}  & Sincronizza il contenuto del file (vedi
322                              sez.~\ref{sec:file_sync}).\\
323     \textsl{\code{fasync}} & Abilita l'I/O asincrono (vedi
324                              sez.~\ref{sec:file_asyncronous_io}) sul file.\\
325     \hline
326   \end{tabular}
327   \caption{Operazioni sui file definite tramite \kstruct{file\_operation}.}
328   \label{tab:file_file_operations}
329 \end{table}
330
331 Anche in questo caso tutte le volte che deve essere eseguita una
332 \textit{system call} o una qualunque altra operazione sul file il VFS andrà ad
333 utilizzare la funzione corrispondente attraverso il puntatore
334 \var{f\_op}. Dato che è cura del VFS quando crea la struttura all'apertura del
335 file assegnare a \var{f\_op} il puntatore alla versione di
336 \kstruct{file\_operation} corretta per quel file, sarà possibile scrivere allo
337 stesso modo sulla porta seriale come su un normale file di dati, e lavorare
338 sui file allo stesso modo indipendentemente dal filesystem.
339
340 Il VFS realizza la quasi totalità delle operazioni relative ai file grazie
341 alle funzioni presenti nelle due strutture \kstruct{inode\_operation} e
342 \kstruct{file\_operation}.  Ovviamente non è detto che tutte le operazioni
343 possibili siano poi disponibili in tutti i casi, ad esempio \code{llseek} non
344 sarà presente per un dispositivo come la porta seriale o per una fifo, mentre
345 sui file del filesystem \texttt{vfat} non saranno disponibili i permessi, ma
346 resta il fatto che grazie al VFS le \textit{system call} per le operazioni sui
347 file possono restare sempre le stesse nonostante le enormi differenze che
348 possono esserci negli oggetti a cui si applicano.
349  
350
351 \itindend{Virtual~File~System}
352
353 % NOTE: documentazione interessante:
354 %       * sorgenti del kernel: Documentation/filesystems/vfs.txt
355 %       * http://thecoffeedesk.com/geocities/rkfs.html
356 %       * http://www.linux.it/~rubini/docs/vfs/vfs.html
357
358
359
360 \subsection{Il funzionamento di un filesystem Unix}
361 \label{sec:file_filesystem}
362
363 Come già accennato in sez.~\ref{sec:file_arch_overview} Linux (ed ogni sistema
364 unix-like) organizza i dati che tiene su disco attraverso l'uso di un
365 filesystem. Una delle caratteristiche di Linux rispetto agli altri Unix è
366 quella di poter supportare, grazie al VFS, una enorme quantità di filesystem
367 diversi, ognuno dei quali avrà una sua particolare struttura e funzionalità
368 proprie.  Per questo non entreremo nei dettagli di un filesystem specifico, ma
369 daremo una descrizione a grandi linee che si adatta alle caratteristiche
370 comuni di qualunque filesystem di un sistema unix-like.
371
372 Una possibile strutturazione dell'informazione su un disco è riportata in
373 fig.~\ref{fig:file_disk_filesys}, dove si hanno tre filesystem su tre
374 partizioni. In essa per semplicità si è fatto riferimento alla struttura del
375 filesystem \acr{ext2}, che prevede una suddivisione dei dati in \textit{block
376   group}.  All'interno di ciascun \textit{block group} viene anzitutto
377 replicato il cosiddetto \textit{superblock}, (la struttura che contiene
378 l'indice iniziale del filesystem e che consente di accedere a tutti i dati
379 sottostanti) e creata una opportuna suddivisione dei dati e delle informazioni
380 per accedere agli stessi.  Sulle caratteristiche di \acr{ext2} e derivati
381 torneremo in sez.~\ref{sec:file_ext2}.
382
383 \itindbeg{inode}
384
385 È comunque caratteristica comune di tutti i filesystem per Unix,
386 indipendentemente da come poi viene strutturata nei dettagli questa
387 informazione, prevedere la presenza di due tipi di risorse: gli
388 \textit{inode}, cui abbiamo già accennato in sez.~\ref{sec:file_vfs_work}, che
389 sono le strutture che identificano i singoli oggetti sul filesystem, e i
390 blocchi, che invece attengono allo spazio disco che viene messo a disposizione
391 per i dati in essi contenuti.
392
393 \begin{figure}[!htb]
394   \centering
395   \includegraphics[width=12cm]{img/disk_struct}
396   \caption{Organizzazione dello spazio su un disco in partizioni e
397   filesystem.}
398   \label{fig:file_disk_filesys}
399 \end{figure}
400
401 Se si va ad esaminare con maggiore dettaglio la strutturazione
402 dell'informazione all'interno del filesystem \textsl{ext2}, tralasciando i
403 dettagli relativi al funzionamento del filesystem stesso come la
404 strutturazione in gruppi dei blocchi, il \textit{superblock} e tutti i dati di
405 gestione possiamo esemplificare la situazione con uno schema come quello
406 esposto in fig.~\ref{fig:file_filesys_detail}.
407
408 \begin{figure}[!htb]
409   \centering
410   \includegraphics[width=12cm]{img/filesys_struct}
411   \caption{Strutturazione dei dati all'interno di un filesystem.}
412   \label{fig:file_filesys_detail}
413 \end{figure}
414
415 Da fig.~\ref{fig:file_filesys_detail} si evidenziano alcune delle
416 caratteristiche di base di un filesystem, che restano le stesse anche su
417 filesystem la cui organizzazione dei dati è totalmente diversa da quella
418 illustrata, e sulle quali è bene porre attenzione visto che sono fondamentali
419 per capire il funzionamento delle funzioni che manipolano i file e le
420 directory che tratteremo nel prosieguo del capitolo. In particolare è
421 opportuno tenere sempre presente che:
422
423
424 \begin{enumerate}
425   
426 \item L'\textit{inode} contiene i cosiddetti \textsl{metadati}, vale dire le
427   informazioni riguardanti le proprietà del file come oggetto del filesystem:
428   il tipo di file, i permessi di accesso, le dimensioni, i puntatori ai
429   blocchi fisici che contengono i dati e così via. Le informazioni che la
430   funzione \func{stat} (vedi sez.~\ref{sec:file_stat}) fornisce provengono
431   dall'\textit{inode}.  Dentro una directory si troverà solo il nome del file
432   e il numero dell'\textit{inode} ad esso associato; il nome non è una
433   proprietà del file e non viene mantenuto nell'\textit{inode}. Da da qui in
434   poi chiameremo il nome del file contenuto in una directory
435   ``\textsl{voce}'', come traduzione della nomenclatura inglese
436   \textit{directory entry} che non useremo per evitare confusione con le
437   \textit{dentry} del kernel viste in sez.~\ref{sec:file_vfs_work}.
438   
439 \item Come mostrato in fig.~\ref{fig:file_filesys_detail} per i file
440   \texttt{macro.tex} e \texttt{gapil\_macro.tex}, ci possono avere più voci
441   che fanno riferimento allo stesso \textit{inode}. Fra le proprietà di un
442   file mantenute nell'\textit{inode} c'è anche il contatore con il numero di
443   riferimenti che sono stati fatti ad esso, il cosiddetto \textit{link
444     count}.\footnote{mantenuto anche nel campo \var{i\_nlink} della struttura
445     \kstruct{inode} di fig.~\ref{fig:kstruct_inode}.}  Solo quando questo
446   contatore si annulla i dati del file possono essere effettivamente rimossi
447   dal disco. Per questo la funzione per cancellare un file si chiama
448   \func{unlink} (vedi sez.~\ref{sec:file_link}), ed in realtà non cancella
449   affatto i dati del file, ma si limita ad eliminare la relativa voce da una
450   directory e decrementare il numero di riferimenti nell'\textit{inode}.
451   
452 \item All'interno di ogni filesystem ogni \textit{inode} è identificato da un
453   numero univoco. Il numero di \textit{inode} associato ad una voce in una
454   directory si riferisce ad questo numero e non ci può essere una directory
455   che contiene riferimenti ad \textit{inode} relativi ad altri filesystem.
456   Questa è la ragione che limita l'uso del comando \cmd{ln}, che crea una
457   nuova voce per un file esistente con la funzione \func{link} (vedi
458   sez.~\ref{sec:file_link}) a file nel filesystem corrente.
459   
460 \item Quando si cambia nome ad un file senza cambiare filesystem il contenuto
461   del file non viene spostato fisicamente, viene semplicemente creata una
462   nuova voce per l'\textit{inode} in questione e rimossa la precedente, questa
463   è la modalità in cui opera normalmente il comando \cmd{mv} attraverso la
464   funzione \func{rename} (vedi sez.~\ref{sec:file_remove}). Questa operazione
465   non modifica minimamente neanche l'\textit{inode} del file, dato che non si
466   opera sul file ma sulla directory che lo contiene.
467
468 \item Gli \textit{inode} dei file, che contengono i \textsl{metadati}, ed i
469   blocchi di spazio disco, che contengono i dati, sono risorse indipendenti ed
470   in genere vengono gestite come tali anche dai diversi filesystem; è pertanto
471   possibile esaurire sia lo spazio disco (il caso più comune) che lo spazio
472   per gli \textit{inode}. Nel primo caso non sarà possibile allocare ulteriore
473   spazio, ma si potranno creare file (vuoti), nel secondo non si potranno
474   creare nuovi file, ma si potranno estendere quelli che ci
475   sono.\footnote{questo comportamento non è generale, alcuni filesystem
476     evoluti possono evitare il problema dell'esaurimento degli \textit{inode}
477     riallocando lo spazio disco libero per i blocchi.}
478
479 \end{enumerate}
480
481 \begin{figure}[!htb]
482   \centering 
483   \includegraphics[width=12cm]{img/dir_links}
484   \caption{Organizzazione dei \textit{link} per le directory.}
485   \label{fig:file_dirs_link}
486 \end{figure}
487
488 Infine tenga presente che, essendo file pure loro, il numero di riferimenti
489 esiste anche per le directory. Per questo se a partire dalla situazione
490 mostrata in fig.~\ref{fig:file_filesys_detail} creiamo una nuova directory
491 \file{img} nella directory \file{gapil}, avremo una situazione come quella
492 illustrata in fig.~\ref{fig:file_dirs_link}.
493
494 La nuova directory avrà un numero di riferimenti pari a due, in quanto è
495 referenziata dalla directory da cui si era partiti (in cui è inserita la nuova
496 voce che fa riferimento a \texttt{img}) e dalla voce interna ``\texttt{.}''
497 che è presente in ogni directory.  Questo è il valore che si troverà sempre
498 per ogni directory che non contenga a sua volta altre directory. Al contempo,
499 la directory da cui si era partiti avrà un numero di riferimenti di almeno
500 tre, in quanto adesso sarà referenziata anche dalla voce ``\texttt{..}'' di
501 \texttt{img}. L'aggiunta di una sottodirectory fa cioè crescere di uno il
502 \textit{link count} della directory genitrice.
503
504 \itindend{inode}
505
506
507 \subsection{Alcuni dettagli sul filesystem \textsl{ext2} e successori}
508 \label{sec:file_ext2}
509
510
511 Benché non esista ``il'' filesystem di Linux, dato che esiste un supporto
512 nativo di diversi filesystem che sono in uso da anni, quello che gli avvicina
513 di più è la famiglia di filesystem evolutasi a partire dal \textit{second
514   extended filesystem}, o \acr{ext2}. Il filesystem \acr{ext2} ha subito un
515 grande sviluppo e diverse evoluzioni, fra cui l'aggiunta del
516 \textit{journaling} con \acr{ext3}, probabilmente ancora il filesystem più
517 diffuso, ed una serie di ulteriori miglioramento con il successivo \acr{ext4},
518 che sta iniziando a sostituirlo gradualmente. In futuro è previsto che questo
519 debba essere sostituito da un filesystem completamente diverso, \acr{btrfs},
520 che dovrebbe diventare il filesystem standard di Linux, ma questo al momento è
521 ancora in fase di sviluppo.\footnote{si fa riferimento al momento dell'ultima
522   revisione di di questo paragrafo, l'inizio del 2012.}
523
524 Il filesystem \acr{ext2} nasce come filesystem nativo per Linux a partire
525 dalle prime versioni del kernel e supporta tutte le caratteristiche di un
526 filesystem standard Unix: è in grado di gestire nomi di file lunghi (256
527 caratteri, estensibili a 1012) e supporta una dimensione massima dei file fino
528 a 4~Tb. I successivi filesystem \acr{ext3} ed \acr{ext4} sono evoluzioni di
529 questo filesystem, e sia pure con molti miglioramenti ed estensioni
530 significative ne mantengono le caratteristiche fondamentali.
531
532 Oltre alle caratteristiche standard, \acr{ext2} fornisce alcune estensioni che
533 non sono presenti su un classico filesystem di tipo Unix; le principali sono
534 le seguenti:
535 \begin{itemize}
536 \item i \textit{file attributes} consentono di modificare il comportamento del
537   kernel quando agisce su gruppi di file. Possono essere impostati su file e
538   directory e in quest'ultimo caso i nuovi file creati nella directory
539   ereditano i suoi attributi.
540 \item sono supportate entrambe le semantiche di BSD e SVr4 come opzioni di
541   montaggio. La semantica BSD comporta che i file in una directory sono creati
542   con lo stesso identificatore di gruppo della directory che li contiene. La
543   semantica SVr4 comporta che i file vengono creati con l'identificatore del
544   gruppo primario del processo, eccetto il caso in cui la directory ha il bit
545   di \acr{sgid} impostato (per una descrizione dettagliata del significato di
546   questi termini si veda sez.~\ref{sec:file_access_control}), nel qual caso
547   file e subdirectory ereditano sia il \ids{GID} che lo \acr{sgid}.
548 \item l'amministratore può scegliere la dimensione dei blocchi del filesystem
549   in fase di creazione, a seconda delle sue esigenze: blocchi più grandi
550   permettono un accesso più veloce, ma sprecano più spazio disco.
551 \item il filesystem implementa link simbolici veloci, in cui il nome del file
552   non è salvato su un blocco, ma tenuto all'interno \itindex{inode}
553   dell'\textit{inode} (evitando letture multiple e spreco di spazio), non
554   tutti i nomi però possono essere gestiti così per limiti di spazio (il
555   limite è 60 caratteri).
556 \item vengono supportati i file immutabili (che possono solo essere letti) per
557   la protezione di file di configurazione sensibili, o file
558   \textit{append-only} che possono essere aperti in scrittura solo per
559   aggiungere dati (caratteristica utilizzabile per la protezione dei file di
560   log).
561 \end{itemize}
562
563 La struttura di \acr{ext2} è stata ispirata a quella del filesystem di BSD: un
564 filesystem è composto da un insieme di blocchi, la struttura generale è quella
565 riportata in fig.~\ref{fig:file_filesys_detail}, in cui la partizione è divisa
566 in gruppi di blocchi.
567
568 Ciascun gruppo di blocchi contiene una copia delle informazioni essenziali del
569 filesystem (i \textit{superblock} sono quindi ridondati) per una maggiore
570 affidabilità e possibilità di recupero in caso di corruzione del
571 \textit{superblock} principale. L'utilizzo di raggruppamenti di blocchi ha
572 inoltre degli effetti positivi nelle prestazioni dato che viene ridotta la
573 distanza fra i dati e la tabella degli \itindex{inode} inode.
574
575 \begin{figure}[!htb]
576   \centering
577   \includegraphics[width=9cm]{img/dir_struct}  
578   \caption{Struttura delle directory nel \textit{second extended filesystem}.}
579   \label{fig:file_ext2_dirs}
580 \end{figure}
581
582 Le directory sono implementate come una \itindex{linked~list} \textit{linked
583   list} con voci di dimensione variabile. Ciascuna voce della lista contiene
584 il numero di inode \itindex{inode}, la sua lunghezza, il nome del file e la sua
585 lunghezza, secondo lo schema in fig.~\ref{fig:file_ext2_dirs}; in questo modo
586 è possibile implementare nomi per i file anche molto lunghi (fino a 1024
587 caratteri) senza sprecare spazio disco.
588
589 Con l'introduzione del filesystem \textit{ext3} sono state introdotte diverse
590 modifiche strutturali, la principale di queste è quella che \textit{ext3} è un
591 filesystem \textit{journaled}, è cioè in grado di eseguire una registrazione
592 delle operazioni di scrittura su un giornale (uno speciale file interno) in
593 modo da poter garantire il ripristino della coerenza dei dati del
594 filesystem\footnote{si noti bene che si è parlato di dati \textsl{del}
595   filesystem, non di dati \textsl{nel} filesystem, quello di cui viene
596   garantito un veloce ripristino è relativo ai dati della struttura interna
597   del filesystem, non di eventuali dati contenuti nei file che potrebbero
598   essere stati persi.} in brevissimo tempo in caso di interruzione improvvisa
599 della corrente o di crollo del sistema che abbia causato una interruzione
600 della scrittura dei dati sul disco.
601
602 Oltre a questo \textit{ext3} introduce ulteriori modifiche volte a migliorare
603 sia le prestazioni che la semplicità di gestione del filesystem, in
604 particolare per le directory si è passato all'uso di alberi binari con
605 indicizzazione tramite hash al posto delle \textit{linked list} che abbiamo
606 illustrato, ottenendo un forte guadagno di prestazioni in caso di directory
607 contenenti un gran numero di file.
608
609 % TODO portare a ext3, ext4 e btrfs ed illustrare le problematiche che si
610 % possono incontrare (in particolare quelle relative alla perdita di contenuti
611 % in caso di crash del sistema)
612
613
614 \subsection{La gestione dell'uso dei filesystem}
615 \label{sec:sys_file_config}
616
617 Come accennato in sez.~\ref{sec:file_arch_overview} per poter accedere ai file
618 occorre prima rendere disponibile al sistema il filesystem su cui essi sono
619 memorizzati; l'operazione di attivazione del filesystem è chiamata
620 \textsl{montaggio}, per far questo in Linux si usa la funzione \funcd{mount},
621 il cui prototipo è:\footnote{la funzione è una versione specifica di Linux che
622   usa la omonima \textit{system call} e non è portabile.}
623
624 \begin{funcproto}{ 
625 \fhead{sys/mount.h} 
626 \fdecl{mount(const char *source, const char *target, const char
627   *filesystemtype, \\ 
628 \phantom{mount(}unsigned long mountflags, const void *data)}
629 \fdesc{Monta un filesystem.} 
630 }
631
632 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
633   caso \var{errno} assumerà uno dei valori:
634   \begin{errlist}
635   \item[\errcode{EACCES}] non si ha il permesso di accesso su uno dei
636     componenti del \itindex{pathname} \textit{pathname}, o si è cercato di
637     montare un filesystem disponibile in sola lettura senza aver specificato
638     \const{MS\_RDONLY} o il device \param{source} è su un filesystem montato
639     con l'opzione \const{MS\_NODEV}.
640   \item[\errcode{EBUSY}] \param{source} è già montato, o non può essere
641     rimontato in sola lettura perché ci sono ancora file aperti in scrittura,
642     o non può essere montato su \param{target} perché la directory è ancora in
643     uso.
644   \item[\errcode{EINVAL}] il dispositivo \param{source} presenta un
645     \textit{superblock} non valido, o si è cercato di rimontare un filesystem
646     non ancora montato, o di montarlo senza che \param{target} sia un
647     \itindex{mount~point} \textit{mount point} o di spostarlo
648     quando \param{target} non è un \itindex{mount~point} \textit{mount point}
649     o è la radice.
650   \item[\errcode{EMFILE}] la tabella dei device \textit{dummy} è piena.
651   \item[\errcode{ENODEV}] il tipo \param{filesystemtype} non esiste o non è
652     configurato nel kernel.
653   \item[\errcode{ENOTBLK}] non si è usato un \textit{block device} per
654     \param{source} quando era richiesto.
655   \item[\errcode{ENXIO}] il \itindex{major~number} \textit{major number} del
656     dispositivo \param{source} è sbagliato.
657   \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
658   \end{errlist} 
659   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENOMEM},
660   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR} nel loro
661   significato generico.}
662 \end{funcproto}
663
664 La funzione monta sulla directory indicata da \param{target}, detta
665 \itindex{mount~point} \textit{mount point}, il filesystem contenuto nel file
666 di dispositivo indicato da \param{source}. In entrambi i casi, come daremo per
667 assunto da qui in avanti tutte le volte che si parla di directory o file nel
668 passaggio di un argomento di una funzione, si intende che questi devono essere
669 indicati con la stringa contenente il loro \itindex{pathname}
670 \textit{pathname}.
671
672 Normalmente un filesystem è contenuto su un disco o una partizione, ma come
673 illustrato in sez.~\ref{sec:file_vfs_work} la struttura del
674 \itindex{Virtual~File~System} \textit{Virtual File System} è estremamente
675 flessibile e può essere usata anche per oggetti diversi da un disco. Ad
676 esempio usando il \textit{loop device} si può montare un file qualunque (come
677 l'immagine di un CD-ROM o di un floppy) che contiene l'immagine di un
678 filesystem, inoltre alcuni tipi di filesystem, come \texttt{proc} o
679 \texttt{sysfs} sono virtuali e non hanno un supporto che ne contenga i dati,
680 che invece sono generati al volo ad ogni lettura, e passati indietro al kernel
681 ad ogni scrittura.\footnote{costituiscono quindi un meccanismo di
682   comunicazione, attraverso l'ordinaria interfaccia dei file, con il kernel.}
683
684 Il tipo di filesystem che si vuole montare è specificato
685 dall'argomento \param{filesystemtype}, che deve essere una delle stringhe
686 riportate nel file \procfile{/proc/filesystems} che, come accennato in
687 sez.~\ref{sec:file_vfs_work}, contiene l'elenco dei filesystem supportati dal
688 kernel. Nel caso si sia indicato un filesystem virtuale, che non è associato a
689 nessun file di dispositivo, il contenuto di \param{source} viene ignorato.
690
691 L'argomento \param{data} viene usato per passare le impostazioni relative alle
692 caratteristiche specifiche di ciascun filesystem. Si tratta di una stringa di
693 parole chiave (separate da virgole e senza spazi) che indicano le cosiddette
694 ``\textsl{opzioni}'' del filesystem che devono essere impostate; in genere
695 viene usato direttamente il contenuto del parametro dell'opzione \texttt{-o}
696 del comando \texttt{mount}. I valori utilizzabili dipendono dal tipo di
697 filesystem e ciascuno ha i suoi, pertanto si rimanda alla documentazione della
698 pagina di manuale di questo comando e dei singoli filesystem.
699
700 Dopo l'esecuzione della funzione il contenuto del filesystem viene resto
701 disponibile nella directory specificata come \itindex{mount~point}
702 \textit{mount point}, il precedente contenuto di detta directory viene
703 mascherato dal contenuto della directory radice del filesystem montato. Fino
704 ai kernel della serie 2.2.x non era possibile montare un filesytem se un
705 \textit{mount point} era già in uso. 
706
707 A partire dal kernel 2.4.x inoltre è divenuto possibile sia spostare
708 atomicamente un \itindex{mount~point} \textit{mount point} da una directory ad
709 un'altra, sia montare lo stesso filesystem in diversi \itindex{mount~point}
710 \textit{mount point}, sia montare più filesystem sullo stesso
711 \itindex{mount~point} \textit{mount point} impilandoli l'uno sull'altro, nel
712 qual caso vale comunque quanto detto in precedenza, e cioè che solo il
713 contenuto dell'ultimo filesystem montato sarà visibile.
714
715 Oltre alle opzioni specifiche di ciascun filesystem, che si passano nella
716 forma della lista di parole chiave indicata con l'argomento \param{data},
717 esistono pure alcune opzioni che si possono applicare in generale, anche se
718 non è detto che tutti i filesystem le supportino, che si specificano tramite
719 l'argomento \param{mountflags}.  L'argomento inoltre può essere utilizzato per
720 modificare il comportamento della funzione, facendole compiere una operazione
721 diversa (ad esempio un rimontaggio, invece che un montaggio).
722
723 In Linux \param{mountflags} deve essere un intero a 32 bit; fino ai kernel
724 della serie 2.2.x i 16 più significativi avevano un valore riservato che
725 doveva essere specificato obbligatoriamente,\footnote{il valore era il
726   \itindex{magic~number} \textit{magic number} \code{0xC0ED}, si può usare la
727   costante \const{MS\_MGC\_MSK} per ottenere la parte di \param{mountflags}
728   riservata al \textit{magic number}, mentre per specificarlo si può dare un
729   OR aritmetico con la costante \const{MS\_MGC\_VAL}.} e si potevano usare
730 solo i 16 meno significativi. Oggi invece, con un numero di opzioni superiore,
731 sono utilizzati tutti e 32 i bit, ma qualora nei 16 più significativi sia
732 presente detto valore, che non esprime una combinazione valida, esso viene
733 ignorato. Il valore dell'argomento deve essere espresso come maschera binaria
734 e i vari bit devono essere impostati con un OR aritmetico dei rispettivi flag,
735 identificati dalle costanti riportate nell'elenco seguente:
736
737 \begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}}
738 \itindbeg{bind~mount}
739 \item[\const{MS\_BIND}] Effettua un cosiddetto \textit{bind mount}, in cui è
740   possibile montare una directory di un filesystem in un'altra directory,
741   l'opzione è disponibile a partire dai kernel della serie 2.4. In questo caso
742   verranno presi in considerazione solo gli argomenti \param{source}, che
743   stavolta indicherà la directory che si vuole montare (e non un file di
744   dispositivo) e \param{target} che indicherà la directory su cui verrà
745   effettuato il \textit{bind mount}. Gli argomenti \param{filesystemtype}
746   e \param{data} vengono ignorati.
747
748   In sostanza quello che avviene è che in corrispondenza del \index{pathname}
749   \textit{pathname} indicato da \param{target} viene montato l'\textit{inode}
750   di \param{source}, così che la porzione di albero dei file presente sotto
751   \param{source} diventi visibile allo stesso modo sotto
752   \param{target}. Trattandosi esattamente dei dati dello stesso filesystem,
753   ogni modifica fatta in uno qualunque dei due rami di albero sarà visibile
754   nell'altro, visto che entrambi faranno riferimento agli stessi
755   \textit{inode}.
756
757   Dal punto di vista del \itindex{Virtual~File~System} VFS l'operazione è
758   analoga al montaggio di un filesystem proprio nel fatto che anche in questo
759   caso si inserisce in corripondenza della \textit{dentry} di \texttt{target}
760   un diverso \textit{inode}, che stavolta, invece di essere quello della
761   radice del filesystem indicato da un file di dispositivo, è quello di una
762   directory già montata.
763
764   Si tenga presente che proprio per questo sotto \param{target} comparirà il
765   contenuto che è presente sotto \param{source} all'interno del filesystem in
766   cui quest'ultima è contenuta. Questo potrebbe non corrispondere alla
767   porzione di albero che sta sotto \param{source} qualora in una
768   sottodirectory di quest'ultima si fosse effettuato un altro montaggio. In
769   tal caso infatti nella porzione di albero sotto \param{source} si troverebbe
770   il contenuto del nuovo filesystem (o di un altro \textit{bind mount}) mentre
771   sotto \param{target} ci sarebbe il contenuto presente nel filesystem
772   originale.\footnote{questo evita anche il problema dei \textit{loop} di
773     fig.~\ref{fig:file_link_loop}, dato che se anche si montasse su
774     \param{target} una directory in cui essa è contenuta, il cerchio non
775     potrebbe chiudersi perché ritornati a \param{target} dentro il
776     \textit{bind mount} vi si troverebbe solo il contenuto originale e non si
777     potrebbe tornare indietro.}
778
779   Fino al kernel 2.6.26 questo flag doveva essere usato da solo, in quanto il
780   \textit{bind mount} continuava ad utilizzare le stesse opzioni del montaggio
781   originale, dal 2.6.26 è stato introdotto il supporto per il cosiddetto
782   \textit{read-only bind mount} e viene onorata la presenza del flag
783   \const{MS\_RDONLY}. In questo modo si ottiene che l'accesso ai file sotto
784   \param{target} sia effettuabile esclusivamente in sola lettura.
785
786   Il supporto per il \textit{bind mount} consente di superare i limiti
787   presenti per gli \textit{hard link} (di cui parleremo in
788   sez.~\ref{sec:file_link}) ottenendo un qualcosa di analogo in cui si può
789   fare riferimento alla porzione dell'albero dei file di un filesystem
790   presente a partire da una certa directory utilizzando una qualunque altra
791   directory, anche se questa sta su un filesystem diverso. Si può così fornire
792   una alternativa all'uso dei link simbolici (di cui parleremo in
793   sez.~\ref{sec:file_symlink}) che funziona correttamente anche all'intero di
794   un \textit{chroot} (argomento su cui torneremo in
795   sez.~\ref{sec:file_chroot}.  
796 \itindend{bind~mount}
797
798 \item[\const{MS\_DIRSYNC}] Richiede che ogni modifica al contenuto di una
799   directory venga immediatamente registrata su disco in maniera sincrona
800   (introdotta a partire dai kernel della serie 2.6). L'opzione si applica a
801   tutte le directory del filesystem, ma su alcuni filesystem è possibile
802   impostarla a livello di singole directory o per i sottorami di una directory
803   con il comando \cmd{lsattr}.\footnote{questo avviene tramite delle opportune
804     \texttt{ioctl} (vedi sez.~\ref{sec:file_ioctl}).}
805
806   Questo consente di ridurre al minimo il rischio di perdita dei dati delle
807   directory in caso di crollo improvviso del sistema, al costo di una perdita
808   di prestazioni dato che le funzioni di scrittura relative ad operazioni
809   sulle directory non saranno più bufferizzate e si bloccheranno fino
810   all'arrivo dei dati sul disco prima che un programma possa proseguire.
811
812 \item[\const{MS\_MANDLOCK}] Consente l'uso del \textit{mandatory locking}
813   \itindex{mandatory~locking} (vedi sez.~\ref{sec:file_mand_locking}) sui file
814   del filesystem. Per poterlo utilizzare effettivamente però esso dovrà essere
815   comunque attivato esplicitamente per i singoli file impostando i permessi
816   come illustrato in sez.~\ref{sec:file_mand_locking}.
817
818 \item[\const{MS\_MOVE}] Effettua uno del spostamento del \itindex{mount~point}
819   \textit{mount point} di un filesystem. La directory del
820   \itindex{mount~point} \textit{mount point} originale deve essere indicata
821   nell'argomento \param{source}, e la sua nuova posizione
822   nell'argomento \param{target}. Tutti gli altri argomenti della funzione
823   vengono ignorati.
824
825   Lo spostamento avviene atomicamente, ed il ramo di albero presente
826   sotto \param{source} sarà immediatamante visibile sotto \param{target}. Non
827   esiste cioè nessun momento in cui il filesystem non risulti montato in una o
828   nell'altra directory e pertanto è garantito che la risoluzione di
829   \textit{pathname} relativi all'interno del filesystem non possa fallire.
830
831 \item[\const{MS\_NOATIME}] Viene disabilitato sul filesystem l'aggiornamento
832   degli \textit{access time} (vedi sez.~\ref{sec:file_file_times}) per
833   qualunque tipo di file. Dato che l'aggiornamento degli \textit{access time}
834   è una funzionalità la cui utilità è spesso irrilevante ma comporta un costo
835   elevato visto che una qualunque lettura comporta comunque una scrittura su
836   disco,\footnote{e questo ad esempio ha conseguenze molto pesanti nell'uso
837     della batteria sui portatili.} questa opzione consente di disabilitarla
838   completamente. La soluzione può risultare troppo drastica dato che
839   l'informazione viene comunque utilizzata da alcuni programmi, per cui nello
840   sviluppo del kernel sono state introdotte altre opzioni che forniscono
841   soluzioni più appropriate e meno radicali.
842
843 \item[\const{MS\_NODEV}] Viene disabilitato sul filesystem l'accesso ai file
844   di dispositivo eventualmente presenti su di esso. L'opzione viene usata come
845   misura di precauzione per rendere inutile la presenza di eventuali file di
846   dispositivo su filesystem che non dovrebbero contenerne.\footnote{si ricordi
847     che le convenzioni del \itindex{Filesystem~Hierarchy~Standard~(FHS)}
848     \textit{Linux Filesystem Hierarchy Standard} richiedono che questi siano
849     mantenuti esclusivamente sotto \texttt{/dev}.}
850
851   Viene utilizzata, assieme a \const{MS\_NOEXEC} e \const{MS\_NOSUID}, per
852   fornire un accesso più controllato a quei filesystem di cui gli utenti hanno
853   il controllo dei contenuti, in particolar modo quelli posti su dispositivi
854   rimuovibili. In questo modo si evitano alla radice possibili situazioni in
855   cui un utente malizioso inserisce su uno di questi filesystem dei file di
856   dispositivo con permessi ``opportunamente'' ampliati che gli consentano di
857   accedere anche a risorse cui non dovrebbe.
858
859 \item[\const{MS\_NODIRATIME}] Viene disabilitato sul filesystem
860   l'aggiornamento degli \textit{access time} (vedi
861   sez.~\ref{sec:file_file_times}), ma soltanto per le directory. Costituisce
862   una alternativa per \const{MS\_NOATIME}, che elimina l'informazione per le
863   directory, che in pratica che non viene mai utilizzata, mantenendola per i
864   file in cui invece ha un impiego, sia pur limitato.
865
866 \item[\const{MS\_NOEXEC}] Viene disabilitata sul filesystem l'esecuzione di un
867   qualunque file eseguibile eventualmente presente su di esso. L'opzione viene
868   usata come misura di precauzione per rendere impossibile l'uso di programmi
869   posti su filesystem che non dovrebbero contenerne.
870
871   Anche in questo caso viene utilizzata per fornire un accesso più controllato
872   a quei filesystem di cui gli utenti hanno il controllo dei contenuti. Da
873   questo punto di vista l'opzione è meno importante delle analoghe
874   \const{MS\_NODEV} e \const{MS\_NOSUID} in quanto l'esecuzione di un
875   programma creato dall'utente pone un livello di rischio nettamente
876   inferiore, ed è in genere consentita per i file contenuti nella sua home
877   directory.\footnote{cosa che renderebbe superfluo l'attivazione di questa
878     opzione, il cui uso ha senso solo per ambienti molto controllati in cui si
879     vuole che gli utenti eseguano solo i programmi forniti
880     dall'amministratore.}
881
882 \item[\const{MS\_NOSUID}] Viene disabilitato sul filesystem l'effetto dei bit
883   dei permessi \itindex{suid~bit} \acr{suid} e \itindex{sgid~bit} \acr{sgid}
884   (vedi sez.~\ref{sec:file_special_perm}) eventualmente presenti sui file in
885   esso contenuti. L'opzione viene usata come misura di precauzione per rendere
886   inefficace l'effetto di questi bit per filesystem in cui non ci dovrebbero
887   essere file dotati di questi permessi.
888
889   Di nuovo viene utilizzata, analogamente a \const{MS\_NOEXEC} e
890   \const{MS\_NODEV}, per fornire un accesso più controllato a quei filesystem
891   di cui gli utenti hanno il controllo dei contenuti. In questo caso si evita
892   che un utente malizioso possa inserire su uno di questi filesystem un
893   eseguibile con il bit \itindex{suid~bit} \acr{suid} attivo e di proprietà
894   dell'amministratore o di un altro utente, che gli consentirebbe di eseguirlo
895   per conto di quest'ultimo.
896
897 \item[\const{MS\_PRIVATE}] (non documentato).
898
899 \item[\const{MS\_RDONLY}] Esegue il montaggio del filesystem in sola lettura,
900   non sarà possibile nessuna modifica ai suoi contenuti. Viene usato tutte le
901   volte che si deve accedere ai contenuti di un filesystem con la certezza che
902   questo non venga modificato (ad esempio per ispezionare un filesystem
903   corrotto). All'avvio di default il kernel monta la radice in questa
904   modalità.
905
906 \item[\const{MS\_RELATIME}] .
907
908 \item[\const{MS\_REMOUNT}] Consente di rimontare un filesystem già montato
909   cambiandone le opzioni di montaggio in maniera atomica. In questo modo si
910   possono modificare le opzioni del filesystem anche se questo è in uso. Gli
911   argomenti \param{source} e \param{target} devono essere gli stessi usati per
912   il montaggio originale, mentre \param{data} che \param{mountflags}
913   conterranno le nuove opzioni, \param{filesystemtype} viene ignorato.
914
915   Qualunque opzione specifica del filesystem indicata con \param{data} può
916   essere modificata, mentre con \param{mountflags} possono essere modificate
917   solo alcune opzioni generiche. Con i kernel più recenti queste sono soltanto
918   \const{MS\_MANDLOCK}, \const{MS\_RDONLY} e \const{MS\_SYNCHRONOUS}, prima
919   del kernel 2.6.16 potevano essere modificate anche le ulteriori
920   \const{MS\_NOATIME} e \const{MS\_NODIRATIME}, ed infine prima del kernel
921   2.4.10 anche \const{MS\_NODEV}, \const{MS\_NOEXEC} e \const{MS\_NOSUID}.
922
923 \item[\const{MS\_SHARE}] Shared mount (non documentato).
924
925 \item[\const{MS\_SILENT}] .
926
927 \item[\const{MS\_SLAVE}] Slave mount (non documentato).
928
929 \item[\const{MS\_STRICTATIME}] .
930
931 \item[\const{MS\_SYNCHRONOUS}] Abilita la scrittura sincrona.
932
933 \item[\const{MS\_UNBINDABLE}]  (non documentato).
934
935 % TODO aggiornare con i nuovi flag di man mount
936 % per \const{MS\_SLAVE},\const{MS\_SHARE}, \const{MS\_PRIVATE},
937 % \const{MS\_UNBINDABLE} dal 2.6.15 vedi shared subtrees,
938 % http://lwn.net/Articles/159077/ e
939 % Documentation/filesystems/sharedsubtree.txt
940
941 % TODO: non documentati ma presenti in sys/mount.h:
942 %       MS_REC
943 %       MS_POSIXACL
944 %       MS_KERNMOUNT
945 %       MS_I_VERSION
946 %       MS_ACTIVE
947 %       MS_NOUSER
948
949 \end{basedescript}
950
951 La funzione \func{mount} può essere utilizzata anche per effettuare il
952 \textsl{rimontaggio} di un filesystem, cosa che permette di cambiarne al volo
953 alcune delle caratteristiche di funzionamento (ad esempio passare da sola
954 lettura a lettura/scrittura). Questa operazione è attivata attraverso uno dei
955 bit di \param{mountflags}, \const{MS\_REMOUNT}, che se impostato specifica che
956 deve essere effettuato il rimontaggio del filesystem (con le opzioni
957 specificate dagli altri bit), anche in questo caso il valore di \param{source}
958 viene ignorato.
959
960 Una volta che non si voglia più utilizzare un certo filesystem è possibile
961 \textsl{smontarlo} usando la funzione \funcd{umount}, il cui prototipo è:
962
963 \begin{funcproto}{ 
964 \fhead{sys/mount.h}
965 \fdecl{umount(const char *target)}
966 \fdesc{Smonta un filesystem.} 
967 }
968 {La funzione ritorna  $0$ in caso 
969   di successo e $-1$  per un errore,
970   nel qual caso \var{errno} assumerà uno dei valori: 
971   \begin{errlist}
972   \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
973   \item[\errcode{EBUSY}]  \param{target} è la directory di lavoro di qualche
974   processo, o contiene dei file aperti, o un altro mount point.
975 \end{errlist}ed inoltre \errval{ENOTDIR}, \errval{EFAULT}, \errval{ENOMEM},
976 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ELOOP} nel loro
977   significato generico.}
978 \end{funcproto}
979
980 La funzione prende il nome della directory su cui il filesystem è montato e
981 non il file o il dispositivo che è stato montato,\footnote{questo è vero a
982   partire dal kernel 2.3.99-pre7, prima esistevano due chiamate separate e la
983   funzione poteva essere usata anche specificando il file di dispositivo.} in
984 quanto con il kernel 2.4.x è possibile montare lo stesso dispositivo in più
985 punti. Nel caso più di un filesystem sia stato montato sullo stesso
986 \itindex{mount~point} \textit{mount point} viene smontato quello che è stato
987 montato per ultimo.
988
989 Si tenga presente che la funzione fallisce quando il filesystem è
990 \textsl{occupato}, questo avviene quando ci sono ancora file aperti sul
991 filesystem, se questo contiene la directory di lavoro corrente di un qualunque
992 processo o il \itindex{mount~point} \textit{mount point} di un altro
993 filesystem; in questo caso l'errore restituito è \errcode{EBUSY}.
994
995 Linux provvede inoltre una seconda funzione, \funcd{umount2}, che in alcuni
996 casi permette di forzare lo smontaggio di un filesystem, anche quando questo
997 risulti occupato; il suo prototipo è:
998 \begin{funcproto}{ 
999 \fhead{sys/mount.h}
1000 \fdecl{umount2(const char *target, int flags)}
1001 \fdesc{Smonta un filesystem.} 
1002 }
1003 {La funzione è identica a \func{umount} per valori di ritorno e codici di
1004   errore. }
1005 \end{funcproto}
1006
1007 Il valore di \param{flags} è una maschera binaria, e al momento l'unico valore
1008 definito è il bit \const{MNT\_FORCE}; gli altri bit devono essere nulli.
1009 Specificando \const{MNT\_FORCE} la funzione cercherà di liberare il filesystem
1010 anche se è occupato per via di una delle condizioni descritte in precedenza. A
1011 seconda del tipo di filesystem alcune (o tutte) possono essere superate,
1012 evitando l'errore di \errcode{EBUSY}.  In tutti i casi prima dello smontaggio
1013 viene eseguita una sincronizzazione dei dati. 
1014
1015 % TODO documentare MNT_DETACH e MNT_EXPIRE ...
1016
1017 Altre due funzioni specifiche di Linux,\footnote{esse si trovano anche su BSD,
1018   ma con una struttura diversa.} utili per ottenere in maniera diretta
1019 informazioni riguardo al filesystem su cui si trova un certo file, sono
1020 \funcd{statfs} e \funcd{fstatfs}, i cui prototipi sono:
1021
1022 \begin{funcproto}{ 
1023 \fhead{sys/vfs.h}
1024 \fdecl{int statfs(const char *path, struct statfs *buf)}
1025 \fdecl{int fstatfs(int fd, struct statfs *buf)}
1026 \fdesc{Restituiscono informazioni relative ad un filesystem.} 
1027 }
1028 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
1029   nel qual caso \var{errno} assumerà uno dei valori: 
1030   \begin{errlist}
1031   \item[\errcode{ENOSYS}] il filesystem su cui si trova il file specificato non
1032   \end{errlist} ed inoltre \errval{EFAULT} ed \errval{EIO} per entrambe,
1033   \errval{EBADF} per \func{fstatfs}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
1034   \errval{ENOENT}, \errval{EACCES}, \errval{ELOOP} per \func{statfs} nel loro
1035   significato generico.}
1036 \end{funcproto}
1037
1038
1039 Queste funzioni permettono di ottenere una serie di informazioni generali
1040 riguardo al filesystem su cui si trova il file specificato; queste vengono
1041 restituite all'indirizzo \param{buf} di una struttura \struct{statfs} definita
1042 come in fig.~\ref{fig:sys_statfs}, ed i campi che sono indefiniti per il
1043 filesystem in esame sono impostati a zero.  I valori del campo \var{f\_type}
1044 sono definiti per i vari filesystem nei relativi file di header dei sorgenti
1045 del kernel da costanti del tipo \var{XXX\_SUPER\_MAGIC}, dove \var{XXX} in
1046 genere è il nome del filesystem stesso.
1047
1048 \begin{figure}[!htb]
1049   \footnotesize \centering
1050   \begin{minipage}[c]{\textwidth}
1051     \includestruct{listati/statfs.h}
1052   \end{minipage}
1053   \normalsize 
1054   \caption{La struttura \structd{statfs}.} 
1055   \label{fig:sys_statfs}
1056 \end{figure}
1057
1058
1059 Le \acr{glibc} provvedono infine una serie di funzioni per la gestione dei due
1060 file \conffile{/etc/fstab} ed \conffile{/etc/mtab}, che convenzionalmente sono
1061 usati in quasi tutti i sistemi unix-like per mantenere rispettivamente le
1062 informazioni riguardo ai filesystem da montare e a quelli correntemente
1063 montati. Le funzioni servono a leggere il contenuto di questi file in
1064 opportune strutture \struct{fstab} e \struct{mntent}, e, per
1065 \conffile{/etc/mtab} per inserire e rimuovere le voci presenti nel file.
1066
1067 In generale si dovrebbero usare queste funzioni (in particolare quelle
1068 relative a \conffile{/etc/mtab}), quando si debba scrivere un programma che
1069 effettua il montaggio di un filesystem; in realtà in questi casi è molto più
1070 semplice invocare direttamente il programma \cmd{mount}, per cui ne
1071 tralasceremo la trattazione, rimandando al manuale delle \acr{glibc}
1072 \cite{glibc} per la documentazione completa.
1073
1074 % TODO scrivere relativamente alle varie funzioni (getfsent e getmntent &C)
1075 % TODO documentare swapon e swapoff (man 2 ...)
1076
1077
1078
1079
1080
1081 \section{La gestione di file e directory}
1082 \label{sec:file_dir}
1083
1084 Come già accennato in sez.~\ref{sec:file_filesystem} in un sistema unix-like
1085 la gestione dei file ha delle caratteristiche specifiche che derivano
1086 direttamente dall'architettura del sistema.  In questa sezione esamineremo le
1087 funzioni usate per la manipolazione di file e directory, per la creazione di
1088 link simbolici e diretti, per la gestione e la lettura delle directory.
1089
1090 In particolare ci soffermeremo sulle conseguenze che derivano
1091 dall'architettura dei filesystem illustrata nel capitolo precedente per quanto
1092 riguarda il comportamento e gli effetti delle varie funzioni.
1093
1094
1095 \subsection{Le funzioni \func{link} e \func{unlink}}
1096 \label{sec:file_link}
1097
1098 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
1099 dei nomi fittizi (come gli alias del vecchio MacOS o i collegamenti di Windows
1100 o i nomi logici del VMS) che permettono di fare riferimento allo stesso file
1101 chiamandolo con nomi diversi o accedendovi da directory diverse.
1102
1103 Questo è possibile anche in ambiente Unix, dove tali collegamenti sono
1104 usualmente chiamati \textit{link}; ma data l'architettura del sistema riguardo
1105 la gestione dei file ci sono due metodi sostanzialmente diversi per fare
1106 questa operazione.
1107
1108 Come spiegato in sez.~\ref{sec:file_filesystem} l'accesso al contenuto di un
1109 file su disco avviene passando attraverso il suo \itindex{inode}
1110 \textit{inode}, che è la struttura usata dal kernel che lo identifica
1111 univocamente all'interno di un singolo filesystem. Il nome del file che si
1112 trova nella voce di una directory è solo un'etichetta, mantenuta all'interno
1113 della directory, che viene associata ad un puntatore che fa riferimento al
1114 suddetto \textit{inode}.
1115
1116 Questo significa che, fintanto che si resta sullo stesso filesystem, la
1117 realizzazione di un link è immediata, ed uno stesso file può avere tanti nomi
1118 diversi, dati da altrettante associazioni diverse allo stesso \itindex{inode}
1119 \textit{inode} effettuate tramite ``etichette'' diverse in directory
1120 diverse. Si noti anche che nessuno di questi nomi viene ad assumere una
1121 particolare preferenza o originalità rispetto agli altri, in quanto tutti
1122 fanno comunque riferimento allo stesso \itindex{inode} \textit{inode}.
1123
1124 Per aggiungere ad una directory una voce che faccia riferimento ad un
1125 \itindex{inode} \textit{inode} già esistente si utilizza la funzione
1126 \func{link}; si suole chiamare questo tipo di associazione un collegamento
1127 diretto, o \textit{hard link}.  Il prototipo della funzione è il seguente:
1128 \begin{prototype}{unistd.h}
1129 {int link(const char *oldpath, const char *newpath)}
1130   Crea un nuovo collegamento diretto.
1131   
1132   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1133     errore nel qual caso \var{errno} viene impostata ai valori:
1134   \begin{errlist}
1135   \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
1136     riferimento ad un filesystem montato sullo stesso \itindex{mount~point}
1137     \textit{mount point}.
1138   \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
1139     \param{newpath} non supporta i link diretti o è una directory.
1140   \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
1141     esiste già.
1142   \item[\errcode{EMLINK}] ci sono troppi link al file \param{oldpath} (il
1143     numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
1144     sez.~\ref{sec:sys_limits}).
1145   \end{errlist}
1146   ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOTDIR},
1147   \errval{EFAULT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
1148   \errval{ENOSPC}, \errval{EIO}.}
1149 \end{prototype}
1150
1151 La funzione crea sul \itindex{pathname} \textit{pathname} \param{newpath} un
1152 collegamento diretto al file indicato da \param{oldpath}.  Per quanto detto la
1153 creazione di un nuovo collegamento diretto non copia il contenuto del file, ma
1154 si limita a creare una voce nella directory specificata da \param{newpath} e
1155 ad aumentare di uno il numero di riferimenti al file (riportato nel campo
1156 \var{st\_nlink} della struttura \struct{stat}, vedi sez.~\ref{sec:file_stat})
1157 aggiungendo il nuovo nome ai precedenti. Si noti che uno stesso file può
1158 essere così chiamato con vari nomi in diverse directory.
1159
1160 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
1161 collegamento diretto è possibile solo se entrambi i \itindex{pathname}
1162 \textit{pathname} sono nello stesso filesystem; inoltre il filesystem deve
1163 supportare i collegamenti diretti (il meccanismo non è disponibile ad esempio
1164 con il filesystem \acr{vfat} di Windows). In realtà la funzione ha un
1165 ulteriore requisito, e cioè che non solo che i due file siano sullo stesso
1166 filesystem, ma anche che si faccia riferimento ad essi sullo stesso
1167 \itindex{mount~point} \textit{mount point}.\footnote{si tenga presente infatti
1168   (vedi sez.~\ref{sec:sys_file_config}) che a partire dal kernel 2.4 uno
1169   stesso filesystem può essere montato più volte su directory diverse.}
1170
1171 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
1172 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
1173 l'amministratore è in grado di creare un collegamento diretto ad un'altra
1174 directory: questo viene fatto perché con una tale operazione è possibile
1175 creare dei \textit{loop} nel filesystem (vedi l'esempio mostrato in
1176 sez.~\ref{sec:file_symlink}, dove riprenderemo il discorso) che molti programmi
1177 non sono in grado di gestire e la cui rimozione diventerebbe estremamente
1178 complicata (in genere per questo tipo di errori occorre far girare il
1179 programma \cmd{fsck} per riparare il filesystem).
1180
1181 Data la pericolosità di questa operazione e la disponibilità dei link
1182 simbolici (che vedremo in sez.~\ref{sec:file_symlink}) e dei
1183 \itindex{bind~mount} \textit{bind mount} (già visti in
1184 sez.~\ref{sec:sys_file_config}) che possono fornire la stessa funzionalità
1185 senza questi problemi, nel caso di Linux questa capacità è stata completamente
1186 disabilitata, e al tentativo di creare un link diretto ad una directory la
1187 funzione \func{link} restituisce l'errore \errcode{EPERM}.
1188
1189 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
1190 \textit{hard link} ad un link simbolico. In questo caso lo standard POSIX
1191 prevederebbe che quest'ultimo venga risolto e che il collegamento sia
1192 effettuato rispetto al file cui esso punta, e che venga riportato un errore
1193 qualora questo non esista o non sia un file. Questo era anche il comportamento
1194 iniziale di Linux ma a partire dai kernel della serie 2.0.x\footnote{per la
1195   precisione il comportamento era quello previsto dallo standard POSIX fino al
1196   kernel di sviluppo 1.3.56, ed è stato temporaneamente ripristinato anche
1197   durante lo sviluppo della serie 2.1.x, per poi tornare al comportamento
1198   attuale fino ad oggi (per riferimento si veda
1199   \url{http://lwn.net/Articles/293902}).} è stato adottato un comportamento
1200 che non segue più lo standard per cui l'\textit{hard link} viene creato
1201 rispetto al link simbolico, e non al file cui questo punta.
1202
1203 La ragione di questa differenza rispetto allo standard, presente anche in
1204 altri sistemi unix-like, sono dovute al fatto che un link simbolico può fare
1205 riferimento anche ad un file non esistente o a una directory, per i quali
1206 l'\textit{hard link} non può essere creato, per cui la scelta di seguire il
1207 link simbolico è stata ritenuta una scelta scorretta nella progettazione
1208 dell'interfaccia.  Infatti se non ci fosse il comportamento adottato da Linux
1209 sarebbe impossibile creare un \textit{hard link} ad un link simbolico, perché
1210 la funzione lo risolverebbe e l'\textit{hard link} verrebbe creato verso la
1211 destinazione. Invece evitando di seguire lo standard l'operazione diventa
1212 possibile, ed anche il comportamento della funzione risulta molto più
1213 comprensibile. Tanto più che se proprio se si vuole creare un \textit{hard
1214   link} rispetto alla destinazione di un link simbolico è sempre possibile
1215 farlo direttamente.\footnote{ciò non toglie che questo comportamento fuori
1216   standard possa causare problemi, come nell'esempio descritto nell'articolo
1217   citato nella nota precedente, a programmi che non si aspettano questa
1218   differenza rispetto allo standard POSIX.}
1219
1220 La rimozione di un file (o più precisamente della voce che lo referenzia
1221 all'interno di una directory) si effettua con la funzione \funcd{unlink}; il
1222 suo prototipo è il seguente:
1223 \begin{prototype}{unistd.h}{int unlink(const char *pathname)}
1224
1225   Cancella un file.
1226   
1227   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1228     errore, nel qual caso il file non viene toccato. La variabile
1229     \var{errno} viene impostata secondo i seguenti codici di errore:
1230   \begin{errlist}
1231   \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una directory.
1232     \footnotemark
1233   \item[\errcode{EROFS}] \param{pathname} è su un filesystem montato in sola
1234   lettura.
1235   \item[\errcode{EISDIR}] \param{pathname} fa riferimento a una directory.
1236   \end{errlist}
1237   ed inoltre: \errval{EACCES}, \errval{EFAULT}, \errval{ENOENT},
1238   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
1239   \errval{EIO}.}
1240 \end{prototype}
1241
1242 \footnotetext{questo è un valore specifico ritornato da Linux che non consente
1243   l'uso di \func{unlink} con le directory (vedi sez.~\ref{sec:file_remove}).
1244   Non è conforme allo standard POSIX, che prescrive invece l'uso di
1245   \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
1246   abbia privilegi sufficienti.}
1247
1248 La funzione cancella il nome specificato da \param{pathname} nella relativa
1249 directory e decrementa il numero di riferimenti nel relativo \itindex{inode}
1250 \textit{inode}. Nel caso di link simbolico cancella il link simbolico; nel
1251 caso di socket, fifo o file di dispositivo \index{file!di~dispositivo} rimuove
1252 il nome, ma come per i file i processi che hanno aperto uno di questi oggetti
1253 possono continuare ad utilizzarlo.
1254
1255 Per cancellare una voce in una directory è necessario avere il permesso di
1256 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
1257 il diritto di esecuzione sulla directory che la contiene (affronteremo in
1258 dettaglio l'argomento dei permessi di file e directory in
1259 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
1260 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
1261 occorrerà anche essere proprietari del file o proprietari della directory (o
1262 root, per cui nessuna delle restrizioni è applicata).
1263
1264 Una delle caratteristiche di queste funzioni è che la creazione/rimozione del
1265 nome dalla directory e l'incremento/decremento del numero di riferimenti
1266 \itindex{inode} nell'\textit{inode} devono essere effettuati in maniera
1267 atomica (si veda sez.~\ref{sec:proc_atom_oper}) senza possibili interruzioni
1268 fra le due operazioni. Per questo entrambe queste funzioni sono realizzate
1269 tramite una singola system call.
1270
1271 Si ricordi infine che un file non viene eliminato dal disco fintanto che tutti
1272 i riferimenti ad esso sono stati cancellati: solo quando il \textit{link
1273   count} mantenuto \itindex{inode} nell'\textit{inode} diventa zero lo spazio
1274 occupato su disco viene rimosso (si ricordi comunque che a questo si aggiunge
1275 sempre un'ulteriore condizione,\footnote{come vedremo in
1276   cap.~\ref{cha:file_unix_interface} il kernel mantiene anche una tabella dei
1277   file aperti nei vari processi, che a sua volta contiene i riferimenti agli
1278   \itindex{inode} \textit{inode} ad essi relativi. Prima di procedere alla
1279   cancellazione dello spazio occupato su disco dal contenuto di un file il
1280   kernel controlla anche questa tabella, per verificare che anche in essa non
1281   ci sia più nessun riferimento all'\textit{inode} in questione.} e cioè che
1282 non ci siano processi che abbiano il suddetto file aperto).
1283
1284 Questa proprietà viene spesso usata per essere sicuri di non lasciare file
1285 temporanei su disco in caso di crash dei programmi; la tecnica è quella di
1286 aprire il file e chiamare \func{unlink} subito dopo, in questo modo il
1287 contenuto del file è sempre disponibile all'interno del processo attraverso il
1288 suo file descriptor (vedi sez.~\ref{sec:file_fd}) fintanto che il processo non
1289 chiude il file, ma non ne resta traccia in nessuna directory, e lo spazio
1290 occupato su disco viene immediatamente rilasciato alla conclusione del
1291 processo (quando tutti i file vengono chiusi).
1292
1293
1294 \subsection{Le funzioni \func{remove} e \func{rename}}
1295 \label{sec:file_remove}
1296
1297 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
1298 \func{unlink} sulle directory; per cancellare una directory si può usare la
1299 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}), oppure la
1300 funzione \funcd{remove}. 
1301
1302 Questa è la funzione prevista dallo standard ANSI C per cancellare un file o
1303 una directory (e funziona anche per i sistemi che non supportano i link
1304 diretti). Per i file è identica a \func{unlink} e per le directory è identica
1305 a \func{rmdir}; il suo prototipo è:
1306 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
1307   Cancella un nome dal filesystem. 
1308   
1309   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1310     errore, nel qual caso il file non viene toccato.
1311     
1312     I codici di errore riportati in \var{errno} sono quelli della chiamata
1313     utilizzata, pertanto si può fare riferimento a quanto illustrato nelle
1314     descrizioni di \func{unlink} e \func{rmdir}.}
1315 \end{prototype}
1316
1317 La funzione utilizza la funzione \func{unlink}\footnote{questo vale usando le
1318   \acr{glibc}; nelle libc4 e nelle libc5 la funzione \func{remove} è un
1319   semplice alias alla funzione \func{unlink} e quindi non può essere usata per
1320   le directory.} per cancellare i file e la funzione \func{rmdir} per
1321 cancellare le directory; si tenga presente che per alcune implementazioni del
1322 protocollo NFS utilizzare questa funzione può comportare la scomparsa di file
1323 ancora in uso.
1324
1325 Per cambiare nome ad un file o a una directory (che devono comunque essere
1326 nello stesso filesystem) si usa invece la funzione \funcd{rename},\footnote{la
1327   funzione è definita dallo standard ANSI C, ma si applica solo per i file, lo
1328   standard POSIX estende la funzione anche alle directory.} il cui prototipo
1329 è:
1330 \begin{prototype}{stdio.h}
1331   {int rename(const char *oldpath, const char *newpath)} 
1332   
1333   Rinomina un file.
1334   
1335   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1336     errore, nel qual caso il file non viene toccato. La variabile
1337     \var{errno} viene impostata secondo i seguenti codici di errore:
1338   \begin{errlist} 
1339   \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
1340     \param{oldpath} non è una directory.
1341   \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
1342     stesso filesystem.
1343   \item[\errcode{ENOTEMPTY}] \param{newpath} è una directory già esistente e
1344     non vuota.
1345   \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
1346     parte di qualche processo (come directory di lavoro o come radice) o del
1347     sistema (come \itindex{mount~point} \textit{mount point}).
1348   \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
1349     \param{oldpath} o più in generale si è cercato di creare una directory come
1350     sotto-directory di se stessa.
1351   \item[\errcode{ENOTDIR}] uno dei componenti dei \itindex{pathname}
1352     \textit{pathname} non è una directory o \param{oldpath} è una directory e
1353     \param{newpath} esiste e non è una directory.
1354   \end{errlist} 
1355   ed inoltre \errval{EACCES}, \errval{EPERM}, \errval{EMLINK},
1356   \errval{ENOENT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP} e
1357   \errval{ENOSPC}.}
1358 \end{prototype}
1359
1360 La funzione rinomina il file \param{oldpath} in \param{newpath}, eseguendo se
1361 necessario lo spostamento di un file fra directory diverse. Eventuali altri
1362 link diretti allo stesso file non vengono influenzati.
1363
1364 Il comportamento della funzione è diverso a seconda che si voglia rinominare
1365 un file o una directory; se ci riferisce ad un file allora \param{newpath}, se
1366 esiste, non deve essere una directory (altrimenti si ha l'errore
1367 \errcode{EISDIR}). Nel caso \param{newpath} indichi un file esistente questo
1368 viene cancellato e rimpiazzato (atomicamente).
1369
1370 Se \param{oldpath} è una directory allora \param{newpath}, se esiste, deve
1371 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
1372 (se non è una directory) o \errcode{ENOTEMPTY} (se non è vuota). Chiaramente
1373 \param{newpath} non può contenere \param{oldpath} altrimenti si avrà un errore
1374 \errcode{EINVAL}.
1375
1376 Se \param{oldpath} si riferisce ad un link simbolico questo sarà rinominato; se
1377 \param{newpath} è un link simbolico verrà cancellato come qualunque altro
1378 file.  Infine qualora \param{oldpath} e \param{newpath} siano due nomi dello
1379 stesso file lo standard POSIX prevede che la funzione non dia errore, e non
1380 faccia nulla, lasciando entrambi i nomi; Linux segue questo standard, anche
1381 se, come fatto notare dal manuale delle \textit{glibc}, il comportamento più
1382 ragionevole sarebbe quello di cancellare \param{oldpath}.
1383
1384 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
1385 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
1386 può esistere cioè nessun istante in cui un altro processo può trovare attivi
1387 entrambi i nomi dello stesso file, o, in caso di sostituzione di un file
1388 esistente, non trovare quest'ultimo prima che la sostituzione sia stata
1389 eseguita.
1390
1391 In ogni caso se \param{newpath} esiste e l'operazione fallisce per un qualche
1392 motivo (come un crash del kernel), \func{rename} garantisce di lasciare
1393 presente un'istanza di \param{newpath}. Tuttavia nella sovrascrittura potrà
1394 esistere una finestra in cui sia \param{oldpath} che \param{newpath} fanno
1395 riferimento allo stesso file.
1396
1397
1398 \subsection{I link simbolici}
1399 \label{sec:file_symlink}
1400
1401 Come abbiamo visto in sez.~\ref{sec:file_link} la funzione \func{link} crea
1402 riferimenti agli \itindex{inode} \textit{inode}, pertanto può funzionare
1403 soltanto per file che risiedono sullo stesso filesystem e solo per un
1404 filesystem di tipo Unix.  Inoltre abbiamo visto che in Linux non è consentito
1405 eseguire un link diretto ad una directory.
1406
1407 Per ovviare a queste limitazioni i sistemi Unix supportano un'altra forma di
1408 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
1409 come avviene in altri sistemi operativi, dei file speciali che contengono
1410 semplicemente il riferimento ad un altro file (o directory). In questo modo è
1411 possibile effettuare link anche attraverso filesystem diversi, a file posti in
1412 filesystem che non supportano i link diretti, a delle directory, ed anche a
1413 file che non esistono ancora.
1414
1415 Il sistema funziona in quanto i link simbolici sono riconosciuti come tali dal
1416 kernel\footnote{è uno dei diversi tipi di file visti in
1417   tab.~\ref{tab:file_file_types}, contrassegnato come tale
1418   nell'\textit{inode}, e riconoscibile dal valore del campo \var{st\_mode}
1419   della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).}  per cui
1420 alcune funzioni di libreria (come \func{open} o \func{stat}) quando ricevono
1421 come argomento un link simbolico vengono automaticamente applicate al file da
1422 esso specificato.  La funzione che permette di creare un nuovo link simbolico
1423 è \funcd{symlink}, ed il suo prototipo è:
1424 \begin{prototype}{unistd.h}
1425   {int symlink(const char *oldpath, const char *newpath)} 
1426   Crea un nuovo link simbolico di nome \param{newpath} il cui contenuto è
1427   \param{oldpath}.
1428   
1429   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1430     errore, nel qual caso la variabile \var{errno} assumerà i valori:
1431   \begin{errlist}
1432   \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
1433     supporta i link simbolici.
1434   \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
1435     \param{oldpath} è una stringa vuota.
1436   \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
1437   \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
1438     lettura.
1439   \end{errlist}
1440   ed inoltre \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
1441   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{ENOSPC} e
1442   \errval{EIO}.}
1443 \end{prototype}
1444
1445 Si tenga presente che la funzione non effettua nessun controllo sull'esistenza
1446 di un file di nome \param{oldpath}, ma si limita ad inserire quella stringa
1447 nel link simbolico. Pertanto un link simbolico può anche riferirsi ad un file
1448 che non esiste: in questo caso si ha quello che viene chiamato un
1449 \textit{dangling link}, letteralmente un \textsl{link ciondolante}.
1450
1451 Come accennato i link simbolici sono risolti automaticamente dal kernel
1452 all'invocazione delle varie system call; in tab.~\ref{tab:file_symb_effect} si
1453 è riportato un elenco dei comportamenti delle varie funzioni di libreria che
1454 operano sui file nei confronti della risoluzione dei link simbolici,
1455 specificando quali seguono il link simbolico e quali invece possono operare
1456 direttamente sul suo contenuto.
1457 \begin{table}[htb]
1458   \centering
1459   \footnotesize
1460   \begin{tabular}[c]{|l|c|c|}
1461     \hline
1462     \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
1463     \hline 
1464     \hline 
1465     \func{access}   & $\bullet$ & --        \\
1466     \func{chdir}    & $\bullet$ & --        \\
1467     \func{chmod}    & $\bullet$ & --        \\
1468     \func{chown}    & --        & $\bullet$ \\
1469     \func{creat}    & $\bullet$ & --        \\
1470     \func{exec}     & $\bullet$ & --        \\
1471     \func{lchown}   & $\bullet$ & --        \\
1472     \func{link}\footnotemark & --        & $\bullet$ \\
1473     \func{lstat}    & --        & $\bullet$ \\
1474     \func{mkdir}    & $\bullet$ & --        \\
1475     \func{mkfifo}   & $\bullet$ & --        \\
1476     \func{mknod}    & $\bullet$ & --        \\
1477     \func{open}     & $\bullet$ & --        \\
1478     \func{opendir}  & $\bullet$ & --        \\
1479     \func{pathconf} & $\bullet$ & --        \\
1480     \func{readlink} & --        & $\bullet$ \\
1481     \func{remove}   & --        & $\bullet$ \\
1482     \func{rename}   & --        & $\bullet$ \\
1483     \func{stat}     & $\bullet$ & --        \\
1484     \func{truncate} & $\bullet$ & --        \\
1485     \func{unlink}   & --        & $\bullet$ \\
1486     \hline 
1487   \end{tabular}
1488   \caption{Uso dei link simbolici da parte di alcune funzioni.}
1489   \label{tab:file_symb_effect}
1490 \end{table}
1491
1492 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
1493   dallo standard POSIX, si veda quanto detto in sez.~\ref{sec:file_link}.}
1494
1495 Si noti che non si è specificato il comportamento delle funzioni che operano
1496 con i file descriptor, in quanto la risoluzione del link simbolico viene in
1497 genere effettuata dalla funzione che restituisce il file descriptor
1498 (normalmente la \func{open}, vedi sez.~\ref{sec:file_open}) e tutte le
1499 operazioni seguenti fanno riferimento solo a quest'ultimo.
1500
1501 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
1502 \func{open} seguono i link simbolici, occorrono funzioni apposite per accedere
1503 alle informazioni del link invece che a quelle del file a cui esso fa
1504 riferimento. Quando si vuole leggere il contenuto di un link simbolico si usa
1505 la funzione \funcd{readlink}, il cui prototipo è:
1506 \begin{prototype}{unistd.h}
1507 {int readlink(const char *path, char *buff, size\_t size)} 
1508   Legge il contenuto del link simbolico indicato da \param{path} nel buffer
1509   \param{buff} di dimensione \param{size}.
1510   
1511   \bodydesc{La funzione restituisce il numero di caratteri letti dentro
1512     \param{buff} o -1 per un errore, nel qual caso la variabile
1513     \var{errno} assumerà i valori:
1514   \begin{errlist}
1515   \item[\errcode{EINVAL}] \param{path} non è un link simbolico o \param{size}
1516     non è positiva.
1517   \end{errlist}
1518   ed inoltre \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1519   \errval{EACCES}, \errval{ELOOP}, \errval{EIO}, \errval{EFAULT} e
1520   \errval{ENOMEM}.}
1521 \end{prototype}
1522
1523 La funzione apre il link simbolico, ne legge il contenuto, lo scrive nel
1524 buffer, e lo richiude. Si tenga presente che la funzione non termina la
1525 stringa con un carattere nullo e la tronca alla dimensione specificata da
1526 \param{size} per evitare di sovrascrivere oltre le dimensioni del buffer.
1527
1528 \begin{figure}[htb]
1529   \centering
1530   \includegraphics[width=8.5cm]{img/link_loop}
1531   \caption{Esempio di loop nel filesystem creato con un link simbolico.}
1532   \label{fig:file_link_loop}
1533 \end{figure}
1534
1535 Un caso comune che si può avere con i link simbolici è la creazione dei
1536 cosiddetti \textit{loop}. La situazione è illustrata in
1537 fig.~\ref{fig:file_link_loop}, che riporta la struttura della directory
1538 \file{/boot}. Come si vede si è creato al suo interno un link simbolico che
1539 punta di nuovo a \file{/boot}.\footnote{il loop mostrato in
1540   fig.~\ref{fig:file_link_loop} è un usato per poter permettere a \cmd{grub}
1541   (un bootloader in grado di leggere direttamente da vari filesystem il file
1542   da lanciare come sistema operativo) di vedere i file contenuti nella
1543   directory \file{/boot} con lo stesso \textit{pathname} con cui verrebbero
1544   visti dal sistema operativo, anche se essi si trovano, come accade spesso,
1545   su una partizione separata (che \cmd{grub}, all'avvio, vede come radice).}
1546
1547 Questo può causare problemi per tutti quei programmi che effettuano la
1548 scansione di una directory senza tener conto dei link simbolici, ad esempio se
1549 lanciassimo un comando del tipo \code{grep -r linux *}, il loop nella
1550 directory porterebbe il comando ad esaminare \file{/boot}, \file{/boot/boot},
1551 \file{/boot/boot/boot} e così via.
1552
1553 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
1554 un \itindex{pathname} \textit{pathname} possano essere seguiti un numero
1555 limitato di link simbolici, il cui valore limite è specificato dalla costante
1556 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
1557 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}.
1558
1559 Un punto da tenere sempre presente è che, come abbiamo accennato, un link
1560 simbolico può fare riferimento anche ad un file che non esiste; ad esempio
1561 possiamo creare un file temporaneo nella nostra directory con un link del
1562 tipo:
1563 \begin{verbatim}
1564 $ ln -s /tmp/tmp_file temporaneo
1565 \end{verbatim}%$
1566 anche se \file{/tmp/tmp\_file} non esiste. Questo può generare confusione, in
1567 quanto aprendo in scrittura \file{temporaneo} verrà creato
1568 \file{/tmp/tmp\_file} e scritto; ma accedendo in sola lettura a
1569 \file{temporaneo}, ad esempio con \cmd{cat}, otterremmo:
1570 \begin{verbatim}
1571 $ cat temporaneo
1572 cat: temporaneo: No such file or directory
1573 \end{verbatim}%$
1574 con un errore che può sembrare sbagliato, dato che un'ispezione con \cmd{ls}
1575 ci mostrerebbe invece l'esistenza di \file{temporaneo}.
1576
1577
1578 \subsection{La creazione e la cancellazione delle directory} 
1579 \label{sec:file_dir_creat_rem}
1580
1581 Benché in sostanza le directory non siano altro che dei file contenenti
1582 elenchi di nomi ed \itindex{inode} \textit{inode}, non è possibile trattarle
1583 come file ordinari e devono essere create direttamente dal kernel attraverso
1584 una opportuna system call.\footnote{questo è quello che permette anche,
1585   attraverso l'uso del VFS, l'utilizzo di diversi formati per la gestione dei
1586   suddetti elenchi, dalle semplici liste a strutture complesse come alberi
1587   binari, hash, ecc. che consentono una ricerca veloce quando il numero di
1588   file è molto grande.}  La funzione usata per creare una directory è
1589 \funcd{mkdir}, ed il suo prototipo è:
1590 \begin{functions}
1591   \headdecl{sys/stat.h}
1592   \headdecl{sys/types.h}
1593   \funcdecl{int mkdir(const char *dirname, mode\_t mode)} 
1594
1595   Crea una nuova directory.
1596   
1597   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1598     errore, nel qual caso \var{errno} assumerà i valori:
1599   \begin{errlist}
1600   \item[\errcode{EEXIST}] un file (o una directory) con quel nome esiste di
1601     già.
1602   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
1603     cui si vuole inserire la nuova directory.
1604   \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
1605     directory contiene troppi file; sotto Linux questo normalmente non avviene
1606     perché il filesystem standard consente la creazione di un numero di file
1607     maggiore di quelli che possono essere contenuti nel disco, ma potendo
1608     avere a che fare anche con filesystem di altri sistemi questo errore può
1609     presentarsi.
1610   \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
1611     la nuova directory o si è esaurita la quota disco dell'utente.
1612   \end{errlist}
1613   ed inoltre anche \errval{EPERM}, \errval{EFAULT}, \errval{ENAMETOOLONG},
1614   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1615   \errval{EROFS}.}
1616 \end{functions}
1617
1618 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
1619 standard presenti in ogni directory (cioè ``\file{.}'' e ``\file{..}''), con
1620 il nome indicato dall'argomento \param{dirname}. Il nome può essere indicato
1621 sia come \itindex{pathname} \textit{pathname} assoluto che come
1622 \itindex{pathname} \textit{pathname} relativo.
1623
1624 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
1625 directory viene creata sono specificati dall'argomento \param{mode}, i cui
1626 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
1627 tenga presente che questi sono modificati dalla maschera di creazione dei file
1628 (si veda sez.~\ref{sec:file_perm_management}).  La titolarità della nuova
1629 directory è impostata secondo quanto riportato in
1630 sez.~\ref{sec:file_ownership_management}.
1631
1632 La funzione che permette la cancellazione di una directory è invece
1633 \funcd{rmdir}, ed il suo prototipo è:
1634 \begin{prototype}{sys/stat.h}{int rmdir(const char *dirname)} 
1635   Cancella una directory.
1636
1637   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1638     errore, nel qual caso \var{errno} assumerà i valori:
1639   \begin{errlist}
1640   \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
1641     directory, oppure la directory che contiene \param{dirname} ha lo
1642     \itindex{sticky~bit} \textit{sticky bit} impostato e l'\ids{UID} effettivo
1643     del processo non corrisponde al proprietario della directory.
1644   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
1645     che contiene la directory che si vuole cancellare, o non c'è il permesso
1646     di attraversare (esecuzione) una delle directory specificate in
1647     \param{dirname}.
1648   \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o la
1649     radice di qualche processo.
1650   \item[\errcode{ENOTEMPTY}] la directory non è vuota.
1651   \end{errlist}
1652   ed inoltre anche \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1653   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{EROFS}.}
1654 \end{prototype}
1655
1656 La funzione cancella la directory \param{dirname}, che deve essere vuota (la
1657 directory deve cioè contenere soltanto le due voci standard ``\file{.}'' e
1658 ``\file{..}'').  Il nome può essere indicato con il \itindex{pathname}
1659 \textit{pathname} assoluto o relativo.
1660
1661 La modalità con cui avviene la cancellazione è analoga a quella di
1662 \func{unlink}: fintanto che il numero di link \itindex{inode}
1663 all'\textit{inode} della directory non diventa nullo e nessun processo ha la
1664 directory aperta lo spazio occupato su disco non viene rilasciato. Se un
1665 processo ha la directory aperta la funzione rimuove il link \itindex{inode}
1666 all'\textit{inode} e nel caso sia l'ultimo, pure le voci standard ``\file{.}''
1667 e ``\file{..}'', a questo punto il kernel non consentirà di creare più nuovi
1668 file nella directory.
1669
1670
1671 \subsection{La creazione di file speciali}
1672 \label{sec:file_mknod}
1673
1674 \index{file!di~dispositivo|(} 
1675
1676 Finora abbiamo parlato esclusivamente di file, directory e link simbolici; in
1677 sez.~\ref{sec:file_file_types} abbiamo visto però che il sistema prevede pure
1678 degli altri tipi di file speciali, come i file di dispositivo, le fifo ed i
1679 socket (questi ultimi sono un caso a parte, essendo associati anche alla
1680 comunicazione via rete, per cui ci saranno trattati in dettaglio a partire da
1681 cap.~\ref{cha:socket_intro}).
1682
1683 La manipolazione delle caratteristiche di questi diversi tipi di file e la
1684 loro cancellazione può essere effettuata con le stesse funzioni che operano
1685 sui file regolari; ma quando li si devono creare sono necessarie delle
1686 funzioni apposite. La prima di queste funzioni è \funcd{mknod}, il cui
1687 prototipo è:
1688 \begin{functions}
1689   \headdecl{sys/types.h}
1690   \headdecl{sys/stat.h}
1691   \headdecl{fcntl.h}
1692   \headdecl{unistd.h}
1693   \funcdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)} 
1694   
1695   Crea un \textit{inode} del tipo specificato sul filesystem.
1696   
1697   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1698     errore, nel qual caso \var{errno} assumerà i valori:
1699   \begin{errlist}
1700   \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
1701     l'\texttt{inode}, o il filesystem su cui si è cercato di
1702     creare \param{pathname} non supporta l'operazione.
1703   \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
1704     fifo, un socket o un dispositivo.
1705   \item[\errcode{EEXIST}] \param{pathname} esiste già o è un link simbolico.
1706   \end{errlist}
1707   ed inoltre anche \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
1708   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1709   \errval{ENOSPC}, \errval{EROFS}.}
1710 \end{functions}
1711
1712 La funzione, come suggerisce il nome, permette di creare un ``\textsl{nodo}''
1713 sul filesystem, e viene in genere utilizzata per creare i file di dispositivo,
1714 ma si può usare anche per creare file regolari. L'argomento
1715 \param{mode} specifica sia il tipo di file che si vuole creare che i relativi
1716 permessi, secondo i valori riportati in tab.~\ref{tab:file_mode_flags}, che
1717 vanno combinati con un OR binario. I permessi sono comunque modificati nella
1718 maniera usuale dal valore di \itindex{umask} \textit{umask} (si veda
1719 sez.~\ref{sec:file_perm_management}).
1720
1721 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
1722 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
1723 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
1724 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
1725 per una fifo;\footnote{con Linux la funzione non può essere usata per creare
1726   directory o link simbolici, si dovranno usare le funzioni \func{mkdir} e
1727   \func{symlink} a questo dedicate.} un valore diverso comporterà l'errore
1728 \errcode{EINVAL}.  
1729
1730 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
1731 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
1732 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
1733 valore verrà ignorato.  Solo l'amministratore può creare un file di
1734 dispositivo usando questa funzione (il processo deve avere la
1735 \itindex{capabilities} \textit{capability} \const{CAP\_MKNOD}), ma in
1736 Linux\footnote{questo è un comportamento specifico di Linux, la funzione non è
1737   prevista dallo standard POSIX.1 originale, mentre è presente in SVr4 e
1738   4.4BSD, ma esistono differenze nei comportamenti e nei codici di errore,
1739   tanto che questa è stata introdotta in POSIX.1-2001 con una nota che la
1740   definisce portabile solo quando viene usata per creare delle fifo, ma
1741   comunque deprecata essendo utilizzabile a tale scopo la specifica
1742   \func{mkfifo}.} l'uso per la creazione di un file ordinario, di una fifo o
1743 di un socket è consentito anche agli utenti normali.
1744
1745 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
1746 al proprietario e al gruppo del processo che li ha creati, a meno che non si
1747 sia attivato il bit \acr{sgid} per la directory o sia stata attivata la
1748 semantica BSD per il filesystem (si veda
1749 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
1750 \itindex{inode} l'\textit{inode}.
1751
1752 Nella creazione di un file di dispositivo occorre poi specificare
1753 correttamente il valore di \param{dev}; questo infatti è di tipo
1754 \type{dev\_t}, che è un tipo primitivo (vedi
1755 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
1756 \textsl{numero} di dispositivo; il kernel infatti identifica ciascun
1757 dispositivo con un valore numerico. Originariamente questo era un intero a 16
1758 bit diviso in due parti di 8 bit chiamate rispettivamente
1759 \itindex{major~number} \textit{major number} e \itindex{minor~number}
1760 \textit{minor number}, che sono poi i due numeri mostrati dal comando
1761 \texttt{ls -l} al posto della dimensione quando lo si esegue su un file di
1762 dispositivo.
1763
1764 Il \itindex{major~number} \textit{major number} identifica una classe di
1765 dispositivi (ad esempio la seriale, o i dischi IDE) e serve in sostanza per
1766 indicare al kernel quale è il modulo che gestisce quella classe di
1767 dispositivi; per identificare uno specifico dispositivo di quella classe (ad
1768 esempio una singola porta seriale, o una partizione di un disco) si usa invece
1769 il \itindex{minor~number} \textit{minor number}. L'elenco aggiornato di questi
1770 numeri con le relative corrispondenze ai vari dispositivi può essere trovato
1771 nel file \texttt{Documentation/devices.txt} allegato alla documentazione dei
1772 sorgenti del kernel.
1773
1774 Data la crescita nel numero di dispositivi supportati, ben presto il limite
1775 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
1776 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
1777 \type{dev\_t}, con delle dimensioni passate a 12 bit per il
1778 \itindex{major~number} \textit{major number} e 20 bit per il
1779 \itindex{minor~number} \textit{minor number}. La transizione però ha anche
1780 comportato il passaggio di \type{dev\_t} a \index{tipo!opaco} tipo opaco, e la
1781 necessità di specificare il numero tramite delle opportune macro, così da non
1782 avere problemi di compatibilità con eventuali ulteriori estensioni.
1783
1784 Le macro sono definite nel file \file{sys/sysmacros.h}, che viene
1785 automaticamente incluso quando si include \file{sys/types.h}; si possono
1786 pertanto ottenere i valori del \itindex{major~number} \textit{major number} e
1787 \itindex{minor~number} \textit{minor number} di un dispositivo rispettivamente
1788 con le macro \macro{major} e \macro{minor}:
1789 \begin{functions}
1790   \headdecl{sys/types.h}
1791   \funcdecl{int \macro{major}(dev\_t dev)}
1792   Restituisce il \itindex{major~number} \textit{major number} del dispositivo
1793   \param{dev}.
1794   
1795   \funcdecl{int \macro{minor}(dev\_t dev)}
1796   Restituisce il \itindex{minor~number} \textit{minor number} del dispositivo
1797   \param{dev}.
1798 \end{functions}
1799 \noindent mentre una volta che siano noti \itindex{major~number} \textit{major
1800   number} e \itindex{minor~number} \textit{minor number} si potrà costruire il
1801 relativo identificativo con la macro \macro{makedev}:
1802 \begin{functions}
1803   \headdecl{sys/types.h}
1804   \funcdecl{dev\_t \macro{minor}(int major, int minor)}
1805
1806   Restituisce l'identificativo di un dispositivo dati \itindex{major~number}
1807   \textit{major number} e \itindex{minor~number} \textit{minor number}.
1808 \end{functions}
1809
1810 \index{file!di~dispositivo|)}
1811
1812 Infine con lo standard POSIX.1-2001 è stata introdotta una funzione specifica
1813 per creare una fifo (tratteremo le fifo in in sez.~\ref{sec:ipc_named_pipe});
1814 la funzione è \funcd{mkfifo} ed il suo prototipo è:
1815 \begin{functions}
1816   \headdecl{sys/types.h} \headdecl{sys/stat.h} 
1817   
1818   \funcdecl{int mkfifo(const char *pathname, mode\_t mode)} 
1819   
1820   Crea una fifo.
1821   
1822   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1823     errore, nel qual caso \var{errno} assumerà i valori \errval{EACCES},
1824     \errval{EEXIST}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC},
1825     \errval{ENOTDIR} e \errval{EROFS}.}
1826 \end{functions}
1827
1828 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
1829 per \func{mknod} il file \param{pathname} non deve esistere (neanche come link
1830 simbolico); al solito i permessi specificati da \param{mode} vengono
1831 modificati dal valore di \itindex{umask} \textit{umask}.
1832
1833
1834
1835 \subsection{Accesso alle directory}
1836 \label{sec:file_dir_read}
1837
1838 Benché le directory alla fine non siano altro che dei file che contengono
1839 delle liste di nomi ed \itindex{inode} \textit{inode}, per il ruolo che
1840 rivestono nella struttura del sistema, non possono essere trattate come dei
1841 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
1842 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
1843 può essere un processo a inserirvi direttamente delle voci con le usuali
1844 funzioni di scrittura.
1845
1846 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
1847 kernel, sono molte le situazioni in cui i processi necessitano di poterne
1848 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
1849 in sez.~\ref{sec:file_open} che è possibile aprire una directory come se fosse
1850 un file, anche se solo in sola lettura) in generale il formato con cui esse
1851 sono scritte può dipendere dal tipo di filesystem, tanto che, come riportato
1852 in tab.~\ref{tab:file_file_operations}, il VFS del kernel prevede una apposita
1853 funzione per la lettura delle directory.
1854
1855 Tutto questo si riflette nello standard POSIX\footnote{le funzioni erano
1856   presenti in SVr4 e 4.3BSD, la loro specifica è riportata in POSIX.1-2001.}
1857 che ha introdotto una apposita interfaccia per la lettura delle directory,
1858 basata sui cosiddetti \textit{directory stream} (chiamati così per l'analogia
1859 con i file stream dell'interfaccia standard ANSI C di
1860 cap.~\ref{cha:files_std_interface}). La prima funzione di questa interfaccia è
1861 \funcd{opendir}, il cui prototipo è:
1862 \begin{functions}
1863   \headdecl{sys/types.h} \headdecl{dirent.h} 
1864   
1865   \funcdecl{DIR * opendir(const char *dirname)} 
1866   
1867   Apre un \textit{directory stream}.
1868   
1869   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
1870     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
1871     assumerà i valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
1872     \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}.}
1873 \end{functions}
1874
1875 La funzione apre un \textit{directory stream} per la directory
1876 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
1877 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
1878 \textit{directory stream}) da usare per tutte le operazioni successive, la
1879 funzione inoltre posiziona lo stream sulla prima voce contenuta nella
1880 directory. 
1881
1882 Si tenga presente che comunque la funzione opera associando il
1883 \textit{directory stream} ad un opportuno file descriptor sottostante, sul
1884 quale vengono compiute le operazioni. Questo viene sempre aperto impostando il
1885 flag di \itindex{close-on-exec} \textit{close-on-exec}, così da evitare che
1886 resti aperto in caso di esecuzione di un altro programma.
1887
1888 Nel caso in cui sia necessario conoscere il \textit{file descriptor} associato
1889 ad un \textit{directory stream} si può usare la funzione
1890 \funcd{dirfd},\footnote{questa funzione è una estensione introdotta con BSD
1891   4.3-Reno ed è presente in Linux con le libc5 (a partire dalla versione
1892   5.1.2) e con le \acr{glibc} ma non presente in POSIX fino alla revisione
1893   POSIX.1-2008, per questo per poterla utilizzare fino alla versione 2.10
1894   delle \acr{glibc} era necessario definire le macro \macro{\_BSD\_SOURCE} o
1895   \macro{\_SVID\_SOURCE}, dalla versione 2.10 si possono usare anche
1896   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o
1897   \texttt{\macro{\_XOPEN\_SOURCE} >= 700}.}  il cui prototipo è:
1898 \begin{functions}
1899   \headdecl{sys/types.h} \headdecl{dirent.h} 
1900   
1901   \funcdecl{int dirfd(DIR * dir)} 
1902   
1903   Restituisce il file descriptor associato ad un \textit{directory stream}.
1904   
1905   \bodydesc{La funzione restituisce il file descriptor (un valore positivo) in
1906     caso di successo e -1 in caso di errore.}
1907 \end{functions}
1908
1909 La funzione restituisce il file descriptor associato al \textit{directory
1910   stream} \param{dir}. Di solito si utilizza questa funzione in abbinamento a
1911 funzioni che operano sui file descriptor, ad esempio si potrà usare
1912 \func{fstat} per ottenere le proprietà della directory, o \func{fchdir} per
1913 spostare su di essa la directory di lavoro (vedi
1914 sez.~\ref{sec:file_work_dir}).
1915
1916 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
1917 possibile associarvi un \textit{directory stream} con la funzione
1918 \funcd{fdopendir},\footnote{questa funzione è però disponibile solo a partire
1919   dalla versione 2.4 delle \acr{glibc}, ed è stata introdotta nello standard
1920   POSIX solo a partire dalla revisione POSIX.1-2008, prima della versione 2.10
1921   delle \acr{glibc} per poterla utilizzare era necessario definire la macro
1922   \macro{\_GNU\_SOURCE}, dalla versione 2.10 si possono usare anche
1923   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o \texttt{\_XOPEN\_SOURCE >=
1924     700} .}  il cui prototipo è:
1925 \begin{functions}
1926   \headdecl{sys/types.h} \headdecl{dirent.h}
1927   
1928   \funcdecl{DIR * fdopendir(int fd)} 
1929   
1930   Associa un \textit{directory stream} al file descriptor \param{fd}.
1931   
1932   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
1933     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
1934     assumerà il valore \errval{EBADF}.}
1935 \end{functions}
1936
1937 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
1938   stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
1939 stato aperto in precedenza; la funzione darà un errore qualora questo non
1940 corrisponda ad una directory. L'uso di questa funzione permette di rispondere
1941 agli stessi requisiti delle funzioni ``\textit{at}'' che vedremo in
1942 sez.~\ref{sec:file_openat}.
1943
1944 Una volta utilizzata il file descriptor verrà usato internamente dalle
1945 funzioni che operano sul \textit{directory stream} e non dovrà essere più
1946 utilizzato all'interno del proprio programma; in particolare dovrà essere
1947 chiuso con \func{closedir} e non direttamente. Si tenga presente inoltre che
1948 \func{fdopendir} non modifica lo stato di un eventuale flag di
1949 \itindex{close-on-exec} \textit{close-on-exec}, che pertanto dovrà essere
1950 impostato esplicitamente in fase di apertura del file descriptor.
1951
1952 Una volta che si sia aperto un \textit{directory stream} la lettura del
1953 contenuto della directory viene effettuata attraverso la funzione
1954 \funcd{readdir}; il suo prototipo è:
1955 \begin{functions}
1956   \headdecl{sys/types.h} \headdecl{dirent.h} 
1957   
1958   \funcdecl{struct dirent *readdir(DIR *dir)}
1959   
1960   Legge una voce dal \textit{directory stream}.
1961   
1962   \bodydesc{La funzione restituisce il puntatore alla struttura contenente i
1963     dati in caso di successo e \val{NULL} altrimenti, in caso di
1964     \textit{directory stream} non valido \var{errno} assumerà il valore
1965     \errval{EBADF}, il valore \val{NULL} viene restituito anche quando si
1966     raggiunge la fine dello stream.}
1967 \end{functions}
1968
1969 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
1970 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
1971 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
1972 esaurite tutte le voci in essa presenti.
1973
1974 \begin{figure}[!htb]
1975   \footnotesize \centering
1976   \begin{minipage}[c]{\textwidth}
1977     \includestruct{listati/dirent.c}
1978   \end{minipage} 
1979   \normalsize 
1980   \caption{La struttura \structd{dirent} per la lettura delle informazioni dei 
1981     file.}
1982   \label{fig:file_dirent_struct}
1983 \end{figure}
1984
1985 I dati vengono memorizzati in una struttura \struct{dirent}, la cui
1986 definizione è riportata in fig.~\ref{fig:file_dirent_struct}.\footnote{la
1987   definizione è quella usata da Linux, che si trova nel file
1988   \file{/usr/include/bits/dirent.h}, essa non contempla la presenza del campo
1989   \var{d\_namlen} che indica la lunghezza del nome del file.} La funzione
1990 restituisce il puntatore alla struttura; si tenga presente però che
1991 quest'ultima è allocata staticamente, per cui viene sovrascritta tutte le
1992 volte che si ripete la lettura di una voce sullo stesso \textit{directory
1993   stream}.
1994
1995 Di questa funzione esiste anche una versione \index{funzioni!rientranti}
1996 rientrante, \func{readdir\_r},\footnote{per usarla è necessario definire una
1997   qualunque delle macro \texttt{\macro{\_POSIX\_C\_SOURCE} >= 1},
1998   \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
1999   \macro{\_POSIX\_SOURCE}.} che non usa una struttura allocata staticamente, e
2000 può essere utilizzata anche con i \itindex{thread} \textit{thread}, il suo
2001 prototipo è:
2002 \begin{functions}
2003   \headdecl{sys/types.h} \headdecl{dirent.h} 
2004   
2005   \funcdecl{int readdir\_r(DIR *dir, struct dirent *entry,
2006           struct dirent **result)}
2007   
2008   Legge una voce dal \textit{directory stream}.
2009   
2010   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2011     errore, gli errori sono gli stessi di \func{readdir}.}
2012 \end{functions}
2013
2014 La funzione restituisce in \param{result} (come
2015 \itindex{value~result~argument} \textit{value result argument}) l'indirizzo
2016 dove sono stati salvati i dati, che di norma corrisponde a quello della
2017 struttura precedentemente allocata e specificata dall'argomento \param{entry},
2018 anche se non è assicurato che la funzione usi lo spazio fornito dall'utente.
2019
2020 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
2021 presenti nella directory; sia BSD che SVr4 prevedono che siano sempre presenti
2022 il campo \var{d\_name},\footnote{lo standard POSIX prevede invece solo la
2023   presenza del campo \var{d\_fileno}, identico \var{d\_ino}, che in Linux è
2024   definito come alias di quest'ultimo; il campo \var{d\_name} è considerato
2025   dipendente dall'implementazione.} che contiene il nome del file nella forma
2026 di una stringa terminata da uno zero,\footnote{lo standard POSIX non specifica
2027   una lunghezza, ma solo un limite \const{NAME\_MAX}; in SVr4 la lunghezza del
2028   campo è definita come \code{NAME\_MAX+1} che di norma porta al valore di 256
2029   byte usato anche in Linux.} ed il campo \var{d\_ino}, che contiene il numero
2030 di \textit{inode} cui il file è associato e corrisponde al campo \var{st\_ino}
2031 di \struct{stat}.
2032
2033 La presenza di ulteriori campi opzionali oltre i due citati è segnalata dalla
2034 definizione di altrettante macro nella forma \code{\_DIRENT\_HAVE\_D\_XXX}
2035 dove \code{XXX} è il nome del relativo campo; nel caso di Linux sono pertanto
2036 definite le macro \macro{\_DIRENT\_HAVE\_D\_TYPE},
2037 \macro{\_DIRENT\_HAVE\_D\_OFF} e \macro{\_DIRENT\_HAVE\_D\_RECLEN}, mentre non
2038 è definita la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN}.
2039
2040 \begin{table}[htb]
2041   \centering
2042   \footnotesize
2043   \begin{tabular}[c]{|l|l|}
2044     \hline
2045     \textbf{Valore} & \textbf{Tipo di file} \\
2046     \hline
2047     \hline
2048     \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
2049     \const{DT\_REG}     & File normale.\\
2050     \const{DT\_DIR}     & Directory.\\
2051     \const{DT\_LNK}     & Link simbolico.\\
2052     \const{DT\_FIFO}    & Fifo.\\
2053     \const{DT\_SOCK}    & Socket.\\
2054     \const{DT\_CHR}     & Dispositivo a caratteri.\\
2055     \const{DT\_BLK}     & Dispositivo a blocchi.\\
2056     \hline    
2057   \end{tabular}
2058   \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
2059     della struttura \struct{dirent}.}
2060   \label{tab:file_dtype_macro}
2061 \end{table}
2062
2063 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
2064 indica il tipo di file (se fifo, directory, link simbolico, ecc.), e consente
2065 di evitare una successiva chiamata a \func{lstat} per determinarlo. I suoi
2066 possibili valori sono riportati in tab.~\ref{tab:file_dtype_macro}. Si tenga
2067 presente che questo valore è disponibile solo per i filesystem che ne
2068 supportano la restituzione (fra questi i più noti sono \textsl{btrfs},
2069 \textsl{ext2}, \textsl{ext3}, e \textsl{ext4}), per gli altri si otterrà
2070 sempre il valore \const{DT\_UNKNOWN}.\footnote{inoltre fino alla versione 2.1
2071   delle \acr{glibc}, pur essendo il campo \var{d\_type} presente, il suo uso
2072   non era implementato, e veniva restituito comunque il valore
2073   \const{DT\_UNKNOWN}.}
2074
2075 Per la conversione da e verso l'analogo valore mantenuto dentro il campo
2076 \var{st\_mode} di \struct{stat} sono definite anche due macro di conversione,
2077 \macro{IFTODT} e \macro{DTTOIF}:
2078 \begin{functions}
2079   \funcdecl{int IFTODT(mode\_t MODE)} Converte il tipo di file dal formato di
2080   \var{st\_mode} a quello di \var{d\_type}.
2081   
2082   \funcdecl{mode\_t DTTOIF(int DTYPE)} Converte il tipo di file dal formato di
2083   \var{d\_type} a quello di \var{st\_mode}.
2084 \end{functions}
2085
2086 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
2087 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
2088 letta. Con questi due campi diventa possibile, determinando la posizione delle
2089 varie voci, spostarsi all'interno dello stream usando la funzione
2090 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
2091   estensioni prese da BSD, ed introdotte nello standard POSIX solo a partire
2092   dalla revisione POSIX.1-2001, per poterle utilizzare deve essere definita
2093   una delle macro \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE} o
2094   \macro{\_SVID\_SOURCE}.} il cui prototipo è:
2095 \begin{prototype}{dirent.h}{void seekdir(DIR *dir, off\_t offset)}
2096   Cambia la posizione all'interno di un \textit{directory stream}.
2097 \end{prototype}
2098
2099 La funzione non ritorna nulla e non segnala errori, è però necessario che il
2100 valore dell'argomento \param{offset} sia valido per lo stream \param{dir};
2101 esso pertanto deve essere stato ottenuto o dal valore di \var{d\_off} di
2102 \struct{dirent} o dal valore restituito dalla funzione \funcd{telldir}, che
2103 legge la posizione corrente; il prototipo di quest'ultima è:\footnote{prima
2104   delle \acr{glibc} 2.1.1 la funzione restituiva un valore di tipo
2105   \type{off\_t}, sostituito a partire dalla versione 2.1.2 da \ctyp{long} per
2106   conformità a POSIX.1-2001.}
2107 \begin{prototype}{dirent.h}{long telldir(DIR *dir)}
2108   Ritorna la posizione corrente in un \textit{directory stream}.
2109   
2110   \bodydesc{La funzione restituisce la posizione corrente nello stream (un
2111     numero positivo) in caso di successo, e -1 altrimenti, nel qual caso
2112     \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
2113     valore errato per \param{dir}.}
2114 \end{prototype}
2115
2116 La sola funzione di posizionamento nello stream prevista originariamente dallo
2117 standard POSIX è \funcd{rewinddir}, che riporta la posizione a quella
2118 iniziale; il suo prototipo è:
2119 \begin{functions}
2120   \headdecl{sys/types.h} \headdecl{dirent.h} 
2121   
2122   \funcdecl{void rewinddir(DIR *dir)}
2123   
2124   Si posiziona all'inizio di un \textit{directory stream}.
2125 \end{functions}
2126
2127 Una volta completate le operazioni si può chiudere il \textit{directory
2128   stream}, ed il file descriptor ad esso associato, con la funzione
2129 \funcd{closedir}, il cui prototipo è:
2130 \begin{functions}
2131   \headdecl{sys/types.h} \headdecl{dirent.h} 
2132   
2133   \funcdecl{int closedir(DIR * dir)} 
2134   
2135   Chiude un \textit{directory stream}.
2136   
2137   \bodydesc{La funzione restituisce 0 in caso di successo e -1 altrimenti, nel
2138     qual caso \var{errno} assume il valore \errval{EBADF}.}
2139 \end{functions}
2140
2141 A parte queste funzioni di base in BSD 4.3 venne introdotta un'altra funzione
2142 che permette di eseguire una scansione completa, con tanto di ricerca ed
2143 ordinamento, del contenuto di una directory; la funzione è
2144 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
2145   \acr{libc4} e richiede siano definite le macro \macro{\_BSD\_SOURCE} o
2146   \macro{\_SVID\_SOURCE}.} ed il suo prototipo è:
2147 \begin{prototype}{dirent.h}{int scandir(const char *dir, 
2148     struct dirent ***namelist, int(*filter)(const struct dirent *),
2149     int(*compar)(const struct dirent **, const struct dirent **))} 
2150   
2151   Esegue una scansione di un \textit{directory stream}.
2152   
2153   \bodydesc{La funzione restituisce in caso di successo il numero di voci
2154     trovate, e -1 altrimenti.}
2155 \end{prototype}
2156
2157 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
2158 prototipo non è molto comprensibile; queste funzioni però sono quelle che
2159 controllano rispettivamente la selezione di una voce (quella passata con
2160 l'argomento \param{filter}) e l'ordinamento di tutte le voci selezionate
2161 (quella specificata dell'argomento \param{compar}).
2162
2163 La funzione legge tutte le voci della directory indicata dall'argomento
2164 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
2165 \struct{dirent}) come argomento della funzione di selezione specificata da
2166 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
2167 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
2168 Qualora si specifichi un valore \val{NULL} per l'argomento \func{filter} non
2169 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
2170
2171 Le voci selezionate possono essere riordinate tramite \func{qsort}, le modalità
2172 del riordinamento possono essere personalizzate usando la funzione
2173 \param{compar} come criterio di ordinamento di \func{qsort}, la funzione
2174 prende come argomenti le due strutture \struct{dirent} da confrontare
2175 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
2176 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
2177 \struct{dirent} viene restituito nell'argomento
2178 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
2179   restituisce, come \itindex{value~result~argument} \textit{value result
2180     argument}, l'indirizzo della stessa; questo significa che \param{namelist}
2181   deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
2182   si deve passare il suo indirizzo.}
2183
2184 Per l'ordinamento, vale a dire come valori possibili per l'argomento
2185 \param{compar} sono disponibili due funzioni predefinite, \funcd{alphasort} e
2186 \funcd{versionsort}, i cui prototipi sono:
2187 \begin{functions}
2188   \headdecl{dirent.h} 
2189   
2190   \funcdecl{int alphasort(const void *a, const void *b)} 
2191
2192   \funcdecl{int versionsort(const void *a, const void *b)} 
2193   
2194   Funzioni per l'ordinamento delle voci di \textit{directory stream}.
2195   
2196   \bodydesc{Le funzioni restituiscono un valore minore, uguale o maggiore di
2197     zero qualora il primo argomento sia rispettivamente minore, uguale o
2198     maggiore del secondo.}
2199 \end{functions}
2200
2201 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
2202 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
2203   argomenti dei puntatori a delle strutture \struct{dirent}; le glibc usano il
2204   prototipo originario di BSD, mostrato anche nella definizione, che prevede
2205   puntatori a \ctyp{void}.} e deve essere specificata come argomento
2206 \param{compar} per ottenere un ordinamento alfabetico (secondo il valore del
2207 campo \var{d\_name} delle varie voci). Le \acr{glibc} prevedono come
2208 estensione\footnote{le glibc, a partire dalla versione 2.1, effettuano anche
2209   l'ordinamento alfabetico tenendo conto delle varie localizzazioni, usando
2210   \func{strcoll} al posto di \func{strcmp}.} anche \func{versionsort}, che
2211 ordina i nomi tenendo conto del numero di versione (cioè qualcosa per cui
2212 \texttt{file10} viene comunque dopo \texttt{file4}.)
2213
2214 \begin{figure}[!htbp]
2215   \footnotesize \centering
2216   \begin{minipage}[c]{\codesamplewidth}
2217     \includecodesample{listati/my_ls.c}
2218   \end{minipage}
2219   \caption{Esempio di codice per eseguire la lista dei file contenuti in una
2220     directory.} 
2221   \label{fig:file_my_ls}
2222 \end{figure}
2223
2224 Un semplice esempio dell'uso di queste funzioni è riportato in
2225 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
2226 programma che, usando la funzione di scansione illustrata in
2227 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
2228 e la relativa dimensione (in sostanza una versione semplificata del comando
2229 \cmd{ls}).
2230
2231 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
2232 la parte di gestione delle opzioni (che prevede solo l'uso di una funzione per
2233 la stampa della sintassi, anch'essa omessa) ma il codice completo potrà essere
2234 trovato coi sorgenti allegati nel file \file{myls.c}.
2235
2236 In sostanza tutto quello che fa il programma, dopo aver controllato
2237 (\texttt{\small 12--15}) di avere almeno un argomento (che indicherà la
2238 directory da esaminare) è chiamare (\texttt{\small 16}) la funzione
2239 \func{DirScan} per eseguire la scansione, usando la funzione \code{do\_ls}
2240 (\texttt{\small 22--29}) per fare tutto il lavoro.
2241
2242 Quest'ultima si limita (\texttt{\small 26}) a chiamare \func{stat} sul file
2243 indicato dalla directory entry passata come argomento (il cui nome è appunto
2244 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
2245 dati ad esso relativi, per poi provvedere (\texttt{\small 27}) a stampare il
2246 nome del file e la dimensione riportata in \var{data}.
2247
2248 Dato che la funzione verrà chiamata all'interno di \func{DirScan} per ogni
2249 voce presente questo è sufficiente a stampare la lista completa dei file e
2250 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
2251 valore di ritorno per indicare una esecuzione senza errori.
2252
2253 \begin{figure}[!htbp]
2254   \footnotesize \centering
2255   \begin{minipage}[c]{\codesamplewidth}
2256     \includecodesample{listati/DirScan.c}
2257   \end{minipage}
2258   \caption{Codice della funzione di scansione di una directory contenuta nel
2259     file \file{DirScan.c}.} 
2260   \label{fig:file_dirscan}
2261 \end{figure}
2262
2263 Tutto il grosso del lavoro è svolto dalla funzione \func{DirScan}, riportata
2264 in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e permette
2265 di eseguire una funzione, passata come secondo argomento, su tutte le voci di
2266 una directory.  La funzione inizia con l'aprire (\texttt{\small 18--22}) uno
2267 stream sulla directory passata come primo argomento, stampando un messaggio in
2268 caso di errore.
2269
2270 Il passo successivo (\texttt{\small 23--24}) è cambiare directory di lavoro
2271 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzioni
2272 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
2273 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
2274 (\texttt{\small 26--30}) sulle singole voci dello stream ci si trovi
2275 all'interno della directory.\footnote{questo è essenziale al funzionamento
2276   della funzione \code{do\_ls}, e ad ogni funzione che debba usare il campo
2277   \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
2278   struttura \struct{dirent} sono sempre relativi alla directory in questione,
2279   e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
2280   ottenere le dimensioni.}
2281
2282 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
2283 alla funzione passata come secondo argomento, il ciclo di scansione della
2284 directory è molto semplice; si legge una voce alla volta (\texttt{\small 26})
2285 all'interno di una istruzione di \code{while} e fintanto che si riceve una
2286 voce valida, cioè un puntatore diverso da \val{NULL}, si esegue
2287 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
2288 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
2289   28}) qualora questa presenti una anomalia, identificata da un codice di
2290 ritorno negativo. Una volta terminato il ciclo la funzione si conclude con la
2291 chiusura (\texttt{\small 32}) dello stream\footnote{nel nostro caso, uscendo
2292   subito dopo la chiamata, questo non servirebbe, in generale però
2293   l'operazione è necessaria, dato che la funzione può essere invocata molte
2294   volte all'interno dello stesso processo, per cui non chiudere i
2295   \textit{directory stream} comporterebbe un consumo progressivo di risorse,
2296   con conseguente rischio di esaurimento delle stesse.} e la restituzione
2297 (\texttt{\small 32}) del codice di operazioni concluse con successo.
2298
2299
2300 \subsection{La directory di lavoro}
2301 \label{sec:file_work_dir}
2302
2303 \itindbeg{pathname}
2304
2305 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
2306 directory nel filesystem,\footnote{questa viene mantenuta all'interno dei dati
2307   della sua \struct{task\_struct} (vedi fig.~\ref{fig:proc_task_struct}), più
2308   precisamente nel campo \texttt{pwd} della sotto-struttura
2309   \struct{fs\_struct}.} che è chiamata \textsl{directory corrente} o
2310 \textsl{directory di lavoro} (in inglese \textit{current working directory}).
2311 La directory di lavoro è quella da cui si parte quando un
2312 \itindsub{pathname}{relativo} \textit{pathname} è espresso in forma relativa,
2313 dove il ``\textsl{relativa}'' fa riferimento appunto a questa directory.
2314
2315 Quando un utente effettua il login, questa directory viene impostata alla
2316 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
2317 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
2318 comando \cmd{pwd} la stampa sul terminale.  Siccome la directory corrente
2319 resta la stessa quando viene creato un processo figlio (vedi
2320 sez.~\ref{sec:proc_fork}), la directory corrente della shell diventa anche la
2321 directory corrente di qualunque comando da essa lanciato.
2322
2323 Dato che è il kernel che tiene traccia per ciascun processo \itindex{inode}
2324 dell'\textit{inode} della directory di lavoro, per ottenerne il
2325 \textit{pathname} occorre usare una apposita funzione di libreria,
2326 \funcd{getcwd},\footnote{con Linux \func{getcwd} è una \textit{system call}
2327   dalla versione 2.1.9, in precedenza il valore doveva essere ottenuto tramite
2328   il filesystem \texttt{/proc} da \procfile{/proc/self/cwd}.} il cui prototipo
2329 è:
2330 \begin{prototype}{unistd.h}{char *getcwd(char *buffer, size\_t size)}
2331   Legge il \textit{pathname} della directory di lavoro corrente.
2332   
2333   \bodydesc{La funzione restituisce il puntatore \param{buffer} se riesce,
2334     \val{NULL} se fallisce, in quest'ultimo caso la variabile
2335     \var{errno} è impostata con i seguenti codici di errore:
2336   \begin{errlist}
2337   \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
2338     è nullo.
2339   \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
2340     lunghezza del \textit{pathname}. 
2341   \item[\errcode{EACCES}] manca il permesso di lettura o di ricerca su uno dei
2342     componenti del \textit{pathname} (cioè su una delle directory superiori
2343     alla corrente).
2344   \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata.
2345   \end{errlist}}
2346 \end{prototype}
2347
2348 La funzione restituisce il \textit{pathname} completo della directory di
2349 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
2350 precedentemente allocata, per una dimensione massima di \param{size}.  Il
2351 buffer deve essere sufficientemente largo da poter contenere il
2352 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
2353 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
2354 un errore.
2355
2356 Si può anche specificare un puntatore nullo come
2357 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
2358   supportata da Linux e dalla \acr{glibc}.} nel qual caso la stringa sarà
2359 allocata automaticamente per una dimensione pari a \param{size} qualora questa
2360 sia diversa da zero, o della lunghezza esatta del \textit{pathname}
2361 altrimenti. In questo caso ci si deve ricordare di disallocare la stringa una
2362 volta cessato il suo utilizzo.
2363
2364 Di questa funzione esiste una versione \code{char *getwd(char *buffer)} fatta
2365 per compatibilità all'indietro con BSD, che non consente di specificare la
2366 dimensione del buffer; esso deve essere allocato in precedenza ed avere una
2367 dimensione superiore a \const{PATH\_MAX} (di solito 256 byte, vedi
2368 sez.~\ref{sec:sys_limits}); il problema è che in Linux non esiste una
2369 dimensione superiore per un \textit{pathname}, per cui non è detto che il
2370 buffer sia sufficiente a contenere il nome del file, e questa è la ragione
2371 principale per cui questa funzione è deprecata.
2372
2373 Un uso comune di \func{getcwd} è quello di salvare la directory di lavoro
2374 iniziale per poi potervi tornare in un tempo successivo, un metodo alternativo
2375 più veloce, se non si è a corto di file descriptor, è invece quello di aprire
2376 la directory corrente (vale a dire ``\texttt{.}'') e tornarvi in seguito con
2377 \func{fchdir}. 
2378
2379 Una seconda usata per ottenere la directory di lavoro è \code{char
2380   *get\_current\_dir\_name(void)} che è sostanzialmente equivalente ad una
2381 \code{getcwd(NULL, 0)}, con la sola differenza che essa ritorna il valore
2382 della variabile di ambiente \val{PWD}, che essendo costruita dalla shell può
2383 contenere un \textit{pathname} comprendente anche dei link simbolici. Usando
2384 \func{getcwd} infatti, essendo il \textit{pathname} ricavato risalendo
2385 all'indietro l'albero della directory, si perderebbe traccia di ogni passaggio
2386 attraverso eventuali link simbolici.
2387
2388 Per cambiare la directory di lavoro si può usare la funzione \funcd{chdir}
2389 (equivalente del comando di shell \cmd{cd}) il cui nome sta appunto per
2390 \textit{change directory}, il suo prototipo è:
2391 \begin{prototype}{unistd.h}{int chdir(const char *pathname)} 
2392   Cambia la directory di lavoro in \param{pathname}.
2393   
2394   \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
2395     nel qual caso \var{errno} assumerà i valori:
2396   \begin{errlist}
2397   \item[\errcode{ENOTDIR}] non si è specificata una directory.
2398   \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
2399     di \param{path}.
2400   \end{errlist}
2401   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2402   \errval{ENOMEM}, \errval{ELOOP} e \errval{EIO}.}
2403 \end{prototype}
2404 \noindent ed ovviamente \param{pathname} deve indicare una directory per la
2405 quale si hanno i permessi di accesso.
2406
2407 Dato che anche le directory sono file, è possibile riferirsi ad esse anche
2408 tramite il file descriptor, e non solo tramite il \textit{pathname}, per fare
2409 questo si usa \funcd{fchdir}, il cui prototipo è:
2410 \begin{prototype}{unistd.h}{int fchdir(int fd)} 
2411   Identica a \func{chdir}, ma usa il file descriptor \param{fd} invece del
2412   \textit{pathname}.
2413   
2414   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
2415     errore, in caso di errore \var{errno} assumerà i valori \errval{EBADF} o
2416     \errval{EACCES}.}
2417 \end{prototype}
2418 \noindent anche in questo caso \param{fd} deve essere un file descriptor
2419 valido che fa riferimento ad una directory. Inoltre l'unico errore di accesso
2420 possibile (tutti gli altri sarebbero occorsi all'apertura di \param{fd}), è
2421 quello in cui il processo non ha il permesso di accesso alla directory
2422 specificata da \param{fd}.
2423
2424 \itindend{pathname}
2425
2426
2427
2428 \subsection{I file temporanei}
2429 \label{sec:file_temp_file}
2430
2431 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
2432 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
2433 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
2434 creare il file dopo aver controllato che questo non esista, nel momento fra il
2435 controllo e la creazione si ha giusto lo spazio per una possibile
2436 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
2437 sez.~\ref{sec:proc_race_cond}).
2438
2439 Le \acr{glibc} provvedono varie funzioni per generare nomi di file temporanei,
2440 di cui si abbia certezza di unicità al momento della generazione; storicamente
2441 la prima di queste funzioni create a questo scopo era
2442 \funcd{tmpnam},\footnote{la funzione è stata deprecata nella revisione
2443   POSIX.1-2008 dello standard POSIX.} il cui prototipo è:
2444 \begin{prototype}{stdio.h}{char *tmpnam(char *string)}
2445   Genera un nome univoco per un file temporaneo.
2446  
2447   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
2448   \val{NULL} in caso di fallimento. Non sono definiti errori.}
2449 \end{prototype}
2450
2451 La funzione restituisce il puntatore ad una stringa contente un nome di file
2452 valido e non esistente al momento dell'invocazione; se si è passato come
2453 argomento \param{string} un puntatore non nullo ad un buffer di caratteri
2454 questo deve essere di dimensione \const{L\_tmpnam} ed il nome generato vi
2455 verrà copiato automaticamente; altrimenti il nome sarà generato in un buffer
2456 statico interno che verrà sovrascritto ad una chiamata successiva.  Successive
2457 invocazioni della funzione continueranno a restituire nomi unici fino ad un
2458 massimo di \const{TMP\_MAX} volte, limite oltre il quale il comportamento è
2459 indefinito. Al nome viene automaticamente aggiunto come prefisso la directory
2460 specificata dalla costante \const{P\_tmpdir}.\footnote{le costanti
2461   \const{L\_tmpnam}, \const{P\_tmpdir} e \const{TMP\_MAX} sono definite in
2462   \file{stdio.h}.}
2463
2464 Di questa funzione esiste una versione \index{funzioni!rientranti} rientrante,
2465 \func{tmpnam\_r}, che non fa nulla quando si passa \val{NULL} come argomento.
2466 Una funzione simile, \funcd{tempnam}, permette di specificare un prefisso per
2467 il file esplicitamente, il suo prototipo è:
2468 \begin{prototype}{stdio.h}{char *tempnam(const char *dir, const char *pfx)}
2469   Genera un nome univoco per un file temporaneo.
2470
2471   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
2472   \val{NULL} in caso di fallimento, \var{errno} viene impostata a
2473   \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
2474 \end{prototype}
2475
2476 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
2477 per cui è sempre \index{funzioni!rientranti} rientrante, occorre però
2478 ricordarsi di disallocare con \code{free} il puntatore che restituisce.
2479 L'argomento \param{pfx} specifica un prefisso di massimo 5 caratteri per il
2480 nome provvisorio. La funzione assegna come directory per il file temporaneo,
2481 verificando che esista e sia accessibile, la prima valida fra le seguenti:
2482 \begin{itemize*}
2483 \item La variabile di ambiente \const{TMPDIR} (non ha effetto se non è
2484   definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
2485   \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}).
2486 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}).
2487 \item Il valore della costante \const{P\_tmpdir}.
2488 \item la directory \file{/tmp}.
2489 \end{itemize*}
2490
2491 In ogni caso, anche se la generazione del nome è casuale, ed è molto difficile
2492 ottenere un nome duplicato, nulla assicura che un altro processo non possa
2493 avere creato, fra l'ottenimento del nome e l'apertura del file, un altro file
2494 con lo stesso nome; per questo motivo quando si usa il nome ottenuto da una di
2495 queste funzioni occorre sempre aprire il nuovo file in modalità di esclusione
2496 (cioè con l'opzione \const{O\_EXCL} per i file descriptor o con il flag
2497 \code{x} per gli stream) che fa fallire l'apertura in caso il file sia già
2498 esistente.
2499
2500 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
2501 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
2502 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
2503 \begin{prototype}{stdio.h}{FILE *tmpfile(void)}
2504   Restituisce un file temporaneo aperto in lettura/scrittura.
2505   
2506   \bodydesc{La funzione ritorna il puntatore allo stream associato al file
2507     temporaneo in caso di successo e \val{NULL} in caso di errore, nel qual
2508     caso \var{errno} assumerà i valori:
2509     \begin{errlist}
2510     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
2511     \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
2512     \end{errlist}
2513     ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
2514     \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES}.}
2515 \end{prototype}
2516
2517 La funzione restituisce direttamente uno stream già aperto (in modalità
2518 \code{r+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso, che viene
2519 automaticamente cancellato alla sua chiusura o all'uscita dal programma. Lo
2520 standard non specifica in quale directory verrà aperto il file, ma le
2521 \acr{glibc} prima tentano con \const{P\_tmpdir} e poi con \file{/tmp}. Questa
2522 funzione è \index{funzioni!rientranti} rientrante e non soffre di problemi di
2523 \itindex{race~condition} \textit{race condition}.
2524
2525 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
2526 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
2527 modificano una stringa di input che serve da modello e che deve essere
2528 conclusa da 6 caratteri \code{X} che verranno sostituiti da un codice
2529 unico. La prima delle due è analoga a \func{tmpnam} e genera un nome casuale,
2530 il suo prototipo è:
2531 \begin{prototype}{stlib.h}{char *mktemp(char *template)}
2532   Genera un nome univoco per un file temporaneo.
2533   
2534   \bodydesc{La funzione ritorna il puntatore \param{template} in caso di
2535     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
2536     assumerà i valori:
2537     \begin{errlist}
2538     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2539     \end{errlist}}
2540 \end{prototype}
2541
2542 La funzionane genera un nome univoco sostituendo le \code{XXXXXX} finali di
2543 \param{template}; dato che \param{template} deve poter essere modificata dalla
2544 funzione non si può usare una stringa costante.  Tutte le avvertenze riguardo
2545 alle possibili \itindex{race~condition} \textit{race condition} date per
2546 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
2547 il valore usato per sostituire le \code{XXXXXX} viene formato con il \ids{PID}
2548 del processo più una lettera, il che mette a disposizione solo 26 possibilità
2549 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
2550 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
2551 usata.
2552
2553 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
2554 \func{tmpfile}, ma restituisce un file descriptor invece di un nome; il suo
2555 prototipo è:
2556 \begin{prototype}{stlib.h}{int mkstemp(char *template)}
2557   Genera un file temporaneo.
2558   
2559   \bodydesc{La funzione ritorna il file descriptor in caso di successo e
2560     -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
2561     \begin{errlist}
2562     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2563     \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
2564       contenuto di \param{template} è indefinito.
2565     \end{errlist}}
2566 \end{prototype}
2567
2568 Come per \func{mktemp} anche in questo caso \param{template} non può essere
2569 una stringa costante. La funzione apre un file in lettura/scrittura con la
2570 funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
2571 sez.~\ref{sec:file_open}), in questo modo al ritorno della funzione si ha la
2572 certezza di essere stati i creatori del file, i cui permessi (si veda
2573 sez.~\ref{sec:file_perm_overview}) sono impostati al valore \code{0600}
2574 (lettura e scrittura solo per il proprietario).\footnote{questo è vero a
2575   partire dalle \acr{glibc} 2.0.7, le versioni precedenti delle \acr{glibc} e
2576   le vecchie \acr{libc5} e \acr{libc4} usavano il valore \code{0666} che
2577   permetteva a chiunque di leggere e scrivere i contenuti del file.}  Di
2578 questa funzione esiste una variante \funcd{mkostemp}, introdotta
2579 specificamente dalla \acr{glibc},\footnote{la funzione è stata introdotta
2580   nella versione 2.7 delle librerie e richiede che sia definita la macro
2581   \const{\_GNU\_SOURCE}.} il cui prototipo è:
2582 \begin{prototype}{stlib.h}{int mkostemp(char *template, int flags)}
2583   Genera un file temporaneo.
2584   
2585   \bodydesc{La funzione ritorna il file descriptor in caso di successo e
2586     -1 in caso di errore, con gli stessi errori di \func{mkstemp}.}
2587 \end{prototype}
2588 \noindent la cui sola differenza è la presenza dell'ulteriore argomento
2589 \var{flags} che consente di specificare i flag da passare ad \func{open}
2590 nell'apertura del file.
2591
2592
2593 In OpenBSD è stata introdotta un'altra funzione simile alle precedenti,
2594 \funcd{mkdtemp}, che crea invece una directory temporanea;\footnote{la
2595   funzione è stata introdotta nelle \acr{glibc} a partire dalla versione
2596   2.1.91 ed inserita nello standard POSIX.1-2008.}  il suo prototipo è:
2597 \begin{prototype}{stlib.h}{char *mkdtemp(char *template)}
2598   Genera una directory temporanea.
2599   
2600   \bodydesc{La funzione ritorna il puntatore al nome della directory in caso
2601     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
2602     assumerà i valori:
2603     \begin{errlist}
2604     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2605     \end{errlist}
2606     più gli altri eventuali codici di errore di \func{mkdir}.}
2607 \end{prototype}
2608
2609 La funzione genera una directory il cui nome è ottenuto sostituendo le
2610 \code{XXXXXX} finali di \param{template} con permessi \code{0700} (al solito
2611 si veda cap.~\ref{cha:file_unix_interface} per i dettagli); dato che la
2612 creazione della directory è sempre esclusiva i precedenti problemi di
2613 \itindex{race~condition} \textit{race condition} non si pongono.
2614
2615
2616 \section{La manipolazione delle caratteristiche dei file}
2617 \label{sec:file_infos}
2618
2619 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
2620 relative alle caratteristiche di ciascun file, a partire dalle informazioni
2621 relative al controllo di accesso, sono mantenute \itindex{inode}
2622 nell'\textit{inode}.
2623
2624 Vedremo in questa sezione come sia possibile leggere tutte queste informazioni
2625 usando la funzione \func{stat}, che permette l'accesso a tutti i dati
2626 memorizzati \itindex{inode} nell'\textit{inode}; esamineremo poi le varie
2627 funzioni usate per manipolare tutte queste informazioni (eccetto quelle che
2628 riguardano la gestione del controllo di accesso, trattate in in
2629 sez.~\ref{sec:file_access_control}).
2630
2631
2632 \subsection{La lettura delle caratteristiche dei file}
2633 \label{sec:file_stat}
2634
2635 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
2636 delle funzioni \func{stat} che sono quelle che usa il comando \cmd{ls} per
2637 poter ottenere e mostrare tutti i dati relativi ad un file; ne fanno parte le
2638 funzioni \funcd{stat}, \funcd{fstat} e \funcd{lstat}, i cui prototipi sono:
2639 \begin{functions}
2640   \headdecl{sys/types.h} 
2641   \headdecl{sys/stat.h} 
2642   \headdecl{unistd.h}
2643
2644   \funcdecl{int stat(const char *file\_name, struct stat *buf)} 
2645   \funcdecl{int lstat(const char *file\_name, struct stat *buf)} 
2646   \funcdecl{int fstat(int filedes, struct stat *buf)} 
2647   Legge le informazioni di un file.
2648
2649   \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
2650     errore, nel qual caso \var{errno} assumerà uno dei valori: \errval{EBADF},
2651     \errval{ENOENT}, \errval{ENOTDIR}, \errval{ELOOP}, \errval{EFAULT},
2652     \errval{EACCES}, \errval{ENOMEM}, \errval{ENAMETOOLONG}.}
2653 \end{functions}
2654
2655 La funzione \func{stat} legge le informazioni del file il cui pathname è
2656 specificato dalla stringa puntata da \param{file\_name} e le inserisce nel
2657 buffer puntato dall'argomento \param{buf}; la funzione \func{lstat} è identica
2658 a \func{stat} eccetto che se \param{file\_name} è un link simbolico vengono
2659 lette le informazioni relative ad esso e non al file a cui fa
2660 riferimento. Infine \func{fstat} esegue la stessa operazione su un file già
2661 aperto, specificato tramite il suo file descriptor \param{filedes}.
2662
2663 La struttura \struct{stat} usata da queste funzioni è definita nell'header
2664 \file{sys/stat.h} e in generale dipende dall'implementazione; la versione
2665 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
2666 riportata dalla pagina di manuale di \func{stat}; in realtà la definizione
2667 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
2668 riservati per estensioni come tempi dei file più precisi (vedi
2669 sez.~\ref{sec:file_file_times}), o per il padding dei campi.
2670
2671 \begin{figure}[!htb]
2672   \footnotesize
2673   \centering
2674   \begin{minipage}[c]{\textwidth}
2675     \includestruct{listati/stat.h}
2676   \end{minipage} 
2677   \normalsize 
2678   \caption{La struttura \structd{stat} per la lettura delle informazioni dei 
2679     file.}
2680   \label{fig:file_stat_struct}
2681 \end{figure}
2682
2683 Si noti come i vari membri della struttura siano specificati come tipi
2684 primitivi del sistema (di quelli definiti in
2685 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \file{sys/types.h}).
2686
2687 \subsection{I tipi di file}
2688 \label{sec:file_types}
2689
2690 Come riportato in tab.~\ref{tab:file_file_types} in Linux oltre ai file e alle
2691 directory esistono altri oggetti che possono stare su un filesystem.  Il tipo
2692 di file è ritornato dalla funzione \func{stat} come maschera binaria nel campo
2693 \var{st\_mode} (che contiene anche le informazioni relative ai permessi) di
2694 una struttura \struct{stat}.
2695
2696 Dato che il valore numerico può variare a seconda delle implementazioni, lo
2697 standard POSIX definisce un insieme di macro per verificare il tipo di file,
2698 queste vengono usate anche da Linux che supporta pure le estensioni allo
2699 standard per i link simbolici e i socket definite da BSD; l'elenco completo
2700 delle macro con cui è possibile estrarre l'informazione da \var{st\_mode} è
2701 riportato in tab.~\ref{tab:file_type_macro}.
2702 \begin{table}[htb]
2703   \centering
2704   \footnotesize
2705   \begin{tabular}[c]{|l|l|}
2706     \hline
2707     \textbf{Macro} & \textbf{Tipo del file} \\
2708     \hline
2709     \hline
2710     \macro{S\_ISREG}\texttt{(m)}  & file normale.\\
2711     \macro{S\_ISDIR}\texttt{(m)}  & directory.\\
2712     \macro{S\_ISCHR}\texttt{(m)}  & dispositivo a caratteri.\\
2713     \macro{S\_ISBLK}\texttt{(m)}  & dispositivo a blocchi.\\
2714     \macro{S\_ISFIFO}\texttt{(m)} & fifo.\\
2715     \macro{S\_ISLNK}\texttt{(m)}  & link simbolico.\\
2716     \macro{S\_ISSOCK}\texttt{(m)} & socket.\\
2717     \hline    
2718   \end{tabular}
2719   \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h}).}
2720   \label{tab:file_type_macro}
2721 \end{table}
2722
2723 Oltre alle macro di tab.~\ref{tab:file_type_macro} è possibile usare
2724 direttamente il valore di \var{st\_mode} per ricavare il tipo di file
2725 controllando direttamente i vari bit in esso memorizzati. Per questo sempre in
2726 \file{sys/stat.h} sono definite le costanti numeriche riportate in
2727 tab.~\ref{tab:file_mode_flags}.
2728
2729 Il primo valore dell'elenco di tab.~\ref{tab:file_mode_flags} è la maschera
2730 binaria che permette di estrarre i bit nei quali viene memorizzato il tipo di
2731 file, i valori successivi sono le costanti corrispondenti ai singoli bit, e
2732 possono essere usati per effettuare la selezione sul tipo di file voluto, con
2733 un'opportuna combinazione.
2734
2735 \begin{table}[htb]
2736   \centering
2737   \footnotesize
2738   \begin{tabular}[c]{|l|c|l|}
2739     \hline
2740     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
2741     \hline
2742     \hline
2743     \const{S\_IFMT}   &  0170000 & Maschera per i bit del tipo di file.\\
2744     \const{S\_IFSOCK} &  0140000 & Socket.\\
2745     \const{S\_IFLNK}  &  0120000 & Link simbolico.\\
2746     \const{S\_IFREG}  &  0100000 & File regolare.\\ 
2747     \const{S\_IFBLK}  &  0060000 & Dispositivo a blocchi.\\
2748     \const{S\_IFDIR}  &  0040000 & Directory.\\
2749     \const{S\_IFCHR}  &  0020000 & Dispositivo a caratteri.\\
2750     \const{S\_IFIFO}  &  0010000 & Fifo.\\
2751     \hline
2752     \const{S\_ISUID}  &  0004000 & Set UID bit \itindex{suid~bit}.\\
2753     \const{S\_ISGID}  &  0002000 & Set GID bit \itindex{sgid~bit}.\\
2754     \const{S\_ISVTX}  &  0001000 & Sticky bit \itindex{sticky~bit}.\\
2755     \hline
2756 %    \const{S\_IRWXU}  &  00700   & Bitmask per i permessi del proprietario.\\
2757     \const{S\_IRUSR}  &  00400   & Il proprietario ha permesso di lettura.\\
2758     \const{S\_IWUSR}  &  00200   & Il proprietario ha permesso di scrittura.\\
2759     \const{S\_IXUSR}  &  00100   & Il proprietario ha permesso di esecuzione.\\
2760     \hline
2761 %    \const{S\_IRWXG}  &  00070   & Bitmask per i permessi del gruppo.\\
2762     \const{S\_IRGRP}  &  00040   & Il gruppo ha permesso di lettura.\\
2763     \const{S\_IWGRP}  &  00020   & Il gruppo ha permesso di scrittura.\\
2764     \const{S\_IXGRP}  &  00010   & Il gruppo ha permesso di esecuzione.\\
2765     \hline
2766 %    \const{S\_IRWXO}  &  00007   & Bitmask per i permessi di tutti gli altri\\
2767     \const{S\_IROTH}  &  00004   & Gli altri hanno permesso di lettura.\\
2768     \const{S\_IWOTH}  &  00002   & Gli altri hanno permesso di esecuzione.\\
2769     \const{S\_IXOTH}  &  00001   & Gli altri hanno permesso di esecuzione.\\
2770     \hline    
2771   \end{tabular}
2772   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
2773     \var{st\_mode} (definite in \file{sys/stat.h}).}
2774   \label{tab:file_mode_flags}
2775 \end{table}
2776
2777 Ad esempio se si volesse impostare una condizione che permetta di controllare
2778 se un file è una directory o un file ordinario si potrebbe definire la macro
2779 di preprocessore:
2780 \includecodesnip{listati/is_file_dir.h}
2781 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
2782 poi si effettua il confronto con la combinazione di tipi scelta.
2783
2784
2785 \subsection{Le dimensioni dei file}
2786 \label{sec:file_file_size}
2787
2788 Il campo \var{st\_size} di una struttura \struct{stat} contiene la dimensione
2789 del file in byte, se si tratta di un file regolare. Nel caso di un link
2790 simbolico la dimensione è quella del \itindex{pathname} \textit{pathname} che
2791 il link stesso contiene; per le fifo questo campo è sempre nullo.
2792
2793 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
2794 byte. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
2795 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
2796 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
2797 dimensione inferiore sarebbe inefficiente.
2798
2799 Si tenga conto che la lunghezza del file riportata in \var{st\_size} non è
2800 detto che corrisponda all'occupazione dello spazio su disco per via della
2801 possibile esistenza dei cosiddetti \index{file!\textit{hole}} \textit{holes}
2802 (letteralmente \textsl{buchi}) che si formano tutte le volte che si va a
2803 scrivere su un \itindex{sparse~file} file dopo aver eseguito uno spostamento
2804 oltre la sua fine (tratteremo in dettaglio l'argomento in
2805 sez.~\ref{sec:file_lseek}).
2806
2807 In questo caso si avranno risultati differenti a seconda del modo in cui si
2808 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
2809 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
2810 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
2811 caso per le parti non scritte vengono restituiti degli zeri, si avrà lo stesso
2812 risultato di \cmd{ls}.
2813
2814 Se è sempre possibile allargare un file, scrivendoci sopra od usando la
2815 funzione \func{lseek} per spostarsi oltre la sua fine, esistono anche casi in
2816 cui si può avere bisogno di effettuare un troncamento, scartando i dati
2817 presenti al di là della dimensione scelta come nuova fine del file.
2818
2819 Un file può sempre essere troncato a zero aprendolo con il flag
2820 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
2821 dimensione si possono usare le due funzioni \funcd{truncate} e
2822 \funcd{ftruncate}, i cui prototipi sono:
2823 \begin{functions}
2824   \headdecl{unistd.h} 
2825
2826   \funcdecl{int truncate(const char *file\_name, off\_t length)} 
2827
2828   \funcdecl{int ftruncate(int fd, off\_t length))} 
2829
2830   Troncano un file alla lunghezza \param{length}.
2831
2832   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per un
2833     errore, nel qual caso \var{errno} viene impostata opportunamente; per
2834     \func{ftruncate} si hanno i valori:
2835   \begin{errlist}
2836   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
2837   \item[\errcode{EINVAL}] \param{fd} è un riferimento ad un socket, non a un
2838     file o non è aperto in scrittura.
2839   \end{errlist}
2840   per \func{truncate} si hanno:
2841   \begin{errlist}
2842   \item[\errcode{EACCES}] il file non ha permesso di scrittura o non si ha il
2843     permesso di esecuzione una delle directory del \itindex{pathname}
2844     \textit{pathname}.
2845   \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
2846   \end{errlist}
2847   ed anche \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2848   \errval{EROFS}, \errval{EIO}, \errval{EFAULT}, \errval{ELOOP}.}
2849 \end{functions}
2850
2851 Entrambe le funzioni fan sì che la dimensione del file sia troncata ad un
2852 valore massimo specificato da \param{length}, e si distinguono solo per il
2853 fatto che il file viene indicato con il pathname \param{file\_name} per
2854 \func{truncate} e con il file descriptor \param{fd} per \funcd{ftruncate}; se
2855 il file è più lungo della lunghezza specificata i dati in eccesso saranno
2856 perduti.
2857
2858 Il comportamento in caso di lunghezza inferiore non è specificato e dipende
2859 dall'implementazione: il file può essere lasciato invariato o esteso fino alla
2860 lunghezza scelta; nel caso di Linux viene esteso con la creazione di un
2861 \index{file!\textit{hole}} \textsl{buco} nel \itindex{sparse~file} file e ad
2862 una lettura si otterranno degli zeri; si tenga presente però che questo
2863 comportamento è supportato solo per filesystem nativi, ad esempio su un
2864 filesystem non nativo come il VFAT di Windows questo non è possibile.
2865
2866 \subsection{I tempi dei file}
2867 \label{sec:file_file_times}
2868
2869 Il sistema mantiene per ciascun file tre tempi, questi sono registrati
2870 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del file e
2871 possono essere letti tramite la funzione \func{stat}, che li restituisce
2872 attraverso tre specifici campi della struttura \struct{stat} di
2873 fig.~\ref{fig:file_stat_struct}. Il significato di detti tempi e dei relativi
2874 campi è riportato nello schema in tab.~\ref{tab:file_file_times}, dove è anche
2875 riportato un esempio delle funzioni che effettuano cambiamenti su di essi. Il
2876 valore è espresso nel cosiddetto \itindex{calendar~time} \textit{calendar
2877   time}, su cui torneremo in dettaglio in sez.~\ref{sec:sys_time}.
2878
2879 \begin{table}[htb]
2880   \centering
2881   \footnotesize
2882   \begin{tabular}[c]{|c|l|l|c|}
2883     \hline
2884     \textbf{Membro} & \textbf{Significato} & \textbf{Funzione} 
2885     & \textbf{Opzione di \cmd{ls}} \\
2886     \hline
2887     \hline
2888     \var{st\_atime}& ultimo accesso ai dati del file    &
2889                      \func{read}, \func{utime}          & \cmd{-u}\\
2890     \var{st\_mtime}& ultima modifica ai dati del file   &
2891                      \func{write}, \func{utime}         & default\\
2892     \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
2893                      \func{chmod}, \func{utime}         & \cmd{-c}\\
2894     \hline
2895   \end{tabular}
2896   \caption{I tre tempi associati a ciascun file.}
2897   \label{tab:file_file_times}
2898 \end{table}
2899
2900 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
2901 ultima modifica (il \textit{modification time}, \var{st\_mtime}) e il tempo di
2902 ultimo cambiamento di stato (il \textit{change time}, \var{st\_ctime}). Il
2903 primo infatti fa riferimento ad una modifica del contenuto di un file, mentre
2904 il secondo ad una modifica \itindex{inode} dell'\textit{inode}. Dato che
2905 esistono molte operazioni, come la funzione \func{link} e altre che vedremo in
2906 seguito, che modificano solo le informazioni contenute \itindex{inode}
2907 nell'\textit{inode} senza toccare il contenuto del file, diventa necessario
2908 l'utilizzo di questo secondo tempo.
2909
2910 Il tempo di ultima modifica viene usato ad esempio da programmi come
2911 \cmd{make} per decidere quali file necessitano di essere ricompilati o
2912 (talvolta insieme anche al tempo di cambiamento di stato) per decidere quali
2913 file devono essere archiviati per il backup. Il tempo di ultimo accesso viene
2914 di solito usato per identificare i file che non vengono più utilizzati per un
2915 certo lasso di tempo. Ad esempio un programma come \texttt{leafnode} lo usa
2916 per cancellare gli articoli letti più vecchi, mentre \texttt{mutt} lo usa per
2917 marcare i messaggi di posta che risultano letti.  Il sistema non tiene conto
2918 dell'ultimo accesso \itindex{inode} all'\textit{inode}, pertanto funzioni come
2919 \func{access} o \func{stat} non hanno alcuna influenza sui tre tempi. Il
2920 comando \cmd{ls} (quando usato con le opzioni \cmd{-l} o \cmd{-t}) mostra i
2921 tempi dei file secondo lo schema riportato nell'ultima colonna di
2922 tab.~\ref{tab:file_file_times}.
2923
2924 L'aggiornamento del tempo di ultimo accesso è stato a lungo considerato un
2925 difetto progettuale di Unix, questo infatti comporta la necessità di
2926 effettuare un accesso in scrittura sul disco anche in tutti i casi in cui
2927 questa informazione non interessa e sarebbe possibile avere un semplice
2928 accesso in lettura sui dati bufferizzati. Questo comporta un ovvio costo sia
2929 in termini di prestazioni, che di consumo di risorse come la batteria per i
2930 portatili, o cicli di riscrittura per i dischi su memorie riscrivibili.
2931
2932 Per questo motivo, onde evitare di mantenere una informazione che nella
2933 maggior parte dei casi non interessa, è sempre stato possibile disabilitare
2934 l'aggiornamento del tempo di ultimo accesso con l'opzione di montaggio
2935 \texttt{noatime}. Dato però che questo può creare problemi a qualche
2936 programma, in Linux è stata introdotta la opzione \texttt{relatime} che esegue
2937 l'aggiornamento soltanto se il tempo di ultimo accesso è precedente al tempo di
2938 ultima modifica o cambiamento, così da rendere evidente che vi è stato un
2939 accesso dopo la scrittura, ed evitando al contempo ulteriori operazioni su
2940 disco negli accessi successivi. In questo modo l'informazione relativa al
2941 fatto che un file sia stato letto resta disponibile, e ad esempio i programmi
2942 citati in precedenza continuano a funzionare. Questa opzione, a partire dal
2943 kernel 2.6.30, è diventata il comportamento di default e non deve più essere
2944 specificata esplicitamente.\footnote{si può comunque riottenere il vecchio
2945   comportamento usando la opzione di montaggio \texttt{strictatime}.}
2946
2947 \begin{table}[htb]
2948   \centering
2949   \footnotesize
2950   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
2951     \hline
2952     \multicolumn{1}{|p{3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
2953     \multicolumn{3}{|p{3.6cm}|}{\centering{
2954         \textbf{File o directory del riferimento}}}&
2955     \multicolumn{3}{|p{3.6cm}|}{\centering{
2956         \textbf{Directory contenente il riferimento}}} 
2957     &\multicolumn{1}{|p{3.6cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
2958     \cline{2-7}
2959     \cline{2-7}
2960     \multicolumn{1}{|p{3cm}|}{} 
2961     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
2962     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
2963     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
2964     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
2965     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
2966     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
2967     &\multicolumn{1}{|p{3cm}|}{} \\
2968     \hline
2969     \hline
2970     \func{chmod}, \func{fchmod} 
2971              & --      & --      &$\bullet$& --      & --      & --      &\\
2972     \func{chown}, \func{fchown} 
2973              & --      & --      &$\bullet$& --      & --      & --      &\\
2974     \func{creat}  
2975              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&  
2976              con \const{O\_CREATE} \\
2977     \func{creat}  
2978              & --      &$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&   
2979              con \const{O\_TRUNC} \\
2980     \func{exec}  
2981              &$\bullet$& --      & --      & --      & --      & --      &\\
2982     \func{lchown}  
2983              & --      & --      &$\bullet$& --      & --      & --      &\\
2984     \func{link}
2985              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
2986     \func{mkdir}
2987              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
2988     \func{mkfifo}
2989              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
2990     \func{open}
2991              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$& 
2992              con \const{O\_CREATE} \\
2993     \func{open}
2994              & --      &$\bullet$&$\bullet$& --      & --      & --      & 
2995              con \const{O\_TRUNC}  \\
2996     \func{pipe}
2997              &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
2998     \func{read}
2999              &$\bullet$& --      & --      & --      & --      & --      &\\
3000     \func{remove}
3001              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
3002              se esegue \func{unlink}\\
3003     \func{remove}
3004               & --      & --      & --      & --      &$\bullet$&$\bullet$& 
3005               se esegue \func{rmdir}\\
3006     \func{rename}
3007               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
3008               per entrambi gli argomenti\\
3009     \func{rmdir}
3010               & --      & --      & --      & --      &$\bullet$&$\bullet$&\\ 
3011     \func{truncate}, \func{ftruncate}
3012               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
3013     \func{unlink}
3014               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\ 
3015     \func{utime}
3016               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\ 
3017     \func{write}
3018               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
3019     \hline
3020   \end{tabular}
3021   \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo 
3022     accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento
3023     \textsl{(c)} dalle varie funzioni operanti su file e directory.}
3024   \label{tab:file_times_effects}  
3025 \end{table}
3026
3027
3028 L'effetto delle varie funzioni di manipolazione dei file sui relativi tempi è
3029 illustrato in tab.~\ref{tab:file_times_effects}, facendo riferimento al
3030 comportamento classico per quanto riguarda \var{st\_atime}. Si sono riportati
3031 gli effetti sia per il file a cui si fa riferimento, sia per la directory che
3032 lo contiene; questi ultimi possono essere capiti se si tiene conto di quanto
3033 già detto, e cioè che anche le directory sono anch'esse file che contengono
3034 una lista di nomi, che il sistema tratta in maniera del tutto analoga a tutti
3035 gli altri.
3036
3037 Per questo motivo tutte le volte che compiremo un'operazione su un file che
3038 comporta una modifica del nome contenuto nella directory, andremo anche a
3039 scrivere sulla directory che lo contiene cambiandone il tempo di modifica. Un
3040 esempio di questo tipo di operazione può essere la cancellazione di un file,
3041 invece leggere o scrivere o cambiare i permessi di un file ha effetti solo sui
3042 tempi di quest'ultimo.
3043
3044 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
3045 creazione del file, usato in molti altri sistemi operativi, ma che in Unix non
3046 esiste. Per questo motivo quando si copia un file, a meno di preservare
3047 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
3048 avrà sempre il tempo corrente come data di ultima modifica.
3049
3050 I tempi di ultimo accesso e modifica possono essere modificati esplicitamente
3051 usando la funzione \funcd{utime}, il cui prototipo è:
3052 \begin{prototype}{utime.h}
3053   {int utime(const char *filename, struct utimbuf *times)} 
3054   Modifica i tempi di ultimo accesso e modifica di un file.
3055
3056   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3057     errore, nel qual caso \var{errno} assumerà uno dei valori:
3058     \begin{errlist}
3059     \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
3060     \item[\errcode{EPERM}] non si è proprietari del file.
3061     \end{errlist}
3062     ed inoltre \errval{EROFS} e \errval{ENOENT}.}
3063 \end{prototype}
3064
3065 La funzione cambia i tempi di ultimo accesso e modifica del file specificato
3066 dall'argomento \param{filename}, e richiede come secondo argomento il
3067 puntatore ad una struttura \struct{utimbuf}, la cui definizione è riportata in
3068 fig.~\ref{fig:struct_utimebuf}, con i nuovi valori di detti tempi
3069 (rispettivamente  nei campi \var{actime} e \var{modtime}). Se si passa un
3070 puntatore nullo verrà impostato il tempo corrente.
3071
3072 \begin{figure}[!htb]
3073   \footnotesize \centering
3074   \begin{minipage}[c]{\textwidth}
3075     \includestruct{listati/utimbuf.h}
3076   \end{minipage} 
3077   \normalsize 
3078   \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
3079     i tempi dei file.}
3080   \label{fig:struct_utimebuf}
3081 \end{figure}
3082
3083 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
3084 cosa è l'argomento \param{times}; se è \val{NULL} la funzione imposta il
3085 tempo corrente ed è sufficiente avere accesso in scrittura al file; se invece
3086 si è specificato un valore la funzione avrà successo solo se si è proprietari
3087 del file o si hanno i privilegi di amministratore.
3088
3089 Si tenga presente che non è comunque possibile specificare il tempo di
3090 cambiamento di stato del file, che viene aggiornato direttamente dal kernel
3091 tutte le volte che si modifica \itindex{inode} l'\textit{inode} (quindi anche
3092 alla chiamata di \func{utime}).  Questo serve anche come misura di sicurezza
3093 per evitare che si possa modificare un file nascondendo completamente le
3094 proprie tracce. In realtà la cosa resta possibile se si è in grado di accedere
3095 al \index{file!di~dispositivo} file di dispositivo, scrivendo direttamente sul
3096 disco senza passare attraverso il filesystem, ma ovviamente in questo modo la
3097 cosa è più complicata da realizzare.
3098
3099 A partire dal kernel 2.6 la risoluzione dei tempi dei file, che nei campi di
3100 tab.~\ref{tab:file_file_times} è espressa in secondi, è stata portata ai
3101 nanosecondi per la gran parte dei filesystem. La ulteriore informazione può
3102 essere acceduta attraverso altri campi appositamente aggiunti alla struttura
3103 \struct{stat}. Se si sono definite le macro \macro{\_BSD\_SOURCE} o
3104 \macro{\_SVID\_SOURCE} questi sono \var{st\_atim.tv\_nsec},
3105 \var{st\_mtim.tv\_nsec} e \var{st\_ctim.tv\_nsec} se queste non sono definite,
3106 \var{st\_atimensec}, \var{st\_mtimensec} e \var{st\_mtimensec}. Qualora il
3107 supporto per questa maggior precisione sia assente questi campi aggiuntivi
3108 saranno nulli.
3109
3110 Per la gestione di questi nuovi valori è stata definita una seconda funzione
3111 di modifica, \funcd{utimes}, che consente di specificare tempi con maggior
3112 precisione; il suo prototipo è:
3113 \begin{prototype}
3114   {sys/time.h}
3115   {int utimes(const char *filename, struct timeval times[2])} 
3116   Modifica i tempi di ultimo accesso e modifica di un file.
3117
3118   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3119     errore, nel qual caso \var{errno} assumerà uno dei valori:
3120     \begin{errlist}
3121     \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
3122     \item[\errcode{EPERM}] non si è proprietari del file.
3123     \end{errlist} 
3124     ed inoltre \errval{EROFS} e \errval{ENOENT}.}
3125 \end{prototype}
3126
3127 La funzione è del tutto analoga alla precedente \func{utime} ma usa come
3128 secondo argomento un vettore di due strutture \struct{timeval}, la cui
3129 definizione è riportata in fig.~\ref{fig:sys_timeval_struct}, che consentono
3130 di indicare i tempi con una precisione del microsecondo. Il primo elemento
3131 di \param{times} indica il valore per il tempo di ultimo accesso, il secondo
3132 quello per il tempo di ultima modifica. Se si indica come secondo argomento un
3133 puntatore nullo di nuovo verrà utilizzato il tempo corrente.
3134
3135 \begin{figure}[!htb]
3136   \footnotesize \centering
3137   \begin{minipage}[c]{\textwidth}
3138     \includestruct{listati/timeval.h}
3139   \end{minipage} 
3140   \normalsize 
3141   \caption{La struttura \structd{timeval} usata per indicare valori di tempo
3142     con la precisione del microsecondo.}
3143   \label{fig:sys_timeval_struct}
3144 \end{figure}
3145
3146 Oltre ad \func{utimes} su Linux sono presenti altre due funzioni,\footnote{le
3147   due funzioni non sono definite in nessuno standard, ma sono presenti, oltre
3148   che su Linux, anche su BSD.} \funcd{futimes} e \funcd{lutimes}, che
3149 consentono rispettivamente di effettuare la modifica utilizzando un file
3150 già aperto o di eseguirla direttamente su un link simbolico. I relativi
3151 prototipi sono:
3152 \begin{functions}
3153   \headdecl{sys/time.h} 
3154   
3155   \funcdecl{int futimes(int fd, const struct timeval tv[2])} Cambia i tempi
3156   di un file già aperto specificato tramite il file descriptor \param{fd}.
3157
3158   \funcdecl{int lutimes(const char *filename, const struct timeval tv[2])}
3159   Cambia i tempi di \param{filename} anche se questo è un link simbolico.
3160   
3161   
3162   \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
3163     errore, nel qual caso \var{errno} assumerà gli stessi valori di
3164     \func{utimes}, con in più per \func{futimes}:
3165   \begin{errlist}
3166   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
3167   \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3168   \end{errlist}}
3169 \end{functions}
3170
3171 Le due funzioni anno lo stesso comportamento di \texttt{utimes} e richiedono
3172 gli stessi privilegi per poter operare, la differenza è che con \func{futimes}
3173 si può indicare il file su cui operare facendo riferimento al relativo file
3174 descriptor mentre con \func{lutimes} nel caso in cui \param{filename} sia un
3175 link simbolico saranno modificati i suoi tempi invece di quelli del file a cui
3176 esso punta.
3177
3178 Nonostante il kernel, come accennato, supporti risoluzioni dei tempi dei file
3179 fino al nanosecondo, le funzioni fin qui esaminate non consentono di impostare
3180 valori con questa precisione. Per questo sono state introdotte due nuove
3181 funzioni, \funcd{futimens} e \func{utimensat}, in grado di eseguire questo
3182 compito; i rispettivi prototipi sono:
3183 \begin{functions}
3184   \headdecl{sys/time.h} 
3185   
3186   \funcdecl{futimens(int fd, const struct timespec times[2])} Cambia i tempi
3187   di un file già aperto, specificato dal file descriptor \param{fd}.
3188
3189   \funcdecl{int utimensat(int dirfd, const char *pathname, const struct
3190     timespec times[2], int flags)} Cambia i tempi del file \param{pathname}.
3191   
3192   
3193   \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
3194     errore, nel qual caso \var{errno} assumerà gli stessi valori di
3195     \func{utimes}, con in più per \func{futimes}:
3196   \begin{errlist}
3197   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
3198   \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3199   \end{errlist}}
3200 \end{functions}
3201
3202 Entrambe le funzioni utilizzano per indicare i valori dei tempi un
3203 vettore \param{times} di due strutture \struct{timespec} che permette di
3204 specificare un valore di tempo con una precisione fino al nanosecondo, la cui
3205 definizione è riportata in fig.~\ref{fig:sys_timespec_struct}.
3206
3207 \begin{figure}[!htb]
3208   \footnotesize \centering
3209   \begin{minipage}[c]{\textwidth}
3210     \includestruct{listati/timespec.h}
3211   \end{minipage} 
3212   \normalsize 
3213   \caption{La struttura \structd{timespec} usata per indicare valori di tempo
3214     con la precisione del nanosecondo.}
3215   \label{fig:sys_timespec_struct}
3216 \end{figure}
3217
3218 Come per le precedenti funzioni il primo elemento di \param{times} indica il
3219 tempo di ultimo accesso ed il secondo quello di ultima modifica, e se si usa
3220 il valore \val{NULL} verrà impostato il tempo corrente sia per l'ultimo
3221 accesso che per l'ultima modifica. Nei singoli elementi di \param{times} si
3222 possono inoltre utilizzare due valori speciali per il campo \var{tv\_nsec}:
3223 con \const{UTIME\_NOW} si richiede l'uso del tempo corrente, mentre con
3224 \const{UTIME\_OMIT} si richiede di non impostare il tempo. Si può così
3225 aggiornare in maniera specifica soltanto uno fra il tempo di ultimo accesso e
3226 quello di ultima modifica. Quando si usa uno di questi valori speciali per
3227 \var{tv\_nsec} il corrispondente valore di \var{tv\_sec} viene ignorato.
3228
3229 Queste due funzioni sono una estensione definita in una recente revisione
3230 dello standard POSIX (la POSIX.1-2008); sono state introdotte a partire dal
3231 kernel 2.6.22, e supportate dalle \acr{glibc} a partire dalla versione
3232 2.6.\footnote{in precedenza, a partire dal kernel 2.6.16, era stata introdotta
3233   la funzione \func{futimesat} seguendo una bozza della revisione dello
3234   standard poi modificata, questa funzione, sostituita da \func{utimensat}, è
3235   stata dichiarata obsoleta, non è supportata da nessuno standard e non deve
3236   essere più utilizzata: pertanto non la tratteremo.} La prima è
3237 sostanzialmente una estensione di \func{futimes} che consente di specificare i
3238 tempi con precisione maggiore, la seconda supporta invece, rispetto ad
3239 \func{utimes}, una sintassi più complessa che, come vedremo in
3240 sez.~\ref{sec:file_openat} consente una indicazione sicura dei
3241 \textit{pathname relativi} specificando la directory da usare come riferimento
3242 in \param{dirfd} e la possibilità di usare \param{flags} per indicare alla
3243 funzione di dereferenziare o meno i link simbolici; si rimanda pertanto la
3244 spiegazione del significato degli argomenti aggiuntivi alla trattazione
3245 generica delle varie funzioni che usano la stessa sintassi, effettuata in
3246 sez.~\ref{sec:file_openat}.
3247
3248
3249 \section{Il controllo di accesso ai file}
3250 \label{sec:file_access_control}
3251
3252 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
3253 del controllo di accesso ai file, che viene implementato per qualunque
3254 filesystem standard.\footnote{per standard si intende che implementa le
3255   caratteristiche previste dallo standard POSIX; in Linux sono disponibili
3256   anche una serie di altri filesystem, come quelli di Windows e del Mac, che
3257   non supportano queste caratteristiche.} In questa sezione ne esamineremo i
3258 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
3259
3260
3261 \subsection{I permessi per l'accesso ai file}
3262 \label{sec:file_perm_overview}
3263
3264 Ad ogni file Linux associa sempre l'utente che ne è proprietario (il
3265 cosiddetto \textit{owner}) ed un gruppo di appartenenza, secondo il meccanismo
3266 degli identificatori di utente e gruppo (\ids{UID} e \ids{GID}). Questi valori
3267 sono accessibili da programma tramite la funzione \func{stat}, e sono
3268 mantenuti nei campi \var{st\_uid} e \var{st\_gid} della struttura
3269 \struct{stat} (si veda sez.~\ref{sec:file_stat}).\footnote{questo è vero solo
3270   per filesystem di tipo Unix, ad esempio non è vero per il filesystem vfat di
3271   Windows, che non fornisce nessun supporto per l'accesso multiutente, e per
3272   il quale i permessi vengono assegnati in maniera fissa con un opzione in
3273   fase di montaggio.}
3274
3275 Il controllo di accesso ai file segue un modello abbastanza semplice che
3276 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
3277 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
3278     Control List} che sono state aggiunte ai filesystem standard con opportune
3279   estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
3280   controllo ancora più sofisticati come il \textit{mandatory access control}
3281   di SE-Linux.} ma nella maggior parte dei casi il meccanismo standard è più
3282 che sufficiente a soddisfare tutte le necessità più comuni.  I tre permessi di
3283 base associati ad ogni file sono:
3284 \begin{itemize*}
3285 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
3286   \textit{read}).
3287 \item il permesso di scrittura (indicato con la lettera \texttt{w},
3288   dall'inglese \textit{write}).
3289 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
3290   dall'inglese \textit{execute}).
3291 \end{itemize*}
3292 mentre i tre livelli su cui sono divisi i privilegi sono:
3293 \begin{itemize*}
3294 \item i privilegi per l'utente proprietario del file.
3295 \item i privilegi per un qualunque utente faccia parte del gruppo cui
3296   appartiene il file.
3297 \item i privilegi per tutti gli altri utenti.
3298 \end{itemize*}
3299
3300 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
3301 meno significativi sono usati a gruppi di tre per indicare i permessi base di
3302 lettura, scrittura ed esecuzione e sono applicati rispettivamente
3303 rispettivamente al proprietario, al gruppo, a tutti gli altri.
3304
3305 \begin{figure}[htb]
3306   \centering
3307   \includegraphics[width=6cm]{img/fileperm}
3308   \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
3309     contenuti nel campo \var{st\_mode} di \struct{stat}.}
3310   \label{fig:file_perm_bit}
3311 \end{figure}
3312
3313 I restanti tre bit (noti come \itindex{suid~bit} \textit{suid bit},
3314 \itindex{sgid~bit} \textit{sgid bit}, e \itindex{sticky~bit} \textit{sticky
3315   bit}) sono usati per indicare alcune caratteristiche più complesse del
3316 meccanismo del controllo di accesso su cui torneremo in seguito (in
3317 sez.~\ref{sec:file_special_perm}); lo schema di allocazione dei bit è
3318 riportato in fig.~\ref{fig:file_perm_bit}.
3319
3320 Anche i permessi, come tutte le altre informazioni pertinenti al file, sono
3321 memorizzati \itindex{inode} nell'\textit{inode}; in particolare essi sono
3322 contenuti in alcuni bit del campo \var{st\_mode} della struttura \struct{stat}
3323 (si veda di nuovo fig.~\ref{fig:file_stat_struct}).
3324
3325 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
3326 \cmd{u} (per \textit{user}), \cmd{g} (per \textit{group}) e \cmd{o} (per
3327 \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti insieme
3328 si usa la lettera \cmd{a} (per \textit{all}). Si tenga ben presente questa
3329 distinzione dato che in certi casi, mutuando la terminologia in uso nel VMS,
3330 si parla dei permessi base come di permessi per \textit{owner}, \textit{group}
3331 ed \textit{all}, le cui iniziali possono dar luogo a confusione.  Le costanti
3332 che permettono di accedere al valore numerico di questi bit nel campo
3333 \var{st\_mode} sono riportate in tab.~\ref{tab:file_bit_perm}.
3334
3335 \begin{table}[htb]
3336   \centering
3337     \footnotesize
3338   \begin{tabular}[c]{|c|l|}
3339     \hline
3340     \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
3341     \hline 
3342     \hline 
3343     \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
3344     \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
3345     \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\ 
3346     \hline            
3347     \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
3348     \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
3349     \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
3350     \hline            
3351     \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
3352     \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
3353     \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
3354     \hline              
3355   \end{tabular}
3356   \caption{I bit dei permessi di accesso ai file, come definiti in 
3357     \texttt{<sys/stat.h>}}
3358   \label{tab:file_bit_perm}
3359 \end{table}
3360
3361 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
3362 che si riferiscano a dei file, dei link simbolici o delle directory; qui ci
3363 limiteremo ad un riassunto delle regole generali, entrando nei dettagli più
3364 avanti.
3365
3366 La prima regola è che per poter accedere ad un file attraverso il suo
3367 \itindex{pathname} \textit{pathname} occorre il permesso di esecuzione in
3368 ciascuna delle directory che compongono il \textit{pathname}; lo stesso vale
3369 per aprire un file nella directory corrente (per la quale appunto serve il
3370 diritto di esecuzione).
3371
3372 Per una directory infatti il permesso di esecuzione significa che essa può
3373 essere attraversata nella risoluzione del \itindex{pathname}
3374 \textit{pathname}, ed è distinto dal permesso di lettura che invece implica
3375 che si può leggere il contenuto della directory.
3376
3377 Questo significa che se si ha il permesso di esecuzione senza permesso di
3378 lettura si potrà lo stesso aprire un file in una directory (se si hanno i
3379 permessi opportuni per il medesimo) ma non si potrà vederlo con \cmd{ls}
3380 (mentre per crearlo occorrerà anche il permesso di scrittura per la
3381 directory).
3382
3383 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
3384 (si veda quanto riportato in tab.~\ref{tab:file_open_flags}) di sola lettura o
3385 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
3386 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
3387 il contenuto, lo stesso permesso è necessario per poter troncare il file.
3388
3389 Non si può creare un file fintanto che non si disponga del permesso di
3390 esecuzione e di quello di scrittura per la directory di destinazione; gli
3391 stessi permessi occorrono per cancellare un file da una directory (si ricordi
3392 che questo non implica necessariamente la rimozione del contenuto del file dal
3393 disco), non è necessario nessun tipo di permesso per il file stesso (infatti
3394 esso non viene toccato, viene solo modificato il contenuto della directory,
3395 rimuovendo la voce che ad esso fa riferimento).
3396
3397 Per poter eseguire un file (che sia un programma compilato od uno script di
3398 shell, od un altro tipo di file eseguibile riconosciuto dal kernel), occorre
3399 avere il permesso di esecuzione, inoltre solo i file regolari possono essere
3400 eseguiti.
3401
3402 I permessi per un link simbolico sono ignorati, contano quelli del file a cui
3403 fa riferimento; per questo in genere il comando \cmd{ls} riporta per un link
3404 simbolico tutti i permessi come concessi; utente e gruppo a cui esso
3405 appartiene vengono pure ignorati quando il link viene risolto, vengono
3406 controllati solo quando viene richiesta la rimozione del link e quest'ultimo è
3407 in una directory con lo \itindex{sticky~bit} \textit{sticky bit} impostato (si
3408 veda sez.~\ref{sec:file_special_perm}).
3409
3410 La procedura con cui il kernel stabilisce se un processo possiede un certo
3411 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
3412 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
3413 \var{st\_gid} accennati in precedenza) e l'\ids{UID} effettivo, il \ids{GID}
3414 effettivo e gli eventuali \ids{GID} supplementari del processo.\footnote{in
3415   realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
3416   identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
3417   sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
3418   eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
3419   differenza.}
3420
3421 Per una spiegazione dettagliata degli identificatori associati ai processi si
3422 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
3423 sez.~\ref{sec:file_special_perm}, l'\ids{UID} effettivo e il \ids{GID} effettivo
3424 corrispondono ai valori dell'\ids{UID} e del \ids{GID} dell'utente che ha
3425 lanciato il processo, mentre i \ids{GID} supplementari sono quelli dei gruppi
3426 cui l'utente appartiene.
3427
3428 I passi attraverso i quali viene stabilito se il processo possiede il diritto
3429 di accesso sono i seguenti:
3430 \begin{enumerate}
3431 \item Se l'\ids{UID} effettivo del processo è zero (corrispondente
3432   all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
3433   controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
3434   tutti i file.
3435 \item Se l'\ids{UID} effettivo del processo è uguale all'\ids{UID} del
3436   proprietario del file (nel qual caso si dice che il processo è proprietario
3437   del file) allora:
3438   \begin{itemize*}
3439   \item se il relativo\footnote{per relativo si intende il bit di user-read se
3440       il processo vuole accedere in lettura, quello di user-write per
3441       l'accesso in scrittura, ecc.} bit dei permessi d'accesso dell'utente è
3442     impostato, l'accesso è consentito
3443   \item altrimenti l'accesso è negato
3444   \end{itemize*}
3445 \item Se il \ids{GID} effettivo del processo o uno dei \ids{GID} supplementari
3446   dei processi corrispondono al \ids{GID} del file allora:
3447   \begin{itemize*}
3448   \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
3449     consentito, 
3450   \item altrimenti l'accesso è negato
3451   \end{itemize*}
3452 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
3453   l'accesso è consentito, altrimenti l'accesso è negato.
3454 \end{enumerate}
3455
3456 Si tenga presente che questi passi vengono eseguiti esattamente in
3457 quest'ordine. Questo vuol dire che se un processo è il proprietario di un file,
3458 l'accesso è consentito o negato solo sulla base dei permessi per l'utente; i
3459 permessi per il gruppo non vengono neanche controllati. Lo stesso vale se il
3460 processo appartiene ad un gruppo appropriato, in questo caso i permessi per
3461 tutti gli altri non vengono controllati.
3462
3463
3464 \subsection{I bit dei permessi speciali}
3465 \label{sec:file_special_perm}
3466
3467 \itindbeg{suid~bit}
3468 \itindbeg{sgid~bit}
3469
3470 Come si è accennato (in sez.~\ref{sec:file_perm_overview}) nei dodici bit del
3471 campo \var{st\_mode} di \struct{stat} che vengono usati per il controllo di
3472 accesso oltre ai bit dei permessi veri e propri, ci sono altri tre bit che
3473 vengono usati per indicare alcune proprietà speciali dei file.  Due di questi
3474 sono i bit detti \acr{suid} (da \textit{set-user-ID bit}) e \acr{sgid} (da
3475 \textit{set-group-ID bit}) che sono identificati dalle costanti
3476 \const{S\_ISUID} e \const{S\_ISGID}.
3477
3478 Come spiegato in dettaglio in sez.~\ref{sec:proc_exec}, quando si lancia un
3479 programma il comportamento normale del kernel è quello di impostare gli
3480 identificatori del gruppo \textit{effective} del nuovo processo al valore dei
3481 corrispondenti del gruppo \textit{real} del processo corrente, che normalmente
3482 corrispondono a quelli dell'utente con cui si è entrati nel sistema.
3483
3484 Se però il file del programma (che ovviamente deve essere
3485 eseguibile\footnote{per motivi di sicurezza il kernel ignora i bit \acr{suid}
3486   e \acr{sgid} per gli script eseguibili.}) ha il bit \acr{suid} impostato, il
3487 kernel assegnerà come \ids{UID} effettivo al nuovo processo l'\ids{UID} del
3488 proprietario del file al posto dell'\ids{UID} del processo originario.  Avere
3489 il bit \acr{sgid} impostato ha lo stesso effetto sul \ids{GID} effettivo del
3490 processo.
3491
3492 I bit \acr{suid} e \acr{sgid} vengono usati per permettere agli utenti normali
3493 di usare programmi che richiedono privilegi speciali; l'esempio classico è il
3494 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
3495 quest'ultimo ovviamente può essere scritto solo dall'amministratore, ma non è
3496 necessario chiamare l'amministratore per cambiare la propria password. Infatti
3497 il comando \cmd{passwd} appartiene a root ma ha il bit \acr{suid} impostato
3498 per cui quando viene lanciato da un utente normale parte con i privilegi di
3499 root.
3500
3501 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
3502 normalmente l'utente che lo ha lanciato comporta vari rischi, e questo tipo di
3503 programmi devono essere scritti accuratamente per evitare che possano essere
3504 usati per guadagnare privilegi non consentiti (l'argomento è affrontato in
3505 dettaglio in sez.~\ref{sec:proc_perms}).
3506
3507 La presenza dei bit \acr{suid} e \acr{sgid} su un file può essere rilevata con
3508 il comando \cmd{ls -l}, che visualizza una lettera \cmd{s} al posto della
3509 \cmd{x} in corrispondenza dei permessi di utente o gruppo. La stessa lettera
3510 \cmd{s} può essere usata nel comando \cmd{chmod} per impostare questi bit.
3511 Infine questi bit possono essere controllati all'interno di \var{st\_mode} con
3512 l'uso delle due costanti \const{S\_ISUID} e \const{S\_IGID}, i cui valori sono
3513 riportati in tab.~\ref{tab:file_mode_flags}.
3514
3515 Gli stessi bit vengono ad assumere in significato completamente diverso per le
3516 directory, normalmente infatti Linux usa la convenzione di SVr4 per indicare
3517 con questi bit l'uso della semantica BSD nella creazione di nuovi file (si
3518 veda sez.~\ref{sec:file_ownership_management} per una spiegazione dettagliata
3519 al proposito).
3520
3521 Infine Linux utilizza il bit \acr{sgid} per un'ulteriore estensione mutuata
3522 da SVr4. Il caso in cui un file ha il bit \acr{sgid} impostato senza che lo
3523 sia anche il corrispondente bit di esecuzione viene utilizzato per attivare
3524 per quel file il \itindex{mandatory~locking} \textit{mandatory locking}
3525 (affronteremo questo argomento in dettaglio più avanti, in
3526 sez.~\ref{sec:file_mand_locking}).
3527
3528 \itindend{suid~bit}
3529 \itindend{sgid~bit}
3530
3531
3532 \itindbeg{sticky~bit}
3533
3534 L'ultimo dei bit rimanenti, identificato dalla costante \const{S\_ISVTX}, è in
3535 parte un rimasuglio delle origini dei sistemi Unix. A quell'epoca infatti la
3536 memoria virtuale e l'accesso ai file erano molto meno sofisticati e per
3537 ottenere la massima velocità possibile per i programmi usati più comunemente
3538 si poteva impostare questo bit.
3539
3540 L'effetto di questo bit era che il \index{segmento!testo} segmento di testo
3541 del programma (si veda sez.~\ref{sec:proc_mem_layout} per i dettagli) veniva
3542 scritto nella swap la prima volta che questo veniva lanciato, e vi permaneva
3543 fino al riavvio della macchina (da questo il nome di \textsl{sticky bit});
3544 essendo la swap un file continuo o una partizione indicizzata direttamente si
3545 poteva risparmiare in tempo di caricamento rispetto alla ricerca attraverso la
3546 struttura del filesystem. Lo \textsl{sticky bit} è indicato usando la lettera
3547 \texttt{t} al posto della \texttt{x} nei permessi per gli altri.
3548
3549 Ovviamente per evitare che gli utenti potessero intasare la swap solo
3550 l'amministratore era in grado di impostare questo bit, che venne chiamato
3551 anche con il nome di \textit{saved text bit}, da cui deriva quello della
3552 costante.  Le attuali implementazioni di memoria virtuale e filesystem rendono
3553 sostanzialmente inutile questo procedimento.
3554
3555 Benché ormai non venga più utilizzato per i file, lo \textit{sticky bit} ha
3556 invece assunto un uso importante per le directory;\footnote{lo \textit{sticky
3557     bit} per le directory è un'estensione non definita nello standard POSIX,
3558   Linux però la supporta, così come BSD e SVr4.} in questo caso se tale bit è
3559 impostato un file potrà essere rimosso dalla directory soltanto se l'utente ha
3560 il permesso di scrittura su di essa ed inoltre è vera una delle seguenti
3561 condizioni:
3562 \begin{itemize*}
3563 \item l'utente è proprietario del file
3564 \item l'utente è proprietario della directory
3565 \item l'utente è l'amministratore 
3566 \end{itemize*}
3567 un classico esempio di directory che ha questo bit impostato è \file{/tmp}, i
3568 permessi infatti di solito sono i seguenti:
3569 \begin{verbatim}
3570 $ ls -ld /tmp
3571 drwxrwxrwt    6 root     root         1024 Aug 10 01:03 /tmp
3572 \end{verbatim}%$
3573 quindi con lo \textit{sticky bit} bit impostato. In questo modo qualunque
3574 utente nel sistema può creare dei file in questa directory (che, come
3575 suggerisce il nome, è normalmente utilizzata per la creazione di file
3576 temporanei), ma solo l'utente che ha creato un certo file potrà cancellarlo o
3577 rinominarlo. In questo modo si evita che un utente possa, più o meno
3578 consapevolmente, cancellare i file temporanei creati degli altri utenti.
3579
3580 \itindend{sticky~bit}
3581
3582 \subsection{Le funzioni per la gestione dei permessi dei file}
3583 \label{sec:file_perm_management}
3584
3585 Come visto in sez.~\ref{sec:file_access_control} il controllo di accesso ad un
3586 file viene fatto utilizzando l'\ids{UID} ed il \ids{GID} effettivo del processo;
3587 ci sono casi però in cui si può voler effettuare il controllo con l'\ids{UID}
3588 reale ed il \ids{GID} reale, vale a dire usando i valori di \ids{UID} e
3589 \ids{GID} relativi all'utente che ha lanciato il programma, e che, come
3590 accennato in sez.~\ref{sec:file_special_perm} e spiegato in dettaglio in
3591 sez.~\ref{sec:proc_perms}, non è detto siano uguali a quelli effettivi.
3592
3593 Per far questo si può usare la funzione \funcd{access}, il cui prototipo è:
3594 \begin{prototype}{unistd.h}
3595 {int access(const char *pathname, int mode)}
3596
3597 Verifica i permessi di accesso.
3598   
3599 \bodydesc{La funzione ritorna 0 se l'accesso è consentito, -1 se l'accesso non
3600   è consentito ed in caso di errore; nel qual caso la variabile \var{errno}
3601   assumerà i valori:
3602   \begin{errlist}
3603   \item[\errcode{EINVAL}] il valore di \param{mode} non è valido.
3604   \item[\errcode{EACCES}] l'accesso al file non è consentito, o non si ha il
3605     permesso di attraversare una delle directory di \param{pathname}.
3606   \item[\errcode{EROFS}] si è richiesto l'accesso in scrittura per un file su
3607     un filesystem montato in sola lettura.
3608   \end{errlist}
3609   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
3610   \errval{ENOTDIR}, \errval{ELOOP}, \errval{EIO}.}
3611 \end{prototype}
3612
3613 La funzione verifica i permessi di accesso, indicati da \param{mode}, per il
3614 file indicato da \param{pathname}. I valori possibili per l'argomento
3615 \param{mode} sono esprimibili come combinazione delle costanti numeriche
3616 riportate in tab.~\ref{tab:file_access_mode_val} (attraverso un OR binario
3617 delle stesse). I primi tre valori implicano anche la verifica dell'esistenza
3618 del file, se si vuole verificare solo quest'ultima si può usare \const{F\_OK},
3619 o anche direttamente \func{stat}. Nel caso in cui \param{pathname} si
3620 riferisca ad un link simbolico, questo viene seguito ed il controllo è fatto
3621 sul file a cui esso fa riferimento.
3622
3623 La funzione controlla solo i bit dei permessi di accesso, si ricordi che il
3624 fatto che una directory abbia permesso di scrittura non significa che ci si
3625 possa scrivere come in un file, e il fatto che un file abbia permesso di
3626 esecuzione non comporta che contenga un programma eseguibile. La funzione
3627 ritorna zero solo se tutte i permessi controllati sono disponibili, in caso
3628 contrario (o di errore) ritorna -1.
3629 \begin{table}[htb]
3630   \centering
3631   \footnotesize
3632   \begin{tabular}{|c|l|}
3633     \hline
3634     \textbf{\param{mode}} & \textbf{Significato} \\
3635     \hline
3636     \hline
3637     \const{R\_OK} & Verifica il permesso di lettura. \\
3638     \const{W\_OK} & Verifica il permesso di scrittura. \\
3639     \const{X\_OK} & Verifica il permesso di esecuzione. \\
3640     \const{F\_OK} & Verifica l'esistenza del file. \\
3641     \hline
3642   \end{tabular}
3643   \caption{Valori possibile per l'argomento \param{mode} della funzione 
3644     \func{access}.}
3645   \label{tab:file_access_mode_val}
3646 \end{table}
3647
3648 Un esempio tipico per l'uso di questa funzione è quello di un processo che sta
3649 eseguendo un programma coi privilegi di un altro utente (ad esempio attraverso
3650 l'uso del \itindex{suid~bit} \textit{suid bit}) che vuole controllare se
3651 l'utente originale ha i permessi per accedere ad un certo file.
3652
3653 Del tutto analoghe a \func{access} sono le due funzioni \funcd{euidaccess} e
3654 \funcd{eaccess} che ripetono lo stesso controllo usando però gli
3655 identificatori del gruppo effettivo, verificando quindi le effettive capacità
3656 di accesso ad un file. Le funzioni hanno entrambe lo stesso
3657 prototipo\footnote{in realtà \func{eaccess} è solo un sinonimo di
3658   \func{euidaccess} fornita per compatibilità con l'uso di questo nome in
3659   altri sistemi.} che è del tutto identico a quello di \func{access}. Prendono
3660 anche gli stessi valori e restituiscono gli stessi risultati e gli stessi
3661 codici di errore.
3662
3663 Per cambiare i permessi di un file il sistema mette ad disposizione due
3664 funzioni \funcd{chmod} e \funcd{fchmod}, che operano rispettivamente su un
3665 filename e su un file descriptor, i loro prototipi sono:
3666 \begin{functions}
3667   \headdecl{sys/types.h} 
3668   \headdecl{sys/stat.h} 
3669   
3670   \funcdecl{int chmod(const char *path, mode\_t mode)} Cambia i permessi del
3671   file indicato da \param{path} al valore indicato da \param{mode}.
3672   
3673   \funcdecl{int fchmod(int fd, mode\_t mode)} Analoga alla precedente, ma usa
3674   il file descriptor \param{fd} per indicare il file.
3675   
3676   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
3677     un errore, in caso di errore \var{errno} può assumere i valori:
3678   \begin{errlist}
3679   \item[\errcode{EPERM}] l'\ids{UID} effettivo non corrisponde a quello del
3680     proprietario del file o non è zero.
3681     \item[\errcode{EROFS}] il file è su un filesystem in sola lettura.
3682   \end{errlist}
3683   ed inoltre \errval{EIO}; \func{chmod} restituisce anche \errval{EFAULT},
3684   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
3685   \errval{EACCES}, \errval{ELOOP}; \func{fchmod} anche \errval{EBADF}.}
3686 \end{functions}
3687
3688 Entrambe le funzioni utilizzano come secondo argomento \param{mode}, una
3689 variabile dell'apposito tipo primitivo \type{mode\_t} (vedi
3690 tab.~\ref{tab:intro_primitive_types}) utilizzato per specificare i permessi sui
3691 file.
3692
3693 \begin{table}[!htb]
3694   \centering
3695   \footnotesize
3696   \begin{tabular}[c]{|c|c|l|}
3697     \hline
3698     \textbf{\param{mode}} & \textbf{Valore} & \textbf{Significato} \\
3699     \hline
3700     \hline
3701     \const{S\_ISUID} & 04000 & Set user ID \itindex{suid~bit}.\\
3702     \const{S\_ISGID} & 02000 & Set group ID \itindex{sgid~bit}.\\
3703     \const{S\_ISVTX} & 01000 & Sticky bit \itindex{sticky~bit}.\\
3704     \hline
3705     \const{S\_IRWXU} & 00700 & L'utente ha tutti i permessi.\\
3706     \const{S\_IRUSR} & 00400 & L'utente ha il permesso di lettura.\\
3707     \const{S\_IWUSR} & 00200 & L'utente ha il permesso di scrittura.\\
3708     \const{S\_IXUSR} & 00100 & L'utente ha il permesso di esecuzione.\\
3709     \hline
3710     \const{S\_IRWXG} & 00070 & Il gruppo ha tutti i permessi.\\
3711     \const{S\_IRGRP} & 00040 & Il gruppo ha il permesso di lettura.\\
3712     \const{S\_IWGRP} & 00020 & Il gruppo ha il permesso di scrittura.\\
3713     \const{S\_IXGRP} & 00010 & Il gruppo ha il permesso di esecuzione.\\
3714     \hline
3715     \const{S\_IRWXO} & 00007 & Gli altri hanno tutti i permessi.\\
3716     \const{S\_IROTH} & 00004 & Gli altri hanno il permesso di lettura.\\
3717     \const{S\_IWOTH} & 00002 & Gli altri hanno il permesso di scrittura.\\
3718     \const{S\_IXOTH} & 00001 & Gli altri hanno il permesso di esecuzione.\\
3719     \hline
3720   \end{tabular}
3721   \caption{Valori delle costanti usate per indicare i vari bit di
3722     \param{mode} utilizzato per impostare i permessi dei file.}
3723   \label{tab:file_permission_const}
3724 \end{table}
3725
3726 Le costanti con cui specificare i singoli bit di \param{mode} sono riportate
3727 in tab.~\ref{tab:file_permission_const}. Il valore di \param{mode} può essere
3728 ottenuto combinando fra loro con un OR binario le costanti simboliche relative
3729 ai vari bit, o specificato direttamente, come per l'omonimo comando di shell,
3730 con un valore numerico (la shell lo vuole in ottale, dato che i bit dei
3731 permessi sono divisibili in gruppi di tre), che si può calcolare direttamente
3732 usando lo schema si utilizzo dei bit illustrato in
3733 fig.~\ref{fig:file_perm_bit}.
3734
3735 Ad esempio i permessi standard assegnati ai nuovi file (lettura e scrittura
3736 per il proprietario, sola lettura per il gruppo e gli altri) sono
3737 corrispondenti al valore ottale $0644$, un programma invece avrebbe anche il
3738 bit di esecuzione attivo, con un valore di $0755$, se si volesse attivare il
3739 bit \itindex{suid~bit} \acr{suid} il valore da fornire sarebbe $4755$.
3740
3741 Il cambiamento dei permessi di un file eseguito attraverso queste funzioni ha
3742 comunque alcune limitazioni, previste per motivi di sicurezza. L'uso delle
3743 funzioni infatti è possibile solo se l'\ids{UID} effettivo del processo
3744 corrisponde a quello del proprietario del file o dell'amministratore,
3745 altrimenti esse falliranno con un errore di \errcode{EPERM}.
3746
3747 Ma oltre a questa regola generale, di immediata comprensione, esistono delle
3748 limitazioni ulteriori. Per questo motivo, anche se si è proprietari del file,
3749 non tutti i valori possibili di \param{mode} sono permessi o hanno effetto;
3750 in particolare accade che:
3751 \begin{enumerate}
3752 \item siccome solo l'amministratore può impostare lo \itindex{sticky~bit}
3753   \textit{sticky bit}, se l'\ids{UID} effettivo del processo non è zero esso
3754   viene automaticamente cancellato (senza notifica di errore) qualora sia
3755   stato indicato in \param{mode}.
3756 \item per quanto detto in sez.~\ref{sec:file_ownership_management} riguardo la
3757   creazione dei nuovi file, si può avere il caso in cui il file creato da un
3758   processo è assegnato ad un gruppo per il quale il processo non ha privilegi.
3759   Per evitare che si possa assegnare il bit \itindex{sgid~bit} \acr{sgid} ad
3760   un file appartenente ad un gruppo per cui non si hanno diritti, questo viene
3761   automaticamente cancellato da \param{mode} (senza notifica di errore)
3762   qualora il gruppo del file non corrisponda a quelli associati al processo
3763   (la cosa non avviene quando l'\ids{UID} effettivo del processo è zero).
3764 \end{enumerate}
3765
3766 Per alcuni filesystem\footnote{i filesystem più comuni (\textsl{ext2},
3767   \textsl{ext3}, \textsl{ext4}, \textsl{ReiserFS}) supportano questa
3768   caratteristica, che è mutuata da BSD.} è inoltre prevista un'ulteriore
3769 misura di sicurezza, volta a scongiurare l'abuso dei \itindex{suid~bit} bit
3770 \acr{suid} e \acr{sgid}; essa consiste nel cancellare automaticamente questi
3771 bit dai permessi di un file qualora un processo che non appartenga
3772 all'amministratore\footnote{per la precisione un processo che non dispone
3773   della \itindex{capabilities} capacità \const{CAP\_FSETID}, vedi
3774   sez.~\ref{sec:proc_capabilities}.} effettui una scrittura. In questo modo
3775 anche se un utente malizioso scopre un file \acr{suid} su cui può scrivere,
3776 un'eventuale modifica comporterà la perdita di questo privilegio.
3777
3778 Le funzioni \func{chmod} e \func{fchmod} ci permettono di modificare i
3779 permessi di un file, resta però il problema di quali sono i permessi assegnati
3780 quando il file viene creato. Le funzioni dell'interfaccia nativa di Unix, come
3781 vedremo in sez.~\ref{sec:file_open}, permettono di indicare esplicitamente i
3782 permessi di creazione di un file, ma questo non è possibile per le funzioni
3783 dell'interfaccia standard ANSI C che non prevede l'esistenza di utenti e
3784 gruppi, ed inoltre il problema si pone anche per l'interfaccia nativa quando i
3785 permessi non vengono indicati esplicitamente. 
3786
3787 \itindbeg{umask} 
3788
3789 Per le funzioni dell'interfaccia standard ANSI C l'unico riferimento possibile
3790 è quello della modalità di apertura del nuovo file (lettura/scrittura o sola
3791 lettura), che però può fornire un valore che è lo stesso per tutti e tre i
3792 permessi di sez.~\ref{sec:file_perm_overview} (cioè $666$ nel primo caso e
3793 $222$ nel secondo). Per questo motivo il sistema associa ad ogni
3794 processo\footnote{è infatti contenuta nel campo \var{umask} della struttura
3795   \struct{fs\_struct}, vedi fig.~\ref{fig:proc_task_struct}.}  una maschera di
3796 bit, la cosiddetta \textit{umask}, che viene utilizzata per impedire che
3797 alcuni permessi possano essere assegnati ai nuovi file in sede di creazione. I
3798 bit indicati nella maschera vengono infatti cancellati dai permessi quando un
3799 nuovo file viene creato.\footnote{l'operazione viene fatta sempre: anche
3800   qualora si indichi esplicitamente un valore dei permessi nelle funzioni di
3801   creazione che lo consentono, i permessi contenuti nella \textit{umask}
3802   verranno tolti.}
3803
3804 La funzione che permette di impostare il valore di questa maschera di
3805 controllo è \funcd{umask}, ed il suo prototipo è:
3806 \begin{prototype}{stat.h}
3807 {mode\_t umask(mode\_t mask)}
3808
3809 Imposta la maschera dei permessi dei bit al valore specificato da \param{mask}
3810 (di cui vengono presi solo i 9 bit meno significativi).
3811   
3812   \bodydesc{La funzione ritorna il precedente valore della maschera. È una
3813     delle poche funzioni che non restituisce codici di errore.}
3814 \end{prototype}
3815
3816 In genere si usa questa maschera per impostare un valore predefinito che
3817 escluda preventivamente alcuni permessi (usualmente quello di scrittura per il
3818 gruppo e gli altri, corrispondente ad un valore per \param{mask} pari a
3819 $022$).  In questo modo è possibile cancellare automaticamente i permessi non
3820 voluti.  Di norma questo valore viene impostato una volta per tutte al login a
3821 $022$, e gli utenti non hanno motivi per modificarlo.
3822
3823 \itindend{umask} 
3824
3825
3826 \subsection{La gestione della titolarità dei file}
3827 \label{sec:file_ownership_management}
3828
3829 Vedremo in sez.~\ref{sec:file_base_func} con quali funzioni si possono creare
3830 nuovi file, in tale occasione vedremo che è possibile specificare in sede di
3831 creazione quali permessi applicare ad un file, però non si può indicare a
3832 quale utente e gruppo esso deve appartenere.  Lo stesso problema si presenta
3833 per la creazione di nuove directory (procedimento descritto in
3834 sez.~\ref{sec:file_dir_creat_rem}).
3835
3836 Lo standard POSIX prescrive che l'\ids{UID} del nuovo file corrisponda
3837 all'\ids{UID} effettivo del processo che lo crea; per il \ids{GID} invece
3838 prevede due diverse possibilità:
3839 \begin{itemize*}
3840 \item il \ids{GID} del file corrisponde al \ids{GID} effettivo del processo.
3841 \item il \ids{GID} del file corrisponde al \ids{GID} della directory in cui
3842   esso è creato.
3843 \end{itemize*}
3844 in genere BSD usa sempre la seconda possibilità, che viene per questo chiamata
3845 semantica BSD. Linux invece segue quella che viene chiamata semantica SVr4; di
3846 norma cioè il nuovo file viene creato, seguendo la prima opzione, con il
3847 \ids{GID} del processo, se però la directory in cui viene creato il file ha il
3848 bit \acr{sgid} impostato allora viene usata la seconda opzione.
3849
3850 Usare la semantica BSD ha il vantaggio che il \ids{GID} viene sempre
3851 automaticamente propagato, restando coerente a quello della directory di
3852 partenza, in tutte le sotto-directory. 
3853
3854 La semantica SVr4 offre la possibilità di scegliere, ma per ottenere lo stesso
3855 risultato di coerenza che si ha con BSD necessita che quando si creano nuove
3856 directory venga anche propagato anche il bit \acr{sgid}. Questo è il
3857 comportamento predefinito del comando \cmd{mkdir}, ed è in questo modo ad
3858 esempio che le varie distribuzioni assicurano che le sotto-directory create
3859 nella home di un utente restino sempre con il \ids{GID} del gruppo primario
3860 dello stesso.
3861
3862 La presenza del bit \acr{sgid} è inoltre molto comoda quando si hanno
3863 directory contenenti file condivisi all'intero di un gruppo in cui possono
3864 scrivere tutti i membri dello stesso, dato che assicura che i file che gli
3865 utenti vi creano appartengano sempre allo stesso gruppo. Questo non risolve
3866 però completamente i problemi di accesso da parte di altri utenti dello stesso
3867 gruppo, in quanto i permessi assegnati al gruppo potrebbero non essere
3868 sufficienti; in tal caso si deve aver cura di usare un valore di
3869 \itindex{umask} \textit{umask} che ne lasci di sufficienti.\footnote{in tal
3870   caso si può assegnare agli utenti del gruppo una \textit{umask} di $002$,
3871   anche se la soluzione migliore in questo caso è usare una ACL di default
3872   (vedi sez.~\ref{sec:file_ACL}).}
3873
3874 Come avviene nel caso dei permessi il sistema fornisce anche delle funzioni,
3875 \funcd{chown}, \funcd{fchown} e \funcd{lchown}, che permettono di cambiare sia
3876 l'utente che il gruppo a cui un file appartiene; i rispettivi prototipi sono:
3877 \begin{functions}
3878   \headdecl{sys/types.h} 
3879   \headdecl{sys/stat.h} 
3880   
3881   \funcdecl{int chown(const char *path, uid\_t owner, gid\_t group)}
3882   \funcdecl{int fchown(int fd, uid\_t owner, gid\_t group)}
3883   \funcdecl{int lchown(const char *path, uid\_t owner, gid\_t group)}
3884
3885   Le funzioni cambiano utente e gruppo di appartenenza di un file ai valori
3886   specificati dalle variabili \param{owner} e \param{group}. 
3887   
3888   \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
3889     errore, nel qual caso caso \var{errno} assumerà i valori:
3890   \begin{errlist}
3891   \item[\errcode{EPERM}] l'\ids{UID} effettivo non corrisponde a quello del
3892     proprietario del file o non è zero, o utente e gruppo non sono validi
3893   \end{errlist}
3894   Oltre a questi entrambe restituiscono gli errori \errval{EROFS} e
3895   \errval{EIO}; \func{chown} restituisce anche \errval{EFAULT},
3896   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
3897   \errval{EACCES}, \errval{ELOOP}; \func{fchown} anche \errval{EBADF}.}
3898 \end{functions}
3899
3900 Con Linux solo l'amministratore\footnote{o in generale un processo con la
3901   \itindex{capabilities} capacità \const{CAP\_CHOWN}, vedi
3902   sez.~\ref{sec:proc_capabilities}.} può cambiare il proprietario di un file;
3903 in questo viene seguita la semantica usata da BSD che non consente agli utenti
3904 di assegnare i loro file ad altri utenti evitando eventuali aggiramenti delle
3905 quote.  L'amministratore può cambiare sempre il gruppo di un file, il
3906 proprietario può cambiare il gruppo solo dei file che gli appartengono e solo
3907 se il nuovo gruppo è il suo gruppo primario o uno dei gruppi di cui fa parte.
3908
3909 La funzione \func{chown} segue i link simbolici, per operare direttamente su
3910 un link simbolico si deve usare la funzione \func{lchown}.\footnote{fino alla
3911   versione 2.1.81 in Linux \func{chown} non seguiva i link simbolici, da
3912   allora questo comportamento è stato assegnato alla funzione \func{lchown},
3913   introdotta per l'occasione, ed è stata creata una nuova system call per
3914   \func{chown} che seguisse i link simbolici.} La funzione \func{fchown} opera
3915 su un file aperto, essa è mutuata da BSD, ma non è nello standard POSIX.
3916 Un'altra estensione rispetto allo standard POSIX è che specificando -1 come
3917 valore per \param{owner} e \param{group} i valori restano immutati.
3918
3919 Quando queste funzioni sono chiamate con successo da un processo senza i
3920 privilegi di root entrambi i bit \itindex{suid~bit} \acr{suid} e
3921 \itindex{sgid~bit} \acr{sgid} vengono cancellati. Questo non avviene per il
3922 bit \acr{sgid} nel caso in cui esso sia usato (in assenza del corrispondente
3923 permesso di esecuzione) per indicare che per il file è attivo il
3924 \itindex{mandatory~locking} \textit{mandatory locking} (vedi
3925 sez.~\ref{sec:file_mand_locking}).
3926
3927
3928 \subsection{Un quadro d'insieme sui permessi}
3929 \label{sec:file_riepilogo}
3930
3931 Avendo affrontato in maniera separata il comportamento delle varie funzioni
3932 che operano sui permessi dei file ed avendo trattato in sezioni diverse il
3933 significato dei singoli bit dei permessi, vale la pena di fare un riepilogo in
3934 cui si riassumano le caratteristiche di ciascuno di essi, in modo da poter
3935 fornire un quadro d'insieme.
3936
3937 \begin{table}[!htb]
3938   \centering
3939   \footnotesize
3940   \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
3941     \hline
3942     \multicolumn{3}{|c|}{special}&
3943     \multicolumn{3}{|c|}{user}&
3944     \multicolumn{3}{|c|}{group}&
3945     \multicolumn{3}{|c|}{other}&
3946     \multirow{2}{*}{\textbf{Significato per i file}} \\
3947     \cline{1-12}
3948     \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
3949     \hline
3950     \hline
3951    1&-&-&-&-&-&-&-&-&-&-&-&Se eseguito ha i permessi del proprietario.\\
3952    -&1&-&-&-&1&-&-&-&-&-&-&Se eseguito ha i permessi del gruppo proprietario.\\
3953    -&1&-&-&-&0&-&-&-&-&-&-&Il \itindex{mandatory~locking} 
3954                            \textit{mandatory locking} è abilitato.\\
3955    -&-&1&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
3956    -&-&-&1&-&-&-&-&-&-&-&-&Permesso di lettura per il proprietario.\\
3957    -&-&-&-&1&-&-&-&-&-&-&-&Permesso di scrittura per il proprietario.\\
3958    -&-&-&-&-&1&-&-&-&-&-&-&Permesso di esecuzione per il proprietario.\\
3959    -&-&-&-&-&-&1&-&-&-&-&-&Permesso di lettura per il gruppo proprietario.\\
3960    -&-&-&-&-&-&-&1&-&-&-&-&Permesso di scrittura per il gruppo proprietario.\\
3961    -&-&-&-&-&-&-&-&1&-&-&-&Permesso di esecuzione per il gruppo proprietario.\\
3962    -&-&-&-&-&-&-&-&-&1&-&-&Permesso di lettura per tutti gli altri.\\
3963    -&-&-&-&-&-&-&-&-&-&1&-&Permesso di scrittura per tutti gli altri.\\
3964    -&-&-&-&-&-&-&-&-&-&-&1&Permesso di esecuzione per tutti gli altri.\\
3965     \hline
3966     \hline
3967     \multicolumn{3}{|c|}{special}&
3968     \multicolumn{3}{|c|}{user}&
3969     \multicolumn{3}{|c|}{group}&
3970     \multicolumn{3}{|c|}{other}&
3971     \multirow{2}{*}{\textbf{Significato per le directory}} \\
3972     \cline{1-12}
3973     \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
3974     \hline
3975     \hline
3976     1&-&-&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
3977     -&1&-&-&-&-&-&-&-&-&-&-&Propaga il gruppo proprietario ai nuovi file 
3978                             creati.\\
3979     -&-&1&-&-&-&-&-&-&-&-&-&Limita l'accesso in scrittura dei file nella 
3980                             directory.\\
3981     -&-&-&1&-&-&-&-&-&-&-&-&Permesso di visualizzazione per il proprietario.\\
3982     -&-&-&-&1&-&-&-&-&-&-&-&Permesso di aggiornamento per il proprietario.\\
3983     -&-&-&-&-&1&-&-&-&-&-&-&Permesso di attraversamento per il proprietario.\\
3984     -&-&-&-&-&-&1&-&-&-&-&-&Permesso di visualizzazione per il gruppo 
3985                             proprietario.\\
3986     -&-&-&-&-&-&-&1&-&-&-&-&Permesso di aggiornamento per il gruppo 
3987                             proprietario.\\
3988     -&-&-&-&-&-&-&-&1&-&-&-&Permesso di attraversamento per il gruppo 
3989                             proprietario.\\
3990     -&-&-&-&-&-&-&-&-&1&-&-&Permesso di visualizzazione per tutti gli altri.\\
3991     -&-&-&-&-&-&-&-&-&-&1&-&Permesso di aggiornamento per tutti gli altri.\\
3992     -&-&-&-&-&-&-&-&-&-&-&1&Permesso di attraversamento per tutti gli altri.\\
3993     \hline
3994   \end{tabular}
3995   \caption{Tabella riassuntiva del significato dei bit dei permessi per un
3996     file e directory.} 
3997   \label{tab:file_fileperm_bits}
3998 \end{table}
3999
4000 Nella parte superiore di tab.~\ref{tab:file_fileperm_bits} si è riassunto il
4001 significato dei vari bit dei permessi per un file ordinario; per quanto
4002 riguarda l'applicazione dei permessi per proprietario, gruppo ed altri si
4003 ricordi quanto illustrato in sez.~\ref{sec:file_perm_overview}.  Per
4004 compattezza, nella tabella si sono specificati i bit di \itindex{suid~bit}
4005 \textit{suid}, \itindex{sgid~bit} \textit{sgid} e \textit{sticky}
4006 \itindex{sticky~bit} con la notazione illustrata anche in
4007 fig.~\ref{fig:file_perm_bit}.  Nella parte inferiore si sono invece riassunti
4008 i significati dei vari bit dei permessi per una directory; anche in questo
4009 caso si è riapplicato ai bit di \itindex{suid~bit} \textit{suid},
4010 \itindex{sgid~bit} \textit{sgid} e \textit{sticky} \itindex{sticky~bit} la
4011 notazione illustrata in fig.~\ref{fig:file_perm_bit}.
4012
4013 Si ricordi infine che i permessi non hanno alcun significato per i link
4014 simbolici, mentre per i \index{file!di~dispositivo} file di dispositivo hanno
4015 senso soltanto i permessi di lettura e scrittura, che si riflettono sulla
4016 possibilità di compiere dette operazioni sul dispositivo stesso.
4017
4018 Nella tabella si è indicato con il carattere ``-'' il fatto che il valore del
4019 bit in questione non è influente rispetto a quanto indicato nella riga della
4020 tabella; la descrizione del significato fa riferimento soltanto alla
4021 combinazione di bit per i quali è stato riportato esplicitamente un valore.
4022 Si rammenti infine che il valore dei bit dei permessi non ha alcun effetto
4023 qualora il processo possieda i privilegi di amministratore.
4024
4025
4026 \section{Caratteristiche e funzionalità avanzate}
4027 \label{sec:file_dir_advances}
4028
4029 Tratteremo qui alcune caratteristiche e funzionalità avanzate della gestione
4030 di file e directory, affrontando anche una serie di estensioni
4031 dell'interfaccia classica dei sistemi unix-like, principalmente utilizzate a
4032 scopi di sicurezza, che sono state introdotte nelle versioni più recenti di
4033 Linux.
4034
4035 \subsection{Gli attributi estesi}
4036 \label{sec:file_xattr}
4037
4038 \itindbeg{Extended~Attributes}
4039
4040 Nelle sezioni precedenti abbiamo trattato in dettaglio le varie informazioni
4041 che il sistema mantiene negli \itindex{inode} \textit{inode}, e le varie
4042 funzioni che permettono di modificarle.  Si sarà notato come in realtà queste
4043 informazioni siano estremamente ridotte.  Questo è dovuto al fatto che Unix
4044 origina negli anni '70, quando le risorse di calcolo e di spazio disco erano
4045 minime. Con il venir meno di queste restrizioni è incominciata ad emergere
4046 l'esigenza di poter associare ai file delle ulteriori informazioni astratte
4047 (quelli che vengono chiamati i \textsl{meta-dati}) che però non potevano
4048 trovare spazio nei dati classici mantenuti negli \itindex{inode}
4049 \textit{inode}.
4050
4051 Per risolvere questo problema alcuni sistemi unix-like (e fra questi anche
4052 Linux) hanno introdotto un meccanismo generico, detto \textit{Extended
4053   Attributes} che consenta di associare delle informazioni ai singoli
4054 file.\footnote{l'uso più comune è quello della ACL, che tratteremo nella
4055   prossima sezione.} Gli \textsl{attributi estesi} non sono altro che delle
4056 coppie nome/valore che sono associate permanentemente ad un oggetto sul
4057 filesystem, analoghi di quello che sono le variabili di ambiente (vedi
4058 sez.~\ref{sec:proc_environ}) per un processo.
4059
4060 Altri sistemi (come Solaris, MacOS e Windows) hanno adottato un meccanismo
4061 diverso in cui ad un file sono associati diversi flussi di dati, su cui
4062 possono essere mantenute ulteriori informazioni, che possono essere accedute
4063 con le normali operazioni di lettura e scrittura. Questi non vanno confusi con
4064 gli \textit{Extended Attributes} (anche se su Solaris hanno lo stesso nome),
4065 che sono un meccanismo molto più semplice, che pur essendo limitato (potendo
4066 contenere solo una quantità limitata di informazione) hanno il grande
4067 vantaggio di essere molto più semplici da realizzare, più
4068 efficienti,\footnote{cosa molto importante, specie per le applicazioni che
4069   richiedono una gran numero di accessi, come le ACL.} e di garantire
4070 l'atomicità di tutte le operazioni.
4071
4072 In Linux gli attributi estesi sono sempre associati al singolo \itindex{inode}
4073 \textit{inode} e l'accesso viene sempre eseguito in forma atomica, in lettura
4074 il valore corrente viene scritto su un buffer in memoria, mentre la scrittura
4075 prevede che ogni valore precedente sia sovrascritto.
4076
4077 Si tenga presente che non tutti i filesystem supportano gli \textit{Extended
4078   Attributes}; al momento della scrittura di queste dispense essi sono
4079 presenti solo sui vari \textsl{extN}, \textsl{ReiserFS}, \textsl{JFS},
4080 \textsl{XFS} e \textsl{Btrfs}.\footnote{l'elenco è aggiornato a Luglio 2011.}
4081 Inoltre a seconda della implementazione ci possono essere dei limiti sulla
4082 quantità di attributi che si possono utilizzare.\footnote{ad esempio nel caso
4083   di \textsl{ext2} ed \textsl{ext3} è richiesto che essi siano contenuti
4084   all'interno di un singolo blocco (pertanto con dimensioni massime pari a
4085   1024, 2048 o 4096 byte a seconda delle dimensioni di quest'ultimo impostate
4086   in fase di creazione del filesystem), mentre con \textsl{XFS} non ci sono
4087   limiti ed i dati vengono memorizzati in maniera diversa (nell'\textit{inode}
4088   stesso, in un blocco a parte, o in una struttura ad albero dedicata) per
4089   mantenerne la scalabilità.} Infine lo spazio utilizzato per mantenere gli
4090 attributi estesi viene tenuto in conto per il calcolo delle quote di utente e
4091 gruppo proprietari del file.
4092
4093 Come meccanismo per mantenere informazioni aggiuntive associate al singolo
4094 file, gli \textit{Extended Attributes} possono avere usi anche molto diversi
4095 fra loro.  Per poterli distinguere allora sono stati suddivisi in
4096 \textsl{classi}, a cui poter applicare requisiti diversi per l'accesso e la
4097 gestione. Per questo motivo il nome di un attributo deve essere sempre
4098 specificato nella forma \texttt{namespace.attribute}, dove \texttt{namespace}
4099 fa riferimento alla classe a cui l'attributo appartiene, mentre
4100 \texttt{attribute} è il nome ad esso assegnato. In tale forma il nome di un
4101 attributo esteso deve essere univoco. Al momento\footnote{della scrittura di
4102   questa sezione, kernel 2.6.23, ottobre 2007.} sono state definite le quattro
4103 classi di attributi riportate in tab.~\ref{tab:extended_attribute_class}.
4104
4105 \begin{table}[htb]
4106   \centering
4107   \footnotesize
4108   \begin{tabular}{|l|p{12cm}|}
4109     \hline
4110     \textbf{Nome} & \textbf{Descrizione} \\
4111     \hline
4112     \hline
4113     \texttt{security}&Gli \textit{extended security attributes}: vengono
4114                       utilizzati dalle estensioni di sicurezza del kernel (i
4115                       \itindex{Linux~Security~Modules} \textit{Linux 
4116                         Security Modules}), per le realizzazione di meccanismi
4117                       evoluti di controllo di accesso come \index{SELinux}
4118                       SELinux o le \textit{capabilities} dei file di
4119                       sez.~\ref{sec:proc_capabilities}.\\ 
4120     \texttt{system} & Gli \textit{extended security attributes}: sono usati
4121                       dal kernel per memorizzare dati di sistema associati ai
4122                       file come le \itindex{Access~Control~List~(ACL)} ACL (vedi
4123                       sez.~\ref{sec:file_ACL}) o le \itindex{capabilities}
4124                       \textit{capabilities} (vedi
4125                       sez.~\ref{sec:proc_capabilities}).\\
4126     \texttt{trusted}& I \textit{trusted extended attributes}: vengono
4127                       utilizzati per poter realizzare in user space 
4128                       meccanismi che consentano di mantenere delle
4129                       informazioni sui file che non devono essere accessibili
4130                       ai processi ordinari.\\
4131     \texttt{user}   & Gli \textit{extended user attributes}: utilizzati per
4132                       mantenere informazioni aggiuntive sui file (come il
4133                       \textit{mime-type}, la codifica dei caratteri o del
4134                       file) accessibili dagli utenti.\\
4135     \hline
4136   \end{tabular}
4137   \caption{I nomi utilizzati valore di \texttt{namespace} per distinguere le
4138     varie classi di \textit{Extended Attributes}.}
4139   \label{tab:extended_attribute_class}
4140 \end{table}
4141
4142
4143 Dato che uno degli usi degli \textit{Extended Attributes} è quello che li
4144 impiega per realizzare delle estensioni (come le
4145 \itindex{Access~Control~List~(ACL)} ACL, \index{SELinux} SELinux, ecc.) al
4146 tradizionale meccanismo dei controlli di accesso di Unix, l'accesso ai loro
4147 valori viene regolato in maniera diversa a seconda sia della loro classe sia
4148 di quali, fra le estensioni che li utilizzano, sono poste in uso. In
4149 particolare, per ciascuna delle classi riportate in
4150 tab.~\ref{tab:extended_attribute_class}, si hanno i seguenti casi:
4151 \begin{basedescript}{\desclabelwidth{1.7cm}\desclabelstyle{\nextlinelabel}}
4152 \item[\texttt{security}] L'accesso agli \textit{extended security attributes}
4153   dipende dalle politiche di sicurezza stabilite da loro stessi tramite
4154   l'utilizzo di un sistema di controllo basato sui
4155   \itindex{Linux~Security~Modules} \textit{Linux Security Modules} (ad esempio
4156   \index{SELinux} SELinux). Pertanto l'accesso in lettura o scrittura dipende
4157   dalle politiche di sicurezza implementate all'interno dal modulo di
4158   sicurezza che si sta utilizzando al momento (ciascuno avrà le sue). Se non è
4159   stato caricato nessun modulo di sicurezza l'accesso in lettura sarà
4160   consentito a tutti i processi, mentre quello in scrittura solo ai processi
4161   con privilegi amministrativi dotati della \index{capabilities}
4162   \textit{capability} \const{CAP\_SYS\_ADMIN}.
4163
4164 \item[\texttt{system}] Anche l'accesso agli \textit{extended system
4165     attributes} dipende dalle politiche di accesso che il kernel realizza
4166   anche utilizzando gli stessi valori in essi contenuti. Ad esempio nel caso
4167   delle \itindex{Access~Control~List~(ACL)} ACL l'accesso è consentito in
4168   lettura ai processi che hanno la capacità di eseguire una ricerca sul file
4169   (cioè hanno il permesso di lettura sulla directory che contiene il file) ed
4170   in scrittura al proprietario del file o ai processi dotati della
4171   \textit{capability} \index{capabilities} \const{CAP\_FOWNER}.\footnote{vale
4172     a dire una politica di accesso analoga a quella impiegata per gli ordinari
4173     permessi dei file.}
4174
4175 \item[\texttt{trusted}] L'accesso ai \textit{trusted extended attributes}, sia
4176   per la lettura che per la scrittura, è consentito soltanto ai processi con
4177   privilegi amministrativi dotati della \index{capabilities}
4178   \textit{capability} \const{CAP\_SYS\_ADMIN}. In questo modo si possono
4179   utilizzare questi attributi per realizzare in user space dei meccanismi di
4180   controllo che accedono ad informazioni non disponibili ai processi ordinari.
4181
4182 \item[\texttt{user}] L'accesso agli \textit{extended user attributes} è
4183   regolato dai normali permessi dei file: occorre avere il permesso di lettura
4184   per leggerli e quello di scrittura per scriverli o modificarli. Dato l'uso
4185   di questi attributi si è scelto di applicare al loro accesso gli stessi
4186   criteri che si usano per l'accesso al contenuto dei file (o delle directory)
4187   cui essi fanno riferimento. Questa scelta vale però soltanto per i file e le
4188   directory ordinarie, se valesse in generale infatti si avrebbe un serio
4189   problema di sicurezza dato che esistono diversi oggetti sul filesystem per i
4190   quali è normale avere avere il permesso di scrittura consentito a tutti gli
4191   utenti, come i link simbolici, o alcuni \index{file!di~dispositivo} file di
4192   dispositivo come \texttt{/dev/null}. Se fosse possibile usare su di essi gli
4193   \textit{extended user attributes} un utente qualunque potrebbe inserirvi
4194   dati a piacere.\footnote{la cosa è stata notata su XFS, dove questo
4195     comportamento permetteva, non essendovi limiti sullo spazio occupabile
4196     dagli \textit{Extended Attributes}, di bloccare il sistema riempiendo il
4197    &n