Alcune indicizzazioni ulteriori, trattata _FORTIFY_SOURCE e messi
[gapil.git] / filedir.tex
1 %% filedir.tex
2 %%
3 %% Copyright (C) 2000-2007 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{File e directory}
13 \label{cha:files_and_dirs}
14
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando dalle funzioni di libreria che si usano per
17 copiarli, spostarli e cambiarne i nomi. Esamineremo poi l'interfaccia che
18 permette la manipolazione dei vari attributi di file e directory ed alla fine
19 faremo una trattazione dettagliata su come è strutturato il sistema base di
20 protezioni e controllo dell'accesso ai file e sulle funzioni che ne permettono
21 la gestione. Tutto quello che riguarda invece la manipolazione del contenuto
22 dei file è lasciato ai capitoli successivi.
23
24
25
26 \section{La gestione di file e directory}
27 \label{sec:file_dir}
28
29 Come già accennato in sez.~\ref{sec:file_filesystem} in un sistema unix-like
30 la gestione dei file ha delle caratteristiche specifiche che derivano
31 direttamente dall'architettura del sistema.  In questa sezione esamineremo le
32 funzioni usate per la manipolazione di file e directory, per la creazione di
33 link simbolici e diretti, per la gestione e la lettura delle directory.
34
35 In particolare ci soffermeremo sulle conseguenze che derivano
36 dall'architettura dei filesystem illustrata nel capitolo precedente per quanto
37 riguarda il comportamento e gli effetti delle varie funzioni.
38
39
40 \subsection{Le funzioni \func{link} e \func{unlink}}
41 \label{sec:file_link}
42
43 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
44 dei nomi fittizi (come gli alias del MacOS o i collegamenti di Windows o i
45 nomi logici del VMS) che permettono di fare riferimento allo stesso file
46 chiamandolo con nomi diversi o accedendovi da directory diverse.
47
48 Questo è possibile anche in ambiente Unix, dove tali collegamenti sono
49 usualmente chiamati \textit{link}; ma data l'architettura del sistema riguardo
50 la gestione dei file (ed in particolare quanto trattato in
51 sez.~\ref{sec:file_arch_func}) ci sono due metodi sostanzialmente diversi per
52 fare questa operazione.
53
54 Come spiegato in sez.~\ref{sec:file_filesystem} l'accesso al contenuto di un
55 file su disco avviene passando attraverso il suo \itindex{inode}
56 \textit{inode}, che è la struttura usata dal kernel che lo identifica
57 univocamente all'interno di un singolo filesystem. Il nome del file che si
58 trova nella voce di una directory è solo un'etichetta, mantenuta all'interno
59 della directory, che viene associata ad un puntatore che fa riferimento al
60 suddetto \textit{inode}.
61
62 Questo significa che, fintanto che si resta sullo stesso filesystem, la
63 realizzazione di un link è immediata, ed uno stesso file può avere tanti nomi
64 diversi, dati da altrettante associazioni diverse allo stesso \itindex{inode}
65 \textit{inode} effettuate tramite ``etichette'' diverse in directory
66 diverse. Si noti anche che nessuno di questi nomi viene ad assumere una
67 particolare preferenza o originalità rispetto agli altri, in quanto tutti
68 fanno comunque riferimento allo stesso \itindex{inode} \textit{inode}.
69
70 Per aggiungere ad una directory una voce che faccia riferimento ad un
71 \itindex{inode} \textit{inode} già esistente si utilizza la funzione
72 \func{link}; si suole chiamare questo tipo di associazione un collegamento
73 diretto, o \textit{hard link}.  Il prototipo della funzione è il seguente:
74 \begin{prototype}{unistd.h}
75 {int link(const char *oldpath, const char *newpath)}
76   Crea un nuovo collegamento diretto.
77   
78   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
79     errore nel qual caso \var{errno} viene impostata ai valori:
80   \begin{errlist}
81   \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
82     riferimento ad un filesystem montato sullo stesso \textit{mount point}.
83   \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
84     \param{newpath} non supporta i link diretti o è una directory.
85   \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
86     esiste già.
87   \item[\errcode{EMLINK}] ci sono troppi link al file \param{oldpath} (il
88     numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
89     sez.~\ref{sec:sys_limits}).
90   \end{errlist}
91   ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOTDIR},
92   \errval{EFAULT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
93   \errval{ENOSPC}, \errval{EIO}.}
94 \end{prototype}
95
96 La funzione crea sul \itindex{pathname} \textit{pathname} \param{newpath} un
97 collegamento diretto al file indicato da \param{oldpath}.  Per quanto detto la
98 creazione di un nuovo collegamento diretto non copia il contenuto del file, ma
99 si limita a creare una voce nella directory specificata da \param{newpath} e
100 ad aumentare di uno il numero di riferimenti al file (riportato nel campo
101 \var{st\_nlink} della struttura \struct{stat}, vedi sez.~\ref{sec:file_stat})
102 aggiungendo il nuovo nome ai precedenti. Si noti che uno stesso file può
103 essere così chiamato con vari nomi in diverse directory.
104
105 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
106 collegamento diretto è possibile solo se entrambi i \itindex{pathname}
107 \textit{pathname} sono nello stesso filesystem; inoltre il filesystem deve
108 supportare i collegamenti diretti (il meccanismo non è disponibile ad esempio
109 con il filesystem \acr{vfat} di Windows). In realtà la funzione ha un
110 ulteriore requisito, e cioè che non solo che i due file siano sullo stesso
111 filesystem, ma anche che si faccia riferimento ad essi sullo stesso
112 \textit{mount point}.\footnote{si tenga presente infatti (vedi
113   sez.~\ref{sec:sys_file_config}) che a partire dal kernel 2.4 uno stesso
114   filesystem può essere montato più volte su directory diverse.}
115
116 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
117 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
118 l'amministratore è in grado di creare un collegamento diretto ad un'altra
119 directory: questo viene fatto perché con una tale operazione è possibile
120 creare dei \textit{loop} nel filesystem (vedi l'esempio mostrato in
121 sez.~\ref{sec:file_symlink}, dove riprenderemo il discorso) che molti programmi
122 non sono in grado di gestire e la cui rimozione diventerebbe estremamente
123 complicata (in genere per questo tipo di errori occorre far girare il
124 programma \cmd{fsck} per riparare il filesystem).
125
126 Data la pericolosità di questa operazione e la disponibilità dei link
127 simbolici che possono fornire la stessa funzionalità senza questi problemi,
128 nel caso di Linux questa capacità è stata completamente disabilitata, e al
129 tentativo di creare un link diretto ad una directory la funzione \func{link}
130 restituisce l'errore \errcode{EPERM}.
131
132 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
133 \textit{hard link} ad un link simbolico. In questo caso lo standard POSIX
134 prevederebbe che quest'ultimo venga risolto e che il collegamento sia
135 effettuato rispetto al file cui esso punta, e che venga riportato un errore
136 qualora questo non esista o non sia un file. Questo era anche il comportamento
137 iniziale di Linux ma a partire dai kernel della serie 2.0.x\footnote{per la
138   precisione il comportamento era quello previsto dallo standard POSIX fino al
139   kernel di sviluppo 1.3.56, ed è stato temporaneamente ripristinato anche
140   durante lo sviluppo della serie 2.1.x, per poi tornare al comportamento
141   attuale fino ad oggi (per riferimento si veda
142   \href{http://lwn.net/Articles/293902}
143   {\texttt{http://lwn.net/Articles/293902}}).} è stato adottato un
144 comportamento che non segue più lo standard per cui l'\textit{hard link} viene
145 creato rispetto al link simbolico, e non al file cui questo punta.
146
147 La ragione di questa differenza rispetto allo standard, presente anche in
148 altri sistemi unix-like, sono dovute al fatto che un link simbolico può fare
149 riferimento anche ad un file non esistente o a una directory, per i quali
150 l'\textit{hard link} non può essere creato, per cui la scelta di seguire il
151 link simbolico è stata ritenuta una scelta scorretta nella progettazione
152 dell'interfaccia.  Infatti se non ci fosse il comportamento adottato da Linux
153 sarebbe impossibile creare un \textit{hard link} ad un link simbolico, perché
154 la funzione lo risolverebbe e l'\textit{hard link} verrebbe creato verso la
155 destinazione. Invece evitando di seguire lo standard l'operazione diventa
156 possibile, ed anche il comportamento della funzione risulta molto più
157 comprensibile. Tanto più che se proprio se si vuole creare un \textit{hard
158   link} rispetto alla destinazione di un link simbolico è sempre possibile
159 farlo direttamente.\footnote{ciò non toglie che questo comportamento fuori
160   standard possa causare problemi, come nell'esempio descritto nell'articolo
161   citato nella nota precedente, a programmi che non si aspettano questa
162   differenza rispetto allo standard POSIX.}
163
164 La rimozione di un file (o più precisamente della voce che lo referenzia
165 all'interno di una directory) si effettua con la funzione \funcd{unlink}; il
166 suo prototipo è il seguente:
167 \begin{prototype}{unistd.h}{int unlink(const char *pathname)}
168
169   Cancella un file.
170   
171   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
172     errore, nel qual caso il file non viene toccato. La variabile
173     \var{errno} viene impostata secondo i seguenti codici di errore:
174   \begin{errlist}
175   \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una directory.
176     \footnotemark
177   \item[\errcode{EROFS}] \param{pathname} è su un filesystem montato in sola
178   lettura.
179   \item[\errcode{EISDIR}] \param{pathname} fa riferimento a una directory.
180   \end{errlist}
181   ed inoltre: \errval{EACCES}, \errval{EFAULT}, \errval{ENOENT},
182   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
183   \errval{EIO}.}
184 \end{prototype}
185
186 \footnotetext{questo è un valore specifico ritornato da Linux che non consente
187   l'uso di \func{unlink} con le directory (vedi sez.~\ref{sec:file_remove}).
188   Non è conforme allo standard POSIX, che prescrive invece l'uso di
189   \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
190   abbia privilegi sufficienti.}
191
192 La funzione cancella il nome specificato da \param{pathname} nella relativa
193 directory e decrementa il numero di riferimenti nel relativo \itindex{inode}
194 \textit{inode}. Nel caso di link simbolico cancella il link simbolico; nel
195 caso di socket, fifo o file di dispositivo \index{file!di~dispositivo} rimuove
196 il nome, ma come per i file i processi che hanno aperto uno di questi oggetti
197 possono continuare ad utilizzarlo.
198
199 Per cancellare una voce in una directory è necessario avere il permesso di
200 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
201 il diritto di esecuzione sulla directory che la contiene (affronteremo in
202 dettaglio l'argomento dei permessi di file e directory in
203 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
204 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
205 occorrerà anche essere proprietari del file o proprietari della directory (o
206 root, per cui nessuna delle restrizioni è applicata).
207
208 Una delle caratteristiche di queste funzioni è che la creazione/rimozione del
209 nome dalla directory e l'incremento/decremento del numero di riferimenti
210 \itindex{inode} nell'\textit{inode} devono essere effettuati in maniera
211 atomica (si veda sez.~\ref{sec:proc_atom_oper}) senza possibili interruzioni
212 fra le due operazioni. Per questo entrambe queste funzioni sono realizzate
213 tramite una singola system call.
214
215 Si ricordi infine che un file non viene eliminato dal disco fintanto che tutti
216 i riferimenti ad esso sono stati cancellati: solo quando il \textit{link
217   count} mantenuto \itindex{inode} nell'\textit{inode} diventa zero lo spazio
218 occupato su disco viene rimosso (si ricordi comunque che a questo si aggiunge
219 sempre un'ulteriore condizione,\footnote{come vedremo in
220   cap.~\ref{cha:file_unix_interface} il kernel mantiene anche una tabella dei
221   file aperti nei vari processi, che a sua volta contiene i riferimenti agli
222   \itindex{inode} \textit{inode} ad essi relativi. Prima di procedere alla
223   cancellazione dello spazio occupato su disco dal contenuto di un file il
224   kernel controlla anche questa tabella, per verificare che anche in essa non
225   ci sia più nessun riferimento all'\textit{inode} in questione.} e cioè che
226 non ci siano processi che abbiano il suddetto file aperto).
227
228 Questa proprietà viene spesso usata per essere sicuri di non lasciare file
229 temporanei su disco in caso di crash dei programmi; la tecnica è quella di
230 aprire il file e chiamare \func{unlink} subito dopo, in questo modo il
231 contenuto del file è sempre disponibile all'interno del processo attraverso il
232 suo file descriptor (vedi sez.~\ref{sec:file_fd}) fintanto che il processo non
233 chiude il file, ma non ne resta traccia in nessuna directory, e lo spazio
234 occupato su disco viene immediatamente rilasciato alla conclusione del
235 processo (quando tutti i file vengono chiusi).
236
237
238 \subsection{Le funzioni \func{remove} e \func{rename}}
239 \label{sec:file_remove}
240
241 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
242 \func{unlink} sulle directory; per cancellare una directory si può usare la
243 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}), oppure la
244 funzione \funcd{remove}. 
245
246 Questa è la funzione prevista dallo standard ANSI C per cancellare un file o
247 una directory (e funziona anche per i sistemi che non supportano i link
248 diretti). Per i file è identica a \func{unlink} e per le directory è identica
249 a \func{rmdir}; il suo prototipo è:
250 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
251   Cancella un nome dal filesystem. 
252   
253   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
254     errore, nel qual caso il file non viene toccato.
255     
256     I codici di errore riportati in \var{errno} sono quelli della chiamata
257     utilizzata, pertanto si può fare riferimento a quanto illustrato nelle
258     descrizioni di \func{unlink} e \func{rmdir}.}
259 \end{prototype}
260
261 La funzione utilizza la funzione \func{unlink}\footnote{questo vale usando le
262   \acr{glibc}; nelle libc4 e nelle libc5 la funzione \func{remove} è un
263   semplice alias alla funzione \func{unlink} e quindi non può essere usata per
264   le directory.} per cancellare i file e la funzione \func{rmdir} per
265 cancellare le directory; si tenga presente che per alcune implementazioni del
266 protocollo NFS utilizzare questa funzione può comportare la scomparsa di file
267 ancora in uso.
268
269 Per cambiare nome ad un file o a una directory (che devono comunque essere
270 nello stesso filesystem) si usa invece la funzione \funcd{rename},\footnote{la
271   funzione è definita dallo standard ANSI C, ma si applica solo per i file, lo
272   standard POSIX estende la funzione anche alle directory.} il cui prototipo
273 è:
274 \begin{prototype}{stdio.h}
275   {int rename(const char *oldpath, const char *newpath)} 
276   
277   Rinomina un file.
278   
279   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
280     errore, nel qual caso il file non viene toccato. La variabile
281     \var{errno} viene impostata secondo i seguenti codici di errore:
282   \begin{errlist} 
283   \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
284     \param{oldpath} non è una directory.
285   \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
286     stesso filesystem.
287   \item[\errcode{ENOTEMPTY}] \param{newpath} è una directory già esistente e
288     non vuota.
289   \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
290     parte di qualche processo (come directory di lavoro o come radice) o del
291     sistema (come mount point).
292   \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
293     \param{oldpath} o più in generale si è cercato di creare una directory come
294     sotto-directory di se stessa.
295   \item[\errcode{ENOTDIR}] uno dei componenti dei \itindex{pathname}
296     \textit{pathname} non è una directory o \param{oldpath} è una directory e
297     \param{newpath} esiste e non è una directory.
298   \end{errlist} 
299   ed inoltre \errval{EACCES}, \errval{EPERM}, \errval{EMLINK},
300   \errval{ENOENT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP} e
301   \errval{ENOSPC}.}
302 \end{prototype}
303
304 La funzione rinomina il file \param{oldpath} in \param{newpath}, eseguendo se
305 necessario lo spostamento di un file fra directory diverse. Eventuali altri
306 link diretti allo stesso file non vengono influenzati.
307
308 Il comportamento della funzione è diverso a seconda che si voglia rinominare
309 un file o una directory; se ci riferisce ad un file allora \param{newpath}, se
310 esiste, non deve essere una directory (altrimenti si ha l'errore
311 \errcode{EISDIR}). Nel caso \param{newpath} indichi un file esistente questo
312 viene cancellato e rimpiazzato (atomicamente).
313
314 Se \param{oldpath} è una directory allora \param{newpath}, se esiste, deve
315 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
316 (se non è una directory) o \errcode{ENOTEMPTY} (se non è vuota). Chiaramente
317 \param{newpath} non può contenere \param{oldpath} altrimenti si avrà un errore
318 \errcode{EINVAL}.
319
320 Se \param{oldpath} si riferisce ad un link simbolico questo sarà rinominato; se
321 \param{newpath} è un link simbolico verrà cancellato come qualunque altro
322 file.  Infine qualora \param{oldpath} e \param{newpath} siano due nomi dello
323 stesso file lo standard POSIX prevede che la funzione non dia errore, e non
324 faccia nulla, lasciando entrambi i nomi; Linux segue questo standard, anche
325 se, come fatto notare dal manuale delle \textit{glibc}, il comportamento più
326 ragionevole sarebbe quello di cancellare \param{oldpath}.
327
328 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
329 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
330 può esistere cioè nessun istante in cui un altro processo può trovare attivi
331 entrambi i nomi dello stesso file, o, in caso di sostituzione di un file
332 esistente, non trovare quest'ultimo prima che la sostituzione sia stata
333 eseguita.
334
335 In ogni caso se \param{newpath} esiste e l'operazione fallisce per un qualche
336 motivo (come un crash del kernel), \func{rename} garantisce di lasciare
337 presente un'istanza di \param{newpath}. Tuttavia nella sovrascrittura potrà
338 esistere una finestra in cui sia \param{oldpath} che \param{newpath} fanno
339 riferimento allo stesso file.
340
341
342 \subsection{I link simbolici}
343 \label{sec:file_symlink}
344
345 Come abbiamo visto in sez.~\ref{sec:file_link} la funzione \func{link} crea
346 riferimenti agli \itindex{inode} \textit{inode}, pertanto può funzionare
347 soltanto per file che risiedono sullo stesso filesystem e solo per un
348 filesystem di tipo Unix.  Inoltre abbiamo visto che in Linux non è consentito
349 eseguire un link diretto ad una directory.
350
351 Per ovviare a queste limitazioni i sistemi Unix supportano un'altra forma di
352 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
353 come avviene in altri sistemi operativi, dei file speciali che contengono
354 semplicemente il riferimento ad un altro file (o directory). In questo modo è
355 possibile effettuare link anche attraverso filesystem diversi, a file posti in
356 filesystem che non supportano i link diretti, a delle directory, ed anche a
357 file che non esistono ancora.
358
359 Il sistema funziona in quanto i link simbolici sono riconosciuti come tali dal
360 kernel\footnote{è uno dei diversi tipi di file visti in
361   tab.~\ref{tab:file_file_types}, contrassegnato come tale
362   nell'\textit{inode}, e riconoscibile dal valore del campo \var{st\_mode}
363   della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).}  per cui
364 alcune funzioni di libreria (come \func{open} o \func{stat}) quando ricevono
365 come argomento un link simbolico vengono automaticamente applicate al file da
366 esso specificato.  La funzione che permette di creare un nuovo link simbolico
367 è \funcd{symlink}, ed il suo prototipo è:
368 \begin{prototype}{unistd.h}
369   {int symlink(const char *oldpath, const char *newpath)} 
370   Crea un nuovo link simbolico di nome \param{newpath} il cui contenuto è
371   \param{oldpath}.
372   
373   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
374     errore, nel qual caso la variabile \var{errno} assumerà i valori:
375   \begin{errlist}
376   \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
377     supporta i link simbolici.
378   \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
379     \param{oldpath} è una stringa vuota.
380   \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
381   \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
382     lettura.
383   \end{errlist}
384   ed inoltre \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
385   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{ENOSPC} e
386   \errval{EIO}.}
387 \end{prototype}
388
389 Si tenga presente che la funzione non effettua nessun controllo sull'esistenza
390 di un file di nome \param{oldpath}, ma si limita ad inserire quella stringa
391 nel link simbolico. Pertanto un link simbolico può anche riferirsi ad un file
392 che non esiste: in questo caso si ha quello che viene chiamato un
393 \textit{dangling link}, letteralmente un \textsl{link ciondolante}.
394
395 Come accennato i link simbolici sono risolti automaticamente dal kernel
396 all'invocazione delle varie system call; in tab.~\ref{tab:file_symb_effect} si
397 è riportato un elenco dei comportamenti delle varie funzioni di libreria che
398 operano sui file nei confronti della risoluzione dei link simbolici,
399 specificando quali seguono il link simbolico e quali invece possono operare
400 direttamente sul suo contenuto.
401 \begin{table}[htb]
402   \centering
403   \footnotesize
404   \begin{tabular}[c]{|l|c|c|}
405     \hline
406     \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
407     \hline 
408     \hline 
409     \func{access}   & $\bullet$ & --        \\
410     \func{chdir}    & $\bullet$ & --        \\
411     \func{chmod}    & $\bullet$ & --        \\
412     \func{chown}    & --        & $\bullet$ \\
413     \func{creat}    & $\bullet$ & --        \\
414     \func{exec}     & $\bullet$ & --        \\
415     \func{lchown}   & $\bullet$ & --        \\
416     \func{link}\footnotemark & --        & $\bullet$ \\
417     \func{lstat}    & --        & $\bullet$ \\
418     \func{mkdir}    & $\bullet$ & --        \\
419     \func{mkfifo}   & $\bullet$ & --        \\
420     \func{mknod}    & $\bullet$ & --        \\
421     \func{open}     & $\bullet$ & --        \\
422     \func{opendir}  & $\bullet$ & --        \\
423     \func{pathconf} & $\bullet$ & --        \\
424     \func{readlink} & --        & $\bullet$ \\
425     \func{remove}   & --        & $\bullet$ \\
426     \func{rename}   & --        & $\bullet$ \\
427     \func{stat}     & $\bullet$ & --        \\
428     \func{truncate} & $\bullet$ & --        \\
429     \func{unlink}   & --        & $\bullet$ \\
430     \hline 
431   \end{tabular}
432   \caption{Uso dei link simbolici da parte di alcune funzioni.}
433   \label{tab:file_symb_effect}
434 \end{table}
435
436 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
437   dallo standard POSIX, si veda quanto detto in sez.~\ref{sec:file_link}.}
438
439 Si noti che non si è specificato il comportamento delle funzioni che operano
440 con i file descriptor, in quanto la risoluzione del link simbolico viene in
441 genere effettuata dalla funzione che restituisce il file descriptor
442 (normalmente la \func{open}, vedi sez.~\ref{sec:file_open}) e tutte le
443 operazioni seguenti fanno riferimento solo a quest'ultimo.
444
445 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
446 \func{open} seguono i link simbolici, occorrono funzioni apposite per accedere
447 alle informazioni del link invece che a quelle del file a cui esso fa
448 riferimento. Quando si vuole leggere il contenuto di un link simbolico si usa
449 la funzione \funcd{readlink}, il cui prototipo è:
450 \begin{prototype}{unistd.h}
451 {int readlink(const char *path, char *buff, size\_t size)} 
452   Legge il contenuto del link simbolico indicato da \param{path} nel buffer
453   \param{buff} di dimensione \param{size}.
454   
455   \bodydesc{La funzione restituisce il numero di caratteri letti dentro
456     \param{buff} o -1 per un errore, nel qual caso la variabile
457     \var{errno} assumerà i valori:
458   \begin{errlist}
459   \item[\errcode{EINVAL}] \param{path} non è un link simbolico o \param{size}
460     non è positiva.
461   \end{errlist}
462   ed inoltre \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
463   \errval{EACCES}, \errval{ELOOP}, \errval{EIO}, \errval{EFAULT} e
464   \errval{ENOMEM}.}
465 \end{prototype}
466
467 La funzione apre il link simbolico, ne legge il contenuto, lo scrive nel
468 buffer, e lo richiude. Si tenga presente che la funzione non termina la
469 stringa con un carattere nullo e la tronca alla dimensione specificata da
470 \param{size} per evitare di sovrascrivere oltre le dimensioni del buffer.
471
472 \begin{figure}[htb]
473   \centering
474   \includegraphics[width=8.5cm]{img/link_loop}
475   \caption{Esempio di loop nel filesystem creato con un link simbolico.}
476   \label{fig:file_link_loop}
477 \end{figure}
478
479 Un caso comune che si può avere con i link simbolici è la creazione dei
480 cosiddetti \textit{loop}. La situazione è illustrata in
481 fig.~\ref{fig:file_link_loop}, che riporta la struttura della directory
482 \file{/boot}. Come si vede si è creato al suo interno un link simbolico che
483 punta di nuovo a \file{/boot}.\footnote{il loop mostrato in
484   fig.~\ref{fig:file_link_loop} è un usato per poter permettere a \cmd{grub}
485   (un bootloader in grado di leggere direttamente da vari filesystem il file
486   da lanciare come sistema operativo) di vedere i file contenuti nella
487   directory \file{/boot} con lo stesso \textit{pathname} con cui verrebbero
488   visti dal sistema operativo, anche se essi si trovano, come accade spesso,
489   su una partizione separata (che \cmd{grub}, all'avvio, vede come radice).}
490
491 Questo può causare problemi per tutti quei programmi che effettuano la
492 scansione di una directory senza tener conto dei link simbolici, ad esempio se
493 lanciassimo un comando del tipo \code{grep -r linux *}, il loop nella
494 directory porterebbe il comando ad esaminare \file{/boot}, \file{/boot/boot},
495 \file{/boot/boot/boot} e così via.
496
497 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
498 un \itindex{pathname} \textit{pathname} possano essere seguiti un numero
499 limitato di link simbolici, il cui valore limite è specificato dalla costante
500 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
501 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}.
502
503 Un punto da tenere sempre presente è che, come abbiamo accennato, un link
504 simbolico può fare riferimento anche ad un file che non esiste; ad esempio
505 possiamo creare un file temporaneo nella nostra directory con un link del
506 tipo:
507 \begin{verbatim}
508 $ ln -s /tmp/tmp_file temporaneo
509 \end{verbatim}%$
510 anche se \file{/tmp/tmp\_file} non esiste. Questo può generare confusione, in
511 quanto aprendo in scrittura \file{temporaneo} verrà creato
512 \file{/tmp/tmp\_file} e scritto; ma accedendo in sola lettura a
513 \file{temporaneo}, ad esempio con \cmd{cat}, otterremmo:
514 \begin{verbatim}
515 $ cat temporaneo
516 cat: temporaneo: No such file or directory
517 \end{verbatim}%$
518 con un errore che può sembrare sbagliato, dato che un'ispezione con \cmd{ls}
519 ci mostrerebbe invece l'esistenza di \file{temporaneo}.
520
521
522 \subsection{La creazione e la cancellazione delle directory} 
523 \label{sec:file_dir_creat_rem}
524
525 Benché in sostanza le directory non siano altro che dei file contenenti
526 elenchi di nomi ed \itindex{inode} \textit{inode}, non è possibile trattarle
527 come file ordinari e devono essere create direttamente dal kernel attraverso
528 una opportuna system call.\footnote{questo è quello che permette anche,
529   attraverso l'uso del VFS, l'utilizzo di diversi formati per la gestione dei
530   suddetti elenchi.}  La funzione usata per creare una directory è
531 \funcd{mkdir}, ed il suo prototipo è:
532 \begin{functions}
533   \headdecl{sys/stat.h}
534   \headdecl{sys/types.h}
535   \funcdecl{int mkdir(const char *dirname, mode\_t mode)} 
536
537   Crea una nuova directory.
538   
539   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
540     errore, nel qual caso \var{errno} assumerà i valori:
541   \begin{errlist}
542   \item[\errcode{EEXIST}] un file (o una directory) con quel nome esiste di
543     già.
544   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
545     cui si vuole inserire la nuova directory.
546   \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
547     directory contiene troppi file; sotto Linux questo normalmente non avviene
548     perché il filesystem standard consente la creazione di un numero di file
549     maggiore di quelli che possono essere contenuti nel disco, ma potendo
550     avere a che fare anche con filesystem di altri sistemi questo errore può
551     presentarsi.
552   \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
553     la nuova directory o si è esaurita la quota disco dell'utente.
554   \end{errlist}
555   ed inoltre anche \errval{EPERM}, \errval{EFAULT}, \errval{ENAMETOOLONG},
556   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
557   \errval{EROFS}.}
558 \end{functions}
559
560 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
561 standard presenti in ogni directory (cioè ``\file{.}'' e ``\file{..}''), con
562 il nome indicato dall'argomento \param{dirname}. Il nome può essere indicato
563 sia come \itindex{pathname} \textit{pathname} assoluto che come
564 \itindex{pathname} \textit{pathname} relativo.
565
566 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
567 directory viene creata sono specificati dall'argomento \param{mode}, i cui
568 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
569 tenga presente che questi sono modificati dalla maschera di creazione dei file
570 (si veda sez.~\ref{sec:file_perm_management}).  La titolarità della nuova
571 directory è impostata secondo quanto riportato in
572 sez.~\ref{sec:file_ownership_management}.
573
574 La funzione che permette la cancellazione di una directory è invece
575 \funcd{rmdir}, ed il suo prototipo è:
576 \begin{prototype}{sys/stat.h}{int rmdir(const char *dirname)} 
577   Cancella una directory.
578
579   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
580     errore, nel qual caso \var{errno} assumerà i valori:
581   \begin{errlist}
582   \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
583     directory, oppure la directory che contiene \param{dirname} ha lo
584     \itindex{sticky~bit} \textit{sticky bit} impostato e l'user-ID effettivo
585     del processo non corrisponde al proprietario della directory.
586   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
587     che contiene la directory che si vuole cancellare, o non c'è il permesso
588     di attraversare (esecuzione) una delle directory specificate in
589     \param{dirname}.
590   \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o la
591     radice di qualche processo.
592   \item[\errcode{ENOTEMPTY}] la directory non è vuota.
593   \end{errlist}
594   ed inoltre anche \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
595   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{EROFS}.}
596 \end{prototype}
597
598 La funzione cancella la directory \param{dirname}, che deve essere vuota (la
599 directory deve cioè contenere soltanto le due voci standard ``\file{.}'' e
600 ``\file{..}'').  Il nome può essere indicato con il \itindex{pathname}
601 \textit{pathname} assoluto o relativo.
602
603 La modalità con cui avviene la cancellazione è analoga a quella di
604 \func{unlink}: fintanto che il numero di link \itindex{inode}
605 all'\textit{inode} della directory non diventa nullo e nessun processo ha la
606 directory aperta lo spazio occupato su disco non viene rilasciato. Se un
607 processo ha la directory aperta la funzione rimuove il link \itindex{inode}
608 all'\textit{inode} e nel caso sia l'ultimo, pure le voci standard ``\file{.}''
609 e ``\file{..}'', a questo punto il kernel non consentirà di creare più nuovi
610 file nella directory.
611
612
613 \subsection{La creazione di file speciali}
614 \label{sec:file_mknod}
615
616 Finora abbiamo parlato esclusivamente di file, directory e link simbolici; in
617 sez.~\ref{sec:file_file_types} abbiamo visto però che il sistema prevede pure
618 degli altri tipi di file speciali, come i \index{file!di~dispositivo} file di
619 dispositivo e le fifo (i socket sono un caso a parte, che tratteremo in
620 cap.~\ref{cha:socket_intro}).
621
622 La manipolazione delle caratteristiche di questi file e la loro cancellazione
623 può essere effettuata con le stesse funzioni che operano sui file regolari; ma
624 quando li si devono creare sono necessarie delle funzioni apposite. La prima
625 di queste funzioni è \funcd{mknod}, il suo prototipo è:
626 \begin{functions}
627   \headdecl{sys/types.h}
628   \headdecl{sys/stat.h}
629   \headdecl{fcntl.h}
630   \headdecl{unistd.h}
631   \funcdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)} 
632   
633   Crea un \textit{inode} del tipo specificato sul filesystem.
634   
635   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
636     errore, nel qual caso \var{errno} assumerà i valori:
637   \begin{errlist}
638   \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
639     l'\texttt{inode}, o il filesystem su cui si è cercato di
640     creare \param{pathname} non supporta l'operazione.
641   \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
642     fifo, un socket o un dispositivo.
643   \item[\errcode{EEXIST}] \param{pathname} esiste già o è un link simbolico.
644   \end{errlist}
645   ed inoltre anche \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
646   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
647   \errval{ENOSPC}, \errval{EROFS}.}
648 \end{functions}
649
650 La funzione permette di creare un file speciale, ma si può usare anche per
651 creare file regolari e fifo; l'argomento \param{mode} specifica il tipo di
652 file che si vuole creare ed i relativi permessi, secondo i valori riportati in
653 tab.~\ref{tab:file_mode_flags}, che vanno combinati con un OR binario. I
654 permessi sono comunque modificati nella maniera usuale dal valore di
655 \itindex{umask} \textit{umask} (si veda sez.~\ref{sec:file_perm_management}).
656
657 Per il tipo di file può essere specificato solo uno fra: \const{S\_IFREG} per
658 un file regolare (che sarà creato vuoto), \const{S\_IFBLK} per un dispositivo
659 a blocchi, \const{S\_IFCHR} per un dispositivo a caratteri, \const{S\_IFSOCK}
660 e \const{S\_IFIFO} per una fifo. Un valore diverso comporterà l'errore
661 \errcode{EINVAL}. Qualora si sia specificato in \param{mode} un file di
662 dispositivo (\const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev}
663 dovrà essere usato per indicare a quale dispositivo si fa riferimento con il
664 relativo numero.
665
666 Solo l'amministratore può creare un file di dispositivo usando questa funzione
667 (il processo deve avere la \textit{capability} \const{CAP\_MKNOD}); ma in
668 Linux\footnote{la funzione non è prevista dallo standard POSIX, e deriva da
669   SVr4, con appunto questa differenza e diversi codici di errore.} l'uso per
670 la creazione di un file ordinario, di una fifo o di un socket è consentito
671 anche agli utenti normali.
672
673 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
674 al proprietario e al gruppo del processo che li ha creati, a meno che non si
675 sia attivato il bit \acr{sgid} per la directory o sia stata attivata la
676 semantica BSD per il filesystem (si veda
677 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
678 \itindex{inode} l'\textit{inode}.
679
680 Per creare una fifo (un file speciale, su cui torneremo in dettaglio in
681 sez.~\ref{sec:ipc_named_pipe}) lo standard POSIX specifica l'uso della funzione
682 \funcd{mkfifo}, il cui prototipo è:
683 \begin{functions}
684   \headdecl{sys/types.h} \headdecl{sys/stat.h} 
685   
686   \funcdecl{int mkfifo(const char *pathname, mode\_t mode)} 
687   
688   Crea una fifo.
689   
690   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
691     errore, nel qual caso \var{errno} assumerà i valori \errval{EACCES},
692     \errval{EEXIST}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC},
693     \errval{ENOTDIR} e \errval{EROFS}.}
694 \end{functions}
695
696 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
697 per \func{mknod} il file \param{pathname} non deve esistere (neanche come link
698 simbolico); al solito i permessi specificati da \param{mode} vengono
699 modificati dal valore di \itindex{umask} \textit{umask}.
700
701
702
703 \subsection{Accesso alle directory}
704 \label{sec:file_dir_read}
705
706 Benché le directory alla fine non siano altro che dei file che contengono
707 delle liste di nomi ed \itindex{inode} \textit{inode}, per il ruolo che
708 rivestono nella struttura del sistema, non possono essere trattate come dei
709 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
710 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
711 può essere un processo a inserirvi direttamente delle voci con le usuali
712 funzioni di scrittura.
713
714 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
715 kernel, sono molte le situazioni in cui i processi necessitano di poterne
716 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
717 in sez.~\ref{sec:file_open} che è possibile aprire una directory come se fosse
718 un file, anche se solo in sola lettura) in generale il formato con cui esse
719 sono scritte può dipendere dal tipo di filesystem, tanto che, come riportato
720 in tab.~\ref{tab:file_file_operations}, il VFS del kernel prevede una apposita
721 funzione per la lettura delle directory.
722
723 Tutto questo si riflette nello standard POSIX\footnote{le funzioni sono
724   previste pure in BSD e SVID.} che ha introdotto una apposita interfaccia per
725 la lettura delle directory, basata sui cosiddetti \textit{directory stream}
726 (chiamati così per l'analogia con i file stream dell'interfaccia standard di
727 cap.~\ref{cha:files_std_interface}). La prima funzione di questa interfaccia è
728 \funcd{opendir}, il cui prototipo è:
729 \begin{functions}
730   \headdecl{sys/types.h} \headdecl{dirent.h} 
731   
732   \funcdecl{DIR * opendir(const char *dirname)} 
733   
734   Apre un \textit{directory stream}.
735   
736   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
737     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
738     assumerà i valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
739     \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}.}
740 \end{functions}
741
742 La funzione apre un \textit{directory stream} per la directory
743 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
744 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
745 \textit{directory stream}) da usare per tutte le operazioni successive, la
746 funzione inoltre posiziona lo stream sulla prima voce contenuta nella
747 directory.
748
749 Dato che le directory sono comunque dei file, in alcuni casi può servire
750 conoscere il \textit{file descriptor} associato ad un \textit{directory
751   stream}, a questo scopo si può usare la funzione \funcd{dirfd}, il cui
752 prototipo è:
753 \begin{functions}
754   \headdecl{sys/types.h} \headdecl{dirent.h} 
755   
756   \funcdecl{int dirfd(DIR * dir)} 
757   
758   Restituisce il file descriptor associato ad un \textit{directory stream}.
759   
760   \bodydesc{La funzione restituisce il file descriptor (un valore positivo) in
761     caso di successo e -1 in caso di errore.}
762 \end{functions}
763
764 La funzione\footnote{questa funzione è una estensione di BSD non presente in
765   POSIX, introdotta con BSD 4.3-Reno; è presente in Linux con le libc5 (a
766   partire dalla versione 5.1.2) e con le \acr{glibc}.} restituisce il file
767 descriptor associato al \textit{directory stream} \param{dir}, essa è
768 disponibile solo definendo \macro{\_BSD\_SOURCE} o \macro{\_SVID\_SOURCE}. Di
769 solito si utilizza questa funzione in abbinamento alla funzione \func{fchdir}
770 per cambiare la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}) a
771 quella relativa allo stream che si sta esaminando.
772
773 La lettura di una voce della directory viene effettuata attraverso la funzione
774 \funcd{readdir}; il suo prototipo è:
775 \begin{functions}
776   \headdecl{sys/types.h} \headdecl{dirent.h} 
777   
778   \funcdecl{struct dirent *readdir(DIR *dir)}
779   
780   Legge una voce dal \textit{directory stream}.
781   
782   \bodydesc{La funzione restituisce il puntatore alla struttura contenente i
783     dati in caso di successo e \val{NULL} altrimenti, in caso di descrittore
784     non valido \var{errno} assumerà il valore \errval{EBADF}, il valore
785     \val{NULL} viene restituito anche quando si raggiunge la fine dello
786     stream.}
787 \end{functions}
788
789 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
790 successiva.  I dati vengono memorizzati in una struttura \struct{dirent} (la
791 cui definizione\footnote{la definizione è quella usata a Linux, che si trova
792   nel file \file{/usr/include/bits/dirent.h}, essa non contempla la presenza
793   del campo \var{d\_namlen} che indica la lunghezza del nome del file (ed
794   infatti la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN} non è definita).}  è
795 riportata in fig.~\ref{fig:file_dirent_struct}). La funzione restituisce il
796 puntatore alla struttura; si tenga presente però che quest'ultima è allocata
797 staticamente, per cui viene sovrascritta tutte le volte che si ripete la
798 lettura di una voce sullo stesso stream.
799
800 Di questa funzione esiste anche una versione \index{funzioni!rientranti}
801 rientrante, \func{readdir\_r}, che non usa una struttura allocata
802 staticamente, e può essere utilizzata anche con i \itindex{thread}
803 \textit{thread}; il suo prototipo è:
804 \begin{functions}
805   \headdecl{sys/types.h} \headdecl{dirent.h} 
806   
807   \funcdecl{int readdir\_r(DIR *dir, struct dirent *entry,
808           struct dirent **result)}
809   
810   Legge una voce dal \textit{directory stream}.
811   
812   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
813     errore, gli errori sono gli stessi di \func{readdir}.}
814 \end{functions}
815
816 La funzione restituisce in \param{result} (come
817 \itindex{value~result~argument} \textit{value result argument}) l'indirizzo
818 dove sono stati salvati i dati, che di norma corrisponde a quello della
819 struttura precedentemente allocata e specificata dall'argomento \param{entry}
820 (anche se non è assicurato che la funzione usi lo spazio fornito dall'utente).
821
822 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
823 presenti nella directory; sia BSD che SVr4\footnote{lo standard POSIX prevede
824   invece solo la presenza del campo \var{d\_fileno}, identico \var{d\_ino},
825   che in Linux è definito come alias di quest'ultimo. Il campo \var{d\_name} è
826   considerato dipendente dall'implementazione.} prevedono che siano sempre
827 presenti il campo \var{d\_name}, che contiene il nome del file nella forma di
828 una stringa terminata da uno zero,\footnote{lo standard POSIX non specifica
829   una lunghezza, ma solo un limite \const{NAME\_MAX}; in SVr4 la lunghezza del
830   campo è definita come \code{NAME\_MAX+1} che di norma porta al valore di 256
831   byte usato anche in Linux.} ed il campo \var{d\_ino}, che contiene il numero
832 di \itindex{inode} \textit{inode} cui il file è associato (di solito
833 corrisponde al campo \var{st\_ino} di \struct{stat}).
834
835 \begin{figure}[!htb]
836   \footnotesize \centering
837   \begin{minipage}[c]{15cm}
838     \includestruct{listati/dirent.c}
839   \end{minipage} 
840   \normalsize 
841   \caption{La struttura \structd{dirent} per la lettura delle informazioni dei 
842     file.}
843   \label{fig:file_dirent_struct}
844 \end{figure}
845
846 La presenza di ulteriori campi opzionali è segnalata dalla definizione di
847 altrettante macro nella forma \code{\_DIRENT\_HAVE\_D\_XXX} dove \code{XXX} è
848 il nome del relativo campo; nel nostro caso sono definite le macro
849 \macro{\_DIRENT\_HAVE\_D\_TYPE}, \macro{\_DIRENT\_HAVE\_D\_OFF} e
850 \macro{\_DIRENT\_HAVE\_D\_RECLEN}.
851
852 \begin{table}[htb]
853   \centering
854   \footnotesize
855   \begin{tabular}[c]{|l|l|}
856     \hline
857     \textbf{Valore} & \textbf{Tipo di file} \\
858     \hline
859     \hline
860     \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
861     \const{DT\_REG}     & File normale.\\
862     \const{DT\_DIR}     & Directory.\\
863     \const{DT\_FIFO}    & Fifo.\\
864     \const{DT\_SOCK}    & Socket.\\
865     \const{DT\_CHR}     & Dispositivo a caratteri.\\
866     \const{DT\_BLK}     & Dispositivo a blocchi.\\
867     \hline    
868   \end{tabular}
869   \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
870     della struttura \struct{dirent}.}
871   \label{tab:file_dtype_macro}
872 \end{table}
873
874 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
875 indica il tipo di file (fifo, directory, link simbolico, ecc.); i suoi
876 possibili valori\footnote{fino alla versione 2.1 delle \acr{glibc} questo
877   campo, pur presente nella struttura, non era implementato, e resta sempre al
878   valore \const{DT\_UNKNOWN}.}  sono riportati in
879 tab.~\ref{tab:file_dtype_macro}; per la conversione da e verso l'analogo
880 valore mantenuto dentro il campo \var{st\_mode} di \struct{stat} sono definite
881 anche due macro di conversione \macro{IFTODT} e \macro{DTTOIF}:
882 \begin{functions}
883   \funcdecl{int IFTODT(mode\_t MODE)} Converte il tipo di file dal formato di
884   \var{st\_mode} a quello di \var{d\_type}.
885   
886   \funcdecl{mode\_t DTTOIF(int DTYPE)} Converte il tipo di file dal formato di
887   \var{d\_type} a quello di \var{st\_mode}.
888 \end{functions}
889
890 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
891 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
892 letta. Con questi due campi diventa possibile, determinando la posizione delle
893 varie voci, spostarsi all'interno dello stream usando la funzione
894 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
895   estensioni prese da BSD, non previste dallo standard POSIX.} il cui
896 prototipo è:
897 \begin{prototype}{dirent.h}{void seekdir(DIR *dir, off\_t offset)}
898   Cambia la posizione all'interno di un \textit{directory stream}.
899 \end{prototype}
900
901 La funzione non ritorna nulla e non segnala errori, è però necessario che il
902 valore dell'argomento \param{offset} sia valido per lo stream \param{dir};
903 esso pertanto deve essere stato ottenuto o dal valore di \var{d\_off} di
904 \struct{dirent} o dal valore restituito dalla funzione \funcd{telldir}, che
905 legge la posizione corrente; il prototipo di quest'ultima è:
906 \begin{prototype}{dirent.h}{off\_t telldir(DIR *dir)}
907   Ritorna la posizione corrente in un \textit{directory stream}.
908   
909   \bodydesc{La funzione restituisce la posizione corrente nello stream (un
910     numero positivo) in caso di successo, e -1 altrimenti, nel qual caso
911     \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
912     valore errato per \param{dir}.}
913 \end{prototype}
914
915 La sola funzione di posizionamento nello stream prevista dallo standard POSIX
916 è \funcd{rewinddir}, che riporta la posizione a quella iniziale; il suo
917 prototipo è:
918 \begin{functions}
919   \headdecl{sys/types.h} \headdecl{dirent.h} 
920   
921   \funcdecl{void rewinddir(DIR *dir)}
922   
923   Si posiziona all'inizio di un \textit{directory stream}.
924 \end{functions}
925
926
927 Una volta completate le operazioni si può chiudere il \textit{directory
928   stream} con la funzione \funcd{closedir}, il cui prototipo è:
929 \begin{functions}
930   \headdecl{sys/types.h} \headdecl{dirent.h} 
931   
932   \funcdecl{int closedir(DIR * dir)} 
933   
934   Chiude un \textit{directory stream}.
935   
936   \bodydesc{La funzione restituisce 0 in caso di successo e -1 altrimenti, nel
937     qual caso \var{errno} assume il valore \errval{EBADF}.}
938 \end{functions}
939
940 A parte queste funzioni di base in BSD 4.3 è stata introdotta un'altra
941 funzione che permette di eseguire una scansione completa (con tanto di ricerca
942 ed ordinamento) del contenuto di una directory; la funzione è
943 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
944   libc4.} ed il suo prototipo è:
945 \begin{prototype}{dirent.h}{int scandir(const char *dir, 
946     struct dirent ***namelist, int(*filter)(const struct dirent *),
947     int(*compar)(const struct dirent **, const struct dirent **))} 
948   
949   Esegue una scansione di un \textit{directory stream}.
950   
951   \bodydesc{La funzione restituisce in caso di successo il numero di voci
952     trovate, e -1 altrimenti.}
953 \end{prototype}
954
955 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
956 prototipo non è molto comprensibile; queste funzioni però sono quelle che
957 controllano rispettivamente la selezione di una voce (quella passata con
958 l'argomento \param{filter}) e l'ordinamento di tutte le voci selezionate
959 (quella specificata dell'argomento \param{compar}).
960
961 La funzione legge tutte le voci della directory indicata dall'argomento
962 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
963 \struct{dirent}) come argomento della funzione di selezione specificata da
964 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
965 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
966 Qualora si specifichi un valore \val{NULL} per l'argomento \func{filter} non
967 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
968
969 Le voci selezionate possono essere riordinate tramite \func{qsort}, le modalità
970 del riordinamento possono essere personalizzate usando la funzione
971 \param{compar} come criterio di ordinamento di \func{qsort}, la funzione
972 prende come argomenti le due strutture \struct{dirent} da confrontare
973 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
974 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
975 \struct{dirent} viene restituito nell'argomento
976 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
977   restituisce, come \itindex{value~result~argument} \textit{value result
978     argument}, l'indirizzo della stessa; questo significa che \param{namelist}
979   deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
980   si deve passare il suo indirizzo.}
981
982 Per l'ordinamento, vale a dire come valori possibili per l'argomento
983 \param{compar} sono disponibili due funzioni predefinite, \funcd{alphasort} e
984 \funcd{versionsort}, i cui prototipi sono:
985 \begin{functions}
986   \headdecl{dirent.h} 
987   
988   \funcdecl{int alphasort(const void *a, const void *b)} 
989
990   \funcdecl{int versionsort(const void *a, const void *b)} 
991   
992   Funzioni per l'ordinamento delle voci di \textit{directory stream}.
993   
994   \bodydesc{Le funzioni restituiscono un valore minore, uguale o maggiore di
995     zero qualora il primo argomento sia rispettivamente minore, uguale o
996     maggiore del secondo.}
997 \end{functions}
998
999 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
1000 libc4\footnote{la versione delle libc4 e libc5 usa però come argomenti dei
1001   puntatori a delle strutture \struct{dirent}; le glibc usano il prototipo
1002   originario di BSD, mostrato anche nella definizione, che prevede puntatori a
1003   \ctyp{void}.}  e deve essere specificata come argomento \param{compare} per
1004 ottenere un ordinamento alfabetico (secondo il valore del campo \var{d\_name}
1005 delle varie voci). Le \acr{glibc} prevedono come estensione\footnote{le glibc,
1006   a partire dalla versione 2.1, effettuano anche l'ordinamento alfabetico
1007   tenendo conto delle varie localizzazioni, usando \func{strcoll} al posto di
1008   \func{strcmp}.} anche \func{versionsort}, che ordina i nomi tenendo conto
1009 del numero di versione (cioè qualcosa per cui \texttt{file10} viene comunque
1010 dopo \texttt{file4}.)
1011
1012 Un semplice esempio dell'uso di queste funzioni è riportato in
1013 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
1014 programma che, usando la funzione di scansione illustrata in
1015 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
1016 e la relativa dimensione (in sostanza una versione semplificata del comando
1017 \cmd{ls}).
1018
1019 \begin{figure}[!htb]
1020   \footnotesize \centering
1021   \begin{minipage}[c]{15.6cm}
1022     \includecodesample{listati/my_ls.c}
1023   \end{minipage}
1024   \caption{Esempio di codice per eseguire la lista dei file contenuti in una
1025     directory.} 
1026   \label{fig:file_my_ls}
1027 \end{figure}
1028
1029 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
1030 la parte di gestione delle opzioni (che prevede solo l'uso di una funzione per
1031 la stampa della sintassi, anch'essa omessa) ma il codice completo potrà essere
1032 trovato coi sorgenti allegati nel file \file{myls.c}.
1033
1034 In sostanza tutto quello che fa il programma, dopo aver controllato
1035 (\texttt{\small 10--13}) di avere almeno un argomento (che indicherà la
1036 directory da esaminare) è chiamare (\texttt{\small 14}) la funzione
1037 \func{DirScan} per eseguire la scansione, usando la funzione \code{do\_ls}
1038 (\texttt{\small 20--26}) per fare tutto il lavoro. 
1039
1040 Quest'ultima si limita (\texttt{\small 23}) a chiamare \func{stat} sul file
1041 indicato dalla directory entry passata come argomento (il cui nome è appunto
1042 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
1043 dati ad esso relativi, per poi provvedere (\texttt{\small 24}) a stampare il
1044 nome del file e la dimensione riportata in \var{data}.  
1045
1046 Dato che la funzione verrà chiamata all'interno di \func{DirScan} per ogni
1047 voce presente questo è sufficiente a stampare la lista completa dei file e
1048 delle relative dimensioni.  Si noti infine come si restituisca sempre 0 come
1049 valore di ritorno per indicare una esecuzione senza errori.
1050
1051 \begin{figure}[!htb]
1052   \footnotesize \centering
1053   \begin{minipage}[c]{15.6cm}
1054     \includecodesample{listati/DirScan.c}
1055   \end{minipage}
1056   \caption{Codice della funzione di scansione di una directory contenuta nel
1057     file \file{DirScan.c}.} 
1058   \label{fig:file_dirscan}
1059 \end{figure}
1060
1061 Tutto il grosso del lavoro è svolto dalla funzione \func{DirScan}, riportata
1062 in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e permette
1063 di eseguire una funzione, passata come secondo argomento, su tutte le voci di
1064 una directory.  La funzione inizia con l'aprire (\texttt{\small 19--23}) uno
1065 stream sulla directory passata come primo argomento, stampando un messaggio in
1066 caso di errore.
1067
1068 Il passo successivo (\texttt{\small 24--25}) è cambiare directory di lavoro
1069 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzione
1070 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
1071 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
1072 (\texttt{\small 27--31}) sulle singole voci dello stream ci si trovi
1073 all'interno della directory.\footnote{questo è essenziale al funzionamento
1074   della funzione \code{do\_ls} (e ad ogni funzione che debba usare il campo
1075   \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
1076   struttura \struct{dirent} sono sempre relativi alla directory in questione,
1077   e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
1078   ottenere le dimensioni.}
1079
1080 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
1081 alla funzione passata come secondo argomento, il ciclo di scansione della
1082 directory è molto semplice; si legge una voce alla volta (\texttt{\small 27})
1083 all'interno di una istruzione di \code{while} e fintanto che si riceve una
1084 voce valida (cioè un puntatore diverso da \val{NULL}) si esegue
1085 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
1086 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
1087   28}) qualora questa presenti una anomalia (identificata da un codice di
1088 ritorno negativo).
1089
1090 Una volta terminato il ciclo la funzione si conclude con la chiusura
1091 (\texttt{\small 32}) dello stream\footnote{nel nostro caso, uscendo subito
1092   dopo la chiamata, questo non servirebbe, in generale però l'operazione è
1093   necessaria, dato che la funzione può essere invocata molte volte all'interno
1094   dello stesso processo, per cui non chiudere gli stream comporterebbe un
1095   consumo progressivo di risorse, con conseguente rischio di esaurimento delle
1096   stesse} e la restituzione (\texttt{\small 33}) del codice di operazioni
1097 concluse con successo.
1098
1099
1100 \subsection{La directory di lavoro}
1101 \label{sec:file_work_dir}
1102
1103 \itindbeg{pathname}
1104
1105 A ciascun processo è associata una directory nel filesystem che è chiamata
1106 \textsl{directory corrente} o \textsl{directory di lavoro} (in inglese
1107 \textit{current working directory}) che è quella a cui si fa riferimento
1108 quando un \itindsub{pathname}{relativo}\textit{pathname} è espresso in forma
1109 relativa, dove il ``\textsl{relativa}'' fa riferimento appunto a questa
1110 directory.
1111
1112 Quando un utente effettua il login, questa directory viene impostata alla
1113 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
1114 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
1115 comando \cmd{pwd} la stampa sul terminale.  Siccome la directory corrente
1116 resta la stessa quando viene creato un processo figlio (vedi
1117 sez.~\ref{sec:proc_fork}), la directory corrente della shell diventa anche la
1118 directory corrente di qualunque comando da essa lanciato.
1119
1120 In genere il kernel tiene traccia per ciascun processo \itindex{inode}
1121 dell'\textit{inode} della directory di lavoro, per ottenere il
1122 \textit{pathname} occorre usare una apposita funzione di libreria,
1123 \funcd{getcwd}, il cui prototipo è:
1124 \begin{prototype}{unistd.h}{char *getcwd(char *buffer, size\_t size)}
1125   Legge il \textit{pathname} della directory di lavoro corrente.
1126   
1127   \bodydesc{La funzione restituisce il puntatore \param{buffer} se riesce,
1128     \val{NULL} se fallisce, in quest'ultimo caso la variabile
1129     \var{errno} è impostata con i seguenti codici di errore:
1130   \begin{errlist}
1131   \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
1132     è nullo.
1133   \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
1134     lunghezza del \textit{pathname}. 
1135   \item[\errcode{EACCES}] manca il permesso di lettura o di ricerca su uno dei
1136     componenti del \textit{pathname} (cioè su una delle directory superiori
1137     alla corrente).
1138   \end{errlist}}
1139 \end{prototype}
1140
1141 La funzione restituisce il \textit{pathname} completo della directory di
1142 lavoro nella stringa puntata da \param{buffer}, che deve essere
1143 precedentemente allocata, per una dimensione massima di \param{size}.  Il
1144 buffer deve essere sufficientemente lungo da poter contenere il
1145 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
1146 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
1147 un errore.
1148
1149 Si può anche specificare un puntatore nullo come
1150 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
1151   supportata da Linux.} nel qual caso la stringa sarà allocata automaticamente
1152 per una dimensione pari a \param{size} qualora questa sia diversa da zero, o
1153 della lunghezza esatta del \textit{pathname} altrimenti. In questo caso ci si
1154 deve ricordare di disallocare la stringa una volta cessato il suo utilizzo.
1155
1156 Di questa funzione esiste una versione \code{char *getwd(char *buffer)} fatta
1157 per compatibilità all'indietro con BSD, che non consente di specificare la
1158 dimensione del buffer; esso deve essere allocato in precedenza ed avere una
1159 dimensione superiore a \const{PATH\_MAX} (di solito 256 byte, vedi
1160 sez.~\ref{sec:sys_limits}); il problema è che in Linux non esiste una
1161 dimensione superiore per un \textit{pathname}, per cui non è detto che il
1162 buffer sia sufficiente a contenere il nome del file, e questa è la ragione
1163 principale per cui questa funzione è deprecata.
1164
1165 Una seconda funzione simile è \code{char *get\_current\_dir\_name(void)} che è
1166 sostanzialmente equivalente ad una \code{getcwd(NULL, 0)}, con la sola
1167 differenza che essa ritorna il valore della variabile di ambiente \val{PWD},
1168 che essendo costruita dalla shell può contenere un \textit{pathname}
1169 comprendente anche dei link simbolici. Usando \func{getcwd} infatti, essendo
1170 il \textit{pathname} ricavato risalendo all'indietro l'albero della directory,
1171 si perderebbe traccia di ogni passaggio attraverso eventuali link simbolici.
1172
1173 Per cambiare la directory di lavoro si può usare la funzione \funcd{chdir}
1174 (equivalente del comando di shell \cmd{cd}) il cui nome sta appunto per
1175 \textit{change directory}, il suo prototipo è:
1176 \begin{prototype}{unistd.h}{int chdir(const char *pathname)} 
1177   Cambia la directory di lavoro in \param{pathname}.
1178   
1179   \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
1180     nel qual caso \var{errno} assumerà i valori:
1181   \begin{errlist}
1182   \item[\errcode{ENOTDIR}] non si è specificata una directory.
1183   \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
1184     di \param{path}.
1185   \end{errlist}
1186   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1187   \errval{ENOMEM}, \errval{ELOOP} e \errval{EIO}.}
1188 \end{prototype}
1189 \noindent ed ovviamente \param{pathname} deve indicare una directory per la
1190 quale si hanno i permessi di accesso.
1191
1192 Dato che anche le directory sono file, è possibile riferirsi ad esse anche
1193 tramite il file descriptor, e non solo tramite il \textit{pathname}, per fare
1194 questo si usa \funcd{fchdir}, il cui prototipo è:
1195 \begin{prototype}{unistd.h}{int fchdir(int fd)} 
1196   Identica a \func{chdir}, ma usa il file descriptor \param{fd} invece del
1197   \textit{pathname}.
1198   
1199   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1200     errore, in caso di errore \var{errno} assumerà i valori \errval{EBADF} o
1201     \errval{EACCES}.}
1202 \end{prototype}
1203 \noindent anche in questo caso \param{fd} deve essere un file descriptor
1204 valido che fa riferimento ad una directory. Inoltre l'unico errore di accesso
1205 possibile (tutti gli altri sarebbero occorsi all'apertura di \param{fd}), è
1206 quello in cui il processo non ha il permesso di accesso alla directory
1207 specificata da \param{fd}.
1208
1209 \itindend{pathname}
1210
1211
1212
1213 \subsection{I file temporanei}
1214 \label{sec:file_temp_file}
1215
1216 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
1217 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
1218 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
1219 creare il file dopo aver controllato che questo non esista, nel momento fra il
1220 controllo e la creazione si ha giusto lo spazio per una possibile
1221 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
1222 sez.~\ref{sec:proc_race_cond}).
1223
1224 Le \acr{glibc} provvedono varie funzioni per generare nomi di file temporanei,
1225 di cui si abbia certezza di unicità (al momento della generazione); la prima
1226 di queste funzioni è \funcd{tmpnam} il cui prototipo è:
1227 \begin{prototype}{stdio.h}{char *tmpnam(char *string)}
1228   Restituisce il puntatore ad una stringa contente un nome di file valido e
1229   non esistente al momento dell'invocazione. 
1230
1231   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1232   \val{NULL} in caso di fallimento. Non sono definiti errori.}
1233 \end{prototype}
1234 \noindent se si è passato un puntatore \param{string} non nullo questo deve
1235 essere di dimensione \const{L\_tmpnam} (costante definita in \file{stdio.h},
1236 come \const{P\_tmpdir} e \const{TMP\_MAX}) ed il nome generato vi verrà
1237 copiato automaticamente; altrimenti il nome sarà generato in un buffer statico
1238 interno che verrà sovrascritto ad una chiamata successiva.  Successive
1239 invocazioni della funzione continueranno a restituire nomi unici fino ad un
1240 massimo di \const{TMP\_MAX} volte. Al nome viene automaticamente aggiunto come
1241 prefisso la directory specificata da \const{P\_tmpdir}.
1242
1243 Di questa funzione esiste una versione \index{funzioni!rientranti} rientrante,
1244 \func{tmpnam\_r}, che non fa nulla quando si passa \val{NULL} come argomento.
1245 Una funzione simile, \funcd{tempnam}, permette di specificare un prefisso per
1246 il file esplicitamente, il suo prototipo è:
1247 \begin{prototype}{stdio.h}{char *tempnam(const char *dir, const char *pfx)}
1248   Restituisce il puntatore ad una stringa contente un nome di file valido e
1249   non esistente al momento dell'invocazione.
1250
1251   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1252   \val{NULL} in caso di fallimento, \var{errno} viene impostata a
1253   \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
1254 \end{prototype}
1255
1256 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
1257 per cui è sempre \index{funzioni!rientranti} rientrante, occorre però
1258 ricordarsi di disallocare il puntatore che restituisce.  L'argomento
1259 \param{pfx} specifica un prefisso di massimo 5 caratteri per il nome
1260 provvisorio. La funzione assegna come directory per il file temporaneo
1261 (verificando che esista e sia accessibili), la prima valida delle seguenti:
1262 \begin{itemize*}
1263 \item La variabile di ambiente \const{TMPNAME} (non ha effetto se non è
1264   definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
1265   \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}).
1266 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}).
1267 \item Il valore della costante \const{P\_tmpdir}.
1268 \item la directory \file{/tmp}.
1269 \end{itemize*}
1270
1271 In ogni caso, anche se la generazione del nome è casuale, ed è molto difficile
1272 ottenere un nome duplicato, nulla assicura che un altro processo non possa
1273 avere creato, fra l'ottenimento del nome e l'apertura del file, un altro file
1274 con lo stesso nome; per questo motivo quando si usa il nome ottenuto da una di
1275 queste funzioni occorre sempre aprire il nuovo file in modalità di esclusione
1276 (cioè con l'opzione \const{O\_EXCL} per i file descriptor o con il flag
1277 \code{x} per gli stream) che fa fallire l'apertura in caso il file sia già
1278 esistente.
1279
1280 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
1281 POSIX definisce la funzione \funcd{tmpfile}, il cui prototipo è:
1282 \begin{prototype}{stdio.h}{FILE *tmpfile (void)}
1283   Restituisce un file temporaneo aperto in lettura/scrittura.
1284   
1285   \bodydesc{La funzione ritorna il puntatore allo stream associato al file
1286     temporaneo in caso di successo e \val{NULL} in caso di errore, nel qual
1287     caso \var{errno} assumerà i valori:
1288     \begin{errlist}
1289     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
1290     \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
1291     \end{errlist}
1292     ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
1293     \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES}.}
1294 \end{prototype}
1295 \noindent essa restituisce direttamente uno stream già aperto (in modalità
1296 \code{r+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso, che viene
1297 automaticamente cancellato alla sua chiusura o all'uscita dal programma. Lo
1298 standard non specifica in quale directory verrà aperto il file, ma le
1299 \acr{glibc} prima tentano con \const{P\_tmpdir} e poi con \file{/tmp}. Questa
1300 funzione è \index{funzioni!rientranti} rientrante e non soffre di problemi di
1301 \itindex{race~condition} \textit{race condition}.
1302
1303 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
1304 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
1305 modificano una stringa di input che serve da modello e che deve essere
1306 conclusa da 6 caratteri \code{X} che verranno sostituiti da un codice
1307 unico. La prima delle due è analoga a \func{tmpnam} e genera un nome casuale,
1308 il suo prototipo è:
1309 \begin{prototype}{stlib.h}{char *mktemp(char *template)}
1310   Genera un filename univoco sostituendo le \code{XXXXXX} finali di
1311   \param{template}.
1312   
1313   \bodydesc{La funzione ritorna il puntatore \param{template} in caso di
1314     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1315     assumerà i valori:
1316     \begin{errlist}
1317     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1318     \end{errlist}}
1319 \end{prototype}
1320 \noindent dato che \param{template} deve poter essere modificata dalla
1321 funzione non si può usare una stringa costante.  Tutte le avvertenze riguardo
1322 alle possibili \itindex{race~condition} \textit{race condition} date per
1323 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
1324 il valore usato per sostituire le \code{XXXXXX} viene formato con il \acr{pid}
1325 del processo più una lettera, il che mette a disposizione solo 26 possibilità
1326 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
1327 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
1328 usata.
1329
1330 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
1331 \func{tmpfile}, ma restituisce un file descriptor invece di uno stream; il suo
1332 prototipo è:
1333 \begin{prototype}{stlib.h}{int mkstemp(char *template)}
1334   Genera un file temporaneo con un nome ottenuto sostituendo le \code{XXXXXX}
1335   finali di \param{template}.
1336   
1337   \bodydesc{La funzione ritorna il file descriptor in caso successo e
1338     -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
1339     \begin{errlist}
1340     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1341     \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
1342       contenuto di \param{template} è indefinito.
1343     \end{errlist}}
1344 \end{prototype}
1345 \noindent come per \func{mktemp} anche in questo caso \param{template} non può
1346 essere una stringa costante. La funzione apre un file in lettura/scrittura con
1347 la funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
1348 sez.~\ref{sec:file_open}), in questo modo al ritorno della funzione si ha la
1349 certezza di essere i soli utenti del file. I permessi sono impostati al valore
1350 \code{0600}\footnote{questo è vero a partire dalle \acr{glibc} 2.0.7, le
1351   versioni precedenti delle \acr{glibc} e le vecchie \acr{libc5} e \acr{libc4}
1352   usavano il valore \code{0666} che permetteva a chiunque di leggere i
1353   contenuti del file.} (si veda sez.~\ref{sec:file_perm_overview}).
1354
1355 In OpenBSD è stata introdotta un'altra funzione\footnote{introdotta anche in
1356   Linux a partire dalle \acr{glibc} 2.1.91.} simile alle precedenti,
1357 \funcd{mkdtemp}, che crea una directory temporanea; il suo prototipo è:
1358 \begin{prototype}{stlib.h}{char *mkdtemp(char *template)}
1359   Genera una directory temporaneo il cui nome è ottenuto sostituendo le
1360   \code{XXXXXX} finali di \param{template}.
1361   
1362   \bodydesc{La funzione ritorna il puntatore al nome della directory in caso
1363     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1364     assumerà i valori:
1365     \begin{errlist}
1366     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1367     \end{errlist}
1368     più gli altri eventuali codici di errore di \func{mkdir}.}
1369 \end{prototype}
1370 \noindent la directory è creata con permessi \code{0700} (al solito si veda
1371 cap.~\ref{cha:file_unix_interface} per i dettagli); dato che la creazione
1372 della directory è sempre esclusiva i precedenti problemi di
1373 \itindex{race~condition} \textit{race condition} non si pongono.
1374
1375
1376 \section{La manipolazione delle caratteristiche dei file}
1377 \label{sec:file_infos}
1378
1379 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
1380 relative alle caratteristiche di ciascun file, a partire dalle informazioni
1381 relative al controllo di accesso, sono mantenute \itindex{inode}
1382 nell'\textit{inode}.
1383
1384 Vedremo in questa sezione come sia possibile leggere tutte queste informazioni
1385 usando la funzione \func{stat}, che permette l'accesso a tutti i dati
1386 memorizzati \itindex{inode} nell'\textit{inode}; esamineremo poi le varie
1387 funzioni usate per manipolare tutte queste informazioni (eccetto quelle che
1388 riguardano la gestione del controllo di accesso, trattate in in
1389 sez.~\ref{sec:file_access_control}).
1390
1391
1392 \subsection{La lettura delle caratteristiche dei file}
1393 \label{sec:file_stat}
1394
1395 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
1396 delle funzioni \func{stat} (\funcd{stat}, \funcd{fstat} e \funcd{lstat});
1397 questa è la funzione che ad esempio usa il comando \cmd{ls} per poter ottenere
1398 e mostrare tutti i dati relativi ad un file. I prototipi di queste funzioni
1399 sono i seguenti:
1400 \begin{functions}
1401   \headdecl{sys/types.h} 
1402   \headdecl{sys/stat.h} 
1403   \headdecl{unistd.h}
1404
1405   \funcdecl{int stat(const char *file\_name, struct stat *buf)} Legge le
1406   informazione del file specificato da \param{file\_name} e le inserisce in
1407   \param{buf}.
1408   
1409   \funcdecl{int lstat(const char *file\_name, struct stat *buf)} Identica a
1410   \func{stat} eccetto che se il \param{file\_name} è un link simbolico vengono
1411   lette le informazioni relative ad esso e non al file a cui fa riferimento.
1412   
1413   \funcdecl{int fstat(int filedes, struct stat *buf)} Identica a \func{stat}
1414   eccetto che si usa con un file aperto, specificato tramite il suo file
1415   descriptor \param{filedes}.
1416   
1417   \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
1418     errore, nel qual caso \var{errno} assumerà uno dei valori: \errval{EBADF},
1419     \errval{ENOENT}, \errval{ENOTDIR}, \errval{ELOOP}, \errval{EFAULT},
1420     \errval{EACCES}, \errval{ENOMEM}, \errval{ENAMETOOLONG}.}
1421 \end{functions}
1422 \noindent il loro comportamento è identico, solo che operano rispettivamente
1423 su un file, su un link simbolico e su un file descriptor.
1424
1425 La struttura \struct{stat} usata da queste funzioni è definita nell'header
1426 \file{sys/stat.h} e in generale dipende dall'implementazione; la versione
1427 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
1428 riportata dalla pagina di manuale di \func{stat} (in realtà la definizione
1429 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
1430 riservati per estensioni come tempi più precisi, o per il padding dei campi).
1431
1432 \begin{figure}[!htb]
1433   \footnotesize
1434   \centering
1435   \begin{minipage}[c]{15cm}
1436     \includestruct{listati/stat.h}
1437   \end{minipage} 
1438   \normalsize 
1439   \caption{La struttura \structd{stat} per la lettura delle informazioni dei 
1440     file.}
1441   \label{fig:file_stat_struct}
1442 \end{figure}
1443
1444 Si noti come i vari membri della struttura siano specificati come tipi
1445 primitivi del sistema (di quelli definiti in
1446 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \file{sys/types.h}).
1447
1448 % TODO: aggiornare con i cambiamenti ai tempi fatti con il 2.6
1449
1450 \subsection{I tipi di file}
1451 \label{sec:file_types}
1452
1453 Come riportato in tab.~\ref{tab:file_file_types} in Linux oltre ai file e alle
1454 directory esistono altri oggetti che possono stare su un filesystem.  Il tipo
1455 di file è ritornato dalla funzione \func{stat} come maschera binaria nel campo
1456 \var{st\_mode} (che contiene anche le informazioni relative ai permessi) di
1457 una struttura \struct{stat}.
1458
1459 Dato che il valore numerico può variare a seconda delle implementazioni, lo
1460 standard POSIX definisce un insieme di macro per verificare il tipo di file,
1461 queste vengono usate anche da Linux che supporta pure le estensioni allo
1462 standard per i link simbolici e i socket definite da BSD; l'elenco completo
1463 delle macro con cui è possibile estrarre l'informazione da \var{st\_mode} è
1464 riportato in tab.~\ref{tab:file_type_macro}.
1465 \begin{table}[htb]
1466   \centering
1467   \footnotesize
1468   \begin{tabular}[c]{|l|l|}
1469     \hline
1470     \textbf{Macro} & \textbf{Tipo del file} \\
1471     \hline
1472     \hline
1473     \macro{S\_ISREG(m)}  & file normale.\\
1474     \macro{S\_ISDIR(m)}  & directory.\\
1475     \macro{S\_ISCHR(m)}  & dispositivo a caratteri.\\
1476     \macro{S\_ISBLK(m)}  & dispositivo a blocchi.\\
1477     \macro{S\_ISFIFO(m)} & fifo.\\
1478     \macro{S\_ISLNK(m)}  & link simbolico.\\
1479     \macro{S\_ISSOCK(m)} & socket.\\
1480     \hline    
1481   \end{tabular}
1482   \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h}).}
1483   \label{tab:file_type_macro}
1484 \end{table}
1485
1486 Oltre alle macro di tab.~\ref{tab:file_type_macro} è possibile usare
1487 direttamente il valore di \var{st\_mode} per ricavare il tipo di file
1488 controllando direttamente i vari bit in esso memorizzati. Per questo sempre in
1489 \file{sys/stat.h} sono definite le costanti numeriche riportate in
1490 tab.~\ref{tab:file_mode_flags}.
1491
1492 Il primo valore dell'elenco di tab.~\ref{tab:file_mode_flags} è la maschera
1493 binaria che permette di estrarre i bit nei quali viene memorizzato il tipo di
1494 file, i valori successivi sono le costanti corrispondenti ai singoli bit, e
1495 possono essere usati per effettuare la selezione sul tipo di file voluto, con
1496 un'opportuna combinazione.
1497
1498 \begin{table}[htb]
1499   \centering
1500   \footnotesize
1501   \begin{tabular}[c]{|l|c|l|}
1502     \hline
1503     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
1504     \hline
1505     \hline
1506     \const{S\_IFMT}   &  0170000 & Maschera per i bit del tipo di file.\\
1507     \const{S\_IFSOCK} &  0140000 & Socket.\\
1508     \const{S\_IFLNK}  &  0120000 & Link simbolico.\\
1509     \const{S\_IFREG}  &  0100000 & File regolare.\\ 
1510     \const{S\_IFBLK}  &  0060000 & Dispositivo a blocchi.\\
1511     \const{S\_IFDIR}  &  0040000 & Directory.\\
1512     \const{S\_IFCHR}  &  0020000 & Dispositivo a caratteri.\\
1513     \const{S\_IFIFO}  &  0010000 & Fifo.\\
1514     \hline
1515     \const{S\_ISUID}  &  0004000 & Set UID bit \itindex{suid~bit}.\\
1516     \const{S\_ISGID}  &  0002000 & Set GID bit \itindex{sgid~bit}.\\
1517     \const{S\_ISVTX}  &  0001000 & Sticky bit \itindex{sticky~bit}.\\
1518     \hline
1519 %    \const{S\_IRWXU}  &  00700   & Bitmask per i permessi del proprietario.\\
1520     \const{S\_IRUSR}  &  00400   & Il proprietario ha permesso di lettura.\\
1521     \const{S\_IWUSR}  &  00200   & Il proprietario ha permesso di scrittura.\\
1522     \const{S\_IXUSR}  &  00100   & Il proprietario ha permesso di esecuzione.\\
1523     \hline
1524 %    \const{S\_IRWXG}  &  00070   & Bitmask per i permessi del gruppo.\\
1525     \const{S\_IRGRP}  &  00040   & Il gruppo ha permesso di lettura.\\
1526     \const{S\_IWGRP}  &  00020   & Il gruppo ha permesso di scrittura.\\
1527     \const{S\_IXGRP}  &  00010   & Il gruppo ha permesso di esecuzione.\\
1528     \hline
1529 %    \const{S\_IRWXO}  &  00007   & Bitmask per i permessi di tutti gli altri\\
1530     \const{S\_IROTH}  &  00004   & Gli altri hanno permesso di lettura.\\
1531     \const{S\_IWOTH}  &  00002   & Gli altri hanno permesso di esecuzione.\\
1532     \const{S\_IXOTH}  &  00001   & Gli altri hanno permesso di esecuzione.\\
1533     \hline    
1534   \end{tabular}
1535   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
1536     \var{st\_mode} (definite in \file{sys/stat.h}).}
1537   \label{tab:file_mode_flags}
1538 \end{table}
1539
1540 Ad esempio se si volesse impostare una condizione che permetta di controllare
1541 se un file è una directory o un file ordinario si potrebbe definire la macro
1542 di preprocessore:
1543 \includecodesnip{listati/is_file_dir.h}
1544 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
1545 poi si effettua il confronto con la combinazione di tipi scelta.
1546
1547
1548 \subsection{Le dimensioni dei file}
1549 \label{sec:file_file_size}
1550
1551 Il campo \var{st\_size} di una struttura \struct{stat} contiene la dimensione
1552 del file in byte, se si tratta di un file regolare. Nel caso di un link
1553 simbolico la dimensione è quella del \itindex{pathname} \textit{pathname} che
1554 il link stesso contiene; per le fifo questo campo è sempre nullo.
1555
1556 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
1557 byte. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
1558 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
1559 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
1560 dimensione inferiore sarebbe inefficiente.
1561
1562 Si tenga conto che la lunghezza del file riportata in \var{st\_size} non è
1563 detto che corrisponda all'occupazione dello spazio su disco per via della
1564 possibile esistenza dei cosiddetti \textit{holes} (letteralmente
1565 \textsl{buchi}) che si formano tutte le volte che si va a scrivere su un file
1566 dopo aver eseguito una \func{lseek} (vedi sez.~\ref{sec:file_lseek}) oltre la
1567 sua fine.
1568
1569 In questo caso si avranno risultati differenti a seconda del modo in cui si
1570 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
1571 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
1572 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
1573 caso per le parti non scritte vengono restituiti degli zeri, si avrà lo stesso
1574 risultato di \cmd{ls}.
1575
1576 Se è sempre possibile allargare un file, scrivendoci sopra od usando la
1577 funzione \func{lseek} per spostarsi oltre la sua fine, esistono anche casi in
1578 cui si può avere bisogno di effettuare un troncamento, scartando i dati
1579 presenti al di là della dimensione scelta come nuova fine del file.
1580
1581 Un file può sempre essere troncato a zero aprendolo con il flag
1582 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
1583 dimensione si possono usare le due funzioni \funcd{truncate} e
1584 \funcd{ftruncate}, i cui prototipi sono:
1585 \begin{functions}
1586   \headdecl{unistd.h} \funcdecl{int truncate(const char *file\_name, off\_t
1587     length)} Fa si che la dimensione del file \param{file\_name} sia troncata
1588   ad un valore massimo specificato da \param{lenght}.
1589   
1590   \funcdecl{int ftruncate(int fd, off\_t length))} Identica a \func{truncate}
1591   eccetto che si usa con un file aperto, specificato tramite il suo file
1592   descriptor \param{fd}.
1593   
1594   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per un
1595     errore, nel qual caso \var{errno} viene impostata opportunamente; per
1596     \func{ftruncate} si hanno i valori:
1597   \begin{errlist}
1598   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
1599   \item[\errcode{EINVAL}] \param{fd} è un riferimento ad un socket, non a un
1600     file o non è aperto in scrittura.
1601   \end{errlist}
1602   per \func{truncate} si hanno:
1603   \begin{errlist}
1604   \item[\errcode{EACCES}] il file non ha permesso di scrittura o non si ha il
1605     permesso di esecuzione una delle directory del \itindex{pathname}
1606     \textit{pathname}.
1607   \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
1608   \end{errlist}
1609   ed anche \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1610   \errval{EROFS}, \errval{EIO}, \errval{EFAULT}, \errval{ELOOP}.}
1611 \end{functions}
1612
1613 Se il file è più lungo della lunghezza specificata i dati in eccesso saranno
1614 perduti; il comportamento in caso di lunghezza inferiore non è specificato e
1615 dipende dall'implementazione: il file può essere lasciato invariato o esteso
1616 fino alla lunghezza scelta; in quest'ultimo caso lo spazio viene riempito con
1617 zeri (e in genere si ha la creazione di un \textit{hole} nel file).
1618
1619
1620 \subsection{I tempi dei file}
1621 \label{sec:file_file_times}
1622
1623 Il sistema mantiene per ciascun file tre tempi. Questi sono registrati
1624 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del file e
1625 possono essere letti tramite la funzione \func{stat}, che li restituisce
1626 attraverso tre campi della struttura \struct{stat} di
1627 fig.~\ref{fig:file_stat_struct}. Il significato di detti tempi e dei relativi
1628 campi è riportato nello schema in tab.~\ref{tab:file_file_times}, dove è anche
1629 riportato un esempio delle funzioni che effettuano cambiamenti su di essi.
1630
1631 \begin{table}[htb]
1632   \centering
1633   \footnotesize
1634   \begin{tabular}[c]{|c|l|l|c|}
1635     \hline
1636     \textbf{Membro} & \textbf{Significato} & \textbf{Funzione} 
1637     & \textbf{Opzione di \cmd{ls}} \\
1638     \hline
1639     \hline
1640     \var{st\_atime}& ultimo accesso ai dati del file    &
1641                      \func{read}, \func{utime}          & \cmd{-u}\\
1642     \var{st\_mtime}& ultima modifica ai dati del file   &
1643                      \func{write}, \func{utime}         & default\\
1644     \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
1645                      \func{chmod}, \func{utime}         & \cmd{-c}\\
1646     \hline
1647   \end{tabular}
1648   \caption{I tre tempi associati a ciascun file.}
1649   \label{tab:file_file_times}
1650 \end{table}
1651
1652 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
1653 modifica (il \textit{modification time} \var{st\_mtime}) e il tempo di
1654 cambiamento di stato (il \textit{change time} \var{st\_ctime}). Il primo
1655 infatti fa riferimento ad una modifica del contenuto di un file, mentre il
1656 secondo ad una modifica \itindex{inode} dell'\textit{inode}; siccome esistono
1657 molte operazioni (come la funzione \func{link} e molte altre che vedremo in
1658 seguito) che modificano solo le informazioni contenute \itindex{inode}
1659 nell'\textit{inode} senza toccare il contenuto del file, diventa necessario
1660 l'utilizzo di un altro tempo.
1661
1662 Il sistema non tiene conto dell'ultimo accesso \itindex{inode}
1663 all'\textit{inode}, pertanto funzioni come \func{access} o \func{stat} non
1664 hanno alcuna influenza sui tre tempi. Il tempo di ultimo accesso (ai dati)
1665 viene di solito usato per cancellare i file che non servono più dopo un certo
1666 lasso di tempo (ad esempio il programma \cmd{leafnode} cancella i vecchi
1667 articoli sulla base di questo tempo).
1668
1669 \begin{table}[htb]
1670   \centering
1671   \footnotesize
1672   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
1673     \hline
1674     \multicolumn{1}{|p{3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
1675     \multicolumn{3}{|p{3.6cm}|}{\centering{
1676         \textbf{File o directory del riferimento}}}&
1677     \multicolumn{3}{|p{3.6cm}|}{\centering{
1678         \textbf{Directory contenente il riferimento}}} 
1679     &\multicolumn{1}{|p{3.6cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
1680     \cline{2-7}
1681     \cline{2-7}
1682     \multicolumn{1}{|p{3cm}|}{} 
1683     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1684     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1685     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1686     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1687     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1688     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1689     &\multicolumn{1}{|p{3cm}|}{} \\
1690     \hline
1691     \hline
1692     \func{chmod}, \func{fchmod} 
1693              & --      & --      &$\bullet$& --      & --      & --      &\\
1694     \func{chown}, \func{fchown} 
1695              & --      & --      &$\bullet$& --      & --      & --      &\\
1696     \func{creat}  
1697              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&  
1698              con \const{O\_CREATE} \\
1699     \func{creat}  
1700              & --      &$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&   
1701              con \const{O\_TRUNC} \\
1702     \func{exec}  
1703              &$\bullet$& --      & --      & --      & --      & --      &\\
1704     \func{lchown}  
1705              & --      & --      &$\bullet$& --      & --      & --      &\\
1706     \func{link}
1707              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
1708     \func{mkdir}
1709              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
1710     \func{mkfifo}
1711              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
1712     \func{open}
1713              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$& 
1714              con \const{O\_CREATE} \\
1715     \func{open}
1716              & --      &$\bullet$&$\bullet$& --      & --      & --      & 
1717              con \const{O\_TRUNC}  \\
1718     \func{pipe}
1719              &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
1720     \func{read}
1721              &$\bullet$& --      & --      & --      & --      & --      &\\
1722     \func{remove}
1723              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
1724              se esegue \func{unlink}\\
1725     \func{remove}
1726               & --      & --      & --      & --      &$\bullet$&$\bullet$& 
1727               se esegue \func{rmdir}\\
1728     \func{rename}
1729               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
1730               per entrambi gli argomenti\\
1731     \func{rmdir}
1732               & --      & --      & --      & --      &$\bullet$&$\bullet$&\\ 
1733     \func{truncate}, \func{ftruncate}
1734               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
1735     \func{unlink}
1736               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\ 
1737     \func{utime}
1738               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\ 
1739     \func{write}
1740               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
1741     \hline
1742   \end{tabular}
1743   \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo 
1744     accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento
1745     \textsl{(c)} dalle varie funzioni operanti su file e directory.}
1746   \label{tab:file_times_effects}  
1747 \end{table}
1748
1749
1750 Il tempo di ultima modifica invece viene usato da \cmd{make} per decidere
1751 quali file necessitano di essere ricompilati o (talvolta insieme anche al
1752 tempo di cambiamento di stato) per decidere quali file devono essere
1753 archiviati per il backup. Il comando \cmd{ls} (quando usato con le opzioni
1754 \cmd{-l} o \cmd{-t}) mostra i tempi dei file secondo lo schema riportato
1755 nell'ultima colonna di tab.~\ref{tab:file_file_times}.
1756
1757 L'effetto delle varie funzioni di manipolazione dei file sui tempi è
1758 illustrato in tab.~\ref{tab:file_times_effects}. Si sono riportati gli effetti
1759 sia per il file a cui si fa riferimento, sia per la directory che lo contiene;
1760 questi ultimi possono essere capiti se si tiene conto di quanto già detto, e
1761 cioè che anche le directory sono file (che contengono una lista di nomi) che
1762 il sistema tratta in maniera del tutto analoga a tutti gli altri.
1763
1764 Per questo motivo tutte le volte che compiremo un'operazione su un file che
1765 comporta una modifica del nome contenuto nella directory, andremo anche a
1766 scrivere sulla directory che lo contiene cambiandone il tempo di modifica. Un
1767 esempio di questo può essere la cancellazione di un file, invece leggere o
1768 scrivere o cambiare i permessi di un file ha effetti solo sui tempi di
1769 quest'ultimo.
1770
1771 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
1772 creazione del file, usato in molti altri sistemi operativi, ma che in Unix non
1773 esiste. Per questo motivo quando si copia un file, a meno di preservare
1774 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
1775 avrà sempre il tempo corrente come data di ultima modifica.
1776
1777 I tempi di ultimo accesso e modifica possono essere cambiati usando la
1778 funzione \funcd{utime}, il cui prototipo è:
1779 \begin{prototype}{utime.h}
1780 {int utime(const char *filename, struct utimbuf *times)} 
1781
1782 Cambia i tempi di ultimo accesso e modifica \itindex{inode}
1783 dell'\textit{inode} specificato da \param{filename} secondo i campi
1784 \var{actime} e \var{modtime} di \param{times}. Se questa è \val{NULL} allora
1785 viene usato il tempo corrente.
1786
1787 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1788   errore, nel qual caso \var{errno} assumerà uno dei valori:
1789   \begin{errlist}
1790   \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
1791   \item[\errcode{ENOENT}] \param{filename} non esiste.
1792   \end{errlist}}
1793 \end{prototype}
1794
1795 La funzione prende come argomento \param{times} una struttura
1796 \struct{utimbuf}, la cui definizione è riportata in
1797 fig.~\ref{fig:struct_utimebuf}, con la quale si possono specificare i nuovi
1798 valori che si vogliono impostare per tempi.
1799
1800 \begin{figure}[!htb]
1801   \footnotesize \centering
1802   \begin{minipage}[c]{15cm}
1803     \includestruct{listati/utimbuf.h}
1804   \end{minipage} 
1805   \normalsize 
1806   \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
1807     i tempi dei file.}
1808   \label{fig:struct_utimebuf}
1809 \end{figure}
1810
1811 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
1812 cosa è l'argomento \param{times}; se è \val{NULL} la funzione imposta il
1813 tempo corrente ed è sufficiente avere accesso in scrittura al file; se invece
1814 si è specificato un valore la funzione avrà successo solo se si è proprietari
1815 del file (o si hanno i privilegi di amministratore).
1816
1817 Si tenga presente che non è comunque possibile specificare il tempo di
1818 cambiamento di stato del file, che viene comunque cambiato dal kernel tutte le
1819 volte che si modifica \itindex{inode} l'\textit{inode} (quindi anche alla
1820 chiamata di \func{utime}).  Questo serve anche come misura di sicurezza per
1821 evitare che si possa modificare un file nascondendo completamente le proprie
1822 tracce.  In realtà la cosa resta possibile, se si è in grado di accedere al
1823 file di dispositivo, scrivendo direttamente sul disco senza passare attraverso
1824 il filesystem, ma ovviamente in questo modo la cosa è molto più complicata da
1825 realizzare.
1826
1827
1828
1829 \section{Il controllo di accesso ai file}
1830 \label{sec:file_access_control}
1831
1832 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
1833 del controllo di accesso ai file, che viene implementato per qualunque
1834 filesystem standard.\footnote{per standard si intende che implementa le
1835   caratteristiche previste dallo standard POSIX; in Linux sono disponibili
1836   anche una serie di altri filesystem, come quelli di Windows e del Mac, che
1837   non supportano queste caratteristiche.} In questa sezione ne esamineremo i
1838 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
1839
1840
1841 \subsection{I permessi per l'accesso ai file}
1842 \label{sec:file_perm_overview}
1843
1844 Ad ogni file Linux associa sempre l'utente che ne è proprietario (il
1845 cosiddetto \textit{owner}) ed un gruppo di appartenenza, secondo il meccanismo
1846 degli identificatori di utente e gruppo (\acr{uid} e \acr{gid}). Questi valori
1847 sono accessibili da programma tramite la funzione \func{stat}, e sono
1848 mantenuti nei campi \var{st\_uid} e \var{st\_gid} della struttura
1849 \struct{stat} (si veda sez.~\ref{sec:file_stat}).\footnote{questo è vero solo
1850   per filesystem di tipo Unix, ad esempio non è vero per il filesystem vfat di
1851   Windows, che non fornisce nessun supporto per l'accesso multiutente, e per
1852   il quale i permessi vengono assegnati in maniera fissa con un opzione in
1853   fase di montaggio.}
1854
1855 Il controllo di accesso ai file segue un modello abbastanza semplice che
1856 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
1857 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
1858     Control List} che sono state aggiunte ai filesystem standard con opportune
1859   estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
1860   controllo ancora più sofisticati come il \textit{mandatory access control}
1861   di SE-Linux.} ma nella maggior parte dei casi il meccanismo standard è più
1862 che sufficiente a soddisfare tutte le necessità più comuni.  I tre permessi di
1863 base associati ad ogni file sono:
1864 \begin{itemize*}
1865 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
1866   \textit{read}).
1867 \item il permesso di scrittura (indicato con la lettera \texttt{w},
1868   dall'inglese \textit{write}).
1869 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
1870   dall'inglese \textit{execute}).
1871 \end{itemize*}
1872 mentre i tre livelli su cui sono divisi i privilegi sono:
1873 \begin{itemize*}
1874 \item i privilegi per l'utente proprietario del file.
1875 \item i privilegi per un qualunque utente faccia parte del gruppo cui
1876   appartiene il file.
1877 \item i privilegi per tutti gli altri utenti.
1878 \end{itemize*}
1879
1880 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
1881 meno significativi sono usati a gruppi di tre per indicare i permessi base di
1882 lettura, scrittura ed esecuzione e sono applicati rispettivamente
1883 rispettivamente al proprietario, al gruppo, a tutti gli altri.
1884
1885 \begin{figure}[htb]
1886   \centering
1887   \includegraphics[width=6cm]{img/fileperm}
1888   \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
1889     contenuti nel campo \var{st\_mode} di \struct{stat}.}
1890   \label{fig:file_perm_bit}
1891 \end{figure}
1892
1893 I restanti tre bit (noti come \itindex{suid~bit} \textit{suid bit},
1894 \itindex{sgid~bit} \textit{sgid bit}, e \itindex{sticky~bit} \textit{sticky
1895   bit}) sono usati per indicare alcune caratteristiche più complesse del
1896 meccanismo del controllo di accesso su cui torneremo in seguito (in
1897 sez.~\ref{sec:file_special_perm}); lo schema di allocazione dei bit è
1898 riportato in fig.~\ref{fig:file_perm_bit}.
1899
1900 Anche i permessi, come tutte le altre informazioni pertinenti al file, sono
1901 memorizzati \itindex{inode} nell'\textit{inode}; in particolare essi sono
1902 contenuti in alcuni bit del campo \var{st\_mode} della struttura \struct{stat}
1903 (si veda di nuovo fig.~\ref{fig:file_stat_struct}).
1904
1905 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
1906 \cmd{u} (per \textit{user}), \cmd{g} (per \textit{group}) e \cmd{o} (per
1907 \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti insieme
1908 si usa la lettera \cmd{a} (per \textit{all}). Si tenga ben presente questa
1909 distinzione dato che in certi casi, mutuando la terminologia in uso nel VMS,
1910 si parla dei permessi base come di permessi per \textit{owner}, \textit{group}
1911 ed \textit{all}, le cui iniziali possono dar luogo a confusione.  Le costanti
1912 che permettono di accedere al valore numerico di questi bit nel campo
1913 \var{st\_mode} sono riportate in tab.~\ref{tab:file_bit_perm}.
1914
1915 \begin{table}[htb]
1916   \centering
1917     \footnotesize
1918   \begin{tabular}[c]{|c|l|}
1919     \hline
1920     \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
1921     \hline 
1922     \hline 
1923     \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
1924     \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
1925     \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\ 
1926     \hline            
1927     \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
1928     \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
1929     \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
1930     \hline            
1931     \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
1932     \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
1933     \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
1934     \hline              
1935   \end{tabular}
1936   \caption{I bit dei permessi di accesso ai file, come definiti in 
1937     \texttt{<sys/stat.h>}}
1938   \label{tab:file_bit_perm}
1939 \end{table}
1940
1941 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
1942 che si riferiscano a dei file, dei link simbolici o delle directory; qui ci
1943 limiteremo ad un riassunto delle regole generali, entrando nei dettagli più
1944 avanti.
1945
1946 La prima regola è che per poter accedere ad un file attraverso il suo
1947 \itindex{pathname} \textit{pathname} occorre il permesso di esecuzione in
1948 ciascuna delle directory che compongono il \textit{pathname}; lo stesso vale
1949 per aprire un file nella directory corrente (per la quale appunto serve il
1950 diritto di esecuzione).
1951
1952 Per una directory infatti il permesso di esecuzione significa che essa può
1953 essere attraversata nella risoluzione del \itindex{pathname}
1954 \textit{pathname}, ed è distinto dal permesso di lettura che invece implica
1955 che si può leggere il contenuto della directory.
1956
1957 Questo significa che se si ha il permesso di esecuzione senza permesso di
1958 lettura si potrà lo stesso aprire un file in una directory (se si hanno i
1959 permessi opportuni per il medesimo) ma non si potrà vederlo con \cmd{ls}
1960 (mentre per crearlo occorrerà anche il permesso di scrittura per la
1961 directory).
1962
1963 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
1964 (si veda quanto riportato in tab.~\ref{tab:file_open_flags}) di sola lettura o
1965 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
1966 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
1967 il contenuto, lo stesso permesso è necessario per poter troncare il file.
1968
1969 Non si può creare un file fintanto che non si disponga del permesso di
1970 esecuzione e di quello di scrittura per la directory di destinazione; gli
1971 stessi permessi occorrono per cancellare un file da una directory (si ricordi
1972 che questo non implica necessariamente la rimozione del contenuto del file dal
1973 disco), non è necessario nessun tipo di permesso per il file stesso (infatti
1974 esso non viene toccato, viene solo modificato il contenuto della directory,
1975 rimuovendo la voce che ad esso fa riferimento).
1976
1977 Per poter eseguire un file (che sia un programma compilato od uno script di
1978 shell, od un altro tipo di file eseguibile riconosciuto dal kernel), occorre
1979 avere il permesso di esecuzione, inoltre solo i file regolari possono essere
1980 eseguiti.
1981
1982 I permessi per un link simbolico sono ignorati, contano quelli del file a cui
1983 fa riferimento; per questo in genere il comando \cmd{ls} riporta per un link
1984 simbolico tutti i permessi come concessi; utente e gruppo a cui esso
1985 appartiene vengono pure ignorati quando il link viene risolto, vengono
1986 controllati solo quando viene richiesta la rimozione del link e quest'ultimo è
1987 in una directory con lo \itindex{sticky~bit} \textit{sticky bit} impostato (si
1988 veda sez.~\ref{sec:file_special_perm}).
1989
1990 La procedura con cui il kernel stabilisce se un processo possiede un certo
1991 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
1992 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
1993 \var{st\_gid} accennati in precedenza) e l'user-ID effettivo, il group-ID
1994 effettivo e gli eventuali group-ID supplementari del processo.\footnote{in
1995   realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
1996   identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
1997   sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
1998   eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
1999   differenza.}
2000
2001 Per una spiegazione dettagliata degli identificatori associati ai processi si
2002 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
2003 sez.~\ref{sec:file_special_perm}, l'user-ID effettivo e il group-ID effettivo
2004 corrispondono ai valori dell'\acr{uid} e del \acr{gid} dell'utente che ha
2005 lanciato il processo, mentre i group-ID supplementari sono quelli dei gruppi
2006 cui l'utente appartiene.
2007
2008 I passi attraverso i quali viene stabilito se il processo possiede il diritto
2009 di accesso sono i seguenti:
2010 \begin{enumerate}
2011 \item Se l'user-ID effettivo del processo è zero (corrispondente
2012   all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
2013   controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
2014   tutti i file.
2015 \item Se l'user-ID effettivo del processo è uguale all'\acr{uid} del
2016   proprietario del file (nel qual caso si dice che il processo è proprietario
2017   del file) allora:
2018   \begin{itemize*}
2019   \item se il relativo\footnote{per relativo si intende il bit di user-read se
2020       il processo vuole accedere in lettura, quello di user-write per
2021       l'accesso in scrittura, ecc.} bit dei permessi d'accesso dell'utente è
2022     impostato, l'accesso è consentito
2023   \item altrimenti l'accesso è negato
2024   \end{itemize*}
2025 \item Se il group-ID effettivo del processo o uno dei group-ID supplementari
2026   dei processi corrispondono al \acr{gid} del file allora:
2027   \begin{itemize*}
2028   \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
2029     consentito, 
2030   \item altrimenti l'accesso è negato
2031   \end{itemize*}
2032 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
2033   l'accesso è consentito, altrimenti l'accesso è negato.
2034 \end{enumerate}
2035
2036 Si tenga presente che questi passi vengono eseguiti esattamente in
2037 quest'ordine. Questo vuol dire che se un processo è il proprietario di un file,
2038 l'accesso è consentito o negato solo sulla base dei permessi per l'utente; i
2039 permessi per il gruppo non vengono neanche controllati. Lo stesso vale se il
2040 processo appartiene ad un gruppo appropriato, in questo caso i permessi per
2041 tutti gli altri non vengono controllati.
2042
2043
2044 \subsection{I bit dei permessi speciali}
2045 \label{sec:file_special_perm}
2046
2047 \itindbeg{suid~bit}
2048 \itindbeg{sgid~bit}
2049
2050 Come si è accennato (in sez.~\ref{sec:file_perm_overview}) nei dodici bit del
2051 campo \var{st\_mode} di \struct{stat} che vengono usati per il controllo di
2052 accesso oltre ai bit dei permessi veri e propri, ci sono altri tre bit che
2053 vengono usati per indicare alcune proprietà speciali dei file.  Due di questi
2054 sono i bit detti \acr{suid} (da \textit{set-user-ID bit}) e \acr{sgid} (da
2055 \textit{set-group-ID bit}) che sono identificati dalle costanti
2056 \const{S\_ISUID} e \const{S\_ISGID}.
2057
2058 Come spiegato in dettaglio in sez.~\ref{sec:proc_exec}, quando si lancia un
2059 programma il comportamento normale del kernel è quello di impostare gli
2060 identificatori del gruppo \textit{effective} del nuovo processo al valore dei
2061 corrispondenti del gruppo \textit{real} del processo corrente, che normalmente
2062 corrispondono a quelli dell'utente con cui si è entrati nel sistema.
2063
2064 Se però il file del programma (che ovviamente deve essere
2065 eseguibile\footnote{per motivi di sicurezza il kernel ignora i bit \acr{suid}
2066   e \acr{sgid} per gli script eseguibili.}) ha il bit \acr{suid} impostato, il
2067 kernel assegnerà come user-ID effettivo al nuovo processo l'\acr{uid} del
2068 proprietario del file al posto dell'\acr{uid} del processo originario.  Avere
2069 il bit \acr{sgid} impostato ha lo stesso effetto sul group-ID effettivo del
2070 processo.
2071
2072 I bit \acr{suid} e \acr{sgid} vengono usati per permettere agli utenti normali
2073 di usare programmi che richiedono privilegi speciali; l'esempio classico è il
2074 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
2075 quest'ultimo ovviamente può essere scritto solo dall'amministratore, ma non è
2076 necessario chiamare l'amministratore per cambiare la propria password. Infatti
2077 il comando \cmd{passwd} appartiene a root ma ha il bit \acr{suid} impostato
2078 per cui quando viene lanciato da un utente normale parte con i privilegi di
2079 root.
2080
2081 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
2082 normalmente l'utente che lo ha lanciato comporta vari rischi, e questo tipo di
2083 programmi devono essere scritti accuratamente per evitare che possano essere
2084 usati per guadagnare privilegi non consentiti (l'argomento è affrontato in
2085 dettaglio in sez.~\ref{sec:proc_perms}).
2086
2087 La presenza dei bit \acr{suid} e \acr{sgid} su un file può essere rilevata con
2088 il comando \cmd{ls -l}, che visualizza una lettera \cmd{s} al posto della
2089 \cmd{x} in corrispondenza dei permessi di utente o gruppo. La stessa lettera
2090 \cmd{s} può essere usata nel comando \cmd{chmod} per impostare questi bit.
2091 Infine questi bit possono essere controllati all'interno di \var{st\_mode} con
2092 l'uso delle due costanti \const{S\_ISUID} e \const{S\_IGID}, i cui valori sono
2093 riportati in tab.~\ref{tab:file_mode_flags}.
2094
2095 Gli stessi bit vengono ad assumere in significato completamente diverso per le
2096 directory, normalmente infatti Linux usa la convenzione di SVr4 per indicare
2097 con questi bit l'uso della semantica BSD nella creazione di nuovi file (si
2098 veda sez.~\ref{sec:file_ownership_management} per una spiegazione dettagliata
2099 al proposito).
2100
2101 Infine Linux utilizza il bit \acr{sgid} per un'ulteriore estensione mutuata
2102 da SVr4. Il caso in cui un file ha il bit \acr{sgid} impostato senza che lo
2103 sia anche il corrispondente bit di esecuzione viene utilizzato per attivare
2104 per quel file il \itindex{mandatory~locking} \textit{mandatory locking}
2105 (affronteremo questo argomento in dettaglio più avanti, in
2106 sez.~\ref{sec:file_mand_locking}).
2107
2108 \itindend{suid~bit}
2109 \itindend{sgid~bit}
2110
2111
2112 \itindbeg{sticky~bit}
2113
2114 L'ultimo dei bit rimanenti, identificato dalla costante \const{S\_ISVTX}, è in
2115 parte un rimasuglio delle origini dei sistemi Unix. A quell'epoca infatti la
2116 memoria virtuale e l'accesso ai file erano molto meno sofisticati e per
2117 ottenere la massima velocità possibile per i programmi usati più comunemente
2118 si poteva impostare questo bit.
2119
2120 L'effetto di questo bit era che il \index{segmento!testo} segmento di testo
2121 del programma (si veda sez.~\ref{sec:proc_mem_layout} per i dettagli) veniva
2122 scritto nella swap la prima volta che questo veniva lanciato, e vi permaneva
2123 fino al riavvio della macchina (da questo il nome di \textsl{sticky bit});
2124 essendo la swap un file continuo o una partizione indicizzata direttamente si
2125 poteva risparmiare in tempo di caricamento rispetto alla ricerca attraverso la
2126 struttura del filesystem. Lo \textsl{sticky bit} è indicato usando la lettera
2127 \texttt{t} al posto della \texttt{x} nei permessi per gli altri.
2128
2129 Ovviamente per evitare che gli utenti potessero intasare la swap solo
2130 l'amministratore era in grado di impostare questo bit, che venne chiamato
2131 anche con il nome di \textit{saved text bit}, da cui deriva quello della
2132 costante.  Le attuali implementazioni di memoria virtuale e filesystem rendono
2133 sostanzialmente inutile questo procedimento.
2134
2135 Benché ormai non venga più utilizzato per i file, lo \textit{sticky bit} ha
2136 invece assunto un uso importante per le directory;\footnote{lo \textit{sticky
2137     bit} per le directory è un'estensione non definita nello standard POSIX,
2138   Linux però la supporta, così come BSD e SVr4.} in questo caso se tale bit è
2139 impostato un file potrà essere rimosso dalla directory soltanto se l'utente ha
2140 il permesso di scrittura su di essa ed inoltre è vera una delle seguenti
2141 condizioni:
2142 \begin{itemize*}
2143 \item l'utente è proprietario del file
2144 \item l'utente è proprietario della directory
2145 \item l'utente è l'amministratore 
2146 \end{itemize*}
2147 un classico esempio di directory che ha questo bit impostato è \file{/tmp}, i
2148 permessi infatti di solito sono i seguenti:
2149 \begin{verbatim}
2150 $ ls -ld /tmp
2151 drwxrwxrwt    6 root     root         1024 Aug 10 01:03 /tmp
2152 \end{verbatim}%$
2153 quindi con lo \textit{sticky bit} bit impostato. In questo modo qualunque
2154 utente nel sistema può creare dei file in questa directory (che, come
2155 suggerisce il nome, è normalmente utilizzata per la creazione di file
2156 temporanei), ma solo l'utente che ha creato un certo file potrà cancellarlo o
2157 rinominarlo. In questo modo si evita che un utente possa, più o meno
2158 consapevolmente, cancellare i file temporanei creati degli altri utenti.
2159
2160 \itindend{sticky~bit}
2161
2162 \subsection{Le funzioni per la gestione dei permessi dei file}
2163 \label{sec:file_perm_management}
2164
2165 Come visto in sez.~\ref{sec:file_access_control} il controllo di accesso ad un
2166 file viene fatto utilizzando l'user-ID ed il group-ID effettivo del processo;
2167 ci sono casi però in cui si può voler effettuare il controllo con l'user-ID
2168 reale ed il group-ID reale, vale a dire usando i valori di \acr{uid} e
2169 \acr{gid} relativi all'utente che ha lanciato il programma, e che, come
2170 accennato in sez.~\ref{sec:file_special_perm} e spiegato in dettaglio in
2171 sez.~\ref{sec:proc_perms}, non è detto siano uguali a quelli effettivi.
2172
2173 Per far questo si può usare la funzione \funcd{access}, il cui prototipo è:
2174 \begin{prototype}{unistd.h}
2175 {int access(const char *pathname, int mode)}
2176
2177 Verifica i permessi di accesso.
2178   
2179 \bodydesc{La funzione ritorna 0 se l'accesso è consentito, -1 se l'accesso non
2180   è consentito ed in caso di errore; nel qual caso la variabile \var{errno}
2181   assumerà i valori:
2182   \begin{errlist}
2183   \item[\errcode{EINVAL}] il valore di \param{mode} non è valido.
2184   \item[\errcode{EACCES}] l'accesso al file non è consentito, o non si ha il
2185     permesso di attraversare una delle directory di \param{pathname}.
2186   \item[\errcode{EROFS}] si è richiesto l'accesso in scrittura per un file su
2187     un filesystem montato in sola lettura.
2188   \end{errlist}
2189   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2190   \errval{ENOTDIR}, \errval{ELOOP}, \errval{EIO}.}
2191 \end{prototype}
2192
2193 La funzione verifica i permessi di accesso, indicati da \param{mode}, per il
2194 file indicato da \param{pathname}. I valori possibili per l'argomento
2195 \param{mode} sono esprimibili come combinazione delle costanti numeriche
2196 riportate in tab.~\ref{tab:file_access_mode_val} (attraverso un OR binario
2197 delle stesse). I primi tre valori implicano anche la verifica dell'esistenza
2198 del file, se si vuole verificare solo quest'ultima si può usare \const{F\_OK},
2199 o anche direttamente \func{stat}. Nel caso in cui \param{pathname} si
2200 riferisca ad un link simbolico, questo viene seguito ed il controllo è fatto
2201 sul file a cui esso fa riferimento.
2202
2203 La funzione controlla solo i bit dei permessi di accesso, si ricordi che il
2204 fatto che una directory abbia permesso di scrittura non significa che ci si
2205 possa scrivere come in un file, e il fatto che un file abbia permesso di
2206 esecuzione non comporta che contenga un programma eseguibile. La funzione
2207 ritorna zero solo se tutte i permessi controllati sono disponibili, in caso
2208 contrario (o di errore) ritorna -1.
2209 \begin{table}[htb]
2210   \centering
2211   \footnotesize
2212   \begin{tabular}{|c|l|}
2213     \hline
2214     \textbf{\param{mode}} & \textbf{Significato} \\
2215     \hline
2216     \hline
2217     \const{R\_OK} & Verifica il permesso di lettura. \\
2218     \const{W\_OK} & Verifica il permesso di scrittura. \\
2219     \const{X\_OK} & Verifica il permesso di esecuzione. \\
2220     \const{F\_OK} & Verifica l'esistenza del file. \\
2221     \hline
2222   \end{tabular}
2223   \caption{Valori possibile per l'argomento \param{mode} della funzione 
2224     \func{access}.}
2225   \label{tab:file_access_mode_val}
2226 \end{table}
2227
2228 Un esempio tipico per l'uso di questa funzione è quello di un processo che sta
2229 eseguendo un programma coi privilegi di un altro utente (ad esempio attraverso
2230 l'uso del \itindex{suid~bit} \textit{suid bit}) che vuole controllare se
2231 l'utente originale ha i permessi per accedere ad un certo file.
2232
2233 % TODO documentare euidaccess (e eaccess)
2234
2235 Per cambiare i permessi di un file il sistema mette ad disposizione due
2236 funzioni \funcd{chmod} e \funcd{fchmod}, che operano rispettivamente su un
2237 filename e su un file descriptor, i loro prototipi sono:
2238 \begin{functions}
2239   \headdecl{sys/types.h} 
2240   \headdecl{sys/stat.h} 
2241   
2242   \funcdecl{int chmod(const char *path, mode\_t mode)} Cambia i permessi del
2243   file indicato da \param{path} al valore indicato da \param{mode}.
2244   
2245   \funcdecl{int fchmod(int fd, mode\_t mode)} Analoga alla precedente, ma usa
2246   il file descriptor \param{fd} per indicare il file.
2247   
2248   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
2249     un errore, in caso di errore \var{errno} può assumere i valori:
2250   \begin{errlist}
2251   \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2252     proprietario del file o non è zero.
2253     \item[\errcode{EROFS}] il file è su un filesystem in sola lettura.
2254   \end{errlist}
2255   ed inoltre \errval{EIO}; \func{chmod} restituisce anche \errval{EFAULT},
2256   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2257   \errval{EACCES}, \errval{ELOOP}; \func{fchmod} anche \errval{EBADF}.}
2258 \end{functions}
2259
2260 Entrambe le funzioni utilizzano come secondo argomento \param{mode}, una
2261 variabile dell'apposito tipo primitivo \type{mode\_t} (vedi
2262 tab.~\ref{tab:intro_primitive_types}) utilizzato per specificare i permessi sui
2263 file.
2264
2265 \begin{table}[!htb]
2266   \centering
2267   \footnotesize
2268   \begin{tabular}[c]{|c|c|l|}
2269     \hline
2270     \textbf{\param{mode}} & \textbf{Valore} & \textbf{Significato} \\
2271     \hline
2272     \hline
2273     \const{S\_ISUID} & 04000 & Set user ID \itindex{suid~bit}.\\
2274     \const{S\_ISGID} & 02000 & Set group ID \itindex{sgid~bit}.\\
2275     \const{S\_ISVTX} & 01000 & Sticky bit \itindex{sticky~bit}.\\
2276     \hline
2277     \const{S\_IRWXU} & 00700 & L'utente ha tutti i permessi.\\
2278     \const{S\_IRUSR} & 00400 & L'utente ha il permesso di lettura.\\
2279     \const{S\_IWUSR} & 00200 & L'utente ha il permesso di scrittura.\\
2280     \const{S\_IXUSR} & 00100 & L'utente ha il permesso di esecuzione.\\
2281     \hline
2282     \const{S\_IRWXG} & 00070 & Il gruppo ha tutti i permessi.\\
2283     \const{S\_IRGRP} & 00040 & Il gruppo ha il permesso di lettura.\\
2284     \const{S\_IWGRP} & 00020 & Il gruppo ha il permesso di scrittura.\\
2285     \const{S\_IXGRP} & 00010 & Il gruppo ha il permesso di esecuzione.\\
2286     \hline
2287     \const{S\_IRWXO} & 00007 & Gli altri hanno tutti i permessi.\\
2288     \const{S\_IROTH} & 00004 & Gli altri hanno il permesso di lettura.\\
2289     \const{S\_IWOTH} & 00002 & Gli altri hanno il permesso di scrittura.\\
2290     \const{S\_IXOTH} & 00001 & Gli altri hanno il permesso di esecuzione.\\
2291     \hline
2292   \end{tabular}
2293   \caption{Valori delle costanti usate per indicare i vari bit di
2294     \param{mode} utilizzato per impostare i permessi dei file.}
2295   \label{tab:file_permission_const}
2296 \end{table}
2297
2298 Le costanti con cui specificare i singoli bit di \param{mode} sono riportate
2299 in tab.~\ref{tab:file_permission_const}. Il valore di \param{mode} può essere
2300 ottenuto combinando fra loro con un OR binario le costanti simboliche relative
2301 ai vari bit, o specificato direttamente, come per l'omonimo comando di shell,
2302 con un valore numerico (la shell lo vuole in ottale, dato che i bit dei
2303 permessi sono divisibili in gruppi di tre), che si può calcolare direttamente
2304 usando lo schema si utilizzo dei bit illustrato in
2305 fig.~\ref{fig:file_perm_bit}.
2306
2307 Ad esempio i permessi standard assegnati ai nuovi file (lettura e scrittura
2308 per il proprietario, sola lettura per il gruppo e gli altri) sono
2309 corrispondenti al valore ottale $0644$, un programma invece avrebbe anche il
2310 bit di esecuzione attivo, con un valore di $0755$, se si volesse attivare il
2311 bit \itindex{suid~bit} \acr{suid} il valore da fornire sarebbe $4755$.
2312
2313 Il cambiamento dei permessi di un file eseguito attraverso queste funzioni ha
2314 comunque alcune limitazioni, previste per motivi di sicurezza. L'uso delle
2315 funzioni infatti è possibile solo se l'user-ID effettivo del processo
2316 corrisponde a quello del proprietario del file o dell'amministratore,
2317 altrimenti esse falliranno con un errore di \errcode{EPERM}.
2318
2319 Ma oltre a questa regola generale, di immediata comprensione, esistono delle
2320 limitazioni ulteriori. Per questo motivo, anche se si è proprietari del file,
2321 non tutti i valori possibili di \param{mode} sono permessi o hanno effetto;
2322 in particolare accade che:
2323 \begin{enumerate}
2324 \item siccome solo l'amministratore può impostare lo \itindex{sticky~bit}
2325   \textit{sticky bit}, se l'user-ID effettivo del processo non è zero esso
2326   viene automaticamente cancellato (senza notifica di errore) qualora sia
2327   stato indicato in \param{mode}.
2328 \item per quanto detto in sez.~\ref{sec:file_ownership_management} riguardo la
2329   creazione dei nuovi file, si può avere il caso in cui il file creato da un
2330   processo è assegnato ad un gruppo per il quale il processo non ha privilegi.
2331   Per evitare che si possa assegnare il bit \itindex{sgid~bit} \acr{sgid} ad
2332   un file appartenente ad un gruppo per cui non si hanno diritti, questo viene
2333   automaticamente cancellato da \param{mode} (senza notifica di errore)
2334   qualora il gruppo del file non corrisponda a quelli associati al processo
2335   (la cosa non avviene quando l'user-ID effettivo del processo è zero).
2336 \end{enumerate}
2337
2338 Per alcuni filesystem\footnote{i filesystem più comuni (\textsl{ext2},
2339   \textsl{ext3}, \textsl{reiserfs}) supportano questa caratteristica, che è
2340   mutuata da BSD.} è inoltre prevista un'ulteriore misura di sicurezza, volta
2341 a scongiurare l'abuso dei \itindex{suid~bit} bit \acr{suid} e \acr{sgid}; essa
2342 consiste nel cancellare automaticamente questi bit dai permessi di un file
2343 qualora un processo che non appartenga all'amministratore\footnote{per la
2344   precisione un processo che non dispone della capability
2345   \const{CAP\_FSETID}.} effettui una scrittura. In questo modo anche se un
2346 utente malizioso scopre un file \acr{suid} su cui può scrivere, un'eventuale
2347 modifica comporterà la perdita di questo privilegio.
2348
2349 Le funzioni \func{chmod} e \func{fchmod} ci permettono di modificare i
2350 permessi di un file, resta però il problema di quali sono i permessi assegnati
2351 quando il file viene creato. Le funzioni dell'interfaccia nativa di Unix, come
2352 vedremo in sez.~\ref{sec:file_open}, permettono di indicare esplicitamente i
2353 permessi di creazione di un file, ma questo non è possibile per le funzioni
2354 dell'interfaccia standard ANSI C che non prevede l'esistenza di utenti e
2355 gruppi, ed inoltre il problema si pone anche per l'interfaccia nativa quando i
2356 permessi non vengono indicati esplicitamente. 
2357
2358 \itindbeg{umask} 
2359
2360 Per le funzioni dell'interfaccia standard ANSI C l'unico riferimento possibile
2361 è quello della modalità di apertura del nuovo file (lettura/scrittura o sola
2362 lettura), che però può fornire un valore che è lo stesso per tutti e tre i
2363 permessi di sez.~\ref{sec:file_perm_overview} (cioè $666$ nel primo caso e
2364 $222$ nel secondo). Per questo motivo il sistema associa ad ogni
2365 processo\footnote{è infatti contenuta nel campo \var{umask} della struttura
2366   \struct{fs\_struct}, vedi fig.~\ref{fig:proc_task_struct}.}  una maschera di
2367 bit, la cosiddetta \textit{umask}, che viene utilizzata per impedire che
2368 alcuni permessi possano essere assegnati ai nuovi file in sede di creazione. I
2369 bit indicati nella maschera vengono infatti cancellati dai permessi quando un
2370 nuovo file viene creato.\footnote{l'operazione viene fatta sempre: anche
2371   qualora si indichi esplicitamente un valore dei permessi nelle funzioni di
2372   creazione che lo consentono, i permessi contenuti nella \textit{umask}
2373   verranno tolti.}
2374
2375 La funzione che permette di impostare il valore di questa maschera di
2376 controllo è \funcd{umask}, ed il suo prototipo è:
2377 \begin{prototype}{stat.h}
2378 {mode\_t umask(mode\_t mask)}
2379
2380 Imposta la maschera dei permessi dei bit al valore specificato da \param{mask}
2381 (di cui vengono presi solo i 9 bit meno significativi).
2382   
2383   \bodydesc{La funzione ritorna il precedente valore della maschera. È una
2384     delle poche funzioni che non restituisce codici di errore.}
2385 \end{prototype}
2386
2387 In genere si usa questa maschera per impostare un valore predefinito che
2388 escluda preventivamente alcuni permessi (usualmente quello di scrittura per il
2389 gruppo e gli altri, corrispondente ad un valore per \param{mask} pari a
2390 $022$).  In questo modo è possibile cancellare automaticamente i permessi non
2391 voluti.  Di norma questo valore viene impostato una volta per tutte al login a
2392 $022$, e gli utenti non hanno motivi per modificarlo.
2393
2394 \itindend{umask} 
2395
2396
2397 \subsection{La gestione della titolarità dei file}
2398 \label{sec:file_ownership_management}
2399
2400 Vedremo in sez.~\ref{sec:file_base_func} con quali funzioni si possono creare
2401 nuovi file, in tale occasione vedremo che è possibile specificare in sede di
2402 creazione quali permessi applicare ad un file, però non si può indicare a
2403 quale utente e gruppo esso deve appartenere.  Lo stesso problema si presenta
2404 per la creazione di nuove directory (procedimento descritto in
2405 sez.~\ref{sec:file_dir_creat_rem}).
2406
2407 Lo standard POSIX prescrive che l'\acr{uid} del nuovo file corrisponda
2408 all'user-ID effettivo del processo che lo crea; per il \acr{gid} invece prevede
2409 due diverse possibilità:
2410 \begin{itemize*}
2411 \item il \acr{gid} del file corrisponde al group-ID effettivo del processo.
2412 \item il \acr{gid} del file corrisponde al \acr{gid} della directory in cui
2413   esso è creato.
2414 \end{itemize*}
2415 in genere BSD usa sempre la seconda possibilità, che viene per questo chiamata
2416 semantica BSD. Linux invece segue quella che viene chiamata semantica SVr4; di
2417 norma cioè il nuovo file viene creato, seguendo la prima opzione, con il
2418 \acr{gid} del processo, se però la directory in cui viene creato il file ha il
2419 bit \acr{sgid} impostato allora viene usata la seconda opzione.
2420
2421 Usare la semantica BSD ha il vantaggio che il \acr{gid} viene sempre
2422 automaticamente propagato, restando coerente a quello della directory di
2423 partenza, in tutte le sotto-directory. 
2424
2425 La semantica SVr4 offre la possibilità di scegliere, ma per ottenere lo stesso
2426 risultato di coerenza che si ha con BSD necessita che per le nuove directory
2427 venga anche propagato anche il bit \acr{sgid}. Questo è il comportamento
2428 predefinito del comando \cmd{mkdir}, ed è in questo modo ad esempio che Debian
2429 assicura che le sotto-directory create nella home di un utente restino sempre
2430 con il \acr{gid} del gruppo primario dello stesso.
2431
2432 Come per i permessi, il sistema fornisce anche delle funzioni che permettano
2433 di cambiare utente e gruppo cui il file appartiene; le funzioni in questione
2434 sono tre: \funcd{chown}, \funcd{fchown} e \funcd{lchown}, ed i loro prototipi
2435 sono:
2436 \begin{functions}
2437   \headdecl{sys/types.h} 
2438   \headdecl{sys/stat.h} 
2439   
2440   \funcdecl{int chown(const char *path, uid\_t owner, gid\_t group)}
2441   \funcdecl{int fchown(int fd, uid\_t owner, gid\_t group)}
2442   \funcdecl{int lchown(const char *path, uid\_t owner, gid\_t group)}
2443
2444   Le funzioni cambiano utente e gruppo di appartenenza di un file ai valori
2445   specificati dalle variabili \param{owner} e \param{group}. 
2446   
2447   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
2448     un errore, in caso di errore \var{errno} può assumere i valori:
2449   \begin{errlist}
2450   \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2451     proprietario del file o non è zero, o utente e gruppo non sono validi
2452   \end{errlist}
2453   Oltre a questi entrambe restituiscono gli errori \errval{EROFS} e
2454   \errval{EIO}; \func{chown} restituisce anche \errval{EFAULT},
2455   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2456   \errval{EACCES}, \errval{ELOOP}; \func{fchown} anche \errval{EBADF}.}
2457 \end{functions}
2458
2459 In Linux soltanto l'amministratore (in sostanza un processo con la
2460 \itindex{capabilities} capability \const{CAP\_CHOWN}) può cambiare il
2461 proprietario di un file, seguendo la semantica di BSD che non consente agli
2462 utenti di assegnare i loro file ad altri (per evitare eventuali aggiramenti
2463 delle quote).  L'amministratore può cambiare il gruppo di un file, il
2464 proprietario può cambiare il gruppo dei file che gli appartengono solo se il
2465 nuovo gruppo è il suo gruppo primario o uno dei gruppi di cui fa parte.
2466
2467 La funzione \func{chown} segue i link simbolici, per operare direttamente su
2468 un link simbolico si deve usare la funzione \func{lchown}.\footnote{fino alla
2469   versione 2.1.81 in Linux \func{chown} non seguiva i link simbolici, da
2470   allora questo comportamento è stato assegnato alla funzione \func{lchown},
2471   introdotta per l'occasione, ed è stata creata una nuova system call per
2472   \func{chown} che seguisse i link simbolici.} La funzione \func{fchown} opera
2473 su un file aperto, essa è mutuata da BSD, ma non è nello standard POSIX.
2474 Un'altra estensione rispetto allo standard POSIX è che specificando -1 come
2475 valore per \param{owner} e \param{group} i valori restano immutati.
2476
2477 Quando queste funzioni sono chiamate con successo da un processo senza i
2478 privilegi di root entrambi i bit \itindex{suid~bit} \acr{suid} e
2479 \itindex{sgid~bit} \acr{sgid} vengono cancellati. Questo non avviene per il
2480 bit \acr{sgid} nel caso in cui esso sia usato (in assenza del corrispondente
2481 permesso di esecuzione) per indicare che per il file è attivo il
2482 \itindex{mandatory~locking} \textit{mandatory locking}.
2483
2484
2485 \subsection{Un quadro d'insieme sui permessi}
2486 \label{sec:file_riepilogo}
2487
2488 Avendo affrontato in maniera separata il comportamento delle varie funzioni ed
2489 il significato dei singoli bit dei permessi sui file, vale la pena fare un
2490 riepilogo in cui si riassumono le caratteristiche di ciascuno di essi, in modo
2491 da poter fornire un quadro d'insieme.
2492
2493 In tab.~\ref{tab:file_fileperm_bits} si sono riassunti gli effetti dei vari
2494 bit dei permessi per un file; per quanto riguarda l'applicazione dei permessi
2495 per proprietario, gruppo ed altri si ricordi quanto illustrato in
2496 sez.~\ref{sec:file_perm_overview}.  Per compattezza, nella tabelle si sono
2497 specificati i bit di \itindex{suid~bit} \textit{suid}, \itindex{sgid~bit}
2498 \textit{sgid} e \textit{sticky} \itindex{sticky~bit} con la notazione
2499 illustrata anche in fig.~\ref{fig:file_perm_bit}.
2500
2501 \begin{table}[!htb]
2502   \centering
2503   \footnotesize
2504   \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
2505     \hline
2506     \multicolumn{3}{|c|}{special}&
2507     \multicolumn{3}{|c|}{user}&
2508     \multicolumn{3}{|c|}{group}&
2509     \multicolumn{3}{|c|}{other}&
2510     \multirow{2}{*}{\textbf{Operazioni possibili}} \\
2511     \cline{1-12}
2512     \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2513     \hline
2514     \hline
2515    1&-&-&-&-&-&-&-&-&-&-&-&Se eseguito ha i permessi del proprietario.\\
2516    -&1&-&-&-&1&-&-&-&-&-&-&Se eseguito ha i permessi del gruppo proprietario.\\
2517    -&1&-&-&-&0&-&-&-&-&-&-&Il \itindex{mandatory~locking} 
2518                            \textit{mandatory locking} è abilitato.\\
2519    -&-&1&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2520    -&-&-&1&-&-&-&-&-&-&-&-&Permesso di lettura per il proprietario.\\
2521    -&-&-&-&1&-&-&-&-&-&-&-&Permesso di scrittura per il proprietario.\\
2522    -&-&-&-&-&1&-&-&-&-&-&-&Permesso di esecuzione per il proprietario.\\
2523    -&-&-&-&-&-&1&-&-&-&-&-&Permesso di lettura per il gruppo proprietario.\\
2524    -&-&-&-&-&-&-&1&-&-&-&-&Permesso di scrittura per il gruppo proprietario.\\
2525    -&-&-&-&-&-&-&-&1&-&-&-&Permesso di esecuzione per il gruppo proprietario.\\
2526    -&-&-&-&-&-&-&-&-&1&-&-&Permesso di lettura per tutti gli altri.\\
2527    -&-&-&-&-&-&-&-&-&-&1&-&Permesso di scrittura per tutti gli altri.\\
2528    -&-&-&-&-&-&-&-&-&-&-&1&Permesso di esecuzione per tutti gli altri.\\
2529     \hline
2530   \end{tabular}
2531   \caption{Tabella riassuntiva del significato dei bit dei permessi per un
2532     file.} 
2533   \label{tab:file_fileperm_bits}
2534 \end{table}
2535
2536 In tab.~\ref{tab:file_dirperm_bits} si sono invece riassunti gli effetti dei
2537 vari bit dei permessi per una directory; anche in questo caso si sono
2538 specificati i bit di \itindex{suid~bit} \textit{suid}, \itindex{sgid~bit}
2539 \textit{sgid} e \textit{sticky} \itindex{sticky~bit} con la notazione compatta
2540 illustrata in fig.~\ref{fig:file_perm_bit}.
2541
2542 \begin{table}[!htb]
2543   \centering
2544   \footnotesize
2545   \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
2546     \hline
2547     \multicolumn{3}{|c|}{special}&
2548     \multicolumn{3}{|c|}{user}&
2549     \multicolumn{3}{|c|}{group}&
2550     \multicolumn{3}{|c|}{other}&
2551     \multirow{2}{*}{\textbf{Operazioni possibili}} \\
2552     \cline{1-12}
2553     \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2554     \hline
2555     \hline
2556     1&-&-&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2557     -&1&-&-&-&-&-&-&-&-&-&-&Propaga il gruppo proprietario ai nuovi file 
2558                             creati.\\
2559     -&-&1&-&-&-&-&-&-&-&-&-&Limita l'accesso in scrittura dei file nella 
2560                             directory.\\
2561     -&-&-&1&-&-&-&-&-&-&-&-&Permesso di visualizzazione per il proprietario.\\
2562     -&-&-&-&1&-&-&-&-&-&-&-&Permesso di aggiornamento per il proprietario.\\
2563     -&-&-&-&-&1&-&-&-&-&-&-&Permesso di attraversamento per il proprietario.\\
2564     -&-&-&-&-&-&1&-&-&-&-&-&Permesso di visualizzazione per il gruppo 
2565                             proprietario.\\
2566     -&-&-&-&-&-&-&1&-&-&-&-&Permesso di aggiornamento per il gruppo 
2567                             proprietario.\\
2568     -&-&-&-&-&-&-&-&1&-&-&-&Permesso di attraversamento per il gruppo 
2569                             proprietario.\\
2570     -&-&-&-&-&-&-&-&-&1&-&-&Permesso di visualizzazione per tutti gli altri.\\
2571     -&-&-&-&-&-&-&-&-&-&1&-&Permesso di aggiornamento per tutti gli altri.\\
2572     -&-&-&-&-&-&-&-&-&-&-&1&Permesso di attraversamento per tutti gli altri.\\
2573     \hline
2574   \end{tabular}
2575   \caption{Tabella riassuntiva del significato dei bit dei permessi per una
2576     directory.} 
2577   \label{tab:file_dirperm_bits}
2578 \end{table}
2579
2580 Nelle tabelle si è indicato con il carattere ``-'' il fatto che il valore del
2581 bit in questione non è influente rispetto a quanto indicato nella riga della
2582 tabella; la descrizione dell'operazione fa riferimento soltanto alla
2583 combinazione di bit per i quali è stato riportato esplicitamente un valore.
2584 Si rammenti infine che il valore dei bit dei permessi non ha alcun effetto
2585 qualora il processo possieda i privilegi di amministratore.
2586
2587
2588
2589 \section{Caratteristiche e funzionalità avanzate}
2590 \label{sec:file_dir_advances}
2591
2592 Tratteremo qui alcune caratteristiche e funzionalità avanzate della gestione
2593 di file e directory, affrontando anche una serie di estensioni
2594 dell'interfaccia classica dei sistemi unix-like, principalmente utilizzate a
2595 scopi di sicurezza, che sono state introdotte nelle versioni più recenti di
2596 Linux.
2597
2598
2599 \subsection{Gli attributi estesi}
2600 \label{sec:file_xattr}
2601
2602 \itindbeg{Extended~Attributes}
2603
2604 Nelle sezioni precedenti abbiamo trattato in dettaglio le varie informazioni
2605 che il sistema mantiene negli \itindex{inode} \textit{inode}, e le varie
2606 funzioni che permettono di modificarle.  Si sarà notato come in realtà queste
2607 informazioni siano estremamente ridotte.  Questo è dovuto al fatto che Unix
2608 origina negli anni '70, quando le risorse di calcolo e di spazio disco erano
2609 minime. Con il venir meno di queste restrizioni è incominciata ad emergere
2610 l'esigenza di poter associare ai file delle ulteriori informazioni astratte
2611 (quelli che vengono chiamati i \textsl{meta-dati}) che però non potevano
2612 trovare spazio nei dati classici mantenuti negli \itindex{inode}
2613 \textit{inode}.
2614
2615 Per risolvere questo problema alcuni sistemi unix-like (e fra questi anche
2616 Linux) hanno introdotto un meccanismo generico che consenta di associare delle
2617 informazioni ai singoli file,\footnote{l'uso più comune è quello della ACL,
2618   che tratteremo nella prossima sezione, ma si possono inserire anche altre
2619   informazioni.}  detto \textit{Extended Attributes}. Gli \textsl{attributi
2620   estesi} non sono altro che delle coppie nome/valore che sono associate
2621 permanentemente ad un oggetto sul filesystem, analoghi di quello che sono le
2622 variabili di ambiente (vedi sez.~\ref{sec:proc_environ}) per un processo.
2623
2624 Altri sistemi (come Solaris, MacOS e Windows) hanno adottato un meccanismo
2625 diverso in cui ad un file sono associati diversi flussi di dati, su cui
2626 possono essere mantenute ulteriori informazioni, che possono essere accedute
2627 con le normali operazioni di lettura e scrittura. Questi non vanno confusi con
2628 gli \textit{Extended Attributes} (anche se su Solaris hanno lo stesso nome),
2629 che sono un meccanismo molto più semplice, che pur essendo limitato (potendo
2630 contenere solo una quantità limitata di informazione) hanno il grande
2631 vantaggio di essere molto più semplici da realizzare, più
2632 efficienti,\footnote{cosa molto importante, specie per le applicazioni che
2633   richiedono una gran numero di accessi, come le ACL.} e di garantire
2634 l'atomicità di tutte le operazioni.
2635
2636 In Linux gli attributi estesi sono sempre associati al singolo \itindex{inode}
2637 \textit{inode} e l'accesso viene sempre eseguito in forma atomica, in lettura
2638 il valore corrente viene scritto su un buffer in memoria, mentre la scrittura
2639 prevede che ogni valore precedente sia sovrascritto.
2640
2641 Si tenga presente che non tutti i filesystem supportano gli \textit{Extended
2642   Attributes}, in particolare al momento della scrittura di queste dispense
2643 essi sono presenti solo su \textsl{ext2}, \textsl{ext3} e \textsl{XFS}.
2644 Inoltre a seconda della implementazione ci possono essere dei limiti sulla
2645 quantità di attributi che si possono utilizzare.\footnote{ad esempio nel caso
2646   di \textsl{ext2} ed \textsl{ext3} è richiesto che essi siano contenuti
2647   all'interno di un singolo blocco (pertanto con dimensioni massime pari a
2648   1024, 2048 o 4096 byte a seconda delle dimensioni di quest'ultimo impostate
2649   in fase di creazione del filesystem), mentre con \textsl{XFS} non ci sono
2650   limiti ed i dati vengono memorizzati in maniera diversa (nell'\textit{inode}
2651   stesso, in un blocco a parte, o in una struttura ad albero dedicata) per
2652   mantenerne la scalabilità.} Infine lo spazio utilizzato per mantenere gli
2653 attributi estesi viene tenuto in conto per il calcolo delle quote di utente e
2654 gruppo proprietari del file.
2655
2656 Come meccanismo per mantenere informazioni aggiuntive associate al singolo
2657 file, gli \textit{Extended Attributes} possono avere usi anche molto diversi
2658 fra loro.  Per poterli distinguere allora sono stati suddivisi in
2659 \textsl{classi}, a cui poter applicare requisiti diversi per l'accesso e la
2660 gestione. Per questo motivo il nome di un attributo deve essere sempre
2661 specificato nella forma \texttt{namespace.attribute}, dove \texttt{namespace}
2662 fa riferimento alla classe a cui l'attributo appartiene, mentre
2663 \texttt{attribute} è il nome ad esso assegnato. In tale forma il nome di un
2664 attributo esteso deve essere univoco. Al momento\footnote{della scrittura di
2665   questa sezione, kernel 2.6.23, ottobre 2007.} sono state definite le quattro
2666 classi di attributi riportate in tab.~\ref{tab:extended_attribute_class}.
2667
2668 \begin{table}[htb]
2669   \centering
2670   \footnotesize
2671   \begin{tabular}{|c|p{10cm}|}
2672     \hline
2673     \textbf{Nome} & \textbf{Descrizione} \\
2674     \hline
2675     \hline
2676     \const{security}& Gli \textit{extended security attributes}: vengono
2677                       utilizzati dalle estensioni di sicurezza del kernel (i
2678                       \itindex{Linux~Security~Modules} \textit{Linux 
2679                         Security Modules}), per le realizzazione di meccanismi
2680                       evoluti di controllo di accesso come \index{SELinux}
2681                       SELinux.\\ 
2682     \const{system}  & Gli \textit{extended security attributes}: sono usati
2683                       dal kernel per memorizzare dati di sistema associati ai
2684                       file come le \itindex{Access~Control~List} ACL (vedi
2685                       sez.~\ref{sec:file_ACL}) o le \itindex{capabilities}
2686                       \textit{capabilities} (vedi
2687                       sez.~\ref{sec:proc_capabilities}).\\
2688     \const{trusted} & I \textit{trusted extended attributes}: vengono
2689                       utilizzati per poter realizzare in user space 
2690                       meccanismi che consentano di mantenere delle
2691                       informazioni sui file che non devono essere accessibili
2692                       ai processi ordinari.\\
2693     \const{user}    & Gli \textit{extended user attributes}: utilizzati per
2694                       mantenere informazioni aggiuntive sui file (come il
2695                       \textit{mime-type}, la codifica dei caratteri o del
2696                       file) accessibili dagli utenti.\\
2697     \hline
2698   \end{tabular}
2699   \caption{I nomi utilizzati valore di \texttt{namespace} per distinguere le
2700     varie classi di \textit{Extended Attributes}.}
2701   \label{tab:extended_attribute_class}
2702 \end{table}
2703
2704
2705 Dato che uno degli usi degli \textit{Extended Attributes} è quello che li
2706 impiega per realizzare delle estensioni (come le ACL, \index{SELinux} SELinux,
2707 ecc.) al tradizionale meccanismo dei controlli di accesso di Unix, l'accesso
2708 ai loro valori viene regolato in maniera diversa a seconda sia della loro
2709 classe sia di quali, fra le estensioni che li utilizzano, sono poste in uso.
2710 In particolare, per ciascuna delle classi riportate in
2711 tab.~\ref{tab:extended_attribute_class}, si hanno i seguenti casi:
2712 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
2713 \item[\texttt{security}] L'accesso agli \textit{extended security attributes}
2714   dipende dalle politiche di sicurezza stabilite da loro stessi tramite
2715   l'utilizzo di un sistema di controllo basato sui
2716   \itindex{Linux~Security~Modules} \textit{Linux Security Modules} (ad esempio
2717   \index{SELinux} SELinux). Pertanto l'accesso in lettura o scrittura dipende
2718   dalle politiche di sicurezza implementate all'interno dal modulo di
2719   sicurezza che si sta utilizzando al momento (ciascuno avrà le sue). Se non è
2720   stato caricato nessun modulo di sicurezza l'accesso in lettura sarà
2721   consentito a tutti i processi, mentre quello in scrittura solo ai processi
2722   con privilegi amministrativi dotati della \index{capabilities}
2723   \textit{capability} \const{CAP\_SYS\_ADMIN}.
2724
2725 \item[\texttt{system}] Anche l'accesso agli \textit{extended system
2726     attributes} dipende dalle politiche di accesso che il kernel realizza
2727   anche utilizzando gli stessi valori in essi contenuti. Ad esempio nel caso
2728   delle ACL l'accesso è consentito in lettura ai processi che hanno la
2729   capacità di eseguire una ricerca sul file (cioè hanno il permesso di lettura
2730   sulla directory che contiene il file) ed in scrittura al proprietario del
2731   file o ai processi dotati della \textit{capability} \index{capabilities}
2732   \const{CAP\_FOWNER}.\footnote{vale a dire una politica di accesso analoga a
2733     quella impiegata per gli ordinari permessi dei file.}
2734
2735 \item[\texttt{trusted}] L'accesso ai \textit{trusted extended attributes}, sia
2736   per la lettura che per la scrittura, è consentito soltanto ai processi con
2737   privilegi amministrativi dotati della \index{capabilities}
2738   \textit{capability} \const{CAP\_SYS\_ADMIN}. In questo modo si possono
2739   utilizzare questi attributi per realizzare in user space dei meccanismi di
2740   controllo che accedono ad informazioni non disponibili ai processi ordinari.
2741
2742 \item[\texttt{user}] L'accesso agli \textit{extended user attributes} è
2743   regolato dagli ordinari permessi dei file a cui essi fanno riferimento:
2744   occorre avere il permesso di lettura per leggerli e quello di scrittura per
2745   scriverli o modificarli. Dato l'uso di questi attributi, si è scelto cioè di
2746   applicare per il loro accesso gli stessi criteri che si usano per l'accesso
2747   al contenuto dei file (o delle directory) cui essi fanno riferimento.
2748
2749   Questa scelta vale però soltanto per i file e le directory ordinarie, se
2750   valesse in generale infatti si avrebbe un serio problema di sicurezza dato
2751   che esistono diversi oggetti sul filesystem per i quali è normale avere
2752   avere il permesso di scrittura consentito a tutti gli utenti, come i link
2753   simbolici, o alcuni file di dispositivo come \texttt{/dev/null}. Se fosse
2754   possibile usare su di essi gli \textit{extended user attributes} un utente
2755   qualunque potrebbe inserirvi dati a piacere.\footnote{la cosa è stata notata
2756     su XFS, dove questo comportamento permetteva, non essendovi limiti sullo
2757     spazio occupabile dagli \textit{Extended Attributes}, di bloccare il
2758     sistema riempiendo il disco.}
2759
2760   La semantica del controllo di accesso che abbiamo indicato inoltre non
2761   avrebbe alcun senso al di fuori di file e directory: i permessi di lettura e
2762   scrittura per un file di dispositivo attengono alle capacità di accesso al
2763   dispositivo sottostante,\footnote{motivo per cui si può formattare un disco
2764     anche se \texttt{/dev} è su un filesystem in sola lettura.} mentre per i
2765   link simbolici questi vengono semplicemente ignorati: in nessuno dei due
2766   casi hanno a che fare con il contenuto del file, e nella discussione
2767   relativa all'uso degli \textit{extended user attributes} nessuno è mai stato
2768   capace di indicare una qualche forma sensata di utilizzo degli stessi per
2769   link simbolici o file di dispositivo, e neanche per le fifo o i socket.
2770
2771   Per questo motivo gli \textit{extended user attributes} sono stati
2772   completamente disabilitati per tutto ciò che non sia un file regolare o una
2773   directory.\footnote{si può verificare la semantica adottata consultando il
2774     file \texttt{fs/xattr.c} dei sorgenti del kernel.} Inoltre per le
2775   directory è stata introdotta una ulteriore restrizione, dovuta di nuovo alla
2776   presenza ordinaria di permessi di scrittura completi su directory come
2777   \texttt{/tmp}.  Questo è un altro caso particolare, in cui il premesso di
2778   scrittura viene usato, unito alla presenza dello \itindex{sticky~bit}
2779   \textit{sticky bit}, per garantire il permesso di creazione di nuovi file.
2780   Per questo motivo, per evitare eventuali abusi, se una directory ha lo
2781   \itindex{sticky~bit} \textit{sticky bit} attivo sarà consentito scrivere i
2782   suoi \textit{extended user attributes} soltanto se si è proprietari della
2783   stessa, o si hanno i privilegi amministrativi della capability
2784   \index{capabilities} \const{CAP\_FOWNER}.
2785 \end{basedescript}
2786
2787 Le funzioni per la gestione degli attributi estesi, come altre funzioni di
2788 gestione avanzate specifiche di Linux, non fanno parte delle \acr{glibc}, e
2789 sono fornite da una apposita libreria, \texttt{libattr}, che deve essere
2790 installata a parte;\footnote{la versione corrente della libreria è
2791   \texttt{libattr1}, e nel caso si usi Debian la si può installare con il
2792   pacchetto omonimo ed il collegato \texttt{libattr1-dev}.}  pertanto se un
2793 programma le utilizza si dovrà indicare esplicitamente l'uso della suddetta
2794 libreria invocando il compilatore con l'opzione \texttt{-lattr}.
2795
2796 Per poter leggere gli attributi estesi sono disponibili tre diverse funzioni,
2797 \funcd{getxattr}, \funcd{lgetxattr} e \funcd{fgetxattr}, che consentono
2798 rispettivamente di richiedere gli attributi relativi a un file, a un link
2799 simbolico e ad un file descriptor; i rispettivi prototipi sono:
2800 \begin{functions}
2801   \headdecl{sys/types.h} 
2802   \headdecl{attr/xattr.h} 
2803   
2804   \funcdecl{ssize\_t getxattr(const char *path, const char *name, void
2805     *value, size\_t size)} 
2806
2807   \funcdecl{ssize\_t lgetxattr(const char *path, const char *name, void
2808     *value, size\_t size)} 
2809
2810   \funcdecl{ssize\_t fgetxattr(int filedes, const char *name, void *value,
2811     size\_t size)}
2812
2813   Le funzioni leggono il valore di un attributo esteso.
2814   
2815   \bodydesc{Le funzioni restituiscono un intero positivo che indica la
2816     dimensione dell'attributo richiesto in caso di successo, e $-1$ in caso di
2817     errore, nel qual caso \var{errno} assumerà i valori:
2818   \begin{errlist}
2819   \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
2820   \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
2821     non è sufficiente per contenere il risultato.
2822   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2823     filesystem o sono disabilitati.
2824   \end{errlist}
2825   Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
2826   ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
2827   all'attributo.  }
2828 \end{functions}
2829
2830 Le funzioni \func{getxattr} e \func{lgetxattr} prendono come primo argomento
2831 un pathname che indica il file di cui si vuole richiedere un attributo, la
2832 sola differenza è che la seconda, se il pathname indica un link simbolico,
2833 restituisce gli attributi di quest'ultimo e non quelli del file a cui esso fa
2834 riferimento. La funzione \func{fgetxattr} prende invece come primo argomento
2835 un numero di file descriptor, e richiede gli attributi del file ad esso
2836 associato.
2837
2838 Tutte e tre le funzioni richiedono di specificare nell'argomento \param{name}
2839 il nome dell'attributo di cui si vuole ottenere il valore. Il nome deve essere
2840 indicato comprensivo di prefisso del \textit{namespace} cui appartiene (uno
2841 dei valori di tab.~\ref{tab:extended_attribute_class}) nella forma
2842 \texttt{namespace.attributename}, come stringa terminata da un carattere NUL.
2843 Il suo valore verrà restituito nel buffer puntato dall'argomento \param{value}
2844 per una dimensione massima di \param{size} byte;\footnote{gli attributi estesi
2845   possono essere costituiti arbitrariamente da dati testuali o binari.}  se
2846 quest'ultima non è sufficiente si avrà un errore di \errcode{ERANGE}.
2847
2848 Per evitare di dover indovinare la dimensione di un attributo per tentativi si
2849 può eseguire una interrogazione utilizzando un valore nullo per \param{size};
2850 in questo caso non verrà letto nessun dato, ma verrà restituito come valore di
2851 ritorno della funzione chiamata la dimensione totale dell'attributo esteso
2852 richiesto, che si potrà usare come stima per allocare un buffer di dimensioni
2853 sufficienti.\footnote{si parla di stima perché anche se le funzioni
2854   restituiscono la dimensione esatta dell'attributo al momento in cui sono
2855   eseguite, questa potrebbe essere modificata in qualunque momento da un
2856   successivo accesso eseguito da un altro processo.}
2857
2858 Un secondo gruppo di funzioni è quello che consente di impostare il valore di
2859 un attributo esteso, queste sono \funcd{setxattr}, \funcd{lsetxattr} e
2860 \funcd{fsetxattr}, e consentono di operare rispettivamente su un file, su un
2861 link simbolico o specificando un file descriptor; i loro prototipi sono:
2862 \begin{functions}
2863   \headdecl{sys/types.h} 
2864   \headdecl{attr/xattr.h} 
2865   
2866   \funcdecl{int setxattr(const char *path, const char *name, const void
2867     *value, size\_t size, int flags)}
2868
2869   \funcdecl{int lsetxattr(const char *path, const char *name, const void
2870     *value, size\_t size, int flags)}
2871
2872   \funcdecl{int fsetxattr(int filedes, const char *name, const void *value,
2873     size\_t size, int flags)}
2874
2875   Impostano il valore di un attributo esteso.
2876   
2877   \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
2878     errore, nel qual caso \var{errno} assumerà i valori:
2879   \begin{errlist}
2880   \item[\errcode{ENOATTR}] si è usato il flag \const{XATTR\_REPLACE} e
2881     l'attributo richiesto non esiste.
2882   \item[\errcode{EEXIST}] si è usato il flag \const{XATTR\_CREATE} ma
2883     l'attributo esiste già.
2884   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2885     filesystem o sono disabilitati.
2886   \end{errlist}
2887   Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
2888   ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
2889   all'attributo.  
2890 }
2891 \end{functions}
2892
2893 Le tre funzioni prendono come primo argomento un valore adeguato al loro
2894 scopo, usato in maniera del tutto identica a quanto visto in precedenza per le
2895 analoghe che leggono gli attributi estesi. Il secondo argomento \param{name}
2896 deve indicare, anche in questo caso con gli stessi criteri appena visti per le
2897 analoghe \func{getxattr}, \func{lgetxattr} e \func{fgetxattr}, il nome
2898 (completo di suffisso) dell'attributo su cui si vuole operare. 
2899
2900 Il valore che verrà assegnato all'attributo dovrà essere preparato nel buffer
2901 puntato da \param{value}, e la sua dimensione totale (in byte) sarà indicata
2902 dall'argomento \param{size}. Infine l'argomento \param{flag} consente di
2903 controllare le modalità di sovrascrittura dell'attributo esteso, esso può
2904 prendere due valori: con \const{XATTR\_REPLACE} si richiede che l'attributo
2905 esista, nel qual caso verrà sovrascritto, altrimenti si avrà errore, mentre
2906 con \const{XATTR\_CREATE} si richiede che l'attributo non esista, nel qual
2907 caso verrà creato, altrimenti si avrà errore ed il valore attuale non sarà
2908 modificato.  Utilizzando per \param{flag} un valore nullo l'attributo verrà
2909 modificato se è già presente, o creato se non c'è.
2910
2911 Le funzioni finora illustrate permettono di leggere o scrivere gli attributi
2912 estesi, ma sarebbe altrettanto utile poter vedere quali sono gli attributi
2913 presenti; a questo provvedono le funzioni \funcd{listxattr},
2914 \funcd{llistxattr} e \funcd{flistxattr} i cui prototipi sono:
2915 \begin{functions}
2916   \headdecl{sys/types.h} 
2917   \headdecl{attr/xattr.h} 
2918   
2919   \funcdecl{ssize\_t listxattr(const char *path, char *list, size\_t size)}
2920
2921   \funcdecl{ssize\_t llistxattr(const char *path, char *list, size\_t size)}
2922
2923   \funcdecl{ssize\_t flistxattr(int filedes, char *list, size\_t size)}
2924
2925   Leggono la lista degli attributi estesi di un file.
2926   
2927   \bodydesc{Le funzioni restituiscono un intero positivo che indica la
2928     dimensione della lista in caso di successo, e $-1$ in caso di errore, nel
2929     qual caso \var{errno} assumerà i valori:
2930   \begin{errlist}
2931   \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
2932     non è sufficiente per contenere il risultato.
2933   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2934     filesystem o sono disabilitati.
2935   \end{errlist}
2936   Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
2937   ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
2938   all'attributo.  
2939 }
2940 \end{functions}
2941
2942 Come per le precedenti le tre funzioni leggono gli attributi rispettivamente
2943 di un file, un link simbolico o specificando un file descriptor, da
2944 specificare con il loro primo argomento. Gli altri due argomenti, identici per
2945 tutte e tre, indicano rispettivamente il puntatore \param{list} al buffer dove
2946 deve essere letta la lista e la dimensione \param{size} di quest'ultimo.
2947
2948 La lista viene fornita come sequenza non ordinata dei nomi dei singoli
2949 attributi estesi (sempre comprensivi del prefisso della loro classe) ciascuno
2950 dei quali è terminato da un carattere nullo. I nomi sono inseriti nel buffer
2951 uno di seguito all'altro. Il valore di ritorno della funzione indica la
2952 dimensione totale della lista in byte.
2953
2954 Come per le funzioni di lettura dei singoli attributi se le dimensioni del
2955 buffer non sono sufficienti si avrà un errore, ma è possibile ottenere dal
2956 valore di ritorno della funzione una stima della dimensione totale della lista
2957 usando per \param{size} un valore nullo. 
2958
2959 Infine per rimuovere semplicemente un attributo esteso, si ha a disposizione
2960 un ultimo gruppo di funzioni: \funcd{removexattr}, \funcd{lremovexattr} e
2961 \funcd{fremovexattr}; i rispettivi prototipi sono:
2962 \begin{functions}
2963   \headdecl{sys/types.h} 
2964   \headdecl{attr/xattr.h} 
2965   
2966   \funcdecl{int removexattr(const char *path, const char *name)}
2967
2968   \funcdecl{int lremovexattr(const char *path, const char *name)}
2969
2970   \funcdecl{int fremovexattr(int filedes, const char *name)}
2971
2972
2973   Rimuovono un attributo esteso di un file.
2974   
2975   \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
2976     errore, nel qual caso \var{errno} assumerà i valori:
2977   \begin{errlist}
2978   \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
2979   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2980     filesystem o sono disabilitati.
2981   \end{errlist}
2982   ed inoltre tutti gli errori di \func{stat}.  
2983 }
2984 \end{functions}
2985
2986 Le tre funzioni rimuovono l'attributo esteso indicato dall'argomento
2987 \param{name} rispettivamente di un file, un link simbolico o specificando un
2988 file descriptor, da specificare con il loro primo argomento.  Anche in questo
2989 caso l'argomento \param{name} deve essere specificato con le modalità già
2990 illustrate in precedenza per le altre funzioni relative agli attributi estesi.
2991
2992
2993 \itindend{Extended~Attributes}
2994
2995 % TODO trattare gli attributi estesi e le funzioni la documentazione di
2996 % sistema è nei pacchetti libxattr1-dev e attr
2997
2998
2999 \subsection{Le \textit{Access  Control List}}
3000 \label{sec:file_ACL}
3001
3002
3003 \itindbeg{Access~Control~List}
3004
3005 Il modello classico dei permessi di Unix, per quanto funzionale ed efficiente,
3006 è comunque piuttosto limitato e per quanto possa aver coperto per lunghi anni
3007 le esigenze più comuni con un meccanismo semplice e potente, non è in grado di
3008 rispondere in maniera adeguata a situazioni che richiedono una gestione
3009 complessa dei permessi di accesso.\footnote{già un requisito come quello di
3010   dare accesso in scrittura ad alcune persone ed in sola lettura ad altre non
3011   si può soddisfare in maniera semplice.}
3012
3013 Per questo motivo erano state progressivamente introdotte nelle varie versioni
3014 di Unix dei meccanismi di gestione dei permessi dei file più flessibili, nella
3015 forma delle cosiddette \textit{Access Control List} (indicate usualmente con
3016 la sigla ACL).  Nello sforzo di standardizzare queste funzionalità era stato
3017 creato un gruppo di lavoro il cui scopo era estendere lo standard POSIX 1003
3018 attraverso due nuovi insiemi di specifiche, la POSIX 1003.1e per l'interfaccia
3019 di programmazione e la POSIX 1003.2c per i comandi di shell.
3020
3021 Gli obiettivi erano però forse troppo ambizioni, e nel gennaio del 1998 i
3022 finanziamenti vennero ritirati senza che si fosse arrivati alla definizione di
3023 uno standard, dato però che una parte della documentazione prodotta era di
3024 alta qualità venne deciso di rilasciare al pubblico la diciassettesima bozza
3025 del documento, quella che va sotto il nome di \textit{POSIX 1003.1e Draft 17},
3026 che è divenuta la base sulla quale si definiscono le cosiddette \textit{Posix
3027   ACL}.
3028
3029 A differenza di altri sistemi (ad esempio FreeBSD) nel caso di Linux si è
3030 scelto di realizzare le ACL attraverso l'uso degli
3031 \itindex{Extended~Attributes} \textit{Extended Attributes} (appena trattati in
3032 sez.~\ref{sec:file_xattr}), e fornire tutte le relative funzioni di gestione
3033 tramite una libreria, \texttt{libacl} che nasconde i dettagli implementativi
3034 delle ACL e presenta ai programmi una interfaccia che fa riferimento allo
3035 standard POSIX 1003.1e.
3036
3037 Anche in questo caso le funzioni di questa libreria non fanno parte delle
3038 \acr{glibc} e devono essere installate a parte;\footnote{la versione corrente
3039   della libreria è \texttt{libacl1}, e nel caso si usi Debian la si può
3040   installare con il pacchetto omonimo e con il collegato \texttt{libacl1-dev}
3041   per i file di sviluppo.}  pertanto se un programma le utilizza si dovrà
3042 indicare esplicitamente l'uso della libreria \texttt{libacl} invocando il
3043 compilatore con l'opzione \texttt{-lacl}. Si tenga presente inoltre che per
3044 poterle utilizzare le ACL devono essere attivate esplicitamente montando il
3045 filesystem\footnote{che deve supportarle, ma questo è ormai vero per
3046   praticamente tutti i filesystem più comuni, con l'eccezione di NFS per il
3047   quale esiste però un supporto sperimentale.} su cui le si vogliono
3048 utilizzare con l'opzione \texttt{acl} attiva. Dato che si tratta di una
3049 estensione è infatti opportuno utilizzarle soltanto laddove siano necessarie.
3050
3051 Una ACL è composta da un insieme di voci, e ciascuna voce è a sua volta
3052 costituita da un \textsl{tipo}, da un eventuale
3053 \textsl{qualificatore},\footnote{deve essere presente soltanto per le voci di
3054   tipo \const{ACL\_USER} e \const{ACL\_GROUP}.} e da un insieme di permessi.
3055 Ad ogni oggetto sul filesystem si può associare una ACL che ne governa i
3056 permessi di accesso, detta \textit{access ACL}.  Inoltre per le directory si
3057 può impostare una ACL aggiuntiva, detta \textit{default ACL}, che serve ad
3058 indicare quale dovrà essere la ACL assegnata di default nella creazione di un
3059 file all'interno della directory stessa. Come avviene per i permessi le ACL
3060 possono essere impostate solo del proprietario del file, o da un processo con
3061 la capability \index{capabilities} \const{CAP\_FOWNER}.
3062
3063 \begin{table}[htb]
3064   \centering
3065   \footnotesize
3066   \begin{tabular}{|l|p{8cm}|}
3067     \hline
3068     \textbf{Tipo} & \textbf{Descrizione} \\
3069     \hline
3070     \hline
3071     \const{ACL\_USER\_OBJ} & voce che contiene i diritti di accesso del
3072                              proprietario del file.\\
3073     \const{ACL\_USER}      & voce che contiene i diritti di accesso per
3074                              l'utente indicato dal rispettivo
3075                              qualificatore.\\  
3076     \const{ACL\_GROUP\_OBJ}& voce che contiene i diritti di accesso del
3077                              gruppo proprietario del file.\\
3078     \const{ACL\_GROUP}     & voce che contiene i diritti di accesso per
3079                              il gruppo indicato dal rispettivo
3080                              qualificatore.\\
3081     \const{ACL\_MASK}      & voce che contiene la maschera dei massimi
3082                              permessi di accesso che possono essere garantiti
3083                              da voci del tipo \const{ACL\_USER},
3084                              \const{ACL\_GROUP} e \const{ACL\_GROUP\_OBJ}.\\
3085     \const{ACL\_OTHER}     & voce che contiene i diritti di accesso di chi
3086                              non corrisponde a nessuna altra voce dell'ACL.\\
3087     \hline
3088   \end{tabular}
3089   \caption{Le costanti che identificano i tipi delle voci di una ACL.}
3090   \label{tab:acl_tag_types}
3091 \end{table}
3092
3093 L'elenco dei vari tipi di voci presenti in una ACL, con una breve descrizione
3094 del relativo significato, è riportato in tab.~\ref{tab:acl_tag_types}. Tre di
3095 questi tipi, \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e
3096 \const{ACL\_OTHER}, corrispondono direttamente ai tre permessi ordinari dei
3097 file (proprietario, gruppo proprietario e tutti gli altri) e per questo una
3098 ACL valida deve sempre contenere una ed una sola voce per ciascuno di questi
3099 tipi.
3100
3101 Una ACL può poi contenere un numero arbitrario di voci di tipo
3102 \const{ACL\_USER} e \const{ACL\_GROUP}, ciascuna delle quali indicherà i
3103 permessi assegnati all'utente e al gruppo indicato dal relativo qualificatore;
3104 ovviamente ciascuna di queste voci dovrà fare riferimento ad un utente o ad un
3105 gruppo diverso, e non corrispondenti a quelli proprietari del file. Inoltre se
3106 in una ACL esiste una voce di uno di questi due tipi è obbligatoria anche la
3107 presenza di una ed una sola voce di tipo \const{ACL\_MASK}, che negli altri
3108 casi è opzionale.
3109
3110 Quest'ultimo tipo di voce contiene la maschera dei permessi che possono essere
3111 assegnati tramite voci di tipo \const{ACL\_USER}, \const{ACL\_GROUP} e
3112 \const{ACL\_GROUP\_OBJ}; se in una di queste voci si fosse specificato un
3113 permesso non presente in \const{ACL\_MASK} questo verrebbe ignorato. L'uso di
3114 una ACL di tipo \const{ACL\_MASK} è di particolare utilità quando essa
3115 associata ad una \textit{default ACL} su una directory, in quanto i permessi
3116 così specificati verranno ereditati da tutti i file creati nella stessa
3117 directory. Si ottiene così una sorta di \itindex{umask} \textit{umask}
3118 associata ad un oggetto sul filesystem piuttosto che a un processo.
3119
3120 Dato che le ACL vengono a costituire una estensione dei permessi ordinari, uno
3121 dei problemi che si erano posti nella loro standardizzazione era appunto
3122 quello della corrispondenza fra questi e le ACL. Come accennato i permessi
3123 ordinari vengono mappati le tre voci di tipo \const{ACL\_USER\_OBJ},
3124 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} che devono essere presenti in
3125 qualunque ACL; un cambiamento ad una di queste voci viene automaticamente
3126 riflesso sui permessi ordinari dei file\footnote{per permessi ordinari si
3127   intende quelli mantenuti nell'\textit{inode}, che devono restare dato che un
3128   filesystem può essere montato senza abilitare le ACL.} e viceversa. In
3129 realtà la mappatura è diretta solo per le voci \const{ACL\_USER\_OBJ} e
3130 \const{ACL\_OTHER}, nel caso di \const{ACL\_GROUP\_OBJ} questo vale soltanto
3131 se non è presente una voce di tipo \const{ACL\_MASK}, se invece questa è
3132 presente verranno tolti dai permessi di \const{ACL\_GROUP\_OBJ} tutti quelli
3133 non presenti in \const{ACL\_MASK}.\footnote{questo diverso comportamento a
3134   seconda delle condizioni è stato introdotto dalla standardizzazione
3135   \textit{POSIX 1003.1e Draft 17} per mantenere il comportamento invariato sui
3136   sistemi dotati di ACL per tutte quelle applicazioni che sono conformi
3137   soltanto all'ordinario standard \textit{POSIX 1003.1}.}
3138
3139 Un secondo aspetto dell'incidenza delle ACL sul comportamento del sistema è
3140 quello relativo alla creazione di nuovi file,\footnote{o oggetti sul
3141   filesystem, il comportamento discusso vale per le funzioni \func{open} e
3142   \func{creat} (vedi sez.~\ref{sec:file_open}), \func{mkdir} (vedi
3143   sez.~\ref{sec:file_dir_creat_rem}), \func{mknod} e \func{mkfifo} (vedi
3144   sez.~\ref{sec:file_mknod}).} che come accennato può essere modificato dalla
3145 presenza di una \textit{default ACL} sulla directory che contiene quel file.
3146 Se questa non c'è valgono le regole usuali illustrate in
3147 sez.~\ref{sec:file_perm_management}, per cui essi sono determinati dalla
3148 \itindex{umask} \textit{umask} del processo, e la sola differenza è che i
3149 permessi ordinari da esse risultanti vengono automaticamente rimappati anche
3150 su una ACL di accesso assegnata automaticamente al nuovo file, che contiene
3151 soltanto le tre corrispondenti voci di tipo \const{ACL\_USER\_OBJ},
3152 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER}.
3153
3154 Se invece è presente una ACL di default sulla directory che contiene il nuovo
3155 file questa diventerà automaticamente la sua ACL di accesso, a meno di non
3156 aver indicato, nelle funzioni di creazione che lo consentono, uno specifico
3157 valore per i permessi ordinari;\footnote{tutte le funzioni citate in
3158   precedenza supportano un argomento \var{mode} che indichi un insieme di
3159   permessi iniziale.} in tal caso saranno eliminati dalle voci corrispondenti
3160 nella ACL tutti quelli non presenti in tale indicazione.
3161
3162 Dato che questa è la ragione che ha portato alla loro creazione, la principale
3163 modifica introdotta con la presenza della ACL è quella alle regole del
3164 controllo di accesso ai file illustrate in sez.~\ref{sec:file_perm_overview}.
3165 Come nel caso ordinario per il controllo vengono sempre utilizzati gli
3166 identificatori del gruppo \textit{effective} del processo, ma in presenza di
3167 ACL i passi attraverso i quali viene stabilito se esso ha diritto di accesso
3168 sono i seguenti:
3169 \begin{enumerate*}
3170 \item Se l'user-ID del processo è nullo l'accesso è sempre garantito senza
3171   nessun controllo.
3172 \item Se l'user-ID del processo corrisponde al proprietario del file allora:
3173   \begin{itemize*}
3174   \item se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
3175     l'accesso è consentito;
3176   \item altrimenti l'accesso è negato.
3177   \end{itemize*}
3178 \item Se l'user-ID del processo corrisponde ad un qualunque qualificatore
3179   presente in una voce \const{ACL\_USER} allora:
3180   \begin{itemize*}
3181   \item se la voce \const{ACL\_USER} corrispondente e la voce
3182     \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
3183     consentito;
3184   \item altrimenti l'accesso è negato.
3185   \end{itemize*}
3186 \item Se è il group-ID del processo o uno dei group-ID supplementari
3187   corrisponde al gruppo proprietario del file allora: 
3188   \begin{itemize*}
3189   \item se la voce \const{ACL\_GROUP\_OBJ} e una eventuale voce
3190     \const{ACL\_MASK} (se non vi sono voci di tipo \const{ACL\_GROUP} questa
3191     può non essere presente) contengono entrambe il permesso richiesto,
3192     l'accesso è consentito;
3193   \item altrimenti l'accesso è negato.
3194   \end{itemize*}
3195 \item Se è il group-ID del processo o uno dei group-ID supplementari
3196   corrisponde ad un qualunque qualificatore presente in una voce
3197   \const{ACL\_GROUP} allora:
3198   \begin{itemize*}
3199   \item se la voce \const{ACL\_GROUP} corrispondente e la voce
3200     \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
3201     consentito;
3202   \item altrimenti l'accesso è negato.
3203   \end{itemize*}
3204 \item Se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
3205   l'accesso è consentito, altrimenti l'accesso è negato.
3206 \end{enumerate*}
3207
3208 I passi di controllo vengono eseguiti esattamente in questa sequenza, e la
3209 decisione viene presa non appena viene trovata una corrispondenza con gli
3210 identificatori del processo. Questo significa che i permessi presenti in una
3211 voce di tipo \const{ACL\_USER} hanno la precedenza sui permessi ordinari
3212 associati al gruppo proprietario del file (vale a dire su
3213 \const{ACL\_GROUP\_OBJ}).
3214
3215 Per la gestione delle ACL lo standard \textit{POSIX 1003.1e Draft 17} ha
3216 previsto delle apposite funzioni ed tutta una serie di tipi di dati
3217 dedicati;\footnote{fino a definire un tipo di dato e delle costanti apposite
3218   per identificare i permessi standard di lettura, scrittura ed esecuzione.}
3219 tutte le operazioni devono essere effettuate attraverso tramite questi tipi di
3220 dati, che incapsulano tutte le informazioni contenute nelle ACL. La prima di
3221 queste funzioni che prendiamo in esame è \funcd{acl\_init}, il cui prototipo
3222 è:
3223 \begin{functions}
3224   \headdecl{sys/types.h} 
3225   \headdecl{sys/acl.h}
3226   
3227   \funcdecl{acl\_t acl\_init(int count)}
3228
3229   Inizializza un'area di lavoro per una ACL di \param{count} voci.
3230   
3231   \bodydesc{La funzione restituisce un puntatore all'area di lavoro in caso di
3232     successo e \const{NULL} in caso di errore, nel qual caso \var{errno}
3233     assumerà uno dei valori:
3234   \begin{errlist}
3235   \item[\errcode{EINVAL}] il valore di \param{count} è negativo.
3236   \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile.
3237   \end{errlist}
3238 }
3239 \end{functions}
3240
3241 La funzione alloca ed inizializza un'area di memoria che verrà usata per
3242 mantenere i dati di una ACL contenente fino ad un massimo di \const{count}
3243 voci. La funzione ritorna un valore di tipo \type{acl\_t}, da usare in tutte
3244 le altre funzioni che operano sulla ACL. La funzione si limita alla
3245 allocazione iniziale e non inserisce nessun valore nella ACL che resta vuota.
3246 Si tenga presente che pur essendo \type{acl\_t} un tipo opaco che identifica
3247 ``\textsl{l'oggetto}'' ACL, il valore restituito dalla funzione non è altro
3248 che un puntatore all'area di memoria allocata per i dati richiesti; pertanto
3249 in caso di fallimento verrà restituito un puntatore nullo e si dovrà
3250 confrontare il valore di ritorno della funzione con ``\code{(acl\_t) NULL}''.
3251
3252 Una volta che si siano completate le operazioni sui dati di una ACL la memoria
3253 allocata dovrà essere liberata esplicitamente attraverso una chiamata alla
3254 funzione \funcd{acl\_free}, il cui prototipo è:
3255 \begin{functions}
3256   \headdecl{sys/types.h} 
3257   \headdecl{sys/acl.h}
3258   
3259   \funcdecl{int acl\_free(void * obj\_p)}
3260
3261   Disalloca la memoria riservata per i dati di una ACL.
3262   
3263   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ se
3264     \param{obj\_p} non è un puntatore valido, nel qual caso \var{errno}
3265     assumerà il valore \errcode{EINVAL} 
3266 }
3267 \end{functions}
3268
3269 Si noti come la funzione richieda come argomento un puntatore di tipo
3270 ``\ctyp{void *}'', essa infatti può essere usata non solo per liberare la
3271 memoria allocata per i dati di una ACL, ma anche per quella usata per creare
3272 le stringhe di descrizione testuale delle ACL o per ottenere i valori dei
3273 qualificatori di una voce; pertanto a seconda dei casi occorrerà eseguire un
3274 \textit{cast} a ``\ctyp{void *}'' del tipo di dato di cui si vuole eseguire la
3275 disallocazione.  Si tenga presente poi che oltre a \func{acl\_init} esistono
3276 molte altre funzioni che possono allocare memoria per i dati delle ACL, è
3277 pertanto opportuno tenere traccia di tutte queste funzioni perché alla fine
3278 delle operazioni tutta la memoria allocata dovrà essere liberata con
3279 \func{acl\_free}.
3280
3281 Una volta che si abbiano a disposizione i dati di una ACL tramite il
3282 riferimento ad oggetto di tipo \type{acl\_t} questi potranno essere copiati
3283 con la funzione \funcd{acl\_dup}, il cui prototipo è:
3284 \begin{functions}
3285   \headdecl{sys/types.h} 
3286   \headdecl{sys/acl.h}
3287   
3288   \funcdecl{acl\_t acl\_dup(acl\_t acl)}
3289
3290   Crea una copia della ACL \param{acl}.
3291   
3292   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3293     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3294     \var{errno} assumerà uno dei valori:
3295   \begin{errlist}
3296   \item[\errcode{EINVAL}] l'argomento \param{acl} non è un puntatore valido
3297     per una ACL.
3298   \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile per eseguire
3299     la copia.
3300   \end{errlist}
3301 }
3302 \end{functions}
3303
3304 La funzione crea una copia dei dati della ACL indicata tramite l'argomento
3305 \param{acl}, allocando autonomamente tutto spazio necessario alla copia e
3306 restituendo un secondo oggetto di tipo \type{acl\_t} come riferimento a
3307 quest'ultima.  Valgono per questo le stesse considerazioni fatte per il valore
3308 di ritorno di \func{acl\_init}, ed in particolare il fatto che occorrerà
3309 prevedere una ulteriore chiamata esplicita a \func{acl\_free} per liberare la
3310 memoria occupata dalla copia.
3311
3312 Se si deve creare una ACL manualmente l'uso di \func{acl\_init} è scomodo,
3313 dato che la funzione restituisce una ACL vuota, una alternativa allora è usare
3314 \funcd{acl\_from\_mode} che consente di creare una ACL a partire da un valore
3315 di permessi ordinari, il prototipo della funzione è:
3316 \begin{functions}
3317   \headdecl{sys/types.h} 
3318   \headdecl{sys/acl.h}
3319   
3320   \funcdecl{acl\_t acl\_from\_mode(mode\_t mode)}
3321
3322   Crea una ACL inizializzata con i permessi di \param{mode}.
3323   
3324   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3325     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3326     \var{errno} assumerà il valore \errval{ENOMEM}.
3327
3328 }
3329 \end{functions}
3330
3331 La funzione restituisce una ACL inizializzata con le tre voci obbligatorie
3332 \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} già
3333 impostate secondo la corrispondenza ai valori dei permessi ordinari indicati
3334 dalla maschera passata nell'argomento \param{mode}. Questa funzione è una
3335 estensione usata dalle ACL di Linux e non è portabile, ma consente di
3336 semplificare l'inizializzazione in maniera molto comoda. 
3337
3338 Altre due funzioni che consentono di creare una ACL già inizializzata sono
3339 \funcd{acl\_get\_fd} e \funcd{acl\_get\_file}, che però sono per lo più
3340 utilizzate per leggere la ACL corrente di un file; i rispettivi prototipi
3341 sono:
3342 \begin{functions}
3343   \headdecl{sys/types.h} 
3344   \headdecl{sys/acl.h}
3345   
3346   \funcdecl{acl\_t acl\_get\_file(const char *path\_p, acl\_type\_t type)}
3347   \funcdecl{acl\_t acl\_get\_fd(int fd)}
3348
3349   Ottiene i dati delle ACL di un file.
3350   
3351   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3352     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3353     \var{errno} assumerà uno dei valori:
3354   \begin{errlist}
3355   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3356   \item[\errcode{ENOTSUP}] il filesystem cui fa riferimento il file non
3357     supporta le ACL.
3358   \end{errlist}
3359   ed inoltre \errval{EBADF} per \func{acl\_get\_fd}, ed \errval{EINVAL} per
3360   valori scorretti di \param{type} e tutti i possibili errori per l'accesso ad
3361   un file per \func{acl\_get\_file}.
3362
3363 }
3364 \end{functions}
3365
3366 Le due funzioni ritornano, con un oggetto di tipo \type{acl\_t}, il valore
3367 della ACL correntemente associata ad un file, che può essere identificato
3368 tramite un file descriptor usando \func{acl\_get\_fd} o con un pathname usando
3369 \func{acl\_get\_file}. Nel caso di quest'ultima funzione, che può richiedere
3370 anche la ACL relativa ad una directory, il secondo argomento \param{type}
3371 consente di specificare se si vuole ottenere la ACL di default o quella di
3372 accesso. Questo argomento deve essere di tipo \type{acl\_type\_t} e può
3373 assumere solo i due valori riportati in tab.~\ref{tab:acl_type}.
3374
3375 \begin{table}[htb]
3376   \centering
3377   \footnotesize
3378   \begin{tabular}{|l|l|}
3379     \hline
3380     \textbf{Tipo} & \textbf{Descrizione} \\
3381     \hline
3382     \hline
3383     \const{ACL\_TYPE\_ACCESS} & indica una ACL di accesso.\\
3384     \const{ACL\_TYPE\_DEFAULT}& indica una ACL di default.\\  
3385     \hline
3386   \end{tabular}
3387   \caption{Le costanti che identificano il tipo di ACL.}
3388   \label{tab:acl_type}
3389 \end{table}
3390
3391 Si tenga presente che nel caso di \func{acl\_get\_file} occorrerà che il
3392 processo chiamante abbia privilegi di accesso sufficienti a poter leggere gli
3393 attributi estesi dei file (come illustrati in sez.~\ref{sec:file_xattr});
3394 inoltre una ACL di tipo \const{ACL\_TYPE\_DEFAULT} potrà essere richiesta
3395 soltanto per una directory, e verrà restituita solo se presente, altrimenti
3396 verrà restituita una ACL vuota.
3397
3398 Infine si potrà creare una ACL direttamente dalla sua rappresentazione
3399 testuale con la funzione  \funcd{acl\_from\_text}, il cui prototipo è:
3400 \begin{functions}
3401   \headdecl{sys/types.h} 
3402   \headdecl{sys/acl.h}
3403   
3404   \funcdecl{acl\_t acl\_from\_text(const char *buf\_p)}
3405
3406   Crea una ACL a partire dalla sua rappresentazione testuale.
3407   
3408   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3409     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3410     \var{errno} assumerà uno dei valori:
3411   \begin{errlist}
3412   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3413   \item[\errcode{EINVAL}] la rappresentazione testuale all'indirizzo
3414     \param{buf\_p} non è valida.
3415   \end{errlist}
3416
3417 }
3418 \end{functions}
3419
3420 La funzione prende come argomento il puntatore ad un buffer dove si è inserita
3421 la rappresentazione testuale della ACL che si vuole creare, la memoria
3422 necessaria viene automaticamente allocata ed in caso di successo viene
3423 restituito come valore di ritorno un oggetto di tipo \type{acl\_t} con il
3424 contenuto della stessa, che come per le precedenti funzioni, dovrà essere
3425 disallocato esplicitamente al termine del suo utilizzo.
3426
3427 La rappresentazione testuale di una ACL è quella usata anche dai comandi
3428 ordinari per la gestione delle ACL (\texttt{getfacl} e \texttt{setfacl}), che
3429 prevede due diverse forme, estesa e breve, entrambe supportate da
3430 \func{acl\_from\_text}. La forma estesa prevede che sia specificata una voce
3431 per riga, nella forma:
3432 \begin{Verbatim}
3433   tipo:qualificatore:permessi
3434 \end{Verbatim}
3435 dove il tipo può essere uno fra \texttt{user}, \texttt{group}, \texttt{other}
3436 e \texttt{mask}. Il qualificatore è presente solo per \texttt{user} e
3437 \texttt{group} e indica l'utente o il gruppo a cui la voce si riferisce; i
3438 permessi sono espressi con una tripletta di lettere analoga a quella usata per
3439 i permessi dei file.\footnote{vale a dire \texttt{r} per il permesso di
3440   lettura, \texttt{w} per il permesso di scrittura, \texttt{x} per il permesso
3441   di esecuzione (scritti in quest'ordine) e \texttt{-} per l'assenza del
3442   permesso.}
3443
3444 Va precisato che i due tipi \texttt{user} e \texttt{group} sono usati
3445 rispettivamente per indicare delle voci relative ad utenti e
3446 gruppi,\footnote{cioè per voci di tipo \const{ACL\_USER\_OBJ} e
3447   \const{ACL\_USER} per \texttt{user} e \const{ACL\_GROUP\_OBJ} e
3448   \const{ACL\_GROUP} per \texttt{group}.} applicate sia a quelli proprietari
3449 del file che a quelli generici; quelle dei proprietari si riconoscono per
3450 l'assenza di un qualificatore, ed in genere si scrivono per prima delle altre.
3451 Il significato delle voci di tipo \texttt{mask} e \texttt{mark} è evidente. In
3452 questa forma si possono anche inserire dei commenti precedendoli con il
3453 carattere ``\texttt{\#}''.
3454
3455 La forma breve prevede invece la scrittura delle singole voci su una riga,
3456 separate da virgole; come specificatori del tipo di voce si possono usare le
3457 iniziali dei valori usati nella forma estesa (cioè ``\texttt{u}'',
3458 ``\texttt{g}'', ``\texttt{o}'' e ``\texttt{m}''), mentre le altri parte della
3459 voce sono le stesse. In questo caso non sono consentiti permessi.
3460
3461 Per la conversione inversa, che consente di ottenere la rappresentazione
3462 testuale di una ACL, sono invece disponibili due funzioni, la prima delle due,
3463 di uso più immediato, è \funcd{acl\_to\_text}, il cui prototipo è:
3464 \begin{functions}
3465   \headdecl{sys/types.h} 
3466   \headdecl{sys/acl.h}
3467   
3468   \funcdecl{char * acl\_to\_text(acl\_t acl, ssize\_t *len\_p)}
3469
3470   Produce la rappresentazione testuale di una ACL.
3471   
3472   \bodydesc{La funzione restituisce il puntatore ad una stringa con la
3473     rappresentazione testuale della ACL in caso di successo e
3474     \code(acl\_t){NULL} in caso di errore, nel qual caso \var{errno} assumerà
3475     uno dei valori:
3476   \begin{errlist}
3477   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3478   \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
3479   \end{errlist}
3480
3481 }
3482 \end{functions}
3483
3484 La funzione restituisce il puntatore ad una stringa terminata da NUL
3485 contenente la rappresentazione in forma estesa della ACL passata come
3486 argomento, ed alloca automaticamente la memoria necessaria. Questa dovrà poi
3487 essere liberata, quando non più necessaria, con \func{acl\_free}. Se
3488 nell'argomento \param{len\_p} si passa un valore puntatore ad una variabile
3489 intera in questa verrà restituita la dimensione della stringa con la
3490 rappresentazione testuale (non comprendente il carattere nullo finale). 
3491
3492 La seconda funzione, \funcd{acl\_to\_any\_text}, permette di controllare con
3493 dovizia di dettagli la generazione della stringa contenente la
3494 rappresentazione testuale della ACL, il suo prototipo è:
3495 \begin{functions}
3496   \headdecl{sys/types.h} 
3497   \headdecl{sys/acl.h}
3498   
3499   \funcdecl{char * acl\_to\_any\_text(acl\_t acl, const char *prefix, char
3500     separator, int options)}
3501
3502   Produce la rappresentazione testuale di una ACL.
3503
3504   \bodydesc{La funzione restituisce il puntatore ad una stringa con la
3505     rappresentazione testuale della ACL in caso di successo e \code{NULL} in
3506     caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
3507   \begin{errlist}
3508   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3509   \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
3510   \end{errlist}
3511
3512 }
3513 \end{functions}
3514
3515 La funzione converte in formato testo la ACL indicata dall'argomento
3516 \param{acl}, usando il carattere \param{separator} come separatore delle
3517 singole voci; se l'argomento \param{prefix} non è nullo la stringa da esso
3518 indicata viene utilizzata come prefisso per le singole voci. 
3519
3520 L'ultimo argomento, \param{options}, consente di controllare la modalità con
3521 cui viene generata la rappresentazione testuale. Un valore nullo fa si che
3522 vengano usati gli identificatori standard \texttt{user}, \texttt{group},
3523 \texttt{other} e \texttt{mask} con i nomi di utenti e gruppi risolti rispetto
3524 ai loro valori numerici. Altrimenti si può specificare un valore in forma di
3525 maschera binaria, da ottenere con un OR aritmetico dei valori riportati in
3526 tab.~\ref{tab:acl_to_text_options}.
3527
3528 \begin{table}[htb]
3529   \centering
3530   \footnotesize
3531   \begin{tabular}{|l|p{8cm}|}
3532     \hline
3533     \textbf{Tipo} & \textbf{Descrizione} \\
3534     \hline
3535     \hline
3536     \const{TEXT\_ABBREVIATE}     & stampa le voci in forma abbreviata.\\
3537     \const{TEXT\_NUMERIC\_IDS}   & non effettua la risoluzione numerica di
3538                                    user-ID e group-ID.\\
3539     \const{TEXT\_SOME\_EFFECTIVE}& per ciascuna voce che contiene permessi che
3540                                    vengono eliminati dalla \const{ACL\_MASK}
3541                                    viene generato un commento con i permessi 
3542                                    effettivamente risultanti; il commento è
3543                                    separato con un tabulatore.\\
3544     \const{TEXT\_ALL\_EFFECTIVE} & viene generato un commento con i permessi
3545                                    effettivi per ciascuna voce che contiene
3546                                    permessi citati nella \const{ACL\_MASK},
3547                                    anche quando questi non vengono modificati
3548                                    da essa; il commento è separato con un
3549                                    tabulatore.\\
3550     \const{TEXT\_SMART\_INDENT}  & da usare in combinazione con le precedenti
3551                                    \const{TEXT\_SOME\_EFFECTIVE} e
3552                                    \const{TEXT\_ALL\_EFFECTIVE} aumenta
3553                                    automaticamente il numero di spaziatori
3554                                    prima degli eventuali commenti in modo da
3555                                    mantenerli allineati.\\
3556     \hline
3557   \end{tabular}
3558   \caption{Possibili valori per l'argomento \param{options} di
3559     \func{acl\_to\_any\_text}.} 
3560   \label{tab:acl_to_text_options}
3561 \end{table}
3562
3563 Come per \func{acl\_to\_text} anche in questo caso il buffer contenente la
3564 rappresentazione testuale dell'ACL, di cui la funzione restituisce
3565 l'indirizzo, viene allocato automaticamente, e dovrà essere esplicitamente
3566 disallocato con una chiamata ad \func{acl\_free}. Si tenga presente infine che
3567 questa funzione è una estensione specifica di Linux, e non è presente nella
3568 bozza dello standard POSIX.1e.
3569
3570
3571 \itindend{Access~Control~List}
3572
3573
3574 % TODO trattare le ACL, la documentazione di sistema è nei pacchetti
3575 % libacl1-dev e acl 
3576 % vedi anche http://www.suse.de/~agruen/acl/linux-acls/online/
3577
3578
3579
3580 \subsection{La funzione \func{chroot}}
3581 \label{sec:file_chroot}
3582
3583 % TODO introdurre nuova sezione sulle funzionalità di sicurezza avanzate, con
3584 % dentro chroot SELinux e AppArmor ???
3585
3586 Benché non abbia niente a che fare con permessi, utenti e gruppi, la funzione
3587 \func{chroot} viene usata spesso per restringere le capacità di accesso di un
3588 programma ad una sezione limitata del filesystem, per cui ne parleremo in
3589 questa sezione.
3590
3591 Come accennato in sez.~\ref{sec:proc_fork} ogni processo oltre ad una
3592 directory di lavoro, ha anche una directory \textsl{radice}\footnote{entrambe
3593   sono contenute in due campi (rispettivamente \var{pwd} e \var{root}) di
3594   \struct{fs\_struct}; vedi fig.~\ref{fig:proc_task_struct}.} che, pur essendo
3595 di norma corrispondente alla radice dell'albero di file e directory come visto
3596 dal kernel (ed illustrato in sez.~\ref{sec:file_organization}), ha per il
3597 processo il significato specifico di directory rispetto alla quale vengono
3598 risolti i \itindsub{pathname}{assoluto}\textit{pathname}
3599 assoluti.\footnote{cioè quando un processo chiede la risoluzione di un
3600   \textit{pathname}, il kernel usa sempre questa directory come punto di
3601   partenza.} Il fatto che questo valore sia specificato per ogni processo apre
3602 allora la possibilità di modificare le modalità di risoluzione dei
3603 \textit{pathname} assoluti da parte di un processo cambiando questa directory,
3604 così come si fa coi \itindsub{pathname}{relativo}\textit{pathname} relativi
3605 cambiando la directory di lavoro.
3606
3607 Normalmente la directory radice di un processo coincide anche con la radice
3608 del filesystem usata dal kernel, e dato che il suo valore viene ereditato dal
3609 padre da ogni processo figlio, in generale i processi risolvono i
3610 \itindsub{pathname}{assoluto} \textit{pathname} assoluti a partire sempre
3611 dalla stessa directory, che corrisponde alla radice del sistema.
3612
3613 In certe situazioni però, per motivi di sicurezza, è utile poter impedire che
3614 un processo possa accedere a tutto il filesystem; per far questo si può
3615 cambiare la sua directory radice con la funzione \funcd{chroot}, il cui
3616 prototipo è:
3617 \begin{prototype}{unistd.h}{int chroot(const char *path)}
3618   Cambia la directory radice del processo a quella specificata da
3619   \param{path}.
3620   
3621 \bodydesc{La funzione restituisce zero in caso di successo e -1 per
3622     un errore, in caso di errore \var{errno} può assumere i valori:
3623   \begin{errlist}
3624   \item[\errcode{EPERM}] l'user-ID effettivo del processo non è zero.
3625   \end{errlist}
3626   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
3627   \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EACCES}, \errval{ELOOP};
3628   \errval{EROFS} e \errval{EIO}.}
3629 \end{prototype}
3630 \noindent in questo modo la directory radice del processo diventerà
3631 \param{path} (che ovviamente deve esistere) ed ogni
3632 \itindsub{pathname}{assoluto}\textit{pathname} assoluto usato dalle funzioni
3633 chiamate nel processo sarà risolto a partire da essa, rendendo impossibile
3634 accedere alla parte di albero sovrastante.  Si ha così quella che viene
3635 chiamata una \textit{chroot jail}, in quanto il processo non può più accedere
3636 a file al di fuori della sezione di albero in cui è stato
3637 \textsl{imprigionato}.
3638
3639 Solo un processo con i privilegi di amministratore può usare questa funzione,
3640 e la nuova radice, per quanto detto in sez.~\ref{sec:proc_fork}, sarà ereditata
3641 da tutti i suoi processi figli. Si tenga presente però che la funzione non
3642 cambia la directory di lavoro, che potrebbe restare fuori dalla \textit{chroot
3643   jail}.
3644
3645 Questo è il motivo per cui la funzione è efficace solo se dopo averla eseguita
3646 si cedono i privilegi di root. Infatti se per un qualche motivo il processo
3647 resta con la directory di lavoro fuori dalla \textit{chroot jail}, potrà
3648 comunque accedere a tutto il resto del filesystem usando
3649 \itindsub{pathname}{relativo}\textit{pathname} relativi, i quali, partendo
3650 dalla directory di lavoro che è fuori della \textit{chroot jail}, potranno
3651 (con l'uso di \texttt{..}) risalire fino alla radice effettiva del filesystem.
3652
3653 Ma se ad un processo restano i privilegi di amministratore esso potrà comunque
3654 portare la sua directory di lavoro fuori dalla \textit{chroot jail} in cui si
3655 trova. Basta infatti creare una nuova \textit{chroot jail} con l'uso di
3656 \func{chroot} su una qualunque directory contenuta nell'attuale directory di
3657 lavoro.  Per questo motivo l'uso di questa funzione non ha molto senso quando
3658 un processo necessita dei privilegi di root per le sue normali operazioni.
3659
3660 Un caso tipico di uso di \func{chroot} è quello di un server FTP anonimo, in
3661 questo caso infatti si vuole che il server veda solo i file che deve
3662 trasferire, per cui in genere si esegue una \func{chroot} sulla directory che
3663 contiene i file.  Si tenga presente però che in questo caso occorrerà
3664 replicare all'interno della \textit{chroot jail} tutti i file (in genere
3665 programmi e librerie) di cui il server potrebbe avere bisogno.
3666
3667
3668
3669
3670 % LocalWords:  sez like filesystem unlink MacOS Windows VMS inode kernel unistd
3671 % LocalWords:  un'etichetta int const char oldpath newpath errno EXDEV EPERM st
3672 % LocalWords:  EEXIST EMLINK EACCES ENAMETOOLONG ENOTDIR EFAULT ENOMEM EROFS ls
3673 % LocalWords:  ELOOP ENOSPC EIO pathname nlink stat vfat fsck EISDIR ENOENT cap
3674 % LocalWords:  POSIX socket fifo sticky root system call count crash nell' init
3675 % LocalWords:  descriptor remove rename rmdir stdio glibc libc NFS DT obj dup
3676 % LocalWords:  ENOTEMPTY EBUSY mount point EINVAL soft symbolic tab symlink fig
3677 % LocalWords:  dangling access chdir chmod chown creat exec lchown lstat mkdir
3678 % LocalWords:  mkfifo mknod opendir pathconf readlink truncate path buff size
3679 % LocalWords:  grub bootloader grep linux MAXSYMLINKS cat VFS sys dirname fcntl
3680 % LocalWords:  dev umask IFREG IFBLK IFCHR IFIFO SVr sgid BSD SVID NULL from to
3681 % LocalWords:  stream dirent EMFILE ENFILE dirfd SOURCE fchdir readdir struct
3682 % LocalWords:  EBADF namlen HAVE thread entry result value argument fileno ino
3683 % LocalWords:  name TYPE OFF RECLEN UNKNOWN REG SOCK CHR BLK type IFTODT DTTOIF
3684 % LocalWords:  DTYPE off reclen seekdir telldir void rewinddir closedir select
3685 % LocalWords:  namelist compar malloc qsort alphasort versionsort strcoll myls
3686 % LocalWords:  strcmp DirScan direntry while current working home shell pwd get
3687 % LocalWords:  getcwd ERANGE getwd change fd race condition tmpnam getfacl mark
3688 % LocalWords:  string tmpdir TMP tempnam pfx TMPNAME suid tmp EXCL tmpfile pid
3689 % LocalWords:  EINTR mktemp mkstemp stlib template filename XXXXXX OpenBSD buf
3690 % LocalWords:  mkdtemp fstat filedes nell'header padding ISREG ISDIR ISCHR IFMT
3691 % LocalWords:  ISBLK ISFIFO ISLNK ISSOCK IFSOCK IFLNK IFDIR ISUID UID ISGID GID
3692 % LocalWords:  ISVTX IRUSR IWUSR IXUSR IRGRP IWGRP IXGRP IROTH IWOTH IXOTH du
3693 % LocalWords:  blocks blksize holes lseek TRUNC ftruncate length lenght ETXTBSY
3694 % LocalWords:  hole atime read utime mtime write ctime modification leafnode cp
3695 % LocalWords:  make fchmod fchown utimbuf times actime modtime Mac owner uid fs
3696 % LocalWords:  gid Control List patch mandatory control execute group other all
3697 % LocalWords:  dell' effective passwd IGID locking swap saved text IRWXU IRWXG
3698 % LocalWords:  IRWXO ext reiser capability FSETID mask capabilities chroot jail
3699 % LocalWords:  FTP Di filter reiserfs Attributes Solaris Posix FreeBSD libacl
3700 % LocalWords:  XFS SELinux namespace attribute security trusted Draft Modules
3701 % LocalWords:  attributes mime ADMIN FOWNER libattr lattr getxattr lgetxattr of
3702 % LocalWords:  fgetxattr attr ssize ENOATTR ENOTSUP NUL setxattr lsetxattr list
3703 % LocalWords:  fsetxattr flags XATTR REPLACE listxattr llistxattr flistxattr by
3704 % LocalWords:  removexattr lremovexattr fremovexattr attributename  lacl acl
3705 % LocalWords:  OBJ setfacl len any prefix separator options NUMERIC IDS SMART
3706
3707 %%% Local Variables: 
3708 %%% mode: latex
3709 %%% TeX-master: "gapil"
3710 %%% End: 
3711 % LocalWords:  INDENT