d4a7015f38a9fdc636a6fcc06b8564379e28ab4c
[gapil.git] / filedir.tex
1 %% filedir.tex
2 %%
3 %% Copyright (C) 2000-2007 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{File e directory}
13 \label{cha:files_and_dirs}
14
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando dalle funzioni di libreria che si usano per
17 copiarli, spostarli e cambiarne i nomi. Esamineremo poi l'interfaccia che
18 permette la manipolazione dei vari attributi di file e directory ed alla fine
19 faremo una trattazione dettagliata su come è strutturato il sistema base di
20 protezioni e controllo dell'accesso ai file e sulle funzioni che ne permettono
21 la gestione. Tutto quello che riguarda invece la manipolazione del contenuto
22 dei file è lasciato ai capitoli successivi.
23
24
25
26 \section{La gestione di file e directory}
27 \label{sec:file_dir}
28
29 Come già accennato in sez.~\ref{sec:file_filesystem} in un sistema unix-like
30 la gestione dei file ha delle caratteristiche specifiche che derivano
31 direttamente dall'architettura del sistema.  In questa sezione esamineremo le
32 funzioni usate per la manipolazione di file e directory, per la creazione di
33 link simbolici e diretti, per la gestione e la lettura delle directory.
34
35 In particolare ci soffermeremo sulle conseguenze che derivano
36 dall'architettura dei filesystem illustrata nel capitolo precedente per quanto
37 riguarda il comportamento e gli effetti delle varie funzioni.
38
39
40 \subsection{Le funzioni \func{link} e \func{unlink}}
41 \label{sec:file_link}
42
43 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
44 dei nomi fittizi (come gli alias del MacOS o i collegamenti di Windows o i
45 nomi logici del VMS) che permettono di fare riferimento allo stesso file
46 chiamandolo con nomi diversi o accedendovi da directory diverse.
47
48 Questo è possibile anche in ambiente Unix, dove tali collegamenti sono
49 usualmente chiamati \textit{link}; ma data l'architettura del sistema riguardo
50 la gestione dei file (ed in particolare quanto trattato in
51 sez.~\ref{sec:file_arch_func}) ci sono due metodi sostanzialmente diversi per
52 fare questa operazione.
53
54 Come spiegato in sez.~\ref{sec:file_filesystem} l'accesso al contenuto di un
55 file su disco avviene passando attraverso il suo \itindex{inode}
56 \textit{inode}, che è la struttura usata dal kernel che lo identifica
57 univocamente all'interno di un singolo filesystem. Il nome del file che si
58 trova nella voce di una directory è solo un'etichetta, mantenuta all'interno
59 della directory, che viene associata ad un puntatore che fa riferimento al
60 suddetto \textit{inode}.
61
62 Questo significa che, fintanto che si resta sullo stesso filesystem, la
63 realizzazione di un link è immediata, ed uno stesso file può avere tanti nomi
64 diversi, dati da altrettante associazioni diverse allo stesso \itindex{inode}
65 \textit{inode} effettuate tramite ``etichette'' diverse in directory
66 diverse. Si noti anche che nessuno di questi nomi viene ad assumere una
67 particolare preferenza o originalità rispetto agli altri, in quanto tutti
68 fanno comunque riferimento allo stesso \itindex{inode} \textit{inode}.
69
70 Per aggiungere ad una directory una voce che faccia riferimento ad un
71 \itindex{inode} \textit{inode} già esistente si utilizza la funzione
72 \func{link}; si suole chiamare questo tipo di associazione un collegamento
73 diretto, o \textit{hard link}.  Il prototipo della funzione è il seguente:
74 \begin{prototype}{unistd.h}
75 {int link(const char *oldpath, const char *newpath)}
76   Crea un nuovo collegamento diretto.
77   
78   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
79     errore nel qual caso \var{errno} viene impostata ai valori:
80   \begin{errlist}
81   \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
82     riferimento ad un filesystem montato sullo stesso \textit{mount point}.
83   \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
84     \param{newpath} non supporta i link diretti o è una directory.
85   \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
86     esiste già.
87   \item[\errcode{EMLINK}] ci sono troppi link al file \param{oldpath} (il
88     numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
89     sez.~\ref{sec:sys_limits}).
90   \end{errlist}
91   ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOTDIR},
92   \errval{EFAULT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
93   \errval{ENOSPC}, \errval{EIO}.}
94 \end{prototype}
95
96 La funzione crea sul \itindex{pathname} \textit{pathname} \param{newpath} un
97 collegamento diretto al file indicato da \param{oldpath}.  Per quanto detto la
98 creazione di un nuovo collegamento diretto non copia il contenuto del file, ma
99 si limita a creare una voce nella directory specificata da \param{newpath} e
100 ad aumentare di uno il numero di riferimenti al file (riportato nel campo
101 \var{st\_nlink} della struttura \struct{stat}, vedi sez.~\ref{sec:file_stat})
102 aggiungendo il nuovo nome ai precedenti. Si noti che uno stesso file può
103 essere così chiamato con vari nomi in diverse directory.
104
105 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
106 collegamento diretto è possibile solo se entrambi i \itindex{pathname}
107 \textit{pathname} sono nello stesso filesystem; inoltre il filesystem deve
108 supportare i collegamenti diretti (il meccanismo non è disponibile ad esempio
109 con il filesystem \acr{vfat} di Windows). In realtà la funzione ha un
110 ulteriore requisito, e cioè che non solo che i due file siano sullo stesso
111 filesystem, ma anche che si faccia riferimento ad essi sullo stesso
112 \textit{mount point}.\footnote{si tenga presente infatti (vedi
113   sez.~\ref{sec:sys_file_config}) che a partire dal kernel 2.4 uno stesso
114   filesystem può essere montato più volte su directory diverse.}
115
116 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
117 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
118 l'amministratore è in grado di creare un collegamento diretto ad un'altra
119 directory: questo viene fatto perché con una tale operazione è possibile
120 creare dei \textit{loop} nel filesystem (vedi l'esempio mostrato in
121 sez.~\ref{sec:file_symlink}, dove riprenderemo il discorso) che molti programmi
122 non sono in grado di gestire e la cui rimozione diventerebbe estremamente
123 complicata (in genere per questo tipo di errori occorre far girare il
124 programma \cmd{fsck} per riparare il filesystem).
125
126 Data la pericolosità di questa operazione e la disponibilità dei link
127 simbolici che possono fornire la stessa funzionalità senza questi problemi,
128 nel caso di Linux questa capacità è stata completamente disabilitata, e al
129 tentativo di creare un link diretto ad una directory la funzione \func{link}
130 restituisce l'errore \errcode{EPERM}.
131
132 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
133 \textit{hard link} ad un link simbolico. In questo caso lo standard POSIX
134 prevederebbe che quest'ultimo venga risolto e che il collegamento sia
135 effettuato rispetto al file cui esso punta, e che venga riportato un errore
136 qualora questo non esista o non sia un file. Questo era anche il comportamento
137 iniziale di Linux ma a partire dai kernel della serie 2.0.x\footnote{per la
138   precisione il comportamento era quello previsto dallo standard POSIX fino al
139   kernel di sviluppo 1.3.56, ed è stato temporaneamente ripristinato anche
140   durante lo sviluppo della serie 2.1.x, per poi tornare al comportamento
141   attuale fino ad oggi (per riferimento si veda
142   \href{http://lwn.net/Articles/293902}
143   {\texttt{http://lwn.net/Articles/293902}}).} è stato adottato un
144 comportamento che non segue più lo standard per cui l'\textit{hard link} viene
145 creato rispetto al link simbolico, e non al file cui questo punta.
146
147 La ragione di questa differenza rispetto allo standard, presente anche in
148 altri sistemi unix-like, sono dovute al fatto che un link simbolico può fare
149 riferimento anche ad un file non esistente o a una directory, per i quali
150 l'\textit{hard link} non può essere creato, per cui la scelta di seguire il
151 link simbolico è stata ritenuta una scelta scorretta nella progettazione
152 dell'interfaccia.  Infatti se non ci fosse il comportamento adottato da Linux
153 sarebbe impossibile creare un \textit{hard link} ad un link simbolico, perché
154 la funzione lo risolverebbe e l'\textit{hard link} verrebbe creato verso la
155 destinazione. Invece evitando di seguire lo standard l'operazione diventa
156 possibile, ed anche il comportamento della funzione risulta molto più
157 comprensibile. Tanto più che se proprio se si vuole creare un \textit{hard
158   link} rispetto alla destinazione di un link simbolico è sempre possibile
159 farlo direttamente.\footnote{ciò non toglie che questo comportamento fuori
160   standard possa causare problemi, come nell'esempio descritto nell'articolo
161   citato nella nota precedente, a programmi che non si aspettano questa
162   differenza rispetto allo standard POSIX.}
163
164 La rimozione di un file (o più precisamente della voce che lo referenzia
165 all'interno di una directory) si effettua con la funzione \funcd{unlink}; il
166 suo prototipo è il seguente:
167 \begin{prototype}{unistd.h}{int unlink(const char *pathname)}
168
169   Cancella un file.
170   
171   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
172     errore, nel qual caso il file non viene toccato. La variabile
173     \var{errno} viene impostata secondo i seguenti codici di errore:
174   \begin{errlist}
175   \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una directory.
176     \footnotemark
177   \item[\errcode{EROFS}] \param{pathname} è su un filesystem montato in sola
178   lettura.
179   \item[\errcode{EISDIR}] \param{pathname} fa riferimento a una directory.
180   \end{errlist}
181   ed inoltre: \errval{EACCES}, \errval{EFAULT}, \errval{ENOENT},
182   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
183   \errval{EIO}.}
184 \end{prototype}
185
186 \footnotetext{questo è un valore specifico ritornato da Linux che non consente
187   l'uso di \func{unlink} con le directory (vedi sez.~\ref{sec:file_remove}).
188   Non è conforme allo standard POSIX, che prescrive invece l'uso di
189   \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
190   abbia privilegi sufficienti.}
191
192 La funzione cancella il nome specificato da \param{pathname} nella relativa
193 directory e decrementa il numero di riferimenti nel relativo \itindex{inode}
194 \textit{inode}. Nel caso di link simbolico cancella il link simbolico; nel
195 caso di socket, fifo o file di dispositivo \index{file!di~dispositivo} rimuove
196 il nome, ma come per i file i processi che hanno aperto uno di questi oggetti
197 possono continuare ad utilizzarlo.
198
199 Per cancellare una voce in una directory è necessario avere il permesso di
200 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
201 il diritto di esecuzione sulla directory che la contiene (affronteremo in
202 dettaglio l'argomento dei permessi di file e directory in
203 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
204 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
205 occorrerà anche essere proprietari del file o proprietari della directory (o
206 root, per cui nessuna delle restrizioni è applicata).
207
208 Una delle caratteristiche di queste funzioni è che la creazione/rimozione del
209 nome dalla directory e l'incremento/decremento del numero di riferimenti
210 \itindex{inode} nell'\textit{inode} devono essere effettuati in maniera
211 atomica (si veda sez.~\ref{sec:proc_atom_oper}) senza possibili interruzioni
212 fra le due operazioni. Per questo entrambe queste funzioni sono realizzate
213 tramite una singola system call.
214
215 Si ricordi infine che un file non viene eliminato dal disco fintanto che tutti
216 i riferimenti ad esso sono stati cancellati: solo quando il \textit{link
217   count} mantenuto \itindex{inode} nell'\textit{inode} diventa zero lo spazio
218 occupato su disco viene rimosso (si ricordi comunque che a questo si aggiunge
219 sempre un'ulteriore condizione,\footnote{come vedremo in
220   cap.~\ref{cha:file_unix_interface} il kernel mantiene anche una tabella dei
221   file aperti nei vari processi, che a sua volta contiene i riferimenti agli
222   \itindex{inode} \textit{inode} ad essi relativi. Prima di procedere alla
223   cancellazione dello spazio occupato su disco dal contenuto di un file il
224   kernel controlla anche questa tabella, per verificare che anche in essa non
225   ci sia più nessun riferimento all'\textit{inode} in questione.} e cioè che
226 non ci siano processi che abbiano il suddetto file aperto).
227
228 Questa proprietà viene spesso usata per essere sicuri di non lasciare file
229 temporanei su disco in caso di crash dei programmi; la tecnica è quella di
230 aprire il file e chiamare \func{unlink} subito dopo, in questo modo il
231 contenuto del file è sempre disponibile all'interno del processo attraverso il
232 suo file descriptor (vedi sez.~\ref{sec:file_fd}) fintanto che il processo non
233 chiude il file, ma non ne resta traccia in nessuna directory, e lo spazio
234 occupato su disco viene immediatamente rilasciato alla conclusione del
235 processo (quando tutti i file vengono chiusi).
236
237
238 \subsection{Le funzioni \func{remove} e \func{rename}}
239 \label{sec:file_remove}
240
241 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
242 \func{unlink} sulle directory; per cancellare una directory si può usare la
243 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}), oppure la
244 funzione \funcd{remove}. 
245
246 Questa è la funzione prevista dallo standard ANSI C per cancellare un file o
247 una directory (e funziona anche per i sistemi che non supportano i link
248 diretti). Per i file è identica a \func{unlink} e per le directory è identica
249 a \func{rmdir}; il suo prototipo è:
250 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
251   Cancella un nome dal filesystem. 
252   
253   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
254     errore, nel qual caso il file non viene toccato.
255     
256     I codici di errore riportati in \var{errno} sono quelli della chiamata
257     utilizzata, pertanto si può fare riferimento a quanto illustrato nelle
258     descrizioni di \func{unlink} e \func{rmdir}.}
259 \end{prototype}
260
261 La funzione utilizza la funzione \func{unlink}\footnote{questo vale usando le
262   \acr{glibc}; nelle libc4 e nelle libc5 la funzione \func{remove} è un
263   semplice alias alla funzione \func{unlink} e quindi non può essere usata per
264   le directory.} per cancellare i file e la funzione \func{rmdir} per
265 cancellare le directory; si tenga presente che per alcune implementazioni del
266 protocollo NFS utilizzare questa funzione può comportare la scomparsa di file
267 ancora in uso.
268
269 Per cambiare nome ad un file o a una directory (che devono comunque essere
270 nello stesso filesystem) si usa invece la funzione \funcd{rename},\footnote{la
271   funzione è definita dallo standard ANSI C, ma si applica solo per i file, lo
272   standard POSIX estende la funzione anche alle directory.} il cui prototipo
273 è:
274 \begin{prototype}{stdio.h}
275   {int rename(const char *oldpath, const char *newpath)} 
276   
277   Rinomina un file.
278   
279   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
280     errore, nel qual caso il file non viene toccato. La variabile
281     \var{errno} viene impostata secondo i seguenti codici di errore:
282   \begin{errlist} 
283   \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
284     \param{oldpath} non è una directory.
285   \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
286     stesso filesystem.
287   \item[\errcode{ENOTEMPTY}] \param{newpath} è una directory già esistente e
288     non vuota.
289   \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
290     parte di qualche processo (come directory di lavoro o come radice) o del
291     sistema (come mount point).
292   \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
293     \param{oldpath} o più in generale si è cercato di creare una directory come
294     sotto-directory di se stessa.
295   \item[\errcode{ENOTDIR}] uno dei componenti dei \itindex{pathname}
296     \textit{pathname} non è una directory o \param{oldpath} è una directory e
297     \param{newpath} esiste e non è una directory.
298   \end{errlist} 
299   ed inoltre \errval{EACCES}, \errval{EPERM}, \errval{EMLINK},
300   \errval{ENOENT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP} e
301   \errval{ENOSPC}.}
302 \end{prototype}
303
304 La funzione rinomina il file \param{oldpath} in \param{newpath}, eseguendo se
305 necessario lo spostamento di un file fra directory diverse. Eventuali altri
306 link diretti allo stesso file non vengono influenzati.
307
308 Il comportamento della funzione è diverso a seconda che si voglia rinominare
309 un file o una directory; se ci riferisce ad un file allora \param{newpath}, se
310 esiste, non deve essere una directory (altrimenti si ha l'errore
311 \errcode{EISDIR}). Nel caso \param{newpath} indichi un file esistente questo
312 viene cancellato e rimpiazzato (atomicamente).
313
314 Se \param{oldpath} è una directory allora \param{newpath}, se esiste, deve
315 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
316 (se non è una directory) o \errcode{ENOTEMPTY} (se non è vuota). Chiaramente
317 \param{newpath} non può contenere \param{oldpath} altrimenti si avrà un errore
318 \errcode{EINVAL}.
319
320 Se \param{oldpath} si riferisce ad un link simbolico questo sarà rinominato; se
321 \param{newpath} è un link simbolico verrà cancellato come qualunque altro
322 file.  Infine qualora \param{oldpath} e \param{newpath} siano due nomi dello
323 stesso file lo standard POSIX prevede che la funzione non dia errore, e non
324 faccia nulla, lasciando entrambi i nomi; Linux segue questo standard, anche
325 se, come fatto notare dal manuale delle \textit{glibc}, il comportamento più
326 ragionevole sarebbe quello di cancellare \param{oldpath}.
327
328 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
329 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
330 può esistere cioè nessun istante in cui un altro processo può trovare attivi
331 entrambi i nomi dello stesso file, o, in caso di sostituzione di un file
332 esistente, non trovare quest'ultimo prima che la sostituzione sia stata
333 eseguita.
334
335 In ogni caso se \param{newpath} esiste e l'operazione fallisce per un qualche
336 motivo (come un crash del kernel), \func{rename} garantisce di lasciare
337 presente un'istanza di \param{newpath}. Tuttavia nella sovrascrittura potrà
338 esistere una finestra in cui sia \param{oldpath} che \param{newpath} fanno
339 riferimento allo stesso file.
340
341
342 \subsection{I link simbolici}
343 \label{sec:file_symlink}
344
345 Come abbiamo visto in sez.~\ref{sec:file_link} la funzione \func{link} crea
346 riferimenti agli \itindex{inode} \textit{inode}, pertanto può funzionare
347 soltanto per file che risiedono sullo stesso filesystem e solo per un
348 filesystem di tipo Unix.  Inoltre abbiamo visto che in Linux non è consentito
349 eseguire un link diretto ad una directory.
350
351 Per ovviare a queste limitazioni i sistemi Unix supportano un'altra forma di
352 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
353 come avviene in altri sistemi operativi, dei file speciali che contengono
354 semplicemente il riferimento ad un altro file (o directory). In questo modo è
355 possibile effettuare link anche attraverso filesystem diversi, a file posti in
356 filesystem che non supportano i link diretti, a delle directory, ed anche a
357 file che non esistono ancora.
358
359 Il sistema funziona in quanto i link simbolici sono riconosciuti come tali dal
360 kernel\footnote{è uno dei diversi tipi di file visti in
361   tab.~\ref{tab:file_file_types}, contrassegnato come tale
362   nell'\textit{inode}, e riconoscibile dal valore del campo \var{st\_mode}
363   della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).}  per cui
364 alcune funzioni di libreria (come \func{open} o \func{stat}) quando ricevono
365 come argomento un link simbolico vengono automaticamente applicate al file da
366 esso specificato.  La funzione che permette di creare un nuovo link simbolico
367 è \funcd{symlink}, ed il suo prototipo è:
368 \begin{prototype}{unistd.h}
369   {int symlink(const char *oldpath, const char *newpath)} 
370   Crea un nuovo link simbolico di nome \param{newpath} il cui contenuto è
371   \param{oldpath}.
372   
373   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
374     errore, nel qual caso la variabile \var{errno} assumerà i valori:
375   \begin{errlist}
376   \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
377     supporta i link simbolici.
378   \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
379     \param{oldpath} è una stringa vuota.
380   \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
381   \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
382     lettura.
383   \end{errlist}
384   ed inoltre \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
385   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{ENOSPC} e
386   \errval{EIO}.}
387 \end{prototype}
388
389 Si tenga presente che la funzione non effettua nessun controllo sull'esistenza
390 di un file di nome \param{oldpath}, ma si limita ad inserire quella stringa
391 nel link simbolico. Pertanto un link simbolico può anche riferirsi ad un file
392 che non esiste: in questo caso si ha quello che viene chiamato un
393 \textit{dangling link}, letteralmente un \textsl{link ciondolante}.
394
395 Come accennato i link simbolici sono risolti automaticamente dal kernel
396 all'invocazione delle varie system call; in tab.~\ref{tab:file_symb_effect} si
397 è riportato un elenco dei comportamenti delle varie funzioni di libreria che
398 operano sui file nei confronti della risoluzione dei link simbolici,
399 specificando quali seguono il link simbolico e quali invece possono operare
400 direttamente sul suo contenuto.
401 \begin{table}[htb]
402   \centering
403   \footnotesize
404   \begin{tabular}[c]{|l|c|c|}
405     \hline
406     \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
407     \hline 
408     \hline 
409     \func{access}   & $\bullet$ & --        \\
410     \func{chdir}    & $\bullet$ & --        \\
411     \func{chmod}    & $\bullet$ & --        \\
412     \func{chown}    & --        & $\bullet$ \\
413     \func{creat}    & $\bullet$ & --        \\
414     \func{exec}     & $\bullet$ & --        \\
415     \func{lchown}   & $\bullet$ & --        \\
416     \func{link}\footnotemark & --        & $\bullet$ \\
417     \func{lstat}    & --        & $\bullet$ \\
418     \func{mkdir}    & $\bullet$ & --        \\
419     \func{mkfifo}   & $\bullet$ & --        \\
420     \func{mknod}    & $\bullet$ & --        \\
421     \func{open}     & $\bullet$ & --        \\
422     \func{opendir}  & $\bullet$ & --        \\
423     \func{pathconf} & $\bullet$ & --        \\
424     \func{readlink} & --        & $\bullet$ \\
425     \func{remove}   & --        & $\bullet$ \\
426     \func{rename}   & --        & $\bullet$ \\
427     \func{stat}     & $\bullet$ & --        \\
428     \func{truncate} & $\bullet$ & --        \\
429     \func{unlink}   & --        & $\bullet$ \\
430     \hline 
431   \end{tabular}
432   \caption{Uso dei link simbolici da parte di alcune funzioni.}
433   \label{tab:file_symb_effect}
434 \end{table}
435
436 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
437   dallo standard POSIX, si veda quanto detto in sez.~\ref{sec:file_link}.}
438
439 Si noti che non si è specificato il comportamento delle funzioni che operano
440 con i file descriptor, in quanto la risoluzione del link simbolico viene in
441 genere effettuata dalla funzione che restituisce il file descriptor
442 (normalmente la \func{open}, vedi sez.~\ref{sec:file_open}) e tutte le
443 operazioni seguenti fanno riferimento solo a quest'ultimo.
444
445 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
446 \func{open} seguono i link simbolici, occorrono funzioni apposite per accedere
447 alle informazioni del link invece che a quelle del file a cui esso fa
448 riferimento. Quando si vuole leggere il contenuto di un link simbolico si usa
449 la funzione \funcd{readlink}, il cui prototipo è:
450 \begin{prototype}{unistd.h}
451 {int readlink(const char *path, char *buff, size\_t size)} 
452   Legge il contenuto del link simbolico indicato da \param{path} nel buffer
453   \param{buff} di dimensione \param{size}.
454   
455   \bodydesc{La funzione restituisce il numero di caratteri letti dentro
456     \param{buff} o -1 per un errore, nel qual caso la variabile
457     \var{errno} assumerà i valori:
458   \begin{errlist}
459   \item[\errcode{EINVAL}] \param{path} non è un link simbolico o \param{size}
460     non è positiva.
461   \end{errlist}
462   ed inoltre \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
463   \errval{EACCES}, \errval{ELOOP}, \errval{EIO}, \errval{EFAULT} e
464   \errval{ENOMEM}.}
465 \end{prototype}
466
467 La funzione apre il link simbolico, ne legge il contenuto, lo scrive nel
468 buffer, e lo richiude. Si tenga presente che la funzione non termina la
469 stringa con un carattere nullo e la tronca alla dimensione specificata da
470 \param{size} per evitare di sovrascrivere oltre le dimensioni del buffer.
471
472 \begin{figure}[htb]
473   \centering
474   \includegraphics[width=8.5cm]{img/link_loop}
475   \caption{Esempio di loop nel filesystem creato con un link simbolico.}
476   \label{fig:file_link_loop}
477 \end{figure}
478
479 Un caso comune che si può avere con i link simbolici è la creazione dei
480 cosiddetti \textit{loop}. La situazione è illustrata in
481 fig.~\ref{fig:file_link_loop}, che riporta la struttura della directory
482 \file{/boot}. Come si vede si è creato al suo interno un link simbolico che
483 punta di nuovo a \file{/boot}.\footnote{il loop mostrato in
484   fig.~\ref{fig:file_link_loop} è un usato per poter permettere a \cmd{grub}
485   (un bootloader in grado di leggere direttamente da vari filesystem il file
486   da lanciare come sistema operativo) di vedere i file contenuti nella
487   directory \file{/boot} con lo stesso \textit{pathname} con cui verrebbero
488   visti dal sistema operativo, anche se essi si trovano, come accade spesso,
489   su una partizione separata (che \cmd{grub}, all'avvio, vede come radice).}
490
491 Questo può causare problemi per tutti quei programmi che effettuano la
492 scansione di una directory senza tener conto dei link simbolici, ad esempio se
493 lanciassimo un comando del tipo \code{grep -r linux *}, il loop nella
494 directory porterebbe il comando ad esaminare \file{/boot}, \file{/boot/boot},
495 \file{/boot/boot/boot} e così via.
496
497 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
498 un \itindex{pathname} \textit{pathname} possano essere seguiti un numero
499 limitato di link simbolici, il cui valore limite è specificato dalla costante
500 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
501 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}.
502
503 Un punto da tenere sempre presente è che, come abbiamo accennato, un link
504 simbolico può fare riferimento anche ad un file che non esiste; ad esempio
505 possiamo creare un file temporaneo nella nostra directory con un link del
506 tipo:
507 \begin{verbatim}
508 $ ln -s /tmp/tmp_file temporaneo
509 \end{verbatim}%$
510 anche se \file{/tmp/tmp\_file} non esiste. Questo può generare confusione, in
511 quanto aprendo in scrittura \file{temporaneo} verrà creato
512 \file{/tmp/tmp\_file} e scritto; ma accedendo in sola lettura a
513 \file{temporaneo}, ad esempio con \cmd{cat}, otterremmo:
514 \begin{verbatim}
515 $ cat temporaneo
516 cat: temporaneo: No such file or directory
517 \end{verbatim}%$
518 con un errore che può sembrare sbagliato, dato che un'ispezione con \cmd{ls}
519 ci mostrerebbe invece l'esistenza di \file{temporaneo}.
520
521
522 \subsection{La creazione e la cancellazione delle directory} 
523 \label{sec:file_dir_creat_rem}
524
525 Benché in sostanza le directory non siano altro che dei file contenenti
526 elenchi di nomi ed \itindex{inode} \textit{inode}, non è possibile trattarle
527 come file ordinari e devono essere create direttamente dal kernel attraverso
528 una opportuna system call.\footnote{questo è quello che permette anche,
529   attraverso l'uso del VFS, l'utilizzo di diversi formati per la gestione dei
530   suddetti elenchi.}  La funzione usata per creare una directory è
531 \funcd{mkdir}, ed il suo prototipo è:
532 \begin{functions}
533   \headdecl{sys/stat.h}
534   \headdecl{sys/types.h}
535   \funcdecl{int mkdir(const char *dirname, mode\_t mode)} 
536
537   Crea una nuova directory.
538   
539   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
540     errore, nel qual caso \var{errno} assumerà i valori:
541   \begin{errlist}
542   \item[\errcode{EEXIST}] un file (o una directory) con quel nome esiste di
543     già.
544   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
545     cui si vuole inserire la nuova directory.
546   \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
547     directory contiene troppi file; sotto Linux questo normalmente non avviene
548     perché il filesystem standard consente la creazione di un numero di file
549     maggiore di quelli che possono essere contenuti nel disco, ma potendo
550     avere a che fare anche con filesystem di altri sistemi questo errore può
551     presentarsi.
552   \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
553     la nuova directory o si è esaurita la quota disco dell'utente.
554   \end{errlist}
555   ed inoltre anche \errval{EPERM}, \errval{EFAULT}, \errval{ENAMETOOLONG},
556   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
557   \errval{EROFS}.}
558 \end{functions}
559
560 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
561 standard presenti in ogni directory (cioè ``\file{.}'' e ``\file{..}''), con
562 il nome indicato dall'argomento \param{dirname}. Il nome può essere indicato
563 sia come \itindex{pathname} \textit{pathname} assoluto che come
564 \itindex{pathname} \textit{pathname} relativo.
565
566 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
567 directory viene creata sono specificati dall'argomento \param{mode}, i cui
568 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
569 tenga presente che questi sono modificati dalla maschera di creazione dei file
570 (si veda sez.~\ref{sec:file_perm_management}).  La titolarità della nuova
571 directory è impostata secondo quanto riportato in
572 sez.~\ref{sec:file_ownership_management}.
573
574 La funzione che permette la cancellazione di una directory è invece
575 \funcd{rmdir}, ed il suo prototipo è:
576 \begin{prototype}{sys/stat.h}{int rmdir(const char *dirname)} 
577   Cancella una directory.
578
579   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
580     errore, nel qual caso \var{errno} assumerà i valori:
581   \begin{errlist}
582   \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
583     directory, oppure la directory che contiene \param{dirname} ha lo
584     \itindex{sticky~bit} \textit{sticky bit} impostato e l'user-ID effettivo
585     del processo non corrisponde al proprietario della directory.
586   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
587     che contiene la directory che si vuole cancellare, o non c'è il permesso
588     di attraversare (esecuzione) una delle directory specificate in
589     \param{dirname}.
590   \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o la
591     radice di qualche processo.
592   \item[\errcode{ENOTEMPTY}] la directory non è vuota.
593   \end{errlist}
594   ed inoltre anche \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
595   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{EROFS}.}
596 \end{prototype}
597
598 La funzione cancella la directory \param{dirname}, che deve essere vuota (la
599 directory deve cioè contenere soltanto le due voci standard ``\file{.}'' e
600 ``\file{..}'').  Il nome può essere indicato con il \itindex{pathname}
601 \textit{pathname} assoluto o relativo.
602
603 La modalità con cui avviene la cancellazione è analoga a quella di
604 \func{unlink}: fintanto che il numero di link \itindex{inode}
605 all'\textit{inode} della directory non diventa nullo e nessun processo ha la
606 directory aperta lo spazio occupato su disco non viene rilasciato. Se un
607 processo ha la directory aperta la funzione rimuove il link \itindex{inode}
608 all'\textit{inode} e nel caso sia l'ultimo, pure le voci standard ``\file{.}''
609 e ``\file{..}'', a questo punto il kernel non consentirà di creare più nuovi
610 file nella directory.
611
612
613 \subsection{La creazione di file speciali}
614 \label{sec:file_mknod}
615
616 Finora abbiamo parlato esclusivamente di file, directory e link simbolici; in
617 sez.~\ref{sec:file_file_types} abbiamo visto però che il sistema prevede pure
618 degli altri tipi di file speciali, come i \index{file!di~dispositivo} file di
619 dispositivo e le fifo (i socket sono un caso a parte, che tratteremo in
620 cap.~\ref{cha:socket_intro}).
621
622 La manipolazione delle caratteristiche di questi file e la loro cancellazione
623 può essere effettuata con le stesse funzioni che operano sui file regolari; ma
624 quando li si devono creare sono necessarie delle funzioni apposite. La prima
625 di queste funzioni è \funcd{mknod}, il suo prototipo è:
626 \begin{functions}
627   \headdecl{sys/types.h}
628   \headdecl{sys/stat.h}
629   \headdecl{fcntl.h}
630   \headdecl{unistd.h}
631   \funcdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)} 
632   
633   Crea un \textit{inode} del tipo specificato sul filesystem.
634   
635   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
636     errore, nel qual caso \var{errno} assumerà i valori:
637   \begin{errlist}
638   \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
639     l'\texttt{inode}, o il filesystem su cui si è cercato di
640     creare \param{pathname} non supporta l'operazione.
641   \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
642     fifo, un socket o un dispositivo.
643   \item[\errcode{EEXIST}] \param{pathname} esiste già o è un link simbolico.
644   \end{errlist}
645   ed inoltre anche \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
646   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
647   \errval{ENOSPC}, \errval{EROFS}.}
648 \end{functions}
649
650 La funzione permette di creare un file speciale, ma si può usare anche per
651 creare file regolari e fifo; l'argomento \param{mode} specifica il tipo di
652 file che si vuole creare ed i relativi permessi, secondo i valori riportati in
653 tab.~\ref{tab:file_mode_flags}, che vanno combinati con un OR binario. I
654 permessi sono comunque modificati nella maniera usuale dal valore di
655 \itindex{umask} \textit{umask} (si veda sez.~\ref{sec:file_perm_management}).
656
657 Per il tipo di file può essere specificato solo uno fra: \const{S\_IFREG} per
658 un file regolare (che sarà creato vuoto), \const{S\_IFBLK} per un dispositivo
659 a blocchi, \const{S\_IFCHR} per un dispositivo a caratteri, \const{S\_IFSOCK}
660 e \const{S\_IFIFO} per una fifo. Un valore diverso comporterà l'errore
661 \errcode{EINVAL}. Qualora si sia specificato in \param{mode} un file di
662 dispositivo (\const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev}
663 dovrà essere usato per indicare a quale dispositivo si fa riferimento con il
664 relativo numero.
665
666 Solo l'amministratore può creare un file di dispositivo usando questa funzione
667 (il processo deve avere la \textit{capability} \const{CAP\_MKNOD}); ma in
668 Linux\footnote{la funzione non è prevista dallo standard POSIX, e deriva da
669   SVr4, con appunto questa differenza e diversi codici di errore.} l'uso per
670 la creazione di un file ordinario, di una fifo o di un socket è consentito
671 anche agli utenti normali.
672
673 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
674 al proprietario e al gruppo del processo che li ha creati, a meno che non si
675 sia attivato il bit \acr{sgid} per la directory o sia stata attivata la
676 semantica BSD per il filesystem (si veda
677 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
678 \itindex{inode} l'\textit{inode}.
679
680 Per creare una fifo (un file speciale, su cui torneremo in dettaglio in
681 sez.~\ref{sec:ipc_named_pipe}) lo standard POSIX specifica l'uso della funzione
682 \funcd{mkfifo}, il cui prototipo è:
683 \begin{functions}
684   \headdecl{sys/types.h} \headdecl{sys/stat.h} 
685   
686   \funcdecl{int mkfifo(const char *pathname, mode\_t mode)} 
687   
688   Crea una fifo.
689   
690   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
691     errore, nel qual caso \var{errno} assumerà i valori \errval{EACCES},
692     \errval{EEXIST}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC},
693     \errval{ENOTDIR} e \errval{EROFS}.}
694 \end{functions}
695
696 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
697 per \func{mknod} il file \param{pathname} non deve esistere (neanche come link
698 simbolico); al solito i permessi specificati da \param{mode} vengono
699 modificati dal valore di \itindex{umask} \textit{umask}.
700
701
702
703 \subsection{Accesso alle directory}
704 \label{sec:file_dir_read}
705
706 Benché le directory alla fine non siano altro che dei file che contengono
707 delle liste di nomi ed \itindex{inode} \textit{inode}, per il ruolo che
708 rivestono nella struttura del sistema, non possono essere trattate come dei
709 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
710 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
711 può essere un processo a inserirvi direttamente delle voci con le usuali
712 funzioni di scrittura.
713
714 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
715 kernel, sono molte le situazioni in cui i processi necessitano di poterne
716 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
717 in sez.~\ref{sec:file_open} che è possibile aprire una directory come se fosse
718 un file, anche se solo in sola lettura) in generale il formato con cui esse
719 sono scritte può dipendere dal tipo di filesystem, tanto che, come riportato
720 in tab.~\ref{tab:file_file_operations}, il VFS del kernel prevede una apposita
721 funzione per la lettura delle directory.
722
723 Tutto questo si riflette nello standard POSIX\footnote{le funzioni sono
724   previste pure in BSD e SVID.} che ha introdotto una apposita interfaccia per
725 la lettura delle directory, basata sui cosiddetti \textit{directory stream}
726 (chiamati così per l'analogia con i file stream dell'interfaccia standard di
727 cap.~\ref{cha:files_std_interface}). La prima funzione di questa interfaccia è
728 \funcd{opendir}, il cui prototipo è:
729 \begin{functions}
730   \headdecl{sys/types.h} \headdecl{dirent.h} 
731   
732   \funcdecl{DIR * opendir(const char *dirname)} 
733   
734   Apre un \textit{directory stream}.
735   
736   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
737     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
738     assumerà i valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
739     \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}.}
740 \end{functions}
741
742 La funzione apre un \textit{directory stream} per la directory
743 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
744 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
745 \textit{directory stream}) da usare per tutte le operazioni successive, la
746 funzione inoltre posiziona lo stream sulla prima voce contenuta nella
747 directory.
748
749 Dato che le directory sono comunque dei file, in alcuni casi può servire
750 conoscere il \textit{file descriptor} associato ad un \textit{directory
751   stream}, a questo scopo si può usare la funzione \funcd{dirfd}, il cui
752 prototipo è:
753 \begin{functions}
754   \headdecl{sys/types.h} \headdecl{dirent.h} 
755   
756   \funcdecl{int dirfd(DIR * dir)} 
757   
758   Restituisce il file descriptor associato ad un \textit{directory stream}.
759   
760   \bodydesc{La funzione restituisce il file descriptor (un valore positivo) in
761     caso di successo e -1 in caso di errore.}
762 \end{functions}
763
764 La funzione\footnote{questa funzione è una estensione di BSD non presente in
765   POSIX, introdotta con BSD 4.3-Reno; è presente in Linux con le libc5 (a
766   partire dalla versione 5.1.2) e con le \acr{glibc}.} restituisce il file
767 descriptor associato al \textit{directory stream} \param{dir}, essa è
768 disponibile solo definendo \macro{\_BSD\_SOURCE} o \macro{\_SVID\_SOURCE}. Di
769 solito si utilizza questa funzione in abbinamento alla funzione \func{fchdir}
770 per cambiare la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}) a
771 quella relativa allo stream che si sta esaminando.
772
773 La lettura di una voce della directory viene effettuata attraverso la funzione
774 \funcd{readdir}; il suo prototipo è:
775 \begin{functions}
776   \headdecl{sys/types.h} \headdecl{dirent.h} 
777   
778   \funcdecl{struct dirent *readdir(DIR *dir)}
779   
780   Legge una voce dal \textit{directory stream}.
781   
782   \bodydesc{La funzione restituisce il puntatore alla struttura contenente i
783     dati in caso di successo e \val{NULL} altrimenti, in caso di descrittore
784     non valido \var{errno} assumerà il valore \errval{EBADF}, il valore
785     \val{NULL} viene restituito anche quando si raggiunge la fine dello
786     stream.}
787 \end{functions}
788
789 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
790 successiva.  I dati vengono memorizzati in una struttura \struct{dirent} (la
791 cui definizione\footnote{la definizione è quella usata a Linux, che si trova
792   nel file \file{/usr/include/bits/dirent.h}, essa non contempla la presenza
793   del campo \var{d\_namlen} che indica la lunghezza del nome del file (ed
794   infatti la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN} non è definita).}  è
795 riportata in fig.~\ref{fig:file_dirent_struct}). La funzione restituisce il
796 puntatore alla struttura; si tenga presente però che quest'ultima è allocata
797 staticamente, per cui viene sovrascritta tutte le volte che si ripete la
798 lettura di una voce sullo stesso stream.
799
800 Di questa funzione esiste anche una versione rientrante, \func{readdir\_r},
801 che non usa una struttura allocata staticamente, e può essere utilizzata anche
802 con i thread; il suo prototipo è:
803 \begin{functions}
804   \headdecl{sys/types.h} \headdecl{dirent.h} 
805   
806   \funcdecl{int readdir\_r(DIR *dir, struct dirent *entry,
807           struct dirent **result)}
808   
809   Legge una voce dal \textit{directory stream}.
810   
811   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
812     errore, gli errori sono gli stessi di \func{readdir}.}
813 \end{functions}
814
815 La funzione restituisce in \param{result} (come
816 \itindex{value~result~argument} \textit{value result argument}) l'indirizzo
817 dove sono stati salvati i dati, che di norma corrisponde a quello della
818 struttura precedentemente allocata e specificata dall'argomento \param{entry}
819 (anche se non è assicurato che la funzione usi lo spazio fornito dall'utente).
820
821 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
822 presenti nella directory; sia BSD che SVr4\footnote{lo standard POSIX prevede
823   invece solo la presenza del campo \var{d\_fileno}, identico \var{d\_ino},
824   che in Linux è definito come alias di quest'ultimo. Il campo \var{d\_name} è
825   considerato dipendente dall'implementazione.} prevedono che siano sempre
826 presenti il campo \var{d\_name}, che contiene il nome del file nella forma di
827 una stringa terminata da uno zero,\footnote{lo standard POSIX non specifica
828   una lunghezza, ma solo un limite \const{NAME\_MAX}; in SVr4 la lunghezza del
829   campo è definita come \code{NAME\_MAX+1} che di norma porta al valore di 256
830   byte usato anche in Linux.} ed il campo \var{d\_ino}, che contiene il numero
831 di \itindex{inode} \textit{inode} cui il file è associato (di solito
832 corrisponde al campo \var{st\_ino} di \struct{stat}).
833
834 \begin{figure}[!htb]
835   \footnotesize \centering
836   \begin{minipage}[c]{15cm}
837     \includestruct{listati/dirent.c}
838   \end{minipage} 
839   \normalsize 
840   \caption{La struttura \structd{dirent} per la lettura delle informazioni dei 
841     file.}
842   \label{fig:file_dirent_struct}
843 \end{figure}
844
845 La presenza di ulteriori campi opzionali è segnalata dalla definizione di
846 altrettante macro nella forma \code{\_DIRENT\_HAVE\_D\_XXX} dove \code{XXX} è
847 il nome del relativo campo; nel nostro caso sono definite le macro
848 \macro{\_DIRENT\_HAVE\_D\_TYPE}, \macro{\_DIRENT\_HAVE\_D\_OFF} e
849 \macro{\_DIRENT\_HAVE\_D\_RECLEN}.
850
851 \begin{table}[htb]
852   \centering
853   \footnotesize
854   \begin{tabular}[c]{|l|l|}
855     \hline
856     \textbf{Valore} & \textbf{Tipo di file} \\
857     \hline
858     \hline
859     \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
860     \const{DT\_REG}     & File normale.\\
861     \const{DT\_DIR}     & Directory.\\
862     \const{DT\_FIFO}    & Fifo.\\
863     \const{DT\_SOCK}    & Socket.\\
864     \const{DT\_CHR}     & Dispositivo a caratteri.\\
865     \const{DT\_BLK}     & Dispositivo a blocchi.\\
866     \hline    
867   \end{tabular}
868   \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
869     della struttura \struct{dirent}.}
870   \label{tab:file_dtype_macro}
871 \end{table}
872
873 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
874 indica il tipo di file (fifo, directory, link simbolico, ecc.); i suoi
875 possibili valori\footnote{fino alla versione 2.1 delle \acr{glibc} questo
876   campo, pur presente nella struttura, non era implementato, e resta sempre al
877   valore \const{DT\_UNKNOWN}.}  sono riportati in
878 tab.~\ref{tab:file_dtype_macro}; per la conversione da e verso l'analogo
879 valore mantenuto dentro il campo \var{st\_mode} di \struct{stat} sono definite
880 anche due macro di conversione \macro{IFTODT} e \macro{DTTOIF}:
881 \begin{functions}
882   \funcdecl{int IFTODT(mode\_t MODE)} Converte il tipo di file dal formato di
883   \var{st\_mode} a quello di \var{d\_type}.
884   
885   \funcdecl{mode\_t DTTOIF(int DTYPE)} Converte il tipo di file dal formato di
886   \var{d\_type} a quello di \var{st\_mode}.
887 \end{functions}
888
889 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
890 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
891 letta. Con questi due campi diventa possibile, determinando la posizione delle
892 varie voci, spostarsi all'interno dello stream usando la funzione
893 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
894   estensioni prese da BSD, non previste dallo standard POSIX.} il cui
895 prototipo è:
896 \begin{prototype}{dirent.h}{void seekdir(DIR *dir, off\_t offset)}
897   Cambia la posizione all'interno di un \textit{directory stream}.
898 \end{prototype}
899
900 La funzione non ritorna nulla e non segnala errori, è però necessario che il
901 valore dell'argomento \param{offset} sia valido per lo stream \param{dir};
902 esso pertanto deve essere stato ottenuto o dal valore di \var{d\_off} di
903 \struct{dirent} o dal valore restituito dalla funzione \funcd{telldir}, che
904 legge la posizione corrente; il prototipo di quest'ultima è:
905 \begin{prototype}{dirent.h}{off\_t telldir(DIR *dir)}
906   Ritorna la posizione corrente in un \textit{directory stream}.
907   
908   \bodydesc{La funzione restituisce la posizione corrente nello stream (un
909     numero positivo) in caso di successo, e -1 altrimenti, nel qual caso
910     \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
911     valore errato per \param{dir}.}
912 \end{prototype}
913
914 La sola funzione di posizionamento nello stream prevista dallo standard POSIX
915 è \funcd{rewinddir}, che riporta la posizione a quella iniziale; il suo
916 prototipo è:
917 \begin{functions}
918   \headdecl{sys/types.h} \headdecl{dirent.h} 
919   
920   \funcdecl{void rewinddir(DIR *dir)}
921   
922   Si posiziona all'inizio di un \textit{directory stream}.
923 \end{functions}
924
925
926 Una volta completate le operazioni si può chiudere il \textit{directory
927   stream} con la funzione \funcd{closedir}, il cui prototipo è:
928 \begin{functions}
929   \headdecl{sys/types.h} \headdecl{dirent.h} 
930   
931   \funcdecl{int closedir(DIR * dir)} 
932   
933   Chiude un \textit{directory stream}.
934   
935   \bodydesc{La funzione restituisce 0 in caso di successo e -1 altrimenti, nel
936     qual caso \var{errno} assume il valore \errval{EBADF}.}
937 \end{functions}
938
939 A parte queste funzioni di base in BSD 4.3 è stata introdotta un'altra
940 funzione che permette di eseguire una scansione completa (con tanto di ricerca
941 ed ordinamento) del contenuto di una directory; la funzione è
942 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
943   libc4.} ed il suo prototipo è:
944 \begin{prototype}{dirent.h}{int scandir(const char *dir, 
945     struct dirent ***namelist, int(*filter)(const struct dirent *),
946     int(*compar)(const struct dirent **, const struct dirent **))} 
947   
948   Esegue una scansione di un \textit{directory stream}.
949   
950   \bodydesc{La funzione restituisce in caso di successo il numero di voci
951     trovate, e -1 altrimenti.}
952 \end{prototype}
953
954 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
955 prototipo non è molto comprensibile; queste funzioni però sono quelle che
956 controllano rispettivamente la selezione di una voce (quella passata con
957 l'argomento \param{filter}) e l'ordinamento di tutte le voci selezionate
958 (quella specificata dell'argomento \param{compar}).
959
960 La funzione legge tutte le voci della directory indicata dall'argomento
961 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
962 \struct{dirent}) come argomento della funzione di selezione specificata da
963 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
964 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
965 Qualora si specifichi un valore \val{NULL} per l'argomento \func{filter} non
966 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
967
968 Le voci selezionate possono essere riordinate tramite \func{qsort}, le modalità
969 del riordinamento possono essere personalizzate usando la funzione
970 \param{compar} come criterio di ordinamento di \func{qsort}, la funzione
971 prende come argomenti le due strutture \struct{dirent} da confrontare
972 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
973 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
974 \struct{dirent} viene restituito nell'argomento
975 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
976   restituisce, come \itindex{value~result~argument} \textit{value result
977     argument}, l'indirizzo della stessa; questo significa che \param{namelist}
978   deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
979   si deve passare il suo indirizzo.}
980
981 Per l'ordinamento, vale a dire come valori possibili per l'argomento
982 \param{compar} sono disponibili due funzioni predefinite, \funcd{alphasort} e
983 \funcd{versionsort}, i cui prototipi sono:
984 \begin{functions}
985   \headdecl{dirent.h} 
986   
987   \funcdecl{int alphasort(const void *a, const void *b)} 
988
989   \funcdecl{int versionsort(const void *a, const void *b)} 
990   
991   Funzioni per l'ordinamento delle voci di \textit{directory stream}.
992   
993   \bodydesc{Le funzioni restituiscono un valore minore, uguale o maggiore di
994     zero qualora il primo argomento sia rispettivamente minore, uguale o
995     maggiore del secondo.}
996 \end{functions}
997
998 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
999 libc4\footnote{la versione delle libc4 e libc5 usa però come argomenti dei
1000   puntatori a delle strutture \struct{dirent}; le glibc usano il prototipo
1001   originario di BSD, mostrato anche nella definizione, che prevede puntatori a
1002   \ctyp{void}.}  e deve essere specificata come argomento \param{compare} per
1003 ottenere un ordinamento alfabetico (secondo il valore del campo \var{d\_name}
1004 delle varie voci). Le \acr{glibc} prevedono come estensione\footnote{le glibc,
1005   a partire dalla versione 2.1, effettuano anche l'ordinamento alfabetico
1006   tenendo conto delle varie localizzazioni, usando \func{strcoll} al posto di
1007   \func{strcmp}.} anche \func{versionsort}, che ordina i nomi tenendo conto
1008 del numero di versione (cioè qualcosa per cui \texttt{file10} viene comunque
1009 dopo \texttt{file4}.)
1010
1011 Un semplice esempio dell'uso di queste funzioni è riportato in
1012 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
1013 programma che, usando la funzione di scansione illustrata in
1014 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
1015 e la relativa dimensione (in sostanza una versione semplificata del comando
1016 \cmd{ls}).
1017
1018 \begin{figure}[!htb]
1019   \footnotesize \centering
1020   \begin{minipage}[c]{15.6cm}
1021     \includecodesample{listati/my_ls.c}
1022   \end{minipage}
1023   \caption{Esempio di codice per eseguire la lista dei file contenuti in una
1024     directory.} 
1025   \label{fig:file_my_ls}
1026 \end{figure}
1027
1028 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
1029 la parte di gestione delle opzioni (che prevede solo l'uso di una funzione per
1030 la stampa della sintassi, anch'essa omessa) ma il codice completo potrà essere
1031 trovato coi sorgenti allegati nel file \file{myls.c}.
1032
1033 In sostanza tutto quello che fa il programma, dopo aver controllato
1034 (\texttt{\small 10--13}) di avere almeno un argomento (che indicherà la
1035 directory da esaminare) è chiamare (\texttt{\small 14}) la funzione
1036 \func{DirScan} per eseguire la scansione, usando la funzione \code{do\_ls}
1037 (\texttt{\small 20--26}) per fare tutto il lavoro. 
1038
1039 Quest'ultima si limita (\texttt{\small 23}) a chiamare \func{stat} sul file
1040 indicato dalla directory entry passata come argomento (il cui nome è appunto
1041 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
1042 dati ad esso relativi, per poi provvedere (\texttt{\small 24}) a stampare il
1043 nome del file e la dimensione riportata in \var{data}.  
1044
1045 Dato che la funzione verrà chiamata all'interno di \func{DirScan} per ogni
1046 voce presente questo è sufficiente a stampare la lista completa dei file e
1047 delle relative dimensioni.  Si noti infine come si restituisca sempre 0 come
1048 valore di ritorno per indicare una esecuzione senza errori.
1049
1050 \begin{figure}[!htb]
1051   \footnotesize \centering
1052   \begin{minipage}[c]{15.6cm}
1053     \includecodesample{listati/DirScan.c}
1054   \end{minipage}
1055   \caption{Codice della funzione di scansione di una directory contenuta nel
1056     file \file{DirScan.c}.} 
1057   \label{fig:file_dirscan}
1058 \end{figure}
1059
1060 Tutto il grosso del lavoro è svolto dalla funzione \func{DirScan}, riportata
1061 in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e permette
1062 di eseguire una funzione, passata come secondo argomento, su tutte le voci di
1063 una directory.  La funzione inizia con l'aprire (\texttt{\small 19--23}) uno
1064 stream sulla directory passata come primo argomento, stampando un messaggio in
1065 caso di errore.
1066
1067 Il passo successivo (\texttt{\small 24--25}) è cambiare directory di lavoro
1068 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzione
1069 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
1070 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
1071 (\texttt{\small 27--31}) sulle singole voci dello stream ci si trovi
1072 all'interno della directory.\footnote{questo è essenziale al funzionamento
1073   della funzione \code{do\_ls} (e ad ogni funzione che debba usare il campo
1074   \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
1075   struttura \struct{dirent} sono sempre relativi alla directory in questione,
1076   e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
1077   ottenere le dimensioni.}
1078
1079 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
1080 alla funzione passata come secondo argomento, il ciclo di scansione della
1081 directory è molto semplice; si legge una voce alla volta (\texttt{\small 27})
1082 all'interno di una istruzione di \code{while} e fintanto che si riceve una
1083 voce valida (cioè un puntatore diverso da \val{NULL}) si esegue
1084 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
1085 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
1086   28}) qualora questa presenti una anomalia (identificata da un codice di
1087 ritorno negativo).
1088
1089 Una volta terminato il ciclo la funzione si conclude con la chiusura
1090 (\texttt{\small 32}) dello stream\footnote{nel nostro caso, uscendo subito
1091   dopo la chiamata, questo non servirebbe, in generale però l'operazione è
1092   necessaria, dato che la funzione può essere invocata molte volte all'interno
1093   dello stesso processo, per cui non chiudere gli stream comporterebbe un
1094   consumo progressivo di risorse, con conseguente rischio di esaurimento delle
1095   stesse} e la restituzione (\texttt{\small 33}) del codice di operazioni
1096 concluse con successo.
1097
1098
1099 \subsection{La directory di lavoro}
1100 \label{sec:file_work_dir}
1101
1102 \itindbeg{pathname}
1103
1104 A ciascun processo è associata una directory nel filesystem che è chiamata
1105 \textsl{directory corrente} o \textsl{directory di lavoro} (in inglese
1106 \textit{current working directory}) che è quella a cui si fa riferimento
1107 quando un \itindsub{pathname}{relativo}\textit{pathname} è espresso in forma
1108 relativa, dove il ``\textsl{relativa}'' fa riferimento appunto a questa
1109 directory.
1110
1111 Quando un utente effettua il login, questa directory viene impostata alla
1112 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
1113 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
1114 comando \cmd{pwd} la stampa sul terminale.  Siccome la directory corrente
1115 resta la stessa quando viene creato un processo figlio (vedi
1116 sez.~\ref{sec:proc_fork}), la directory corrente della shell diventa anche la
1117 directory corrente di qualunque comando da essa lanciato.
1118
1119 In genere il kernel tiene traccia per ciascun processo \itindex{inode}
1120 dell'\textit{inode} della directory di lavoro, per ottenere il
1121 \textit{pathname} occorre usare una apposita funzione di libreria,
1122 \funcd{getcwd}, il cui prototipo è:
1123 \begin{prototype}{unistd.h}{char *getcwd(char *buffer, size\_t size)}
1124   Legge il \textit{pathname} della directory di lavoro corrente.
1125   
1126   \bodydesc{La funzione restituisce il puntatore \param{buffer} se riesce,
1127     \val{NULL} se fallisce, in quest'ultimo caso la variabile
1128     \var{errno} è impostata con i seguenti codici di errore:
1129   \begin{errlist}
1130   \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
1131     è nullo.
1132   \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
1133     lunghezza del \textit{pathname}. 
1134   \item[\errcode{EACCES}] manca il permesso di lettura o di ricerca su uno dei
1135     componenti del \textit{pathname} (cioè su una delle directory superiori
1136     alla corrente).
1137   \end{errlist}}
1138 \end{prototype}
1139
1140 La funzione restituisce il \textit{pathname} completo della directory di
1141 lavoro nella stringa puntata da \param{buffer}, che deve essere
1142 precedentemente allocata, per una dimensione massima di \param{size}.  Il
1143 buffer deve essere sufficientemente lungo da poter contenere il
1144 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
1145 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
1146 un errore.
1147
1148 Si può anche specificare un puntatore nullo come
1149 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
1150   supportata da Linux.} nel qual caso la stringa sarà allocata automaticamente
1151 per una dimensione pari a \param{size} qualora questa sia diversa da zero, o
1152 della lunghezza esatta del \textit{pathname} altrimenti. In questo caso ci si
1153 deve ricordare di disallocare la stringa una volta cessato il suo utilizzo.
1154
1155 Di questa funzione esiste una versione \code{char *getwd(char *buffer)} fatta
1156 per compatibilità all'indietro con BSD, che non consente di specificare la
1157 dimensione del buffer; esso deve essere allocato in precedenza ed avere una
1158 dimensione superiore a \const{PATH\_MAX} (di solito 256 byte, vedi
1159 sez.~\ref{sec:sys_limits}); il problema è che in Linux non esiste una
1160 dimensione superiore per un \textit{pathname}, per cui non è detto che il
1161 buffer sia sufficiente a contenere il nome del file, e questa è la ragione
1162 principale per cui questa funzione è deprecata.
1163
1164 Una seconda funzione simile è \code{char *get\_current\_dir\_name(void)} che è
1165 sostanzialmente equivalente ad una \code{getcwd(NULL, 0)}, con la sola
1166 differenza che essa ritorna il valore della variabile di ambiente \val{PWD},
1167 che essendo costruita dalla shell può contenere un \textit{pathname}
1168 comprendente anche dei link simbolici. Usando \func{getcwd} infatti, essendo
1169 il \textit{pathname} ricavato risalendo all'indietro l'albero della directory,
1170 si perderebbe traccia di ogni passaggio attraverso eventuali link simbolici.
1171
1172 Per cambiare la directory di lavoro si può usare la funzione \funcd{chdir}
1173 (equivalente del comando di shell \cmd{cd}) il cui nome sta appunto per
1174 \textit{change directory}, il suo prototipo è:
1175 \begin{prototype}{unistd.h}{int chdir(const char *pathname)} 
1176   Cambia la directory di lavoro in \param{pathname}.
1177   
1178   \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
1179     nel qual caso \var{errno} assumerà i valori:
1180   \begin{errlist}
1181   \item[\errcode{ENOTDIR}] non si è specificata una directory.
1182   \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
1183     di \param{path}.
1184   \end{errlist}
1185   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1186   \errval{ENOMEM}, \errval{ELOOP} e \errval{EIO}.}
1187 \end{prototype}
1188 \noindent ed ovviamente \param{pathname} deve indicare una directory per la
1189 quale si hanno i permessi di accesso.
1190
1191 Dato che anche le directory sono file, è possibile riferirsi ad esse anche
1192 tramite il file descriptor, e non solo tramite il \textit{pathname}, per fare
1193 questo si usa \funcd{fchdir}, il cui prototipo è:
1194 \begin{prototype}{unistd.h}{int fchdir(int fd)} 
1195   Identica a \func{chdir}, ma usa il file descriptor \param{fd} invece del
1196   \textit{pathname}.
1197   
1198   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1199     errore, in caso di errore \var{errno} assumerà i valori \errval{EBADF} o
1200     \errval{EACCES}.}
1201 \end{prototype}
1202 \noindent anche in questo caso \param{fd} deve essere un file descriptor
1203 valido che fa riferimento ad una directory. Inoltre l'unico errore di accesso
1204 possibile (tutti gli altri sarebbero occorsi all'apertura di \param{fd}), è
1205 quello in cui il processo non ha il permesso di accesso alla directory
1206 specificata da \param{fd}.
1207
1208 \itindend{pathname}
1209
1210
1211
1212 \subsection{I file temporanei}
1213 \label{sec:file_temp_file}
1214
1215 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
1216 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
1217 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
1218 creare il file dopo aver controllato che questo non esista, nel momento fra il
1219 controllo e la creazione si ha giusto lo spazio per una possibile
1220 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
1221 sez.~\ref{sec:proc_race_cond}).
1222
1223 Le \acr{glibc} provvedono varie funzioni per generare nomi di file temporanei,
1224 di cui si abbia certezza di unicità (al momento della generazione); la prima
1225 di queste funzioni è \funcd{tmpnam} il cui prototipo è:
1226 \begin{prototype}{stdio.h}{char *tmpnam(char *string)}
1227   Restituisce il puntatore ad una stringa contente un nome di file valido e
1228   non esistente al momento dell'invocazione. 
1229
1230   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1231   \val{NULL} in caso di fallimento. Non sono definiti errori.}
1232 \end{prototype}
1233 \noindent se si è passato un puntatore \param{string} non nullo questo deve
1234 essere di dimensione \const{L\_tmpnam} (costante definita in \file{stdio.h},
1235 come \const{P\_tmpdir} e \const{TMP\_MAX}) ed il nome generato vi verrà
1236 copiato automaticamente; altrimenti il nome sarà generato in un buffer statico
1237 interno che verrà sovrascritto ad una chiamata successiva.  Successive
1238 invocazioni della funzione continueranno a restituire nomi unici fino ad un
1239 massimo di \const{TMP\_MAX} volte. Al nome viene automaticamente aggiunto come
1240 prefisso la directory specificata da \const{P\_tmpdir}.
1241
1242 Di questa funzione esiste una versione rientrante, \func{tmpnam\_r}, che non
1243 fa nulla quando si passa \val{NULL} come argomento. Una funzione simile,
1244 \funcd{tempnam}, permette di specificare un prefisso per il file
1245 esplicitamente, il suo prototipo è:
1246 \begin{prototype}{stdio.h}{char *tempnam(const char *dir, const char *pfx)}
1247   Restituisce il puntatore ad una stringa contente un nome di file valido e
1248   non esistente al momento dell'invocazione.
1249
1250   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1251   \val{NULL} in caso di fallimento, \var{errno} viene impostata a
1252   \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
1253 \end{prototype}
1254
1255 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
1256 per cui è sempre rientrante, occorre però ricordarsi di disallocare il
1257 puntatore che restituisce.  L'argomento \param{pfx} specifica un prefisso di
1258 massimo 5 caratteri per il nome provvisorio. La funzione assegna come
1259 directory per il file temporaneo (verificando che esista e sia accessibili),
1260 la prima valida delle seguenti:
1261 \begin{itemize*}
1262 \item La variabile di ambiente \const{TMPNAME} (non ha effetto se non è
1263   definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
1264   \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}).
1265 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}).
1266 \item Il valore della costante \const{P\_tmpdir}.
1267 \item la directory \file{/tmp}.
1268 \end{itemize*}
1269
1270 In ogni caso, anche se la generazione del nome è casuale, ed è molto difficile
1271 ottenere un nome duplicato, nulla assicura che un altro processo non possa
1272 avere creato, fra l'ottenimento del nome e l'apertura del file, un altro file
1273 con lo stesso nome; per questo motivo quando si usa il nome ottenuto da una di
1274 queste funzioni occorre sempre aprire il nuovo file in modalità di esclusione
1275 (cioè con l'opzione \const{O\_EXCL} per i file descriptor o con il flag
1276 \code{x} per gli stream) che fa fallire l'apertura in caso il file sia già
1277 esistente.
1278
1279 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
1280 POSIX definisce la funzione \funcd{tmpfile}, il cui prototipo è:
1281 \begin{prototype}{stdio.h}{FILE *tmpfile (void)}
1282   Restituisce un file temporaneo aperto in lettura/scrittura.
1283   
1284   \bodydesc{La funzione ritorna il puntatore allo stream associato al file
1285     temporaneo in caso di successo e \val{NULL} in caso di errore, nel qual
1286     caso \var{errno} assumerà i valori:
1287     \begin{errlist}
1288     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
1289     \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
1290     \end{errlist}
1291     ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
1292     \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES}.}
1293 \end{prototype}
1294 \noindent essa restituisce direttamente uno stream già aperto (in modalità
1295 \code{r+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso, che viene
1296 automaticamente cancellato alla sua chiusura o all'uscita dal programma. Lo
1297 standard non specifica in quale directory verrà aperto il file, ma le
1298 \acr{glibc} prima tentano con \const{P\_tmpdir} e poi con \file{/tmp}. Questa
1299 funzione è rientrante e non soffre di problemi di \itindex{race~condition}
1300 \textit{race condition}.
1301
1302 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
1303 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
1304 modificano una stringa di input che serve da modello e che deve essere
1305 conclusa da 6 caratteri \code{X} che verranno sostituiti da un codice
1306 unico. La prima delle due è analoga a \func{tmpnam} e genera un nome casuale,
1307 il suo prototipo è:
1308 \begin{prototype}{stlib.h}{char *mktemp(char *template)}
1309   Genera un filename univoco sostituendo le \code{XXXXXX} finali di
1310   \param{template}.
1311   
1312   \bodydesc{La funzione ritorna il puntatore \param{template} in caso di
1313     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1314     assumerà i valori:
1315     \begin{errlist}
1316     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1317     \end{errlist}}
1318 \end{prototype}
1319 \noindent dato che \param{template} deve poter essere modificata dalla
1320 funzione non si può usare una stringa costante.  Tutte le avvertenze riguardo
1321 alle possibili \itindex{race~condition} \textit{race condition} date per
1322 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
1323 il valore usato per sostituire le \code{XXXXXX} viene formato con il \acr{pid}
1324 del processo più una lettera, il che mette a disposizione solo 26 possibilità
1325 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
1326 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
1327 usata.
1328
1329 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
1330 \func{tmpfile}, ma restituisce un file descriptor invece di uno stream; il suo
1331 prototipo è:
1332 \begin{prototype}{stlib.h}{int mkstemp(char *template)}
1333   Genera un file temporaneo con un nome ottenuto sostituendo le \code{XXXXXX}
1334   finali di \param{template}.
1335   
1336   \bodydesc{La funzione ritorna il file descriptor in caso successo e
1337     -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
1338     \begin{errlist}
1339     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1340     \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
1341       contenuto di \param{template} è indefinito.
1342     \end{errlist}}
1343 \end{prototype}
1344 \noindent come per \func{mktemp} anche in questo caso \param{template} non può
1345 essere una stringa costante. La funzione apre un file in lettura/scrittura con
1346 la funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
1347 sez.~\ref{sec:file_open}), in questo modo al ritorno della funzione si ha la
1348 certezza di essere i soli utenti del file. I permessi sono impostati al valore
1349 \code{0600}\footnote{questo è vero a partire dalle \acr{glibc} 2.0.7, le
1350   versioni precedenti delle \acr{glibc} e le vecchie \acr{libc5} e \acr{libc4}
1351   usavano il valore \code{0666} che permetteva a chiunque di leggere i
1352   contenuti del file.} (si veda sez.~\ref{sec:file_perm_overview}).
1353
1354 In OpenBSD è stata introdotta un'altra funzione\footnote{introdotta anche in
1355   Linux a partire dalle \acr{glibc} 2.1.91.} simile alle precedenti,
1356 \funcd{mkdtemp}, che crea una directory temporanea; il suo prototipo è:
1357 \begin{prototype}{stlib.h}{char *mkdtemp(char *template)}
1358   Genera una directory temporaneo il cui nome è ottenuto sostituendo le
1359   \code{XXXXXX} finali di \param{template}.
1360   
1361   \bodydesc{La funzione ritorna il puntatore al nome della directory in caso
1362     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1363     assumerà i valori:
1364     \begin{errlist}
1365     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1366     \end{errlist}
1367     più gli altri eventuali codici di errore di \func{mkdir}.}
1368 \end{prototype}
1369 \noindent la directory è creata con permessi \code{0700} (al solito si veda
1370 cap.~\ref{cha:file_unix_interface} per i dettagli); dato che la creazione
1371 della directory è sempre esclusiva i precedenti problemi di
1372 \itindex{race~condition} \textit{race condition} non si pongono.
1373
1374
1375 \section{La manipolazione delle caratteristiche dei file}
1376 \label{sec:file_infos}
1377
1378 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
1379 relative alle caratteristiche di ciascun file, a partire dalle informazioni
1380 relative al controllo di accesso, sono mantenute \itindex{inode}
1381 nell'\textit{inode}.
1382
1383 Vedremo in questa sezione come sia possibile leggere tutte queste informazioni
1384 usando la funzione \func{stat}, che permette l'accesso a tutti i dati
1385 memorizzati \itindex{inode} nell'\textit{inode}; esamineremo poi le varie
1386 funzioni usate per manipolare tutte queste informazioni (eccetto quelle che
1387 riguardano la gestione del controllo di accesso, trattate in in
1388 sez.~\ref{sec:file_access_control}).
1389
1390
1391 \subsection{La lettura delle caratteristiche dei file}
1392 \label{sec:file_stat}
1393
1394 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
1395 delle funzioni \func{stat} (\funcd{stat}, \funcd{fstat} e \funcd{lstat});
1396 questa è la funzione che ad esempio usa il comando \cmd{ls} per poter ottenere
1397 e mostrare tutti i dati relativi ad un file. I prototipi di queste funzioni
1398 sono i seguenti:
1399 \begin{functions}
1400   \headdecl{sys/types.h} 
1401   \headdecl{sys/stat.h} 
1402   \headdecl{unistd.h}
1403
1404   \funcdecl{int stat(const char *file\_name, struct stat *buf)} Legge le
1405   informazione del file specificato da \param{file\_name} e le inserisce in
1406   \param{buf}.
1407   
1408   \funcdecl{int lstat(const char *file\_name, struct stat *buf)} Identica a
1409   \func{stat} eccetto che se il \param{file\_name} è un link simbolico vengono
1410   lette le informazioni relative ad esso e non al file a cui fa riferimento.
1411   
1412   \funcdecl{int fstat(int filedes, struct stat *buf)} Identica a \func{stat}
1413   eccetto che si usa con un file aperto, specificato tramite il suo file
1414   descriptor \param{filedes}.
1415   
1416   \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
1417     errore, nel qual caso \var{errno} assumerà uno dei valori: \errval{EBADF},
1418     \errval{ENOENT}, \errval{ENOTDIR}, \errval{ELOOP}, \errval{EFAULT},
1419     \errval{EACCES}, \errval{ENOMEM}, \errval{ENAMETOOLONG}.}
1420 \end{functions}
1421 \noindent il loro comportamento è identico, solo che operano rispettivamente
1422 su un file, su un link simbolico e su un file descriptor.
1423
1424 La struttura \struct{stat} usata da queste funzioni è definita nell'header
1425 \file{sys/stat.h} e in generale dipende dall'implementazione; la versione
1426 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
1427 riportata dalla pagina di manuale di \func{stat} (in realtà la definizione
1428 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
1429 riservati per estensioni come tempi più precisi, o per il padding dei campi).
1430
1431 \begin{figure}[!htb]
1432   \footnotesize
1433   \centering
1434   \begin{minipage}[c]{15cm}
1435     \includestruct{listati/stat.h}
1436   \end{minipage} 
1437   \normalsize 
1438   \caption{La struttura \structd{stat} per la lettura delle informazioni dei 
1439     file.}
1440   \label{fig:file_stat_struct}
1441 \end{figure}
1442
1443 Si noti come i vari membri della struttura siano specificati come tipi
1444 primitivi del sistema (di quelli definiti in
1445 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \file{sys/types.h}).
1446
1447 % TODO: aggiornare con i cambiamenti ai tempi fatti con il 2.6
1448
1449 \subsection{I tipi di file}
1450 \label{sec:file_types}
1451
1452 Come riportato in tab.~\ref{tab:file_file_types} in Linux oltre ai file e alle
1453 directory esistono altri oggetti che possono stare su un filesystem.  Il tipo
1454 di file è ritornato dalla funzione \func{stat} come maschera binaria nel campo
1455 \var{st\_mode} (che contiene anche le informazioni relative ai permessi) di
1456 una struttura \struct{stat}.
1457
1458 Dato che il valore numerico può variare a seconda delle implementazioni, lo
1459 standard POSIX definisce un insieme di macro per verificare il tipo di file,
1460 queste vengono usate anche da Linux che supporta pure le estensioni allo
1461 standard per i link simbolici e i socket definite da BSD; l'elenco completo
1462 delle macro con cui è possibile estrarre l'informazione da \var{st\_mode} è
1463 riportato in tab.~\ref{tab:file_type_macro}.
1464 \begin{table}[htb]
1465   \centering
1466   \footnotesize
1467   \begin{tabular}[c]{|l|l|}
1468     \hline
1469     \textbf{Macro} & \textbf{Tipo del file} \\
1470     \hline
1471     \hline
1472     \macro{S\_ISREG(m)}  & file normale.\\
1473     \macro{S\_ISDIR(m)}  & directory.\\
1474     \macro{S\_ISCHR(m)}  & dispositivo a caratteri.\\
1475     \macro{S\_ISBLK(m)}  & dispositivo a blocchi.\\
1476     \macro{S\_ISFIFO(m)} & fifo.\\
1477     \macro{S\_ISLNK(m)}  & link simbolico.\\
1478     \macro{S\_ISSOCK(m)} & socket.\\
1479     \hline    
1480   \end{tabular}
1481   \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h}).}
1482   \label{tab:file_type_macro}
1483 \end{table}
1484
1485 Oltre alle macro di tab.~\ref{tab:file_type_macro} è possibile usare
1486 direttamente il valore di \var{st\_mode} per ricavare il tipo di file
1487 controllando direttamente i vari bit in esso memorizzati. Per questo sempre in
1488 \file{sys/stat.h} sono definite le costanti numeriche riportate in
1489 tab.~\ref{tab:file_mode_flags}.
1490
1491 Il primo valore dell'elenco di tab.~\ref{tab:file_mode_flags} è la maschera
1492 binaria che permette di estrarre i bit nei quali viene memorizzato il tipo di
1493 file, i valori successivi sono le costanti corrispondenti ai singoli bit, e
1494 possono essere usati per effettuare la selezione sul tipo di file voluto, con
1495 un'opportuna combinazione.
1496
1497 \begin{table}[htb]
1498   \centering
1499   \footnotesize
1500   \begin{tabular}[c]{|l|c|l|}
1501     \hline
1502     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
1503     \hline
1504     \hline
1505     \const{S\_IFMT}   &  0170000 & Maschera per i bit del tipo di file.\\
1506     \const{S\_IFSOCK} &  0140000 & Socket.\\
1507     \const{S\_IFLNK}  &  0120000 & Link simbolico.\\
1508     \const{S\_IFREG}  &  0100000 & File regolare.\\ 
1509     \const{S\_IFBLK}  &  0060000 & Dispositivo a blocchi.\\
1510     \const{S\_IFDIR}  &  0040000 & Directory.\\
1511     \const{S\_IFCHR}  &  0020000 & Dispositivo a caratteri.\\
1512     \const{S\_IFIFO}  &  0010000 & Fifo.\\
1513     \hline
1514     \const{S\_ISUID}  &  0004000 & Set UID bit \itindex{suid~bit}.\\
1515     \const{S\_ISGID}  &  0002000 & Set GID bit \itindex{sgid~bit}.\\
1516     \const{S\_ISVTX}  &  0001000 & Sticky bit \itindex{sticky~bit}.\\
1517     \hline
1518 %    \const{S\_IRWXU}  &  00700   & Bitmask per i permessi del proprietario.\\
1519     \const{S\_IRUSR}  &  00400   & Il proprietario ha permesso di lettura.\\
1520     \const{S\_IWUSR}  &  00200   & Il proprietario ha permesso di scrittura.\\
1521     \const{S\_IXUSR}  &  00100   & Il proprietario ha permesso di esecuzione.\\
1522     \hline
1523 %    \const{S\_IRWXG}  &  00070   & Bitmask per i permessi del gruppo.\\
1524     \const{S\_IRGRP}  &  00040   & Il gruppo ha permesso di lettura.\\
1525     \const{S\_IWGRP}  &  00020   & Il gruppo ha permesso di scrittura.\\
1526     \const{S\_IXGRP}  &  00010   & Il gruppo ha permesso di esecuzione.\\
1527     \hline
1528 %    \const{S\_IRWXO}  &  00007   & Bitmask per i permessi di tutti gli altri\\
1529     \const{S\_IROTH}  &  00004   & Gli altri hanno permesso di lettura.\\
1530     \const{S\_IWOTH}  &  00002   & Gli altri hanno permesso di esecuzione.\\
1531     \const{S\_IXOTH}  &  00001   & Gli altri hanno permesso di esecuzione.\\
1532     \hline    
1533   \end{tabular}
1534   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
1535     \var{st\_mode} (definite in \file{sys/stat.h}).}
1536   \label{tab:file_mode_flags}
1537 \end{table}
1538
1539 Ad esempio se si volesse impostare una condizione che permetta di controllare
1540 se un file è una directory o un file ordinario si potrebbe definire la macro
1541 di preprocessore:
1542 \includecodesnip{listati/is_file_dir.h}
1543 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
1544 poi si effettua il confronto con la combinazione di tipi scelta.
1545
1546
1547 \subsection{Le dimensioni dei file}
1548 \label{sec:file_file_size}
1549
1550 Il campo \var{st\_size} di una struttura \struct{stat} contiene la dimensione
1551 del file in byte, se si tratta di un file regolare. Nel caso di un link
1552 simbolico la dimensione è quella del \itindex{pathname} \textit{pathname} che
1553 il link stesso contiene; per le fifo questo campo è sempre nullo.
1554
1555 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
1556 byte. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
1557 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
1558 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
1559 dimensione inferiore sarebbe inefficiente.
1560
1561 Si tenga conto che la lunghezza del file riportata in \var{st\_size} non è
1562 detto che corrisponda all'occupazione dello spazio su disco per via della
1563 possibile esistenza dei cosiddetti \textit{holes} (letteralmente
1564 \textsl{buchi}) che si formano tutte le volte che si va a scrivere su un file
1565 dopo aver eseguito una \func{lseek} (vedi sez.~\ref{sec:file_lseek}) oltre la
1566 sua fine.
1567
1568 In questo caso si avranno risultati differenti a seconda del modo in cui si
1569 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
1570 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
1571 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
1572 caso per le parti non scritte vengono restituiti degli zeri, si avrà lo stesso
1573 risultato di \cmd{ls}.
1574
1575 Se è sempre possibile allargare un file, scrivendoci sopra od usando la
1576 funzione \func{lseek} per spostarsi oltre la sua fine, esistono anche casi in
1577 cui si può avere bisogno di effettuare un troncamento, scartando i dati
1578 presenti al di là della dimensione scelta come nuova fine del file.
1579
1580 Un file può sempre essere troncato a zero aprendolo con il flag
1581 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
1582 dimensione si possono usare le due funzioni \funcd{truncate} e
1583 \funcd{ftruncate}, i cui prototipi sono:
1584 \begin{functions}
1585   \headdecl{unistd.h} \funcdecl{int truncate(const char *file\_name, off\_t
1586     length)} Fa si che la dimensione del file \param{file\_name} sia troncata
1587   ad un valore massimo specificato da \param{lenght}.
1588   
1589   \funcdecl{int ftruncate(int fd, off\_t length))} Identica a \func{truncate}
1590   eccetto che si usa con un file aperto, specificato tramite il suo file
1591   descriptor \param{fd}.
1592   
1593   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per un
1594     errore, nel qual caso \var{errno} viene impostata opportunamente; per
1595     \func{ftruncate} si hanno i valori:
1596   \begin{errlist}
1597   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
1598   \item[\errcode{EINVAL}] \param{fd} è un riferimento ad un socket, non a un
1599     file o non è aperto in scrittura.
1600   \end{errlist}
1601   per \func{truncate} si hanno:
1602   \begin{errlist}
1603   \item[\errcode{EACCES}] il file non ha permesso di scrittura o non si ha il
1604     permesso di esecuzione una delle directory del \itindex{pathname}
1605     \textit{pathname}.
1606   \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
1607   \end{errlist}
1608   ed anche \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1609   \errval{EROFS}, \errval{EIO}, \errval{EFAULT}, \errval{ELOOP}.}
1610 \end{functions}
1611
1612 Se il file è più lungo della lunghezza specificata i dati in eccesso saranno
1613 perduti; il comportamento in caso di lunghezza inferiore non è specificato e
1614 dipende dall'implementazione: il file può essere lasciato invariato o esteso
1615 fino alla lunghezza scelta; in quest'ultimo caso lo spazio viene riempito con
1616 zeri (e in genere si ha la creazione di un \textit{hole} nel file).
1617
1618
1619 \subsection{I tempi dei file}
1620 \label{sec:file_file_times}
1621
1622 Il sistema mantiene per ciascun file tre tempi. Questi sono registrati
1623 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del file e
1624 possono essere letti tramite la funzione \func{stat}, che li restituisce
1625 attraverso tre campi della struttura \struct{stat} di
1626 fig.~\ref{fig:file_stat_struct}. Il significato di detti tempi e dei relativi
1627 campi è riportato nello schema in tab.~\ref{tab:file_file_times}, dove è anche
1628 riportato un esempio delle funzioni che effettuano cambiamenti su di essi.
1629
1630 \begin{table}[htb]
1631   \centering
1632   \footnotesize
1633   \begin{tabular}[c]{|c|l|l|c|}
1634     \hline
1635     \textbf{Membro} & \textbf{Significato} & \textbf{Funzione} 
1636     & \textbf{Opzione di \cmd{ls}} \\
1637     \hline
1638     \hline
1639     \var{st\_atime}& ultimo accesso ai dati del file    &
1640                      \func{read}, \func{utime}          & \cmd{-u}\\
1641     \var{st\_mtime}& ultima modifica ai dati del file   &
1642                      \func{write}, \func{utime}         & default\\
1643     \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
1644                      \func{chmod}, \func{utime}         & \cmd{-c}\\
1645     \hline
1646   \end{tabular}
1647   \caption{I tre tempi associati a ciascun file.}
1648   \label{tab:file_file_times}
1649 \end{table}
1650
1651 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
1652 modifica (il \textit{modification time} \var{st\_mtime}) e il tempo di
1653 cambiamento di stato (il \textit{change time} \var{st\_ctime}). Il primo
1654 infatti fa riferimento ad una modifica del contenuto di un file, mentre il
1655 secondo ad una modifica \itindex{inode} dell'\textit{inode}; siccome esistono
1656 molte operazioni (come la funzione \func{link} e molte altre che vedremo in
1657 seguito) che modificano solo le informazioni contenute \itindex{inode}
1658 nell'\textit{inode} senza toccare il contenuto del file, diventa necessario
1659 l'utilizzo di un altro tempo.
1660
1661 Il sistema non tiene conto dell'ultimo accesso \itindex{inode}
1662 all'\textit{inode}, pertanto funzioni come \func{access} o \func{stat} non
1663 hanno alcuna influenza sui tre tempi. Il tempo di ultimo accesso (ai dati)
1664 viene di solito usato per cancellare i file che non servono più dopo un certo
1665 lasso di tempo (ad esempio il programma \cmd{leafnode} cancella i vecchi
1666 articoli sulla base di questo tempo).
1667
1668 \begin{table}[htb]
1669   \centering
1670   \footnotesize
1671   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
1672     \hline
1673     \multicolumn{1}{|p{3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
1674     \multicolumn{3}{|p{3.6cm}|}{\centering{
1675         \textbf{File o directory del riferimento}}}&
1676     \multicolumn{3}{|p{3.6cm}|}{\centering{
1677         \textbf{Directory contenente il riferimento}}} 
1678     &\multicolumn{1}{|p{3.6cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
1679     \cline{2-7}
1680     \cline{2-7}
1681     \multicolumn{1}{|p{3cm}|}{} 
1682     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1683     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1684     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1685     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1686     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1687     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1688     &\multicolumn{1}{|p{3cm}|}{} \\
1689     \hline
1690     \hline
1691     \func{chmod}, \func{fchmod} 
1692              & --      & --      &$\bullet$& --      & --      & --      &\\
1693     \func{chown}, \func{fchown} 
1694              & --      & --      &$\bullet$& --      & --      & --      &\\
1695     \func{creat}  
1696              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&  
1697              con \const{O\_CREATE} \\
1698     \func{creat}  
1699              & --      &$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&   
1700              con \const{O\_TRUNC} \\
1701     \func{exec}  
1702              &$\bullet$& --      & --      & --      & --      & --      &\\
1703     \func{lchown}  
1704              & --      & --      &$\bullet$& --      & --      & --      &\\
1705     \func{link}
1706              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
1707     \func{mkdir}
1708              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
1709     \func{mkfifo}
1710              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
1711     \func{open}
1712              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$& 
1713              con \const{O\_CREATE} \\
1714     \func{open}
1715              & --      &$\bullet$&$\bullet$& --      & --      & --      & 
1716              con \const{O\_TRUNC}  \\
1717     \func{pipe}
1718              &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
1719     \func{read}
1720              &$\bullet$& --      & --      & --      & --      & --      &\\
1721     \func{remove}
1722              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
1723              se esegue \func{unlink}\\
1724     \func{remove}
1725               & --      & --      & --      & --      &$\bullet$&$\bullet$& 
1726               se esegue \func{rmdir}\\
1727     \func{rename}
1728               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
1729               per entrambi gli argomenti\\
1730     \func{rmdir}
1731               & --      & --      & --      & --      &$\bullet$&$\bullet$&\\ 
1732     \func{truncate}, \func{ftruncate}
1733               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
1734     \func{unlink}
1735               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\ 
1736     \func{utime}
1737               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\ 
1738     \func{write}
1739               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
1740     \hline
1741   \end{tabular}
1742   \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo 
1743     accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento
1744     \textsl{(c)} dalle varie funzioni operanti su file e directory.}
1745   \label{tab:file_times_effects}  
1746 \end{table}
1747
1748
1749 Il tempo di ultima modifica invece viene usato da \cmd{make} per decidere
1750 quali file necessitano di essere ricompilati o (talvolta insieme anche al
1751 tempo di cambiamento di stato) per decidere quali file devono essere
1752 archiviati per il backup. Il comando \cmd{ls} (quando usato con le opzioni
1753 \cmd{-l} o \cmd{-t}) mostra i tempi dei file secondo lo schema riportato
1754 nell'ultima colonna di tab.~\ref{tab:file_file_times}.
1755
1756 L'effetto delle varie funzioni di manipolazione dei file sui tempi è
1757 illustrato in tab.~\ref{tab:file_times_effects}. Si sono riportati gli effetti
1758 sia per il file a cui si fa riferimento, sia per la directory che lo contiene;
1759 questi ultimi possono essere capiti se si tiene conto di quanto già detto, e
1760 cioè che anche le directory sono file (che contengono una lista di nomi) che
1761 il sistema tratta in maniera del tutto analoga a tutti gli altri.
1762
1763 Per questo motivo tutte le volte che compiremo un'operazione su un file che
1764 comporta una modifica del nome contenuto nella directory, andremo anche a
1765 scrivere sulla directory che lo contiene cambiandone il tempo di modifica. Un
1766 esempio di questo può essere la cancellazione di un file, invece leggere o
1767 scrivere o cambiare i permessi di un file ha effetti solo sui tempi di
1768 quest'ultimo.
1769
1770 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
1771 creazione del file, usato in molti altri sistemi operativi, ma che in Unix non
1772 esiste. Per questo motivo quando si copia un file, a meno di preservare
1773 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
1774 avrà sempre il tempo corrente come data di ultima modifica.
1775
1776 I tempi di ultimo accesso e modifica possono essere cambiati usando la
1777 funzione \funcd{utime}, il cui prototipo è:
1778 \begin{prototype}{utime.h}
1779 {int utime(const char *filename, struct utimbuf *times)} 
1780
1781 Cambia i tempi di ultimo accesso e modifica \itindex{inode}
1782 dell'\textit{inode} specificato da \param{filename} secondo i campi
1783 \var{actime} e \var{modtime} di \param{times}. Se questa è \val{NULL} allora
1784 viene usato il tempo corrente.
1785
1786 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1787   errore, nel qual caso \var{errno} assumerà uno dei valori:
1788   \begin{errlist}
1789   \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
1790   \item[\errcode{ENOENT}] \param{filename} non esiste.
1791   \end{errlist}}
1792 \end{prototype}
1793
1794 La funzione prende come argomento \param{times} una struttura
1795 \struct{utimbuf}, la cui definizione è riportata in
1796 fig.~\ref{fig:struct_utimebuf}, con la quale si possono specificare i nuovi
1797 valori che si vogliono impostare per tempi.
1798
1799 \begin{figure}[!htb]
1800   \footnotesize \centering
1801   \begin{minipage}[c]{15cm}
1802     \includestruct{listati/utimbuf.h}
1803   \end{minipage} 
1804   \normalsize 
1805   \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
1806     i tempi dei file.}
1807   \label{fig:struct_utimebuf}
1808 \end{figure}
1809
1810 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
1811 cosa è l'argomento \param{times}; se è \val{NULL} la funzione imposta il
1812 tempo corrente ed è sufficiente avere accesso in scrittura al file; se invece
1813 si è specificato un valore la funzione avrà successo solo se si è proprietari
1814 del file (o si hanno i privilegi di amministratore).
1815
1816 Si tenga presente che non è comunque possibile specificare il tempo di
1817 cambiamento di stato del file, che viene comunque cambiato dal kernel tutte le
1818 volte che si modifica \itindex{inode} l'\textit{inode} (quindi anche alla
1819 chiamata di \func{utime}).  Questo serve anche come misura di sicurezza per
1820 evitare che si possa modificare un file nascondendo completamente le proprie
1821 tracce.  In realtà la cosa resta possibile, se si è in grado di accedere al
1822 file di dispositivo, scrivendo direttamente sul disco senza passare attraverso
1823 il filesystem, ma ovviamente in questo modo la cosa è molto più complicata da
1824 realizzare.
1825
1826
1827
1828 \section{Il controllo di accesso ai file}
1829 \label{sec:file_access_control}
1830
1831 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
1832 del controllo di accesso ai file, che viene implementato per qualunque
1833 filesystem standard.\footnote{per standard si intende che implementa le
1834   caratteristiche previste dallo standard POSIX; in Linux sono disponibili
1835   anche una serie di altri filesystem, come quelli di Windows e del Mac, che
1836   non supportano queste caratteristiche.} In questa sezione ne esamineremo i
1837 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
1838
1839
1840 \subsection{I permessi per l'accesso ai file}
1841 \label{sec:file_perm_overview}
1842
1843 Ad ogni file Linux associa sempre l'utente che ne è proprietario (il
1844 cosiddetto \textit{owner}) ed un gruppo di appartenenza, secondo il meccanismo
1845 degli identificatori di utente e gruppo (\acr{uid} e \acr{gid}). Questi valori
1846 sono accessibili da programma tramite la funzione \func{stat}, e sono
1847 mantenuti nei campi \var{st\_uid} e \var{st\_gid} della struttura
1848 \struct{stat} (si veda sez.~\ref{sec:file_stat}).\footnote{questo è vero solo
1849   per filesystem di tipo Unix, ad esempio non è vero per il filesystem vfat di
1850   Windows, che non fornisce nessun supporto per l'accesso multiutente, e per
1851   il quale i permessi vengono assegnati in maniera fissa con un opzione in
1852   fase di montaggio.}
1853
1854 Il controllo di accesso ai file segue un modello abbastanza semplice che
1855 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
1856 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
1857     Control List} che sono state aggiunte ai filesystem standard con opportune
1858   estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
1859   controllo ancora più sofisticati come il \textit{mandatory access control}
1860   di SE-Linux.} ma nella maggior parte dei casi il meccanismo standard è più
1861 che sufficiente a soddisfare tutte le necessità più comuni.  I tre permessi di
1862 base associati ad ogni file sono:
1863 \begin{itemize*}
1864 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
1865   \textit{read}).
1866 \item il permesso di scrittura (indicato con la lettera \texttt{w},
1867   dall'inglese \textit{write}).
1868 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
1869   dall'inglese \textit{execute}).
1870 \end{itemize*}
1871 mentre i tre livelli su cui sono divisi i privilegi sono:
1872 \begin{itemize*}
1873 \item i privilegi per l'utente proprietario del file.
1874 \item i privilegi per un qualunque utente faccia parte del gruppo cui
1875   appartiene il file.
1876 \item i privilegi per tutti gli altri utenti.
1877 \end{itemize*}
1878
1879 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
1880 meno significativi sono usati a gruppi di tre per indicare i permessi base di
1881 lettura, scrittura ed esecuzione e sono applicati rispettivamente
1882 rispettivamente al proprietario, al gruppo, a tutti gli altri.
1883
1884 \begin{figure}[htb]
1885   \centering
1886   \includegraphics[width=6cm]{img/fileperm}
1887   \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
1888     contenuti nel campo \var{st\_mode} di \struct{stat}.}
1889   \label{fig:file_perm_bit}
1890 \end{figure}
1891
1892 I restanti tre bit (noti come \itindex{suid~bit} \textit{suid bit},
1893 \itindex{sgid~bit} \textit{sgid bit}, e \itindex{sticky~bit} \textit{sticky
1894   bit}) sono usati per indicare alcune caratteristiche più complesse del
1895 meccanismo del controllo di accesso su cui torneremo in seguito (in
1896 sez.~\ref{sec:file_special_perm}); lo schema di allocazione dei bit è
1897 riportato in fig.~\ref{fig:file_perm_bit}.
1898
1899 Anche i permessi, come tutte le altre informazioni pertinenti al file, sono
1900 memorizzati \itindex{inode} nell'\textit{inode}; in particolare essi sono
1901 contenuti in alcuni bit del campo \var{st\_mode} della struttura \struct{stat}
1902 (si veda di nuovo fig.~\ref{fig:file_stat_struct}).
1903
1904 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
1905 \cmd{u} (per \textit{user}), \cmd{g} (per \textit{group}) e \cmd{o} (per
1906 \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti insieme
1907 si usa la lettera \cmd{a} (per \textit{all}). Si tenga ben presente questa
1908 distinzione dato che in certi casi, mutuando la terminologia in uso nel VMS,
1909 si parla dei permessi base come di permessi per \textit{owner}, \textit{group}
1910 ed \textit{all}, le cui iniziali possono dar luogo a confusione.  Le costanti
1911 che permettono di accedere al valore numerico di questi bit nel campo
1912 \var{st\_mode} sono riportate in tab.~\ref{tab:file_bit_perm}.
1913
1914 \begin{table}[htb]
1915   \centering
1916     \footnotesize
1917   \begin{tabular}[c]{|c|l|}
1918     \hline
1919     \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
1920     \hline 
1921     \hline 
1922     \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
1923     \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
1924     \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\ 
1925     \hline            
1926     \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
1927     \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
1928     \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
1929     \hline            
1930     \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
1931     \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
1932     \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
1933     \hline              
1934   \end{tabular}
1935   \caption{I bit dei permessi di accesso ai file, come definiti in 
1936     \texttt{<sys/stat.h>}}
1937   \label{tab:file_bit_perm}
1938 \end{table}
1939
1940 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
1941 che si riferiscano a dei file, dei link simbolici o delle directory; qui ci
1942 limiteremo ad un riassunto delle regole generali, entrando nei dettagli più
1943 avanti.
1944
1945 La prima regola è che per poter accedere ad un file attraverso il suo
1946 \itindex{pathname} \textit{pathname} occorre il permesso di esecuzione in
1947 ciascuna delle directory che compongono il \textit{pathname}; lo stesso vale
1948 per aprire un file nella directory corrente (per la quale appunto serve il
1949 diritto di esecuzione).
1950
1951 Per una directory infatti il permesso di esecuzione significa che essa può
1952 essere attraversata nella risoluzione del \itindex{pathname}
1953 \textit{pathname}, ed è distinto dal permesso di lettura che invece implica
1954 che si può leggere il contenuto della directory.
1955
1956 Questo significa che se si ha il permesso di esecuzione senza permesso di
1957 lettura si potrà lo stesso aprire un file in una directory (se si hanno i
1958 permessi opportuni per il medesimo) ma non si potrà vederlo con \cmd{ls}
1959 (mentre per crearlo occorrerà anche il permesso di scrittura per la
1960 directory).
1961
1962 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
1963 (si veda quanto riportato in tab.~\ref{tab:file_open_flags}) di sola lettura o
1964 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
1965 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
1966 il contenuto, lo stesso permesso è necessario per poter troncare il file.
1967
1968 Non si può creare un file fintanto che non si disponga del permesso di
1969 esecuzione e di quello di scrittura per la directory di destinazione; gli
1970 stessi permessi occorrono per cancellare un file da una directory (si ricordi
1971 che questo non implica necessariamente la rimozione del contenuto del file dal
1972 disco), non è necessario nessun tipo di permesso per il file stesso (infatti
1973 esso non viene toccato, viene solo modificato il contenuto della directory,
1974 rimuovendo la voce che ad esso fa riferimento).
1975
1976 Per poter eseguire un file (che sia un programma compilato od uno script di
1977 shell, od un altro tipo di file eseguibile riconosciuto dal kernel), occorre
1978 avere il permesso di esecuzione, inoltre solo i file regolari possono essere
1979 eseguiti.
1980
1981 I permessi per un link simbolico sono ignorati, contano quelli del file a cui
1982 fa riferimento; per questo in genere il comando \cmd{ls} riporta per un link
1983 simbolico tutti i permessi come concessi; utente e gruppo a cui esso
1984 appartiene vengono pure ignorati quando il link viene risolto, vengono
1985 controllati solo quando viene richiesta la rimozione del link e quest'ultimo è
1986 in una directory con lo \itindex{sticky~bit} \textit{sticky bit} impostato (si
1987 veda sez.~\ref{sec:file_special_perm}).
1988
1989 La procedura con cui il kernel stabilisce se un processo possiede un certo
1990 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
1991 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
1992 \var{st\_gid} accennati in precedenza) e l'user-ID effettivo, il group-ID
1993 effettivo e gli eventuali group-ID supplementari del processo.\footnote{in
1994   realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
1995   identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
1996   sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
1997   eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
1998   differenza.}
1999
2000 Per una spiegazione dettagliata degli identificatori associati ai processi si
2001 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
2002 sez.~\ref{sec:file_special_perm}, l'user-ID effettivo e il group-ID effettivo
2003 corrispondono ai valori dell'\acr{uid} e del \acr{gid} dell'utente che ha
2004 lanciato il processo, mentre i group-ID supplementari sono quelli dei gruppi
2005 cui l'utente appartiene.
2006
2007 I passi attraverso i quali viene stabilito se il processo possiede il diritto
2008 di accesso sono i seguenti:
2009 \begin{enumerate}
2010 \item Se l'user-ID effettivo del processo è zero (corrispondente
2011   all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
2012   controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
2013   tutti i file.
2014 \item Se l'user-ID effettivo del processo è uguale all'\acr{uid} del
2015   proprietario del file (nel qual caso si dice che il processo è proprietario
2016   del file) allora:
2017   \begin{itemize*}
2018   \item se il relativo\footnote{per relativo si intende il bit di user-read se
2019       il processo vuole accedere in lettura, quello di user-write per
2020       l'accesso in scrittura, ecc.} bit dei permessi d'accesso dell'utente è
2021     impostato, l'accesso è consentito
2022   \item altrimenti l'accesso è negato
2023   \end{itemize*}
2024 \item Se il group-ID effettivo del processo o uno dei group-ID supplementari
2025   dei processi corrispondono al \acr{gid} del file allora:
2026   \begin{itemize*}
2027   \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
2028     consentito, 
2029   \item altrimenti l'accesso è negato
2030   \end{itemize*}
2031 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
2032   l'accesso è consentito, altrimenti l'accesso è negato.
2033 \end{enumerate}
2034
2035 Si tenga presente che questi passi vengono eseguiti esattamente in
2036 quest'ordine. Questo vuol dire che se un processo è il proprietario di un file,
2037 l'accesso è consentito o negato solo sulla base dei permessi per l'utente; i
2038 permessi per il gruppo non vengono neanche controllati. Lo stesso vale se il
2039 processo appartiene ad un gruppo appropriato, in questo caso i permessi per
2040 tutti gli altri non vengono controllati.
2041
2042
2043 \subsection{I bit dei permessi speciali}
2044 \label{sec:file_special_perm}
2045
2046 \itindbeg{suid~bit}
2047 \itindbeg{sgid~bit}
2048
2049 Come si è accennato (in sez.~\ref{sec:file_perm_overview}) nei dodici bit del
2050 campo \var{st\_mode} di \struct{stat} che vengono usati per il controllo di
2051 accesso oltre ai bit dei permessi veri e propri, ci sono altri tre bit che
2052 vengono usati per indicare alcune proprietà speciali dei file.  Due di questi
2053 sono i bit detti \acr{suid} (da \textit{set-user-ID bit}) e \acr{sgid} (da
2054 \textit{set-group-ID bit}) che sono identificati dalle costanti
2055 \const{S\_ISUID} e \const{S\_ISGID}.
2056
2057 Come spiegato in dettaglio in sez.~\ref{sec:proc_exec}, quando si lancia un
2058 programma il comportamento normale del kernel è quello di impostare gli
2059 identificatori del gruppo \textit{effective} del nuovo processo al valore dei
2060 corrispondenti del gruppo \textit{real} del processo corrente, che normalmente
2061 corrispondono a quelli dell'utente con cui si è entrati nel sistema.
2062
2063 Se però il file del programma (che ovviamente deve essere
2064 eseguibile\footnote{per motivi di sicurezza il kernel ignora i bit \acr{suid}
2065   e \acr{sgid} per gli script eseguibili.}) ha il bit \acr{suid} impostato, il
2066 kernel assegnerà come user-ID effettivo al nuovo processo l'\acr{uid} del
2067 proprietario del file al posto dell'\acr{uid} del processo originario.  Avere
2068 il bit \acr{sgid} impostato ha lo stesso effetto sul group-ID effettivo del
2069 processo.
2070
2071 I bit \acr{suid} e \acr{sgid} vengono usati per permettere agli utenti normali
2072 di usare programmi che richiedono privilegi speciali; l'esempio classico è il
2073 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
2074 quest'ultimo ovviamente può essere scritto solo dall'amministratore, ma non è
2075 necessario chiamare l'amministratore per cambiare la propria password. Infatti
2076 il comando \cmd{passwd} appartiene a root ma ha il bit \acr{suid} impostato
2077 per cui quando viene lanciato da un utente normale parte con i privilegi di
2078 root.
2079
2080 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
2081 normalmente l'utente che lo ha lanciato comporta vari rischi, e questo tipo di
2082 programmi devono essere scritti accuratamente per evitare che possano essere
2083 usati per guadagnare privilegi non consentiti (l'argomento è affrontato in
2084 dettaglio in sez.~\ref{sec:proc_perms}).
2085
2086 La presenza dei bit \acr{suid} e \acr{sgid} su un file può essere rilevata con
2087 il comando \cmd{ls -l}, che visualizza una lettera \cmd{s} al posto della
2088 \cmd{x} in corrispondenza dei permessi di utente o gruppo. La stessa lettera
2089 \cmd{s} può essere usata nel comando \cmd{chmod} per impostare questi bit.
2090 Infine questi bit possono essere controllati all'interno di \var{st\_mode} con
2091 l'uso delle due costanti \const{S\_ISUID} e \const{S\_IGID}, i cui valori sono
2092 riportati in tab.~\ref{tab:file_mode_flags}.
2093
2094 Gli stessi bit vengono ad assumere in significato completamente diverso per le
2095 directory, normalmente infatti Linux usa la convenzione di SVr4 per indicare
2096 con questi bit l'uso della semantica BSD nella creazione di nuovi file (si
2097 veda sez.~\ref{sec:file_ownership_management} per una spiegazione dettagliata
2098 al proposito).
2099
2100 Infine Linux utilizza il bit \acr{sgid} per un'ulteriore estensione mutuata
2101 da SVr4. Il caso in cui un file ha il bit \acr{sgid} impostato senza che lo
2102 sia anche il corrispondente bit di esecuzione viene utilizzato per attivare
2103 per quel file il \itindex{mandatory~locking} \textit{mandatory locking}
2104 (affronteremo questo argomento in dettaglio più avanti, in
2105 sez.~\ref{sec:file_mand_locking}).
2106
2107 \itindend{suid~bit}
2108 \itindend{sgid~bit}
2109
2110
2111 \itindbeg{sticky~bit}
2112
2113 L'ultimo dei bit rimanenti, identificato dalla costante \const{S\_ISVTX}, è in
2114 parte un rimasuglio delle origini dei sistemi Unix. A quell'epoca infatti la
2115 memoria virtuale e l'accesso ai file erano molto meno sofisticati e per
2116 ottenere la massima velocità possibile per i programmi usati più comunemente
2117 si poteva impostare questo bit.
2118
2119 L'effetto di questo bit era che il \index{segmento!testo} segmento di testo
2120 del programma (si veda sez.~\ref{sec:proc_mem_layout} per i dettagli) veniva
2121 scritto nella swap la prima volta che questo veniva lanciato, e vi permaneva
2122 fino al riavvio della macchina (da questo il nome di \textsl{sticky bit});
2123 essendo la swap un file continuo o una partizione indicizzata direttamente si
2124 poteva risparmiare in tempo di caricamento rispetto alla ricerca attraverso la
2125 struttura del filesystem. Lo \textsl{sticky bit} è indicato usando la lettera
2126 \texttt{t} al posto della \texttt{x} nei permessi per gli altri.
2127
2128 Ovviamente per evitare che gli utenti potessero intasare la swap solo
2129 l'amministratore era in grado di impostare questo bit, che venne chiamato
2130 anche con il nome di \textit{saved text bit}, da cui deriva quello della
2131 costante.  Le attuali implementazioni di memoria virtuale e filesystem rendono
2132 sostanzialmente inutile questo procedimento.
2133
2134 Benché ormai non venga più utilizzato per i file, lo \textit{sticky bit} ha
2135 invece assunto un uso importante per le directory;\footnote{lo \textit{sticky
2136     bit} per le directory è un'estensione non definita nello standard POSIX,
2137   Linux però la supporta, così come BSD e SVr4.} in questo caso se tale bit è
2138 impostato un file potrà essere rimosso dalla directory soltanto se l'utente ha
2139 il permesso di scrittura su di essa ed inoltre è vera una delle seguenti
2140 condizioni:
2141 \begin{itemize*}
2142 \item l'utente è proprietario del file
2143 \item l'utente è proprietario della directory
2144 \item l'utente è l'amministratore 
2145 \end{itemize*}
2146 un classico esempio di directory che ha questo bit impostato è \file{/tmp}, i
2147 permessi infatti di solito sono i seguenti:
2148 \begin{verbatim}
2149 $ ls -ld /tmp
2150 drwxrwxrwt    6 root     root         1024 Aug 10 01:03 /tmp
2151 \end{verbatim}%$
2152 quindi con lo \textit{sticky bit} bit impostato. In questo modo qualunque
2153 utente nel sistema può creare dei file in questa directory (che, come
2154 suggerisce il nome, è normalmente utilizzata per la creazione di file
2155 temporanei), ma solo l'utente che ha creato un certo file potrà cancellarlo o
2156 rinominarlo. In questo modo si evita che un utente possa, più o meno
2157 consapevolmente, cancellare i file temporanei creati degli altri utenti.
2158
2159 \itindend{sticky~bit}
2160
2161 \subsection{Le funzioni per la gestione dei permessi dei file}
2162 \label{sec:file_perm_management}
2163
2164 Come visto in sez.~\ref{sec:file_access_control} il controllo di accesso ad un
2165 file viene fatto utilizzando l'user-ID ed il group-ID effettivo del processo;
2166 ci sono casi però in cui si può voler effettuare il controllo con l'user-ID
2167 reale ed il group-ID reale, vale a dire usando i valori di \acr{uid} e
2168 \acr{gid} relativi all'utente che ha lanciato il programma, e che, come
2169 accennato in sez.~\ref{sec:file_special_perm} e spiegato in dettaglio in
2170 sez.~\ref{sec:proc_perms}, non è detto siano uguali a quelli effettivi.
2171
2172 Per far questo si può usare la funzione \funcd{access}, il cui prototipo è:
2173 \begin{prototype}{unistd.h}
2174 {int access(const char *pathname, int mode)}
2175
2176 Verifica i permessi di accesso.
2177   
2178 \bodydesc{La funzione ritorna 0 se l'accesso è consentito, -1 se l'accesso non
2179   è consentito ed in caso di errore; nel qual caso la variabile \var{errno}
2180   assumerà i valori:
2181   \begin{errlist}
2182   \item[\errcode{EINVAL}] il valore di \param{mode} non è valido.
2183   \item[\errcode{EACCES}] l'accesso al file non è consentito, o non si ha il
2184     permesso di attraversare una delle directory di \param{pathname}.
2185   \item[\errcode{EROFS}] si è richiesto l'accesso in scrittura per un file su
2186     un filesystem montato in sola lettura.
2187   \end{errlist}
2188   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2189   \errval{ENOTDIR}, \errval{ELOOP}, \errval{EIO}.}
2190 \end{prototype}
2191
2192 La funzione verifica i permessi di accesso, indicati da \param{mode}, per il
2193 file indicato da \param{pathname}. I valori possibili per l'argomento
2194 \param{mode} sono esprimibili come combinazione delle costanti numeriche
2195 riportate in tab.~\ref{tab:file_access_mode_val} (attraverso un OR binario
2196 delle stesse). I primi tre valori implicano anche la verifica dell'esistenza
2197 del file, se si vuole verificare solo quest'ultima si può usare \const{F\_OK},
2198 o anche direttamente \func{stat}. Nel caso in cui \param{pathname} si
2199 riferisca ad un link simbolico, questo viene seguito ed il controllo è fatto
2200 sul file a cui esso fa riferimento.
2201
2202 La funzione controlla solo i bit dei permessi di accesso, si ricordi che il
2203 fatto che una directory abbia permesso di scrittura non significa che ci si
2204 possa scrivere come in un file, e il fatto che un file abbia permesso di
2205 esecuzione non comporta che contenga un programma eseguibile. La funzione
2206 ritorna zero solo se tutte i permessi controllati sono disponibili, in caso
2207 contrario (o di errore) ritorna -1.
2208 \begin{table}[htb]
2209   \centering
2210   \footnotesize
2211   \begin{tabular}{|c|l|}
2212     \hline
2213     \textbf{\param{mode}} & \textbf{Significato} \\
2214     \hline
2215     \hline
2216     \const{R\_OK} & Verifica il permesso di lettura. \\
2217     \const{W\_OK} & Verifica il permesso di scrittura. \\
2218     \const{X\_OK} & Verifica il permesso di esecuzione. \\
2219     \const{F\_OK} & Verifica l'esistenza del file. \\
2220     \hline
2221   \end{tabular}
2222   \caption{Valori possibile per l'argomento \param{mode} della funzione 
2223     \func{access}.}
2224   \label{tab:file_access_mode_val}
2225 \end{table}
2226
2227 Un esempio tipico per l'uso di questa funzione è quello di un processo che sta
2228 eseguendo un programma coi privilegi di un altro utente (ad esempio attraverso
2229 l'uso del \itindex{suid~bit} \textit{suid bit}) che vuole controllare se
2230 l'utente originale ha i permessi per accedere ad un certo file.
2231
2232 % TODO documentare euidaccess (e eaccess)
2233
2234 Per cambiare i permessi di un file il sistema mette ad disposizione due
2235 funzioni \funcd{chmod} e \funcd{fchmod}, che operano rispettivamente su un
2236 filename e su un file descriptor, i loro prototipi sono:
2237 \begin{functions}
2238   \headdecl{sys/types.h} 
2239   \headdecl{sys/stat.h} 
2240   
2241   \funcdecl{int chmod(const char *path, mode\_t mode)} Cambia i permessi del
2242   file indicato da \param{path} al valore indicato da \param{mode}.
2243   
2244   \funcdecl{int fchmod(int fd, mode\_t mode)} Analoga alla precedente, ma usa
2245   il file descriptor \param{fd} per indicare il file.
2246   
2247   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
2248     un errore, in caso di errore \var{errno} può assumere i valori:
2249   \begin{errlist}
2250   \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2251     proprietario del file o non è zero.
2252     \item[\errcode{EROFS}] il file è su un filesystem in sola lettura.
2253   \end{errlist}
2254   ed inoltre \errval{EIO}; \func{chmod} restituisce anche \errval{EFAULT},
2255   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2256   \errval{EACCES}, \errval{ELOOP}; \func{fchmod} anche \errval{EBADF}.}
2257 \end{functions}
2258
2259 Entrambe le funzioni utilizzano come secondo argomento \param{mode}, una
2260 variabile dell'apposito tipo primitivo \type{mode\_t} (vedi
2261 tab.~\ref{tab:intro_primitive_types}) utilizzato per specificare i permessi sui
2262 file.
2263
2264 \begin{table}[!htb]
2265   \centering
2266   \footnotesize
2267   \begin{tabular}[c]{|c|c|l|}
2268     \hline
2269     \textbf{\param{mode}} & \textbf{Valore} & \textbf{Significato} \\
2270     \hline
2271     \hline
2272     \const{S\_ISUID} & 04000 & Set user ID \itindex{suid~bit}.\\
2273     \const{S\_ISGID} & 02000 & Set group ID \itindex{sgid~bit}.\\
2274     \const{S\_ISVTX} & 01000 & Sticky bit \itindex{sticky~bit}.\\
2275     \hline
2276     \const{S\_IRWXU} & 00700 & L'utente ha tutti i permessi.\\
2277     \const{S\_IRUSR} & 00400 & L'utente ha il permesso di lettura.\\
2278     \const{S\_IWUSR} & 00200 & L'utente ha il permesso di scrittura.\\
2279     \const{S\_IXUSR} & 00100 & L'utente ha il permesso di esecuzione.\\
2280     \hline
2281     \const{S\_IRWXG} & 00070 & Il gruppo ha tutti i permessi.\\
2282     \const{S\_IRGRP} & 00040 & Il gruppo ha il permesso di lettura.\\
2283     \const{S\_IWGRP} & 00020 & Il gruppo ha il permesso di scrittura.\\
2284     \const{S\_IXGRP} & 00010 & Il gruppo ha il permesso di esecuzione.\\
2285     \hline
2286     \const{S\_IRWXO} & 00007 & Gli altri hanno tutti i permessi.\\
2287     \const{S\_IROTH} & 00004 & Gli altri hanno il permesso di lettura.\\
2288     \const{S\_IWOTH} & 00002 & Gli altri hanno il permesso di scrittura.\\
2289     \const{S\_IXOTH} & 00001 & Gli altri hanno il permesso di esecuzione.\\
2290     \hline
2291   \end{tabular}
2292   \caption{Valori delle costanti usate per indicare i vari bit di
2293     \param{mode} utilizzato per impostare i permessi dei file.}
2294   \label{tab:file_permission_const}
2295 \end{table}
2296
2297 Le costanti con cui specificare i singoli bit di \param{mode} sono riportate
2298 in tab.~\ref{tab:file_permission_const}. Il valore di \param{mode} può essere
2299 ottenuto combinando fra loro con un OR binario le costanti simboliche relative
2300 ai vari bit, o specificato direttamente, come per l'omonimo comando di shell,
2301 con un valore numerico (la shell lo vuole in ottale, dato che i bit dei
2302 permessi sono divisibili in gruppi di tre), che si può calcolare direttamente
2303 usando lo schema si utilizzo dei bit illustrato in
2304 fig.~\ref{fig:file_perm_bit}.
2305
2306 Ad esempio i permessi standard assegnati ai nuovi file (lettura e scrittura
2307 per il proprietario, sola lettura per il gruppo e gli altri) sono
2308 corrispondenti al valore ottale $0644$, un programma invece avrebbe anche il
2309 bit di esecuzione attivo, con un valore di $0755$, se si volesse attivare il
2310 bit \itindex{suid~bit} \acr{suid} il valore da fornire sarebbe $4755$.
2311
2312 Il cambiamento dei permessi di un file eseguito attraverso queste funzioni ha
2313 comunque alcune limitazioni, previste per motivi di sicurezza. L'uso delle
2314 funzioni infatti è possibile solo se l'user-ID effettivo del processo
2315 corrisponde a quello del proprietario del file o dell'amministratore,
2316 altrimenti esse falliranno con un errore di \errcode{EPERM}.
2317
2318 Ma oltre a questa regola generale, di immediata comprensione, esistono delle
2319 limitazioni ulteriori. Per questo motivo, anche se si è proprietari del file,
2320 non tutti i valori possibili di \param{mode} sono permessi o hanno effetto;
2321 in particolare accade che:
2322 \begin{enumerate}
2323 \item siccome solo l'amministratore può impostare lo \itindex{sticky~bit}
2324   \textit{sticky bit}, se l'user-ID effettivo del processo non è zero esso
2325   viene automaticamente cancellato (senza notifica di errore) qualora sia
2326   stato indicato in \param{mode}.
2327 \item per quanto detto in sez.~\ref{sec:file_ownership_management} riguardo la
2328   creazione dei nuovi file, si può avere il caso in cui il file creato da un
2329   processo è assegnato ad un gruppo per il quale il processo non ha privilegi.
2330   Per evitare che si possa assegnare il bit \itindex{sgid~bit} \acr{sgid} ad
2331   un file appartenente ad un gruppo per cui non si hanno diritti, questo viene
2332   automaticamente cancellato da \param{mode} (senza notifica di errore)
2333   qualora il gruppo del file non corrisponda a quelli associati al processo
2334   (la cosa non avviene quando l'user-ID effettivo del processo è zero).
2335 \end{enumerate}
2336
2337 Per alcuni filesystem\footnote{i filesystem più comuni (\textsl{ext2},
2338   \textsl{ext3}, \textsl{reiserfs}) supportano questa caratteristica, che è
2339   mutuata da BSD.} è inoltre prevista un'ulteriore misura di sicurezza, volta
2340 a scongiurare l'abuso dei \itindex{suid~bit} bit \acr{suid} e \acr{sgid}; essa
2341 consiste nel cancellare automaticamente questi bit dai permessi di un file
2342 qualora un processo che non appartenga all'amministratore\footnote{per la
2343   precisione un processo che non dispone della capability
2344   \const{CAP\_FSETID}.} effettui una scrittura. In questo modo anche se un
2345 utente malizioso scopre un file \acr{suid} su cui può scrivere, un'eventuale
2346 modifica comporterà la perdita di questo privilegio.
2347
2348 Le funzioni \func{chmod} e \func{fchmod} ci permettono di modificare i
2349 permessi di un file, resta però il problema di quali sono i permessi assegnati
2350 quando il file viene creato. Le funzioni dell'interfaccia nativa di Unix, come
2351 vedremo in sez.~\ref{sec:file_open}, permettono di indicare esplicitamente i
2352 permessi di creazione di un file, ma questo non è possibile per le funzioni
2353 dell'interfaccia standard ANSI C che non prevede l'esistenza di utenti e
2354 gruppi, ed inoltre il problema si pone anche per l'interfaccia nativa quando i
2355 permessi non vengono indicati esplicitamente. 
2356
2357 \itindbeg{umask} 
2358
2359 Per le funzioni dell'interfaccia standard ANSI C l'unico riferimento possibile
2360 è quello della modalità di apertura del nuovo file (lettura/scrittura o sola
2361 lettura), che però può fornire un valore che è lo stesso per tutti e tre i
2362 permessi di sez.~\ref{sec:file_perm_overview} (cioè $666$ nel primo caso e
2363 $222$ nel secondo). Per questo motivo il sistema associa ad ogni
2364 processo\footnote{è infatti contenuta nel campo \var{umask} della struttura
2365   \struct{fs\_struct}, vedi fig.~\ref{fig:proc_task_struct}.}  una maschera di
2366 bit, la cosiddetta \textit{umask}, che viene utilizzata per impedire che
2367 alcuni permessi possano essere assegnati ai nuovi file in sede di creazione. I
2368 bit indicati nella maschera vengono infatti cancellati dai permessi quando un
2369 nuovo file viene creato.\footnote{l'operazione viene fatta sempre: anche
2370   qualora si indichi esplicitamente un valore dei permessi nelle funzioni di
2371   creazione che lo consentono, i permessi contenuti nella \textit{umask}
2372   verranno tolti.}
2373
2374 La funzione che permette di impostare il valore di questa maschera di
2375 controllo è \funcd{umask}, ed il suo prototipo è:
2376 \begin{prototype}{stat.h}
2377 {mode\_t umask(mode\_t mask)}
2378
2379 Imposta la maschera dei permessi dei bit al valore specificato da \param{mask}
2380 (di cui vengono presi solo i 9 bit meno significativi).
2381   
2382   \bodydesc{La funzione ritorna il precedente valore della maschera. È una
2383     delle poche funzioni che non restituisce codici di errore.}
2384 \end{prototype}
2385
2386 In genere si usa questa maschera per impostare un valore predefinito che
2387 escluda preventivamente alcuni permessi (usualmente quello di scrittura per il
2388 gruppo e gli altri, corrispondente ad un valore per \param{mask} pari a
2389 $022$).  In questo modo è possibile cancellare automaticamente i permessi non
2390 voluti.  Di norma questo valore viene impostato una volta per tutte al login a
2391 $022$, e gli utenti non hanno motivi per modificarlo.
2392
2393 \itindend{umask} 
2394
2395
2396 \subsection{La gestione della titolarità dei file}
2397 \label{sec:file_ownership_management}
2398
2399 Vedremo in sez.~\ref{sec:file_base_func} con quali funzioni si possono creare
2400 nuovi file, in tale occasione vedremo che è possibile specificare in sede di
2401 creazione quali permessi applicare ad un file, però non si può indicare a
2402 quale utente e gruppo esso deve appartenere.  Lo stesso problema si presenta
2403 per la creazione di nuove directory (procedimento descritto in
2404 sez.~\ref{sec:file_dir_creat_rem}).
2405
2406 Lo standard POSIX prescrive che l'\acr{uid} del nuovo file corrisponda
2407 all'user-ID effettivo del processo che lo crea; per il \acr{gid} invece prevede
2408 due diverse possibilità:
2409 \begin{itemize*}
2410 \item il \acr{gid} del file corrisponde al group-ID effettivo del processo.
2411 \item il \acr{gid} del file corrisponde al \acr{gid} della directory in cui
2412   esso è creato.
2413 \end{itemize*}
2414 in genere BSD usa sempre la seconda possibilità, che viene per questo chiamata
2415 semantica BSD. Linux invece segue quella che viene chiamata semantica SVr4; di
2416 norma cioè il nuovo file viene creato, seguendo la prima opzione, con il
2417 \acr{gid} del processo, se però la directory in cui viene creato il file ha il
2418 bit \acr{sgid} impostato allora viene usata la seconda opzione.
2419
2420 Usare la semantica BSD ha il vantaggio che il \acr{gid} viene sempre
2421 automaticamente propagato, restando coerente a quello della directory di
2422 partenza, in tutte le sotto-directory. 
2423
2424 La semantica SVr4 offre la possibilità di scegliere, ma per ottenere lo stesso
2425 risultato di coerenza che si ha con BSD necessita che per le nuove directory
2426 venga anche propagato anche il bit \acr{sgid}. Questo è il comportamento
2427 predefinito del comando \cmd{mkdir}, ed è in questo modo ad esempio che Debian
2428 assicura che le sotto-directory create nella home di un utente restino sempre
2429 con il \acr{gid} del gruppo primario dello stesso.
2430
2431 Come per i permessi, il sistema fornisce anche delle funzioni che permettano
2432 di cambiare utente e gruppo cui il file appartiene; le funzioni in questione
2433 sono tre: \funcd{chown}, \funcd{fchown} e \funcd{lchown}, ed i loro prototipi
2434 sono:
2435 \begin{functions}
2436   \headdecl{sys/types.h} 
2437   \headdecl{sys/stat.h} 
2438   
2439   \funcdecl{int chown(const char *path, uid\_t owner, gid\_t group)}
2440   \funcdecl{int fchown(int fd, uid\_t owner, gid\_t group)}
2441   \funcdecl{int lchown(const char *path, uid\_t owner, gid\_t group)}
2442
2443   Le funzioni cambiano utente e gruppo di appartenenza di un file ai valori
2444   specificati dalle variabili \param{owner} e \param{group}. 
2445   
2446   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
2447     un errore, in caso di errore \var{errno} può assumere i valori:
2448   \begin{errlist}
2449   \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2450     proprietario del file o non è zero, o utente e gruppo non sono validi
2451   \end{errlist}
2452   Oltre a questi entrambe restituiscono gli errori \errval{EROFS} e
2453   \errval{EIO}; \func{chown} restituisce anche \errval{EFAULT},
2454   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2455   \errval{EACCES}, \errval{ELOOP}; \func{fchown} anche \errval{EBADF}.}
2456 \end{functions}
2457
2458 In Linux soltanto l'amministratore (in sostanza un processo con la
2459 \itindex{capabilities} capability \const{CAP\_CHOWN}) può cambiare il
2460 proprietario di un file, seguendo la semantica di BSD che non consente agli
2461 utenti di assegnare i loro file ad altri (per evitare eventuali aggiramenti
2462 delle quote).  L'amministratore può cambiare il gruppo di un file, il
2463 proprietario può cambiare il gruppo dei file che gli appartengono solo se il
2464 nuovo gruppo è il suo gruppo primario o uno dei gruppi di cui fa parte.
2465
2466 La funzione \func{chown} segue i link simbolici, per operare direttamente su
2467 un link simbolico si deve usare la funzione \func{lchown}.\footnote{fino alla
2468   versione 2.1.81 in Linux \func{chown} non seguiva i link simbolici, da
2469   allora questo comportamento è stato assegnato alla funzione \func{lchown},
2470   introdotta per l'occasione, ed è stata creata una nuova system call per
2471   \func{chown} che seguisse i link simbolici.} La funzione \func{fchown} opera
2472 su un file aperto, essa è mutuata da BSD, ma non è nello standard POSIX.
2473 Un'altra estensione rispetto allo standard POSIX è che specificando -1 come
2474 valore per \param{owner} e \param{group} i valori restano immutati.
2475
2476 Quando queste funzioni sono chiamate con successo da un processo senza i
2477 privilegi di root entrambi i bit \itindex{suid~bit} \acr{suid} e
2478 \itindex{sgid~bit} \acr{sgid} vengono cancellati. Questo non avviene per il
2479 bit \acr{sgid} nel caso in cui esso sia usato (in assenza del corrispondente
2480 permesso di esecuzione) per indicare che per il file è attivo il
2481 \itindex{mandatory~locking} \textit{mandatory locking}.
2482
2483
2484 \subsection{Un quadro d'insieme sui permessi}
2485 \label{sec:file_riepilogo}
2486
2487 Avendo affrontato in maniera separata il comportamento delle varie funzioni ed
2488 il significato dei singoli bit dei permessi sui file, vale la pena fare un
2489 riepilogo in cui si riassumono le caratteristiche di ciascuno di essi, in modo
2490 da poter fornire un quadro d'insieme.
2491
2492 In tab.~\ref{tab:file_fileperm_bits} si sono riassunti gli effetti dei vari
2493 bit dei permessi per un file; per quanto riguarda l'applicazione dei permessi
2494 per proprietario, gruppo ed altri si ricordi quanto illustrato in
2495 sez.~\ref{sec:file_perm_overview}.  Per compattezza, nella tabelle si sono
2496 specificati i bit di \itindex{suid~bit} \textit{suid}, \itindex{sgid~bit}
2497 \textit{sgid} e \textit{sticky} \itindex{sticky~bit} con la notazione
2498 illustrata anche in fig.~\ref{fig:file_perm_bit}.
2499
2500 \begin{table}[!htb]
2501   \centering
2502   \footnotesize
2503   \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
2504     \hline
2505     \multicolumn{3}{|c|}{special}&
2506     \multicolumn{3}{|c|}{user}&
2507     \multicolumn{3}{|c|}{group}&
2508     \multicolumn{3}{|c|}{other}&
2509     \multirow{2}{*}{\textbf{Operazioni possibili}} \\
2510     \cline{1-12}
2511     \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2512     \hline
2513     \hline
2514    1&-&-&-&-&-&-&-&-&-&-&-&Se eseguito ha i permessi del proprietario.\\
2515    -&1&-&-&-&1&-&-&-&-&-&-&Se eseguito ha i permessi del gruppo proprietario.\\
2516    -&1&-&-&-&0&-&-&-&-&-&-&Il \itindex{mandatory~locking} 
2517                            \textit{mandatory locking} è abilitato.\\
2518    -&-&1&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2519    -&-&-&1&-&-&-&-&-&-&-&-&Permesso di lettura per il proprietario.\\
2520    -&-&-&-&1&-&-&-&-&-&-&-&Permesso di scrittura per il proprietario.\\
2521    -&-&-&-&-&1&-&-&-&-&-&-&Permesso di esecuzione per il proprietario.\\
2522    -&-&-&-&-&-&1&-&-&-&-&-&Permesso di lettura per il gruppo proprietario.\\
2523    -&-&-&-&-&-&-&1&-&-&-&-&Permesso di scrittura per il gruppo proprietario.\\
2524    -&-&-&-&-&-&-&-&1&-&-&-&Permesso di esecuzione per il gruppo proprietario.\\
2525    -&-&-&-&-&-&-&-&-&1&-&-&Permesso di lettura per tutti gli altri.\\
2526    -&-&-&-&-&-&-&-&-&-&1&-&Permesso di scrittura per tutti gli altri.\\
2527    -&-&-&-&-&-&-&-&-&-&-&1&Permesso di esecuzione per tutti gli altri.\\
2528     \hline
2529   \end{tabular}
2530   \caption{Tabella riassuntiva del significato dei bit dei permessi per un
2531     file.} 
2532   \label{tab:file_fileperm_bits}
2533 \end{table}
2534
2535 In tab.~\ref{tab:file_dirperm_bits} si sono invece riassunti gli effetti dei
2536 vari bit dei permessi per una directory; anche in questo caso si sono
2537 specificati i bit di \itindex{suid~bit} \textit{suid}, \itindex{sgid~bit}
2538 \textit{sgid} e \textit{sticky} \itindex{sticky~bit} con la notazione compatta
2539 illustrata in fig.~\ref{fig:file_perm_bit}.
2540
2541 \begin{table}[!htb]
2542   \centering
2543   \footnotesize
2544   \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
2545     \hline
2546     \multicolumn{3}{|c|}{special}&
2547     \multicolumn{3}{|c|}{user}&
2548     \multicolumn{3}{|c|}{group}&
2549     \multicolumn{3}{|c|}{other}&
2550     \multirow{2}{*}{\textbf{Operazioni possibili}} \\
2551     \cline{1-12}
2552     \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2553     \hline
2554     \hline
2555     1&-&-&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2556     -&1&-&-&-&-&-&-&-&-&-&-&Propaga il gruppo proprietario ai nuovi file 
2557                             creati.\\
2558     -&-&1&-&-&-&-&-&-&-&-&-&Limita l'accesso in scrittura dei file nella 
2559                             directory.\\
2560     -&-&-&1&-&-&-&-&-&-&-&-&Permesso di visualizzazione per il proprietario.\\
2561     -&-&-&-&1&-&-&-&-&-&-&-&Permesso di aggiornamento per il proprietario.\\
2562     -&-&-&-&-&1&-&-&-&-&-&-&Permesso di attraversamento per il proprietario.\\
2563     -&-&-&-&-&-&1&-&-&-&-&-&Permesso di visualizzazione per il gruppo 
2564                             proprietario.\\
2565     -&-&-&-&-&-&-&1&-&-&-&-&Permesso di aggiornamento per il gruppo 
2566                             proprietario.\\
2567     -&-&-&-&-&-&-&-&1&-&-&-&Permesso di attraversamento per il gruppo 
2568                             proprietario.\\
2569     -&-&-&-&-&-&-&-&-&1&-&-&Permesso di visualizzazione per tutti gli altri.\\
2570     -&-&-&-&-&-&-&-&-&-&1&-&Permesso di aggiornamento per tutti gli altri.\\
2571     -&-&-&-&-&-&-&-&-&-&-&1&Permesso di attraversamento per tutti gli altri.\\
2572     \hline
2573   \end{tabular}
2574   \caption{Tabella riassuntiva del significato dei bit dei permessi per una
2575     directory.} 
2576   \label{tab:file_dirperm_bits}
2577 \end{table}
2578
2579 Nelle tabelle si è indicato con il carattere ``-'' il fatto che il valore del
2580 bit in questione non è influente rispetto a quanto indicato nella riga della
2581 tabella; la descrizione dell'operazione fa riferimento soltanto alla
2582 combinazione di bit per i quali è stato riportato esplicitamente un valore.
2583 Si rammenti infine che il valore dei bit dei permessi non ha alcun effetto
2584 qualora il processo possieda i privilegi di amministratore.
2585
2586
2587
2588 \section{Caratteristiche e funzionalità avanzate}
2589 \label{sec:file_dir_advances}
2590
2591 Tratteremo qui alcune caratteristiche e funzionalità avanzate della gestione
2592 di file e directory, affrontando anche una serie di estensioni
2593 dell'interfaccia classica dei sistemi unix-like, principalmente utilizzate a
2594 scopi di sicurezza, che sono state introdotte nelle versioni più recenti di
2595 Linux.
2596
2597
2598 \subsection{Gli attributi estesi}
2599 \label{sec:file_xattr}
2600
2601 \itindbeg{Extended~Attributes}
2602
2603 Nelle sezioni precedenti abbiamo trattato in dettaglio le varie informazioni
2604 che il sistema mantiene negli \itindex{inode} \textit{inode}, e le varie
2605 funzioni che permettono di modificarle.  Si sarà notato come in realtà queste
2606 informazioni siano estremamente ridotte.  Questo è dovuto al fatto che Unix
2607 origina negli anni '70, quando le risorse di calcolo e di spazio disco erano
2608 minime. Con il venir meno di queste restrizioni è incominciata ad emergere
2609 l'esigenza di poter associare ai file delle ulteriori informazioni astratte
2610 (quelli che vengono chiamati i \textsl{meta-dati}) che però non potevano
2611 trovare spazio nei dati classici mantenuti negli \itindex{inode}
2612 \textit{inode}.
2613
2614 Per risolvere questo problema alcuni sistemi unix-like (e fra questi anche
2615 Linux) hanno introdotto un meccanismo generico che consenta di associare delle
2616 informazioni ai singoli file,\footnote{l'uso più comune è quello della ACL,
2617   che tratteremo nella prossima sezione, ma si possono inserire anche altre
2618   informazioni.}  detto \textit{Extended Attributes}. Gli \textsl{attributi
2619   estesi} non sono altro che delle coppie nome/valore che sono associate
2620 permanentemente ad un oggetto sul filesystem, analoghi di quello che sono le
2621 variabili di ambiente (vedi sez.~\ref{sec:proc_environ}) per un processo.
2622
2623 Altri sistemi (come Solaris, MacOS e Windows) hanno adottato un meccanismo
2624 diverso in cui ad un file sono associati diversi flussi di dati, su cui
2625 possono essere mantenute ulteriori informazioni, che possono essere accedute
2626 con le normali operazioni di lettura e scrittura. Questi non vanno confusi con
2627 gli \textit{Extended Attributes} (anche se su Solaris hanno lo stesso nome),
2628 che sono un meccanismo molto più semplice, che pur essendo limitato (potendo
2629 contenere solo una quantità limitata di informazione) hanno il grande
2630 vantaggio di essere molto più semplici da realizzare, più
2631 efficienti,\footnote{cosa molto importante, specie per le applicazioni che
2632   richiedono una gran numero di accessi, come le ACL.} e di garantire
2633 l'atomicità di tutte le operazioni.
2634
2635 In Linux gli attributi estesi sono sempre associati al singolo \itindex{inode}
2636 \textit{inode} e l'accesso viene sempre eseguito in forma atomica, in lettura
2637 il valore corrente viene scritto su un buffer in memoria, mentre la scrittura
2638 prevede che ogni valore precedente sia sovrascritto.
2639
2640 Si tenga presente che non tutti i filesystem supportano gli \textit{Extended
2641   Attributes}, in particolare al momento della scrittura di queste dispense
2642 essi sono presenti solo su \textsl{ext2}, \textsl{ext3} e \textsl{XFS}.
2643 Inoltre a seconda della implementazione ci possono essere dei limiti sulla
2644 quantità di attributi che si possono utilizzare.\footnote{ad esempio nel caso
2645   di \textsl{ext2} ed \textsl{ext3} è richiesto che essi siano contenuti
2646   all'interno di un singolo blocco (pertanto con dimensioni massime pari a
2647   1024, 2048 o 4096 byte a seconda delle dimensioni di quest'ultimo impostate
2648   in fase di creazione del filesystem), mentre con \textsl{XFS} non ci sono
2649   limiti ed i dati vengono memorizzati in maniera diversa (nell'\textit{inode}
2650   stesso, in un blocco a parte, o in una struttura ad albero dedicata) per
2651   mantenerne la scalabilità.} Infine lo spazio utilizzato per mantenere gli
2652 attributi estesi viene tenuto in conto per il calcolo delle quote di utente e
2653 gruppo proprietari del file.
2654
2655 Come meccanismo per mantenere informazioni aggiuntive associate al singolo
2656 file, gli \textit{Extended Attributes} possono avere usi anche molto diversi
2657 fra loro.  Per poterli distinguere allora sono stati suddivisi in
2658 \textsl{classi}, a cui poter applicare requisiti diversi per l'accesso e la
2659 gestione. Per questo motivo il nome di un attributo deve essere sempre
2660 specificato nella forma \texttt{namespace.attribute}, dove \texttt{namespace}
2661 fa riferimento alla classe a cui l'attributo appartiene, mentre
2662 \texttt{attribute} è il nome ad esso assegnato. In tale forma il nome di un
2663 attributo esteso deve essere univoco. Al momento\footnote{della scrittura di
2664   questa sezione, kernel 2.6.23, ottobre 2007.} sono state definite le quattro
2665 classi di attributi riportate in tab.~\ref{tab:extended_attribute_class}.
2666
2667 \begin{table}[htb]
2668   \centering
2669   \footnotesize
2670   \begin{tabular}{|c|p{10cm}|}
2671     \hline
2672     \textbf{Nome} & \textbf{Descrizione} \\
2673     \hline
2674     \hline
2675     \const{security}& Gli \textit{extended security attributes}: vengono
2676                       utilizzati dalle estensioni di sicurezza del kernel (i
2677                       \itindex{Linux~Security~Modules} \textit{Linux 
2678                         Security Modules}), per le realizzazione di meccanismi
2679                       evoluti di controllo di accesso come \index{SELinux}
2680                       SELinux.\\ 
2681     \const{system}  & Gli \textit{extended security attributes}: sono usati
2682                       dal kernel per memorizzare dati di sistema associati ai
2683                       file come le \itindex{Access~Control~List} ACL (vedi
2684                       sez.~\ref{sec:file_ACL}) o le \itindex{capabilities}
2685                       \textit{capabilities} (vedi
2686                       sez.~\ref{sec:proc_capabilities}).\\
2687     \const{trusted} & I \textit{trusted extended attributes}: vengono
2688                       utilizzati per poter realizzare in user space 
2689                       meccanismi che consentano di mantenere delle
2690                       informazioni sui file che non devono essere accessibili
2691                       ai processi ordinari.\\
2692     \const{user}    & Gli \textit{extended user attributes}: utilizzati per
2693                       mantenere informazioni aggiuntive sui file (come il
2694                       \textit{mime-type}, la codifica dei caratteri o del
2695                       file) accessibili dagli utenti.\\
2696     \hline
2697   \end{tabular}
2698   \caption{I nomi utilizzati valore di \texttt{namespace} per distinguere le
2699     varie classi di \textit{Extended Attributes}.}
2700   \label{tab:extended_attribute_class}
2701 \end{table}
2702
2703
2704 Dato che uno degli usi degli \textit{Extended Attributes} è quello che li
2705 impiega per realizzare delle estensioni (come le ACL, \index{SELinux} SELinux,
2706 ecc.) al tradizionale meccanismo dei controlli di accesso di Unix, l'accesso
2707 ai loro valori viene regolato in maniera diversa a seconda sia della loro
2708 classe sia di quali, fra le estensioni che li utilizzano, sono poste in uso.
2709 In particolare, per ciascuna delle classi riportate in
2710 tab.~\ref{tab:extended_attribute_class}, si hanno i seguenti casi:
2711 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
2712 \item[\texttt{security}] L'accesso agli \textit{extended security attributes}
2713   dipende dalle politiche di sicurezza stabilite da loro stessi tramite
2714   l'utilizzo di un sistema di controllo basato sui
2715   \itindex{Linux~Security~Modules} \textit{Linux Security Modules} (ad esempio
2716   \index{SELinux} SELinux). Pertanto l'accesso in lettura o scrittura dipende
2717   dalle politiche di sicurezza implementate all'interno dal modulo di
2718   sicurezza che si sta utilizzando al momento (ciascuno avrà le sue). Se non è
2719   stato caricato nessun modulo di sicurezza l'accesso in lettura sarà
2720   consentito a tutti i processi, mentre quello in scrittura solo ai processi
2721   con privilegi amministrativi dotati della \index{capabilities}
2722   \textit{capability} \const{CAP\_SYS\_ADMIN}.
2723
2724 \item[\texttt{system}] Anche l'accesso agli \textit{extended system
2725     attributes} dipende dalle politiche di accesso che il kernel realizza
2726   anche utilizzando gli stessi valori in essi contenuti. Ad esempio nel caso
2727   delle ACL l'accesso è consentito in lettura ai processi che hanno la
2728   capacità di eseguire una ricerca sul file (cioè hanno il permesso di lettura
2729   sulla directory che contiene il file) ed in scrittura al proprietario del
2730   file o ai processi dotati della \textit{capability} \index{capabilities}
2731   \const{CAP\_FOWNER}.\footnote{vale a dire una politica di accesso analoga a
2732     quella impiegata per gli ordinari permessi dei file.}
2733
2734 \item[\texttt{trusted}] L'accesso ai \textit{trusted extended attributes}, sia
2735   per la lettura che per la scrittura, è consentito soltanto ai processi con
2736   privilegi amministrativi dotati della \index{capabilities}
2737   \textit{capability} \const{CAP\_SYS\_ADMIN}. In questo modo si possono
2738   utilizzare questi attributi per realizzare in user space dei meccanismi di
2739   controllo che accedono ad informazioni non disponibili ai processi ordinari.
2740
2741 \item[\texttt{user}] L'accesso agli \textit{extended user attributes} è
2742   regolato dagli ordinari permessi dei file a cui essi fanno riferimento:
2743   occorre avere il permesso di lettura per leggerli e quello di scrittura per
2744   scriverli o modificarli. Dato l'uso di questi attributi, si è scelto cioè di
2745   applicare per il loro accesso gli stessi criteri che si usano per l'accesso
2746   al contenuto dei file (o delle directory) cui essi fanno riferimento.
2747
2748   Questa scelta vale però soltanto per i file e le directory ordinarie, se
2749   valesse in generale infatti si avrebbe un serio problema di sicurezza dato
2750   che esistono diversi oggetti sul filesystem per i quali è normale avere
2751   avere il permesso di scrittura consentito a tutti gli utenti, come i link
2752   simbolici, o alcuni file di dispositivo come \texttt{/dev/null}. Se fosse
2753   possibile usare su di essi gli \textit{extended user attributes} un utente
2754   qualunque potrebbe inserirvi dati a piacere.\footnote{la cosa è stata notata
2755     su XFS, dove questo comportamento permetteva, non essendovi limiti sullo
2756     spazio occupabile dagli \textit{Extended Attributes}, di bloccare il
2757     sistema riempiendo il disco.}
2758
2759   La semantica del controllo di accesso che abbiamo indicato inoltre non
2760   avrebbe alcun senso al di fuori di file e directory: i permessi di lettura e
2761   scrittura per un file di dispositivo attengono alle capacità di accesso al
2762   dispositivo sottostante,\footnote{motivo per cui si può formattare un disco
2763     anche se \texttt{/dev} è su un filesystem in sola lettura.} mentre per i
2764   link simbolici questi vengono semplicemente ignorati: in nessuno dei due
2765   casi hanno a che fare con il contenuto del file, e nella discussione
2766   relativa all'uso degli \textit{extended user attributes} nessuno è mai stato
2767   capace di indicare una qualche forma sensata di utilizzo degli stessi per
2768   link simbolici o file di dispositivo, e neanche per le fifo o i socket.
2769
2770   Per questo motivo gli \textit{extended user attributes} sono stati
2771   completamente disabilitati per tutto ciò che non sia un file regolare o una
2772   directory.\footnote{si può verificare la semantica adottata consultando il
2773     file \texttt{fs/xattr.c} dei sorgenti del kernel.} Inoltre per le
2774   directory è stata introdotta una ulteriore restrizione, dovuta di nuovo alla
2775   presenza ordinaria di permessi di scrittura completi su directory come
2776   \texttt{/tmp}.  Questo è un altro caso particolare, in cui il premesso di
2777   scrittura viene usato, unito alla presenza dello \itindex{sticky~bit}
2778   \textit{sticky bit}, per garantire il permesso di creazione di nuovi file.
2779   Per questo motivo, per evitare eventuali abusi, se una directory ha lo
2780   \itindex{sticky~bit} \textit{sticky bit} attivo sarà consentito scrivere i
2781   suoi \textit{extended user attributes} soltanto se si è proprietari della
2782   stessa, o si hanno i privilegi amministrativi della capability
2783   \index{capabilities} \const{CAP\_FOWNER}.
2784 \end{basedescript}
2785
2786 Le funzioni per la gestione degli attributi estesi, come altre funzioni di
2787 gestione avanzate specifiche di Linux, non fanno parte delle \acr{glibc}, e
2788 sono fornite da una apposita libreria, \texttt{libattr}, che deve essere
2789 installata a parte;\footnote{la versione corrente della libreria è
2790   \texttt{libattr1}, e nel caso si usi Debian la si può installare con il
2791   pacchetto omonimo ed il collegato \texttt{libattr1-dev}.}  pertanto se un
2792 programma le utilizza si dovrà indicare esplicitamente l'uso della suddetta
2793 libreria invocando il compilatore con l'opzione \texttt{-lattr}.
2794
2795 Per poter leggere gli attributi estesi sono disponibili tre diverse funzioni,
2796 \funcd{getxattr}, \funcd{lgetxattr} e \funcd{fgetxattr}, che consentono
2797 rispettivamente di richiedere gli attributi relativi a un file, a un link
2798 simbolico e ad un file descriptor; i rispettivi prototipi sono:
2799 \begin{functions}
2800   \headdecl{sys/types.h} 
2801   \headdecl{attr/xattr.h} 
2802   
2803   \funcdecl{ssize\_t getxattr(const char *path, const char *name, void
2804     *value, size\_t size)} 
2805
2806   \funcdecl{ssize\_t lgetxattr(const char *path, const char *name, void
2807     *value, size\_t size)} 
2808
2809   \funcdecl{ssize\_t fgetxattr(int filedes, const char *name, void *value,
2810     size\_t size)}
2811
2812   Le funzioni leggono il valore di un attributo esteso.
2813   
2814   \bodydesc{Le funzioni restituiscono un intero positivo che indica la
2815     dimensione dell'attributo richiesto in caso di successo, e $-1$ in caso di
2816     errore, nel qual caso \var{errno} assumerà i valori:
2817   \begin{errlist}
2818   \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
2819   \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
2820     non è sufficiente per contenere il risultato.
2821   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2822     filesystem o sono disabilitati.
2823   \end{errlist}
2824   Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
2825   ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
2826   all'attributo.  }
2827 \end{functions}
2828
2829 Le funzioni \func{getxattr} e \func{lgetxattr} prendono come primo argomento
2830 un pathname che indica il file di cui si vuole richiedere un attributo, la
2831 sola differenza è che la seconda, se il pathname indica un link simbolico,
2832 restituisce gli attributi di quest'ultimo e non quelli del file a cui esso fa
2833 riferimento. La funzione \func{fgetxattr} prende invece come primo argomento
2834 un numero di file descriptor, e richiede gli attributi del file ad esso
2835 associato.
2836
2837 Tutte e tre le funzioni richiedono di specificare nell'argomento \param{name}
2838 il nome dell'attributo di cui si vuole ottenere il valore. Il nome deve essere
2839 indicato comprensivo di prefisso del \textit{namespace} cui appartiene (uno
2840 dei valori di tab.~\ref{tab:extended_attribute_class}) nella forma
2841 \texttt{namespace.attributename}, come stringa terminata da un carattere NUL.
2842 Il suo valore verrà restituito nel buffer puntato dall'argomento \param{value}
2843 per una dimensione massima di \param{size} byte;\footnote{gli attributi estesi
2844   possono essere costituiti arbitrariamente da dati testuali o binari.}  se
2845 quest'ultima non è sufficiente si avrà un errore di \errcode{ERANGE}.
2846
2847 Per evitare di dover indovinare la dimensione di un attributo per tentativi si
2848 può eseguire una interrogazione utilizzando un valore nullo per \param{size};
2849 in questo caso non verrà letto nessun dato, ma verrà restituito come valore di
2850 ritorno della funzione chiamata la dimensione totale dell'attributo esteso
2851 richiesto, che si potrà usare come stima per allocare un buffer di dimensioni
2852 sufficienti.\footnote{si parla di stima perché anche se le funzioni
2853   restituiscono la dimensione esatta dell'attributo al momento in cui sono
2854   eseguite, questa potrebbe essere modificata in qualunque momento da un
2855   successivo accesso eseguito da un altro processo.}
2856
2857 Un secondo gruppo di funzioni è quello che consente di impostare il valore di
2858 un attributo esteso, queste sono \funcd{setxattr}, \funcd{lsetxattr} e
2859 \funcd{fsetxattr}, e consentono di operare rispettivamente su un file, su un
2860 link simbolico o specificando un file descriptor; i loro prototipi sono:
2861 \begin{functions}
2862   \headdecl{sys/types.h} 
2863   \headdecl{attr/xattr.h} 
2864   
2865   \funcdecl{int setxattr(const char *path, const char *name, const void
2866     *value, size\_t size, int flags)}
2867
2868   \funcdecl{int lsetxattr(const char *path, const char *name, const void
2869     *value, size\_t size, int flags)}
2870
2871   \funcdecl{int fsetxattr(int filedes, const char *name, const void *value,
2872     size\_t size, int flags)}
2873
2874   Impostano il valore di un attributo esteso.
2875   
2876   \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
2877     errore, nel qual caso \var{errno} assumerà i valori:
2878   \begin{errlist}
2879   \item[\errcode{ENOATTR}] si è usato il flag \const{XATTR\_REPLACE} e
2880     l'attributo richiesto non esiste.
2881   \item[\errcode{EEXIST}] si è usato il flag \const{XATTR\_CREATE} ma
2882     l'attributo esiste già.
2883   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2884     filesystem o sono disabilitati.
2885   \end{errlist}
2886   Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
2887   ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
2888   all'attributo.  
2889 }
2890 \end{functions}
2891
2892 Le tre funzioni prendono come primo argomento un valore adeguato al loro
2893 scopo, usato in maniera del tutto identica a quanto visto in precedenza per le
2894 analoghe che leggono gli attributi estesi. Il secondo argomento \param{name}
2895 deve indicare, anche in questo caso con gli stessi criteri appena visti per le
2896 analoghe \func{getxattr}, \func{lgetxattr} e \func{fgetxattr}, il nome
2897 (completo di suffisso) dell'attributo su cui si vuole operare. 
2898
2899 Il valore che verrà assegnato all'attributo dovrà essere preparato nel buffer
2900 puntato da \param{value}, e la sua dimensione totale (in byte) sarà indicata
2901 dall'argomento \param{size}. Infine l'argomento \param{flag} consente di
2902 controllare le modalità di sovrascrittura dell'attributo esteso, esso può
2903 prendere due valori: con \const{XATTR\_REPLACE} si richiede che l'attributo
2904 esista, nel qual caso verrà sovrascritto, altrimenti si avrà errore, mentre
2905 con \const{XATTR\_CREATE} si richiede che l'attributo non esista, nel qual
2906 caso verrà creato, altrimenti si avrà errore ed il valore attuale non sarà
2907 modificato.  Utilizzando per \param{flag} un valore nullo l'attributo verrà
2908 modificato se è già presente, o creato se non c'è.
2909
2910 Le funzioni finora illustrate permettono di leggere o scrivere gli attributi
2911 estesi, ma sarebbe altrettanto utile poter vedere quali sono gli attributi
2912 presenti; a questo provvedono le funzioni \funcd{listxattr},
2913 \funcd{llistxattr} e \funcd{flistxattr} i cui prototipi sono:
2914 \begin{functions}
2915   \headdecl{sys/types.h} 
2916   \headdecl{attr/xattr.h} 
2917   
2918   \funcdecl{ssize\_t listxattr(const char *path, char *list, size\_t size)}
2919
2920   \funcdecl{ssize\_t llistxattr(const char *path, char *list, size\_t size)}
2921
2922   \funcdecl{ssize\_t flistxattr(int filedes, char *list, size\_t size)}
2923
2924   Leggono la lista degli attributi estesi di un file.
2925   
2926   \bodydesc{Le funzioni restituiscono un intero positivo che indica la
2927     dimensione della lista in caso di successo, e $-1$ in caso di errore, nel
2928     qual caso \var{errno} assumerà i valori:
2929   \begin{errlist}
2930   \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
2931     non è sufficiente per contenere il risultato.
2932   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2933     filesystem o sono disabilitati.
2934   \end{errlist}
2935   Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
2936   ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
2937   all'attributo.  
2938 }
2939 \end{functions}
2940
2941 Come per le precedenti le tre funzioni leggono gli attributi rispettivamente
2942 di un file, un link simbolico o specificando un file descriptor, da
2943 specificare con il loro primo argomento. Gli altri due argomenti, identici per
2944 tutte e tre, indicano rispettivamente il puntatore \param{list} al buffer dove
2945 deve essere letta la lista e la dimensione \param{size} di quest'ultimo.
2946
2947 La lista viene fornita come sequenza non ordinata dei nomi dei singoli
2948 attributi estesi (sempre comprensivi del prefisso della loro classe) ciascuno
2949 dei quali è terminato da un carattere nullo. I nomi sono inseriti nel buffer
2950 uno di seguito all'altro. Il valore di ritorno della funzione indica la
2951 dimensione totale della lista in byte.
2952
2953 Come per le funzioni di lettura dei singoli attributi se le dimensioni del
2954 buffer non sono sufficienti si avrà un errore, ma è possibile ottenere dal
2955 valore di ritorno della funzione una stima della dimensione totale della lista
2956 usando per \param{size} un valore nullo. 
2957
2958 Infine per rimuovere semplicemente un attributo esteso, si ha a disposizione
2959 un ultimo gruppo di funzioni: \funcd{removexattr}, \funcd{lremovexattr} e
2960 \funcd{fremovexattr}; i rispettivi prototipi sono:
2961 \begin{functions}
2962   \headdecl{sys/types.h} 
2963   \headdecl{attr/xattr.h} 
2964   
2965   \funcdecl{int removexattr(const char *path, const char *name)}
2966
2967   \funcdecl{int lremovexattr(const char *path, const char *name)}
2968
2969   \funcdecl{int fremovexattr(int filedes, const char *name)}
2970
2971
2972   Rimuovono un attributo esteso di un file.
2973   
2974   \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
2975     errore, nel qual caso \var{errno} assumerà i valori:
2976   \begin{errlist}
2977   \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
2978   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2979     filesystem o sono disabilitati.
2980   \end{errlist}
2981   ed inoltre tutti gli errori di \func{stat}.  
2982 }
2983 \end{functions}
2984
2985 Le tre funzioni rimuovono l'attributo esteso indicato dall'argomento
2986 \param{name} rispettivamente di un file, un link simbolico o specificando un
2987 file descriptor, da specificare con il loro primo argomento.  Anche in questo
2988 caso l'argomento \param{name} deve essere specificato con le modalità già
2989 illustrate in precedenza per le altre funzioni relative agli attributi estesi.
2990
2991
2992 \itindend{Extended~Attributes}
2993
2994 % TODO trattare gli attributi estesi e le funzioni la documentazione di
2995 % sistema è nei pacchetti libxattr1-dev e attr
2996
2997
2998 \subsection{Le \textit{Access  Control List}}
2999 \label{sec:file_ACL}
3000
3001
3002 \itindbeg{Access~Control~List}
3003
3004 Il modello classico dei permessi di Unix, per quanto funzionale ed efficiente,
3005 è comunque piuttosto limitato e per quanto possa aver coperto per lunghi anni
3006 le esigenze più comuni con un meccanismo semplice e potente, non è in grado di
3007 rispondere in maniera adeguata a situazioni che richiedono una gestione
3008 complessa dei permessi di accesso.\footnote{già un requisito come quello di
3009   dare accesso in scrittura ad alcune persone ed in sola lettura ad altre non
3010   si può soddisfare in maniera semplice.}
3011
3012 Per questo motivo erano state progressivamente introdotte nelle varie versioni
3013 di Unix dei meccanismi di gestione dei permessi dei file più flessibili, nella
3014 forma delle cosiddette \textit{Access Control List} (indicate usualmente con
3015 la sigla ACL).  Nello sforzo di standardizzare queste funzionalità era stato
3016 creato un gruppo di lavoro il cui scopo era estendere lo standard POSIX 1003
3017 attraverso due nuovi insiemi di specifiche, la POSIX 1003.1e per l'interfaccia
3018 di programmazione e la POSIX 1003.2c per i comandi di shell.
3019
3020 Gli obiettivi erano però forse troppo ambizioni, e nel gennaio del 1998 i
3021 finanziamenti vennero ritirati senza che si fosse arrivati alla definizione di
3022 uno standard, dato però che una parte della documentazione prodotta era di
3023 alta qualità venne deciso di rilasciare al pubblico la diciassettesima bozza
3024 del documento, quella che va sotto il nome di \textit{POSIX 1003.1e Draft 17},
3025 che è divenuta la base sulla quale si definiscono le cosiddette \textit{Posix
3026   ACL}.
3027
3028 A differenza di altri sistemi (ad esempio FreeBSD) nel caso di Linux si è
3029 scelto di realizzare le ACL attraverso l'uso degli
3030 \itindex{Extended~Attributes} \textit{Extended Attributes} (appena trattati in
3031 sez.~\ref{sec:file_xattr}), e fornire tutte le relative funzioni di gestione
3032 tramite una libreria, \texttt{libacl} che nasconde i dettagli implementativi
3033 delle ACL e presenta ai programmi una interfaccia che fa riferimento allo
3034 standard POSIX 1003.1e.
3035
3036 Anche in questo caso le funzioni di questa libreria non fanno parte delle
3037 \acr{glibc} e devono essere installate a parte;\footnote{la versione corrente
3038   della libreria è \texttt{libacl1}, e nel caso si usi Debian la si può
3039   installare con il pacchetto omonimo e con il collegato \texttt{libacl1-dev}
3040   per i file di sviluppo.}  pertanto se un programma le utilizza si dovrà
3041 indicare esplicitamente l'uso della libreria \texttt{libacl} invocando il
3042 compilatore con l'opzione \texttt{-lacl}. Si tenga presente inoltre che per
3043 poterle utilizzare le ACL devono essere attivate esplicitamente montando il
3044 filesystem\footnote{che deve supportarle, ma questo è ormai vero per
3045   praticamente tutti i filesystem più comuni, con l'eccezione di NFS per il
3046   quale esiste però un supporto sperimentale.} su cui le si vogliono
3047 utilizzare con l'opzione \texttt{acl} attiva. Dato che si tratta di una
3048 estensione è infatti opportuno utilizzarle soltanto laddove siano necessarie.
3049
3050 Una ACL è composta da un insieme di voci, e ciascuna voce è a sua volta
3051 costituita da un \textsl{tipo}, da un eventuale
3052 \textsl{qualificatore},\footnote{deve essere presente soltanto per le voci di
3053   tipo \const{ACL\_USER} e \const{ACL\_GROUP}.} e da un insieme di permessi.
3054 Ad ogni oggetto sul filesystem si può associare una ACL che ne governa i
3055 permessi di accesso, detta \textit{access ACL}.  Inoltre per le directory si
3056 può impostare una ACL aggiuntiva, detta \textit{default ACL}, che serve ad
3057 indicare quale dovrà essere la ACL assegnata di default nella creazione di un
3058 file all'interno della directory stessa. Come avviene per i permessi le ACL
3059 possono essere impostate solo del proprietario del file, o da un processo con
3060 la capability \index{capabilities} \const{CAP\_FOWNER}.
3061
3062 \begin{table}[htb]
3063   \centering
3064   \footnotesize
3065   \begin{tabular}{|l|p{8cm}|}
3066     \hline
3067     \textbf{Tipo} & \textbf{Descrizione} \\
3068     \hline
3069     \hline
3070     \const{ACL\_USER\_OBJ} & voce che contiene i diritti di accesso del
3071                              proprietario del file.\\
3072     \const{ACL\_USER}      & voce che contiene i diritti di accesso per
3073                              l'utente indicato dal rispettivo
3074                              qualificatore.\\  
3075     \const{ACL\_GROUP\_OBJ}& voce che contiene i diritti di accesso del
3076                              gruppo proprietario del file.\\
3077     \const{ACL\_GROUP}     & voce che contiene i diritti di accesso per
3078                              il gruppo indicato dal rispettivo
3079                              qualificatore.\\
3080     \const{ACL\_MASK}      & voce che contiene la maschera dei massimi
3081                              permessi di accesso che possono essere garantiti
3082                              da voci del tipo \const{ACL\_USER},
3083                              \const{ACL\_GROUP} e \const{ACL\_GROUP\_OBJ}.\\
3084     \const{ACL\_OTHER}     & voce che contiene i diritti di accesso di chi
3085                              non corrisponde a nessuna altra voce dell'ACL.\\
3086     \hline
3087   \end{tabular}
3088   \caption{Le costanti che identificano i tipi delle voci di una ACL.}
3089   \label{tab:acl_tag_types}
3090 \end{table}
3091
3092 L'elenco dei vari tipi di voci presenti in una ACL, con una breve descrizione
3093 del relativo significato, è riportato in tab.~\ref{tab:acl_tag_types}. Tre di
3094 questi tipi, \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e
3095 \const{ACL\_OTHER}, corrispondono direttamente ai tre permessi ordinari dei
3096 file (proprietario, gruppo proprietario e tutti gli altri) e per questo una
3097 ACL valida deve sempre contenere una ed una sola voce per ciascuno di questi
3098 tipi.
3099
3100 Una ACL può poi contenere un numero arbitrario di voci di tipo
3101 \const{ACL\_USER} e \const{ACL\_GROUP}, ciascuna delle quali indicherà i
3102 permessi assegnati all'utente e al gruppo indicato dal relativo qualificatore;
3103 ovviamente ciascuna di queste voci dovrà fare riferimento ad un utente o ad un
3104 gruppo diverso, e non corrispondenti a quelli proprietari del file. Inoltre se
3105 in una ACL esiste una voce di uno di questi due tipi è obbligatoria anche la
3106 presenza di una ed una sola voce di tipo \const{ACL\_MASK}, che negli altri
3107 casi è opzionale.
3108
3109 Quest'ultimo tipo di voce contiene la maschera dei permessi che possono essere
3110 assegnati tramite voci di tipo \const{ACL\_USER}, \const{ACL\_GROUP} e
3111 \const{ACL\_GROUP\_OBJ}; se in una di queste voci si fosse specificato un
3112 permesso non presente in \const{ACL\_MASK} questo verrebbe ignorato. L'uso di
3113 una ACL di tipo \const{ACL\_MASK} è di particolare utilità quando essa
3114 associata ad una \textit{default ACL} su una directory, in quanto i permessi
3115 così specificati verranno ereditati da tutti i file creati nella stessa
3116 directory. Si ottiene così una sorta di \itindex{umask} \textit{umask}
3117 associata ad un oggetto sul filesystem piuttosto che a un processo.
3118
3119 Dato che le ACL vengono a costituire una estensione dei permessi ordinari, uno
3120 dei problemi che si erano posti nella loro standardizzazione era appunto
3121 quello della corrispondenza fra questi e le ACL. Come accennato i permessi
3122 ordinari vengono mappati le tre voci di tipo \const{ACL\_USER\_OBJ},
3123 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} che devono essere presenti in
3124 qualunque ACL; un cambiamento ad una di queste voci viene automaticamente
3125 riflesso sui permessi ordinari dei file\footnote{per permessi ordinari si
3126   intende quelli mantenuti nell'\textit{inode}, che devono restare dato che un
3127   filesystem può essere montato senza abilitare le ACL.} e viceversa. In
3128 realtà la mappatura è diretta solo per le voci \const{ACL\_USER\_OBJ} e
3129 \const{ACL\_OTHER}, nel caso di \const{ACL\_GROUP\_OBJ} questo vale soltanto
3130 se non è presente una voce di tipo \const{ACL\_MASK}, se invece questa è
3131 presente verranno tolti dai permessi di \const{ACL\_GROUP\_OBJ} tutti quelli
3132 non presenti in \const{ACL\_MASK}.\footnote{questo diverso comportamento a
3133   seconda delle condizioni è stato introdotto dalla standardizzazione
3134   \textit{POSIX 1003.1e Draft 17} per mantenere il comportamento invariato sui
3135   sistemi dotati di ACL per tutte quelle applicazioni che sono conformi
3136   soltanto all'ordinario standard \textit{POSIX 1003.1}.}
3137
3138 Un secondo aspetto dell'incidenza delle ACL sul comportamento del sistema è
3139 quello relativo alla creazione di nuovi file,\footnote{o oggetti sul
3140   filesystem, il comportamento discusso vale per le funzioni \func{open} e
3141   \func{creat} (vedi sez.~\ref{sec:file_open}), \func{mkdir} (vedi
3142   sez.~\ref{sec:file_dir_creat_rem}), \func{mknod} e \func{mkfifo} (vedi
3143   sez.~\ref{sec:file_mknod}).} che come accennato può essere modificato dalla
3144 presenza di una \textit{default ACL} sulla directory che contiene quel file.
3145 Se questa non c'è valgono le regole usuali illustrate in
3146 sez.~\ref{sec:file_perm_management}, per cui essi sono determinati dalla
3147 \itindex{umask} \textit{umask} del processo, e la sola differenza è che i
3148 permessi ordinari da esse risultanti vengono automaticamente rimappati anche
3149 su una ACL di accesso assegnata automaticamente al nuovo file, che contiene
3150 soltanto le tre corrispondenti voci di tipo \const{ACL\_USER\_OBJ},
3151 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER}.
3152
3153 Se invece è presente una ACL di default sulla directory che contiene il nuovo
3154 file questa diventerà automaticamente la sua ACL di accesso, a meno di non
3155 aver indicato, nelle funzioni di creazione che lo consentono, uno specifico
3156 valore per i permessi ordinari;\footnote{tutte le funzioni citate in
3157   precedenza supportano un argomento \var{mode} che indichi un insieme di
3158   permessi iniziale.} in tal caso saranno eliminati dalle voci corrispondenti
3159 nella ACL tutti quelli non presenti in tale indicazione.
3160
3161 Dato che questa è la ragione che ha portato alla loro creazione, la principale
3162 modifica introdotta con la presenza della ACL è quella alle regole del
3163 controllo di accesso ai file illustrate in sez.~\ref{sec:file_perm_overview}.
3164 Come nel caso ordinario per il controllo vengono sempre utilizzati gli
3165 identificatori del gruppo \textit{effective} del processo, ma in presenza di
3166 ACL i passi attraverso i quali viene stabilito se esso ha diritto di accesso
3167 sono i seguenti:
3168 \begin{enumerate*}
3169 \item Se l'user-ID del processo è nullo l'accesso è sempre garantito senza
3170   nessun controllo.
3171 \item Se l'user-ID del processo corrisponde al proprietario del file allora:
3172   \begin{itemize*}
3173   \item se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
3174     l'accesso è consentito;
3175   \item altrimenti l'accesso è negato.
3176   \end{itemize*}
3177 \item Se l'user-ID del processo corrisponde ad un qualunque qualificatore
3178   presente in una voce \const{ACL\_USER} allora:
3179   \begin{itemize*}
3180   \item se la voce \const{ACL\_USER} corrispondente e la voce
3181     \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
3182     consentito;
3183   \item altrimenti l'accesso è negato.
3184   \end{itemize*}
3185 \item Se è il group-ID del processo o uno dei group-ID supplementari
3186   corrisponde al gruppo proprietario del file allora: 
3187   \begin{itemize*}
3188   \item se la voce \const{ACL\_GROUP\_OBJ} e una eventuale voce
3189     \const{ACL\_MASK} (se non vi sono voci di tipo \const{ACL\_GROUP} questa
3190     può non essere presente) contengono entrambe il permesso richiesto,
3191     l'accesso è consentito;
3192   \item altrimenti l'accesso è negato.
3193   \end{itemize*}
3194 \item Se è il group-ID del processo o uno dei group-ID supplementari
3195   corrisponde ad un qualunque qualificatore presente in una voce
3196   \const{ACL\_GROUP} allora:
3197   \begin{itemize*}
3198   \item se la voce \const{ACL\_GROUP} corrispondente e la voce
3199     \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
3200     consentito;
3201   \item altrimenti l'accesso è negato.
3202   \end{itemize*}
3203 \item Se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
3204   l'accesso è consentito, altrimenti l'accesso è negato.
3205 \end{enumerate*}
3206
3207 I passi di controllo vengono eseguiti esattamente in questa sequenza, e la
3208 decisione viene presa non appena viene trovata una corrispondenza con gli
3209 identificatori del processo. Questo significa che i permessi presenti in una
3210 voce di tipo \const{ACL\_USER} hanno la precedenza sui permessi ordinari
3211 associati al gruppo proprietario del file (vale a dire su
3212 \const{ACL\_GROUP\_OBJ}).
3213
3214 Per la gestione delle ACL lo standard \textit{POSIX 1003.1e Draft 17} ha
3215 previsto delle apposite funzioni ed tutta una serie di tipi di dati
3216 dedicati;\footnote{fino a definire un tipo di dato e delle costanti apposite
3217   per identificare i permessi standard di lettura, scrittura ed esecuzione.}
3218 tutte le operazioni devono essere effettuate attraverso tramite questi tipi di
3219 dati, che incapsulano tutte le informazioni contenute nelle ACL. La prima di
3220 queste funzioni che prendiamo in esame è \funcd{acl\_init}, il cui prototipo
3221 è:
3222 \begin{functions}
3223   \headdecl{sys/types.h} 
3224   \headdecl{sys/acl.h}
3225   
3226   \funcdecl{acl\_t acl\_init(int count)}
3227
3228   Inizializza un'area di lavoro per una ACL di \param{count} voci.
3229   
3230   \bodydesc{La funzione restituisce un puntatore all'area di lavoro in caso di
3231     successo e \const{NULL} in caso di errore, nel qual caso \var{errno}
3232     assumerà uno dei valori:
3233   \begin{errlist}
3234   \item[\errcode{EINVAL}] il valore di \param{count} è negativo.
3235   \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile.
3236   \end{errlist}
3237 }
3238 \end{functions}
3239
3240 La funzione alloca ed inizializza un'area di memoria che verrà usata per
3241 mantenere i dati di una ACL contenente fino ad un massimo di \const{count}
3242 voci. La funzione ritorna un valore di tipo \type{acl\_t}, da usare in tutte
3243 le altre funzioni che operano sulla ACL. La funzione si limita alla
3244 allocazione iniziale e non inserisce nessun valore nella ACL che resta vuota.
3245 Si tenga presente che pur essendo \type{acl\_t} un tipo opaco che identifica
3246 ``\textsl{l'oggetto}'' ACL, il valore restituito dalla funzione non è altro
3247 che un puntatore all'area di memoria allocata per i dati richiesti; pertanto
3248 in caso di fallimento verrà restituito un puntatore nullo e si dovrà
3249 confrontare il valore di ritorno della funzione con ``\code{(acl\_t) NULL}''.
3250
3251 Una volta che si siano completate le operazioni sui dati di una ACL la memoria
3252 allocata dovrà essere liberata esplicitamente attraverso una chiamata alla
3253 funzione \funcd{acl\_free}, il cui prototipo è:
3254 \begin{functions}
3255   \headdecl{sys/types.h} 
3256   \headdecl{sys/acl.h}
3257   
3258   \funcdecl{int acl\_free(void * obj\_p)}
3259
3260   Disalloca la memoria riservata per i dati di una ACL.
3261   
3262   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ se
3263     \param{obj\_p} non è un puntatore valido, nel qual caso \var{errno}
3264     assumerà il valore \errcode{EINVAL} 
3265 }
3266 \end{functions}
3267
3268 Si noti come la funzione richieda come argomento un puntatore di tipo
3269 ``\ctyp{void *}'', essa infatti può essere usata non solo per liberare la
3270 memoria allocata per i dati di una ACL, ma anche per quella usata per creare
3271 le stringhe di descrizione testuale delle ACL o per ottenere i valori dei
3272 qualificatori di una voce; pertanto a seconda dei casi occorrerà eseguire un
3273 \textit{cast} a ``\ctyp{void *}'' del tipo di dato di cui si vuole eseguire la
3274 disallocazione.  Si tenga presente poi che oltre a \func{acl\_init} esistono
3275 molte altre funzioni che possono allocare memoria per i dati delle ACL, è
3276 pertanto opportuno tenere traccia di tutte queste funzioni perché alla fine
3277 delle operazioni tutta la memoria allocata dovrà essere liberata con
3278 \func{acl\_free}.
3279
3280 Una volta che si abbiano a disposizione i dati di una ACL tramite il
3281 riferimento ad oggetto di tipo \type{acl\_t} questi potranno essere copiati
3282 con la funzione \funcd{acl\_dup}, il cui prototipo è:
3283 \begin{functions}
3284   \headdecl{sys/types.h} 
3285   \headdecl{sys/acl.h}
3286   
3287   \funcdecl{acl\_t acl\_dup(acl\_t acl)}
3288
3289   Crea una copia della ACL \param{acl}.
3290   
3291   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3292     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3293     \var{errno} assumerà uno dei valori:
3294   \begin{errlist}
3295   \item[\errcode{EINVAL}] l'argomento \param{acl} non è un puntatore valido
3296     per una ACL.
3297   \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile per eseguire
3298     la copia.
3299   \end{errlist}
3300 }
3301 \end{functions}
3302
3303 La funzione crea una copia dei dati della ACL indicata tramite l'argomento
3304 \param{acl}, allocando autonomamente tutto spazio necessario alla copia e
3305 restituendo un secondo oggetto di tipo \type{acl\_t} come riferimento a
3306 quest'ultima.  Valgono per questo le stesse considerazioni fatte per il valore
3307 di ritorno di \func{acl\_init}, ed in particolare il fatto che occorrerà
3308 prevedere una ulteriore chiamata esplicita a \func{acl\_free} per liberare la
3309 memoria occupata dalla copia.
3310
3311 Se si deve creare una ACL manualmente l'uso di \func{acl\_init} è scomodo,
3312 dato che la funzione restituisce una ACL vuota, una alternativa allora è usare
3313 \funcd{acl\_from\_mode} che consente di creare una ACL a partire da un valore
3314 di permessi ordinari, il prototipo della funzione è:
3315 \begin{functions}
3316   \headdecl{sys/types.h} 
3317   \headdecl{sys/acl.h}
3318   
3319   \funcdecl{acl\_t acl\_from\_mode(mode\_t mode)}
3320
3321   Crea una ACL inizializzata con i permessi di \param{mode}.
3322   
3323   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3324     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3325     \var{errno} assumerà il valore \errval{ENOMEM}.
3326
3327 }
3328 \end{functions}
3329
3330 La funzione restituisce una ACL inizializzata con le tre voci obbligatorie
3331 \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} già
3332 impostate secondo la corrispondenza ai valori dei permessi ordinari indicati
3333 dalla maschera passata nell'argomento \param{mode}. Questa funzione è una
3334 estensione usata dalle ACL di Linux e non è portabile, ma consente di
3335 semplificare l'inizializzazione in maniera molto comoda. 
3336
3337 Altre due funzioni che consentono di creare una ACL già inizializzata sono
3338 \funcd{acl\_get\_fd} e \funcd{acl\_get\_file}, che però sono per lo più
3339 utilizzate per leggere la ACL corrente di un file; i rispettivi prototipi
3340 sono:
3341 \begin{functions}
3342   \headdecl{sys/types.h} 
3343   \headdecl{sys/acl.h}
3344   
3345   \funcdecl{acl\_t acl\_get\_file(const char *path\_p, acl\_type\_t type)}
3346   \funcdecl{acl\_t acl\_get\_fd(int fd)}
3347
3348   Ottiene i dati delle ACL di un file.
3349   
3350   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3351     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3352     \var{errno} assumerà uno dei valori:
3353   \begin{errlist}
3354   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3355   \item[\errcode{ENOTSUP}] il filesystem cui fa riferimento il file non
3356     supporta le ACL.
3357   \end{errlist}
3358   ed inoltre \errval{EBADF} per \func{acl\_get\_fd}, ed \errval{EINVAL} per
3359   valori scorretti di \param{type} e tutti i possibili errori per l'accesso ad
3360   un file per \func{acl\_get\_file}.
3361
3362 }
3363 \end{functions}
3364
3365 Le due funzioni ritornano, con un oggetto di tipo \type{acl\_t}, il valore
3366 della ACL correntemente associata ad un file, che può essere identificato
3367 tramite un file descriptor usando \func{acl\_get\_fd} o con un pathname usando
3368 \func{acl\_get\_file}. Nel caso di quest'ultima funzione, che può richiedere
3369 anche la ACL relativa ad una directory, il secondo argomento \param{type}
3370 consente di specificare se si vuole ottenere la ACL di default o quella di
3371 accesso. Questo argomento deve essere di tipo \type{acl\_type\_t} e può
3372 assumere solo i due valori riportati in tab.~\ref{tab:acl_type}.
3373
3374 \begin{table}[htb]
3375   \centering
3376   \footnotesize
3377   \begin{tabular}{|l|l|}
3378     \hline
3379     \textbf{Tipo} & \textbf{Descrizione} \\
3380     \hline
3381     \hline
3382     \const{ACL\_TYPE\_ACCESS} & indica una ACL di accesso.\\
3383     \const{ACL\_TYPE\_DEFAULT}& indica una ACL di default.\\  
3384     \hline
3385   \end{tabular}
3386   \caption{Le costanti che identificano il tipo di ACL.}
3387   \label{tab:acl_type}
3388 \end{table}
3389
3390 Si tenga presente che nel caso di \func{acl\_get\_file} occorrerà che il
3391 processo chiamante abbia privilegi di accesso sufficienti a poter leggere gli
3392 attributi estesi dei file (come illustrati in sez.~\ref{sec:file_xattr});
3393 inoltre una ACL di tipo \const{ACL\_TYPE\_DEFAULT} potrà essere richiesta
3394 soltanto per una directory, e verrà restituita solo se presente, altrimenti
3395 verrà restituita una ACL vuota.
3396
3397 Infine si potrà creare una ACL direttamente dalla sua rappresentazione
3398 testuale con la funzione  \funcd{acl\_from\_text}, il cui prototipo è:
3399 \begin{functions}
3400   \headdecl{sys/types.h} 
3401   \headdecl{sys/acl.h}
3402   
3403   \funcdecl{acl\_t acl\_from\_text(const char *buf\_p)}
3404
3405   Crea una ACL a partire dalla sua rappresentazione testuale.
3406   
3407   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3408     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3409     \var{errno} assumerà uno dei valori:
3410   \begin{errlist}
3411   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3412   \item[\errcode{EINVAL}] la rappresentazione testuale all'indirizzo
3413     \param{buf\_p} non è valida.
3414   \end{errlist}
3415
3416 }
3417 \end{functions}
3418
3419 La funzione prende come argomento il puntatore ad un buffer dove si è inserita
3420 la rappresentazione testuale della ACL che si vuole creare, la memoria
3421 necessaria viene automaticamente allocata ed in caso di successo viene
3422 restituito come valore di ritorno un oggetto di tipo \type{acl\_t} con il
3423 contenuto della stessa, che come per le precedenti funzioni, dovrà essere
3424 disallocato esplicitamente al termine del suo utilizzo.
3425
3426 La rappresentazione testuale di una ACL è quella usata anche dai comandi
3427 ordinari per la gestione delle ACL (\texttt{getfacl} e \texttt{setfacl}), che
3428 prevede due diverse forme, estesa e breve, entrambe supportate da
3429 \func{acl\_from\_text}. La forma estesa prevede che sia specificata una voce
3430 per riga, nella forma:
3431 \begin{Verbatim}
3432   tipo:qualificatore:permessi
3433 \end{Verbatim}
3434 dove il tipo può essere uno fra \texttt{user}, \texttt{group}, \texttt{other}
3435 e \texttt{mask}. Il qualificatore è presente solo per \texttt{user} e
3436 \texttt{group} e indica l'utente o il gruppo a cui la voce si riferisce; i
3437 permessi sono espressi con una tripletta di lettere analoga a quella usata per
3438 i permessi dei file.\footnote{vale a dire \texttt{r} per il permesso di
3439   lettura, \texttt{w} per il permesso di scrittura, \texttt{x} per il permesso
3440   di esecuzione (scritti in quest'ordine) e \texttt{-} per l'assenza del
3441   permesso.}
3442
3443 Va precisato che i due tipi \texttt{user} e \texttt{group} sono usati
3444 rispettivamente per indicare delle voci relative ad utenti e
3445 gruppi,\footnote{cioè per voci di tipo \const{ACL\_USER\_OBJ} e
3446   \const{ACL\_USER} per \texttt{user} e \const{ACL\_GROUP\_OBJ} e
3447   \const{ACL\_GROUP} per \texttt{group}.} applicate sia a quelli proprietari
3448 del file che a quelli generici; quelle dei proprietari si riconoscono per
3449 l'assenza di un qualificatore, ed in genere si scrivono per prima delle altre.
3450 Il significato delle voci di tipo \texttt{mask} e \texttt{mark} è evidente. In
3451 questa forma si possono anche inserire dei commenti precedendoli con il
3452 carattere ``\texttt{\#}''.
3453
3454 La forma breve prevede invece la scrittura delle singole voci su una riga,
3455 separate da virgole; come specificatori del tipo di voce si possono usare le
3456 iniziali dei valori usati nella forma estesa (cioè ``\texttt{u}'',
3457 ``\texttt{g}'', ``\texttt{o}'' e ``\texttt{m}''), mentre le altri parte della
3458 voce sono le stesse. In questo caso non sono consentiti permessi.
3459
3460 Per la conversione inversa, che consente di ottenere la rappresentazione
3461 testuale di una ACL, sono invece disponibili due funzioni, la prima delle due,
3462 di uso più immediato, è \funcd{acl\_to\_text}, il cui prototipo è:
3463 \begin{functions}
3464   \headdecl{sys/types.h} 
3465   \headdecl{sys/acl.h}
3466   
3467   \funcdecl{char * acl\_to\_text(acl\_t acl, ssize\_t *len\_p)}
3468
3469   Produce la rappresentazione testuale di una ACL.
3470   
3471   \bodydesc{La funzione restituisce il puntatore ad una stringa con la
3472     rappresentazione testuale della ACL in caso di successo e
3473     \code(acl\_t){NULL} in caso di errore, nel qual caso \var{errno} assumerà
3474     uno dei valori:
3475   \begin{errlist}
3476   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3477   \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
3478   \end{errlist}
3479
3480 }
3481 \end{functions}
3482
3483 La funzione restituisce il puntatore ad una stringa terminata da NUL
3484 contenente la rappresentazione in forma estesa della ACL passata come
3485 argomento, ed alloca automaticamente la memoria necessaria. Questa dovrà poi
3486 essere liberata, quando non più necessaria, con \func{acl\_free}. Se
3487 nell'argomento \param{len\_p} si passa un valore puntatore ad una variabile
3488 intera in questa verrà restituita la dimensione della stringa con la
3489 rappresentazione testuale (non comprendente il carattere nullo finale). 
3490
3491 La seconda funzione, \funcd{acl\_to\_any\_text}, permette di controllare con
3492 dovizia di dettagli la generazione della stringa contenente la
3493 rappresentazione testuale della ACL, il suo prototipo è:
3494 \begin{functions}
3495   \headdecl{sys/types.h} 
3496   \headdecl{sys/acl.h}
3497   
3498   \funcdecl{char * acl\_to\_any\_text(acl\_t acl, const char *prefix, char
3499     separator, int options)}
3500
3501   Produce la rappresentazione testuale di una ACL.
3502
3503   \bodydesc{La funzione restituisce il puntatore ad una stringa con la
3504     rappresentazione testuale della ACL in caso di successo e \code{NULL} in
3505     caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
3506   \begin{errlist}
3507   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3508   \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
3509   \end{errlist}
3510
3511 }
3512 \end{functions}
3513
3514 La funzione converte in formato testo la ACL indicata dall'argomento
3515 \param{acl}, usando il carattere \param{separator} come separatore delle
3516 singole voci; se l'argomento \param{prefix} non è nullo la stringa da esso
3517 indicata viene utilizzata come prefisso per le singole voci. 
3518
3519 L'ultimo argomento, \param{options}, consente di controllare la modalità con
3520 cui viene generata la rappresentazione testuale. Un valore nullo fa si che
3521 vengano usati gli identificatori standard \texttt{user}, \texttt{group},
3522 \texttt{other} e \texttt{mask} con i nomi di utenti e gruppi risolti rispetto
3523 ai loro valori numerici. Altrimenti si può specificare un valore in forma di
3524 maschera binaria, da ottenere con un OR aritmetico dei valori riportati in
3525 tab.~\ref{tab:acl_to_text_options}.
3526
3527 \begin{table}[htb]
3528   \centering
3529   \footnotesize
3530   \begin{tabular}{|l|p{8cm}|}
3531     \hline
3532     \textbf{Tipo} & \textbf{Descrizione} \\
3533     \hline
3534     \hline
3535     \const{TEXT\_ABBREVIATE}     & stampa le voci in forma abbreviata.\\
3536     \const{TEXT\_NUMERIC\_IDS}   & non effettua la risoluzione numerica di
3537                                    user-ID e group-ID.\\
3538     \const{TEXT\_SOME\_EFFECTIVE}& per ciascuna voce che contiene permessi che
3539                                    vengono eliminati dalla \const{ACL\_MASK}
3540                                    viene generato un commento con i permessi 
3541                                    effettivamente risultanti; il commento è
3542                                    separato con un tabulatore.\\
3543     \const{TEXT\_ALL\_EFFECTIVE} & viene generato un commento con i permessi
3544                                    effettivi per ciascuna voce che contiene
3545                                    permessi citati nella \const{ACL\_MASK},
3546                                    anche quando questi non vengono modificati
3547                                    da essa; il commento è separato con un
3548                                    tabulatore.\\
3549     \const{TEXT\_SMART\_INDENT}  & da usare in combinazione con le precedenti
3550                                    \const{TEXT\_SOME\_EFFECTIVE} e
3551                                    \const{TEXT\_ALL\_EFFECTIVE} aumenta
3552                                    automaticamente il numero di spaziatori
3553                                    prima degli eventuali commenti in modo da
3554                                    mantenerli allineati.\\
3555     \hline
3556   \end{tabular}
3557   \caption{Possibili valori per l'argomento \param{options} di
3558     \func{acl\_to\_any\_text}.} 
3559   \label{tab:acl_to_text_options}
3560 \end{table}
3561
3562 Come per \func{acl\_to\_text} anche in questo caso il buffer contenente la
3563 rappresentazione testuale dell'ACL, di cui la funzione restituisce
3564 l'indirizzo, viene allocato automaticamente, e dovrà essere esplicitamente
3565 disallocato con una chiamata ad \func{acl\_free}. Si tenga presente infine che
3566 questa funzione è una estensione specifica di Linux, e non è presente nella
3567 bozza dello standard POSIX.1e.
3568
3569
3570 \itindend{Access~Control~List}
3571
3572
3573 % TODO trattare le ACL, la documentazione di sistema è nei pacchetti
3574 % libacl1-dev e acl 
3575 % vedi anche http://www.suse.de/~agruen/acl/linux-acls/online/
3576
3577
3578
3579 \subsection{La funzione \func{chroot}}
3580 \label{sec:file_chroot}
3581
3582 % TODO introdurre nuova sezione sulle funzionalità di sicurezza avanzate, con
3583 % dentro chroot SELinux e AppArmor ???
3584
3585 Benché non abbia niente a che fare con permessi, utenti e gruppi, la funzione
3586 \func{chroot} viene usata spesso per restringere le capacità di accesso di un
3587 programma ad una sezione limitata del filesystem, per cui ne parleremo in
3588 questa sezione.
3589
3590 Come accennato in sez.~\ref{sec:proc_fork} ogni processo oltre ad una
3591 directory di lavoro, ha anche una directory \textsl{radice}\footnote{entrambe
3592   sono contenute in due campi (rispettivamente \var{pwd} e \var{root}) di
3593   \struct{fs\_struct}; vedi fig.~\ref{fig:proc_task_struct}.} che, pur essendo
3594 di norma corrispondente alla radice dell'albero di file e directory come visto
3595 dal kernel (ed illustrato in sez.~\ref{sec:file_organization}), ha per il
3596 processo il significato specifico di directory rispetto alla quale vengono
3597 risolti i \itindsub{pathname}{assoluto}\textit{pathname}
3598 assoluti.\footnote{cioè quando un processo chiede la risoluzione di un
3599   \textit{pathname}, il kernel usa sempre questa directory come punto di
3600   partenza.} Il fatto che questo valore sia specificato per ogni processo apre
3601 allora la possibilità di modificare le modalità di risoluzione dei
3602 \textit{pathname} assoluti da parte di un processo cambiando questa directory,
3603 così come si fa coi \itindsub{pathname}{relativo}\textit{pathname} relativi
3604 cambiando la directory di lavoro.
3605
3606 Normalmente la directory radice di un processo coincide anche con la radice
3607 del filesystem usata dal kernel, e dato che il suo valore viene ereditato dal
3608 padre da ogni processo figlio, in generale i processi risolvono i
3609 \itindsub{pathname}{assoluto} \textit{pathname} assoluti a partire sempre
3610 dalla stessa directory, che corrisponde alla radice del sistema.
3611
3612 In certe situazioni però, per motivi di sicurezza, è utile poter impedire che
3613 un processo possa accedere a tutto il filesystem; per far questo si può
3614 cambiare la sua directory radice con la funzione \funcd{chroot}, il cui
3615 prototipo è:
3616 \begin{prototype}{unistd.h}{int chroot(const char *path)}
3617   Cambia la directory radice del processo a quella specificata da
3618   \param{path}.
3619   
3620 \bodydesc{La funzione restituisce zero in caso di successo e -1 per
3621     un errore, in caso di errore \var{errno} può assumere i valori:
3622   \begin{errlist}
3623   \item[\errcode{EPERM}] l'user-ID effettivo del processo non è zero.
3624   \end{errlist}
3625   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
3626   \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EACCES}, \errval{ELOOP};
3627   \errval{EROFS} e \errval{EIO}.}
3628 \end{prototype}
3629 \noindent in questo modo la directory radice del processo diventerà
3630 \param{path} (che ovviamente deve esistere) ed ogni
3631 \itindsub{pathname}{assoluto}\textit{pathname} assoluto usato dalle funzioni
3632 chiamate nel processo sarà risolto a partire da essa, rendendo impossibile
3633 accedere alla parte di albero sovrastante.  Si ha così quella che viene
3634 chiamata una \textit{chroot jail}, in quanto il processo non può più accedere
3635 a file al di fuori della sezione di albero in cui è stato
3636 \textsl{imprigionato}.
3637
3638 Solo un processo con i privilegi di amministratore può usare questa funzione,
3639 e la nuova radice, per quanto detto in sez.~\ref{sec:proc_fork}, sarà ereditata
3640 da tutti i suoi processi figli. Si tenga presente però che la funzione non
3641 cambia la directory di lavoro, che potrebbe restare fuori dalla \textit{chroot
3642   jail}.
3643
3644 Questo è il motivo per cui la funzione è efficace solo se dopo averla eseguita
3645 si cedono i privilegi di root. Infatti se per un qualche motivo il processo
3646 resta con la directory di lavoro fuori dalla \textit{chroot jail}, potrà
3647 comunque accedere a tutto il resto del filesystem usando
3648 \itindsub{pathname}{relativo}\textit{pathname} relativi, i quali, partendo
3649 dalla directory di lavoro che è fuori della \textit{chroot jail}, potranno
3650 (con l'uso di \texttt{..}) risalire fino alla radice effettiva del filesystem.
3651
3652 Ma se ad un processo restano i privilegi di amministratore esso potrà comunque
3653 portare la sua directory di lavoro fuori dalla \textit{chroot jail} in cui si
3654 trova. Basta infatti creare una nuova \textit{chroot jail} con l'uso di
3655 \func{chroot} su una qualunque directory contenuta nell'attuale directory di
3656 lavoro.  Per questo motivo l'uso di questa funzione non ha molto senso quando
3657 un processo necessita dei privilegi di root per le sue normali operazioni.
3658
3659 Un caso tipico di uso di \func{chroot} è quello di un server FTP anonimo, in
3660 questo caso infatti si vuole che il server veda solo i file che deve
3661 trasferire, per cui in genere si esegue una \func{chroot} sulla directory che
3662 contiene i file.  Si tenga presente però che in questo caso occorrerà
3663 replicare all'interno della \textit{chroot jail} tutti i file (in genere
3664 programmi e librerie) di cui il server potrebbe avere bisogno.
3665
3666
3667
3668
3669 % LocalWords:  sez like filesystem unlink MacOS Windows VMS inode kernel unistd
3670 % LocalWords:  un'etichetta int const char oldpath newpath errno EXDEV EPERM st
3671 % LocalWords:  EEXIST EMLINK EACCES ENAMETOOLONG ENOTDIR EFAULT ENOMEM EROFS ls
3672 % LocalWords:  ELOOP ENOSPC EIO pathname nlink stat vfat fsck EISDIR ENOENT cap
3673 % LocalWords:  POSIX socket fifo sticky root system call count crash nell' init
3674 % LocalWords:  descriptor remove rename rmdir stdio glibc libc NFS DT obj dup
3675 % LocalWords:  ENOTEMPTY EBUSY mount point EINVAL soft symbolic tab symlink fig
3676 % LocalWords:  dangling access chdir chmod chown creat exec lchown lstat mkdir
3677 % LocalWords:  mkfifo mknod opendir pathconf readlink truncate path buff size
3678 % LocalWords:  grub bootloader grep linux MAXSYMLINKS cat VFS sys dirname fcntl
3679 % LocalWords:  dev umask IFREG IFBLK IFCHR IFIFO SVr sgid BSD SVID NULL from to
3680 % LocalWords:  stream dirent EMFILE ENFILE dirfd SOURCE fchdir readdir struct
3681 % LocalWords:  EBADF namlen HAVE thread entry result value argument fileno ino
3682 % LocalWords:  name TYPE OFF RECLEN UNKNOWN REG SOCK CHR BLK type IFTODT DTTOIF
3683 % LocalWords:  DTYPE off reclen seekdir telldir void rewinddir closedir select
3684 % LocalWords:  namelist compar malloc qsort alphasort versionsort strcoll myls
3685 % LocalWords:  strcmp DirScan direntry while current working home shell pwd get
3686 % LocalWords:  getcwd ERANGE getwd change fd race condition tmpnam getfacl mark
3687 % LocalWords:  string tmpdir TMP tempnam pfx TMPNAME suid tmp EXCL tmpfile pid
3688 % LocalWords:  EINTR mktemp mkstemp stlib template filename XXXXXX OpenBSD buf
3689 % LocalWords:  mkdtemp fstat filedes nell'header padding ISREG ISDIR ISCHR IFMT
3690 % LocalWords:  ISBLK ISFIFO ISLNK ISSOCK IFSOCK IFLNK IFDIR ISUID UID ISGID GID
3691 % LocalWords:  ISVTX IRUSR IWUSR IXUSR IRGRP IWGRP IXGRP IROTH IWOTH IXOTH du
3692 % LocalWords:  blocks blksize holes lseek TRUNC ftruncate length lenght ETXTBSY
3693 % LocalWords:  hole atime read utime mtime write ctime modification leafnode cp
3694 % LocalWords:  make fchmod fchown utimbuf times actime modtime Mac owner uid fs
3695 % LocalWords:  gid Control List patch mandatory control execute group other all
3696 % LocalWords:  dell' effective passwd IGID locking swap saved text IRWXU IRWXG
3697 % LocalWords:  IRWXO ext reiser capability FSETID mask capabilities chroot jail
3698 % LocalWords:  FTP Di filter reiserfs Attributes Solaris Posix FreeBSD libacl
3699 % LocalWords:  XFS SELinux namespace attribute security trusted Draft Modules
3700 % LocalWords:  attributes mime ADMIN FOWNER libattr lattr getxattr lgetxattr of
3701 % LocalWords:  fgetxattr attr ssize ENOATTR ENOTSUP NUL setxattr lsetxattr list
3702 % LocalWords:  fsetxattr flags XATTR REPLACE listxattr llistxattr flistxattr by
3703 % LocalWords:  removexattr lremovexattr fremovexattr attributename  lacl acl
3704 % LocalWords:  OBJ setfacl len any prefix separator options NUMERIC IDS SMART
3705
3706 %%% Local Variables: 
3707 %%% mode: latex
3708 %%% TeX-master: "gapil"
3709 %%% End: 
3710 % LocalWords:  INDENT