Passaggio a UTF-8 dei sorgenti
[gapil.git] / filedir.tex
1 %% filedir.tex
2 %%
3 %% Copyright (C) 2000-2011 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{File e directory}
13 \label{cha:files_and_dirs}
14
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando dalle funzioni di libreria che si usano per
17 copiarli, spostarli e cambiarne i nomi. Esamineremo poi l'interfaccia che
18 permette la manipolazione dei vari attributi di file e directory ed alla fine
19 faremo una trattazione dettagliata su come è strutturato il sistema base di
20 protezioni e controllo dell'accesso ai file e sulle funzioni che ne permettono
21 la gestione. Tutto quello che riguarda invece la manipolazione del contenuto
22 dei file è lasciato ai capitoli successivi.
23
24
25
26 \section{La gestione di file e directory}
27 \label{sec:file_dir}
28
29 Come già accennato in sez.~\ref{sec:file_filesystem} in un sistema unix-like
30 la gestione dei file ha delle caratteristiche specifiche che derivano
31 direttamente dall'architettura del sistema.  In questa sezione esamineremo le
32 funzioni usate per la manipolazione di file e directory, per la creazione di
33 link simbolici e diretti, per la gestione e la lettura delle directory.
34
35 In particolare ci soffermeremo sulle conseguenze che derivano
36 dall'architettura dei filesystem illustrata nel capitolo precedente per quanto
37 riguarda il comportamento e gli effetti delle varie funzioni.
38
39
40 \subsection{Le funzioni \func{link} e \func{unlink}}
41 \label{sec:file_link}
42
43 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
44 dei nomi fittizi (come gli alias del MacOS o i collegamenti di Windows o i
45 nomi logici del VMS) che permettono di fare riferimento allo stesso file
46 chiamandolo con nomi diversi o accedendovi da directory diverse.
47
48 Questo è possibile anche in ambiente Unix, dove tali collegamenti sono
49 usualmente chiamati \textit{link}; ma data l'architettura del sistema riguardo
50 la gestione dei file (ed in particolare quanto trattato in
51 sez.~\ref{sec:file_arch_func}) ci sono due metodi sostanzialmente diversi per
52 fare questa operazione.
53
54 Come spiegato in sez.~\ref{sec:file_filesystem} l'accesso al contenuto di un
55 file su disco avviene passando attraverso il suo \itindex{inode}
56 \textit{inode}, che è la struttura usata dal kernel che lo identifica
57 univocamente all'interno di un singolo filesystem. Il nome del file che si
58 trova nella voce di una directory è solo un'etichetta, mantenuta all'interno
59 della directory, che viene associata ad un puntatore che fa riferimento al
60 suddetto \textit{inode}.
61
62 Questo significa che, fintanto che si resta sullo stesso filesystem, la
63 realizzazione di un link è immediata, ed uno stesso file può avere tanti nomi
64 diversi, dati da altrettante associazioni diverse allo stesso \itindex{inode}
65 \textit{inode} effettuate tramite ``etichette'' diverse in directory
66 diverse. Si noti anche che nessuno di questi nomi viene ad assumere una
67 particolare preferenza o originalità rispetto agli altri, in quanto tutti
68 fanno comunque riferimento allo stesso \itindex{inode} \textit{inode}.
69
70 Per aggiungere ad una directory una voce che faccia riferimento ad un
71 \itindex{inode} \textit{inode} già esistente si utilizza la funzione
72 \func{link}; si suole chiamare questo tipo di associazione un collegamento
73 diretto, o \textit{hard link}.  Il prototipo della funzione è il seguente:
74 \begin{prototype}{unistd.h}
75 {int link(const char *oldpath, const char *newpath)}
76   Crea un nuovo collegamento diretto.
77   
78   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
79     errore nel qual caso \var{errno} viene impostata ai valori:
80   \begin{errlist}
81   \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
82     riferimento ad un filesystem montato sullo stesso \textit{mount point}.
83   \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
84     \param{newpath} non supporta i link diretti o è una directory.
85   \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
86     esiste già.
87   \item[\errcode{EMLINK}] ci sono troppi link al file \param{oldpath} (il
88     numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
89     sez.~\ref{sec:sys_limits}).
90   \end{errlist}
91   ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOTDIR},
92   \errval{EFAULT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
93   \errval{ENOSPC}, \errval{EIO}.}
94 \end{prototype}
95
96 La funzione crea sul \itindex{pathname} \textit{pathname} \param{newpath} un
97 collegamento diretto al file indicato da \param{oldpath}.  Per quanto detto la
98 creazione di un nuovo collegamento diretto non copia il contenuto del file, ma
99 si limita a creare una voce nella directory specificata da \param{newpath} e
100 ad aumentare di uno il numero di riferimenti al file (riportato nel campo
101 \var{st\_nlink} della struttura \struct{stat}, vedi sez.~\ref{sec:file_stat})
102 aggiungendo il nuovo nome ai precedenti. Si noti che uno stesso file può
103 essere così chiamato con vari nomi in diverse directory.
104
105 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
106 collegamento diretto è possibile solo se entrambi i \itindex{pathname}
107 \textit{pathname} sono nello stesso filesystem; inoltre il filesystem deve
108 supportare i collegamenti diretti (il meccanismo non è disponibile ad esempio
109 con il filesystem \acr{vfat} di Windows). In realtà la funzione ha un
110 ulteriore requisito, e cioè che non solo che i due file siano sullo stesso
111 filesystem, ma anche che si faccia riferimento ad essi sullo stesso
112 \textit{mount point}.\footnote{si tenga presente infatti (vedi
113   sez.~\ref{sec:sys_file_config}) che a partire dal kernel 2.4 uno stesso
114   filesystem può essere montato più volte su directory diverse.}
115
116 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
117 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
118 l'amministratore è in grado di creare un collegamento diretto ad un'altra
119 directory: questo viene fatto perché con una tale operazione è possibile
120 creare dei \textit{loop} nel filesystem (vedi l'esempio mostrato in
121 sez.~\ref{sec:file_symlink}, dove riprenderemo il discorso) che molti programmi
122 non sono in grado di gestire e la cui rimozione diventerebbe estremamente
123 complicata (in genere per questo tipo di errori occorre far girare il
124 programma \cmd{fsck} per riparare il filesystem).
125
126 Data la pericolosità di questa operazione e la disponibilità dei link
127 simbolici che possono fornire la stessa funzionalità senza questi problemi,
128 nel caso di Linux questa capacità è stata completamente disabilitata, e al
129 tentativo di creare un link diretto ad una directory la funzione \func{link}
130 restituisce l'errore \errcode{EPERM}.
131
132 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
133 \textit{hard link} ad un link simbolico. In questo caso lo standard POSIX
134 prevederebbe che quest'ultimo venga risolto e che il collegamento sia
135 effettuato rispetto al file cui esso punta, e che venga riportato un errore
136 qualora questo non esista o non sia un file. Questo era anche il comportamento
137 iniziale di Linux ma a partire dai kernel della serie 2.0.x\footnote{per la
138   precisione il comportamento era quello previsto dallo standard POSIX fino al
139   kernel di sviluppo 1.3.56, ed è stato temporaneamente ripristinato anche
140   durante lo sviluppo della serie 2.1.x, per poi tornare al comportamento
141   attuale fino ad oggi (per riferimento si veda
142   \href{http://lwn.net/Articles/293902}
143   {\texttt{http://lwn.net/Articles/293902}}).} è stato adottato un
144 comportamento che non segue più lo standard per cui l'\textit{hard link} viene
145 creato rispetto al link simbolico, e non al file cui questo punta.
146
147 La ragione di questa differenza rispetto allo standard, presente anche in
148 altri sistemi unix-like, sono dovute al fatto che un link simbolico può fare
149 riferimento anche ad un file non esistente o a una directory, per i quali
150 l'\textit{hard link} non può essere creato, per cui la scelta di seguire il
151 link simbolico è stata ritenuta una scelta scorretta nella progettazione
152 dell'interfaccia.  Infatti se non ci fosse il comportamento adottato da Linux
153 sarebbe impossibile creare un \textit{hard link} ad un link simbolico, perché
154 la funzione lo risolverebbe e l'\textit{hard link} verrebbe creato verso la
155 destinazione. Invece evitando di seguire lo standard l'operazione diventa
156 possibile, ed anche il comportamento della funzione risulta molto più
157 comprensibile. Tanto più che se proprio se si vuole creare un \textit{hard
158   link} rispetto alla destinazione di un link simbolico è sempre possibile
159 farlo direttamente.\footnote{ciò non toglie che questo comportamento fuori
160   standard possa causare problemi, come nell'esempio descritto nell'articolo
161   citato nella nota precedente, a programmi che non si aspettano questa
162   differenza rispetto allo standard POSIX.}
163
164 La rimozione di un file (o più precisamente della voce che lo referenzia
165 all'interno di una directory) si effettua con la funzione \funcd{unlink}; il
166 suo prototipo è il seguente:
167 \begin{prototype}{unistd.h}{int unlink(const char *pathname)}
168
169   Cancella un file.
170   
171   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
172     errore, nel qual caso il file non viene toccato. La variabile
173     \var{errno} viene impostata secondo i seguenti codici di errore:
174   \begin{errlist}
175   \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una directory.
176     \footnotemark
177   \item[\errcode{EROFS}] \param{pathname} è su un filesystem montato in sola
178   lettura.
179   \item[\errcode{EISDIR}] \param{pathname} fa riferimento a una directory.
180   \end{errlist}
181   ed inoltre: \errval{EACCES}, \errval{EFAULT}, \errval{ENOENT},
182   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
183   \errval{EIO}.}
184 \end{prototype}
185
186 \footnotetext{questo è un valore specifico ritornato da Linux che non consente
187   l'uso di \func{unlink} con le directory (vedi sez.~\ref{sec:file_remove}).
188   Non è conforme allo standard POSIX, che prescrive invece l'uso di
189   \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
190   abbia privilegi sufficienti.}
191
192 La funzione cancella il nome specificato da \param{pathname} nella relativa
193 directory e decrementa il numero di riferimenti nel relativo \itindex{inode}
194 \textit{inode}. Nel caso di link simbolico cancella il link simbolico; nel
195 caso di socket, fifo o file di dispositivo \index{file!di~dispositivo} rimuove
196 il nome, ma come per i file i processi che hanno aperto uno di questi oggetti
197 possono continuare ad utilizzarlo.
198
199 Per cancellare una voce in una directory è necessario avere il permesso di
200 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
201 il diritto di esecuzione sulla directory che la contiene (affronteremo in
202 dettaglio l'argomento dei permessi di file e directory in
203 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
204 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
205 occorrerà anche essere proprietari del file o proprietari della directory (o
206 root, per cui nessuna delle restrizioni è applicata).
207
208 Una delle caratteristiche di queste funzioni è che la creazione/rimozione del
209 nome dalla directory e l'incremento/decremento del numero di riferimenti
210 \itindex{inode} nell'\textit{inode} devono essere effettuati in maniera
211 atomica (si veda sez.~\ref{sec:proc_atom_oper}) senza possibili interruzioni
212 fra le due operazioni. Per questo entrambe queste funzioni sono realizzate
213 tramite una singola system call.
214
215 Si ricordi infine che un file non viene eliminato dal disco fintanto che tutti
216 i riferimenti ad esso sono stati cancellati: solo quando il \textit{link
217   count} mantenuto \itindex{inode} nell'\textit{inode} diventa zero lo spazio
218 occupato su disco viene rimosso (si ricordi comunque che a questo si aggiunge
219 sempre un'ulteriore condizione,\footnote{come vedremo in
220   cap.~\ref{cha:file_unix_interface} il kernel mantiene anche una tabella dei
221   file aperti nei vari processi, che a sua volta contiene i riferimenti agli
222   \itindex{inode} \textit{inode} ad essi relativi. Prima di procedere alla
223   cancellazione dello spazio occupato su disco dal contenuto di un file il
224   kernel controlla anche questa tabella, per verificare che anche in essa non
225   ci sia più nessun riferimento all'\textit{inode} in questione.} e cioè che
226 non ci siano processi che abbiano il suddetto file aperto).
227
228 Questa proprietà viene spesso usata per essere sicuri di non lasciare file
229 temporanei su disco in caso di crash dei programmi; la tecnica è quella di
230 aprire il file e chiamare \func{unlink} subito dopo, in questo modo il
231 contenuto del file è sempre disponibile all'interno del processo attraverso il
232 suo file descriptor (vedi sez.~\ref{sec:file_fd}) fintanto che il processo non
233 chiude il file, ma non ne resta traccia in nessuna directory, e lo spazio
234 occupato su disco viene immediatamente rilasciato alla conclusione del
235 processo (quando tutti i file vengono chiusi).
236
237
238 \subsection{Le funzioni \func{remove} e \func{rename}}
239 \label{sec:file_remove}
240
241 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
242 \func{unlink} sulle directory; per cancellare una directory si può usare la
243 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}), oppure la
244 funzione \funcd{remove}. 
245
246 Questa è la funzione prevista dallo standard ANSI C per cancellare un file o
247 una directory (e funziona anche per i sistemi che non supportano i link
248 diretti). Per i file è identica a \func{unlink} e per le directory è identica
249 a \func{rmdir}; il suo prototipo è:
250 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
251   Cancella un nome dal filesystem. 
252   
253   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
254     errore, nel qual caso il file non viene toccato.
255     
256     I codici di errore riportati in \var{errno} sono quelli della chiamata
257     utilizzata, pertanto si può fare riferimento a quanto illustrato nelle
258     descrizioni di \func{unlink} e \func{rmdir}.}
259 \end{prototype}
260
261 La funzione utilizza la funzione \func{unlink}\footnote{questo vale usando le
262   \acr{glibc}; nelle libc4 e nelle libc5 la funzione \func{remove} è un
263   semplice alias alla funzione \func{unlink} e quindi non può essere usata per
264   le directory.} per cancellare i file e la funzione \func{rmdir} per
265 cancellare le directory; si tenga presente che per alcune implementazioni del
266 protocollo NFS utilizzare questa funzione può comportare la scomparsa di file
267 ancora in uso.
268
269 Per cambiare nome ad un file o a una directory (che devono comunque essere
270 nello stesso filesystem) si usa invece la funzione \funcd{rename},\footnote{la
271   funzione è definita dallo standard ANSI C, ma si applica solo per i file, lo
272   standard POSIX estende la funzione anche alle directory.} il cui prototipo
273 è:
274 \begin{prototype}{stdio.h}
275   {int rename(const char *oldpath, const char *newpath)} 
276   
277   Rinomina un file.
278   
279   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
280     errore, nel qual caso il file non viene toccato. La variabile
281     \var{errno} viene impostata secondo i seguenti codici di errore:
282   \begin{errlist} 
283   \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
284     \param{oldpath} non è una directory.
285   \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
286     stesso filesystem.
287   \item[\errcode{ENOTEMPTY}] \param{newpath} è una directory già esistente e
288     non vuota.
289   \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
290     parte di qualche processo (come directory di lavoro o come radice) o del
291     sistema (come mount point).
292   \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
293     \param{oldpath} o più in generale si è cercato di creare una directory come
294     sotto-directory di se stessa.
295   \item[\errcode{ENOTDIR}] uno dei componenti dei \itindex{pathname}
296     \textit{pathname} non è una directory o \param{oldpath} è una directory e
297     \param{newpath} esiste e non è una directory.
298   \end{errlist} 
299   ed inoltre \errval{EACCES}, \errval{EPERM}, \errval{EMLINK},
300   \errval{ENOENT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP} e
301   \errval{ENOSPC}.}
302 \end{prototype}
303
304 La funzione rinomina il file \param{oldpath} in \param{newpath}, eseguendo se
305 necessario lo spostamento di un file fra directory diverse. Eventuali altri
306 link diretti allo stesso file non vengono influenzati.
307
308 Il comportamento della funzione è diverso a seconda che si voglia rinominare
309 un file o una directory; se ci riferisce ad un file allora \param{newpath}, se
310 esiste, non deve essere una directory (altrimenti si ha l'errore
311 \errcode{EISDIR}). Nel caso \param{newpath} indichi un file esistente questo
312 viene cancellato e rimpiazzato (atomicamente).
313
314 Se \param{oldpath} è una directory allora \param{newpath}, se esiste, deve
315 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
316 (se non è una directory) o \errcode{ENOTEMPTY} (se non è vuota). Chiaramente
317 \param{newpath} non può contenere \param{oldpath} altrimenti si avrà un errore
318 \errcode{EINVAL}.
319
320 Se \param{oldpath} si riferisce ad un link simbolico questo sarà rinominato; se
321 \param{newpath} è un link simbolico verrà cancellato come qualunque altro
322 file.  Infine qualora \param{oldpath} e \param{newpath} siano due nomi dello
323 stesso file lo standard POSIX prevede che la funzione non dia errore, e non
324 faccia nulla, lasciando entrambi i nomi; Linux segue questo standard, anche
325 se, come fatto notare dal manuale delle \textit{glibc}, il comportamento più
326 ragionevole sarebbe quello di cancellare \param{oldpath}.
327
328 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
329 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
330 può esistere cioè nessun istante in cui un altro processo può trovare attivi
331 entrambi i nomi dello stesso file, o, in caso di sostituzione di un file
332 esistente, non trovare quest'ultimo prima che la sostituzione sia stata
333 eseguita.
334
335 In ogni caso se \param{newpath} esiste e l'operazione fallisce per un qualche
336 motivo (come un crash del kernel), \func{rename} garantisce di lasciare
337 presente un'istanza di \param{newpath}. Tuttavia nella sovrascrittura potrà
338 esistere una finestra in cui sia \param{oldpath} che \param{newpath} fanno
339 riferimento allo stesso file.
340
341
342 \subsection{I link simbolici}
343 \label{sec:file_symlink}
344
345 Come abbiamo visto in sez.~\ref{sec:file_link} la funzione \func{link} crea
346 riferimenti agli \itindex{inode} \textit{inode}, pertanto può funzionare
347 soltanto per file che risiedono sullo stesso filesystem e solo per un
348 filesystem di tipo Unix.  Inoltre abbiamo visto che in Linux non è consentito
349 eseguire un link diretto ad una directory.
350
351 Per ovviare a queste limitazioni i sistemi Unix supportano un'altra forma di
352 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
353 come avviene in altri sistemi operativi, dei file speciali che contengono
354 semplicemente il riferimento ad un altro file (o directory). In questo modo è
355 possibile effettuare link anche attraverso filesystem diversi, a file posti in
356 filesystem che non supportano i link diretti, a delle directory, ed anche a
357 file che non esistono ancora.
358
359 Il sistema funziona in quanto i link simbolici sono riconosciuti come tali dal
360 kernel\footnote{è uno dei diversi tipi di file visti in
361   tab.~\ref{tab:file_file_types}, contrassegnato come tale
362   nell'\textit{inode}, e riconoscibile dal valore del campo \var{st\_mode}
363   della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).}  per cui
364 alcune funzioni di libreria (come \func{open} o \func{stat}) quando ricevono
365 come argomento un link simbolico vengono automaticamente applicate al file da
366 esso specificato.  La funzione che permette di creare un nuovo link simbolico
367 è \funcd{symlink}, ed il suo prototipo è:
368 \begin{prototype}{unistd.h}
369   {int symlink(const char *oldpath, const char *newpath)} 
370   Crea un nuovo link simbolico di nome \param{newpath} il cui contenuto è
371   \param{oldpath}.
372   
373   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
374     errore, nel qual caso la variabile \var{errno} assumerà i valori:
375   \begin{errlist}
376   \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
377     supporta i link simbolici.
378   \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
379     \param{oldpath} è una stringa vuota.
380   \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
381   \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
382     lettura.
383   \end{errlist}
384   ed inoltre \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
385   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{ENOSPC} e
386   \errval{EIO}.}
387 \end{prototype}
388
389 Si tenga presente che la funzione non effettua nessun controllo sull'esistenza
390 di un file di nome \param{oldpath}, ma si limita ad inserire quella stringa
391 nel link simbolico. Pertanto un link simbolico può anche riferirsi ad un file
392 che non esiste: in questo caso si ha quello che viene chiamato un
393 \textit{dangling link}, letteralmente un \textsl{link ciondolante}.
394
395 Come accennato i link simbolici sono risolti automaticamente dal kernel
396 all'invocazione delle varie system call; in tab.~\ref{tab:file_symb_effect} si
397 è riportato un elenco dei comportamenti delle varie funzioni di libreria che
398 operano sui file nei confronti della risoluzione dei link simbolici,
399 specificando quali seguono il link simbolico e quali invece possono operare
400 direttamente sul suo contenuto.
401 \begin{table}[htb]
402   \centering
403   \footnotesize
404   \begin{tabular}[c]{|l|c|c|}
405     \hline
406     \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
407     \hline 
408     \hline 
409     \func{access}   & $\bullet$ & --        \\
410     \func{chdir}    & $\bullet$ & --        \\
411     \func{chmod}    & $\bullet$ & --        \\
412     \func{chown}    & --        & $\bullet$ \\
413     \func{creat}    & $\bullet$ & --        \\
414     \func{exec}     & $\bullet$ & --        \\
415     \func{lchown}   & $\bullet$ & --        \\
416     \func{link}\footnotemark & --        & $\bullet$ \\
417     \func{lstat}    & --        & $\bullet$ \\
418     \func{mkdir}    & $\bullet$ & --        \\
419     \func{mkfifo}   & $\bullet$ & --        \\
420     \func{mknod}    & $\bullet$ & --        \\
421     \func{open}     & $\bullet$ & --        \\
422     \func{opendir}  & $\bullet$ & --        \\
423     \func{pathconf} & $\bullet$ & --        \\
424     \func{readlink} & --        & $\bullet$ \\
425     \func{remove}   & --        & $\bullet$ \\
426     \func{rename}   & --        & $\bullet$ \\
427     \func{stat}     & $\bullet$ & --        \\
428     \func{truncate} & $\bullet$ & --        \\
429     \func{unlink}   & --        & $\bullet$ \\
430     \hline 
431   \end{tabular}
432   \caption{Uso dei link simbolici da parte di alcune funzioni.}
433   \label{tab:file_symb_effect}
434 \end{table}
435
436 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
437   dallo standard POSIX, si veda quanto detto in sez.~\ref{sec:file_link}.}
438
439 Si noti che non si è specificato il comportamento delle funzioni che operano
440 con i file descriptor, in quanto la risoluzione del link simbolico viene in
441 genere effettuata dalla funzione che restituisce il file descriptor
442 (normalmente la \func{open}, vedi sez.~\ref{sec:file_open}) e tutte le
443 operazioni seguenti fanno riferimento solo a quest'ultimo.
444
445 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
446 \func{open} seguono i link simbolici, occorrono funzioni apposite per accedere
447 alle informazioni del link invece che a quelle del file a cui esso fa
448 riferimento. Quando si vuole leggere il contenuto di un link simbolico si usa
449 la funzione \funcd{readlink}, il cui prototipo è:
450 \begin{prototype}{unistd.h}
451 {int readlink(const char *path, char *buff, size\_t size)} 
452   Legge il contenuto del link simbolico indicato da \param{path} nel buffer
453   \param{buff} di dimensione \param{size}.
454   
455   \bodydesc{La funzione restituisce il numero di caratteri letti dentro
456     \param{buff} o -1 per un errore, nel qual caso la variabile
457     \var{errno} assumerà i valori:
458   \begin{errlist}
459   \item[\errcode{EINVAL}] \param{path} non è un link simbolico o \param{size}
460     non è positiva.
461   \end{errlist}
462   ed inoltre \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
463   \errval{EACCES}, \errval{ELOOP}, \errval{EIO}, \errval{EFAULT} e
464   \errval{ENOMEM}.}
465 \end{prototype}
466
467 La funzione apre il link simbolico, ne legge il contenuto, lo scrive nel
468 buffer, e lo richiude. Si tenga presente che la funzione non termina la
469 stringa con un carattere nullo e la tronca alla dimensione specificata da
470 \param{size} per evitare di sovrascrivere oltre le dimensioni del buffer.
471
472 \begin{figure}[htb]
473   \centering
474   \includegraphics[width=8.5cm]{img/link_loop}
475   \caption{Esempio di loop nel filesystem creato con un link simbolico.}
476   \label{fig:file_link_loop}
477 \end{figure}
478
479 Un caso comune che si può avere con i link simbolici è la creazione dei
480 cosiddetti \textit{loop}. La situazione è illustrata in
481 fig.~\ref{fig:file_link_loop}, che riporta la struttura della directory
482 \file{/boot}. Come si vede si è creato al suo interno un link simbolico che
483 punta di nuovo a \file{/boot}.\footnote{il loop mostrato in
484   fig.~\ref{fig:file_link_loop} è un usato per poter permettere a \cmd{grub}
485   (un bootloader in grado di leggere direttamente da vari filesystem il file
486   da lanciare come sistema operativo) di vedere i file contenuti nella
487   directory \file{/boot} con lo stesso \textit{pathname} con cui verrebbero
488   visti dal sistema operativo, anche se essi si trovano, come accade spesso,
489   su una partizione separata (che \cmd{grub}, all'avvio, vede come radice).}
490
491 Questo può causare problemi per tutti quei programmi che effettuano la
492 scansione di una directory senza tener conto dei link simbolici, ad esempio se
493 lanciassimo un comando del tipo \code{grep -r linux *}, il loop nella
494 directory porterebbe il comando ad esaminare \file{/boot}, \file{/boot/boot},
495 \file{/boot/boot/boot} e così via.
496
497 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
498 un \itindex{pathname} \textit{pathname} possano essere seguiti un numero
499 limitato di link simbolici, il cui valore limite è specificato dalla costante
500 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
501 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}.
502
503 Un punto da tenere sempre presente è che, come abbiamo accennato, un link
504 simbolico può fare riferimento anche ad un file che non esiste; ad esempio
505 possiamo creare un file temporaneo nella nostra directory con un link del
506 tipo:
507 \begin{verbatim}
508 $ ln -s /tmp/tmp_file temporaneo
509 \end{verbatim}%$
510 anche se \file{/tmp/tmp\_file} non esiste. Questo può generare confusione, in
511 quanto aprendo in scrittura \file{temporaneo} verrà creato
512 \file{/tmp/tmp\_file} e scritto; ma accedendo in sola lettura a
513 \file{temporaneo}, ad esempio con \cmd{cat}, otterremmo:
514 \begin{verbatim}
515 $ cat temporaneo
516 cat: temporaneo: No such file or directory
517 \end{verbatim}%$
518 con un errore che può sembrare sbagliato, dato che un'ispezione con \cmd{ls}
519 ci mostrerebbe invece l'esistenza di \file{temporaneo}.
520
521
522 \subsection{La creazione e la cancellazione delle directory} 
523 \label{sec:file_dir_creat_rem}
524
525 Benché in sostanza le directory non siano altro che dei file contenenti
526 elenchi di nomi ed \itindex{inode} \textit{inode}, non è possibile trattarle
527 come file ordinari e devono essere create direttamente dal kernel attraverso
528 una opportuna system call.\footnote{questo è quello che permette anche,
529   attraverso l'uso del VFS, l'utilizzo di diversi formati per la gestione dei
530   suddetti elenchi.}  La funzione usata per creare una directory è
531 \funcd{mkdir}, ed il suo prototipo è:
532 \begin{functions}
533   \headdecl{sys/stat.h}
534   \headdecl{sys/types.h}
535   \funcdecl{int mkdir(const char *dirname, mode\_t mode)} 
536
537   Crea una nuova directory.
538   
539   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
540     errore, nel qual caso \var{errno} assumerà i valori:
541   \begin{errlist}
542   \item[\errcode{EEXIST}] un file (o una directory) con quel nome esiste di
543     già.
544   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
545     cui si vuole inserire la nuova directory.
546   \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
547     directory contiene troppi file; sotto Linux questo normalmente non avviene
548     perché il filesystem standard consente la creazione di un numero di file
549     maggiore di quelli che possono essere contenuti nel disco, ma potendo
550     avere a che fare anche con filesystem di altri sistemi questo errore può
551     presentarsi.
552   \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
553     la nuova directory o si è esaurita la quota disco dell'utente.
554   \end{errlist}
555   ed inoltre anche \errval{EPERM}, \errval{EFAULT}, \errval{ENAMETOOLONG},
556   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
557   \errval{EROFS}.}
558 \end{functions}
559
560 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
561 standard presenti in ogni directory (cioè ``\file{.}'' e ``\file{..}''), con
562 il nome indicato dall'argomento \param{dirname}. Il nome può essere indicato
563 sia come \itindex{pathname} \textit{pathname} assoluto che come
564 \itindex{pathname} \textit{pathname} relativo.
565
566 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
567 directory viene creata sono specificati dall'argomento \param{mode}, i cui
568 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
569 tenga presente che questi sono modificati dalla maschera di creazione dei file
570 (si veda sez.~\ref{sec:file_perm_management}).  La titolarità della nuova
571 directory è impostata secondo quanto riportato in
572 sez.~\ref{sec:file_ownership_management}.
573
574 La funzione che permette la cancellazione di una directory è invece
575 \funcd{rmdir}, ed il suo prototipo è:
576 \begin{prototype}{sys/stat.h}{int rmdir(const char *dirname)} 
577   Cancella una directory.
578
579   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
580     errore, nel qual caso \var{errno} assumerà i valori:
581   \begin{errlist}
582   \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
583     directory, oppure la directory che contiene \param{dirname} ha lo
584     \itindex{sticky~bit} \textit{sticky bit} impostato e l'user-ID effettivo
585     del processo non corrisponde al proprietario della directory.
586   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
587     che contiene la directory che si vuole cancellare, o non c'è il permesso
588     di attraversare (esecuzione) una delle directory specificate in
589     \param{dirname}.
590   \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o la
591     radice di qualche processo.
592   \item[\errcode{ENOTEMPTY}] la directory non è vuota.
593   \end{errlist}
594   ed inoltre anche \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
595   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{EROFS}.}
596 \end{prototype}
597
598 La funzione cancella la directory \param{dirname}, che deve essere vuota (la
599 directory deve cioè contenere soltanto le due voci standard ``\file{.}'' e
600 ``\file{..}'').  Il nome può essere indicato con il \itindex{pathname}
601 \textit{pathname} assoluto o relativo.
602
603 La modalità con cui avviene la cancellazione è analoga a quella di
604 \func{unlink}: fintanto che il numero di link \itindex{inode}
605 all'\textit{inode} della directory non diventa nullo e nessun processo ha la
606 directory aperta lo spazio occupato su disco non viene rilasciato. Se un
607 processo ha la directory aperta la funzione rimuove il link \itindex{inode}
608 all'\textit{inode} e nel caso sia l'ultimo, pure le voci standard ``\file{.}''
609 e ``\file{..}'', a questo punto il kernel non consentirà di creare più nuovi
610 file nella directory.
611
612
613 \subsection{La creazione di file speciali}
614 \label{sec:file_mknod}
615
616 \index{file!di~dispositivo|(} 
617
618 Finora abbiamo parlato esclusivamente di file, directory e link simbolici; in
619 sez.~\ref{sec:file_file_types} abbiamo visto però che il sistema prevede pure
620 degli altri tipi di file speciali, come i file di dispositivo, le fifo ed i
621 socket (questi ultimi sono un caso a parte, essendo associati anche alla
622 comunicazione via rete, per cui ci saranno trattati in dettaglio a partire da
623 cap.~\ref{cha:socket_intro}).
624
625 La manipolazione delle caratteristiche di questi diversi tipi di file e la
626 loro cancellazione può essere effettuata con le stesse funzioni che operano
627 sui file regolari; ma quando li si devono creare sono necessarie delle
628 funzioni apposite. La prima di queste funzioni è \funcd{mknod}, il cui
629 prototipo è:
630 \begin{functions}
631   \headdecl{sys/types.h}
632   \headdecl{sys/stat.h}
633   \headdecl{fcntl.h}
634   \headdecl{unistd.h}
635   \funcdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)} 
636   
637   Crea un \textit{inode} del tipo specificato sul filesystem.
638   
639   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
640     errore, nel qual caso \var{errno} assumerà i valori:
641   \begin{errlist}
642   \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
643     l'\texttt{inode}, o il filesystem su cui si è cercato di
644     creare \param{pathname} non supporta l'operazione.
645   \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
646     fifo, un socket o un dispositivo.
647   \item[\errcode{EEXIST}] \param{pathname} esiste già o è un link simbolico.
648   \end{errlist}
649   ed inoltre anche \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
650   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
651   \errval{ENOSPC}, \errval{EROFS}.}
652 \end{functions}
653
654 La funzione, come suggerisce il nome, permette di creare un ``\textsl{nodo}''
655 sul filesystem, e viene in genere utilizzata per creare i file di dispositivo,
656 ma si può usare anche per creare file regolari. L'argomento
657 \param{mode} specifica sia il tipo di file che si vuole creare che i relativi
658 permessi, secondo i valori riportati in tab.~\ref{tab:file_mode_flags}, che
659 vanno combinati con un OR binario. I permessi sono comunque modificati nella
660 maniera usuale dal valore di \itindex{umask} \textit{umask} (si veda
661 sez.~\ref{sec:file_perm_management}).
662
663 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
664 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
665 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
666 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
667 per una fifo;\footnote{con Linux la funzione non può essere usata per creare
668   directory o link simbolici, si dovranno usare le funzioni \func{mkdir} e
669   \func{symlink} a questo dedicate.} un valore diverso comporterà l'errore
670 \errcode{EINVAL}.  
671
672 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
673 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
674 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
675 valore verrà ignorato.  Solo l'amministratore può creare un file di
676 dispositivo usando questa funzione (il processo deve avere la
677 \itindex{capabilities} \textit{capability} \const{CAP\_MKNOD}), ma in
678 Linux\footnote{questo è un comportamento specifico di Linux, la funzione non è
679   prevista dallo standard POSIX.1 originale, mentre è presente in SVr4 e
680   4.4BSD, ma esistono differenze nei comportamenti e nei codici di errore,
681   tanto che questa è stata introdotta in POSIX.1-2001 con una nota che la
682   definisce portabile solo quando viene usata per creare delle fifo, ma
683   comunque deprecata essendo utilizzabile a tale scopo la specifica
684   \func{mkfifo}.} l'uso per la creazione di un file ordinario, di una fifo o
685 di un socket è consentito anche agli utenti normali.
686
687 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
688 al proprietario e al gruppo del processo che li ha creati, a meno che non si
689 sia attivato il bit \acr{sgid} per la directory o sia stata attivata la
690 semantica BSD per il filesystem (si veda
691 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
692 \itindex{inode} l'\textit{inode}.
693
694 Nella creazione di un file di dispositivo occorre poi specificare
695 correttamente il valore di \param{dev}; questo infatti è di tipo
696 \type{dev\_t}, che è un tipo primitivo (vedi
697 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
698 \textsl{numero} di dispositivo; il kernel infatti identifica ciascun
699 dispositivo con un valore numerico. Originariamente questo era un intero a 16
700 bit diviso in due parti di 8 bit chiamate rispettivamente
701 \itindex{major~number} \textit{major number} e \itindex{minor~number}
702 \textit{minor number}, che sono poi i due numeri mostrati dal comando
703 \texttt{ls -l} al posto della dimensione quando lo si esegue su un file di
704 dispositivo.
705
706 Il \itindex{major~number} \textit{major number} identifica una classe di
707 dispositivi (ad esempio la seriale, o i dischi IDE) e serve in sostanza per
708 indicare al kernel quale è il modulo che gestisce quella classe di
709 dispositivi; per identificare uno specifico dispositivo di quella classe (ad
710 esempio una singola porta seriale, o una partizione di un disco) si usa invece
711 il \itindex{minor~number} \textit{minor number}. L'elenco aggiornato di questi
712 numeri con le relative corrispondenze ai vari dispositivi può essere trovato
713 nel file \texttt{Documentation/devices.txt} allegato alla documentazione dei
714 sorgenti del kernel.
715
716 Data la crescita nel numero di dispositivi supportati, ben presto il limite
717 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
718 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
719 \type{dev\_t}, con delle dimensioni passate a 12 bit per il
720 \itindex{major~number} \textit{major number} e 20 bit per il
721 \itindex{minor~number} \textit{minor number}. La transizione però ha anche
722 comportato il passaggio di \type{dev\_t} a tipo opaco, e la necessità di
723 specificare il numero tramite delle opportune macro, così da non avere
724 problemi di compatibilità con eventuali ulteriori estensioni.  
725
726 Le macro sono definite nel file \file{sys/sysmacros.h}, che viene
727 automaticamente incluso quando si include \file{sys/types.h}; si possono
728 pertanto ottenere i valori del \itindex{major~number} \textit{major number} e
729 \itindex{minor~number} \textit{minor number} di un dispositivo rispettivamente
730 con le macro \macro{major} e \macro{minor}:
731 \begin{functions}
732   \headdecl{sys/types.h}
733   \funcdecl{int \macro{major}(dev\_t dev)}
734   Restituisce il \itindex{major~number} \textit{major number} del dispositivo
735   \param{dev}.
736   
737   \funcdecl{int \macro{minor}(dev\_t dev)}
738   Restituisce il \itindex{minor~number} \textit{minor number} del dispositivo
739   \param{dev}.
740 \end{functions}
741 \noindent mentre una volta che siano noti \itindex{major~number} \textit{major
742   number} e \itindex{minor~number} \textit{minor number} si potrà costruire il
743 relativo identificativo con la macro \macro{makedev}:
744 \begin{functions}
745   \headdecl{sys/types.h}
746   \funcdecl{dev\_t \macro{minor}(int major, int minor)}
747
748   Restituisce l'identificativo di un dispositivo dati \itindex{major~number}
749   \textit{major number} e \itindex{minor~number} \textit{minor number}.
750 \end{functions}
751
752 \index{file!di~dispositivo|)}
753
754 Infine con lo standard POSIX.1-2001 è stata introdotta una funzione specifica
755 per creare una fifo (tratteremo le fifo in in sez.~\ref{sec:ipc_named_pipe});
756 la funzione è \funcd{mkfifo} ed il suo prototipo è:
757 \begin{functions}
758   \headdecl{sys/types.h} \headdecl{sys/stat.h} 
759   
760   \funcdecl{int mkfifo(const char *pathname, mode\_t mode)} 
761   
762   Crea una fifo.
763   
764   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
765     errore, nel qual caso \var{errno} assumerà i valori \errval{EACCES},
766     \errval{EEXIST}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC},
767     \errval{ENOTDIR} e \errval{EROFS}.}
768 \end{functions}
769
770 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
771 per \func{mknod} il file \param{pathname} non deve esistere (neanche come link
772 simbolico); al solito i permessi specificati da \param{mode} vengono
773 modificati dal valore di \itindex{umask} \textit{umask}.
774
775
776
777 \subsection{Accesso alle directory}
778 \label{sec:file_dir_read}
779
780 Benché le directory alla fine non siano altro che dei file che contengono
781 delle liste di nomi ed \itindex{inode} \textit{inode}, per il ruolo che
782 rivestono nella struttura del sistema, non possono essere trattate come dei
783 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
784 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
785 può essere un processo a inserirvi direttamente delle voci con le usuali
786 funzioni di scrittura.
787
788 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
789 kernel, sono molte le situazioni in cui i processi necessitano di poterne
790 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
791 in sez.~\ref{sec:file_open} che è possibile aprire una directory come se fosse
792 un file, anche se solo in sola lettura) in generale il formato con cui esse
793 sono scritte può dipendere dal tipo di filesystem, tanto che, come riportato
794 in tab.~\ref{tab:file_file_operations}, il VFS del kernel prevede una apposita
795 funzione per la lettura delle directory.
796
797 Tutto questo si riflette nello standard POSIX\footnote{le funzioni sono
798   previste pure in BSD e SVID.} che ha introdotto una apposita interfaccia per
799 la lettura delle directory, basata sui cosiddetti \textit{directory stream}
800 (chiamati così per l'analogia con i file stream dell'interfaccia standard ANSI
801 C di cap.~\ref{cha:files_std_interface}). La prima funzione di questa
802 interfaccia è \funcd{opendir}, il cui prototipo è:
803 \begin{functions}
804   \headdecl{sys/types.h} \headdecl{dirent.h} 
805   
806   \funcdecl{DIR * opendir(const char *dirname)} 
807   
808   Apre un \textit{directory stream}.
809   
810   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
811     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
812     assumerà i valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
813     \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}.}
814 \end{functions}
815
816 La funzione apre un \textit{directory stream} per la directory
817 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
818 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
819 \textit{directory stream}) da usare per tutte le operazioni successive, la
820 funzione inoltre posiziona lo stream sulla prima voce contenuta nella
821 directory.
822
823 Dato che le directory sono comunque dei file, in alcuni casi può servire
824 conoscere il \textit{file descriptor} associato ad un \textit{directory
825   stream}, a questo scopo si può usare la funzione \funcd{dirfd}, il cui
826 prototipo è:
827 \begin{functions}
828   \headdecl{sys/types.h} \headdecl{dirent.h} 
829   
830   \funcdecl{int dirfd(DIR * dir)} 
831   
832   Restituisce il file descriptor associato ad un \textit{directory stream}.
833   
834   \bodydesc{La funzione restituisce il file descriptor (un valore positivo) in
835     caso di successo e -1 in caso di errore.}
836 \end{functions}
837
838 La funzione\footnote{questa funzione è una estensione di BSD non presente in
839   POSIX, introdotta con BSD 4.3-Reno; è presente in Linux con le libc5 (a
840   partire dalla versione 5.1.2) e con le \acr{glibc}.} restituisce il file
841 descriptor associato al \textit{directory stream} \param{dir}, essa è
842 disponibile solo definendo \macro{\_BSD\_SOURCE} o \macro{\_SVID\_SOURCE}. Di
843 solito si utilizza questa funzione in abbinamento alla funzione \func{fchdir}
844 per cambiare la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}) a
845 quella relativa allo stream che si sta esaminando.
846
847 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
848 possibile associarvi un \textit{directory stream} con la funzione
849 \funcd{fopendir},\footnote{questa funzione è però disponibile solo a partire
850   dalla versione 2.4 delle \acr{glibc}, e pur essendo candidata per
851   l'inclusione nella successiva revisione dello standard POSIX.1-2001, non è
852   ancora presente in nessuna specifica formale.} il cui prototipo è:
853 \begin{functions}
854   \headdecl{sys/types.h}
855   \headdecl{dirent.h} 
856   
857   \funcdecl{DIR * fopendir(int fd)} 
858   
859   Associa un \textit{directory stream} al file descriptor \param{fd}.
860   
861   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
862     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
863     assumerà il valore \errval{EBADF}.}
864 \end{functions}
865
866 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
867   stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
868 stato aperto in precedenza e la funzione darà un errore qualora questo non
869 corrisponda ad una directory. Una volta utilizzata il file descriptor verrà
870 usato dalle funzioni che operano sul \textit{directory stream} e non deve
871 essere più utilizzato direttamente all'interno del proprio programma.
872
873 Una volta che si sia aperto un \textit{directory stream} la lettura del
874 contenuto della directory viene effettuata attraverso la funzione
875 \funcd{readdir}, il suo prototipo è:
876 \begin{functions}
877   \headdecl{sys/types.h} \headdecl{dirent.h} 
878   
879   \funcdecl{struct dirent *readdir(DIR *dir)}
880   
881   Legge una voce dal \textit{directory stream}.
882   
883   \bodydesc{La funzione restituisce il puntatore alla struttura contenente i
884     dati in caso di successo e \val{NULL} altrimenti, in caso di descrittore
885     non valido \var{errno} assumerà il valore \errval{EBADF}, il valore
886     \val{NULL} viene restituito anche quando si raggiunge la fine dello
887     stream.}
888 \end{functions}
889
890 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
891 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
892 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
893 esaurite tutte le voci in essa presenti.
894
895 I dati vengono memorizzati in una struttura \struct{dirent} (la cui
896 definizione\footnote{la definizione è quella usata a Linux, che si trova nel
897   file \file{/usr/include/bits/dirent.h}, essa non contempla la presenza del
898   campo \var{d\_namlen} che indica la lunghezza del nome del file (ed infatti
899   la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN} non è definita).}  è riportata in
900 fig.~\ref{fig:file_dirent_struct}). La funzione restituisce il puntatore alla
901 struttura; si tenga presente però che quest'ultima è allocata staticamente,
902 per cui viene sovrascritta tutte le volte che si ripete la lettura di una voce
903 sullo stesso \textit{directory stream}.
904
905 Di questa funzione esiste anche una versione \index{funzioni!rientranti}
906 rientrante, \func{readdir\_r}, che non usa una struttura allocata
907 staticamente, e può essere utilizzata anche con i \itindex{thread}
908 \textit{thread}, il suo prototipo è:
909 \begin{functions}
910   \headdecl{sys/types.h} \headdecl{dirent.h} 
911   
912   \funcdecl{int readdir\_r(DIR *dir, struct dirent *entry,
913           struct dirent **result)}
914   
915   Legge una voce dal \textit{directory stream}.
916   
917   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
918     errore, gli errori sono gli stessi di \func{readdir}.}
919 \end{functions}
920
921 La funzione restituisce in \param{result} (come
922 \itindex{value~result~argument} \textit{value result argument}) l'indirizzo
923 dove sono stati salvati i dati, che di norma corrisponde a quello della
924 struttura precedentemente allocata e specificata dall'argomento \param{entry}
925 (anche se non è assicurato che la funzione usi lo spazio fornito dall'utente).
926
927 \begin{figure}[!htb]
928   \footnotesize \centering
929   \begin{minipage}[c]{15cm}
930     \includestruct{listati/dirent.c}
931   \end{minipage} 
932   \normalsize 
933   \caption{La struttura \structd{dirent} per la lettura delle informazioni dei 
934     file.}
935   \label{fig:file_dirent_struct}
936 \end{figure}
937
938 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
939 presenti nella directory; sia BSD che SVr4\footnote{lo standard POSIX prevede
940   invece solo la presenza del campo \var{d\_fileno}, identico \var{d\_ino},
941   che in Linux è definito come alias di quest'ultimo. Il campo \var{d\_name} è
942   considerato dipendente dall'implementazione.} prevedono che siano sempre
943 presenti il campo \var{d\_name}, che contiene il nome del file nella forma di
944 una stringa terminata da uno zero,\footnote{lo standard POSIX non specifica
945   una lunghezza, ma solo un limite \const{NAME\_MAX}; in SVr4 la lunghezza del
946   campo è definita come \code{NAME\_MAX+1} che di norma porta al valore di 256
947   byte usato anche in Linux.} ed il campo \var{d\_ino}, che contiene il numero
948 di \itindex{inode} \textit{inode} cui il file è associato (di solito
949 corrisponde al campo \var{st\_ino} di \struct{stat}).
950
951 La presenza di ulteriori campi opzionali è segnalata dalla definizione di
952 altrettante macro nella forma \code{\_DIRENT\_HAVE\_D\_XXX} dove \code{XXX} è
953 il nome del relativo campo; nel nostro caso sono definite le macro
954 \macro{\_DIRENT\_HAVE\_D\_TYPE}, \macro{\_DIRENT\_HAVE\_D\_OFF} e
955 \macro{\_DIRENT\_HAVE\_D\_RECLEN}.
956
957 \begin{table}[htb]
958   \centering
959   \footnotesize
960   \begin{tabular}[c]{|l|l|}
961     \hline
962     \textbf{Valore} & \textbf{Tipo di file} \\
963     \hline
964     \hline
965     \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
966     \const{DT\_REG}     & File normale.\\
967     \const{DT\_DIR}     & Directory.\\
968     \const{DT\_FIFO}    & Fifo.\\
969     \const{DT\_SOCK}    & Socket.\\
970     \const{DT\_CHR}     & Dispositivo a caratteri.\\
971     \const{DT\_BLK}     & Dispositivo a blocchi.\\
972     \hline    
973   \end{tabular}
974   \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
975     della struttura \struct{dirent}.}
976   \label{tab:file_dtype_macro}
977 \end{table}
978
979 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
980 indica il tipo di file (fifo, directory, link simbolico, ecc.). I suoi
981 possibili valori\footnote{fino alla versione 2.1 delle \acr{glibc} questo
982   campo, pur presente nella struttura, non era implementato, e resta sempre al
983   valore \const{DT\_UNKNOWN}.}  sono riportati in
984 tab.~\ref{tab:file_dtype_macro}; per la conversione da e verso l'analogo
985 valore mantenuto dentro il campo \var{st\_mode} di \struct{stat} sono definite
986 anche due macro di conversione \macro{IFTODT} e \macro{DTTOIF}:
987 \begin{functions}
988   \funcdecl{int IFTODT(mode\_t MODE)} Converte il tipo di file dal formato di
989   \var{st\_mode} a quello di \var{d\_type}.
990   
991   \funcdecl{mode\_t DTTOIF(int DTYPE)} Converte il tipo di file dal formato di
992   \var{d\_type} a quello di \var{st\_mode}.
993 \end{functions}
994
995 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
996 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
997 letta. Con questi due campi diventa possibile, determinando la posizione delle
998 varie voci, spostarsi all'interno dello stream usando la funzione
999 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
1000   estensioni prese da BSD, non previste dallo standard POSIX.} il cui
1001 prototipo è:
1002 \begin{prototype}{dirent.h}{void seekdir(DIR *dir, off\_t offset)}
1003   Cambia la posizione all'interno di un \textit{directory stream}.
1004 \end{prototype}
1005
1006 La funzione non ritorna nulla e non segnala errori, è però necessario che il
1007 valore dell'argomento \param{offset} sia valido per lo stream \param{dir};
1008 esso pertanto deve essere stato ottenuto o dal valore di \var{d\_off} di
1009 \struct{dirent} o dal valore restituito dalla funzione \funcd{telldir}, che
1010 legge la posizione corrente; il prototipo di quest'ultima è:
1011 \begin{prototype}{dirent.h}{off\_t telldir(DIR *dir)}
1012   Ritorna la posizione corrente in un \textit{directory stream}.
1013   
1014   \bodydesc{La funzione restituisce la posizione corrente nello stream (un
1015     numero positivo) in caso di successo, e -1 altrimenti, nel qual caso
1016     \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
1017     valore errato per \param{dir}.}
1018 \end{prototype}
1019
1020 La sola funzione di posizionamento nello stream prevista dallo standard POSIX
1021 è \funcd{rewinddir}, che riporta la posizione a quella iniziale; il suo
1022 prototipo è:
1023 \begin{functions}
1024   \headdecl{sys/types.h} \headdecl{dirent.h} 
1025   
1026   \funcdecl{void rewinddir(DIR *dir)}
1027   
1028   Si posiziona all'inizio di un \textit{directory stream}.
1029 \end{functions}
1030
1031
1032 Una volta completate le operazioni si può chiudere il \textit{directory
1033   stream} con la funzione \funcd{closedir}, il cui prototipo è:
1034 \begin{functions}
1035   \headdecl{sys/types.h} \headdecl{dirent.h} 
1036   
1037   \funcdecl{int closedir(DIR * dir)} 
1038   
1039   Chiude un \textit{directory stream}.
1040   
1041   \bodydesc{La funzione restituisce 0 in caso di successo e -1 altrimenti, nel
1042     qual caso \var{errno} assume il valore \errval{EBADF}.}
1043 \end{functions}
1044
1045 A parte queste funzioni di base in BSD 4.3 è stata introdotta un'altra
1046 funzione che permette di eseguire una scansione completa (con tanto di ricerca
1047 ed ordinamento) del contenuto di una directory; la funzione è
1048 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
1049   \acr{libc4}.} ed il suo prototipo è:
1050 \begin{prototype}{dirent.h}{int scandir(const char *dir, 
1051     struct dirent ***namelist, int(*filter)(const struct dirent *),
1052     int(*compar)(const struct dirent **, const struct dirent **))} 
1053   
1054   Esegue una scansione di un \textit{directory stream}.
1055   
1056   \bodydesc{La funzione restituisce in caso di successo il numero di voci
1057     trovate, e -1 altrimenti.}
1058 \end{prototype}
1059
1060 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
1061 prototipo non è molto comprensibile; queste funzioni però sono quelle che
1062 controllano rispettivamente la selezione di una voce (quella passata con
1063 l'argomento \param{filter}) e l'ordinamento di tutte le voci selezionate
1064 (quella specificata dell'argomento \param{compar}).
1065
1066 La funzione legge tutte le voci della directory indicata dall'argomento
1067 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
1068 \struct{dirent}) come argomento della funzione di selezione specificata da
1069 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
1070 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
1071 Qualora si specifichi un valore \val{NULL} per l'argomento \func{filter} non
1072 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
1073
1074 Le voci selezionate possono essere riordinate tramite \func{qsort}, le modalità
1075 del riordinamento possono essere personalizzate usando la funzione
1076 \param{compar} come criterio di ordinamento di \func{qsort}, la funzione
1077 prende come argomenti le due strutture \struct{dirent} da confrontare
1078 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
1079 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
1080 \struct{dirent} viene restituito nell'argomento
1081 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
1082   restituisce, come \itindex{value~result~argument} \textit{value result
1083     argument}, l'indirizzo della stessa; questo significa che \param{namelist}
1084   deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
1085   si deve passare il suo indirizzo.}
1086
1087 Per l'ordinamento, vale a dire come valori possibili per l'argomento
1088 \param{compar} sono disponibili due funzioni predefinite, \funcd{alphasort} e
1089 \funcd{versionsort}, i cui prototipi sono:
1090 \begin{functions}
1091   \headdecl{dirent.h} 
1092   
1093   \funcdecl{int alphasort(const void *a, const void *b)} 
1094
1095   \funcdecl{int versionsort(const void *a, const void *b)} 
1096   
1097   Funzioni per l'ordinamento delle voci di \textit{directory stream}.
1098   
1099   \bodydesc{Le funzioni restituiscono un valore minore, uguale o maggiore di
1100     zero qualora il primo argomento sia rispettivamente minore, uguale o
1101     maggiore del secondo.}
1102 \end{functions}
1103
1104 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
1105 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
1106   argomenti dei puntatori a delle strutture \struct{dirent}; le glibc usano il
1107   prototipo originario di BSD, mostrato anche nella definizione, che prevede
1108   puntatori a \ctyp{void}.} e deve essere specificata come argomento
1109 \param{compar} per ottenere un ordinamento alfabetico (secondo il valore del
1110 campo \var{d\_name} delle varie voci). Le \acr{glibc} prevedono come
1111 estensione\footnote{le glibc, a partire dalla versione 2.1, effettuano anche
1112   l'ordinamento alfabetico tenendo conto delle varie localizzazioni, usando
1113   \func{strcoll} al posto di \func{strcmp}.} anche \func{versionsort}, che
1114 ordina i nomi tenendo conto del numero di versione (cioè qualcosa per cui
1115 \texttt{file10} viene comunque dopo \texttt{file4}.)
1116
1117 Un semplice esempio dell'uso di queste funzioni è riportato in
1118 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
1119 programma che, usando la funzione di scansione illustrata in
1120 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
1121 e la relativa dimensione (in sostanza una versione semplificata del comando
1122 \cmd{ls}).
1123
1124 \begin{figure}[!htb]
1125   \footnotesize \centering
1126   \begin{minipage}[c]{15.6cm}
1127     \includecodesample{listati/my_ls.c}
1128   \end{minipage}
1129   \caption{Esempio di codice per eseguire la lista dei file contenuti in una
1130     directory.} 
1131   \label{fig:file_my_ls}
1132 \end{figure}
1133
1134 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
1135 la parte di gestione delle opzioni (che prevede solo l'uso di una funzione per
1136 la stampa della sintassi, anch'essa omessa) ma il codice completo potrà essere
1137 trovato coi sorgenti allegati nel file \file{myls.c}.
1138
1139 In sostanza tutto quello che fa il programma, dopo aver controllato
1140 (\texttt{\small 10--13}) di avere almeno un argomento (che indicherà la
1141 directory da esaminare) è chiamare (\texttt{\small 14}) la funzione
1142 \func{DirScan} per eseguire la scansione, usando la funzione \code{do\_ls}
1143 (\texttt{\small 20--26}) per fare tutto il lavoro. 
1144
1145 Quest'ultima si limita (\texttt{\small 23}) a chiamare \func{stat} sul file
1146 indicato dalla directory entry passata come argomento (il cui nome è appunto
1147 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
1148 dati ad esso relativi, per poi provvedere (\texttt{\small 24}) a stampare il
1149 nome del file e la dimensione riportata in \var{data}.  
1150
1151 Dato che la funzione verrà chiamata all'interno di \func{DirScan} per ogni
1152 voce presente questo è sufficiente a stampare la lista completa dei file e
1153 delle relative dimensioni.  Si noti infine come si restituisca sempre 0 come
1154 valore di ritorno per indicare una esecuzione senza errori.
1155
1156 \begin{figure}[!htb]
1157   \footnotesize \centering
1158   \begin{minipage}[c]{15.6cm}
1159     \includecodesample{listati/DirScan.c}
1160   \end{minipage}
1161   \caption{Codice della funzione di scansione di una directory contenuta nel
1162     file \file{DirScan.c}.} 
1163   \label{fig:file_dirscan}
1164 \end{figure}
1165
1166 Tutto il grosso del lavoro è svolto dalla funzione \func{DirScan}, riportata
1167 in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e permette
1168 di eseguire una funzione, passata come secondo argomento, su tutte le voci di
1169 una directory.  La funzione inizia con l'aprire (\texttt{\small 19--23}) uno
1170 stream sulla directory passata come primo argomento, stampando un messaggio in
1171 caso di errore.
1172
1173 Il passo successivo (\texttt{\small 24--25}) è cambiare directory di lavoro
1174 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzione
1175 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
1176 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
1177 (\texttt{\small 27--31}) sulle singole voci dello stream ci si trovi
1178 all'interno della directory.\footnote{questo è essenziale al funzionamento
1179   della funzione \code{do\_ls} (e ad ogni funzione che debba usare il campo
1180   \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
1181   struttura \struct{dirent} sono sempre relativi alla directory in questione,
1182   e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
1183   ottenere le dimensioni.}
1184
1185 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
1186 alla funzione passata come secondo argomento, il ciclo di scansione della
1187 directory è molto semplice; si legge una voce alla volta (\texttt{\small 27})
1188 all'interno di una istruzione di \code{while} e fintanto che si riceve una
1189 voce valida (cioè un puntatore diverso da \val{NULL}) si esegue
1190 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
1191 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
1192   28}) qualora questa presenti una anomalia (identificata da un codice di
1193 ritorno negativo). Una volta terminato il ciclo la funzione si conclude con la
1194 chiusura (\texttt{\small 32}) dello stream\footnote{nel nostro caso, uscendo
1195   subito dopo la chiamata, questo non servirebbe, in generale però
1196   l'operazione è necessaria, dato che la funzione può essere invocata molte
1197   volte all'interno dello stesso processo, per cui non chiudere i
1198   \textit{directory stream} comporterebbe un consumo progressivo di risorse,
1199   con conseguente rischio di esaurimento delle stesse.} e la restituzione
1200 (\texttt{\small 33}) del codice di operazioni concluse con successo.
1201
1202
1203 \subsection{La directory di lavoro}
1204 \label{sec:file_work_dir}
1205
1206 \itindbeg{pathname}
1207
1208 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
1209 directory nel filesystem,\footnote{questa viene mantenuta all'interno dei dati
1210   della sua \struct{task\_struct} (vedi fig.~\ref{fig:proc_task_struct}), più
1211   precisamente nel campo \texttt{pwd} della sotto-struttura
1212   \struct{fs\_struct}.} che è chiamata \textsl{directory corrente} o
1213 \textsl{directory di lavoro} (in inglese \textit{current working directory}).
1214 La directory di lavoro è quella da cui si parte quando un
1215 \itindsub{pathname}{relativo} \textit{pathname} è espresso in forma relativa,
1216 dove il ``\textsl{relativa}'' fa riferimento appunto a questa directory.
1217
1218 Quando un utente effettua il login, questa directory viene impostata alla
1219 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
1220 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
1221 comando \cmd{pwd} la stampa sul terminale.  Siccome la directory corrente
1222 resta la stessa quando viene creato un processo figlio (vedi
1223 sez.~\ref{sec:proc_fork}), la directory corrente della shell diventa anche la
1224 directory corrente di qualunque comando da essa lanciato.
1225
1226 Dato che è il kernel che tiene traccia per ciascun processo \itindex{inode}
1227 dell'\textit{inode} della directory di lavoro, per ottenerne il
1228 \textit{pathname} occorre usare una apposita funzione di libreria,
1229 \funcd{getcwd},\footnote{con Linux \func{getcwd} è una \textit{system call}
1230   dalla versione 2.1.9, in precedenza il valore doveva essere ottenuto tramite
1231   il filesystem \texttt{/proc} da \procfile{/proc/self/cwd}.} il cui prototipo
1232 è:
1233 \begin{prototype}{unistd.h}{char *getcwd(char *buffer, size\_t size)}
1234   Legge il \textit{pathname} della directory di lavoro corrente.
1235   
1236   \bodydesc{La funzione restituisce il puntatore \param{buffer} se riesce,
1237     \val{NULL} se fallisce, in quest'ultimo caso la variabile
1238     \var{errno} è impostata con i seguenti codici di errore:
1239   \begin{errlist}
1240   \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
1241     è nullo.
1242   \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
1243     lunghezza del \textit{pathname}. 
1244   \item[\errcode{EACCES}] manca il permesso di lettura o di ricerca su uno dei
1245     componenti del \textit{pathname} (cioè su una delle directory superiori
1246     alla corrente).
1247   \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata.
1248   \end{errlist}}
1249 \end{prototype}
1250
1251 La funzione restituisce il \textit{pathname} completo della directory di
1252 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
1253 precedentemente allocata, per una dimensione massima di \param{size}.  Il
1254 buffer deve essere sufficientemente largo da poter contenere il
1255 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
1256 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
1257 un errore.
1258
1259 Si può anche specificare un puntatore nullo come
1260 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
1261   supportata da Linux e dalla \acr{glibc}.} nel qual caso la stringa sarà
1262 allocata automaticamente per una dimensione pari a \param{size} qualora questa
1263 sia diversa da zero, o della lunghezza esatta del \textit{pathname}
1264 altrimenti. In questo caso ci si deve ricordare di disallocare la stringa una
1265 volta cessato il suo utilizzo.
1266
1267 Di questa funzione esiste una versione \code{char *getwd(char *buffer)} fatta
1268 per compatibilità all'indietro con BSD, che non consente di specificare la
1269 dimensione del buffer; esso deve essere allocato in precedenza ed avere una
1270 dimensione superiore a \const{PATH\_MAX} (di solito 256 byte, vedi
1271 sez.~\ref{sec:sys_limits}); il problema è che in Linux non esiste una
1272 dimensione superiore per un \textit{pathname}, per cui non è detto che il
1273 buffer sia sufficiente a contenere il nome del file, e questa è la ragione
1274 principale per cui questa funzione è deprecata.
1275
1276 Un uso comune di \func{getcwd} è quello di salvare la directory di lavoro
1277 iniziale per poi potervi tornare in un tempo successivo, un metodo alternativo
1278 più veloce, se non si è a corto di file descriptor, è invece quello di aprire
1279 la directory corrente (vale a dire ``\texttt{.}'') e tornarvi in seguito con
1280 \func{fchdir}. 
1281
1282 Una seconda usata per ottenere la directory di lavoro è \code{char
1283   *get\_current\_dir\_name(void)} che è sostanzialmente equivalente ad una
1284 \code{getcwd(NULL, 0)}, con la sola differenza che essa ritorna il valore
1285 della variabile di ambiente \val{PWD}, che essendo costruita dalla shell può
1286 contenere un \textit{pathname} comprendente anche dei link simbolici. Usando
1287 \func{getcwd} infatti, essendo il \textit{pathname} ricavato risalendo
1288 all'indietro l'albero della directory, si perderebbe traccia di ogni passaggio
1289 attraverso eventuali link simbolici.
1290
1291 Per cambiare la directory di lavoro si può usare la funzione \funcd{chdir}
1292 (equivalente del comando di shell \cmd{cd}) il cui nome sta appunto per
1293 \textit{change directory}, il suo prototipo è:
1294 \begin{prototype}{unistd.h}{int chdir(const char *pathname)} 
1295   Cambia la directory di lavoro in \param{pathname}.
1296   
1297   \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
1298     nel qual caso \var{errno} assumerà i valori:
1299   \begin{errlist}
1300   \item[\errcode{ENOTDIR}] non si è specificata una directory.
1301   \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
1302     di \param{path}.
1303   \end{errlist}
1304   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1305   \errval{ENOMEM}, \errval{ELOOP} e \errval{EIO}.}
1306 \end{prototype}
1307 \noindent ed ovviamente \param{pathname} deve indicare una directory per la
1308 quale si hanno i permessi di accesso.
1309
1310 Dato che anche le directory sono file, è possibile riferirsi ad esse anche
1311 tramite il file descriptor, e non solo tramite il \textit{pathname}, per fare
1312 questo si usa \funcd{fchdir}, il cui prototipo è:
1313 \begin{prototype}{unistd.h}{int fchdir(int fd)} 
1314   Identica a \func{chdir}, ma usa il file descriptor \param{fd} invece del
1315   \textit{pathname}.
1316   
1317   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1318     errore, in caso di errore \var{errno} assumerà i valori \errval{EBADF} o
1319     \errval{EACCES}.}
1320 \end{prototype}
1321 \noindent anche in questo caso \param{fd} deve essere un file descriptor
1322 valido che fa riferimento ad una directory. Inoltre l'unico errore di accesso
1323 possibile (tutti gli altri sarebbero occorsi all'apertura di \param{fd}), è
1324 quello in cui il processo non ha il permesso di accesso alla directory
1325 specificata da \param{fd}.
1326
1327 \itindend{pathname}
1328
1329
1330
1331 \subsection{I file temporanei}
1332 \label{sec:file_temp_file}
1333
1334 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
1335 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
1336 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
1337 creare il file dopo aver controllato che questo non esista, nel momento fra il
1338 controllo e la creazione si ha giusto lo spazio per una possibile
1339 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
1340 sez.~\ref{sec:proc_race_cond}).
1341
1342 Le \acr{glibc} provvedono varie funzioni per generare nomi di file temporanei,
1343 di cui si abbia certezza di unicità (al momento della generazione); la prima
1344 di queste funzioni è \funcd{tmpnam} il cui prototipo è:
1345 \begin{prototype}{stdio.h}{char *tmpnam(char *string)}
1346   Restituisce il puntatore ad una stringa contente un nome di file valido e
1347   non esistente al momento dell'invocazione. 
1348
1349   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1350   \val{NULL} in caso di fallimento. Non sono definiti errori.}
1351 \end{prototype}
1352 \noindent se si è passato un puntatore \param{string} non nullo questo deve
1353 essere di dimensione \const{L\_tmpnam} (costante definita in \file{stdio.h},
1354 come \const{P\_tmpdir} e \const{TMP\_MAX}) ed il nome generato vi verrà
1355 copiato automaticamente; altrimenti il nome sarà generato in un buffer statico
1356 interno che verrà sovrascritto ad una chiamata successiva.  Successive
1357 invocazioni della funzione continueranno a restituire nomi unici fino ad un
1358 massimo di \const{TMP\_MAX} volte. Al nome viene automaticamente aggiunto come
1359 prefisso la directory specificata da \const{P\_tmpdir}.
1360
1361 Di questa funzione esiste una versione \index{funzioni!rientranti} rientrante,
1362 \func{tmpnam\_r}, che non fa nulla quando si passa \val{NULL} come argomento.
1363 Una funzione simile, \funcd{tempnam}, permette di specificare un prefisso per
1364 il file esplicitamente, il suo prototipo è:
1365 \begin{prototype}{stdio.h}{char *tempnam(const char *dir, const char *pfx)}
1366   Restituisce il puntatore ad una stringa contente un nome di file valido e
1367   non esistente al momento dell'invocazione.
1368
1369   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1370   \val{NULL} in caso di fallimento, \var{errno} viene impostata a
1371   \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
1372 \end{prototype}
1373
1374 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
1375 per cui è sempre \index{funzioni!rientranti} rientrante, occorre però
1376 ricordarsi di disallocare con \code{free} il puntatore che restituisce.
1377 L'argomento \param{pfx} specifica un prefisso di massimo 5 caratteri per il
1378 nome provvisorio. La funzione assegna come directory per il file temporaneo
1379 (verificando che esista e sia accessibili), la prima valida delle seguenti:
1380 \begin{itemize}
1381 \item La variabile di ambiente \const{TMPDIR} (non ha effetto se non è
1382   definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
1383   \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}).
1384 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}).
1385 \item Il valore della costante \const{P\_tmpdir}.
1386 \item la directory \file{/tmp}.
1387 \end{itemize}
1388
1389 In ogni caso, anche se la generazione del nome è casuale, ed è molto difficile
1390 ottenere un nome duplicato, nulla assicura che un altro processo non possa
1391 avere creato, fra l'ottenimento del nome e l'apertura del file, un altro file
1392 con lo stesso nome; per questo motivo quando si usa il nome ottenuto da una di
1393 queste funzioni occorre sempre aprire il nuovo file in modalità di esclusione
1394 (cioè con l'opzione \const{O\_EXCL} per i file descriptor o con il flag
1395 \code{x} per gli stream) che fa fallire l'apertura in caso il file sia già
1396 esistente.
1397
1398 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
1399 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
1400 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
1401 \begin{prototype}{stdio.h}{FILE *tmpfile (void)}
1402   Restituisce un file temporaneo aperto in lettura/scrittura.
1403   
1404   \bodydesc{La funzione ritorna il puntatore allo stream associato al file
1405     temporaneo in caso di successo e \val{NULL} in caso di errore, nel qual
1406     caso \var{errno} assumerà i valori:
1407     \begin{errlist}
1408     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
1409     \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
1410     \end{errlist}
1411     ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
1412     \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES}.}
1413 \end{prototype}
1414
1415 La funzione restituisce direttamente uno stream già aperto (in modalità
1416 \code{r+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso, che viene
1417 automaticamente cancellato alla sua chiusura o all'uscita dal programma. Lo
1418 standard non specifica in quale directory verrà aperto il file, ma le
1419 \acr{glibc} prima tentano con \const{P\_tmpdir} e poi con \file{/tmp}. Questa
1420 funzione è \index{funzioni!rientranti} rientrante e non soffre di problemi di
1421 \itindex{race~condition} \textit{race condition}.
1422
1423 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
1424 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
1425 modificano una stringa di input che serve da modello e che deve essere
1426 conclusa da 6 caratteri \code{X} che verranno sostituiti da un codice
1427 unico. La prima delle due è analoga a \func{tmpnam} e genera un nome casuale,
1428 il suo prototipo è:
1429 \begin{prototype}{stlib.h}{char *mktemp(char *template)}
1430   Genera un filename univoco sostituendo le \code{XXXXXX} finali di
1431   \param{template}.
1432   
1433   \bodydesc{La funzione ritorna il puntatore \param{template} in caso di
1434     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1435     assumerà i valori:
1436     \begin{errlist}
1437     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1438     \end{errlist}}
1439 \end{prototype}
1440 \noindent dato che \param{template} deve poter essere modificata dalla
1441 funzione non si può usare una stringa costante.  Tutte le avvertenze riguardo
1442 alle possibili \itindex{race~condition} \textit{race condition} date per
1443 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
1444 il valore usato per sostituire le \code{XXXXXX} viene formato con il \acr{pid}
1445 del processo più una lettera, il che mette a disposizione solo 26 possibilità
1446 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
1447 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
1448 usata.
1449
1450 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
1451 \func{tmpfile}, ma restituisce un file descriptor invece di uno stream; il suo
1452 prototipo è:
1453 \begin{prototype}{stlib.h}{int mkstemp(char *template)}
1454   Genera un file temporaneo con un nome ottenuto sostituendo le \code{XXXXXX}
1455   finali di \param{template}.
1456   
1457   \bodydesc{La funzione ritorna il file descriptor in caso successo e
1458     -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
1459     \begin{errlist}
1460     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1461     \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
1462       contenuto di \param{template} è indefinito.
1463     \end{errlist}}
1464 \end{prototype}
1465 \noindent come per \func{mktemp} anche in questo caso \param{template} non può
1466 essere una stringa costante. La funzione apre un file in lettura/scrittura con
1467 la funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
1468 sez.~\ref{sec:file_open}), in questo modo al ritorno della funzione si ha la
1469 certezza di essere i soli utenti del file. I permessi sono impostati al valore
1470 \code{0600}\footnote{questo è vero a partire dalle \acr{glibc} 2.0.7, le
1471   versioni precedenti delle \acr{glibc} e le vecchie \acr{libc5} e \acr{libc4}
1472   usavano il valore \code{0666} che permetteva a chiunque di leggere i
1473   contenuti del file.} (si veda sez.~\ref{sec:file_perm_overview}).
1474
1475 In OpenBSD è stata introdotta un'altra funzione\footnote{introdotta anche in
1476   Linux a partire dalle \acr{glibc} 2.1.91.} simile alle precedenti,
1477 \funcd{mkdtemp}, che crea una directory temporanea; il suo prototipo è:
1478 \begin{prototype}{stlib.h}{char *mkdtemp(char *template)}
1479   Genera una directory temporaneo il cui nome è ottenuto sostituendo le
1480   \code{XXXXXX} finali di \param{template}.
1481   
1482   \bodydesc{La funzione ritorna il puntatore al nome della directory in caso
1483     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1484     assumerà i valori:
1485     \begin{errlist}
1486     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1487     \end{errlist}
1488     più gli altri eventuali codici di errore di \func{mkdir}.}
1489 \end{prototype}
1490 \noindent la directory è creata con permessi \code{0700} (al solito si veda
1491 cap.~\ref{cha:file_unix_interface} per i dettagli); dato che la creazione
1492 della directory è sempre esclusiva i precedenti problemi di
1493 \itindex{race~condition} \textit{race condition} non si pongono.
1494
1495
1496 \section{La manipolazione delle caratteristiche dei file}
1497 \label{sec:file_infos}
1498
1499 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
1500 relative alle caratteristiche di ciascun file, a partire dalle informazioni
1501 relative al controllo di accesso, sono mantenute \itindex{inode}
1502 nell'\textit{inode}.
1503
1504 Vedremo in questa sezione come sia possibile leggere tutte queste informazioni
1505 usando la funzione \func{stat}, che permette l'accesso a tutti i dati
1506 memorizzati \itindex{inode} nell'\textit{inode}; esamineremo poi le varie
1507 funzioni usate per manipolare tutte queste informazioni (eccetto quelle che
1508 riguardano la gestione del controllo di accesso, trattate in in
1509 sez.~\ref{sec:file_access_control}).
1510
1511
1512 \subsection{La lettura delle caratteristiche dei file}
1513 \label{sec:file_stat}
1514
1515 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
1516 delle funzioni \func{stat} (\funcd{stat}, \funcd{fstat} e \funcd{lstat});
1517 questa è la funzione che ad esempio usa il comando \cmd{ls} per poter ottenere
1518 e mostrare tutti i dati relativi ad un file. I prototipi di queste funzioni
1519 sono i seguenti:
1520 \begin{functions}
1521   \headdecl{sys/types.h} 
1522   \headdecl{sys/stat.h} 
1523   \headdecl{unistd.h}
1524
1525   \funcdecl{int stat(const char *file\_name, struct stat *buf)} Legge le
1526   informazione del file specificato da \param{file\_name} e le inserisce in
1527   \param{buf}.
1528   
1529   \funcdecl{int lstat(const char *file\_name, struct stat *buf)} Identica a
1530   \func{stat} eccetto che se il \param{file\_name} è un link simbolico vengono
1531   lette le informazioni relative ad esso e non al file a cui fa riferimento.
1532   
1533   \funcdecl{int fstat(int filedes, struct stat *buf)} Identica a \func{stat}
1534   eccetto che si usa con un file aperto, specificato tramite il suo file
1535   descriptor \param{filedes}.
1536   
1537   \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
1538     errore, nel qual caso \var{errno} assumerà uno dei valori: \errval{EBADF},
1539     \errval{ENOENT}, \errval{ENOTDIR}, \errval{ELOOP}, \errval{EFAULT},
1540     \errval{EACCES}, \errval{ENOMEM}, \errval{ENAMETOOLONG}.}
1541 \end{functions}
1542 \noindent il loro comportamento è identico, solo che operano rispettivamente
1543 su un file, su un link simbolico e su un file descriptor.
1544
1545 La struttura \struct{stat} usata da queste funzioni è definita nell'header
1546 \file{sys/stat.h} e in generale dipende dall'implementazione; la versione
1547 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
1548 riportata dalla pagina di manuale di \func{stat}; in realtà la definizione
1549 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
1550 riservati per estensioni come tempi dei file più precisi (vedi
1551 sez.~\ref{sec:file_file_times}), o per il padding dei campi.
1552
1553 \begin{figure}[!htb]
1554   \footnotesize
1555   \centering
1556   \begin{minipage}[c]{15cm}
1557     \includestruct{listati/stat.h}
1558   \end{minipage} 
1559   \normalsize 
1560   \caption{La struttura \structd{stat} per la lettura delle informazioni dei 
1561     file.}
1562   \label{fig:file_stat_struct}
1563 \end{figure}
1564
1565 Si noti come i vari membri della struttura siano specificati come tipi
1566 primitivi del sistema (di quelli definiti in
1567 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \file{sys/types.h}).
1568
1569 \subsection{I tipi di file}
1570 \label{sec:file_types}
1571
1572 Come riportato in tab.~\ref{tab:file_file_types} in Linux oltre ai file e alle
1573 directory esistono altri oggetti che possono stare su un filesystem.  Il tipo
1574 di file è ritornato dalla funzione \func{stat} come maschera binaria nel campo
1575 \var{st\_mode} (che contiene anche le informazioni relative ai permessi) di
1576 una struttura \struct{stat}.
1577
1578 Dato che il valore numerico può variare a seconda delle implementazioni, lo
1579 standard POSIX definisce un insieme di macro per verificare il tipo di file,
1580 queste vengono usate anche da Linux che supporta pure le estensioni allo
1581 standard per i link simbolici e i socket definite da BSD; l'elenco completo
1582 delle macro con cui è possibile estrarre l'informazione da \var{st\_mode} è
1583 riportato in tab.~\ref{tab:file_type_macro}.
1584 \begin{table}[htb]
1585   \centering
1586   \footnotesize
1587   \begin{tabular}[c]{|l|l|}
1588     \hline
1589     \textbf{Macro} & \textbf{Tipo del file} \\
1590     \hline
1591     \hline
1592     \macro{S\_ISREG(m)}  & file normale.\\
1593     \macro{S\_ISDIR(m)}  & directory.\\
1594     \macro{S\_ISCHR(m)}  & dispositivo a caratteri.\\
1595     \macro{S\_ISBLK(m)}  & dispositivo a blocchi.\\
1596     \macro{S\_ISFIFO(m)} & fifo.\\
1597     \macro{S\_ISLNK(m)}  & link simbolico.\\
1598     \macro{S\_ISSOCK(m)} & socket.\\
1599     \hline    
1600   \end{tabular}
1601   \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h}).}
1602   \label{tab:file_type_macro}
1603 \end{table}
1604
1605 Oltre alle macro di tab.~\ref{tab:file_type_macro} è possibile usare
1606 direttamente il valore di \var{st\_mode} per ricavare il tipo di file
1607 controllando direttamente i vari bit in esso memorizzati. Per questo sempre in
1608 \file{sys/stat.h} sono definite le costanti numeriche riportate in
1609 tab.~\ref{tab:file_mode_flags}.
1610
1611 Il primo valore dell'elenco di tab.~\ref{tab:file_mode_flags} è la maschera
1612 binaria che permette di estrarre i bit nei quali viene memorizzato il tipo di
1613 file, i valori successivi sono le costanti corrispondenti ai singoli bit, e
1614 possono essere usati per effettuare la selezione sul tipo di file voluto, con
1615 un'opportuna combinazione.
1616
1617 \begin{table}[htb]
1618   \centering
1619   \footnotesize
1620   \begin{tabular}[c]{|l|c|l|}
1621     \hline
1622     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
1623     \hline
1624     \hline
1625     \const{S\_IFMT}   &  0170000 & Maschera per i bit del tipo di file.\\
1626     \const{S\_IFSOCK} &  0140000 & Socket.\\
1627     \const{S\_IFLNK}  &  0120000 & Link simbolico.\\
1628     \const{S\_IFREG}  &  0100000 & File regolare.\\ 
1629     \const{S\_IFBLK}  &  0060000 & Dispositivo a blocchi.\\
1630     \const{S\_IFDIR}  &  0040000 & Directory.\\
1631     \const{S\_IFCHR}  &  0020000 & Dispositivo a caratteri.\\
1632     \const{S\_IFIFO}  &  0010000 & Fifo.\\
1633     \hline
1634     \const{S\_ISUID}  &  0004000 & Set UID bit \itindex{suid~bit}.\\
1635     \const{S\_ISGID}  &  0002000 & Set GID bit \itindex{sgid~bit}.\\
1636     \const{S\_ISVTX}  &  0001000 & Sticky bit \itindex{sticky~bit}.\\
1637     \hline
1638 %    \const{S\_IRWXU}  &  00700   & Bitmask per i permessi del proprietario.\\
1639     \const{S\_IRUSR}  &  00400   & Il proprietario ha permesso di lettura.\\
1640     \const{S\_IWUSR}  &  00200   & Il proprietario ha permesso di scrittura.\\
1641     \const{S\_IXUSR}  &  00100   & Il proprietario ha permesso di esecuzione.\\
1642     \hline
1643 %    \const{S\_IRWXG}  &  00070   & Bitmask per i permessi del gruppo.\\
1644     \const{S\_IRGRP}  &  00040   & Il gruppo ha permesso di lettura.\\
1645     \const{S\_IWGRP}  &  00020   & Il gruppo ha permesso di scrittura.\\
1646     \const{S\_IXGRP}  &  00010   & Il gruppo ha permesso di esecuzione.\\
1647     \hline
1648 %    \const{S\_IRWXO}  &  00007   & Bitmask per i permessi di tutti gli altri\\
1649     \const{S\_IROTH}  &  00004   & Gli altri hanno permesso di lettura.\\
1650     \const{S\_IWOTH}  &  00002   & Gli altri hanno permesso di esecuzione.\\
1651     \const{S\_IXOTH}  &  00001   & Gli altri hanno permesso di esecuzione.\\
1652     \hline    
1653   \end{tabular}
1654   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
1655     \var{st\_mode} (definite in \file{sys/stat.h}).}
1656   \label{tab:file_mode_flags}
1657 \end{table}
1658
1659 Ad esempio se si volesse impostare una condizione che permetta di controllare
1660 se un file è una directory o un file ordinario si potrebbe definire la macro
1661 di preprocessore:
1662 \includecodesnip{listati/is_file_dir.h}
1663 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
1664 poi si effettua il confronto con la combinazione di tipi scelta.
1665
1666
1667 \subsection{Le dimensioni dei file}
1668 \label{sec:file_file_size}
1669
1670 Il campo \var{st\_size} di una struttura \struct{stat} contiene la dimensione
1671 del file in byte, se si tratta di un file regolare. Nel caso di un link
1672 simbolico la dimensione è quella del \itindex{pathname} \textit{pathname} che
1673 il link stesso contiene; per le fifo questo campo è sempre nullo.
1674
1675 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
1676 byte. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
1677 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
1678 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
1679 dimensione inferiore sarebbe inefficiente.
1680
1681 Si tenga conto che la lunghezza del file riportata in \var{st\_size} non è
1682 detto che corrisponda all'occupazione dello spazio su disco per via della
1683 possibile esistenza dei cosiddetti \index{file!\textit{hole}} \textit{holes}
1684 (letteralmente \textsl{buchi}) che si formano tutte le volte che si va a
1685 scrivere su un \itindex{sparse~file} file dopo aver eseguito una \func{lseek}
1686 (tratteremo in dettaglio l'argomento in sez.~\ref{sec:file_lseek}) oltre la
1687 sua fine.
1688
1689 In questo caso si avranno risultati differenti a seconda del modo in cui si
1690 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
1691 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
1692 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
1693 caso per le parti non scritte vengono restituiti degli zeri, si avrà lo stesso
1694 risultato di \cmd{ls}.
1695
1696 Se è sempre possibile allargare un file, scrivendoci sopra od usando la
1697 funzione \func{lseek} per spostarsi oltre la sua fine, esistono anche casi in
1698 cui si può avere bisogno di effettuare un troncamento, scartando i dati
1699 presenti al di là della dimensione scelta come nuova fine del file.
1700
1701 Un file può sempre essere troncato a zero aprendolo con il flag
1702 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
1703 dimensione si possono usare le due funzioni \funcd{truncate} e
1704 \funcd{ftruncate}, i cui prototipi sono:
1705 \begin{functions}
1706   \headdecl{unistd.h} \funcdecl{int truncate(const char *file\_name, off\_t
1707     length)} Fa si che la dimensione del file \param{file\_name} sia troncata
1708   ad un valore massimo specificato da \param{length}.
1709   
1710   \funcdecl{int ftruncate(int fd, off\_t length))} Identica a \func{truncate}
1711   eccetto che si usa con un file aperto, specificato tramite il suo file
1712   descriptor \param{fd}.
1713   
1714   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per un
1715     errore, nel qual caso \var{errno} viene impostata opportunamente; per
1716     \func{ftruncate} si hanno i valori:
1717   \begin{errlist}
1718   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
1719   \item[\errcode{EINVAL}] \param{fd} è un riferimento ad un socket, non a un
1720     file o non è aperto in scrittura.
1721   \end{errlist}
1722   per \func{truncate} si hanno:
1723   \begin{errlist}
1724   \item[\errcode{EACCES}] il file non ha permesso di scrittura o non si ha il
1725     permesso di esecuzione una delle directory del \itindex{pathname}
1726     \textit{pathname}.
1727   \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
1728   \end{errlist}
1729   ed anche \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1730   \errval{EROFS}, \errval{EIO}, \errval{EFAULT}, \errval{ELOOP}.}
1731 \end{functions}
1732
1733 Se il file è più lungo della lunghezza specificata i dati in eccesso saranno
1734 perduti; il comportamento in caso di lunghezza inferiore non è specificato e
1735 dipende dall'implementazione: il file può essere lasciato invariato o esteso
1736 fino alla lunghezza scelta; nel caso di Linux viene esteso con la creazione di
1737 un \index{file!\textit{hole}} \textsl{buco} nel \itindex{sparse~file} file e
1738 ad una lettura si otterranno degli zeri.
1739
1740 \subsection{I tempi dei file}
1741 \label{sec:file_file_times}
1742
1743 Il sistema mantiene per ciascun file tre tempi. Questi sono registrati
1744 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del file e
1745 possono essere letti tramite la funzione \func{stat}, che li restituisce
1746 attraverso tre campi della struttura \struct{stat} di
1747 fig.~\ref{fig:file_stat_struct}. Il significato di detti tempi e dei relativi
1748 campi è riportato nello schema in tab.~\ref{tab:file_file_times}, dove è anche
1749 riportato un esempio delle funzioni che effettuano cambiamenti su di essi. Il
1750 valore è espresso nel cosiddetto \itindex{calendar~time} \textit{calendar
1751   time}, su cui torneremo in dettaglio in sez.~\ref{sec:sys_time}.
1752
1753 \begin{table}[htb]
1754   \centering
1755   \footnotesize
1756   \begin{tabular}[c]{|c|l|l|c|}
1757     \hline
1758     \textbf{Membro} & \textbf{Significato} & \textbf{Funzione} 
1759     & \textbf{Opzione di \cmd{ls}} \\
1760     \hline
1761     \hline
1762     \var{st\_atime}& ultimo accesso ai dati del file    &
1763                      \func{read}, \func{utime}          & \cmd{-u}\\
1764     \var{st\_mtime}& ultima modifica ai dati del file   &
1765                      \func{write}, \func{utime}         & default\\
1766     \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
1767                      \func{chmod}, \func{utime}         & \cmd{-c}\\
1768     \hline
1769   \end{tabular}
1770   \caption{I tre tempi associati a ciascun file.}
1771   \label{tab:file_file_times}
1772 \end{table}
1773
1774 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
1775 modifica (il \textit{modification time}, \var{st\_mtime}) e il tempo di
1776 cambiamento di stato (il \textit{change time}, \var{st\_ctime}). Il primo
1777 infatti fa riferimento ad una modifica del contenuto di un file, mentre il
1778 secondo ad una modifica \itindex{inode} dell'\textit{inode}; siccome esistono
1779 molte operazioni (come la funzione \func{link} e molte altre che vedremo in
1780 seguito) che modificano solo le informazioni contenute \itindex{inode}
1781 nell'\textit{inode} senza toccare il contenuto del file, diventa necessario
1782 l'utilizzo di un altro tempo.
1783
1784 Il tempo di ultima modifica viene usato ad esempio da programmi come
1785 \cmd{make} per decidere quali file necessitano di essere ricompilati o
1786 (talvolta insieme anche al tempo di cambiamento di stato) per decidere quali
1787 file devono essere archiviati per il backup. Il tempo di ultimo accesso viene
1788 di solito usato per identificare i file che non vengono più utilizzati per un
1789 certo lasso di tempo. Ad esempio un programma come \texttt{leafnode} lo usa
1790 per cancellare gli articoli letti più vecchi, mentre \texttt{mutt} lo usa per
1791 marcare i messaggi di posta che risultano letti.  Il sistema non tiene conto
1792 dell'ultimo accesso \itindex{inode} all'\textit{inode}, pertanto funzioni come
1793 \func{access} o \func{stat} non hanno alcuna influenza sui tre tempi. Il
1794 comando \cmd{ls} (quando usato con le opzioni \cmd{-l} o \cmd{-t}) mostra i
1795 tempi dei file secondo lo schema riportato nell'ultima colonna di
1796 tab.~\ref{tab:file_file_times}.
1797
1798 L'aggiornamento del tempo di ultimo accesso è stato a lungo considerato un
1799 difetto progettuale di Unix, questo infatti comporta la necessità di
1800 effettuare un accesso in scrittura sul disco anche in tutti i casi in cui
1801 questa informazione non interessa e sarebbe possibile avere un semplice
1802 accesso in lettura sui dati bufferizzati. Questo comporta un ovvio costo sia
1803 in termini di prestazioni, che di consumo di risorse come la batteria per i
1804 portatili, o cicli di riscrittura per i dischi su memorie riscrivibili.
1805
1806 Per questo motivo, onde evitare di mantenere una informazione che nella
1807 maggior parte dei casi non interessa, è sempre stato possibile disabilitare
1808 l'aggiornamento del tempo di ultimo accesso con l'opzione di montaggio
1809 \texttt{noatime}. Dato però che questo può creare problemi a qualche
1810 programma, in Linux è stata introdotta la opzione \texttt{relatime} che esegue
1811 l'aggiornamento soltanto se il tempo di ultimo accesso è precedente al tempo di
1812 ultima modifica o cambiamento, così da rendere evidente che vi è stato un
1813 accesso dopo la scrittura, ed evitando al contempo ulteriori operazioni su
1814 disco negli accessi successivi. In questo modo l'informazione relativa al
1815 fatto che un file sia stato letto resta disponibile, e ad esempio i programmi
1816 citati in precedenza continuano a funzionare. Questa opzione, a partire dal
1817 kernel 2.6.30, è diventata il comportamento di default e non deve più essere
1818 specificata esplicitamente.\footnote{si può comunque riottenere il vecchio
1819   comportamento usando la opzione di montaggio \texttt{strictatime}.}
1820
1821 L'effetto delle varie funzioni di manipolazione dei file sui relativi tempi è
1822 illustrato in tab.~\ref{tab:file_times_effects}, facendo riferimento al
1823 comportamento classico per quanto riguarda \var{st\_atime}. Si sono riportati
1824 gli effetti sia per il file a cui si fa riferimento, sia per la directory che
1825 lo contiene; questi ultimi possono essere capiti se si tiene conto di quanto
1826 già detto, e cioè che anche le directory sono file (che contengono una lista
1827 di nomi) che il sistema tratta in maniera del tutto analoga a tutti gli altri.
1828
1829 \begin{table}[htb]
1830   \centering
1831   \footnotesize
1832   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
1833     \hline
1834     \multicolumn{1}{|p{3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
1835     \multicolumn{3}{|p{3.6cm}|}{\centering{
1836         \textbf{File o directory del riferimento}}}&
1837     \multicolumn{3}{|p{3.6cm}|}{\centering{
1838         \textbf{Directory contenente il riferimento}}} 
1839     &\multicolumn{1}{|p{3.6cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
1840     \cline{2-7}
1841     \cline{2-7}
1842     \multicolumn{1}{|p{3cm}|}{} 
1843     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1844     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1845     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1846     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1847     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1848     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1849     &\multicolumn{1}{|p{3cm}|}{} \\
1850     \hline
1851     \hline
1852     \func{chmod}, \func{fchmod} 
1853              & --      & --      &$\bullet$& --      & --      & --      &\\
1854     \func{chown}, \func{fchown} 
1855              & --      & --      &$\bullet$& --      & --      & --      &\\
1856     \func{creat}  
1857              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&  
1858              con \const{O\_CREATE} \\
1859     \func{creat}  
1860              & --      &$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&   
1861              con \const{O\_TRUNC} \\
1862     \func{exec}  
1863              &$\bullet$& --      & --      & --      & --      & --      &\\
1864     \func{lchown}  
1865              & --      & --      &$\bullet$& --      & --      & --      &\\
1866     \func{link}
1867              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
1868     \func{mkdir}
1869              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
1870     \func{mkfifo}
1871              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
1872     \func{open}
1873              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$& 
1874              con \const{O\_CREATE} \\
1875     \func{open}
1876              & --      &$\bullet$&$\bullet$& --      & --      & --      & 
1877              con \const{O\_TRUNC}  \\
1878     \func{pipe}
1879              &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
1880     \func{read}
1881              &$\bullet$& --      & --      & --      & --      & --      &\\
1882     \func{remove}
1883              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
1884              se esegue \func{unlink}\\
1885     \func{remove}
1886               & --      & --      & --      & --      &$\bullet$&$\bullet$& 
1887               se esegue \func{rmdir}\\
1888     \func{rename}
1889               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$& 
1890               per entrambi gli argomenti\\
1891     \func{rmdir}
1892               & --      & --      & --      & --      &$\bullet$&$\bullet$&\\ 
1893     \func{truncate}, \func{ftruncate}
1894               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
1895     \func{unlink}
1896               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\ 
1897     \func{utime}
1898               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\ 
1899     \func{write}
1900               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\ 
1901     \hline
1902   \end{tabular}
1903   \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo 
1904     accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento
1905     \textsl{(c)} dalle varie funzioni operanti su file e directory.}
1906   \label{tab:file_times_effects}  
1907 \end{table}
1908
1909 Per questo motivo tutte le volte che compiremo un'operazione su un file che
1910 comporta una modifica del nome contenuto nella directory, andremo anche a
1911 scrivere sulla directory che lo contiene cambiandone il tempo di modifica. Un
1912 esempio di questo può essere la cancellazione di un file, invece leggere o
1913 scrivere o cambiare i permessi di un file ha effetti solo sui tempi di
1914 quest'ultimo.
1915
1916 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
1917 creazione del file, usato in molti altri sistemi operativi, ma che in Unix non
1918 esiste. Per questo motivo quando si copia un file, a meno di preservare
1919 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
1920 avrà sempre il tempo corrente come data di ultima modifica.
1921
1922 I tempi di ultimo accesso e modifica possono essere modificati esplicitamente
1923 usando la funzione \funcd{utime}, il cui prototipo è:
1924 \begin{prototype}{utime.h}
1925   {int utime(const char *filename, struct utimbuf *times)} 
1926
1927   Cambia i tempi di ultimo accesso e modifica \itindex{inode}
1928   dell'\textit{inode} specificato da \param{filename} secondo i valori dei
1929   campi \var{actime} e \var{modtime} di \param{times}. Se questa è \val{NULL}
1930   allora viene usato il tempo corrente.
1931
1932   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1933     errore, nel qual caso \var{errno} assumerà uno dei valori:
1934     \begin{errlist}
1935     \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
1936     \item[\errcode{EPERM}] non si è proprietari del file.
1937     \end{errlist}
1938     ed inoltre \errval{EROFS} e \errval{ENOENT}.}
1939 \end{prototype}
1940
1941 La funzione prende come argomento \param{times} una struttura
1942 \struct{utimbuf}, la cui definizione è riportata in
1943 fig.~\ref{fig:struct_utimebuf}, con la quale si possono specificare i nuovi
1944 valori che si vogliono impostare per tempi.
1945
1946 \begin{figure}[!htb]
1947   \footnotesize \centering
1948   \begin{minipage}[c]{15cm}
1949     \includestruct{listati/utimbuf.h}
1950   \end{minipage} 
1951   \normalsize 
1952   \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
1953     i tempi dei file.}
1954   \label{fig:struct_utimebuf}
1955 \end{figure}
1956
1957 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
1958 cosa è l'argomento \param{times}; se è \val{NULL} la funzione imposta il
1959 tempo corrente ed è sufficiente avere accesso in scrittura al file; se invece
1960 si è specificato un valore la funzione avrà successo solo se si è proprietari
1961 del file (o si hanno i privilegi di amministratore).
1962
1963 Si tenga presente che non è comunque possibile specificare il tempo di
1964 cambiamento di stato del file, che viene comunque cambiato dal kernel tutte le
1965 volte che si modifica \itindex{inode} l'\textit{inode} (quindi anche alla
1966 chiamata di \func{utime}).  Questo serve anche come misura di sicurezza per
1967 evitare che si possa modificare un file nascondendo completamente le proprie
1968 tracce. In realtà la cosa resta possibile, se si è in grado di accedere al
1969 \index{file!di~dispositivo} file di dispositivo, scrivendo direttamente sul
1970 disco senza passare attraverso il filesystem, ma ovviamente in questo modo la
1971 cosa è molto più complicata da realizzare.
1972
1973 A partire dal kernel 2.6 la risoluzione dei tempi dei file, che nei campi di
1974 tab.~\ref{tab:file_file_times} è espressa in secondi, è stata portata ai
1975 nanosecondi per la gran parte dei filesystem. La ulteriore informazione può
1976 essere acceduta attraverso altri campi appositamente aggiunti alla struttura
1977 \struct{stat}. Se si sono definite le macro \macro{\_BSD\_SOURCE} o
1978 \macro{\_SVID\_SOURCE} questi sono \var{st\_atim.tv\_nsec},
1979 \var{st\_mtim.tv\_nsec} e \var{st\_ctim.tv\_nsec} se queste non sono definite,
1980 \var{st\_atimensec}, \var{st\_mtimensec} e \var{st\_mtimensec}. Qualora il
1981 supporto per questa maggior precisione sia assente questi campi aggiuntivi
1982 saranno nulli.
1983
1984 Per la gestione di questi nuovi valori è stata definita una seconda funzione
1985 di modifica, \funcd{utimes}, che consente di specificare tempi con maggior
1986 precisione; il suo prototipo è:
1987 \begin{prototype}
1988   {sys/time.h}
1989   {int utimes(const char *filename, struct timeval times[2])} 
1990
1991   Cambia i tempi di ultimo accesso e modifica \itindex{inode}
1992   dell'\textit{inode} specificato da \param{filename} secondo i valori
1993   specificati da \param{times}. Se questo è \val{NULL} allora viene usato il
1994   tempo corrente.
1995
1996   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1997     errore, nel qual caso \var{errno} assumerà uno dei valori:
1998     \begin{errlist}
1999     \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
2000     \item[\errcode{EPERM}] non si è proprietari del file.
2001     \end{errlist} 
2002     ed inoltre \errval{EROFS} e \errval{ENOENT}.}
2003 \end{prototype}
2004
2005 La funzione è del tutto analoga alla precedente \func{utime} ma usa come
2006 argomento \param{times}, un vettore di due strutture \struct{timeval}, la cui
2007 definizione è riportata in fig.~\ref{fig:sys_timeval_struct}, che consentono
2008 di indicare i tempi con una precisione del microsecondo. Il primo elemento
2009 di \param{times} indica il valore per il tempo di ultimo accesso, il secondo
2010 quello per il tempo di ultima modifica.
2011
2012 \begin{figure}[!htb]
2013   \footnotesize \centering
2014   \begin{minipage}[c]{15cm}
2015     \includestruct{listati/timeval.h}
2016   \end{minipage} 
2017   \normalsize 
2018   \caption{La struttura \structd{timeval} usata per indicare valori di tempo
2019     con la precisione del microsecondo.}
2020   \label{fig:sys_timeval_struct}
2021 \end{figure}
2022
2023 Oltre ad \func{utimes} su Linux sono presenti altre due funzioni,\footnote{le
2024   due funzioni non sono definite in nessuno standard, ma sono presenti, oltre
2025   che su Linux, anche su BSD.} \funcd{futimes} e \funcd{lutimes}, che
2026 consentono rispettivamente di effettuare la modifica utilizzando un file
2027 già aperto o di eseguirla direttamente su un link simbolico. I relativi
2028 prototipi sono:
2029 \begin{functions}
2030   \headdecl{sys/time.h} 
2031   
2032   \funcdecl{int futimes(int fd, const struct timeval tv[2])} Cambia i tempi
2033   di un file già aperto specificato tramite il file descriptor \param{fd}.
2034
2035   \funcdecl{int lutimes(const char *filename, const struct timeval tv[2])}
2036   Cambia i tempi di \param{filename} anche se questo è un link simbolico.
2037   
2038   
2039   \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
2040     errore, nel qual caso \var{errno} assumerà gli stessi valori di
2041     \func{utimes}, con in più per \func{futimes}:
2042   \begin{errlist}
2043   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
2044   \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
2045   \end{errlist}}
2046 \end{functions}
2047
2048 Le due funzioni anno lo stesso comportamento di \texttt{utimes} e richiedono
2049 gli stessi privilegi per poter operare, la differenza è che con \func{futimes}
2050 si può indicare il file su cui operare facendo riferimento al relativo file
2051 descriptor (tratteremo in dettaglio l'argomento in
2052 sez.~\ref{cha:file_unix_interface}) mentre con \func{lutimes} nel caso in
2053 cui \param{filename} sia un link simbolico saranno modificati i suoi tempi
2054 invece di quelli del file a cui esso punta.
2055
2056 Nonostante il kernel, come accennato, supporti risoluzioni dei tempi dei file
2057 fino al nanosecondo, le funzioni fin qui esaminate non consentono di impostare
2058 valori con questa precisione. Per questo sono state introdotte due nuove
2059 funzioni, \funcd{futimens} e \func{utimensat}, in grado di eseguire questo
2060 compito; i rispettivi prototipi sono:
2061 \begin{functions}
2062   \headdecl{sys/time.h} 
2063   
2064   \funcdecl{futimens(int fd, const struct timespec times[2])} Cambia i tempi
2065   di un file già aperto, specificato dal file descriptor \param{fd}.
2066
2067   \funcdecl{int utimensat(int dirfd, const char *pathname, const struct
2068     timespec times[2], int flags)} Cambia i tempi del file \param{pathname}.
2069   
2070   
2071   \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
2072     errore, nel qual caso \var{errno} assumerà gli stessi valori di
2073     \func{utimes}, con in più per \func{futimes}:
2074   \begin{errlist}
2075   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
2076   \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
2077   \end{errlist}}
2078 \end{functions}
2079
2080 Entrambe le funzioni utilizzano per indicare i valori dei tempi un
2081 vettore \param{times} di due strutture \struct{timespec} che permette di
2082 specificare un valore di tempo con una precisione fino al nanosecondo, la cui
2083 definizione è riportata in fig.~\ref{fig:sys_timespec_struct}.
2084
2085 \begin{figure}[!htb]
2086   \footnotesize \centering
2087   \begin{minipage}[c]{15cm}
2088     \includestruct{listati/timespec.h}
2089   \end{minipage} 
2090   \normalsize 
2091   \caption{La struttura \structd{timespec} usata per indicare valori di tempo
2092     con la precisione del nanosecondo.}
2093   \label{fig:sys_timespec_struct}
2094 \end{figure}
2095
2096 Come per le precedenti funzioni il primo elemento di \param{times} indica il
2097 tempo di ultimo accesso ed il secondo quello di ultima modifica, e se si usa
2098 il valore \const{NULL} verrà impostato il tempo corrente sia per l'ultimo
2099 accesso che per l'ultima modifica. Nei singoli elementi di \param{times} si
2100 possono inoltre utilizzare due valori speciali per il campo \var{tv\_nsec}:
2101 con \const{UTIME\_NOW} si richiede l'uso del tempo corrente, mentre con
2102 \const{UTIME\_OMIT} si richiede di non impostare il tempo. Si può così
2103 aggiornare in maniera specifica soltanto uno fra il tempo di ultimo accesso e
2104 quello di ultima modifica. Quando si usa uno di questi valori speciali per
2105 \var{tv\_nsec} il corrispondente valore di \var{tv\_sec} viene ignorato.
2106
2107 Queste due funzioni sono una estensione definita in una recente revisione
2108 dello standard POSIX (la POSIX.1-2008); sono state introdotte a partire dal
2109 kernel 2.6.22, e supportate dalle \acr{glibc} a partire dalla versione
2110 2.6.\footnote{in precedenza, a partire dal kernel 2.6.16, era stata introdotta
2111   la funzione \func{futimesat} seguendo una bozza della revisione dello
2112   standard poi modificata, questa funzione, sostituita da \func{utimensat}, è
2113   stata dichiarata obsoleta, non è supportata da nessuno standard e non deve
2114   essere più utilizzata: pertanto non la tratteremo.} La prima è
2115 sostanzialmente una estensione di \func{futimes} che consente di specificare i
2116 tempi con precisione maggiore, la seconda supporta invece, rispetto ad
2117 \func{utimes}, una sintassi più complessa che, come vedremo in
2118 sez.~\ref{sec:file_openat},\footnote{si rimanda pertanto la spiegazione del
2119   significato degli argomenti aggiuntivi alla trattazione generica delle varie
2120   funzioni che usano la stessa sintassi, effettuata in
2121   sez.~\ref{sec:file_openat}.}  consente una indicazione sicura dei
2122 \textit{pathname relativi} specificando la directory da usare come riferimento
2123 in \param{dirfd} e la possibilità di usare \param{flags} per indicare alla
2124 funzione di dereferenziare o meno i link simbolici.
2125
2126
2127 \section{Il controllo di accesso ai file}
2128 \label{sec:file_access_control}
2129
2130 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
2131 del controllo di accesso ai file, che viene implementato per qualunque
2132 filesystem standard.\footnote{per standard si intende che implementa le
2133   caratteristiche previste dallo standard POSIX; in Linux sono disponibili
2134   anche una serie di altri filesystem, come quelli di Windows e del Mac, che
2135   non supportano queste caratteristiche.} In questa sezione ne esamineremo i
2136 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
2137
2138
2139 \subsection{I permessi per l'accesso ai file}
2140 \label{sec:file_perm_overview}
2141
2142 Ad ogni file Linux associa sempre l'utente che ne è proprietario (il
2143 cosiddetto \textit{owner}) ed un gruppo di appartenenza, secondo il meccanismo
2144 degli identificatori di utente e gruppo (\acr{uid} e \acr{gid}). Questi valori
2145 sono accessibili da programma tramite la funzione \func{stat}, e sono
2146 mantenuti nei campi \var{st\_uid} e \var{st\_gid} della struttura
2147 \struct{stat} (si veda sez.~\ref{sec:file_stat}).\footnote{questo è vero solo
2148   per filesystem di tipo Unix, ad esempio non è vero per il filesystem vfat di
2149   Windows, che non fornisce nessun supporto per l'accesso multiutente, e per
2150   il quale i permessi vengono assegnati in maniera fissa con un opzione in
2151   fase di montaggio.}
2152
2153 Il controllo di accesso ai file segue un modello abbastanza semplice che
2154 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
2155 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
2156     Control List} che sono state aggiunte ai filesystem standard con opportune
2157   estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
2158   controllo ancora più sofisticati come il \textit{mandatory access control}
2159   di SE-Linux.} ma nella maggior parte dei casi il meccanismo standard è più
2160 che sufficiente a soddisfare tutte le necessità più comuni.  I tre permessi di
2161 base associati ad ogni file sono:
2162 \begin{itemize*}
2163 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
2164   \textit{read}).
2165 \item il permesso di scrittura (indicato con la lettera \texttt{w},
2166   dall'inglese \textit{write}).
2167 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
2168   dall'inglese \textit{execute}).
2169 \end{itemize*}
2170 mentre i tre livelli su cui sono divisi i privilegi sono:
2171 \begin{itemize*}
2172 \item i privilegi per l'utente proprietario del file.
2173 \item i privilegi per un qualunque utente faccia parte del gruppo cui
2174   appartiene il file.
2175 \item i privilegi per tutti gli altri utenti.
2176 \end{itemize*}
2177
2178 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
2179 meno significativi sono usati a gruppi di tre per indicare i permessi base di
2180 lettura, scrittura ed esecuzione e sono applicati rispettivamente
2181 rispettivamente al proprietario, al gruppo, a tutti gli altri.
2182
2183 \begin{figure}[htb]
2184   \centering
2185   \includegraphics[width=6cm]{img/fileperm}
2186   \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
2187     contenuti nel campo \var{st\_mode} di \struct{stat}.}
2188   \label{fig:file_perm_bit}
2189 \end{figure}
2190
2191 I restanti tre bit (noti come \itindex{suid~bit} \textit{suid bit},
2192 \itindex{sgid~bit} \textit{sgid bit}, e \itindex{sticky~bit} \textit{sticky
2193   bit}) sono usati per indicare alcune caratteristiche più complesse del
2194 meccanismo del controllo di accesso su cui torneremo in seguito (in
2195 sez.~\ref{sec:file_special_perm}); lo schema di allocazione dei bit è
2196 riportato in fig.~\ref{fig:file_perm_bit}.
2197
2198 Anche i permessi, come tutte le altre informazioni pertinenti al file, sono
2199 memorizzati \itindex{inode} nell'\textit{inode}; in particolare essi sono
2200 contenuti in alcuni bit del campo \var{st\_mode} della struttura \struct{stat}
2201 (si veda di nuovo fig.~\ref{fig:file_stat_struct}).
2202
2203 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
2204 \cmd{u} (per \textit{user}), \cmd{g} (per \textit{group}) e \cmd{o} (per
2205 \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti insieme
2206 si usa la lettera \cmd{a} (per \textit{all}). Si tenga ben presente questa
2207 distinzione dato che in certi casi, mutuando la terminologia in uso nel VMS,
2208 si parla dei permessi base come di permessi per \textit{owner}, \textit{group}
2209 ed \textit{all}, le cui iniziali possono dar luogo a confusione.  Le costanti
2210 che permettono di accedere al valore numerico di questi bit nel campo
2211 \var{st\_mode} sono riportate in tab.~\ref{tab:file_bit_perm}.
2212
2213 \begin{table}[htb]
2214   \centering
2215     \footnotesize
2216   \begin{tabular}[c]{|c|l|}
2217     \hline
2218     \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
2219     \hline 
2220     \hline 
2221     \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
2222     \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
2223     \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\ 
2224     \hline            
2225     \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
2226     \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
2227     \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
2228     \hline            
2229     \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
2230     \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
2231     \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
2232     \hline              
2233   \end{tabular}
2234   \caption{I bit dei permessi di accesso ai file, come definiti in 
2235     \texttt{<sys/stat.h>}}
2236   \label{tab:file_bit_perm}
2237 \end{table}
2238
2239 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
2240 che si riferiscano a dei file, dei link simbolici o delle directory; qui ci
2241 limiteremo ad un riassunto delle regole generali, entrando nei dettagli più
2242 avanti.
2243
2244 La prima regola è che per poter accedere ad un file attraverso il suo
2245 \itindex{pathname} \textit{pathname} occorre il permesso di esecuzione in
2246 ciascuna delle directory che compongono il \textit{pathname}; lo stesso vale
2247 per aprire un file nella directory corrente (per la quale appunto serve il
2248 diritto di esecuzione).
2249
2250 Per una directory infatti il permesso di esecuzione significa che essa può
2251 essere attraversata nella risoluzione del \itindex{pathname}
2252 \textit{pathname}, ed è distinto dal permesso di lettura che invece implica
2253 che si può leggere il contenuto della directory.
2254
2255 Questo significa che se si ha il permesso di esecuzione senza permesso di
2256 lettura si potrà lo stesso aprire un file in una directory (se si hanno i
2257 permessi opportuni per il medesimo) ma non si potrà vederlo con \cmd{ls}
2258 (mentre per crearlo occorrerà anche il permesso di scrittura per la
2259 directory).
2260
2261 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
2262 (si veda quanto riportato in tab.~\ref{tab:file_open_flags}) di sola lettura o
2263 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
2264 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
2265 il contenuto, lo stesso permesso è necessario per poter troncare il file.
2266
2267 Non si può creare un file fintanto che non si disponga del permesso di
2268 esecuzione e di quello di scrittura per la directory di destinazione; gli
2269 stessi permessi occorrono per cancellare un file da una directory (si ricordi
2270 che questo non implica necessariamente la rimozione del contenuto del file dal
2271 disco), non è necessario nessun tipo di permesso per il file stesso (infatti
2272 esso non viene toccato, viene solo modificato il contenuto della directory,
2273 rimuovendo la voce che ad esso fa riferimento).
2274
2275 Per poter eseguire un file (che sia un programma compilato od uno script di
2276 shell, od un altro tipo di file eseguibile riconosciuto dal kernel), occorre
2277 avere il permesso di esecuzione, inoltre solo i file regolari possono essere
2278 eseguiti.
2279
2280 I permessi per un link simbolico sono ignorati, contano quelli del file a cui
2281 fa riferimento; per questo in genere il comando \cmd{ls} riporta per un link
2282 simbolico tutti i permessi come concessi; utente e gruppo a cui esso
2283 appartiene vengono pure ignorati quando il link viene risolto, vengono
2284 controllati solo quando viene richiesta la rimozione del link e quest'ultimo è
2285 in una directory con lo \itindex{sticky~bit} \textit{sticky bit} impostato (si
2286 veda sez.~\ref{sec:file_special_perm}).
2287
2288 La procedura con cui il kernel stabilisce se un processo possiede un certo
2289 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
2290 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
2291 \var{st\_gid} accennati in precedenza) e l'user-ID effettivo, il group-ID
2292 effettivo e gli eventuali group-ID supplementari del processo.\footnote{in
2293   realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
2294   identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
2295   sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
2296   eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
2297   differenza.}
2298
2299 Per una spiegazione dettagliata degli identificatori associati ai processi si
2300 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
2301 sez.~\ref{sec:file_special_perm}, l'user-ID effettivo e il group-ID effettivo
2302 corrispondono ai valori dell'\acr{uid} e del \acr{gid} dell'utente che ha
2303 lanciato il processo, mentre i group-ID supplementari sono quelli dei gruppi
2304 cui l'utente appartiene.
2305
2306 I passi attraverso i quali viene stabilito se il processo possiede il diritto
2307 di accesso sono i seguenti:
2308 \begin{enumerate}
2309 \item Se l'user-ID effettivo del processo è zero (corrispondente
2310   all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
2311   controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
2312   tutti i file.
2313 \item Se l'user-ID effettivo del processo è uguale all'\acr{uid} del
2314   proprietario del file (nel qual caso si dice che il processo è proprietario
2315   del file) allora:
2316   \begin{itemize*}
2317   \item se il relativo\footnote{per relativo si intende il bit di user-read se
2318       il processo vuole accedere in lettura, quello di user-write per
2319       l'accesso in scrittura, ecc.} bit dei permessi d'accesso dell'utente è
2320     impostato, l'accesso è consentito
2321   \item altrimenti l'accesso è negato
2322   \end{itemize*}
2323 \item Se il group-ID effettivo del processo o uno dei group-ID supplementari
2324   dei processi corrispondono al \acr{gid} del file allora:
2325   \begin{itemize*}
2326   \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
2327     consentito, 
2328   \item altrimenti l'accesso è negato
2329   \end{itemize*}
2330 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
2331   l'accesso è consentito, altrimenti l'accesso è negato.
2332 \end{enumerate}
2333
2334 Si tenga presente che questi passi vengono eseguiti esattamente in
2335 quest'ordine. Questo vuol dire che se un processo è il proprietario di un file,
2336 l'accesso è consentito o negato solo sulla base dei permessi per l'utente; i
2337 permessi per il gruppo non vengono neanche controllati. Lo stesso vale se il
2338 processo appartiene ad un gruppo appropriato, in questo caso i permessi per
2339 tutti gli altri non vengono controllati.
2340
2341
2342 \subsection{I bit dei permessi speciali}
2343 \label{sec:file_special_perm}
2344
2345 \itindbeg{suid~bit}
2346 \itindbeg{sgid~bit}
2347
2348 Come si è accennato (in sez.~\ref{sec:file_perm_overview}) nei dodici bit del
2349 campo \var{st\_mode} di \struct{stat} che vengono usati per il controllo di
2350 accesso oltre ai bit dei permessi veri e propri, ci sono altri tre bit che
2351 vengono usati per indicare alcune proprietà speciali dei file.  Due di questi
2352 sono i bit detti \acr{suid} (da \textit{set-user-ID bit}) e \acr{sgid} (da
2353 \textit{set-group-ID bit}) che sono identificati dalle costanti
2354 \const{S\_ISUID} e \const{S\_ISGID}.
2355
2356 Come spiegato in dettaglio in sez.~\ref{sec:proc_exec}, quando si lancia un
2357 programma il comportamento normale del kernel è quello di impostare gli
2358 identificatori del gruppo \textit{effective} del nuovo processo al valore dei
2359 corrispondenti del gruppo \textit{real} del processo corrente, che normalmente
2360 corrispondono a quelli dell'utente con cui si è entrati nel sistema.
2361
2362 Se però il file del programma (che ovviamente deve essere
2363 eseguibile\footnote{per motivi di sicurezza il kernel ignora i bit \acr{suid}
2364   e \acr{sgid} per gli script eseguibili.}) ha il bit \acr{suid} impostato, il
2365 kernel assegnerà come user-ID effettivo al nuovo processo l'\acr{uid} del
2366 proprietario del file al posto dell'\acr{uid} del processo originario.  Avere
2367 il bit \acr{sgid} impostato ha lo stesso effetto sul group-ID effettivo del
2368 processo.
2369
2370 I bit \acr{suid} e \acr{sgid} vengono usati per permettere agli utenti normali
2371 di usare programmi che richiedono privilegi speciali; l'esempio classico è il
2372 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
2373 quest'ultimo ovviamente può essere scritto solo dall'amministratore, ma non è
2374 necessario chiamare l'amministratore per cambiare la propria password. Infatti
2375 il comando \cmd{passwd} appartiene a root ma ha il bit \acr{suid} impostato
2376 per cui quando viene lanciato da un utente normale parte con i privilegi di
2377 root.
2378
2379 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
2380 normalmente l'utente che lo ha lanciato comporta vari rischi, e questo tipo di
2381 programmi devono essere scritti accuratamente per evitare che possano essere
2382 usati per guadagnare privilegi non consentiti (l'argomento è affrontato in
2383 dettaglio in sez.~\ref{sec:proc_perms}).
2384
2385 La presenza dei bit \acr{suid} e \acr{sgid} su un file può essere rilevata con
2386 il comando \cmd{ls -l}, che visualizza una lettera \cmd{s} al posto della
2387 \cmd{x} in corrispondenza dei permessi di utente o gruppo. La stessa lettera
2388 \cmd{s} può essere usata nel comando \cmd{chmod} per impostare questi bit.
2389 Infine questi bit possono essere controllati all'interno di \var{st\_mode} con
2390 l'uso delle due costanti \const{S\_ISUID} e \const{S\_IGID}, i cui valori sono
2391 riportati in tab.~\ref{tab:file_mode_flags}.
2392
2393 Gli stessi bit vengono ad assumere in significato completamente diverso per le
2394 directory, normalmente infatti Linux usa la convenzione di SVr4 per indicare
2395 con questi bit l'uso della semantica BSD nella creazione di nuovi file (si
2396 veda sez.~\ref{sec:file_ownership_management} per una spiegazione dettagliata
2397 al proposito).
2398
2399 Infine Linux utilizza il bit \acr{sgid} per un'ulteriore estensione mutuata
2400 da SVr4. Il caso in cui un file ha il bit \acr{sgid} impostato senza che lo
2401 sia anche il corrispondente bit di esecuzione viene utilizzato per attivare
2402 per quel file il \itindex{mandatory~locking} \textit{mandatory locking}
2403 (affronteremo questo argomento in dettaglio più avanti, in
2404 sez.~\ref{sec:file_mand_locking}).
2405
2406 \itindend{suid~bit}
2407 \itindend{sgid~bit}
2408
2409
2410 \itindbeg{sticky~bit}
2411
2412 L'ultimo dei bit rimanenti, identificato dalla costante \const{S\_ISVTX}, è in
2413 parte un rimasuglio delle origini dei sistemi Unix. A quell'epoca infatti la
2414 memoria virtuale e l'accesso ai file erano molto meno sofisticati e per
2415 ottenere la massima velocità possibile per i programmi usati più comunemente
2416 si poteva impostare questo bit.
2417
2418 L'effetto di questo bit era che il \index{segmento!testo} segmento di testo
2419 del programma (si veda sez.~\ref{sec:proc_mem_layout} per i dettagli) veniva
2420 scritto nella swap la prima volta che questo veniva lanciato, e vi permaneva
2421 fino al riavvio della macchina (da questo il nome di \textsl{sticky bit});
2422 essendo la swap un file continuo o una partizione indicizzata direttamente si
2423 poteva risparmiare in tempo di caricamento rispetto alla ricerca attraverso la
2424 struttura del filesystem. Lo \textsl{sticky bit} è indicato usando la lettera
2425 \texttt{t} al posto della \texttt{x} nei permessi per gli altri.
2426
2427 Ovviamente per evitare che gli utenti potessero intasare la swap solo
2428 l'amministratore era in grado di impostare questo bit, che venne chiamato
2429 anche con il nome di \textit{saved text bit}, da cui deriva quello della
2430 costante.  Le attuali implementazioni di memoria virtuale e filesystem rendono
2431 sostanzialmente inutile questo procedimento.
2432
2433 Benché ormai non venga più utilizzato per i file, lo \textit{sticky bit} ha
2434 invece assunto un uso importante per le directory;\footnote{lo \textit{sticky
2435     bit} per le directory è un'estensione non definita nello standard POSIX,
2436   Linux però la supporta, così come BSD e SVr4.} in questo caso se tale bit è
2437 impostato un file potrà essere rimosso dalla directory soltanto se l'utente ha
2438 il permesso di scrittura su di essa ed inoltre è vera una delle seguenti
2439 condizioni:
2440 \begin{itemize*}
2441 \item l'utente è proprietario del file
2442 \item l'utente è proprietario della directory
2443 \item l'utente è l'amministratore 
2444 \end{itemize*}
2445 un classico esempio di directory che ha questo bit impostato è \file{/tmp}, i
2446 permessi infatti di solito sono i seguenti:
2447 \begin{verbatim}
2448 $ ls -ld /tmp
2449 drwxrwxrwt    6 root     root         1024 Aug 10 01:03 /tmp
2450 \end{verbatim}%$
2451 quindi con lo \textit{sticky bit} bit impostato. In questo modo qualunque
2452 utente nel sistema può creare dei file in questa directory (che, come
2453 suggerisce il nome, è normalmente utilizzata per la creazione di file
2454 temporanei), ma solo l'utente che ha creato un certo file potrà cancellarlo o
2455 rinominarlo. In questo modo si evita che un utente possa, più o meno
2456 consapevolmente, cancellare i file temporanei creati degli altri utenti.
2457
2458 \itindend{sticky~bit}
2459
2460 \subsection{Le funzioni per la gestione dei permessi dei file}
2461 \label{sec:file_perm_management}
2462
2463 Come visto in sez.~\ref{sec:file_access_control} il controllo di accesso ad un
2464 file viene fatto utilizzando l'user-ID ed il group-ID effettivo del processo;
2465 ci sono casi però in cui si può voler effettuare il controllo con l'user-ID
2466 reale ed il group-ID reale, vale a dire usando i valori di \acr{uid} e
2467 \acr{gid} relativi all'utente che ha lanciato il programma, e che, come
2468 accennato in sez.~\ref{sec:file_special_perm} e spiegato in dettaglio in
2469 sez.~\ref{sec:proc_perms}, non è detto siano uguali a quelli effettivi.
2470
2471 Per far questo si può usare la funzione \funcd{access}, il cui prototipo è:
2472 \begin{prototype}{unistd.h}
2473 {int access(const char *pathname, int mode)}
2474
2475 Verifica i permessi di accesso.
2476   
2477 \bodydesc{La funzione ritorna 0 se l'accesso è consentito, -1 se l'accesso non
2478   è consentito ed in caso di errore; nel qual caso la variabile \var{errno}
2479   assumerà i valori:
2480   \begin{errlist}
2481   \item[\errcode{EINVAL}] il valore di \param{mode} non è valido.
2482   \item[\errcode{EACCES}] l'accesso al file non è consentito, o non si ha il
2483     permesso di attraversare una delle directory di \param{pathname}.
2484   \item[\errcode{EROFS}] si è richiesto l'accesso in scrittura per un file su
2485     un filesystem montato in sola lettura.
2486   \end{errlist}
2487   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2488   \errval{ENOTDIR}, \errval{ELOOP}, \errval{EIO}.}
2489 \end{prototype}
2490
2491 La funzione verifica i permessi di accesso, indicati da \param{mode}, per il
2492 file indicato da \param{pathname}. I valori possibili per l'argomento
2493 \param{mode} sono esprimibili come combinazione delle costanti numeriche
2494 riportate in tab.~\ref{tab:file_access_mode_val} (attraverso un OR binario
2495 delle stesse). I primi tre valori implicano anche la verifica dell'esistenza
2496 del file, se si vuole verificare solo quest'ultima si può usare \const{F\_OK},
2497 o anche direttamente \func{stat}. Nel caso in cui \param{pathname} si
2498 riferisca ad un link simbolico, questo viene seguito ed il controllo è fatto
2499 sul file a cui esso fa riferimento.
2500
2501 La funzione controlla solo i bit dei permessi di accesso, si ricordi che il
2502 fatto che una directory abbia permesso di scrittura non significa che ci si
2503 possa scrivere come in un file, e il fatto che un file abbia permesso di
2504 esecuzione non comporta che contenga un programma eseguibile. La funzione
2505 ritorna zero solo se tutte i permessi controllati sono disponibili, in caso
2506 contrario (o di errore) ritorna -1.
2507 \begin{table}[htb]
2508   \centering
2509   \footnotesize
2510   \begin{tabular}{|c|l|}
2511     \hline
2512     \textbf{\param{mode}} & \textbf{Significato} \\
2513     \hline
2514     \hline
2515     \const{R\_OK} & Verifica il permesso di lettura. \\
2516     \const{W\_OK} & Verifica il permesso di scrittura. \\
2517     \const{X\_OK} & Verifica il permesso di esecuzione. \\
2518     \const{F\_OK} & Verifica l'esistenza del file. \\
2519     \hline
2520   \end{tabular}
2521   \caption{Valori possibile per l'argomento \param{mode} della funzione 
2522     \func{access}.}
2523   \label{tab:file_access_mode_val}
2524 \end{table}
2525
2526 Un esempio tipico per l'uso di questa funzione è quello di un processo che sta
2527 eseguendo un programma coi privilegi di un altro utente (ad esempio attraverso
2528 l'uso del \itindex{suid~bit} \textit{suid bit}) che vuole controllare se
2529 l'utente originale ha i permessi per accedere ad un certo file.
2530
2531 Del tutto analoghe a \func{access} sono le due funzioni \funcd{euidaccess} e
2532 \funcd{eaccess} che ripetono lo stesso controllo usando però gli
2533 identificatori del gruppo effettivo, verificando quindi le effettive capacità
2534 di accesso ad un file. Le funzioni hanno entrambe lo stesso
2535 prototipo\footnote{in realtà \func{eaccess} è solo un sinonimo di
2536   \func{euidaccess} fornita per compatibilità con l'uso di questo nome in
2537   altri sistemi.} che è del tutto identico a quello di \func{access}. Prendono
2538 anche gli stessi valori e restituiscono gli stessi risultati e gli stessi
2539 codici di errore.
2540
2541 Per cambiare i permessi di un file il sistema mette ad disposizione due
2542 funzioni \funcd{chmod} e \funcd{fchmod}, che operano rispettivamente su un
2543 filename e su un file descriptor, i loro prototipi sono:
2544 \begin{functions}
2545   \headdecl{sys/types.h} 
2546   \headdecl{sys/stat.h} 
2547   
2548   \funcdecl{int chmod(const char *path, mode\_t mode)} Cambia i permessi del
2549   file indicato da \param{path} al valore indicato da \param{mode}.
2550   
2551   \funcdecl{int fchmod(int fd, mode\_t mode)} Analoga alla precedente, ma usa
2552   il file descriptor \param{fd} per indicare il file.
2553   
2554   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
2555     un errore, in caso di errore \var{errno} può assumere i valori:
2556   \begin{errlist}
2557   \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2558     proprietario del file o non è zero.
2559     \item[\errcode{EROFS}] il file è su un filesystem in sola lettura.
2560   \end{errlist}
2561   ed inoltre \errval{EIO}; \func{chmod} restituisce anche \errval{EFAULT},
2562   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2563   \errval{EACCES}, \errval{ELOOP}; \func{fchmod} anche \errval{EBADF}.}
2564 \end{functions}
2565
2566 Entrambe le funzioni utilizzano come secondo argomento \param{mode}, una
2567 variabile dell'apposito tipo primitivo \type{mode\_t} (vedi
2568 tab.~\ref{tab:intro_primitive_types}) utilizzato per specificare i permessi sui
2569 file.
2570
2571 \begin{table}[!htb]
2572   \centering
2573   \footnotesize
2574   \begin{tabular}[c]{|c|c|l|}
2575     \hline
2576     \textbf{\param{mode}} & \textbf{Valore} & \textbf{Significato} \\
2577     \hline
2578     \hline
2579     \const{S\_ISUID} & 04000 & Set user ID \itindex{suid~bit}.\\
2580     \const{S\_ISGID} & 02000 & Set group ID \itindex{sgid~bit}.\\
2581     \const{S\_ISVTX} & 01000 & Sticky bit \itindex{sticky~bit}.\\
2582     \hline
2583     \const{S\_IRWXU} & 00700 & L'utente ha tutti i permessi.\\
2584     \const{S\_IRUSR} & 00400 & L'utente ha il permesso di lettura.\\
2585     \const{S\_IWUSR} & 00200 & L'utente ha il permesso di scrittura.\\
2586     \const{S\_IXUSR} & 00100 & L'utente ha il permesso di esecuzione.\\
2587     \hline
2588     \const{S\_IRWXG} & 00070 & Il gruppo ha tutti i permessi.\\
2589     \const{S\_IRGRP} & 00040 & Il gruppo ha il permesso di lettura.\\
2590     \const{S\_IWGRP} & 00020 & Il gruppo ha il permesso di scrittura.\\
2591     \const{S\_IXGRP} & 00010 & Il gruppo ha il permesso di esecuzione.\\
2592     \hline
2593     \const{S\_IRWXO} & 00007 & Gli altri hanno tutti i permessi.\\
2594     \const{S\_IROTH} & 00004 & Gli altri hanno il permesso di lettura.\\
2595     \const{S\_IWOTH} & 00002 & Gli altri hanno il permesso di scrittura.\\
2596     \const{S\_IXOTH} & 00001 & Gli altri hanno il permesso di esecuzione.\\
2597     \hline
2598   \end{tabular}
2599   \caption{Valori delle costanti usate per indicare i vari bit di
2600     \param{mode} utilizzato per impostare i permessi dei file.}
2601   \label{tab:file_permission_const}
2602 \end{table}
2603
2604 Le costanti con cui specificare i singoli bit di \param{mode} sono riportate
2605 in tab.~\ref{tab:file_permission_const}. Il valore di \param{mode} può essere
2606 ottenuto combinando fra loro con un OR binario le costanti simboliche relative
2607 ai vari bit, o specificato direttamente, come per l'omonimo comando di shell,
2608 con un valore numerico (la shell lo vuole in ottale, dato che i bit dei
2609 permessi sono divisibili in gruppi di tre), che si può calcolare direttamente
2610 usando lo schema si utilizzo dei bit illustrato in
2611 fig.~\ref{fig:file_perm_bit}.
2612
2613 Ad esempio i permessi standard assegnati ai nuovi file (lettura e scrittura
2614 per il proprietario, sola lettura per il gruppo e gli altri) sono
2615 corrispondenti al valore ottale $0644$, un programma invece avrebbe anche il
2616 bit di esecuzione attivo, con un valore di $0755$, se si volesse attivare il
2617 bit \itindex{suid~bit} \acr{suid} il valore da fornire sarebbe $4755$.
2618
2619 Il cambiamento dei permessi di un file eseguito attraverso queste funzioni ha
2620 comunque alcune limitazioni, previste per motivi di sicurezza. L'uso delle
2621 funzioni infatti è possibile solo se l'user-ID effettivo del processo
2622 corrisponde a quello del proprietario del file o dell'amministratore,
2623 altrimenti esse falliranno con un errore di \errcode{EPERM}.
2624
2625 Ma oltre a questa regola generale, di immediata comprensione, esistono delle
2626 limitazioni ulteriori. Per questo motivo, anche se si è proprietari del file,
2627 non tutti i valori possibili di \param{mode} sono permessi o hanno effetto;
2628 in particolare accade che:
2629 \begin{enumerate}
2630 \item siccome solo l'amministratore può impostare lo \itindex{sticky~bit}
2631   \textit{sticky bit}, se l'user-ID effettivo del processo non è zero esso
2632   viene automaticamente cancellato (senza notifica di errore) qualora sia
2633   stato indicato in \param{mode}.
2634 \item per quanto detto in sez.~\ref{sec:file_ownership_management} riguardo la
2635   creazione dei nuovi file, si può avere il caso in cui il file creato da un
2636   processo è assegnato ad un gruppo per il quale il processo non ha privilegi.
2637   Per evitare che si possa assegnare il bit \itindex{sgid~bit} \acr{sgid} ad
2638   un file appartenente ad un gruppo per cui non si hanno diritti, questo viene
2639   automaticamente cancellato da \param{mode} (senza notifica di errore)
2640   qualora il gruppo del file non corrisponda a quelli associati al processo
2641   (la cosa non avviene quando l'user-ID effettivo del processo è zero).
2642 \end{enumerate}
2643
2644 Per alcuni filesystem\footnote{i filesystem più comuni (\textsl{ext2},
2645   \textsl{ext3}, \textsl{reiserfs}) supportano questa caratteristica, che è
2646   mutuata da BSD.} è inoltre prevista un'ulteriore misura di sicurezza, volta
2647 a scongiurare l'abuso dei \itindex{suid~bit} bit \acr{suid} e \acr{sgid}; essa
2648 consiste nel cancellare automaticamente questi bit dai permessi di un file
2649 qualora un processo che non appartenga all'amministratore\footnote{per la
2650   precisione un processo che non dispone della \itindex{capabilities} capacità
2651   \const{CAP\_FSETID}, vedi sez.~\ref{sec:proc_capabilities}.} effettui una
2652 scrittura. In questo modo anche se un utente malizioso scopre un file
2653 \acr{suid} su cui può scrivere, un'eventuale modifica comporterà la perdita di
2654 questo privilegio.
2655
2656 Le funzioni \func{chmod} e \func{fchmod} ci permettono di modificare i
2657 permessi di un file, resta però il problema di quali sono i permessi assegnati
2658 quando il file viene creato. Le funzioni dell'interfaccia nativa di Unix, come
2659 vedremo in sez.~\ref{sec:file_open}, permettono di indicare esplicitamente i
2660 permessi di creazione di un file, ma questo non è possibile per le funzioni
2661 dell'interfaccia standard ANSI C che non prevede l'esistenza di utenti e
2662 gruppi, ed inoltre il problema si pone anche per l'interfaccia nativa quando i
2663 permessi non vengono indicati esplicitamente. 
2664
2665 \itindbeg{umask} 
2666
2667 Per le funzioni dell'interfaccia standard ANSI C l'unico riferimento possibile
2668 è quello della modalità di apertura del nuovo file (lettura/scrittura o sola
2669 lettura), che però può fornire un valore che è lo stesso per tutti e tre i
2670 permessi di sez.~\ref{sec:file_perm_overview} (cioè $666$ nel primo caso e
2671 $222$ nel secondo). Per questo motivo il sistema associa ad ogni
2672 processo\footnote{è infatti contenuta nel campo \var{umask} della struttura
2673   \struct{fs\_struct}, vedi fig.~\ref{fig:proc_task_struct}.}  una maschera di
2674 bit, la cosiddetta \textit{umask}, che viene utilizzata per impedire che
2675 alcuni permessi possano essere assegnati ai nuovi file in sede di creazione. I
2676 bit indicati nella maschera vengono infatti cancellati dai permessi quando un
2677 nuovo file viene creato.\footnote{l'operazione viene fatta sempre: anche
2678   qualora si indichi esplicitamente un valore dei permessi nelle funzioni di
2679   creazione che lo consentono, i permessi contenuti nella \textit{umask}
2680   verranno tolti.}
2681
2682 La funzione che permette di impostare il valore di questa maschera di
2683 controllo è \funcd{umask}, ed il suo prototipo è:
2684 \begin{prototype}{stat.h}
2685 {mode\_t umask(mode\_t mask)}
2686
2687 Imposta la maschera dei permessi dei bit al valore specificato da \param{mask}
2688 (di cui vengono presi solo i 9 bit meno significativi).
2689   
2690   \bodydesc{La funzione ritorna il precedente valore della maschera. È una
2691     delle poche funzioni che non restituisce codici di errore.}
2692 \end{prototype}
2693
2694 In genere si usa questa maschera per impostare un valore predefinito che
2695 escluda preventivamente alcuni permessi (usualmente quello di scrittura per il
2696 gruppo e gli altri, corrispondente ad un valore per \param{mask} pari a
2697 $022$).  In questo modo è possibile cancellare automaticamente i permessi non
2698 voluti.  Di norma questo valore viene impostato una volta per tutte al login a
2699 $022$, e gli utenti non hanno motivi per modificarlo.
2700
2701 \itindend{umask} 
2702
2703
2704 \subsection{La gestione della titolarità dei file}
2705 \label{sec:file_ownership_management}
2706
2707 Vedremo in sez.~\ref{sec:file_base_func} con quali funzioni si possono creare
2708 nuovi file, in tale occasione vedremo che è possibile specificare in sede di
2709 creazione quali permessi applicare ad un file, però non si può indicare a
2710 quale utente e gruppo esso deve appartenere.  Lo stesso problema si presenta
2711 per la creazione di nuove directory (procedimento descritto in
2712 sez.~\ref{sec:file_dir_creat_rem}).
2713
2714 Lo standard POSIX prescrive che l'\acr{uid} del nuovo file corrisponda
2715 all'user-ID effettivo del processo che lo crea; per il \acr{gid} invece prevede
2716 due diverse possibilità:
2717 \begin{itemize*}
2718 \item il \acr{gid} del file corrisponde al group-ID effettivo del processo.
2719 \item il \acr{gid} del file corrisponde al \acr{gid} della directory in cui
2720   esso è creato.
2721 \end{itemize*}
2722 in genere BSD usa sempre la seconda possibilità, che viene per questo chiamata
2723 semantica BSD. Linux invece segue quella che viene chiamata semantica SVr4; di
2724 norma cioè il nuovo file viene creato, seguendo la prima opzione, con il
2725 \acr{gid} del processo, se però la directory in cui viene creato il file ha il
2726 bit \acr{sgid} impostato allora viene usata la seconda opzione.
2727
2728 Usare la semantica BSD ha il vantaggio che il \acr{gid} viene sempre
2729 automaticamente propagato, restando coerente a quello della directory di
2730 partenza, in tutte le sotto-directory. 
2731
2732 La semantica SVr4 offre la possibilità di scegliere, ma per ottenere lo stesso
2733 risultato di coerenza che si ha con BSD necessita che quando si creano nuove
2734 directory venga anche propagato anche il bit \acr{sgid}. Questo è il
2735 comportamento predefinito del comando \cmd{mkdir}, ed è in questo modo ad
2736 esempio che le varie distribuzioni assicurano che le sotto-directory create
2737 nella home di un utente restino sempre con il \acr{gid} del gruppo primario
2738 dello stesso.
2739
2740 La presenza del bit \acr{sgid} è inoltre molto comoda quando si hanno
2741 directory contenenti file condivisi all'intero di un gruppo in cui possono
2742 scrivere tutti i membri dello stesso, dato che assicura che i file che gli
2743 utenti vi creano appartengano sempre allo stesso gruppo. Questo non risolve
2744 però completamente i problemi di accesso da parte di altri utenti dello stesso
2745 gruppo, in quanto i permessi assegnati al gruppo potrebbero non essere
2746 sufficienti; in tal caso si deve aver cura di usare un valore di
2747 \itindex{umask} \textit{umask} che ne lasci di sufficienti.\footnote{in tal
2748   caso si può assegnare agli utenti del gruppo una \textit{umask} di $002$,
2749   anche se la soluzione migliore in questo caso è usare una ACL di default
2750   (vedi sez.~\ref{sec:file_ACL}).}
2751
2752 Come avviene nel caso dei permessi il sistema fornisce anche delle funzioni,
2753 \funcd{chown}, \funcd{fchown} e \funcd{lchown}, che permettono di cambiare sia
2754 l'utente che il gruppo a cui un file appartiene; i rispettivi prototipi sono:
2755 \begin{functions}
2756   \headdecl{sys/types.h} 
2757   \headdecl{sys/stat.h} 
2758   
2759   \funcdecl{int chown(const char *path, uid\_t owner, gid\_t group)}
2760   \funcdecl{int fchown(int fd, uid\_t owner, gid\_t group)}
2761   \funcdecl{int lchown(const char *path, uid\_t owner, gid\_t group)}
2762
2763   Le funzioni cambiano utente e gruppo di appartenenza di un file ai valori
2764   specificati dalle variabili \param{owner} e \param{group}. 
2765   
2766   \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
2767     errore, nel qual caso caso \var{errno} assumerà i valori:
2768   \begin{errlist}
2769   \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2770     proprietario del file o non è zero, o utente e gruppo non sono validi
2771   \end{errlist}
2772   Oltre a questi entrambe restituiscono gli errori \errval{EROFS} e
2773   \errval{EIO}; \func{chown} restituisce anche \errval{EFAULT},
2774   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2775   \errval{EACCES}, \errval{ELOOP}; \func{fchown} anche \errval{EBADF}.}
2776 \end{functions}
2777
2778 Con Linux solo l'amministratore\footnote{o in generale un processo con la
2779   \itindex{capabilities} capacità \const{CAP\_CHOWN}, vedi
2780   sez.~\ref{sec:proc_capabilities}.} può cambiare il proprietario di un file;
2781 in questo viene seguita la semantica usata da BSD che non consente agli utenti
2782 di assegnare i loro file ad altri utenti evitando eventuali aggiramenti delle
2783 quote.  L'amministratore può cambiare sempre il gruppo di un file, il
2784 proprietario può cambiare il gruppo solo dei file che gli appartengono e solo
2785 se il nuovo gruppo è il suo gruppo primario o uno dei gruppi di cui fa parte.
2786
2787 La funzione \func{chown} segue i link simbolici, per operare direttamente su
2788 un link simbolico si deve usare la funzione \func{lchown}.\footnote{fino alla
2789   versione 2.1.81 in Linux \func{chown} non seguiva i link simbolici, da
2790   allora questo comportamento è stato assegnato alla funzione \func{lchown},
2791   introdotta per l'occasione, ed è stata creata una nuova system call per
2792   \func{chown} che seguisse i link simbolici.} La funzione \func{fchown} opera
2793 su un file aperto, essa è mutuata da BSD, ma non è nello standard POSIX.
2794 Un'altra estensione rispetto allo standard POSIX è che specificando -1 come
2795 valore per \param{owner} e \param{group} i valori restano immutati.
2796
2797 Quando queste funzioni sono chiamate con successo da un processo senza i
2798 privilegi di root entrambi i bit \itindex{suid~bit} \acr{suid} e
2799 \itindex{sgid~bit} \acr{sgid} vengono cancellati. Questo non avviene per il
2800 bit \acr{sgid} nel caso in cui esso sia usato (in assenza del corrispondente
2801 permesso di esecuzione) per indicare che per il file è attivo il
2802 \itindex{mandatory~locking} \textit{mandatory locking} (vedi
2803 sez.~\ref{sec:file_mand_locking}).
2804
2805
2806 \subsection{Un quadro d'insieme sui permessi}
2807 \label{sec:file_riepilogo}
2808
2809 Avendo affrontato in maniera separata il comportamento delle varie funzioni
2810 che operano sui permessi dei file ed avendo trattato in sezioni diverse il
2811 significato dei singoli bit dei permessi, vale la pena di fare un riepilogo in
2812 cui si riassumano le caratteristiche di ciascuno di essi, in modo da poter
2813 fornire un quadro d'insieme.
2814
2815 \begin{table}[!htb]
2816   \centering
2817   \footnotesize
2818   \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
2819     \hline
2820     \multicolumn{3}{|c|}{special}&
2821     \multicolumn{3}{|c|}{user}&
2822     \multicolumn{3}{|c|}{group}&
2823     \multicolumn{3}{|c|}{other}&
2824     \multirow{2}{*}{\textbf{Significato per i file}} \\
2825     \cline{1-12}
2826     \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2827     \hline
2828     \hline
2829    1&-&-&-&-&-&-&-&-&-&-&-&Se eseguito ha i permessi del proprietario.\\
2830    -&1&-&-&-&1&-&-&-&-&-&-&Se eseguito ha i permessi del gruppo proprietario.\\
2831    -&1&-&-&-&0&-&-&-&-&-&-&Il \itindex{mandatory~locking} 
2832                            \textit{mandatory locking} è abilitato.\\
2833    -&-&1&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2834    -&-&-&1&-&-&-&-&-&-&-&-&Permesso di lettura per il proprietario.\\
2835    -&-&-&-&1&-&-&-&-&-&-&-&Permesso di scrittura per il proprietario.\\
2836    -&-&-&-&-&1&-&-&-&-&-&-&Permesso di esecuzione per il proprietario.\\
2837    -&-&-&-&-&-&1&-&-&-&-&-&Permesso di lettura per il gruppo proprietario.\\
2838    -&-&-&-&-&-&-&1&-&-&-&-&Permesso di scrittura per il gruppo proprietario.\\
2839    -&-&-&-&-&-&-&-&1&-&-&-&Permesso di esecuzione per il gruppo proprietario.\\
2840    -&-&-&-&-&-&-&-&-&1&-&-&Permesso di lettura per tutti gli altri.\\
2841    -&-&-&-&-&-&-&-&-&-&1&-&Permesso di scrittura per tutti gli altri.\\
2842    -&-&-&-&-&-&-&-&-&-&-&1&Permesso di esecuzione per tutti gli altri.\\
2843     \hline
2844     \hline
2845     \multicolumn{3}{|c|}{special}&
2846     \multicolumn{3}{|c|}{user}&
2847     \multicolumn{3}{|c|}{group}&
2848     \multicolumn{3}{|c|}{other}&
2849     \multirow{2}{*}{\textbf{Significato per le directory}} \\
2850     \cline{1-12}
2851     \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2852     \hline
2853     \hline
2854     1&-&-&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2855     -&1&-&-&-&-&-&-&-&-&-&-&Propaga il gruppo proprietario ai nuovi file 
2856                             creati.\\
2857     -&-&1&-&-&-&-&-&-&-&-&-&Limita l'accesso in scrittura dei file nella 
2858                             directory.\\
2859     -&-&-&1&-&-&-&-&-&-&-&-&Permesso di visualizzazione per il proprietario.\\
2860     -&-&-&-&1&-&-&-&-&-&-&-&Permesso di aggiornamento per il proprietario.\\
2861     -&-&-&-&-&1&-&-&-&-&-&-&Permesso di attraversamento per il proprietario.\\
2862     -&-&-&-&-&-&1&-&-&-&-&-&Permesso di visualizzazione per il gruppo 
2863                             proprietario.\\
2864     -&-&-&-&-&-&-&1&-&-&-&-&Permesso di aggiornamento per il gruppo 
2865                             proprietario.\\
2866     -&-&-&-&-&-&-&-&1&-&-&-&Permesso di attraversamento per il gruppo 
2867                             proprietario.\\
2868     -&-&-&-&-&-&-&-&-&1&-&-&Permesso di visualizzazione per tutti gli altri.\\
2869     -&-&-&-&-&-&-&-&-&-&1&-&Permesso di aggiornamento per tutti gli altri.\\
2870     -&-&-&-&-&-&-&-&-&-&-&1&Permesso di attraversamento per tutti gli altri.\\
2871     \hline
2872   \end{tabular}
2873   \caption{Tabella riassuntiva del significato dei bit dei permessi per un
2874     file e directory.} 
2875   \label{tab:file_fileperm_bits}
2876 \end{table}
2877
2878 Nella parte superiore di tab.~\ref{tab:file_fileperm_bits} si è riassunto il
2879 significato dei vari bit dei permessi per un file ordinario; per quanto
2880 riguarda l'applicazione dei permessi per proprietario, gruppo ed altri si
2881 ricordi quanto illustrato in sez.~\ref{sec:file_perm_overview}.  Per
2882 compattezza, nella tabella si sono specificati i bit di \itindex{suid~bit}
2883 \textit{suid}, \itindex{sgid~bit} \textit{sgid} e \textit{sticky}
2884 \itindex{sticky~bit} con la notazione illustrata anche in
2885 fig.~\ref{fig:file_perm_bit}.  Nella parte inferiore si sono invece riassunti
2886 i significati dei vari bit dei permessi per una directory; anche in questo
2887 caso si è riapplicato ai bit di \itindex{suid~bit} \textit{suid},
2888 \itindex{sgid~bit} \textit{sgid} e \textit{sticky} \itindex{sticky~bit} la
2889 notazione illustrata in fig.~\ref{fig:file_perm_bit}.
2890
2891 Si ricordi infine che i permessi non hanno alcun significato per i link
2892 simbolici, mentre per i \index{file!di~dispositivo} file di dispositivo hanno
2893 senso soltanto i permessi di lettura e scrittura, che si riflettono sulla
2894 possibilità di compiere dette operazioni sul dispositivo stesso.
2895
2896 Nella tabella si è indicato con il carattere ``-'' il fatto che il valore del
2897 bit in questione non è influente rispetto a quanto indicato nella riga della
2898 tabella; la descrizione del significato fa riferimento soltanto alla
2899 combinazione di bit per i quali è stato riportato esplicitamente un valore.
2900 Si rammenti infine che il valore dei bit dei permessi non ha alcun effetto
2901 qualora il processo possieda i privilegi di amministratore.
2902
2903
2904 \section{Caratteristiche e funzionalità avanzate}
2905 \label{sec:file_dir_advances}
2906
2907 Tratteremo qui alcune caratteristiche e funzionalità avanzate della gestione
2908 di file e directory, affrontando anche una serie di estensioni
2909 dell'interfaccia classica dei sistemi unix-like, principalmente utilizzate a
2910 scopi di sicurezza, che sono state introdotte nelle versioni più recenti di
2911 Linux.
2912
2913
2914 \subsection{La gestione delle \textit{capabilities}}
2915 \label{sec:proc_capabilities}
2916
2917 \itindbeg{capabilities} 
2918
2919 Come accennato in sez.~\ref{sec:proc_access_id} l'architettura classica della
2920 gestione dei privilegi in un sistema unix-like ha il sostanziale problema di
2921 fornire all'amministratore dei poteri troppo ampi, questo comporta che anche
2922 quando si siano predisposte delle misure di protezione per in essere in grado
2923 di difendersi dagli effetti di una eventuale compromissione del
2924 sistema,\footnote{come montare un filesystem in sola lettura per impedirne
2925   modifiche, o marcare un file come immutabile.} una volta che questa sia
2926 stata effettuata e si siano ottenuti i privilegi di amministratore, queste
2927 potranno essere comunque rimosse.\footnote{nei casi elencati nella precedente
2928   nota si potrà sempre rimontare il sistema in lettura-scrittura, o togliere
2929   la marcatura di immutabilità.}
2930
2931 Il problema consiste nel fatto che nell'architettura tradizionale di un
2932 sistema unix-like i controlli di accesso sono basati su un solo livello di
2933 separazione: per i processi normali essi sono posti in atto, mentre per i
2934 processi con i privilegi di amministratore essi non vengono neppure eseguiti;
2935 per questo motivo non era previsto alcun modo per evitare che un processo con
2936 diritti di amministratore non potesse eseguire certe operazioni, o per cedere
2937 definitivamente alcuni privilegi da un certo momento in poi.
2938
2939 Per ovviare a tutto ciò, a partire dai kernel della serie 2.2, è stato
2940 introdotto un meccanismo, detto \textit{capabilities}, che consentisse di
2941 suddividere i vari privilegi tradizionalmente associati all'amministratore in
2942 un insieme di \textsl{capacità} distinte.  L'idea era che queste capacità
2943 potessero essere abilitate e disabilitate in maniera indipendente per ciascun
2944 processo con privilegi di amministratore, permettendo così una granularità
2945 molto più fine nella distribuzione degli stessi che evitasse la originaria
2946 situazione di ``\textsl{tutto o nulla}''.
2947
2948 Il meccanismo completo delle \textit{capabilities}\footnote{l'implementazione
2949   si rifà ad una bozza di quello che doveva diventare lo standard POSIX.1e,
2950   poi abbandonato.} prevede inoltre la possibilità di associare le stesse ai
2951 singoli file eseguibili, in modo da poter stabilire quali capacità possono
2952 essere utilizzate quando viene messo in esecuzione uno specifico programma; ma
2953 il supporto per questa funzionalità è stato introdotto soltanto a partire dal
2954 kernel 2.6.24; fino ad allora doveva essere il programma stesso ad eseguire
2955 una riduzione esplicita delle sue capacità, cosa che ha reso l'uso di questa
2956 funzionalità poco diffuso, vista la presenza di meccanismi alternativi come
2957 \index{SELinux} SELinux.
2958
2959 Per gestire questo meccanismo ciascun processo porta con sé tre distinti
2960 insiemi di \textit{capabilities}, che vengono denominati rispettivamente
2961 \textit{effective}, \textit{permitted} ed \textit{inherited}. Questi insiemi
2962 vengono mantenuti in forma di tre diverse maschere binarie,\footnote{il kernel
2963   li mantiene, come i vari identificatori di sez.~\ref{sec:proc_setuid},
2964   all'interno della \struct{task\_struct} di ciascun processo (vedi
2965   fig.~\ref{fig:proc_task_struct}), nei tre campi \texttt{cap\_effective},
2966   \texttt{cap\_inheritable}, \texttt{cap\_permitted} del tipo
2967   \texttt{kernel\_cap\_t}; questo è attualmente definito come intero a 32 bit,
2968   il che comporta un massimo di 32 \textit{capabilities} distinte.} in cui
2969 ciascun bit corrisponde ad una capacità diversa.
2970
2971 L'utilizzo di tre distinti insiemi serve a fornire una interfaccia flessibile
2972 per l'uso delle \textit{capabilities}, con scopi analoghi a quelli per cui
2973 sono mantenuti i diversi insiemi di identificatori di
2974 sez.~\ref{sec:proc_setuid}; il loro significato è il seguente:
2975 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
2976 \item[\textit{effective}] l'insieme delle \textit{capabilities}
2977   ``\textsl{effettive}'', cioè di quelle che vengono effettivamente usate dal
2978   kernel quando deve eseguire il controllo di accesso per le varie operazioni
2979   compiute dal processo.
2980 \item[\textit{permitted}] l'insieme delle \textit{capabilities}
2981   ``\textsl{permesse}'', cioè l'insieme di quelle capacità che un processo
2982   \textsl{può} impostare come \textsl{effettive}. Se un processo cancella una
2983   capacità da questo insieme non potrà più riassumerla (almeno che non esegua
2984   un programma che è \acr{suid} di root).
2985 \item[\textit{inherited}] l'insieme delle \textit{capabilities}
2986   ``\textsl{ereditabili}'', cioè quelle che vengono trasmesse ad un nuovo
2987   programma eseguito attraverso una chiamata ad \func{exec} (con l'eccezione
2988   del caso che questo sia \acr{suid} di root).
2989 \label{sec:capabilities_set}
2990 \end{basedescript}
2991
2992 Oltre a questi tre insiemi, che sono relativi al singolo processo, il kernel
2993 mantiene un insieme generale valido per tutto il sistema, chiamato
2994 \itindex{capabilities~bounding~set} \textit{capabilities bounding set}. Ogni
2995 volta che un programma viene posto in esecuzione con \func{exec} il contenuto
2996 degli insiemi \textit{effective} e \textit{permitted} vengono mascherati con
2997 un \textsl{AND} binario del contenuto corrente del \textit{capabilities
2998   bounding set}, così che il nuovo processo potrà disporre soltanto delle
2999 capacità in esso elencate.
3000
3001 Il \textit{capabilities bounding set} è un parametro di sistema, accessibile
3002 attraverso il contenuto del file \procfile{/proc/sys/kernel/cap-bound}, che per
3003 questa sua caratteristica consente di impostare un limite generale alle
3004 capacità che possono essere accordate ai vari processi.  Questo valore può
3005 essere impostato ad un valore arbitrario esclusivamente dal primo processo
3006 eseguito nel sistema (di norma cioè da \texttt{/sbin/init}), ogni processo
3007 eseguito successivamente (cioè con \textsl{pid} diverso da 1) anche se
3008 eseguito con privilegi di amministratore potrà soltanto rimuovere uno dei bit
3009 già presenti dell'insieme: questo significa che una volta rimossa una
3010 \textit{capability} dal \textit{capabilities bounding set} essa non sarà più
3011 disponibile, neanche per l'amministratore, a meno di un riavvio.
3012
3013 Quando un programma viene messo in esecuzione\footnote{cioè quando viene
3014   eseguita la \func{execve} con cui lo si lancia; in corrispondenza di una
3015   \func{fork} le \textit{capabilities} non vengono modificate.} esso eredita
3016 (nel senso che assume negli insiemi \textit{effective} e \textit{permitted})
3017 le \textit{capabilities} mantenute nell'insieme \textit{inherited}, a meno che
3018 non sia eseguito un programma \acr{suid} di root o la \func{exec} sia stata
3019 eseguita da un programma con \textsl{uid} reale zero; in tal caso il programma
3020 ottiene tutte le \textit{capabilities} presenti nel \textit{capabilities
3021   bounding set}. In questo modo si può far si che ad un processo eseguito in
3022 un secondo tempo possano essere trasmesse solo un insieme limitato di
3023 capacità, impedendogli di recuperare quelle assenti nell'insieme
3024 \textit{inherited}. Si tenga presente invece che attraverso una \func{fork}
3025 vengono mantenute le stesse capacità del processo padre.
3026
3027
3028 % TODO verificare per process capability bounding set, vedi:
3029 %  http://git.kernel.org/git/?p=linux/kernel/git/torvalds/linux-2.6.git;a=commit;h=3b7391de67da515c91f48aa371de77cb6cc5c07e
3030
3031 % TODO capire cosa cambia con i patch vari, vedi
3032 % http://lwn.net/Articles/280279/  
3033 % http://lwn.net/Articles/256519/
3034 % http://lwn.net/Articles/211883/
3035
3036
3037 Un elenco delle delle \textit{capabilities} disponibili su Linux, con una
3038 breve descrizione ed il nome delle costanti che le identificano, è riportato
3039 in tab.~\ref{tab:proc_capabilities};\footnote{l'elenco presentato questa
3040   tabella, ripreso dalla pagina di manuale (accessibile con \texttt{man
3041     capabilities}) e dalle definizioni in \texttt{linux/capabilities.h}, è
3042   aggiornato al kernel 2.6.26.} la tabella è divisa in due parti, la prima
3043 riporta le \textit{capabilities} previste anche nella bozza dello standard
3044 POSIX1.e, la seconda quelle specifiche di Linux.  Come si può notare dalla
3045 tabella alcune \textit{capabilities} attengono a singole funzionalità e sono
3046 molto specializzate, mentre altre hanno un campo di applicazione molto vasto,
3047 che è opportuno dettagliare maggiormente.
3048
3049 \begin{table}[!h!bt]
3050   \centering
3051   \footnotesize
3052   \begin{tabular}{|l|p{12cm}|}
3053     \hline
3054     \textbf{Capacità}&\textbf{Descrizione}\\
3055     \hline
3056     \hline
3057 %
3058 % POSIX-draft defined capabilities.
3059 %
3060     \const{CAP\_AUDIT\_WRITE}&La capacità di scrivere dati nel giornale di
3061                               auditing del kernel (dal kernel 2.6.11).\\ 
3062     \const{CAP\_AUDIT\_CONTROL}& La capacità di abilitare e disabilitare il
3063                               controllo dell'auditing (dal kernel 2.6.11).\\ 
3064     % TODO verificare questa roba dell'auditing
3065     \const{CAP\_CHOWN}      & La capacità di cambiare proprietario e gruppo
3066                               proprietario di un file (vedi
3067                               sez.~\ref{sec:file_ownership_management}).\\
3068     \const{CAP\_DAC\_OVERRIDE}& La capacità di evitare il controllo dei
3069                               permessi di lettura, scrittura ed esecuzione dei
3070                               file,\footnotemark (vedi
3071                               sez.~\ref{sec:file_access_control}).\\
3072     \const{CAP\_DAC\_READ\_SEARCH}& La capacità di evitare il controllo dei
3073                               permessi di lettura ed esecuzione per
3074                               le directory (vedi
3075                               sez.~\ref{sec:file_access_control}).\\
3076     \const{CAP\_FOWNER}     & La capacità di evitare il controllo della
3077                               proprietà di un file per tutte
3078                               le operazioni privilegiate non coperte dalle
3079                               precedenti \const{CAP\_DAC\_OVERRIDE} e
3080                               \const{CAP\_DAC\_READ\_SEARCH}.\\
3081     \const{CAP\_FSETID}     & La capacità di evitare la cancellazione
3082                               automatica dei bit \itindex{suid~bit} \acr{suid}
3083                               e \itindex{sgid~bit} \acr{sgid} quando un file
3084                               per i quali sono impostati viene modificato da
3085                               un processo senza questa capacità e la capacità
3086                               di impostare il bit \acr{sgid} su un file anche
3087                               quando questo è relativo ad un gruppo cui non si
3088                               appartiene (vedi
3089                               sez.~\ref{sec:file_perm_management}).\\ 
3090     \const{CAP\_SETFCAP}    & La capacità di impostare le
3091                               \textit{capabilities} di un file (dal kernel
3092                               2.6.24).\\  
3093     \const{CAP\_KILL}       & La capacità di mandare segnali a qualunque
3094                               processo (vedi sez.~\ref{sec:sig_kill_raise}).\\
3095     \const{CAP\_SETGID}     & La capacità di manipolare i group ID dei
3096                               processi, sia il principale che i supplementari,
3097                               (vedi sez.~\ref{sec:proc_setgroups}) che quelli
3098                               trasmessi tramite i socket \textit{unix domain}
3099                               (vedi sez.~\ref{sec:unix_socket}).\\
3100     \const{CAP\_SETUID}     & La capacità di manipolare gli user ID del
3101                               processo (vedi sez.~\ref{sec:proc_setuid}) e di
3102                               trasmettere un user ID arbitrario nel passaggio
3103                               delle credenziali coi socket \textit{unix
3104                                 domain} (vedi sez.~\ref{sec:unix_socket}).\\ 
3105 %
3106 % Linux specific capabilities
3107 %
3108 \hline
3109     \const{CAP\_IPC\_LOCK}  & La capacità di effettuare il \textit{memory
3110                               locking} \itindex{memory~locking} con le
3111                               funzioni \func{mlock}, \func{mlockall},
3112                               \func{shmctl}, \func{mmap} (vedi
3113                               sez.~\ref{sec:proc_mem_lock} e 
3114                               sez.~\ref{sec:file_memory_map}). \\  
3115     \const{CAP\_IPC\_OWNER} & La capacità di evitare il controllo dei permessi
3116                               per le operazioni sugli oggetti di
3117                               intercomunicazione fra processi (vedi
3118                               sez.~\ref{sec:ipc_sysv}).\\  
3119     \const{CAP\_LEASE}      & La capacità di creare dei \textit{file lease}
3120                               \index{file!lease} (vedi
3121                               sez.~\ref{sec:file_asyncronous_lease})
3122                               pur non essendo proprietari del file (dal kernel
3123                               2.4).\\ 
3124     \const{CAP\_LINUX\_IMMUTABLE}& La capacità di impostare sui file gli
3125                               attributi \textit{immutable} e
3126                               \itindex{append~mode} \textit{append only} (se
3127                               supportati).\\
3128     \const{CAP\_MKNOD}      & La capacità di creare
3129                               \index{file!di~dispositivo} file di dispositivo
3130                               con \func{mknod} (vedi
3131                               sez.~\ref{sec:file_mknod}) (dal kernel 2.4).\\ 
3132     \const{CAP\_NET\_ADMIN} & La capacità di eseguire alcune operazioni
3133                               privilegiate sulla rete.\\
3134     \const{CAP\_NET\_BIND\_SERVICE}& La capacità di porsi in ascolto
3135                               su porte riservate (vedi
3136                               sez.~\ref{sec:TCP_func_bind}).\\ 
3137     \const{CAP\_NET\_BROADCAST}& La capacità di consentire l'uso di socket in
3138                               \itindex{broadcast} \textit{broadcast} e
3139                               \itindex{multicast} \textit{multicast}.\\ 
3140     \const{CAP\_NET\_RAW}   & La capacità di usare socket \texttt{RAW} e
3141                               \texttt{PACKET} (vedi sez.~\ref{sec:sock_type}).\\
3142     \const{CAP\_SETPCAP}    & La capacità di impostare o rimuovere una
3143                               capacità.\\ 
3144     % TODO cambiata nel 2.4.24 rc1 ? 
3145     \const{CAP\_SYS\_ADMIN} & La capacità di eseguire una serie di compiti
3146                               amministrativi. \\
3147     \const{CAP\_SYS\_BOOT}  & La capacità di fare eseguire un riavvio del
3148                               sistema.\\
3149 % TODO trattare reboot e kexec 
3150     \const{CAP\_SYS\_CHROOT}& La capacità di eseguire la funzione
3151                               \func{chroot} (vedi
3152                               sez.~\ref{sec:file_chroot}).\\
3153     \const{CAP\_MAC\_ADMIN} & La capacità amministrare il MAC di Smack (dal
3154                               kernel 2.6.25).\\  
3155     \const{CAP\_MAC\_OVERRIDE}& La capacità evitare il MAC di Smack (dal
3156                               kernel 2.6.25).\\  
3157     \const{CAP\_SYS\_MODULE}& La capacità di caricare e rimuovere moduli del
3158                               kernel. \\ 
3159     \const{CAP\_SYS\_NICE}  & La capacità di modificare le priorità dei
3160                               processi. \\ 
3161     \const{CAP\_SYS\_PACCT} & La capacità di usare le funzioni di
3162                               \textit{accounting} dei processi (vedi
3163                               sez.~\ref{sec:sys_bsd_accounting}).\\ 
3164     \const{CAP\_SYS\_PTRACE}& La capacità  di tracciare qualunque processo con
3165                               \func{ptrace} (vedi 
3166                               sez.~\ref{sec:xxx_ptrace}).\\
3167     \const{CAP\_SYS\_RAWIO} & La capacità di eseguire operazioni sulle porte
3168                               di I/O con \func{ioperm} e \func{iopl} (vedi
3169                               sez.~\ref{sec:file_io_port}).\\
3170     \const{CAP\_SYS\_RESOURCE}& La capacità di superare le limitazioni sulle
3171                               risorse.\\ 
3172     \const{CAP\_SYS\_TIME}  & La capacità di modificare il tempo di sistema
3173                               (vedi sez.~\ref{sec:sys_time}).\\ 
3174     \const{CAP\_SYS\_TTY\_CONFIG}& La capacità di simulare un \textit{hangup}
3175                               della console, con la funzione
3176                               \func{vhangup}.\\
3177     \hline
3178   \end{tabular}
3179   \caption{Le costanti che identificano le \textit{capabilities} presenti nel
3180     kernel.}
3181 \label{tab:proc_capabilities}
3182 \end{table}
3183
3184 \footnotetext{vale a dire i permessi caratteristici del modello classico del
3185   controllo di accesso chiamato \itindex{Discrectionary~Access~Control~(DAC)}
3186   \textit{Discrectionary Access Control} (da cui il nome DAC).}
3187
3188 La prima di queste capacità ``\textsl{ampie}'' è \const{CAP\_FOWNER}, che
3189 rimuove le restrizioni poste ad un processo che non ha la proprietà di un file
3190 in un vasto campo di operazioni;\footnote{vale a dire la richiesta che
3191   l'user-ID effettivo del processo (o meglio il \textit{filesystem user-ID},
3192   vedi sez.~\ref{sec:proc_setuid}) coincida con quello del proprietario.}
3193 queste comprendono i cambiamenti dei permessi e dei tempi del file (vedi
3194 sez.~\ref{sec:file_perm_management} e sez.~\ref{sec:file_file_times}), le
3195 impostazioni degli attributi estesi e delle ACL (vedi
3196 sez.~\ref{sec:file_xattr} e \ref{sec:file_ACL}), poter ignorare lo
3197 \itindex{sticky~bit} \textit{sticky bit} nella cancellazione dei file (vedi
3198 sez.~\ref{sec:file_special_perm}), la possibilità di impostare il flag di
3199 \const{O\_NOATIME} con \func{open} e \func{fcntl} (vedi
3200 sez.~\ref{sec:file_open} e sez.~\ref{sec:file_fcntl}) senza restrizioni.
3201
3202 Una seconda capacità che copre diverse operazioni, in questo caso riguardanti
3203 la rete, è \const{CAP\_NET\_ADMIN}, che consente di impostare le opzioni
3204 privilegiate dei socket (vedi sez.~\ref{sec:sock_generic_options}), abilitare
3205 il \itindex{multicast} \textit{multicasting}, eseguire la configurazione delle
3206 interfacce di rete (vedi sez.~\ref{sec:sock_ioctl_netdevice}) ed impostare la
3207 tabella di instradamento.
3208
3209 Una terza \textit{capability} con vasto campo di applicazione è
3210 \const{CAP\_SYS\_ADMIN}, che copre una serie di operazioni amministrative,
3211 come impostare le quote disco (vedi sez.\ref{sec:disk_quota}), attivare e
3212 disattivare la swap, montare, rimontare e smontare filesystem (vedi
3213 sez.~\ref{sec:sys_file_config}), effettuare operazioni di controllo sugli
3214 oggetti dell'IPC di SysV (vedi sez.~\ref{sec:ipc_sysv}), operare sugli
3215 attributi estesi di classe \texttt{security} o \texttt{trusted} (vedi
3216 sez.~\ref{sec:file_xattr}), specificare un user-ID arbitrario nella
3217 trasmissione delle credenziali dei socket (vedi sez.~\ref{sec:socket_xxx}),
3218 assegnare classi privilegiate per lo scheduling dell'I/O (vedi
3219 sez.~\ref{sec:io_priority}), superare il limite di sistema sul numero massimo
3220 di file aperti,\footnote{quello indicato da \procfile{/proc/sys/fs/file-max}.}
3221 effettuare operazioni privilegiate sulle chiavi mantenute dal kernel (vedi
3222 sez.~\ref{sec:io_priority}), usare la funzione \func{lookup\_dcookie} (vedi
3223 sez.~\ref{sec:xxx_profiling}), usare \const{CLONE\_NEWNS} con \func{unshare},
3224 (vedi sez.~\ref{sec:process_clone}).
3225
3226 Originariamente \const{CAP\_SYS\_NICE} riguardava soltanto la capacità di
3227 aumentare le priorità di esecuzione dei processi, come la diminuzione del
3228 valore di \textit{nice} (vedi sez.~\ref{sec:proc_sched_stand}), l'uso delle
3229 priorità \textit{real-time} (vedi sez.~\ref{sec:proc_real_time}), o
3230 l'impostazione delle affinità di processore (vedi
3231 sez.~\ref{sec:proc_sched_multiprocess}); ma con l'introduzione di priorità
3232 anche riguardo le operazioni di accesso al disco, e, nel caso di sistemi NUMA,
3233 alla memoria, essa viene a coprire anche la possibilità di assegnare priorità
3234 arbitrarie nell'accesso a disco (vedi sez.~\ref{sec:io_priority}) e nelle
3235 politiche di allocazione delle pagine di memoria ai nodi di un sistema NUMA.
3236
3237 Infine la \textit{capability} \const{CAP\_SYS\_RESOURCE} attiene alla
3238 possibilità di superare i limiti imposti sulle risorse di sistema, come usare
3239 lo spazio disco riservato all'amministratore sui filesystem che lo supportano,
3240 usare la funzione \func{ioctl} per controllare il \textit{journaling} sul
3241 filesystem \acr{ext3}, non subire le quote disco, aumentare i limiti sulle
3242 risorse (vedi sez.~\ref{sec:sys_resource_limit}) e sulle dimensioni dei
3243 messaggi delle code del SysV IPC (vedi sez.~\ref{sec:ipc_sysv_mq}).
3244
3245
3246 Per la gestione delle \textit{capabilities} il kernel mette a disposizione due
3247 funzioni che permettono rispettivamente di leggere ed impostare i valori dei
3248 tre insiemi illustrati in precedenza. Queste due funzioni sono \funcd{capget}
3249 e \funcd{capset} e costituiscono l'interfaccia di gestione basso livello; i
3250 loro rispettivi prototipi sono:
3251 \begin{functions}
3252   \headdecl{sys/capability.h}
3253
3254   \funcdecl{int capget(cap\_user\_header\_t hdrp, cap\_user\_data\_t datap)}
3255   Legge le \textit{capabilities}.
3256
3257   \funcdecl{int capset(cap\_user\_header\_t hdrp, const cap\_user\_data\_t
3258     datap)} 
3259   Imposta le \textit{capabilities}.
3260
3261   
3262   \bodydesc{Entrambe le funzioni ritornano 0 in caso di successo e -1 in caso
3263     di errore, nel qual caso \var{errno} può assumere i valori:
3264     \begin{errlist}
3265     \item[\errcode{ESRCH}] si è fatto riferimento ad un processo inesistente.
3266     \item[\errcode{EPERM}] si è tentato di aggiungere una capacità
3267       nell'insieme delle \textit{capabilities} permesse, o di impostare una
3268       capacità non presente nell'insieme di quelle permesse negli insieme
3269       delle effettive o ereditate, o si è cercato di impostare una
3270       \textit{capability} di un altro processo senza avare
3271       \const{CAP\_SETPCAP}. 
3272   \end{errlist}
3273   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
3274 }
3275
3276 \end{functions}
3277
3278 Queste due funzioni prendono come argomenti due tipi di dati dedicati,
3279 definiti come puntatori a due strutture specifiche di Linux, illustrate in
3280 fig.~\ref{fig:cap_kernel_struct}. Per poterle utilizzare occorre anche
3281 cancellare la macro \macro{\_POSIX\_SOURCE}.\footnote{per farlo occorre
3282   utilizzare la direttiva di preprocessore \direct{undef}; si dovrà cioè
3283   inserire una istruzione \texttt{\#undef \_POSIX\_SOURCE} prima di includere
3284   \texttt{sys/capability.h}.} Si tenga presente che le strutture di
3285 fig.~\ref{fig:cap_kernel_struct}, come i prototipi delle due funzioni
3286 \func{capget} e \func{capset}, sono soggette ad essere modificate con il
3287 cambiamento del kernel (in particolare i tipi di dati delle strutture) ed
3288 anche se finora l'interfaccia è risultata stabile, non c'è nessuna
3289 assicurazione che questa venga mantenuta.\footnote{anzi, visto lo scarso
3290   utilizzo di questa funzionalità ci sono state varie discussioni fra gli
3291   sviluppatori del kernel relative all'eliminarla o al modificarla
3292   radicalmente.} Pertanto se si vogliono scrivere programmi portabili che
3293 possano essere eseguiti su qualunque versione del kernel è opportuno
3294 utilizzare le interfacce di alto livello.
3295
3296 \begin{figure}[!htb]
3297   \footnotesize
3298   \centering
3299   \begin{minipage}[c]{15cm}
3300     \includestruct{listati/cap_user_header_t.h}
3301   \end{minipage} 
3302   \normalsize 
3303   \caption{Definizione delle strutture a cui fanno riferimento i puntatori
3304     \structd{cap\_user\_header\_t} e \structd{cap\_user\_data\_t} usati per
3305     l'interfaccia di gestione di basso livello delle \textit{capabilities}.}
3306   \label{fig:cap_kernel_struct}
3307 \end{figure}
3308
3309 La struttura a cui deve puntare l'argomento \param{hdrp} serve ad indicare,
3310 tramite il campo \var{pid}, il processo del quale si vogliono leggere o
3311 modificare le \textit{capabilities}. Il campo \var{version} deve essere
3312 impostato al valore della versione delle usata dal kernel (quello indicato
3313 dalla costante \const{\_LINUX\_CAPABILITY\_VERSION} di
3314 fig.~\ref{fig:cap_kernel_struct}) altrimenti le funzioni ritorneranno con un
3315 errore di \errcode{EINVAL}, restituendo nel campo stesso il valore corretto
3316 della versione in uso.  La struttura a cui deve puntare l'argomento
3317 \param{datap} invece conterrà i valori letti o da impostare per i tre insiemi
3318 delle capacità del processo.
3319
3320 Dato che le precedenti funzioni, oltre ad essere specifiche di Linux, non
3321 garantiscono la stabilità nell'interfaccia, è sempre opportuno effettuare la
3322 gestione delle \textit{capabilities} utilizzando le funzioni di libreria a
3323 questo dedicate. Queste funzioni, che seguono quanto previsto nelle bozze
3324 dello standard POSIX.1e, non fanno parte delle \acr{glibc} e sono fornite in
3325 una libreria a parte,\footnote{la libreria è \texttt{libcap2}, nel caso di
3326   Debian può essere installata con il pacchetto omonimo.} pertanto se un
3327 programma le utilizza si dovrà indicare esplicitamente l'uso della suddetta
3328 libreria attraverso l'opzione \texttt{-lcap} del compilatore.
3329
3330 Le funzioni dell'interfaccia delle bozze di POSIX.1e prevedono l'uso di uno
3331 tipo di dato opaco, \type{cap\_t}, come puntatore ai dati mantenuti nel
3332 cosiddetto \textit{capability state},\footnote{si tratta in sostanza di un
3333   puntatore ad una struttura interna utilizzata dalle librerie, i cui campi
3334   non devono mai essere acceduti direttamente.} in sono memorizzati tutti i
3335 dati delle \textit{capabilities}. In questo modo è possibile mascherare i
3336 dettagli della gestione di basso livello, che potranno essere modificati senza
3337 dover cambiare le funzioni dell'interfaccia, che faranno riferimento soltanto
3338 ad oggetti di questo tipo.  L'interfaccia pertanto non soltanto fornisce le
3339 funzioni per modificare e leggere le \textit{capabilities}, ma anche quelle
3340 per gestire i dati attraverso \type{cap\_t}.
3341
3342 La prima funzione dell'interfaccia è quella che permette di inizializzare un
3343 \textit{capability state}, allocando al contempo la memoria necessaria per i
3344 relativi dati. La funzione è \funcd{cap\_init} ed il suo prototipo è:
3345 \begin{functions}
3346   \headdecl{sys/capability.h}
3347
3348   \funcdecl{cap\_t cap\_init(void)} 
3349   Crea ed inizializza un \textit{capability state}.
3350   
3351   \bodydesc{La funzione ritorna un valore non nullo in caso di successo e
3352     \macro{NULL} in caso di errore, nel qual caso \var{errno} assumerà il
3353     valore \errval{ENOMEM}.
3354   }
3355 \end{functions}
3356
3357 La funzione restituisce il puntatore \type{cap\_t} ad uno stato inizializzato
3358 con tutte le \textit{capabilities} azzerate. In caso di errore (cioè quando
3359 non c'è memoria sufficiente ad allocare i dati) viene restituito \macro{NULL}
3360 ed \var{errno} viene impostata a \errval{ENOMEM}.  La memoria necessaria a
3361 mantenere i dati viene automaticamente allocata da \func{cap\_init}, ma dovrà
3362 essere disallocata esplicitamente quando non è più necessaria utilizzando, per
3363 questo l'interfaccia fornisce una apposita funzione, \funcd{cap\_free}, il cui
3364 prototipo è:
3365 \begin{functions}
3366   \headdecl{sys/capability.h}
3367
3368   \funcdecl{int cap\_free(void *obj\_d)} 
3369   Disalloca la memoria allocata per i dati delle \textit{capabilities}.
3370   
3371   \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
3372     errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
3373   }
3374 \end{functions}
3375
3376 La funzione permette di liberare la memoria allocata dalle altre funzioni
3377 della libreria sia per un \textit{capability state}, nel qual caso l'argomento
3378 dovrà essere un dato di tipo \type{cap\_t}, che per una descrizione testuale
3379 dello stesso,\footnote{cioè quanto ottenuto tramite la funzione
3380   \func{cap\_to\_text}.} nel qual caso l'argomento dovrà essere un dato di
3381 tipo \texttt{char *}. Per questo l'argomento \param{obj\_d} è dichiarato come
3382 \texttt{void *} e deve sempre corrispondere ad un puntatore ottenuto tramite
3383 le altre funzioni della libreria, altrimenti la funzione fallirà con un errore
3384 di \errval{EINVAL}.
3385
3386 Infine si può creare una copia di un \textit{capability state} ottenuto in
3387 precedenza tramite la funzione \funcd{cap\_dup}, il cui prototipo è:
3388 \begin{functions}
3389   \headdecl{sys/capability.h}
3390
3391   \funcdecl{cap\_t cap\_dup(cap\_t cap\_p)} 
3392   Duplica un \textit{capability state} restituendone una copia.
3393   
3394   \bodydesc{La funzione ritorna un valore non nullo in caso di successo e
3395     \macro{NULL} in caso di errore, nel qual caso \var{errno} potrà assumere i
3396     valori \errval{ENOMEM} o \errval{EINVAL}.  
3397   }
3398 \end{functions}
3399
3400 La funzione crea una copia del \textit{capability state} posto all'indirizzo
3401 \param{cap\_p} che si è passato come argomento, restituendo il puntatore alla
3402 copia, che conterrà gli stessi valori delle \textit{capabilities} presenti
3403 nell'originale. La memoria necessaria viene allocata automaticamente dalla
3404 funzione. Una volta effettuata la copia i due \textit{capability state}
3405 potranno essere modificati in maniera completamente
3406 indipendente.\footnote{alla fine delle operazioni si ricordi però di
3407   disallocare anche la copia, oltre all'originale. }
3408
3409 Una seconda classe di funzioni di servizio previste dall'interfaccia sono
3410 quelle per la gestione dei dati contenuti all'interno di un \textit{capability
3411   state}; la prima di queste è \funcd{cap\_clear}, il cui prototipo è:
3412 \begin{functions}
3413   \headdecl{sys/capability.h}
3414
3415   \funcdecl{int cap\_clear(cap\_t cap\_p)} 
3416   Inizializza un \textit{capability state} cancellando tutte le
3417   \textit{capabilities}.
3418   
3419   \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
3420     errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
3421   }
3422 \end{functions}
3423
3424 La funzione si limita ad azzerare tutte le \textit{capabilities} presenti nel
3425 \textit{capability state} all'indirizzo \param{cap\_p} passato come argomento,
3426 restituendo uno stato \textsl{vuoto}, analogo a quello che si ottiene nella
3427 creazione con \func{cap\_init}.
3428
3429 Per la gestione dei valori delle \textit{capabilities} presenti in un
3430 \textit{capability state} l'interfaccia prevede due funzioni,
3431 \funcd{cap\_get\_flag} e \funcd{cap\_set\_flag}, che permettono
3432 rispettivamente di leggere o impostare il valore di un flag delle
3433 \textit{capabilities}; i rispettivi prototipi sono:
3434 \begin{functions}
3435   \headdecl{sys/capability.h}
3436
3437   \funcdecl{int cap\_get\_flag(cap\_t cap\_p, cap\_value\_t cap, cap\_flag\_t
3438     flag, cap\_flag\_value\_t *value\_p)}
3439   Legge il valore di una \textit{capability}.
3440
3441   \funcdecl{int cap\_set\_flag(cap\_t cap\_p, cap\_flag\_t flag, int ncap,
3442     cap\_value\_t *caps, cap\_flag\_value\_t value)} 
3443   Imposta il valore di una \textit{capability}.
3444   
3445   \bodydesc{Le funzioni ritornano 0 in caso di successo e $-1$ in caso di
3446     errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
3447 }
3448 \end{functions}
3449
3450 In entrambe le funzioni l'argomento \param{cap\_p} indica il puntatore al
3451 \textit{capability state} su cui operare, mentre l'argomento \param{flag}
3452 indica su quale dei tre insiemi illustrati a
3453 pag.~\pageref{sec:capabilities_set} si intende operare. Questi devono essere
3454 specificati con una variabile di tipo \type{cap\_flag\_t} che può assumere
3455 esclusivamente\footnote{si tratta in effetti di un tipo enumerato, come si può
3456   verificare dalla sua definizione che si trova in
3457   \texttt{/usr/include/sys/capability.h}.} uno dei valori illustrati in
3458 tab.~\ref{tab:cap_set_identifier}.
3459
3460 \begin{table}[htb]
3461   \centering
3462   \footnotesize
3463   \begin{tabular}[c]{|l|l|}
3464     \hline
3465     \textbf{Valore} & \textbf{Significato} \\
3466     \hline
3467     \hline
3468     \const{CAP\_EFFECTIVE}  & Capacità dell'insieme \textsl{effettivo}.\\
3469     \const{CAP\_PERMITTED}  & Capacità dell'insieme \textsl{permesso}.\\ 
3470     \const{CAP\_INHERITABLE}& Capacità dell'insieme \textsl{ereditabile}.\\
3471     \hline
3472   \end{tabular}
3473   \caption{Valori possibili per il tipo di dato \type{cap\_flag\_t} che
3474     identifica gli insiemi delle \textit{capabilities}.}
3475   \label{tab:cap_set_identifier}
3476 \end{table}
3477
3478 La capacità che si intende controllare o impostare invece deve essere
3479 specificata attraverso una variabile di tipo \type{cap\_value\_t}, che può
3480 prendere come valore uno qualunque di quelli riportati in
3481 tab.~\ref{tab:proc_capabilities}, in questo caso però non è possibile
3482 combinare diversi valori in una maschera binaria, una variabile di tipo
3483 \type{cap\_value\_t} deve indicare una sola capacità.\footnote{nel file di
3484   header citato nella nota precedente il tipo \type{cap\_value\_t} è definito
3485   come \ctyp{int}, ma i valori validi sono soltanto quelli di
3486   tab.~\ref{tab:proc_capabilities}.}  
3487
3488 Infine lo stato di una capacità è descritto ad una variabile di tipo
3489 \type{cap\_flag\_value\_t}, che a sua volta può assumere soltanto
3490 uno\footnote{anche questo è un tipo enumerato.} dei valori di
3491 tab.~\ref{tab:cap_value_type}.
3492
3493 \begin{table}[htb]
3494   \centering
3495   \footnotesize
3496   \begin{tabular}[c]{|l|l|}
3497     \hline
3498     \textbf{Valore} & \textbf{Significato} \\
3499     \hline
3500     \hline
3501     \const{CAP\_CLEAR}& La capacità non è impostata.\\ 
3502     \const{CAP\_SET}  & La capacità è impostata.\\
3503     \hline
3504   \end{tabular}
3505   \caption{Valori possibili per il tipo di dato \type{cap\_flag\_value\_t} che
3506     indica lo stato di una capacità.}
3507   \label{tab:cap_value_type}
3508 \end{table}
3509
3510 La funzione \func{cap\_get\_flag} legge lo stato della capacità indicata
3511 dall'argomento \param{cap} all'interno dell'insieme indicato dall'argomento
3512 \param{flag} e ne restituisce il valore nella variabile posta all'indirizzo
3513 puntato dall'argomento \param{value\_p}; è possibile cioè leggere soltanto uno
3514 stato di una capacità alla volta.
3515
3516 La funzione \func{cap\_set\_flag} può invece impostare in una sola chiamata
3517 più \textit{capabilities}, anche se solo all'interno dello stesso insieme. Per
3518 questo motivo essa prende un vettore di valori di tipo \type{cap\_value\_t}
3519 nell'argomento \param{caps}, la cui dimensione viene specificata dall'argomento
3520 \param{ncap}. Il tipo di impostazione da eseguire (cancellazione o
3521 impostazione) viene indicato dall'argomento \param{value}.
3522
3523 Per la visualizzazione dello stato delle \textit{capabilities} l'interfaccia
3524 prevede una funzione apposita, \funcd{cap\_to\_text}, il cui prototipo è:
3525 \begin{functions}
3526   \headdecl{sys/capability.h}
3527
3528   \funcdecl{char * cap\_to\_text(cap\_t caps, ssize\_t * length\_p)}
3529
3530   Genera una visualizzazione testuale delle \textit{capabilities}.
3531   
3532   \bodydesc{La funzione ritorna un puntatore alla stringa con la descrizione
3533     delle \textit{capabilities} in caso di successo e \val{NULL} in caso di
3534     errore, nel qual caso \var{errno} può assumere i valori \errval{EINVAL} o
3535     \errval{ENOMEM}.
3536   }
3537 \end{functions}
3538
3539 La funzione ritorna l'indirizzo di una stringa contente la descrizione
3540 testuale del contenuto del \textit{capabilities state} \param{caps} passato
3541 come argomento, e, qualora l'argomento \param{length\_p} sia diverso da
3542 \val{NULL}, restituisce nella variabile intera da questo puntata la lunghezza
3543 della stringa. La stringa restituita viene allocata automaticamente dalla
3544 funzione e pertanto dovrà essere liberata con \func{cap\_free}.
3545
3546 Fin quei abbiamo trattato solo le funzioni di servizio relative alla
3547 manipolazione dei \textit{capabilities state}; l'interfaccia di gestione
3548 prevede però anche le funzioni per la gestione delle \textit{capabilities}
3549 stesse. La prima di queste è \funcd{cap\_get\_proc} che consente la lettura
3550 delle \textit{capabilities} del processo corrente, il suo prototipo è:
3551 \begin{functions}
3552   \headdecl{sys/capability.h}