3 %% Copyright (C) 2000-2007 Simone Piccardi. Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
12 \chapter{File e directory}
13 \label{cha:files_and_dirs}
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando dalle funzioni di libreria che si usano per
17 copiarli, spostarli e cambiarne i nomi. Esamineremo poi l'interfaccia che
18 permette la manipolazione dei vari attributi di file e directory ed alla fine
19 faremo una trattazione dettagliata su come è strutturato il sistema base di
20 protezioni e controllo dell'accesso ai file e sulle funzioni che ne permettono
21 la gestione. Tutto quello che riguarda invece la manipolazione del contenuto
22 dei file è lasciato ai capitoli successivi.
26 \section{La gestione di file e directory}
29 Come già accennato in sez.~\ref{sec:file_filesystem} in un sistema unix-like
30 la gestione dei file ha delle caratteristiche specifiche che derivano
31 direttamente dall'architettura del sistema. In questa sezione esamineremo le
32 funzioni usate per la manipolazione di file e directory, per la creazione di
33 link simbolici e diretti, per la gestione e la lettura delle directory.
35 In particolare ci soffermeremo sulle conseguenze che derivano
36 dall'architettura dei filesystem illustrata nel capitolo precedente per quanto
37 riguarda il comportamento e gli effetti delle varie funzioni.
40 \subsection{Le funzioni \func{link} e \func{unlink}}
43 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
44 dei nomi fittizi (come gli alias del MacOS o i collegamenti di Windows o i
45 nomi logici del VMS) che permettono di fare riferimento allo stesso file
46 chiamandolo con nomi diversi o accedendovi da directory diverse.
48 Questo è possibile anche in ambiente Unix, dove tali collegamenti sono
49 usualmente chiamati \textit{link}; ma data l'architettura del sistema riguardo
50 la gestione dei file (ed in particolare quanto trattato in
51 sez.~\ref{sec:file_arch_func}) ci sono due metodi sostanzialmente diversi per
52 fare questa operazione.
54 Come spiegato in sez.~\ref{sec:file_filesystem} l'accesso al contenuto di un
55 file su disco avviene passando attraverso il suo \itindex{inode}
56 \textit{inode}, che è la struttura usata dal kernel che lo identifica
57 univocamente all'interno di un singolo filesystem. Il nome del file che si
58 trova nella voce di una directory è solo un'etichetta, mantenuta all'interno
59 della directory, che viene associata ad un puntatore che fa riferimento al
60 suddetto \textit{inode}.
62 Questo significa che, fintanto che si resta sullo stesso filesystem, la
63 realizzazione di un link è immediata, ed uno stesso file può avere tanti nomi
64 diversi, dati da altrettante associazioni diverse allo stesso \itindex{inode}
65 \textit{inode} effettuate tramite ``etichette'' diverse in directory
66 diverse. Si noti anche che nessuno di questi nomi viene ad assumere una
67 particolare preferenza o originalità rispetto agli altri, in quanto tutti
68 fanno comunque riferimento allo stesso \itindex{inode} \textit{inode}.
70 Per aggiungere ad una directory una voce che faccia riferimento ad un
71 \itindex{inode} \textit{inode} già esistente si utilizza la funzione
72 \func{link}; si suole chiamare questo tipo di associazione un collegamento
73 diretto, o \textit{hard link}. Il prototipo della funzione è il seguente:
74 \begin{prototype}{unistd.h}
75 {int link(const char *oldpath, const char *newpath)}
76 Crea un nuovo collegamento diretto.
78 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
79 errore nel qual caso \var{errno} viene impostata ai valori:
81 \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
82 riferimento ad un filesystem montato sullo stesso \textit{mount point}.
83 \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
84 \param{newpath} non supporta i link diretti o è una directory.
85 \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
87 \item[\errcode{EMLINK}] ci sono troppi link al file \param{oldpath} (il
88 numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
89 sez.~\ref{sec:sys_limits}).
91 ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOTDIR},
92 \errval{EFAULT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
93 \errval{ENOSPC}, \errval{EIO}.}
96 La funzione crea sul \itindex{pathname} \textit{pathname} \param{newpath} un
97 collegamento diretto al file indicato da \param{oldpath}. Per quanto detto la
98 creazione di un nuovo collegamento diretto non copia il contenuto del file, ma
99 si limita a creare una voce nella directory specificata da \param{newpath} e
100 ad aumentare di uno il numero di riferimenti al file (riportato nel campo
101 \var{st\_nlink} della struttura \struct{stat}, vedi sez.~\ref{sec:file_stat})
102 aggiungendo il nuovo nome ai precedenti. Si noti che uno stesso file può
103 essere così chiamato con vari nomi in diverse directory.
105 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
106 collegamento diretto è possibile solo se entrambi i \itindex{pathname}
107 \textit{pathname} sono nello stesso filesystem; inoltre il filesystem deve
108 supportare i collegamenti diretti (il meccanismo non è disponibile ad esempio
109 con il filesystem \acr{vfat} di Windows). In realtà la funzione ha un
110 ulteriore requisito, e cioè che non solo che i due file siano sullo stesso
111 filesystem, ma anche che si faccia riferimento ad essi sullo stesso
112 \textit{mount point}.\footnote{si tenga presente infatti (vedi
113 sez.~\ref{sec:sys_file_config}) che a partire dal kernel 2.4 uno stesso
114 filesystem può essere montato più volte su directory diverse.}
116 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
117 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
118 l'amministratore è in grado di creare un collegamento diretto ad un'altra
119 directory: questo viene fatto perché con una tale operazione è possibile
120 creare dei \textit{loop} nel filesystem (vedi l'esempio mostrato in
121 sez.~\ref{sec:file_symlink}, dove riprenderemo il discorso) che molti programmi
122 non sono in grado di gestire e la cui rimozione diventerebbe estremamente
123 complicata (in genere per questo tipo di errori occorre far girare il
124 programma \cmd{fsck} per riparare il filesystem).
126 Data la pericolosità di questa operazione e la disponibilità dei link
127 simbolici che possono fornire la stessa funzionalità senza questi problemi,
128 nel caso di Linux questa capacità è stata completamente disabilitata, e al
129 tentativo di creare un link diretto ad una directory la funzione \func{link}
130 restituisce l'errore \errcode{EPERM}.
132 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
133 \textit{hard link} ad un link simbolico. In questo caso lo standard POSIX
134 prevederebbe che quest'ultimo venga risolto e che il collegamento sia
135 effettuato rispetto al file cui esso punta, e che venga riportato un errore
136 qualora questo non esista o non sia un file. Questo era anche il comportamento
137 iniziale di Linux ma a partire dai kernel della serie 2.0.x\footnote{per la
138 precisione il comportamento era quello previsto dallo standard POSIX fino al
139 kernel di sviluppo 1.3.56, ed è stato temporaneamente ripristinato anche
140 durante lo sviluppo della serie 2.1.x, per poi tornare al comportamento
141 attuale fino ad oggi (per riferimento si veda
142 \href{http://lwn.net/Articles/293902}
143 {\texttt{http://lwn.net/Articles/293902}}).} è stato adottato un
144 comportamento che non segue più lo standard per cui l'\textit{hard link} viene
145 creato rispetto al link simbolico, e non al file cui questo punta.
147 La ragione di questa differenza rispetto allo standard, presente anche in
148 altri sistemi unix-like, sono dovute al fatto che un link simbolico può fare
149 riferimento anche ad un file non esistente o a una directory, per i quali
150 l'\textit{hard link} non può essere creato, per cui la scelta di seguire il
151 link simbolico è stata ritenuta una scelta scorretta nella progettazione
152 dell'interfaccia. Infatti se non ci fosse il comportamento adottato da Linux
153 sarebbe impossibile creare un \textit{hard link} ad un link simbolico, perché
154 la funzione lo risolverebbe e l'\textit{hard link} verrebbe creato verso la
155 destinazione. Invece evitando di seguire lo standard l'operazione diventa
156 possibile, ed anche il comportamento della funzione risulta molto più
157 comprensibile. Tanto più che se proprio se si vuole creare un \textit{hard
158 link} rispetto alla destinazione di un link simbolico è sempre possibile
159 farlo direttamente.\footnote{ciò non toglie che questo comportamento fuori
160 standard possa causare problemi, come nell'esempio descritto nell'articolo
161 citato nella nota precedente, a programmi che non si aspettano questa
162 differenza rispetto allo standard POSIX.}
164 La rimozione di un file (o più precisamente della voce che lo referenzia
165 all'interno di una directory) si effettua con la funzione \funcd{unlink}; il
166 suo prototipo è il seguente:
167 \begin{prototype}{unistd.h}{int unlink(const char *pathname)}
171 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
172 errore, nel qual caso il file non viene toccato. La variabile
173 \var{errno} viene impostata secondo i seguenti codici di errore:
175 \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una directory.
177 \item[\errcode{EROFS}] \param{pathname} è su un filesystem montato in sola
179 \item[\errcode{EISDIR}] \param{pathname} fa riferimento a una directory.
181 ed inoltre: \errval{EACCES}, \errval{EFAULT}, \errval{ENOENT},
182 \errval{ENOTDIR}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
186 \footnotetext{questo è un valore specifico ritornato da Linux che non consente
187 l'uso di \func{unlink} con le directory (vedi sez.~\ref{sec:file_remove}).
188 Non è conforme allo standard POSIX, che prescrive invece l'uso di
189 \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
190 abbia privilegi sufficienti.}
192 La funzione cancella il nome specificato da \param{pathname} nella relativa
193 directory e decrementa il numero di riferimenti nel relativo \itindex{inode}
194 \textit{inode}. Nel caso di link simbolico cancella il link simbolico; nel
195 caso di socket, fifo o file di dispositivo \index{file!di~dispositivo} rimuove
196 il nome, ma come per i file i processi che hanno aperto uno di questi oggetti
197 possono continuare ad utilizzarlo.
199 Per cancellare una voce in una directory è necessario avere il permesso di
200 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
201 il diritto di esecuzione sulla directory che la contiene (affronteremo in
202 dettaglio l'argomento dei permessi di file e directory in
203 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
204 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
205 occorrerà anche essere proprietari del file o proprietari della directory (o
206 root, per cui nessuna delle restrizioni è applicata).
208 Una delle caratteristiche di queste funzioni è che la creazione/rimozione del
209 nome dalla directory e l'incremento/decremento del numero di riferimenti
210 \itindex{inode} nell'\textit{inode} devono essere effettuati in maniera
211 atomica (si veda sez.~\ref{sec:proc_atom_oper}) senza possibili interruzioni
212 fra le due operazioni. Per questo entrambe queste funzioni sono realizzate
213 tramite una singola system call.
215 Si ricordi infine che un file non viene eliminato dal disco fintanto che tutti
216 i riferimenti ad esso sono stati cancellati: solo quando il \textit{link
217 count} mantenuto \itindex{inode} nell'\textit{inode} diventa zero lo spazio
218 occupato su disco viene rimosso (si ricordi comunque che a questo si aggiunge
219 sempre un'ulteriore condizione,\footnote{come vedremo in
220 cap.~\ref{cha:file_unix_interface} il kernel mantiene anche una tabella dei
221 file aperti nei vari processi, che a sua volta contiene i riferimenti agli
222 \itindex{inode} \textit{inode} ad essi relativi. Prima di procedere alla
223 cancellazione dello spazio occupato su disco dal contenuto di un file il
224 kernel controlla anche questa tabella, per verificare che anche in essa non
225 ci sia più nessun riferimento all'\textit{inode} in questione.} e cioè che
226 non ci siano processi che abbiano il suddetto file aperto).
228 Questa proprietà viene spesso usata per essere sicuri di non lasciare file
229 temporanei su disco in caso di crash dei programmi; la tecnica è quella di
230 aprire il file e chiamare \func{unlink} subito dopo, in questo modo il
231 contenuto del file è sempre disponibile all'interno del processo attraverso il
232 suo file descriptor (vedi sez.~\ref{sec:file_fd}) fintanto che il processo non
233 chiude il file, ma non ne resta traccia in nessuna directory, e lo spazio
234 occupato su disco viene immediatamente rilasciato alla conclusione del
235 processo (quando tutti i file vengono chiusi).
238 \subsection{Le funzioni \func{remove} e \func{rename}}
239 \label{sec:file_remove}
241 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
242 \func{unlink} sulle directory; per cancellare una directory si può usare la
243 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}), oppure la
244 funzione \funcd{remove}.
246 Questa è la funzione prevista dallo standard ANSI C per cancellare un file o
247 una directory (e funziona anche per i sistemi che non supportano i link
248 diretti). Per i file è identica a \func{unlink} e per le directory è identica
249 a \func{rmdir}; il suo prototipo è:
250 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
251 Cancella un nome dal filesystem.
253 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
254 errore, nel qual caso il file non viene toccato.
256 I codici di errore riportati in \var{errno} sono quelli della chiamata
257 utilizzata, pertanto si può fare riferimento a quanto illustrato nelle
258 descrizioni di \func{unlink} e \func{rmdir}.}
261 La funzione utilizza la funzione \func{unlink}\footnote{questo vale usando le
262 \acr{glibc}; nelle libc4 e nelle libc5 la funzione \func{remove} è un
263 semplice alias alla funzione \func{unlink} e quindi non può essere usata per
264 le directory.} per cancellare i file e la funzione \func{rmdir} per
265 cancellare le directory; si tenga presente che per alcune implementazioni del
266 protocollo NFS utilizzare questa funzione può comportare la scomparsa di file
269 Per cambiare nome ad un file o a una directory (che devono comunque essere
270 nello stesso filesystem) si usa invece la funzione \funcd{rename},\footnote{la
271 funzione è definita dallo standard ANSI C, ma si applica solo per i file, lo
272 standard POSIX estende la funzione anche alle directory.} il cui prototipo
274 \begin{prototype}{stdio.h}
275 {int rename(const char *oldpath, const char *newpath)}
279 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
280 errore, nel qual caso il file non viene toccato. La variabile
281 \var{errno} viene impostata secondo i seguenti codici di errore:
283 \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
284 \param{oldpath} non è una directory.
285 \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
287 \item[\errcode{ENOTEMPTY}] \param{newpath} è una directory già esistente e
289 \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
290 parte di qualche processo (come directory di lavoro o come radice) o del
291 sistema (come mount point).
292 \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
293 \param{oldpath} o più in generale si è cercato di creare una directory come
294 sotto-directory di se stessa.
295 \item[\errcode{ENOTDIR}] uno dei componenti dei \itindex{pathname}
296 \textit{pathname} non è una directory o \param{oldpath} è una directory e
297 \param{newpath} esiste e non è una directory.
299 ed inoltre \errval{EACCES}, \errval{EPERM}, \errval{EMLINK},
300 \errval{ENOENT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP} e
304 La funzione rinomina il file \param{oldpath} in \param{newpath}, eseguendo se
305 necessario lo spostamento di un file fra directory diverse. Eventuali altri
306 link diretti allo stesso file non vengono influenzati.
308 Il comportamento della funzione è diverso a seconda che si voglia rinominare
309 un file o una directory; se ci riferisce ad un file allora \param{newpath}, se
310 esiste, non deve essere una directory (altrimenti si ha l'errore
311 \errcode{EISDIR}). Nel caso \param{newpath} indichi un file esistente questo
312 viene cancellato e rimpiazzato (atomicamente).
314 Se \param{oldpath} è una directory allora \param{newpath}, se esiste, deve
315 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
316 (se non è una directory) o \errcode{ENOTEMPTY} (se non è vuota). Chiaramente
317 \param{newpath} non può contenere \param{oldpath} altrimenti si avrà un errore
320 Se \param{oldpath} si riferisce ad un link simbolico questo sarà rinominato; se
321 \param{newpath} è un link simbolico verrà cancellato come qualunque altro
322 file. Infine qualora \param{oldpath} e \param{newpath} siano due nomi dello
323 stesso file lo standard POSIX prevede che la funzione non dia errore, e non
324 faccia nulla, lasciando entrambi i nomi; Linux segue questo standard, anche
325 se, come fatto notare dal manuale delle \textit{glibc}, il comportamento più
326 ragionevole sarebbe quello di cancellare \param{oldpath}.
328 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
329 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
330 può esistere cioè nessun istante in cui un altro processo può trovare attivi
331 entrambi i nomi dello stesso file, o, in caso di sostituzione di un file
332 esistente, non trovare quest'ultimo prima che la sostituzione sia stata
335 In ogni caso se \param{newpath} esiste e l'operazione fallisce per un qualche
336 motivo (come un crash del kernel), \func{rename} garantisce di lasciare
337 presente un'istanza di \param{newpath}. Tuttavia nella sovrascrittura potrà
338 esistere una finestra in cui sia \param{oldpath} che \param{newpath} fanno
339 riferimento allo stesso file.
342 \subsection{I link simbolici}
343 \label{sec:file_symlink}
345 Come abbiamo visto in sez.~\ref{sec:file_link} la funzione \func{link} crea
346 riferimenti agli \itindex{inode} \textit{inode}, pertanto può funzionare
347 soltanto per file che risiedono sullo stesso filesystem e solo per un
348 filesystem di tipo Unix. Inoltre abbiamo visto che in Linux non è consentito
349 eseguire un link diretto ad una directory.
351 Per ovviare a queste limitazioni i sistemi Unix supportano un'altra forma di
352 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
353 come avviene in altri sistemi operativi, dei file speciali che contengono
354 semplicemente il riferimento ad un altro file (o directory). In questo modo è
355 possibile effettuare link anche attraverso filesystem diversi, a file posti in
356 filesystem che non supportano i link diretti, a delle directory, ed anche a
357 file che non esistono ancora.
359 Il sistema funziona in quanto i link simbolici sono riconosciuti come tali dal
360 kernel\footnote{è uno dei diversi tipi di file visti in
361 tab.~\ref{tab:file_file_types}, contrassegnato come tale
362 nell'\textit{inode}, e riconoscibile dal valore del campo \var{st\_mode}
363 della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).} per cui
364 alcune funzioni di libreria (come \func{open} o \func{stat}) quando ricevono
365 come argomento un link simbolico vengono automaticamente applicate al file da
366 esso specificato. La funzione che permette di creare un nuovo link simbolico
367 è \funcd{symlink}, ed il suo prototipo è:
368 \begin{prototype}{unistd.h}
369 {int symlink(const char *oldpath, const char *newpath)}
370 Crea un nuovo link simbolico di nome \param{newpath} il cui contenuto è
373 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
374 errore, nel qual caso la variabile \var{errno} assumerà i valori:
376 \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
377 supporta i link simbolici.
378 \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
379 \param{oldpath} è una stringa vuota.
380 \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
381 \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
384 ed inoltre \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
385 \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{ENOSPC} e
389 Si tenga presente che la funzione non effettua nessun controllo sull'esistenza
390 di un file di nome \param{oldpath}, ma si limita ad inserire quella stringa
391 nel link simbolico. Pertanto un link simbolico può anche riferirsi ad un file
392 che non esiste: in questo caso si ha quello che viene chiamato un
393 \textit{dangling link}, letteralmente un \textsl{link ciondolante}.
395 Come accennato i link simbolici sono risolti automaticamente dal kernel
396 all'invocazione delle varie system call; in tab.~\ref{tab:file_symb_effect} si
397 è riportato un elenco dei comportamenti delle varie funzioni di libreria che
398 operano sui file nei confronti della risoluzione dei link simbolici,
399 specificando quali seguono il link simbolico e quali invece possono operare
400 direttamente sul suo contenuto.
404 \begin{tabular}[c]{|l|c|c|}
406 \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
409 \func{access} & $\bullet$ & -- \\
410 \func{chdir} & $\bullet$ & -- \\
411 \func{chmod} & $\bullet$ & -- \\
412 \func{chown} & -- & $\bullet$ \\
413 \func{creat} & $\bullet$ & -- \\
414 \func{exec} & $\bullet$ & -- \\
415 \func{lchown} & $\bullet$ & -- \\
416 \func{link}\footnotemark & -- & $\bullet$ \\
417 \func{lstat} & -- & $\bullet$ \\
418 \func{mkdir} & $\bullet$ & -- \\
419 \func{mkfifo} & $\bullet$ & -- \\
420 \func{mknod} & $\bullet$ & -- \\
421 \func{open} & $\bullet$ & -- \\
422 \func{opendir} & $\bullet$ & -- \\
423 \func{pathconf} & $\bullet$ & -- \\
424 \func{readlink} & -- & $\bullet$ \\
425 \func{remove} & -- & $\bullet$ \\
426 \func{rename} & -- & $\bullet$ \\
427 \func{stat} & $\bullet$ & -- \\
428 \func{truncate} & $\bullet$ & -- \\
429 \func{unlink} & -- & $\bullet$ \\
432 \caption{Uso dei link simbolici da parte di alcune funzioni.}
433 \label{tab:file_symb_effect}
436 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
437 dallo standard POSIX, si veda quanto detto in sez.~\ref{sec:file_link}.}
439 Si noti che non si è specificato il comportamento delle funzioni che operano
440 con i file descriptor, in quanto la risoluzione del link simbolico viene in
441 genere effettuata dalla funzione che restituisce il file descriptor
442 (normalmente la \func{open}, vedi sez.~\ref{sec:file_open}) e tutte le
443 operazioni seguenti fanno riferimento solo a quest'ultimo.
445 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
446 \func{open} seguono i link simbolici, occorrono funzioni apposite per accedere
447 alle informazioni del link invece che a quelle del file a cui esso fa
448 riferimento. Quando si vuole leggere il contenuto di un link simbolico si usa
449 la funzione \funcd{readlink}, il cui prototipo è:
450 \begin{prototype}{unistd.h}
451 {int readlink(const char *path, char *buff, size\_t size)}
452 Legge il contenuto del link simbolico indicato da \param{path} nel buffer
453 \param{buff} di dimensione \param{size}.
455 \bodydesc{La funzione restituisce il numero di caratteri letti dentro
456 \param{buff} o -1 per un errore, nel qual caso la variabile
457 \var{errno} assumerà i valori:
459 \item[\errcode{EINVAL}] \param{path} non è un link simbolico o \param{size}
462 ed inoltre \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
463 \errval{EACCES}, \errval{ELOOP}, \errval{EIO}, \errval{EFAULT} e
467 La funzione apre il link simbolico, ne legge il contenuto, lo scrive nel
468 buffer, e lo richiude. Si tenga presente che la funzione non termina la
469 stringa con un carattere nullo e la tronca alla dimensione specificata da
470 \param{size} per evitare di sovrascrivere oltre le dimensioni del buffer.
474 \includegraphics[width=8.5cm]{img/link_loop}
475 \caption{Esempio di loop nel filesystem creato con un link simbolico.}
476 \label{fig:file_link_loop}
479 Un caso comune che si può avere con i link simbolici è la creazione dei
480 cosiddetti \textit{loop}. La situazione è illustrata in
481 fig.~\ref{fig:file_link_loop}, che riporta la struttura della directory
482 \file{/boot}. Come si vede si è creato al suo interno un link simbolico che
483 punta di nuovo a \file{/boot}.\footnote{il loop mostrato in
484 fig.~\ref{fig:file_link_loop} è un usato per poter permettere a \cmd{grub}
485 (un bootloader in grado di leggere direttamente da vari filesystem il file
486 da lanciare come sistema operativo) di vedere i file contenuti nella
487 directory \file{/boot} con lo stesso \textit{pathname} con cui verrebbero
488 visti dal sistema operativo, anche se essi si trovano, come accade spesso,
489 su una partizione separata (che \cmd{grub}, all'avvio, vede come radice).}
491 Questo può causare problemi per tutti quei programmi che effettuano la
492 scansione di una directory senza tener conto dei link simbolici, ad esempio se
493 lanciassimo un comando del tipo \code{grep -r linux *}, il loop nella
494 directory porterebbe il comando ad esaminare \file{/boot}, \file{/boot/boot},
495 \file{/boot/boot/boot} e così via.
497 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
498 un \itindex{pathname} \textit{pathname} possano essere seguiti un numero
499 limitato di link simbolici, il cui valore limite è specificato dalla costante
500 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
501 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}.
503 Un punto da tenere sempre presente è che, come abbiamo accennato, un link
504 simbolico può fare riferimento anche ad un file che non esiste; ad esempio
505 possiamo creare un file temporaneo nella nostra directory con un link del
508 $ ln -s /tmp/tmp_file temporaneo
510 anche se \file{/tmp/tmp\_file} non esiste. Questo può generare confusione, in
511 quanto aprendo in scrittura \file{temporaneo} verrà creato
512 \file{/tmp/tmp\_file} e scritto; ma accedendo in sola lettura a
513 \file{temporaneo}, ad esempio con \cmd{cat}, otterremmo:
516 cat: temporaneo: No such file or directory
518 con un errore che può sembrare sbagliato, dato che un'ispezione con \cmd{ls}
519 ci mostrerebbe invece l'esistenza di \file{temporaneo}.
522 \subsection{La creazione e la cancellazione delle directory}
523 \label{sec:file_dir_creat_rem}
525 Benché in sostanza le directory non siano altro che dei file contenenti
526 elenchi di nomi ed \itindex{inode} \textit{inode}, non è possibile trattarle
527 come file ordinari e devono essere create direttamente dal kernel attraverso
528 una opportuna system call.\footnote{questo è quello che permette anche,
529 attraverso l'uso del VFS, l'utilizzo di diversi formati per la gestione dei
530 suddetti elenchi.} La funzione usata per creare una directory è
531 \funcd{mkdir}, ed il suo prototipo è:
533 \headdecl{sys/stat.h}
534 \headdecl{sys/types.h}
535 \funcdecl{int mkdir(const char *dirname, mode\_t mode)}
537 Crea una nuova directory.
539 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
540 errore, nel qual caso \var{errno} assumerà i valori:
542 \item[\errcode{EEXIST}] un file (o una directory) con quel nome esiste di
544 \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
545 cui si vuole inserire la nuova directory.
546 \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
547 directory contiene troppi file; sotto Linux questo normalmente non avviene
548 perché il filesystem standard consente la creazione di un numero di file
549 maggiore di quelli che possono essere contenuti nel disco, ma potendo
550 avere a che fare anche con filesystem di altri sistemi questo errore può
552 \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
553 la nuova directory o si è esaurita la quota disco dell'utente.
555 ed inoltre anche \errval{EPERM}, \errval{EFAULT}, \errval{ENAMETOOLONG},
556 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
560 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
561 standard presenti in ogni directory (cioè ``\file{.}'' e ``\file{..}''), con
562 il nome indicato dall'argomento \param{dirname}. Il nome può essere indicato
563 sia come \itindex{pathname} \textit{pathname} assoluto che come
564 \itindex{pathname} \textit{pathname} relativo.
566 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
567 directory viene creata sono specificati dall'argomento \param{mode}, i cui
568 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
569 tenga presente che questi sono modificati dalla maschera di creazione dei file
570 (si veda sez.~\ref{sec:file_perm_management}). La titolarità della nuova
571 directory è impostata secondo quanto riportato in
572 sez.~\ref{sec:file_ownership_management}.
574 La funzione che permette la cancellazione di una directory è invece
575 \funcd{rmdir}, ed il suo prototipo è:
576 \begin{prototype}{sys/stat.h}{int rmdir(const char *dirname)}
577 Cancella una directory.
579 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
580 errore, nel qual caso \var{errno} assumerà i valori:
582 \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
583 directory, oppure la directory che contiene \param{dirname} ha lo
584 \itindex{sticky~bit} \textit{sticky bit} impostato e l'user-ID effettivo
585 del processo non corrisponde al proprietario della directory.
586 \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
587 che contiene la directory che si vuole cancellare, o non c'è il permesso
588 di attraversare (esecuzione) una delle directory specificate in
590 \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o la
591 radice di qualche processo.
592 \item[\errcode{ENOTEMPTY}] la directory non è vuota.
594 ed inoltre anche \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
595 \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{EROFS}.}
598 La funzione cancella la directory \param{dirname}, che deve essere vuota (la
599 directory deve cioè contenere soltanto le due voci standard ``\file{.}'' e
600 ``\file{..}''). Il nome può essere indicato con il \itindex{pathname}
601 \textit{pathname} assoluto o relativo.
603 La modalità con cui avviene la cancellazione è analoga a quella di
604 \func{unlink}: fintanto che il numero di link \itindex{inode}
605 all'\textit{inode} della directory non diventa nullo e nessun processo ha la
606 directory aperta lo spazio occupato su disco non viene rilasciato. Se un
607 processo ha la directory aperta la funzione rimuove il link \itindex{inode}
608 all'\textit{inode} e nel caso sia l'ultimo, pure le voci standard ``\file{.}''
609 e ``\file{..}'', a questo punto il kernel non consentirà di creare più nuovi
610 file nella directory.
613 \subsection{La creazione di file speciali}
614 \label{sec:file_mknod}
616 Finora abbiamo parlato esclusivamente di file, directory e link simbolici; in
617 sez.~\ref{sec:file_file_types} abbiamo visto però che il sistema prevede pure
618 degli altri tipi di file speciali, come i \index{file!di~dispositivo} file di
619 dispositivo e le fifo (i socket sono un caso a parte, che tratteremo in
620 cap.~\ref{cha:socket_intro}).
622 La manipolazione delle caratteristiche di questi file e la loro cancellazione
623 può essere effettuata con le stesse funzioni che operano sui file regolari; ma
624 quando li si devono creare sono necessarie delle funzioni apposite. La prima
625 di queste funzioni è \funcd{mknod}, il suo prototipo è:
627 \headdecl{sys/types.h}
628 \headdecl{sys/stat.h}
631 \funcdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)}
633 Crea un \textit{inode} del tipo specificato sul filesystem.
635 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
636 errore, nel qual caso \var{errno} assumerà i valori:
638 \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
639 l'\texttt{inode}, o il filesystem su cui si è cercato di
640 creare \param{pathname} non supporta l'operazione.
641 \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
642 fifo, un socket o un dispositivo.
643 \item[\errcode{EEXIST}] \param{pathname} esiste già o è un link simbolico.
645 ed inoltre anche \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
646 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
647 \errval{ENOSPC}, \errval{EROFS}.}
650 La funzione permette di creare un file speciale, ma si può usare anche per
651 creare file regolari e fifo; l'argomento \param{mode} specifica il tipo di
652 file che si vuole creare ed i relativi permessi, secondo i valori riportati in
653 tab.~\ref{tab:file_mode_flags}, che vanno combinati con un OR binario. I
654 permessi sono comunque modificati nella maniera usuale dal valore di
655 \itindex{umask} \textit{umask} (si veda sez.~\ref{sec:file_perm_management}).
657 Per il tipo di file può essere specificato solo uno fra: \const{S\_IFREG} per
658 un file regolare (che sarà creato vuoto), \const{S\_IFBLK} per un dispositivo
659 a blocchi, \const{S\_IFCHR} per un dispositivo a caratteri, \const{S\_IFSOCK}
660 e \const{S\_IFIFO} per una fifo. Un valore diverso comporterà l'errore
661 \errcode{EINVAL}. Qualora si sia specificato in \param{mode} un file di
662 dispositivo (\const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev}
663 dovrà essere usato per indicare a quale dispositivo si fa riferimento con il
666 Solo l'amministratore può creare un file di dispositivo usando questa funzione
667 (il processo deve avere la \textit{capability} \const{CAP\_MKNOD}); ma in
668 Linux\footnote{la funzione non è prevista dallo standard POSIX, e deriva da
669 SVr4, con appunto questa differenza e diversi codici di errore.} l'uso per
670 la creazione di un file ordinario, di una fifo o di un socket è consentito
671 anche agli utenti normali.
673 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
674 al proprietario e al gruppo del processo che li ha creati, a meno che non si
675 sia attivato il bit \acr{sgid} per la directory o sia stata attivata la
676 semantica BSD per il filesystem (si veda
677 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
678 \itindex{inode} l'\textit{inode}.
680 Per creare una fifo (un file speciale, su cui torneremo in dettaglio in
681 sez.~\ref{sec:ipc_named_pipe}) lo standard POSIX specifica l'uso della funzione
682 \funcd{mkfifo}, il cui prototipo è:
684 \headdecl{sys/types.h} \headdecl{sys/stat.h}
686 \funcdecl{int mkfifo(const char *pathname, mode\_t mode)}
690 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
691 errore, nel qual caso \var{errno} assumerà i valori \errval{EACCES},
692 \errval{EEXIST}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC},
693 \errval{ENOTDIR} e \errval{EROFS}.}
696 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
697 per \func{mknod} il file \param{pathname} non deve esistere (neanche come link
698 simbolico); al solito i permessi specificati da \param{mode} vengono
699 modificati dal valore di \itindex{umask} \textit{umask}.
703 \subsection{Accesso alle directory}
704 \label{sec:file_dir_read}
706 Benché le directory alla fine non siano altro che dei file che contengono
707 delle liste di nomi ed \itindex{inode} \textit{inode}, per il ruolo che
708 rivestono nella struttura del sistema, non possono essere trattate come dei
709 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
710 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
711 può essere un processo a inserirvi direttamente delle voci con le usuali
712 funzioni di scrittura.
714 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
715 kernel, sono molte le situazioni in cui i processi necessitano di poterne
716 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
717 in sez.~\ref{sec:file_open} che è possibile aprire una directory come se fosse
718 un file, anche se solo in sola lettura) in generale il formato con cui esse
719 sono scritte può dipendere dal tipo di filesystem, tanto che, come riportato
720 in tab.~\ref{tab:file_file_operations}, il VFS del kernel prevede una apposita
721 funzione per la lettura delle directory.
723 Tutto questo si riflette nello standard POSIX\footnote{le funzioni sono
724 previste pure in BSD e SVID.} che ha introdotto una apposita interfaccia per
725 la lettura delle directory, basata sui cosiddetti \textit{directory stream}
726 (chiamati così per l'analogia con i file stream dell'interfaccia standard di
727 cap.~\ref{cha:files_std_interface}). La prima funzione di questa interfaccia è
728 \funcd{opendir}, il cui prototipo è:
730 \headdecl{sys/types.h} \headdecl{dirent.h}
732 \funcdecl{DIR * opendir(const char *dirname)}
734 Apre un \textit{directory stream}.
736 \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
737 in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
738 assumerà i valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
739 \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}.}
742 La funzione apre un \textit{directory stream} per la directory
743 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
744 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
745 \textit{directory stream}) da usare per tutte le operazioni successive, la
746 funzione inoltre posiziona lo stream sulla prima voce contenuta nella
749 Dato che le directory sono comunque dei file, in alcuni casi può servire
750 conoscere il \textit{file descriptor} associato ad un \textit{directory
751 stream}, a questo scopo si può usare la funzione \funcd{dirfd}, il cui
754 \headdecl{sys/types.h} \headdecl{dirent.h}
756 \funcdecl{int dirfd(DIR * dir)}
758 Restituisce il file descriptor associato ad un \textit{directory stream}.
760 \bodydesc{La funzione restituisce il file descriptor (un valore positivo) in
761 caso di successo e -1 in caso di errore.}
764 La funzione\footnote{questa funzione è una estensione di BSD non presente in
765 POSIX, introdotta con BSD 4.3-Reno; è presente in Linux con le libc5 (a
766 partire dalla versione 5.1.2) e con le \acr{glibc}.} restituisce il file
767 descriptor associato al \textit{directory stream} \param{dir}, essa è
768 disponibile solo definendo \macro{\_BSD\_SOURCE} o \macro{\_SVID\_SOURCE}. Di
769 solito si utilizza questa funzione in abbinamento alla funzione \func{fchdir}
770 per cambiare la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}) a
771 quella relativa allo stream che si sta esaminando.
773 La lettura di una voce della directory viene effettuata attraverso la funzione
774 \funcd{readdir}; il suo prototipo è:
776 \headdecl{sys/types.h} \headdecl{dirent.h}
778 \funcdecl{struct dirent *readdir(DIR *dir)}
780 Legge una voce dal \textit{directory stream}.
782 \bodydesc{La funzione restituisce il puntatore alla struttura contenente i
783 dati in caso di successo e \val{NULL} altrimenti, in caso di descrittore
784 non valido \var{errno} assumerà il valore \errval{EBADF}, il valore
785 \val{NULL} viene restituito anche quando si raggiunge la fine dello
789 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
790 successiva. I dati vengono memorizzati in una struttura \struct{dirent} (la
791 cui definizione\footnote{la definizione è quella usata a Linux, che si trova
792 nel file \file{/usr/include/bits/dirent.h}, essa non contempla la presenza
793 del campo \var{d\_namlen} che indica la lunghezza del nome del file (ed
794 infatti la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN} non è definita).} è
795 riportata in fig.~\ref{fig:file_dirent_struct}). La funzione restituisce il
796 puntatore alla struttura; si tenga presente però che quest'ultima è allocata
797 staticamente, per cui viene sovrascritta tutte le volte che si ripete la
798 lettura di una voce sullo stesso stream.
800 Di questa funzione esiste anche una versione \index{funzioni!rientranti}
801 rientrante, \func{readdir\_r}, che non usa una struttura allocata
802 staticamente, e può essere utilizzata anche con i \itindex{thread}
803 \textit{thread}; il suo prototipo è:
805 \headdecl{sys/types.h} \headdecl{dirent.h}
807 \funcdecl{int readdir\_r(DIR *dir, struct dirent *entry,
808 struct dirent **result)}
810 Legge una voce dal \textit{directory stream}.
812 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
813 errore, gli errori sono gli stessi di \func{readdir}.}
816 La funzione restituisce in \param{result} (come
817 \itindex{value~result~argument} \textit{value result argument}) l'indirizzo
818 dove sono stati salvati i dati, che di norma corrisponde a quello della
819 struttura precedentemente allocata e specificata dall'argomento \param{entry}
820 (anche se non è assicurato che la funzione usi lo spazio fornito dall'utente).
822 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
823 presenti nella directory; sia BSD che SVr4\footnote{lo standard POSIX prevede
824 invece solo la presenza del campo \var{d\_fileno}, identico \var{d\_ino},
825 che in Linux è definito come alias di quest'ultimo. Il campo \var{d\_name} è
826 considerato dipendente dall'implementazione.} prevedono che siano sempre
827 presenti il campo \var{d\_name}, che contiene il nome del file nella forma di
828 una stringa terminata da uno zero,\footnote{lo standard POSIX non specifica
829 una lunghezza, ma solo un limite \const{NAME\_MAX}; in SVr4 la lunghezza del
830 campo è definita come \code{NAME\_MAX+1} che di norma porta al valore di 256
831 byte usato anche in Linux.} ed il campo \var{d\_ino}, che contiene il numero
832 di \itindex{inode} \textit{inode} cui il file è associato (di solito
833 corrisponde al campo \var{st\_ino} di \struct{stat}).
836 \footnotesize \centering
837 \begin{minipage}[c]{15cm}
838 \includestruct{listati/dirent.c}
841 \caption{La struttura \structd{dirent} per la lettura delle informazioni dei
843 \label{fig:file_dirent_struct}
846 La presenza di ulteriori campi opzionali è segnalata dalla definizione di
847 altrettante macro nella forma \code{\_DIRENT\_HAVE\_D\_XXX} dove \code{XXX} è
848 il nome del relativo campo; nel nostro caso sono definite le macro
849 \macro{\_DIRENT\_HAVE\_D\_TYPE}, \macro{\_DIRENT\_HAVE\_D\_OFF} e
850 \macro{\_DIRENT\_HAVE\_D\_RECLEN}.
855 \begin{tabular}[c]{|l|l|}
857 \textbf{Valore} & \textbf{Tipo di file} \\
860 \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
861 \const{DT\_REG} & File normale.\\
862 \const{DT\_DIR} & Directory.\\
863 \const{DT\_FIFO} & Fifo.\\
864 \const{DT\_SOCK} & Socket.\\
865 \const{DT\_CHR} & Dispositivo a caratteri.\\
866 \const{DT\_BLK} & Dispositivo a blocchi.\\
869 \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
870 della struttura \struct{dirent}.}
871 \label{tab:file_dtype_macro}
874 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
875 indica il tipo di file (fifo, directory, link simbolico, ecc.); i suoi
876 possibili valori\footnote{fino alla versione 2.1 delle \acr{glibc} questo
877 campo, pur presente nella struttura, non era implementato, e resta sempre al
878 valore \const{DT\_UNKNOWN}.} sono riportati in
879 tab.~\ref{tab:file_dtype_macro}; per la conversione da e verso l'analogo
880 valore mantenuto dentro il campo \var{st\_mode} di \struct{stat} sono definite
881 anche due macro di conversione \macro{IFTODT} e \macro{DTTOIF}:
883 \funcdecl{int IFTODT(mode\_t MODE)} Converte il tipo di file dal formato di
884 \var{st\_mode} a quello di \var{d\_type}.
886 \funcdecl{mode\_t DTTOIF(int DTYPE)} Converte il tipo di file dal formato di
887 \var{d\_type} a quello di \var{st\_mode}.
890 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
891 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
892 letta. Con questi due campi diventa possibile, determinando la posizione delle
893 varie voci, spostarsi all'interno dello stream usando la funzione
894 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
895 estensioni prese da BSD, non previste dallo standard POSIX.} il cui
897 \begin{prototype}{dirent.h}{void seekdir(DIR *dir, off\_t offset)}
898 Cambia la posizione all'interno di un \textit{directory stream}.
901 La funzione non ritorna nulla e non segnala errori, è però necessario che il
902 valore dell'argomento \param{offset} sia valido per lo stream \param{dir};
903 esso pertanto deve essere stato ottenuto o dal valore di \var{d\_off} di
904 \struct{dirent} o dal valore restituito dalla funzione \funcd{telldir}, che
905 legge la posizione corrente; il prototipo di quest'ultima è:
906 \begin{prototype}{dirent.h}{off\_t telldir(DIR *dir)}
907 Ritorna la posizione corrente in un \textit{directory stream}.
909 \bodydesc{La funzione restituisce la posizione corrente nello stream (un
910 numero positivo) in caso di successo, e -1 altrimenti, nel qual caso
911 \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
912 valore errato per \param{dir}.}
915 La sola funzione di posizionamento nello stream prevista dallo standard POSIX
916 è \funcd{rewinddir}, che riporta la posizione a quella iniziale; il suo
919 \headdecl{sys/types.h} \headdecl{dirent.h}
921 \funcdecl{void rewinddir(DIR *dir)}
923 Si posiziona all'inizio di un \textit{directory stream}.
927 Una volta completate le operazioni si può chiudere il \textit{directory
928 stream} con la funzione \funcd{closedir}, il cui prototipo è:
930 \headdecl{sys/types.h} \headdecl{dirent.h}
932 \funcdecl{int closedir(DIR * dir)}
934 Chiude un \textit{directory stream}.
936 \bodydesc{La funzione restituisce 0 in caso di successo e -1 altrimenti, nel
937 qual caso \var{errno} assume il valore \errval{EBADF}.}
940 A parte queste funzioni di base in BSD 4.3 è stata introdotta un'altra
941 funzione che permette di eseguire una scansione completa (con tanto di ricerca
942 ed ordinamento) del contenuto di una directory; la funzione è
943 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
944 libc4.} ed il suo prototipo è:
945 \begin{prototype}{dirent.h}{int scandir(const char *dir,
946 struct dirent ***namelist, int(*filter)(const struct dirent *),
947 int(*compar)(const struct dirent **, const struct dirent **))}
949 Esegue una scansione di un \textit{directory stream}.
951 \bodydesc{La funzione restituisce in caso di successo il numero di voci
952 trovate, e -1 altrimenti.}
955 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
956 prototipo non è molto comprensibile; queste funzioni però sono quelle che
957 controllano rispettivamente la selezione di una voce (quella passata con
958 l'argomento \param{filter}) e l'ordinamento di tutte le voci selezionate
959 (quella specificata dell'argomento \param{compar}).
961 La funzione legge tutte le voci della directory indicata dall'argomento
962 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
963 \struct{dirent}) come argomento della funzione di selezione specificata da
964 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
965 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
966 Qualora si specifichi un valore \val{NULL} per l'argomento \func{filter} non
967 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
969 Le voci selezionate possono essere riordinate tramite \func{qsort}, le modalità
970 del riordinamento possono essere personalizzate usando la funzione
971 \param{compar} come criterio di ordinamento di \func{qsort}, la funzione
972 prende come argomenti le due strutture \struct{dirent} da confrontare
973 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
974 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
975 \struct{dirent} viene restituito nell'argomento
976 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
977 restituisce, come \itindex{value~result~argument} \textit{value result
978 argument}, l'indirizzo della stessa; questo significa che \param{namelist}
979 deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
980 si deve passare il suo indirizzo.}
982 Per l'ordinamento, vale a dire come valori possibili per l'argomento
983 \param{compar} sono disponibili due funzioni predefinite, \funcd{alphasort} e
984 \funcd{versionsort}, i cui prototipi sono:
988 \funcdecl{int alphasort(const void *a, const void *b)}
990 \funcdecl{int versionsort(const void *a, const void *b)}
992 Funzioni per l'ordinamento delle voci di \textit{directory stream}.
994 \bodydesc{Le funzioni restituiscono un valore minore, uguale o maggiore di
995 zero qualora il primo argomento sia rispettivamente minore, uguale o
996 maggiore del secondo.}
999 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
1000 libc4\footnote{la versione delle libc4 e libc5 usa però come argomenti dei
1001 puntatori a delle strutture \struct{dirent}; le glibc usano il prototipo
1002 originario di BSD, mostrato anche nella definizione, che prevede puntatori a
1003 \ctyp{void}.} e deve essere specificata come argomento \param{compare} per
1004 ottenere un ordinamento alfabetico (secondo il valore del campo \var{d\_name}
1005 delle varie voci). Le \acr{glibc} prevedono come estensione\footnote{le glibc,
1006 a partire dalla versione 2.1, effettuano anche l'ordinamento alfabetico
1007 tenendo conto delle varie localizzazioni, usando \func{strcoll} al posto di
1008 \func{strcmp}.} anche \func{versionsort}, che ordina i nomi tenendo conto
1009 del numero di versione (cioè qualcosa per cui \texttt{file10} viene comunque
1010 dopo \texttt{file4}.)
1012 Un semplice esempio dell'uso di queste funzioni è riportato in
1013 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
1014 programma che, usando la funzione di scansione illustrata in
1015 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
1016 e la relativa dimensione (in sostanza una versione semplificata del comando
1019 \begin{figure}[!htb]
1020 \footnotesize \centering
1021 \begin{minipage}[c]{15.6cm}
1022 \includecodesample{listati/my_ls.c}
1024 \caption{Esempio di codice per eseguire la lista dei file contenuti in una
1026 \label{fig:file_my_ls}
1029 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
1030 la parte di gestione delle opzioni (che prevede solo l'uso di una funzione per
1031 la stampa della sintassi, anch'essa omessa) ma il codice completo potrà essere
1032 trovato coi sorgenti allegati nel file \file{myls.c}.
1034 In sostanza tutto quello che fa il programma, dopo aver controllato
1035 (\texttt{\small 10--13}) di avere almeno un argomento (che indicherà la
1036 directory da esaminare) è chiamare (\texttt{\small 14}) la funzione
1037 \func{DirScan} per eseguire la scansione, usando la funzione \code{do\_ls}
1038 (\texttt{\small 20--26}) per fare tutto il lavoro.
1040 Quest'ultima si limita (\texttt{\small 23}) a chiamare \func{stat} sul file
1041 indicato dalla directory entry passata come argomento (il cui nome è appunto
1042 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
1043 dati ad esso relativi, per poi provvedere (\texttt{\small 24}) a stampare il
1044 nome del file e la dimensione riportata in \var{data}.
1046 Dato che la funzione verrà chiamata all'interno di \func{DirScan} per ogni
1047 voce presente questo è sufficiente a stampare la lista completa dei file e
1048 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
1049 valore di ritorno per indicare una esecuzione senza errori.
1051 \begin{figure}[!htb]
1052 \footnotesize \centering
1053 \begin{minipage}[c]{15.6cm}
1054 \includecodesample{listati/DirScan.c}
1056 \caption{Codice della funzione di scansione di una directory contenuta nel
1057 file \file{DirScan.c}.}
1058 \label{fig:file_dirscan}
1061 Tutto il grosso del lavoro è svolto dalla funzione \func{DirScan}, riportata
1062 in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e permette
1063 di eseguire una funzione, passata come secondo argomento, su tutte le voci di
1064 una directory. La funzione inizia con l'aprire (\texttt{\small 19--23}) uno
1065 stream sulla directory passata come primo argomento, stampando un messaggio in
1068 Il passo successivo (\texttt{\small 24--25}) è cambiare directory di lavoro
1069 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzione
1070 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
1071 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
1072 (\texttt{\small 27--31}) sulle singole voci dello stream ci si trovi
1073 all'interno della directory.\footnote{questo è essenziale al funzionamento
1074 della funzione \code{do\_ls} (e ad ogni funzione che debba usare il campo
1075 \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
1076 struttura \struct{dirent} sono sempre relativi alla directory in questione,
1077 e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
1078 ottenere le dimensioni.}
1080 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
1081 alla funzione passata come secondo argomento, il ciclo di scansione della
1082 directory è molto semplice; si legge una voce alla volta (\texttt{\small 27})
1083 all'interno di una istruzione di \code{while} e fintanto che si riceve una
1084 voce valida (cioè un puntatore diverso da \val{NULL}) si esegue
1085 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
1086 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
1087 28}) qualora questa presenti una anomalia (identificata da un codice di
1090 Una volta terminato il ciclo la funzione si conclude con la chiusura
1091 (\texttt{\small 32}) dello stream\footnote{nel nostro caso, uscendo subito
1092 dopo la chiamata, questo non servirebbe, in generale però l'operazione è
1093 necessaria, dato che la funzione può essere invocata molte volte all'interno
1094 dello stesso processo, per cui non chiudere gli stream comporterebbe un
1095 consumo progressivo di risorse, con conseguente rischio di esaurimento delle
1096 stesse} e la restituzione (\texttt{\small 33}) del codice di operazioni
1097 concluse con successo.
1100 \subsection{La directory di lavoro}
1101 \label{sec:file_work_dir}
1105 A ciascun processo è associata una directory nel filesystem che è chiamata
1106 \textsl{directory corrente} o \textsl{directory di lavoro} (in inglese
1107 \textit{current working directory}) che è quella a cui si fa riferimento
1108 quando un \itindsub{pathname}{relativo}\textit{pathname} è espresso in forma
1109 relativa, dove il ``\textsl{relativa}'' fa riferimento appunto a questa
1112 Quando un utente effettua il login, questa directory viene impostata alla
1113 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
1114 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
1115 comando \cmd{pwd} la stampa sul terminale. Siccome la directory corrente
1116 resta la stessa quando viene creato un processo figlio (vedi
1117 sez.~\ref{sec:proc_fork}), la directory corrente della shell diventa anche la
1118 directory corrente di qualunque comando da essa lanciato.
1120 In genere il kernel tiene traccia per ciascun processo \itindex{inode}
1121 dell'\textit{inode} della directory di lavoro, per ottenere il
1122 \textit{pathname} occorre usare una apposita funzione di libreria,
1123 \funcd{getcwd}, il cui prototipo è:
1124 \begin{prototype}{unistd.h}{char *getcwd(char *buffer, size\_t size)}
1125 Legge il \textit{pathname} della directory di lavoro corrente.
1127 \bodydesc{La funzione restituisce il puntatore \param{buffer} se riesce,
1128 \val{NULL} se fallisce, in quest'ultimo caso la variabile
1129 \var{errno} è impostata con i seguenti codici di errore:
1131 \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
1133 \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
1134 lunghezza del \textit{pathname}.
1135 \item[\errcode{EACCES}] manca il permesso di lettura o di ricerca su uno dei
1136 componenti del \textit{pathname} (cioè su una delle directory superiori
1141 La funzione restituisce il \textit{pathname} completo della directory di
1142 lavoro nella stringa puntata da \param{buffer}, che deve essere
1143 precedentemente allocata, per una dimensione massima di \param{size}. Il
1144 buffer deve essere sufficientemente lungo da poter contenere il
1145 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
1146 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
1149 Si può anche specificare un puntatore nullo come
1150 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
1151 supportata da Linux.} nel qual caso la stringa sarà allocata automaticamente
1152 per una dimensione pari a \param{size} qualora questa sia diversa da zero, o
1153 della lunghezza esatta del \textit{pathname} altrimenti. In questo caso ci si
1154 deve ricordare di disallocare la stringa una volta cessato il suo utilizzo.
1156 Di questa funzione esiste una versione \code{char *getwd(char *buffer)} fatta
1157 per compatibilità all'indietro con BSD, che non consente di specificare la
1158 dimensione del buffer; esso deve essere allocato in precedenza ed avere una
1159 dimensione superiore a \const{PATH\_MAX} (di solito 256 byte, vedi
1160 sez.~\ref{sec:sys_limits}); il problema è che in Linux non esiste una
1161 dimensione superiore per un \textit{pathname}, per cui non è detto che il
1162 buffer sia sufficiente a contenere il nome del file, e questa è la ragione
1163 principale per cui questa funzione è deprecata.
1165 Una seconda funzione simile è \code{char *get\_current\_dir\_name(void)} che è
1166 sostanzialmente equivalente ad una \code{getcwd(NULL, 0)}, con la sola
1167 differenza che essa ritorna il valore della variabile di ambiente \val{PWD},
1168 che essendo costruita dalla shell può contenere un \textit{pathname}
1169 comprendente anche dei link simbolici. Usando \func{getcwd} infatti, essendo
1170 il \textit{pathname} ricavato risalendo all'indietro l'albero della directory,
1171 si perderebbe traccia di ogni passaggio attraverso eventuali link simbolici.
1173 Per cambiare la directory di lavoro si può usare la funzione \funcd{chdir}
1174 (equivalente del comando di shell \cmd{cd}) il cui nome sta appunto per
1175 \textit{change directory}, il suo prototipo è:
1176 \begin{prototype}{unistd.h}{int chdir(const char *pathname)}
1177 Cambia la directory di lavoro in \param{pathname}.
1179 \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
1180 nel qual caso \var{errno} assumerà i valori:
1182 \item[\errcode{ENOTDIR}] non si è specificata una directory.
1183 \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
1186 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1187 \errval{ENOMEM}, \errval{ELOOP} e \errval{EIO}.}
1189 \noindent ed ovviamente \param{pathname} deve indicare una directory per la
1190 quale si hanno i permessi di accesso.
1192 Dato che anche le directory sono file, è possibile riferirsi ad esse anche
1193 tramite il file descriptor, e non solo tramite il \textit{pathname}, per fare
1194 questo si usa \funcd{fchdir}, il cui prototipo è:
1195 \begin{prototype}{unistd.h}{int fchdir(int fd)}
1196 Identica a \func{chdir}, ma usa il file descriptor \param{fd} invece del
1199 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1200 errore, in caso di errore \var{errno} assumerà i valori \errval{EBADF} o
1203 \noindent anche in questo caso \param{fd} deve essere un file descriptor
1204 valido che fa riferimento ad una directory. Inoltre l'unico errore di accesso
1205 possibile (tutti gli altri sarebbero occorsi all'apertura di \param{fd}), è
1206 quello in cui il processo non ha il permesso di accesso alla directory
1207 specificata da \param{fd}.
1213 \subsection{I file temporanei}
1214 \label{sec:file_temp_file}
1216 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
1217 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
1218 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
1219 creare il file dopo aver controllato che questo non esista, nel momento fra il
1220 controllo e la creazione si ha giusto lo spazio per una possibile
1221 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
1222 sez.~\ref{sec:proc_race_cond}).
1224 Le \acr{glibc} provvedono varie funzioni per generare nomi di file temporanei,
1225 di cui si abbia certezza di unicità (al momento della generazione); la prima
1226 di queste funzioni è \funcd{tmpnam} il cui prototipo è:
1227 \begin{prototype}{stdio.h}{char *tmpnam(char *string)}
1228 Restituisce il puntatore ad una stringa contente un nome di file valido e
1229 non esistente al momento dell'invocazione.
1231 \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1232 \val{NULL} in caso di fallimento. Non sono definiti errori.}
1234 \noindent se si è passato un puntatore \param{string} non nullo questo deve
1235 essere di dimensione \const{L\_tmpnam} (costante definita in \file{stdio.h},
1236 come \const{P\_tmpdir} e \const{TMP\_MAX}) ed il nome generato vi verrà
1237 copiato automaticamente; altrimenti il nome sarà generato in un buffer statico
1238 interno che verrà sovrascritto ad una chiamata successiva. Successive
1239 invocazioni della funzione continueranno a restituire nomi unici fino ad un
1240 massimo di \const{TMP\_MAX} volte. Al nome viene automaticamente aggiunto come
1241 prefisso la directory specificata da \const{P\_tmpdir}.
1243 Di questa funzione esiste una versione \index{funzioni!rientranti} rientrante,
1244 \func{tmpnam\_r}, che non fa nulla quando si passa \val{NULL} come argomento.
1245 Una funzione simile, \funcd{tempnam}, permette di specificare un prefisso per
1246 il file esplicitamente, il suo prototipo è:
1247 \begin{prototype}{stdio.h}{char *tempnam(const char *dir, const char *pfx)}
1248 Restituisce il puntatore ad una stringa contente un nome di file valido e
1249 non esistente al momento dell'invocazione.
1251 \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1252 \val{NULL} in caso di fallimento, \var{errno} viene impostata a
1253 \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
1256 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
1257 per cui è sempre \index{funzioni!rientranti} rientrante, occorre però
1258 ricordarsi di disallocare il puntatore che restituisce. L'argomento
1259 \param{pfx} specifica un prefisso di massimo 5 caratteri per il nome
1260 provvisorio. La funzione assegna come directory per il file temporaneo
1261 (verificando che esista e sia accessibili), la prima valida delle seguenti:
1263 \item La variabile di ambiente \const{TMPNAME} (non ha effetto se non è
1264 definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
1265 \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}).
1266 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}).
1267 \item Il valore della costante \const{P\_tmpdir}.
1268 \item la directory \file{/tmp}.
1271 In ogni caso, anche se la generazione del nome è casuale, ed è molto difficile
1272 ottenere un nome duplicato, nulla assicura che un altro processo non possa
1273 avere creato, fra l'ottenimento del nome e l'apertura del file, un altro file
1274 con lo stesso nome; per questo motivo quando si usa il nome ottenuto da una di
1275 queste funzioni occorre sempre aprire il nuovo file in modalità di esclusione
1276 (cioè con l'opzione \const{O\_EXCL} per i file descriptor o con il flag
1277 \code{x} per gli stream) che fa fallire l'apertura in caso il file sia già
1280 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
1281 POSIX definisce la funzione \funcd{tmpfile}, il cui prototipo è:
1282 \begin{prototype}{stdio.h}{FILE *tmpfile (void)}
1283 Restituisce un file temporaneo aperto in lettura/scrittura.
1285 \bodydesc{La funzione ritorna il puntatore allo stream associato al file
1286 temporaneo in caso di successo e \val{NULL} in caso di errore, nel qual
1287 caso \var{errno} assumerà i valori:
1289 \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
1290 \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
1292 ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
1293 \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES}.}
1295 \noindent essa restituisce direttamente uno stream già aperto (in modalità
1296 \code{r+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso, che viene
1297 automaticamente cancellato alla sua chiusura o all'uscita dal programma. Lo
1298 standard non specifica in quale directory verrà aperto il file, ma le
1299 \acr{glibc} prima tentano con \const{P\_tmpdir} e poi con \file{/tmp}. Questa
1300 funzione è \index{funzioni!rientranti} rientrante e non soffre di problemi di
1301 \itindex{race~condition} \textit{race condition}.
1303 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
1304 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
1305 modificano una stringa di input che serve da modello e che deve essere
1306 conclusa da 6 caratteri \code{X} che verranno sostituiti da un codice
1307 unico. La prima delle due è analoga a \func{tmpnam} e genera un nome casuale,
1309 \begin{prototype}{stlib.h}{char *mktemp(char *template)}
1310 Genera un filename univoco sostituendo le \code{XXXXXX} finali di
1313 \bodydesc{La funzione ritorna il puntatore \param{template} in caso di
1314 successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1317 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1320 \noindent dato che \param{template} deve poter essere modificata dalla
1321 funzione non si può usare una stringa costante. Tutte le avvertenze riguardo
1322 alle possibili \itindex{race~condition} \textit{race condition} date per
1323 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
1324 il valore usato per sostituire le \code{XXXXXX} viene formato con il \acr{pid}
1325 del processo più una lettera, il che mette a disposizione solo 26 possibilità
1326 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
1327 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
1330 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
1331 \func{tmpfile}, ma restituisce un file descriptor invece di uno stream; il suo
1333 \begin{prototype}{stlib.h}{int mkstemp(char *template)}
1334 Genera un file temporaneo con un nome ottenuto sostituendo le \code{XXXXXX}
1335 finali di \param{template}.
1337 \bodydesc{La funzione ritorna il file descriptor in caso successo e
1338 -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
1340 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1341 \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
1342 contenuto di \param{template} è indefinito.
1345 \noindent come per \func{mktemp} anche in questo caso \param{template} non può
1346 essere una stringa costante. La funzione apre un file in lettura/scrittura con
1347 la funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
1348 sez.~\ref{sec:file_open}), in questo modo al ritorno della funzione si ha la
1349 certezza di essere i soli utenti del file. I permessi sono impostati al valore
1350 \code{0600}\footnote{questo è vero a partire dalle \acr{glibc} 2.0.7, le
1351 versioni precedenti delle \acr{glibc} e le vecchie \acr{libc5} e \acr{libc4}
1352 usavano il valore \code{0666} che permetteva a chiunque di leggere i
1353 contenuti del file.} (si veda sez.~\ref{sec:file_perm_overview}).
1355 In OpenBSD è stata introdotta un'altra funzione\footnote{introdotta anche in
1356 Linux a partire dalle \acr{glibc} 2.1.91.} simile alle precedenti,
1357 \funcd{mkdtemp}, che crea una directory temporanea; il suo prototipo è:
1358 \begin{prototype}{stlib.h}{char *mkdtemp(char *template)}
1359 Genera una directory temporaneo il cui nome è ottenuto sostituendo le
1360 \code{XXXXXX} finali di \param{template}.
1362 \bodydesc{La funzione ritorna il puntatore al nome della directory in caso
1363 successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1366 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1368 più gli altri eventuali codici di errore di \func{mkdir}.}
1370 \noindent la directory è creata con permessi \code{0700} (al solito si veda
1371 cap.~\ref{cha:file_unix_interface} per i dettagli); dato che la creazione
1372 della directory è sempre esclusiva i precedenti problemi di
1373 \itindex{race~condition} \textit{race condition} non si pongono.
1376 \section{La manipolazione delle caratteristiche dei file}
1377 \label{sec:file_infos}
1379 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
1380 relative alle caratteristiche di ciascun file, a partire dalle informazioni
1381 relative al controllo di accesso, sono mantenute \itindex{inode}
1382 nell'\textit{inode}.
1384 Vedremo in questa sezione come sia possibile leggere tutte queste informazioni
1385 usando la funzione \func{stat}, che permette l'accesso a tutti i dati
1386 memorizzati \itindex{inode} nell'\textit{inode}; esamineremo poi le varie
1387 funzioni usate per manipolare tutte queste informazioni (eccetto quelle che
1388 riguardano la gestione del controllo di accesso, trattate in in
1389 sez.~\ref{sec:file_access_control}).
1392 \subsection{La lettura delle caratteristiche dei file}
1393 \label{sec:file_stat}
1395 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
1396 delle funzioni \func{stat} (\funcd{stat}, \funcd{fstat} e \funcd{lstat});
1397 questa è la funzione che ad esempio usa il comando \cmd{ls} per poter ottenere
1398 e mostrare tutti i dati relativi ad un file. I prototipi di queste funzioni
1401 \headdecl{sys/types.h}
1402 \headdecl{sys/stat.h}
1405 \funcdecl{int stat(const char *file\_name, struct stat *buf)} Legge le
1406 informazione del file specificato da \param{file\_name} e le inserisce in
1409 \funcdecl{int lstat(const char *file\_name, struct stat *buf)} Identica a
1410 \func{stat} eccetto che se il \param{file\_name} è un link simbolico vengono
1411 lette le informazioni relative ad esso e non al file a cui fa riferimento.
1413 \funcdecl{int fstat(int filedes, struct stat *buf)} Identica a \func{stat}
1414 eccetto che si usa con un file aperto, specificato tramite il suo file
1415 descriptor \param{filedes}.
1417 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
1418 errore, nel qual caso \var{errno} assumerà uno dei valori: \errval{EBADF},
1419 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ELOOP}, \errval{EFAULT},
1420 \errval{EACCES}, \errval{ENOMEM}, \errval{ENAMETOOLONG}.}
1422 \noindent il loro comportamento è identico, solo che operano rispettivamente
1423 su un file, su un link simbolico e su un file descriptor.
1425 La struttura \struct{stat} usata da queste funzioni è definita nell'header
1426 \file{sys/stat.h} e in generale dipende dall'implementazione; la versione
1427 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
1428 riportata dalla pagina di manuale di \func{stat} (in realtà la definizione
1429 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
1430 riservati per estensioni come tempi più precisi, o per il padding dei campi).
1432 \begin{figure}[!htb]
1435 \begin{minipage}[c]{15cm}
1436 \includestruct{listati/stat.h}
1439 \caption{La struttura \structd{stat} per la lettura delle informazioni dei
1441 \label{fig:file_stat_struct}
1444 Si noti come i vari membri della struttura siano specificati come tipi
1445 primitivi del sistema (di quelli definiti in
1446 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \file{sys/types.h}).
1448 % TODO: aggiornare con i cambiamenti ai tempi fatti con il 2.6
1450 \subsection{I tipi di file}
1451 \label{sec:file_types}
1453 Come riportato in tab.~\ref{tab:file_file_types} in Linux oltre ai file e alle
1454 directory esistono altri oggetti che possono stare su un filesystem. Il tipo
1455 di file è ritornato dalla funzione \func{stat} come maschera binaria nel campo
1456 \var{st\_mode} (che contiene anche le informazioni relative ai permessi) di
1457 una struttura \struct{stat}.
1459 Dato che il valore numerico può variare a seconda delle implementazioni, lo
1460 standard POSIX definisce un insieme di macro per verificare il tipo di file,
1461 queste vengono usate anche da Linux che supporta pure le estensioni allo
1462 standard per i link simbolici e i socket definite da BSD; l'elenco completo
1463 delle macro con cui è possibile estrarre l'informazione da \var{st\_mode} è
1464 riportato in tab.~\ref{tab:file_type_macro}.
1468 \begin{tabular}[c]{|l|l|}
1470 \textbf{Macro} & \textbf{Tipo del file} \\
1473 \macro{S\_ISREG(m)} & file normale.\\
1474 \macro{S\_ISDIR(m)} & directory.\\
1475 \macro{S\_ISCHR(m)} & dispositivo a caratteri.\\
1476 \macro{S\_ISBLK(m)} & dispositivo a blocchi.\\
1477 \macro{S\_ISFIFO(m)} & fifo.\\
1478 \macro{S\_ISLNK(m)} & link simbolico.\\
1479 \macro{S\_ISSOCK(m)} & socket.\\
1482 \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h}).}
1483 \label{tab:file_type_macro}
1486 Oltre alle macro di tab.~\ref{tab:file_type_macro} è possibile usare
1487 direttamente il valore di \var{st\_mode} per ricavare il tipo di file
1488 controllando direttamente i vari bit in esso memorizzati. Per questo sempre in
1489 \file{sys/stat.h} sono definite le costanti numeriche riportate in
1490 tab.~\ref{tab:file_mode_flags}.
1492 Il primo valore dell'elenco di tab.~\ref{tab:file_mode_flags} è la maschera
1493 binaria che permette di estrarre i bit nei quali viene memorizzato il tipo di
1494 file, i valori successivi sono le costanti corrispondenti ai singoli bit, e
1495 possono essere usati per effettuare la selezione sul tipo di file voluto, con
1496 un'opportuna combinazione.
1501 \begin{tabular}[c]{|l|c|l|}
1503 \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
1506 \const{S\_IFMT} & 0170000 & Maschera per i bit del tipo di file.\\
1507 \const{S\_IFSOCK} & 0140000 & Socket.\\
1508 \const{S\_IFLNK} & 0120000 & Link simbolico.\\
1509 \const{S\_IFREG} & 0100000 & File regolare.\\
1510 \const{S\_IFBLK} & 0060000 & Dispositivo a blocchi.\\
1511 \const{S\_IFDIR} & 0040000 & Directory.\\
1512 \const{S\_IFCHR} & 0020000 & Dispositivo a caratteri.\\
1513 \const{S\_IFIFO} & 0010000 & Fifo.\\
1515 \const{S\_ISUID} & 0004000 & Set UID bit \itindex{suid~bit}.\\
1516 \const{S\_ISGID} & 0002000 & Set GID bit \itindex{sgid~bit}.\\
1517 \const{S\_ISVTX} & 0001000 & Sticky bit \itindex{sticky~bit}.\\
1519 % \const{S\_IRWXU} & 00700 & Bitmask per i permessi del proprietario.\\
1520 \const{S\_IRUSR} & 00400 & Il proprietario ha permesso di lettura.\\
1521 \const{S\_IWUSR} & 00200 & Il proprietario ha permesso di scrittura.\\
1522 \const{S\_IXUSR} & 00100 & Il proprietario ha permesso di esecuzione.\\
1524 % \const{S\_IRWXG} & 00070 & Bitmask per i permessi del gruppo.\\
1525 \const{S\_IRGRP} & 00040 & Il gruppo ha permesso di lettura.\\
1526 \const{S\_IWGRP} & 00020 & Il gruppo ha permesso di scrittura.\\
1527 \const{S\_IXGRP} & 00010 & Il gruppo ha permesso di esecuzione.\\
1529 % \const{S\_IRWXO} & 00007 & Bitmask per i permessi di tutti gli altri\\
1530 \const{S\_IROTH} & 00004 & Gli altri hanno permesso di lettura.\\
1531 \const{S\_IWOTH} & 00002 & Gli altri hanno permesso di esecuzione.\\
1532 \const{S\_IXOTH} & 00001 & Gli altri hanno permesso di esecuzione.\\
1535 \caption{Costanti per l'identificazione dei vari bit che compongono il campo
1536 \var{st\_mode} (definite in \file{sys/stat.h}).}
1537 \label{tab:file_mode_flags}
1540 Ad esempio se si volesse impostare una condizione che permetta di controllare
1541 se un file è una directory o un file ordinario si potrebbe definire la macro
1543 \includecodesnip{listati/is_file_dir.h}
1544 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
1545 poi si effettua il confronto con la combinazione di tipi scelta.
1548 \subsection{Le dimensioni dei file}
1549 \label{sec:file_file_size}
1551 Il campo \var{st\_size} di una struttura \struct{stat} contiene la dimensione
1552 del file in byte, se si tratta di un file regolare. Nel caso di un link
1553 simbolico la dimensione è quella del \itindex{pathname} \textit{pathname} che
1554 il link stesso contiene; per le fifo questo campo è sempre nullo.
1556 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
1557 byte. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
1558 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
1559 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
1560 dimensione inferiore sarebbe inefficiente.
1562 Si tenga conto che la lunghezza del file riportata in \var{st\_size} non è
1563 detto che corrisponda all'occupazione dello spazio su disco per via della
1564 possibile esistenza dei cosiddetti \textit{holes} (letteralmente
1565 \textsl{buchi}) che si formano tutte le volte che si va a scrivere su un file
1566 dopo aver eseguito una \func{lseek} (vedi sez.~\ref{sec:file_lseek}) oltre la
1569 In questo caso si avranno risultati differenti a seconda del modo in cui si
1570 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
1571 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
1572 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
1573 caso per le parti non scritte vengono restituiti degli zeri, si avrà lo stesso
1574 risultato di \cmd{ls}.
1576 Se è sempre possibile allargare un file, scrivendoci sopra od usando la
1577 funzione \func{lseek} per spostarsi oltre la sua fine, esistono anche casi in
1578 cui si può avere bisogno di effettuare un troncamento, scartando i dati
1579 presenti al di là della dimensione scelta come nuova fine del file.
1581 Un file può sempre essere troncato a zero aprendolo con il flag
1582 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
1583 dimensione si possono usare le due funzioni \funcd{truncate} e
1584 \funcd{ftruncate}, i cui prototipi sono:
1586 \headdecl{unistd.h} \funcdecl{int truncate(const char *file\_name, off\_t
1587 length)} Fa si che la dimensione del file \param{file\_name} sia troncata
1588 ad un valore massimo specificato da \param{lenght}.
1590 \funcdecl{int ftruncate(int fd, off\_t length))} Identica a \func{truncate}
1591 eccetto che si usa con un file aperto, specificato tramite il suo file
1592 descriptor \param{fd}.
1594 \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per un
1595 errore, nel qual caso \var{errno} viene impostata opportunamente; per
1596 \func{ftruncate} si hanno i valori:
1598 \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
1599 \item[\errcode{EINVAL}] \param{fd} è un riferimento ad un socket, non a un
1600 file o non è aperto in scrittura.
1602 per \func{truncate} si hanno:
1604 \item[\errcode{EACCES}] il file non ha permesso di scrittura o non si ha il
1605 permesso di esecuzione una delle directory del \itindex{pathname}
1607 \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
1609 ed anche \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1610 \errval{EROFS}, \errval{EIO}, \errval{EFAULT}, \errval{ELOOP}.}
1613 Se il file è più lungo della lunghezza specificata i dati in eccesso saranno
1614 perduti; il comportamento in caso di lunghezza inferiore non è specificato e
1615 dipende dall'implementazione: il file può essere lasciato invariato o esteso
1616 fino alla lunghezza scelta; in quest'ultimo caso lo spazio viene riempito con
1617 zeri (e in genere si ha la creazione di un \textit{hole} nel file).
1620 \subsection{I tempi dei file}
1621 \label{sec:file_file_times}
1623 Il sistema mantiene per ciascun file tre tempi. Questi sono registrati
1624 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del file e
1625 possono essere letti tramite la funzione \func{stat}, che li restituisce
1626 attraverso tre campi della struttura \struct{stat} di
1627 fig.~\ref{fig:file_stat_struct}. Il significato di detti tempi e dei relativi
1628 campi è riportato nello schema in tab.~\ref{tab:file_file_times}, dove è anche
1629 riportato un esempio delle funzioni che effettuano cambiamenti su di essi.
1634 \begin{tabular}[c]{|c|l|l|c|}
1636 \textbf{Membro} & \textbf{Significato} & \textbf{Funzione}
1637 & \textbf{Opzione di \cmd{ls}} \\
1640 \var{st\_atime}& ultimo accesso ai dati del file &
1641 \func{read}, \func{utime} & \cmd{-u}\\
1642 \var{st\_mtime}& ultima modifica ai dati del file &
1643 \func{write}, \func{utime} & default\\
1644 \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
1645 \func{chmod}, \func{utime} & \cmd{-c}\\
1648 \caption{I tre tempi associati a ciascun file.}
1649 \label{tab:file_file_times}
1652 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
1653 modifica (il \textit{modification time} \var{st\_mtime}) e il tempo di
1654 cambiamento di stato (il \textit{change time} \var{st\_ctime}). Il primo
1655 infatti fa riferimento ad una modifica del contenuto di un file, mentre il
1656 secondo ad una modifica \itindex{inode} dell'\textit{inode}; siccome esistono
1657 molte operazioni (come la funzione \func{link} e molte altre che vedremo in
1658 seguito) che modificano solo le informazioni contenute \itindex{inode}
1659 nell'\textit{inode} senza toccare il contenuto del file, diventa necessario
1660 l'utilizzo di un altro tempo.
1662 Il sistema non tiene conto dell'ultimo accesso \itindex{inode}
1663 all'\textit{inode}, pertanto funzioni come \func{access} o \func{stat} non
1664 hanno alcuna influenza sui tre tempi. Il tempo di ultimo accesso (ai dati)
1665 viene di solito usato per cancellare i file che non servono più dopo un certo
1666 lasso di tempo (ad esempio il programma \cmd{leafnode} cancella i vecchi
1667 articoli sulla base di questo tempo).
1672 \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
1674 \multicolumn{1}{|p{3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
1675 \multicolumn{3}{|p{3.6cm}|}{\centering{
1676 \textbf{File o directory del riferimento}}}&
1677 \multicolumn{3}{|p{3.6cm}|}{\centering{
1678 \textbf{Directory contenente il riferimento}}}
1679 &\multicolumn{1}{|p{3.6cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
1682 \multicolumn{1}{|p{3cm}|}{}
1683 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1684 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1685 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1686 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1687 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1688 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1689 &\multicolumn{1}{|p{3cm}|}{} \\
1692 \func{chmod}, \func{fchmod}
1693 & -- & -- &$\bullet$& -- & -- & -- &\\
1694 \func{chown}, \func{fchown}
1695 & -- & -- &$\bullet$& -- & -- & -- &\\
1697 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
1698 con \const{O\_CREATE} \\
1700 & -- &$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
1701 con \const{O\_TRUNC} \\
1703 &$\bullet$& -- & -- & -- & -- & -- &\\
1705 & -- & -- &$\bullet$& -- & -- & -- &\\
1707 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&\\
1709 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&\\
1711 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&\\
1713 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
1714 con \const{O\_CREATE} \\
1716 & -- &$\bullet$&$\bullet$& -- & -- & -- &
1717 con \const{O\_TRUNC} \\
1719 &$\bullet$&$\bullet$&$\bullet$& -- & -- & -- &\\
1721 &$\bullet$& -- & -- & -- & -- & -- &\\
1723 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&
1724 se esegue \func{unlink}\\
1726 & -- & -- & -- & -- &$\bullet$&$\bullet$&
1727 se esegue \func{rmdir}\\
1729 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&
1730 per entrambi gli argomenti\\
1732 & -- & -- & -- & -- &$\bullet$&$\bullet$&\\
1733 \func{truncate}, \func{ftruncate}
1734 & -- &$\bullet$&$\bullet$& -- & -- & -- &\\
1736 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&\\
1738 &$\bullet$&$\bullet$&$\bullet$& -- & -- & -- &\\
1740 & -- &$\bullet$&$\bullet$& -- & -- & -- &\\
1743 \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo
1744 accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento
1745 \textsl{(c)} dalle varie funzioni operanti su file e directory.}
1746 \label{tab:file_times_effects}
1750 Il tempo di ultima modifica invece viene usato da \cmd{make} per decidere
1751 quali file necessitano di essere ricompilati o (talvolta insieme anche al
1752 tempo di cambiamento di stato) per decidere quali file devono essere
1753 archiviati per il backup. Il comando \cmd{ls} (quando usato con le opzioni
1754 \cmd{-l} o \cmd{-t}) mostra i tempi dei file secondo lo schema riportato
1755 nell'ultima colonna di tab.~\ref{tab:file_file_times}.
1757 L'effetto delle varie funzioni di manipolazione dei file sui tempi è
1758 illustrato in tab.~\ref{tab:file_times_effects}. Si sono riportati gli effetti
1759 sia per il file a cui si fa riferimento, sia per la directory che lo contiene;
1760 questi ultimi possono essere capiti se si tiene conto di quanto già detto, e
1761 cioè che anche le directory sono file (che contengono una lista di nomi) che
1762 il sistema tratta in maniera del tutto analoga a tutti gli altri.
1764 Per questo motivo tutte le volte che compiremo un'operazione su un file che
1765 comporta una modifica del nome contenuto nella directory, andremo anche a
1766 scrivere sulla directory che lo contiene cambiandone il tempo di modifica. Un
1767 esempio di questo può essere la cancellazione di un file, invece leggere o
1768 scrivere o cambiare i permessi di un file ha effetti solo sui tempi di
1771 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
1772 creazione del file, usato in molti altri sistemi operativi, ma che in Unix non
1773 esiste. Per questo motivo quando si copia un file, a meno di preservare
1774 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
1775 avrà sempre il tempo corrente come data di ultima modifica.
1777 I tempi di ultimo accesso e modifica possono essere cambiati usando la
1778 funzione \funcd{utime}, il cui prototipo è:
1779 \begin{prototype}{utime.h}
1780 {int utime(const char *filename, struct utimbuf *times)}
1782 Cambia i tempi di ultimo accesso e modifica \itindex{inode}
1783 dell'\textit{inode} specificato da \param{filename} secondo i campi
1784 \var{actime} e \var{modtime} di \param{times}. Se questa è \val{NULL} allora
1785 viene usato il tempo corrente.
1787 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1788 errore, nel qual caso \var{errno} assumerà uno dei valori:
1790 \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
1791 \item[\errcode{ENOENT}] \param{filename} non esiste.
1795 La funzione prende come argomento \param{times} una struttura
1796 \struct{utimbuf}, la cui definizione è riportata in
1797 fig.~\ref{fig:struct_utimebuf}, con la quale si possono specificare i nuovi
1798 valori che si vogliono impostare per tempi.
1800 \begin{figure}[!htb]
1801 \footnotesize \centering
1802 \begin{minipage}[c]{15cm}
1803 \includestruct{listati/utimbuf.h}
1806 \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
1808 \label{fig:struct_utimebuf}
1811 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
1812 cosa è l'argomento \param{times}; se è \val{NULL} la funzione imposta il
1813 tempo corrente ed è sufficiente avere accesso in scrittura al file; se invece
1814 si è specificato un valore la funzione avrà successo solo se si è proprietari
1815 del file (o si hanno i privilegi di amministratore).
1817 Si tenga presente che non è comunque possibile specificare il tempo di
1818 cambiamento di stato del file, che viene comunque cambiato dal kernel tutte le
1819 volte che si modifica \itindex{inode} l'\textit{inode} (quindi anche alla
1820 chiamata di \func{utime}). Questo serve anche come misura di sicurezza per
1821 evitare che si possa modificare un file nascondendo completamente le proprie
1822 tracce. In realtà la cosa resta possibile, se si è in grado di accedere al
1823 file di dispositivo, scrivendo direttamente sul disco senza passare attraverso
1824 il filesystem, ma ovviamente in questo modo la cosa è molto più complicata da
1829 \section{Il controllo di accesso ai file}
1830 \label{sec:file_access_control}
1832 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
1833 del controllo di accesso ai file, che viene implementato per qualunque
1834 filesystem standard.\footnote{per standard si intende che implementa le
1835 caratteristiche previste dallo standard POSIX; in Linux sono disponibili
1836 anche una serie di altri filesystem, come quelli di Windows e del Mac, che
1837 non supportano queste caratteristiche.} In questa sezione ne esamineremo i
1838 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
1841 \subsection{I permessi per l'accesso ai file}
1842 \label{sec:file_perm_overview}
1844 Ad ogni file Linux associa sempre l'utente che ne è proprietario (il
1845 cosiddetto \textit{owner}) ed un gruppo di appartenenza, secondo il meccanismo
1846 degli identificatori di utente e gruppo (\acr{uid} e \acr{gid}). Questi valori
1847 sono accessibili da programma tramite la funzione \func{stat}, e sono
1848 mantenuti nei campi \var{st\_uid} e \var{st\_gid} della struttura
1849 \struct{stat} (si veda sez.~\ref{sec:file_stat}).\footnote{questo è vero solo
1850 per filesystem di tipo Unix, ad esempio non è vero per il filesystem vfat di
1851 Windows, che non fornisce nessun supporto per l'accesso multiutente, e per
1852 il quale i permessi vengono assegnati in maniera fissa con un opzione in
1855 Il controllo di accesso ai file segue un modello abbastanza semplice che
1856 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
1857 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
1858 Control List} che sono state aggiunte ai filesystem standard con opportune
1859 estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
1860 controllo ancora più sofisticati come il \textit{mandatory access control}
1861 di SE-Linux.} ma nella maggior parte dei casi il meccanismo standard è più
1862 che sufficiente a soddisfare tutte le necessità più comuni. I tre permessi di
1863 base associati ad ogni file sono:
1865 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
1867 \item il permesso di scrittura (indicato con la lettera \texttt{w},
1868 dall'inglese \textit{write}).
1869 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
1870 dall'inglese \textit{execute}).
1872 mentre i tre livelli su cui sono divisi i privilegi sono:
1874 \item i privilegi per l'utente proprietario del file.
1875 \item i privilegi per un qualunque utente faccia parte del gruppo cui
1877 \item i privilegi per tutti gli altri utenti.
1880 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
1881 meno significativi sono usati a gruppi di tre per indicare i permessi base di
1882 lettura, scrittura ed esecuzione e sono applicati rispettivamente
1883 rispettivamente al proprietario, al gruppo, a tutti gli altri.
1887 \includegraphics[width=6cm]{img/fileperm}
1888 \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
1889 contenuti nel campo \var{st\_mode} di \struct{stat}.}
1890 \label{fig:file_perm_bit}
1893 I restanti tre bit (noti come \itindex{suid~bit} \textit{suid bit},
1894 \itindex{sgid~bit} \textit{sgid bit}, e \itindex{sticky~bit} \textit{sticky
1895 bit}) sono usati per indicare alcune caratteristiche più complesse del
1896 meccanismo del controllo di accesso su cui torneremo in seguito (in
1897 sez.~\ref{sec:file_special_perm}); lo schema di allocazione dei bit è
1898 riportato in fig.~\ref{fig:file_perm_bit}.
1900 Anche i permessi, come tutte le altre informazioni pertinenti al file, sono
1901 memorizzati \itindex{inode} nell'\textit{inode}; in particolare essi sono
1902 contenuti in alcuni bit del campo \var{st\_mode} della struttura \struct{stat}
1903 (si veda di nuovo fig.~\ref{fig:file_stat_struct}).
1905 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
1906 \cmd{u} (per \textit{user}), \cmd{g} (per \textit{group}) e \cmd{o} (per
1907 \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti insieme
1908 si usa la lettera \cmd{a} (per \textit{all}). Si tenga ben presente questa
1909 distinzione dato che in certi casi, mutuando la terminologia in uso nel VMS,
1910 si parla dei permessi base come di permessi per \textit{owner}, \textit{group}
1911 ed \textit{all}, le cui iniziali possono dar luogo a confusione. Le costanti
1912 che permettono di accedere al valore numerico di questi bit nel campo
1913 \var{st\_mode} sono riportate in tab.~\ref{tab:file_bit_perm}.
1918 \begin{tabular}[c]{|c|l|}
1920 \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
1923 \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
1924 \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
1925 \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\
1927 \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
1928 \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
1929 \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
1931 \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
1932 \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
1933 \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
1936 \caption{I bit dei permessi di accesso ai file, come definiti in
1937 \texttt{<sys/stat.h>}}
1938 \label{tab:file_bit_perm}
1941 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
1942 che si riferiscano a dei file, dei link simbolici o delle directory; qui ci
1943 limiteremo ad un riassunto delle regole generali, entrando nei dettagli più
1946 La prima regola è che per poter accedere ad un file attraverso il suo
1947 \itindex{pathname} \textit{pathname} occorre il permesso di esecuzione in
1948 ciascuna delle directory che compongono il \textit{pathname}; lo stesso vale
1949 per aprire un file nella directory corrente (per la quale appunto serve il
1950 diritto di esecuzione).
1952 Per una directory infatti il permesso di esecuzione significa che essa può
1953 essere attraversata nella risoluzione del \itindex{pathname}
1954 \textit{pathname}, ed è distinto dal permesso di lettura che invece implica
1955 che si può leggere il contenuto della directory.
1957 Questo significa che se si ha il permesso di esecuzione senza permesso di
1958 lettura si potrà lo stesso aprire un file in una directory (se si hanno i
1959 permessi opportuni per il medesimo) ma non si potrà vederlo con \cmd{ls}
1960 (mentre per crearlo occorrerà anche il permesso di scrittura per la
1963 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
1964 (si veda quanto riportato in tab.~\ref{tab:file_open_flags}) di sola lettura o
1965 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
1966 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
1967 il contenuto, lo stesso permesso è necessario per poter troncare il file.
1969 Non si può creare un file fintanto che non si disponga del permesso di
1970 esecuzione e di quello di scrittura per la directory di destinazione; gli
1971 stessi permessi occorrono per cancellare un file da una directory (si ricordi
1972 che questo non implica necessariamente la rimozione del contenuto del file dal
1973 disco), non è necessario nessun tipo di permesso per il file stesso (infatti
1974 esso non viene toccato, viene solo modificato il contenuto della directory,
1975 rimuovendo la voce che ad esso fa riferimento).
1977 Per poter eseguire un file (che sia un programma compilato od uno script di
1978 shell, od un altro tipo di file eseguibile riconosciuto dal kernel), occorre
1979 avere il permesso di esecuzione, inoltre solo i file regolari possono essere
1982 I permessi per un link simbolico sono ignorati, contano quelli del file a cui
1983 fa riferimento; per questo in genere il comando \cmd{ls} riporta per un link
1984 simbolico tutti i permessi come concessi; utente e gruppo a cui esso
1985 appartiene vengono pure ignorati quando il link viene risolto, vengono
1986 controllati solo quando viene richiesta la rimozione del link e quest'ultimo è
1987 in una directory con lo \itindex{sticky~bit} \textit{sticky bit} impostato (si
1988 veda sez.~\ref{sec:file_special_perm}).
1990 La procedura con cui il kernel stabilisce se un processo possiede un certo
1991 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
1992 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
1993 \var{st\_gid} accennati in precedenza) e l'user-ID effettivo, il group-ID
1994 effettivo e gli eventuali group-ID supplementari del processo.\footnote{in
1995 realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
1996 identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
1997 sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
1998 eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
2001 Per una spiegazione dettagliata degli identificatori associati ai processi si
2002 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
2003 sez.~\ref{sec:file_special_perm}, l'user-ID effettivo e il group-ID effettivo
2004 corrispondono ai valori dell'\acr{uid} e del \acr{gid} dell'utente che ha
2005 lanciato il processo, mentre i group-ID supplementari sono quelli dei gruppi
2006 cui l'utente appartiene.
2008 I passi attraverso i quali viene stabilito se il processo possiede il diritto
2009 di accesso sono i seguenti:
2011 \item Se l'user-ID effettivo del processo è zero (corrispondente
2012 all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
2013 controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
2015 \item Se l'user-ID effettivo del processo è uguale all'\acr{uid} del
2016 proprietario del file (nel qual caso si dice che il processo è proprietario
2019 \item se il relativo\footnote{per relativo si intende il bit di user-read se
2020 il processo vuole accedere in lettura, quello di user-write per
2021 l'accesso in scrittura, ecc.} bit dei permessi d'accesso dell'utente è
2022 impostato, l'accesso è consentito
2023 \item altrimenti l'accesso è negato
2025 \item Se il group-ID effettivo del processo o uno dei group-ID supplementari
2026 dei processi corrispondono al \acr{gid} del file allora:
2028 \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
2030 \item altrimenti l'accesso è negato
2032 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
2033 l'accesso è consentito, altrimenti l'accesso è negato.
2036 Si tenga presente che questi passi vengono eseguiti esattamente in
2037 quest'ordine. Questo vuol dire che se un processo è il proprietario di un file,
2038 l'accesso è consentito o negato solo sulla base dei permessi per l'utente; i
2039 permessi per il gruppo non vengono neanche controllati. Lo stesso vale se il
2040 processo appartiene ad un gruppo appropriato, in questo caso i permessi per
2041 tutti gli altri non vengono controllati.
2044 \subsection{I bit dei permessi speciali}
2045 \label{sec:file_special_perm}
2050 Come si è accennato (in sez.~\ref{sec:file_perm_overview}) nei dodici bit del
2051 campo \var{st\_mode} di \struct{stat} che vengono usati per il controllo di
2052 accesso oltre ai bit dei permessi veri e propri, ci sono altri tre bit che
2053 vengono usati per indicare alcune proprietà speciali dei file. Due di questi
2054 sono i bit detti \acr{suid} (da \textit{set-user-ID bit}) e \acr{sgid} (da
2055 \textit{set-group-ID bit}) che sono identificati dalle costanti
2056 \const{S\_ISUID} e \const{S\_ISGID}.
2058 Come spiegato in dettaglio in sez.~\ref{sec:proc_exec}, quando si lancia un
2059 programma il comportamento normale del kernel è quello di impostare gli
2060 identificatori del gruppo \textit{effective} del nuovo processo al valore dei
2061 corrispondenti del gruppo \textit{real} del processo corrente, che normalmente
2062 corrispondono a quelli dell'utente con cui si è entrati nel sistema.
2064 Se però il file del programma (che ovviamente deve essere
2065 eseguibile\footnote{per motivi di sicurezza il kernel ignora i bit \acr{suid}
2066 e \acr{sgid} per gli script eseguibili.}) ha il bit \acr{suid} impostato, il
2067 kernel assegnerà come user-ID effettivo al nuovo processo l'\acr{uid} del
2068 proprietario del file al posto dell'\acr{uid} del processo originario. Avere
2069 il bit \acr{sgid} impostato ha lo stesso effetto sul group-ID effettivo del
2072 I bit \acr{suid} e \acr{sgid} vengono usati per permettere agli utenti normali
2073 di usare programmi che richiedono privilegi speciali; l'esempio classico è il
2074 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
2075 quest'ultimo ovviamente può essere scritto solo dall'amministratore, ma non è
2076 necessario chiamare l'amministratore per cambiare la propria password. Infatti
2077 il comando \cmd{passwd} appartiene a root ma ha il bit \acr{suid} impostato
2078 per cui quando viene lanciato da un utente normale parte con i privilegi di
2081 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
2082 normalmente l'utente che lo ha lanciato comporta vari rischi, e questo tipo di
2083 programmi devono essere scritti accuratamente per evitare che possano essere
2084 usati per guadagnare privilegi non consentiti (l'argomento è affrontato in
2085 dettaglio in sez.~\ref{sec:proc_perms}).
2087 La presenza dei bit \acr{suid} e \acr{sgid} su un file può essere rilevata con
2088 il comando \cmd{ls -l}, che visualizza una lettera \cmd{s} al posto della
2089 \cmd{x} in corrispondenza dei permessi di utente o gruppo. La stessa lettera
2090 \cmd{s} può essere usata nel comando \cmd{chmod} per impostare questi bit.
2091 Infine questi bit possono essere controllati all'interno di \var{st\_mode} con
2092 l'uso delle due costanti \const{S\_ISUID} e \const{S\_IGID}, i cui valori sono
2093 riportati in tab.~\ref{tab:file_mode_flags}.
2095 Gli stessi bit vengono ad assumere in significato completamente diverso per le
2096 directory, normalmente infatti Linux usa la convenzione di SVr4 per indicare
2097 con questi bit l'uso della semantica BSD nella creazione di nuovi file (si
2098 veda sez.~\ref{sec:file_ownership_management} per una spiegazione dettagliata
2101 Infine Linux utilizza il bit \acr{sgid} per un'ulteriore estensione mutuata
2102 da SVr4. Il caso in cui un file ha il bit \acr{sgid} impostato senza che lo
2103 sia anche il corrispondente bit di esecuzione viene utilizzato per attivare
2104 per quel file il \itindex{mandatory~locking} \textit{mandatory locking}
2105 (affronteremo questo argomento in dettaglio più avanti, in
2106 sez.~\ref{sec:file_mand_locking}).
2112 \itindbeg{sticky~bit}
2114 L'ultimo dei bit rimanenti, identificato dalla costante \const{S\_ISVTX}, è in
2115 parte un rimasuglio delle origini dei sistemi Unix. A quell'epoca infatti la
2116 memoria virtuale e l'accesso ai file erano molto meno sofisticati e per
2117 ottenere la massima velocità possibile per i programmi usati più comunemente
2118 si poteva impostare questo bit.
2120 L'effetto di questo bit era che il \index{segmento!testo} segmento di testo
2121 del programma (si veda sez.~\ref{sec:proc_mem_layout} per i dettagli) veniva
2122 scritto nella swap la prima volta che questo veniva lanciato, e vi permaneva
2123 fino al riavvio della macchina (da questo il nome di \textsl{sticky bit});
2124 essendo la swap un file continuo o una partizione indicizzata direttamente si
2125 poteva risparmiare in tempo di caricamento rispetto alla ricerca attraverso la
2126 struttura del filesystem. Lo \textsl{sticky bit} è indicato usando la lettera
2127 \texttt{t} al posto della \texttt{x} nei permessi per gli altri.
2129 Ovviamente per evitare che gli utenti potessero intasare la swap solo
2130 l'amministratore era in grado di impostare questo bit, che venne chiamato
2131 anche con il nome di \textit{saved text bit}, da cui deriva quello della
2132 costante. Le attuali implementazioni di memoria virtuale e filesystem rendono
2133 sostanzialmente inutile questo procedimento.
2135 Benché ormai non venga più utilizzato per i file, lo \textit{sticky bit} ha
2136 invece assunto un uso importante per le directory;\footnote{lo \textit{sticky
2137 bit} per le directory è un'estensione non definita nello standard POSIX,
2138 Linux però la supporta, così come BSD e SVr4.} in questo caso se tale bit è
2139 impostato un file potrà essere rimosso dalla directory soltanto se l'utente ha
2140 il permesso di scrittura su di essa ed inoltre è vera una delle seguenti
2143 \item l'utente è proprietario del file
2144 \item l'utente è proprietario della directory
2145 \item l'utente è l'amministratore
2147 un classico esempio di directory che ha questo bit impostato è \file{/tmp}, i
2148 permessi infatti di solito sono i seguenti:
2151 drwxrwxrwt 6 root root 1024 Aug 10 01:03 /tmp
2153 quindi con lo \textit{sticky bit} bit impostato. In questo modo qualunque
2154 utente nel sistema può creare dei file in questa directory (che, come
2155 suggerisce il nome, è normalmente utilizzata per la creazione di file
2156 temporanei), ma solo l'utente che ha creato un certo file potrà cancellarlo o
2157 rinominarlo. In questo modo si evita che un utente possa, più o meno
2158 consapevolmente, cancellare i file temporanei creati degli altri utenti.
2160 \itindend{sticky~bit}
2162 \subsection{Le funzioni per la gestione dei permessi dei file}
2163 \label{sec:file_perm_management}
2165 Come visto in sez.~\ref{sec:file_access_control} il controllo di accesso ad un
2166 file viene fatto utilizzando l'user-ID ed il group-ID effettivo del processo;
2167 ci sono casi però in cui si può voler effettuare il controllo con l'user-ID
2168 reale ed il group-ID reale, vale a dire usando i valori di \acr{uid} e
2169 \acr{gid} relativi all'utente che ha lanciato il programma, e che, come
2170 accennato in sez.~\ref{sec:file_special_perm} e spiegato in dettaglio in
2171 sez.~\ref{sec:proc_perms}, non è detto siano uguali a quelli effettivi.
2173 Per far questo si può usare la funzione \funcd{access}, il cui prototipo è:
2174 \begin{prototype}{unistd.h}
2175 {int access(const char *pathname, int mode)}
2177 Verifica i permessi di accesso.
2179 \bodydesc{La funzione ritorna 0 se l'accesso è consentito, -1 se l'accesso non
2180 è consentito ed in caso di errore; nel qual caso la variabile \var{errno}
2183 \item[\errcode{EINVAL}] il valore di \param{mode} non è valido.
2184 \item[\errcode{EACCES}] l'accesso al file non è consentito, o non si ha il
2185 permesso di attraversare una delle directory di \param{pathname}.
2186 \item[\errcode{EROFS}] si è richiesto l'accesso in scrittura per un file su
2187 un filesystem montato in sola lettura.
2189 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2190 \errval{ENOTDIR}, \errval{ELOOP}, \errval{EIO}.}
2193 La funzione verifica i permessi di accesso, indicati da \param{mode}, per il
2194 file indicato da \param{pathname}. I valori possibili per l'argomento
2195 \param{mode} sono esprimibili come combinazione delle costanti numeriche
2196 riportate in tab.~\ref{tab:file_access_mode_val} (attraverso un OR binario
2197 delle stesse). I primi tre valori implicano anche la verifica dell'esistenza
2198 del file, se si vuole verificare solo quest'ultima si può usare \const{F\_OK},
2199 o anche direttamente \func{stat}. Nel caso in cui \param{pathname} si
2200 riferisca ad un link simbolico, questo viene seguito ed il controllo è fatto
2201 sul file a cui esso fa riferimento.
2203 La funzione controlla solo i bit dei permessi di accesso, si ricordi che il
2204 fatto che una directory abbia permesso di scrittura non significa che ci si
2205 possa scrivere come in un file, e il fatto che un file abbia permesso di
2206 esecuzione non comporta che contenga un programma eseguibile. La funzione
2207 ritorna zero solo se tutte i permessi controllati sono disponibili, in caso
2208 contrario (o di errore) ritorna -1.
2212 \begin{tabular}{|c|l|}
2214 \textbf{\param{mode}} & \textbf{Significato} \\
2217 \const{R\_OK} & Verifica il permesso di lettura. \\
2218 \const{W\_OK} & Verifica il permesso di scrittura. \\
2219 \const{X\_OK} & Verifica il permesso di esecuzione. \\
2220 \const{F\_OK} & Verifica l'esistenza del file. \\
2223 \caption{Valori possibile per l'argomento \param{mode} della funzione
2225 \label{tab:file_access_mode_val}
2228 Un esempio tipico per l'uso di questa funzione è quello di un processo che sta
2229 eseguendo un programma coi privilegi di un altro utente (ad esempio attraverso
2230 l'uso del \itindex{suid~bit} \textit{suid bit}) che vuole controllare se
2231 l'utente originale ha i permessi per accedere ad un certo file.
2233 % TODO documentare euidaccess (e eaccess)
2235 Per cambiare i permessi di un file il sistema mette ad disposizione due
2236 funzioni \funcd{chmod} e \funcd{fchmod}, che operano rispettivamente su un
2237 filename e su un file descriptor, i loro prototipi sono:
2239 \headdecl{sys/types.h}
2240 \headdecl{sys/stat.h}
2242 \funcdecl{int chmod(const char *path, mode\_t mode)} Cambia i permessi del
2243 file indicato da \param{path} al valore indicato da \param{mode}.
2245 \funcdecl{int fchmod(int fd, mode\_t mode)} Analoga alla precedente, ma usa
2246 il file descriptor \param{fd} per indicare il file.
2248 \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
2249 un errore, in caso di errore \var{errno} può assumere i valori:
2251 \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2252 proprietario del file o non è zero.
2253 \item[\errcode{EROFS}] il file è su un filesystem in sola lettura.
2255 ed inoltre \errval{EIO}; \func{chmod} restituisce anche \errval{EFAULT},
2256 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2257 \errval{EACCES}, \errval{ELOOP}; \func{fchmod} anche \errval{EBADF}.}
2260 Entrambe le funzioni utilizzano come secondo argomento \param{mode}, una
2261 variabile dell'apposito tipo primitivo \type{mode\_t} (vedi
2262 tab.~\ref{tab:intro_primitive_types}) utilizzato per specificare i permessi sui
2268 \begin{tabular}[c]{|c|c|l|}
2270 \textbf{\param{mode}} & \textbf{Valore} & \textbf{Significato} \\
2273 \const{S\_ISUID} & 04000 & Set user ID \itindex{suid~bit}.\\
2274 \const{S\_ISGID} & 02000 & Set group ID \itindex{sgid~bit}.\\
2275 \const{S\_ISVTX} & 01000 & Sticky bit \itindex{sticky~bit}.\\
2277 \const{S\_IRWXU} & 00700 & L'utente ha tutti i permessi.\\
2278 \const{S\_IRUSR} & 00400 & L'utente ha il permesso di lettura.\\
2279 \const{S\_IWUSR} & 00200 & L'utente ha il permesso di scrittura.\\
2280 \const{S\_IXUSR} & 00100 & L'utente ha il permesso di esecuzione.\\
2282 \const{S\_IRWXG} & 00070 & Il gruppo ha tutti i permessi.\\
2283 \const{S\_IRGRP} & 00040 & Il gruppo ha il permesso di lettura.\\
2284 \const{S\_IWGRP} & 00020 & Il gruppo ha il permesso di scrittura.\\
2285 \const{S\_IXGRP} & 00010 & Il gruppo ha il permesso di esecuzione.\\
2287 \const{S\_IRWXO} & 00007 & Gli altri hanno tutti i permessi.\\
2288 \const{S\_IROTH} & 00004 & Gli altri hanno il permesso di lettura.\\
2289 \const{S\_IWOTH} & 00002 & Gli altri hanno il permesso di scrittura.\\
2290 \const{S\_IXOTH} & 00001 & Gli altri hanno il permesso di esecuzione.\\
2293 \caption{Valori delle costanti usate per indicare i vari bit di
2294 \param{mode} utilizzato per impostare i permessi dei file.}
2295 \label{tab:file_permission_const}
2298 Le costanti con cui specificare i singoli bit di \param{mode} sono riportate
2299 in tab.~\ref{tab:file_permission_const}. Il valore di \param{mode} può essere
2300 ottenuto combinando fra loro con un OR binario le costanti simboliche relative
2301 ai vari bit, o specificato direttamente, come per l'omonimo comando di shell,
2302 con un valore numerico (la shell lo vuole in ottale, dato che i bit dei
2303 permessi sono divisibili in gruppi di tre), che si può calcolare direttamente
2304 usando lo schema si utilizzo dei bit illustrato in
2305 fig.~\ref{fig:file_perm_bit}.
2307 Ad esempio i permessi standard assegnati ai nuovi file (lettura e scrittura
2308 per il proprietario, sola lettura per il gruppo e gli altri) sono
2309 corrispondenti al valore ottale $0644$, un programma invece avrebbe anche il
2310 bit di esecuzione attivo, con un valore di $0755$, se si volesse attivare il
2311 bit \itindex{suid~bit} \acr{suid} il valore da fornire sarebbe $4755$.
2313 Il cambiamento dei permessi di un file eseguito attraverso queste funzioni ha
2314 comunque alcune limitazioni, previste per motivi di sicurezza. L'uso delle
2315 funzioni infatti è possibile solo se l'user-ID effettivo del processo
2316 corrisponde a quello del proprietario del file o dell'amministratore,
2317 altrimenti esse falliranno con un errore di \errcode{EPERM}.
2319 Ma oltre a questa regola generale, di immediata comprensione, esistono delle
2320 limitazioni ulteriori. Per questo motivo, anche se si è proprietari del file,
2321 non tutti i valori possibili di \param{mode} sono permessi o hanno effetto;
2322 in particolare accade che:
2324 \item siccome solo l'amministratore può impostare lo \itindex{sticky~bit}
2325 \textit{sticky bit}, se l'user-ID effettivo del processo non è zero esso
2326 viene automaticamente cancellato (senza notifica di errore) qualora sia
2327 stato indicato in \param{mode}.
2328 \item per quanto detto in sez.~\ref{sec:file_ownership_management} riguardo la
2329 creazione dei nuovi file, si può avere il caso in cui il file creato da un
2330 processo è assegnato ad un gruppo per il quale il processo non ha privilegi.
2331 Per evitare che si possa assegnare il bit \itindex{sgid~bit} \acr{sgid} ad
2332 un file appartenente ad un gruppo per cui non si hanno diritti, questo viene
2333 automaticamente cancellato da \param{mode} (senza notifica di errore)
2334 qualora il gruppo del file non corrisponda a quelli associati al processo
2335 (la cosa non avviene quando l'user-ID effettivo del processo è zero).
2338 Per alcuni filesystem\footnote{i filesystem più comuni (\textsl{ext2},
2339 \textsl{ext3}, \textsl{reiserfs}) supportano questa caratteristica, che è
2340 mutuata da BSD.} è inoltre prevista un'ulteriore misura di sicurezza, volta
2341 a scongiurare l'abuso dei \itindex{suid~bit} bit \acr{suid} e \acr{sgid}; essa
2342 consiste nel cancellare automaticamente questi bit dai permessi di un file
2343 qualora un processo che non appartenga all'amministratore\footnote{per la
2344 precisione un processo che non dispone della capability
2345 \const{CAP\_FSETID}.} effettui una scrittura. In questo modo anche se un
2346 utente malizioso scopre un file \acr{suid} su cui può scrivere, un'eventuale
2347 modifica comporterà la perdita di questo privilegio.
2349 Le funzioni \func{chmod} e \func{fchmod} ci permettono di modificare i
2350 permessi di un file, resta però il problema di quali sono i permessi assegnati
2351 quando il file viene creato. Le funzioni dell'interfaccia nativa di Unix, come
2352 vedremo in sez.~\ref{sec:file_open}, permettono di indicare esplicitamente i
2353 permessi di creazione di un file, ma questo non è possibile per le funzioni
2354 dell'interfaccia standard ANSI C che non prevede l'esistenza di utenti e
2355 gruppi, ed inoltre il problema si pone anche per l'interfaccia nativa quando i
2356 permessi non vengono indicati esplicitamente.
2360 Per le funzioni dell'interfaccia standard ANSI C l'unico riferimento possibile
2361 è quello della modalità di apertura del nuovo file (lettura/scrittura o sola
2362 lettura), che però può fornire un valore che è lo stesso per tutti e tre i
2363 permessi di sez.~\ref{sec:file_perm_overview} (cioè $666$ nel primo caso e
2364 $222$ nel secondo). Per questo motivo il sistema associa ad ogni
2365 processo\footnote{è infatti contenuta nel campo \var{umask} della struttura
2366 \struct{fs\_struct}, vedi fig.~\ref{fig:proc_task_struct}.} una maschera di
2367 bit, la cosiddetta \textit{umask}, che viene utilizzata per impedire che
2368 alcuni permessi possano essere assegnati ai nuovi file in sede di creazione. I
2369 bit indicati nella maschera vengono infatti cancellati dai permessi quando un
2370 nuovo file viene creato.\footnote{l'operazione viene fatta sempre: anche
2371 qualora si indichi esplicitamente un valore dei permessi nelle funzioni di
2372 creazione che lo consentono, i permessi contenuti nella \textit{umask}
2375 La funzione che permette di impostare il valore di questa maschera di
2376 controllo è \funcd{umask}, ed il suo prototipo è:
2377 \begin{prototype}{stat.h}
2378 {mode\_t umask(mode\_t mask)}
2380 Imposta la maschera dei permessi dei bit al valore specificato da \param{mask}
2381 (di cui vengono presi solo i 9 bit meno significativi).
2383 \bodydesc{La funzione ritorna il precedente valore della maschera. È una
2384 delle poche funzioni che non restituisce codici di errore.}
2387 In genere si usa questa maschera per impostare un valore predefinito che
2388 escluda preventivamente alcuni permessi (usualmente quello di scrittura per il
2389 gruppo e gli altri, corrispondente ad un valore per \param{mask} pari a
2390 $022$). In questo modo è possibile cancellare automaticamente i permessi non
2391 voluti. Di norma questo valore viene impostato una volta per tutte al login a
2392 $022$, e gli utenti non hanno motivi per modificarlo.
2397 \subsection{La gestione della titolarità dei file}
2398 \label{sec:file_ownership_management}
2400 Vedremo in sez.~\ref{sec:file_base_func} con quali funzioni si possono creare
2401 nuovi file, in tale occasione vedremo che è possibile specificare in sede di
2402 creazione quali permessi applicare ad un file, però non si può indicare a
2403 quale utente e gruppo esso deve appartenere. Lo stesso problema si presenta
2404 per la creazione di nuove directory (procedimento descritto in
2405 sez.~\ref{sec:file_dir_creat_rem}).
2407 Lo standard POSIX prescrive che l'\acr{uid} del nuovo file corrisponda
2408 all'user-ID effettivo del processo che lo crea; per il \acr{gid} invece prevede
2409 due diverse possibilità:
2411 \item il \acr{gid} del file corrisponde al group-ID effettivo del processo.
2412 \item il \acr{gid} del file corrisponde al \acr{gid} della directory in cui
2415 in genere BSD usa sempre la seconda possibilità, che viene per questo chiamata
2416 semantica BSD. Linux invece segue quella che viene chiamata semantica SVr4; di
2417 norma cioè il nuovo file viene creato, seguendo la prima opzione, con il
2418 \acr{gid} del processo, se però la directory in cui viene creato il file ha il
2419 bit \acr{sgid} impostato allora viene usata la seconda opzione.
2421 Usare la semantica BSD ha il vantaggio che il \acr{gid} viene sempre
2422 automaticamente propagato, restando coerente a quello della directory di
2423 partenza, in tutte le sotto-directory.
2425 La semantica SVr4 offre la possibilità di scegliere, ma per ottenere lo stesso
2426 risultato di coerenza che si ha con BSD necessita che per le nuove directory
2427 venga anche propagato anche il bit \acr{sgid}. Questo è il comportamento
2428 predefinito del comando \cmd{mkdir}, ed è in questo modo ad esempio che Debian
2429 assicura che le sotto-directory create nella home di un utente restino sempre
2430 con il \acr{gid} del gruppo primario dello stesso.
2432 Come per i permessi, il sistema fornisce anche delle funzioni che permettano
2433 di cambiare utente e gruppo cui il file appartiene; le funzioni in questione
2434 sono tre: \funcd{chown}, \funcd{fchown} e \funcd{lchown}, ed i loro prototipi
2437 \headdecl{sys/types.h}
2438 \headdecl{sys/stat.h}
2440 \funcdecl{int chown(const char *path, uid\_t owner, gid\_t group)}
2441 \funcdecl{int fchown(int fd, uid\_t owner, gid\_t group)}
2442 \funcdecl{int lchown(const char *path, uid\_t owner, gid\_t group)}
2444 Le funzioni cambiano utente e gruppo di appartenenza di un file ai valori
2445 specificati dalle variabili \param{owner} e \param{group}.
2447 \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
2448 un errore, in caso di errore \var{errno} può assumere i valori:
2450 \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2451 proprietario del file o non è zero, o utente e gruppo non sono validi
2453 Oltre a questi entrambe restituiscono gli errori \errval{EROFS} e
2454 \errval{EIO}; \func{chown} restituisce anche \errval{EFAULT},
2455 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2456 \errval{EACCES}, \errval{ELOOP}; \func{fchown} anche \errval{EBADF}.}
2459 In Linux soltanto l'amministratore (in sostanza un processo con la
2460 \itindex{capabilities} capability \const{CAP\_CHOWN}) può cambiare il
2461 proprietario di un file, seguendo la semantica di BSD che non consente agli
2462 utenti di assegnare i loro file ad altri (per evitare eventuali aggiramenti
2463 delle quote). L'amministratore può cambiare il gruppo di un file, il
2464 proprietario può cambiare il gruppo dei file che gli appartengono solo se il
2465 nuovo gruppo è il suo gruppo primario o uno dei gruppi di cui fa parte.
2467 La funzione \func{chown} segue i link simbolici, per operare direttamente su
2468 un link simbolico si deve usare la funzione \func{lchown}.\footnote{fino alla
2469 versione 2.1.81 in Linux \func{chown} non seguiva i link simbolici, da
2470 allora questo comportamento è stato assegnato alla funzione \func{lchown},
2471 introdotta per l'occasione, ed è stata creata una nuova system call per
2472 \func{chown} che seguisse i link simbolici.} La funzione \func{fchown} opera
2473 su un file aperto, essa è mutuata da BSD, ma non è nello standard POSIX.
2474 Un'altra estensione rispetto allo standard POSIX è che specificando -1 come
2475 valore per \param{owner} e \param{group} i valori restano immutati.
2477 Quando queste funzioni sono chiamate con successo da un processo senza i
2478 privilegi di root entrambi i bit \itindex{suid~bit} \acr{suid} e
2479 \itindex{sgid~bit} \acr{sgid} vengono cancellati. Questo non avviene per il
2480 bit \acr{sgid} nel caso in cui esso sia usato (in assenza del corrispondente
2481 permesso di esecuzione) per indicare che per il file è attivo il
2482 \itindex{mandatory~locking} \textit{mandatory locking}.
2485 \subsection{Un quadro d'insieme sui permessi}
2486 \label{sec:file_riepilogo}
2488 Avendo affrontato in maniera separata il comportamento delle varie funzioni ed
2489 il significato dei singoli bit dei permessi sui file, vale la pena fare un
2490 riepilogo in cui si riassumono le caratteristiche di ciascuno di essi, in modo
2491 da poter fornire un quadro d'insieme.
2493 In tab.~\ref{tab:file_fileperm_bits} si sono riassunti gli effetti dei vari
2494 bit dei permessi per un file; per quanto riguarda l'applicazione dei permessi
2495 per proprietario, gruppo ed altri si ricordi quanto illustrato in
2496 sez.~\ref{sec:file_perm_overview}. Per compattezza, nella tabelle si sono
2497 specificati i bit di \itindex{suid~bit} \textit{suid}, \itindex{sgid~bit}
2498 \textit{sgid} e \textit{sticky} \itindex{sticky~bit} con la notazione
2499 illustrata anche in fig.~\ref{fig:file_perm_bit}.
2504 \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
2506 \multicolumn{3}{|c|}{special}&
2507 \multicolumn{3}{|c|}{user}&
2508 \multicolumn{3}{|c|}{group}&
2509 \multicolumn{3}{|c|}{other}&
2510 \multirow{2}{*}{\textbf{Operazioni possibili}} \\
2512 \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2515 1&-&-&-&-&-&-&-&-&-&-&-&Se eseguito ha i permessi del proprietario.\\
2516 -&1&-&-&-&1&-&-&-&-&-&-&Se eseguito ha i permessi del gruppo proprietario.\\
2517 -&1&-&-&-&0&-&-&-&-&-&-&Il \itindex{mandatory~locking}
2518 \textit{mandatory locking} è abilitato.\\
2519 -&-&1&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2520 -&-&-&1&-&-&-&-&-&-&-&-&Permesso di lettura per il proprietario.\\
2521 -&-&-&-&1&-&-&-&-&-&-&-&Permesso di scrittura per il proprietario.\\
2522 -&-&-&-&-&1&-&-&-&-&-&-&Permesso di esecuzione per il proprietario.\\
2523 -&-&-&-&-&-&1&-&-&-&-&-&Permesso di lettura per il gruppo proprietario.\\
2524 -&-&-&-&-&-&-&1&-&-&-&-&Permesso di scrittura per il gruppo proprietario.\\
2525 -&-&-&-&-&-&-&-&1&-&-&-&Permesso di esecuzione per il gruppo proprietario.\\
2526 -&-&-&-&-&-&-&-&-&1&-&-&Permesso di lettura per tutti gli altri.\\
2527 -&-&-&-&-&-&-&-&-&-&1&-&Permesso di scrittura per tutti gli altri.\\
2528 -&-&-&-&-&-&-&-&-&-&-&1&Permesso di esecuzione per tutti gli altri.\\
2531 \caption{Tabella riassuntiva del significato dei bit dei permessi per un
2533 \label{tab:file_fileperm_bits}
2536 In tab.~\ref{tab:file_dirperm_bits} si sono invece riassunti gli effetti dei
2537 vari bit dei permessi per una directory; anche in questo caso si sono
2538 specificati i bit di \itindex{suid~bit} \textit{suid}, \itindex{sgid~bit}
2539 \textit{sgid} e \textit{sticky} \itindex{sticky~bit} con la notazione compatta
2540 illustrata in fig.~\ref{fig:file_perm_bit}.
2545 \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
2547 \multicolumn{3}{|c|}{special}&
2548 \multicolumn{3}{|c|}{user}&
2549 \multicolumn{3}{|c|}{group}&
2550 \multicolumn{3}{|c|}{other}&
2551 \multirow{2}{*}{\textbf{Operazioni possibili}} \\
2553 \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2556 1&-&-&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2557 -&1&-&-&-&-&-&-&-&-&-&-&Propaga il gruppo proprietario ai nuovi file
2559 -&-&1&-&-&-&-&-&-&-&-&-&Limita l'accesso in scrittura dei file nella
2561 -&-&-&1&-&-&-&-&-&-&-&-&Permesso di visualizzazione per il proprietario.\\
2562 -&-&-&-&1&-&-&-&-&-&-&-&Permesso di aggiornamento per il proprietario.\\
2563 -&-&-&-&-&1&-&-&-&-&-&-&Permesso di attraversamento per il proprietario.\\
2564 -&-&-&-&-&-&1&-&-&-&-&-&Permesso di visualizzazione per il gruppo
2566 -&-&-&-&-&-&-&1&-&-&-&-&Permesso di aggiornamento per il gruppo
2568 -&-&-&-&-&-&-&-&1&-&-&-&Permesso di attraversamento per il gruppo
2570 -&-&-&-&-&-&-&-&-&1&-&-&Permesso di visualizzazione per tutti gli altri.\\
2571 -&-&-&-&-&-&-&-&-&-&1&-&Permesso di aggiornamento per tutti gli altri.\\
2572 -&-&-&-&-&-&-&-&-&-&-&1&Permesso di attraversamento per tutti gli altri.\\
2575 \caption{Tabella riassuntiva del significato dei bit dei permessi per una
2577 \label{tab:file_dirperm_bits}
2580 Nelle tabelle si è indicato con il carattere ``-'' il fatto che il valore del
2581 bit in questione non è influente rispetto a quanto indicato nella riga della
2582 tabella; la descrizione dell'operazione fa riferimento soltanto alla
2583 combinazione di bit per i quali è stato riportato esplicitamente un valore.
2584 Si rammenti infine che il valore dei bit dei permessi non ha alcun effetto
2585 qualora il processo possieda i privilegi di amministratore.
2589 \section{Caratteristiche e funzionalità avanzate}
2590 \label{sec:file_dir_advances}
2592 Tratteremo qui alcune caratteristiche e funzionalità avanzate della gestione
2593 di file e directory, affrontando anche una serie di estensioni
2594 dell'interfaccia classica dei sistemi unix-like, principalmente utilizzate a
2595 scopi di sicurezza, che sono state introdotte nelle versioni più recenti di
2599 \subsection{Gli attributi estesi}
2600 \label{sec:file_xattr}
2602 \itindbeg{Extended~Attributes}
2604 Nelle sezioni precedenti abbiamo trattato in dettaglio le varie informazioni
2605 che il sistema mantiene negli \itindex{inode} \textit{inode}, e le varie
2606 funzioni che permettono di modificarle. Si sarà notato come in realtà queste
2607 informazioni siano estremamente ridotte. Questo è dovuto al fatto che Unix
2608 origina negli anni '70, quando le risorse di calcolo e di spazio disco erano
2609 minime. Con il venir meno di queste restrizioni è incominciata ad emergere
2610 l'esigenza di poter associare ai file delle ulteriori informazioni astratte
2611 (quelli che vengono chiamati i \textsl{meta-dati}) che però non potevano
2612 trovare spazio nei dati classici mantenuti negli \itindex{inode}
2615 Per risolvere questo problema alcuni sistemi unix-like (e fra questi anche
2616 Linux) hanno introdotto un meccanismo generico che consenta di associare delle
2617 informazioni ai singoli file,\footnote{l'uso più comune è quello della ACL,
2618 che tratteremo nella prossima sezione, ma si possono inserire anche altre
2619 informazioni.} detto \textit{Extended Attributes}. Gli \textsl{attributi
2620 estesi} non sono altro che delle coppie nome/valore che sono associate
2621 permanentemente ad un oggetto sul filesystem, analoghi di quello che sono le
2622 variabili di ambiente (vedi sez.~\ref{sec:proc_environ}) per un processo.
2624 Altri sistemi (come Solaris, MacOS e Windows) hanno adottato un meccanismo
2625 diverso in cui ad un file sono associati diversi flussi di dati, su cui
2626 possono essere mantenute ulteriori informazioni, che possono essere accedute
2627 con le normali operazioni di lettura e scrittura. Questi non vanno confusi con
2628 gli \textit{Extended Attributes} (anche se su Solaris hanno lo stesso nome),
2629 che sono un meccanismo molto più semplice, che pur essendo limitato (potendo
2630 contenere solo una quantità limitata di informazione) hanno il grande
2631 vantaggio di essere molto più semplici da realizzare, più
2632 efficienti,\footnote{cosa molto importante, specie per le applicazioni che
2633 richiedono una gran numero di accessi, come le ACL.} e di garantire
2634 l'atomicità di tutte le operazioni.
2636 In Linux gli attributi estesi sono sempre associati al singolo \itindex{inode}
2637 \textit{inode} e l'accesso viene sempre eseguito in forma atomica, in lettura
2638 il valore corrente viene scritto su un buffer in memoria, mentre la scrittura
2639 prevede che ogni valore precedente sia sovrascritto.
2641 Si tenga presente che non tutti i filesystem supportano gli \textit{Extended
2642 Attributes}, in particolare al momento della scrittura di queste dispense
2643 essi sono presenti solo su \textsl{ext2}, \textsl{ext3} e \textsl{XFS}.
2644 Inoltre a seconda della implementazione ci possono essere dei limiti sulla
2645 quantità di attributi che si possono utilizzare.\footnote{ad esempio nel caso
2646 di \textsl{ext2} ed \textsl{ext3} è richiesto che essi siano contenuti
2647 all'interno di un singolo blocco (pertanto con dimensioni massime pari a
2648 1024, 2048 o 4096 byte a seconda delle dimensioni di quest'ultimo impostate
2649 in fase di creazione del filesystem), mentre con \textsl{XFS} non ci sono
2650 limiti ed i dati vengono memorizzati in maniera diversa (nell'\textit{inode}
2651 stesso, in un blocco a parte, o in una struttura ad albero dedicata) per
2652 mantenerne la scalabilità.} Infine lo spazio utilizzato per mantenere gli
2653 attributi estesi viene tenuto in conto per il calcolo delle quote di utente e
2654 gruppo proprietari del file.
2656 Come meccanismo per mantenere informazioni aggiuntive associate al singolo
2657 file, gli \textit{Extended Attributes} possono avere usi anche molto diversi
2658 fra loro. Per poterli distinguere allora sono stati suddivisi in
2659 \textsl{classi}, a cui poter applicare requisiti diversi per l'accesso e la
2660 gestione. Per questo motivo il nome di un attributo deve essere sempre
2661 specificato nella forma \texttt{namespace.attribute}, dove \texttt{namespace}
2662 fa riferimento alla classe a cui l'attributo appartiene, mentre
2663 \texttt{attribute} è il nome ad esso assegnato. In tale forma il nome di un
2664 attributo esteso deve essere univoco. Al momento\footnote{della scrittura di
2665 questa sezione, kernel 2.6.23, ottobre 2007.} sono state definite le quattro
2666 classi di attributi riportate in tab.~\ref{tab:extended_attribute_class}.
2671 \begin{tabular}{|c|p{10cm}|}
2673 \textbf{Nome} & \textbf{Descrizione} \\
2676 \const{security}& Gli \textit{extended security attributes}: vengono
2677 utilizzati dalle estensioni di sicurezza del kernel (i
2678 \itindex{Linux~Security~Modules} \textit{Linux
2679 Security Modules}), per le realizzazione di meccanismi
2680 evoluti di controllo di accesso come \index{SELinux}
2682 \const{system} & Gli \textit{extended security attributes}: sono usati
2683 dal kernel per memorizzare dati di sistema associati ai
2684 file come le \itindex{Access~Control~List} ACL (vedi
2685 sez.~\ref{sec:file_ACL}) o le \itindex{capabilities}
2686 \textit{capabilities} (vedi
2687 sez.~\ref{sec:proc_capabilities}).\\
2688 \const{trusted} & I \textit{trusted extended attributes}: vengono
2689 utilizzati per poter realizzare in user space
2690 meccanismi che consentano di mantenere delle
2691 informazioni sui file che non devono essere accessibili
2692 ai processi ordinari.\\
2693 \const{user} & Gli \textit{extended user attributes}: utilizzati per
2694 mantenere informazioni aggiuntive sui file (come il
2695 \textit{mime-type}, la codifica dei caratteri o del
2696 file) accessibili dagli utenti.\\
2699 \caption{I nomi utilizzati valore di \texttt{namespace} per distinguere le
2700 varie classi di \textit{Extended Attributes}.}
2701 \label{tab:extended_attribute_class}
2705 Dato che uno degli usi degli \textit{Extended Attributes} è quello che li
2706 impiega per realizzare delle estensioni (come le ACL, \index{SELinux} SELinux,
2707 ecc.) al tradizionale meccanismo dei controlli di accesso di Unix, l'accesso
2708 ai loro valori viene regolato in maniera diversa a seconda sia della loro
2709 classe sia di quali, fra le estensioni che li utilizzano, sono poste in uso.
2710 In particolare, per ciascuna delle classi riportate in
2711 tab.~\ref{tab:extended_attribute_class}, si hanno i seguenti casi:
2712 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
2713 \item[\texttt{security}] L'accesso agli \textit{extended security attributes}
2714 dipende dalle politiche di sicurezza stabilite da loro stessi tramite
2715 l'utilizzo di un sistema di controllo basato sui
2716 \itindex{Linux~Security~Modules} \textit{Linux Security Modules} (ad esempio
2717 \index{SELinux} SELinux). Pertanto l'accesso in lettura o scrittura dipende
2718 dalle politiche di sicurezza implementate all'interno dal modulo di
2719 sicurezza che si sta utilizzando al momento (ciascuno avrà le sue). Se non è
2720 stato caricato nessun modulo di sicurezza l'accesso in lettura sarà
2721 consentito a tutti i processi, mentre quello in scrittura solo ai processi
2722 con privilegi amministrativi dotati della \index{capabilities}
2723 \textit{capability} \const{CAP\_SYS\_ADMIN}.
2725 \item[\texttt{system}] Anche l'accesso agli \textit{extended system
2726 attributes} dipende dalle politiche di accesso che il kernel realizza
2727 anche utilizzando gli stessi valori in essi contenuti. Ad esempio nel caso
2728 delle ACL l'accesso è consentito in lettura ai processi che hanno la
2729 capacità di eseguire una ricerca sul file (cioè hanno il permesso di lettura
2730 sulla directory che contiene il file) ed in scrittura al proprietario del
2731 file o ai processi dotati della \textit{capability} \index{capabilities}
2732 \const{CAP\_FOWNER}.\footnote{vale a dire una politica di accesso analoga a
2733 quella impiegata per gli ordinari permessi dei file.}
2735 \item[\texttt{trusted}] L'accesso ai \textit{trusted extended attributes}, sia
2736 per la lettura che per la scrittura, è consentito soltanto ai processi con
2737 privilegi amministrativi dotati della \index{capabilities}
2738 \textit{capability} \const{CAP\_SYS\_ADMIN}. In questo modo si possono
2739 utilizzare questi attributi per realizzare in user space dei meccanismi di
2740 controllo che accedono ad informazioni non disponibili ai processi ordinari.
2742 \item[\texttt{user}] L'accesso agli \textit{extended user attributes} è
2743 regolato dagli ordinari permessi dei file a cui essi fanno riferimento:
2744 occorre avere il permesso di lettura per leggerli e quello di scrittura per
2745 scriverli o modificarli. Dato l'uso di questi attributi, si è scelto cioè di
2746 applicare per il loro accesso gli stessi criteri che si usano per l'accesso
2747 al contenuto dei file (o delle directory) cui essi fanno riferimento.
2749 Questa scelta vale però soltanto per i file e le directory ordinarie, se
2750 valesse in generale infatti si avrebbe un serio problema di sicurezza dato
2751 che esistono diversi oggetti sul filesystem per i quali è normale avere
2752 avere il permesso di scrittura consentito a tutti gli utenti, come i link
2753 simbolici, o alcuni file di dispositivo come \texttt{/dev/null}. Se fosse
2754 possibile usare su di essi gli \textit{extended user attributes} un utente
2755 qualunque potrebbe inserirvi dati a piacere.\footnote{la cosa è stata notata
2756 su XFS, dove questo comportamento permetteva, non essendovi limiti sullo
2757 spazio occupabile dagli \textit{Extended Attributes}, di bloccare il
2758 sistema riempiendo il disco.}
2760 La semantica del controllo di accesso che abbiamo indicato inoltre non
2761 avrebbe alcun senso al di fuori di file e directory: i permessi di lettura e
2762 scrittura per un file di dispositivo attengono alle capacità di accesso al
2763 dispositivo sottostante,\footnote{motivo per cui si può formattare un disco
2764 anche se \texttt{/dev} è su un filesystem in sola lettura.} mentre per i
2765 link simbolici questi vengono semplicemente ignorati: in nessuno dei due
2766 casi hanno a che fare con il contenuto del file, e nella discussione
2767 relativa all'uso degli \textit{extended user attributes} nessuno è mai stato
2768 capace di indicare una qualche forma sensata di utilizzo degli stessi per
2769 link simbolici o file di dispositivo, e neanche per le fifo o i socket.
2771 Per questo motivo gli \textit{extended user attributes} sono stati
2772 completamente disabilitati per tutto ciò che non sia un file regolare o una
2773 directory.\footnote{si può verificare la semantica adottata consultando il
2774 file \texttt{fs/xattr.c} dei sorgenti del kernel.} Inoltre per le
2775 directory è stata introdotta una ulteriore restrizione, dovuta di nuovo alla
2776 presenza ordinaria di permessi di scrittura completi su directory come
2777 \texttt{/tmp}. Questo è un altro caso particolare, in cui il premesso di
2778 scrittura viene usato, unito alla presenza dello \itindex{sticky~bit}
2779 \textit{sticky bit}, per garantire il permesso di creazione di nuovi file.
2780 Per questo motivo, per evitare eventuali abusi, se una directory ha lo
2781 \itindex{sticky~bit} \textit{sticky bit} attivo sarà consentito scrivere i
2782 suoi \textit{extended user attributes} soltanto se si è proprietari della
2783 stessa, o si hanno i privilegi amministrativi della capability
2784 \index{capabilities} \const{CAP\_FOWNER}.
2787 Le funzioni per la gestione degli attributi estesi, come altre funzioni di
2788 gestione avanzate specifiche di Linux, non fanno parte delle \acr{glibc}, e
2789 sono fornite da una apposita libreria, \texttt{libattr}, che deve essere
2790 installata a parte;\footnote{la versione corrente della libreria è
2791 \texttt{libattr1}, e nel caso si usi Debian la si può installare con il
2792 pacchetto omonimo ed il collegato \texttt{libattr1-dev}.} pertanto se un
2793 programma le utilizza si dovrà indicare esplicitamente l'uso della suddetta
2794 libreria invocando il compilatore con l'opzione \texttt{-lattr}.
2796 Per poter leggere gli attributi estesi sono disponibili tre diverse funzioni,
2797 \funcd{getxattr}, \funcd{lgetxattr} e \funcd{fgetxattr}, che consentono
2798 rispettivamente di richiedere gli attributi relativi a un file, a un link
2799 simbolico e ad un file descriptor; i rispettivi prototipi sono:
2801 \headdecl{sys/types.h}
2802 \headdecl{attr/xattr.h}
2804 \funcdecl{ssize\_t getxattr(const char *path, const char *name, void
2805 *value, size\_t size)}
2807 \funcdecl{ssize\_t lgetxattr(const char *path, const char *name, void
2808 *value, size\_t size)}
2810 \funcdecl{ssize\_t fgetxattr(int filedes, const char *name, void *value,
2813 Le funzioni leggono il valore di un attributo esteso.
2815 \bodydesc{Le funzioni restituiscono un intero positivo che indica la
2816 dimensione dell'attributo richiesto in caso di successo, e $-1$ in caso di
2817 errore, nel qual caso \var{errno} assumerà i valori:
2819 \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
2820 \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
2821 non è sufficiente per contenere il risultato.
2822 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2823 filesystem o sono disabilitati.
2825 Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
2826 ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
2830 Le funzioni \func{getxattr} e \func{lgetxattr} prendono come primo argomento
2831 un pathname che indica il file di cui si vuole richiedere un attributo, la
2832 sola differenza è che la seconda, se il pathname indica un link simbolico,
2833 restituisce gli attributi di quest'ultimo e non quelli del file a cui esso fa
2834 riferimento. La funzione \func{fgetxattr} prende invece come primo argomento
2835 un numero di file descriptor, e richiede gli attributi del file ad esso
2838 Tutte e tre le funzioni richiedono di specificare nell'argomento \param{name}
2839 il nome dell'attributo di cui si vuole ottenere il valore. Il nome deve essere
2840 indicato comprensivo di prefisso del \textit{namespace} cui appartiene (uno
2841 dei valori di tab.~\ref{tab:extended_attribute_class}) nella forma
2842 \texttt{namespace.attributename}, come stringa terminata da un carattere NUL.
2843 Il suo valore verrà restituito nel buffer puntato dall'argomento \param{value}
2844 per una dimensione massima di \param{size} byte;\footnote{gli attributi estesi
2845 possono essere costituiti arbitrariamente da dati testuali o binari.} se
2846 quest'ultima non è sufficiente si avrà un errore di \errcode{ERANGE}.
2848 Per evitare di dover indovinare la dimensione di un attributo per tentativi si
2849 può eseguire una interrogazione utilizzando un valore nullo per \param{size};
2850 in questo caso non verrà letto nessun dato, ma verrà restituito come valore di
2851 ritorno della funzione chiamata la dimensione totale dell'attributo esteso
2852 richiesto, che si potrà usare come stima per allocare un buffer di dimensioni
2853 sufficienti.\footnote{si parla di stima perché anche se le funzioni
2854 restituiscono la dimensione esatta dell'attributo al momento in cui sono
2855 eseguite, questa potrebbe essere modificata in qualunque momento da un
2856 successivo accesso eseguito da un altro processo.}
2858 Un secondo gruppo di funzioni è quello che consente di impostare il valore di
2859 un attributo esteso, queste sono \funcd{setxattr}, \funcd{lsetxattr} e
2860 \funcd{fsetxattr}, e consentono di operare rispettivamente su un file, su un
2861 link simbolico o specificando un file descriptor; i loro prototipi sono:
2863 \headdecl{sys/types.h}
2864 \headdecl{attr/xattr.h}
2866 \funcdecl{int setxattr(const char *path, const char *name, const void
2867 *value, size\_t size, int flags)}
2869 \funcdecl{int lsetxattr(const char *path, const char *name, const void
2870 *value, size\_t size, int flags)}
2872 \funcdecl{int fsetxattr(int filedes, const char *name, const void *value,
2873 size\_t size, int flags)}
2875 Impostano il valore di un attributo esteso.
2877 \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
2878 errore, nel qual caso \var{errno} assumerà i valori:
2880 \item[\errcode{ENOATTR}] si è usato il flag \const{XATTR\_REPLACE} e
2881 l'attributo richiesto non esiste.
2882 \item[\errcode{EEXIST}] si è usato il flag \const{XATTR\_CREATE} ma
2883 l'attributo esiste già.
2884 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2885 filesystem o sono disabilitati.
2887 Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
2888 ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
2893 Le tre funzioni prendono come primo argomento un valore adeguato al loro
2894 scopo, usato in maniera del tutto identica a quanto visto in precedenza per le
2895 analoghe che leggono gli attributi estesi. Il secondo argomento \param{name}
2896 deve indicare, anche in questo caso con gli stessi criteri appena visti per le
2897 analoghe \func{getxattr}, \func{lgetxattr} e \func{fgetxattr}, il nome
2898 (completo di suffisso) dell'attributo su cui si vuole operare.
2900 Il valore che verrà assegnato all'attributo dovrà essere preparato nel buffer
2901 puntato da \param{value}, e la sua dimensione totale (in byte) sarà indicata
2902 dall'argomento \param{size}. Infine l'argomento \param{flag} consente di
2903 controllare le modalità di sovrascrittura dell'attributo esteso, esso può
2904 prendere due valori: con \const{XATTR\_REPLACE} si richiede che l'attributo
2905 esista, nel qual caso verrà sovrascritto, altrimenti si avrà errore, mentre
2906 con \const{XATTR\_CREATE} si richiede che l'attributo non esista, nel qual
2907 caso verrà creato, altrimenti si avrà errore ed il valore attuale non sarà
2908 modificato. Utilizzando per \param{flag} un valore nullo l'attributo verrà
2909 modificato se è già presente, o creato se non c'è.
2911 Le funzioni finora illustrate permettono di leggere o scrivere gli attributi
2912 estesi, ma sarebbe altrettanto utile poter vedere quali sono gli attributi
2913 presenti; a questo provvedono le funzioni \funcd{listxattr},
2914 \funcd{llistxattr} e \funcd{flistxattr} i cui prototipi sono:
2916 \headdecl{sys/types.h}
2917 \headdecl{attr/xattr.h}
2919 \funcdecl{ssize\_t listxattr(const char *path, char *list, size\_t size)}
2921 \funcdecl{ssize\_t llistxattr(const char *path, char *list, size\_t size)}
2923 \funcdecl{ssize\_t flistxattr(int filedes, char *list, size\_t size)}
2925 Leggono la lista degli attributi estesi di un file.
2927 \bodydesc{Le funzioni restituiscono un intero positivo che indica la
2928 dimensione della lista in caso di successo, e $-1$ in caso di errore, nel
2929 qual caso \var{errno} assumerà i valori:
2931 \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
2932 non è sufficiente per contenere il risultato.
2933 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2934 filesystem o sono disabilitati.
2936 Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
2937 ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
2942 Come per le precedenti le tre funzioni leggono gli attributi rispettivamente
2943 di un file, un link simbolico o specificando un file descriptor, da
2944 specificare con il loro primo argomento. Gli altri due argomenti, identici per
2945 tutte e tre, indicano rispettivamente il puntatore \param{list} al buffer dove
2946 deve essere letta la lista e la dimensione \param{size} di quest'ultimo.
2948 La lista viene fornita come sequenza non ordinata dei nomi dei singoli
2949 attributi estesi (sempre comprensivi del prefisso della loro classe) ciascuno
2950 dei quali è terminato da un carattere nullo. I nomi sono inseriti nel buffer
2951 uno di seguito all'altro. Il valore di ritorno della funzione indica la
2952 dimensione totale della lista in byte.
2954 Come per le funzioni di lettura dei singoli attributi se le dimensioni del
2955 buffer non sono sufficienti si avrà un errore, ma è possibile ottenere dal
2956 valore di ritorno della funzione una stima della dimensione totale della lista
2957 usando per \param{size} un valore nullo.
2959 Infine per rimuovere semplicemente un attributo esteso, si ha a disposizione
2960 un ultimo gruppo di funzioni: \funcd{removexattr}, \funcd{lremovexattr} e
2961 \funcd{fremovexattr}; i rispettivi prototipi sono:
2963 \headdecl{sys/types.h}
2964 \headdecl{attr/xattr.h}
2966 \funcdecl{int removexattr(const char *path, const char *name)}
2968 \funcdecl{int lremovexattr(const char *path, const char *name)}
2970 \funcdecl{int fremovexattr(int filedes, const char *name)}
2973 Rimuovono un attributo esteso di un file.
2975 \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
2976 errore, nel qual caso \var{errno} assumerà i valori:
2978 \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
2979 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2980 filesystem o sono disabilitati.
2982 ed inoltre tutti gli errori di \func{stat}.
2986 Le tre funzioni rimuovono l'attributo esteso indicato dall'argomento
2987 \param{name} rispettivamente di un file, un link simbolico o specificando un
2988 file descriptor, da specificare con il loro primo argomento. Anche in questo
2989 caso l'argomento \param{name} deve essere specificato con le modalità già
2990 illustrate in precedenza per le altre funzioni relative agli attributi estesi.
2993 \itindend{Extended~Attributes}
2995 % TODO trattare gli attributi estesi e le funzioni la documentazione di
2996 % sistema è nei pacchetti libxattr1-dev e attr
2999 \subsection{Le \textit{Access Control List}}
3000 \label{sec:file_ACL}
3003 \itindbeg{Access~Control~List}
3005 Il modello classico dei permessi di Unix, per quanto funzionale ed efficiente,
3006 è comunque piuttosto limitato e per quanto possa aver coperto per lunghi anni
3007 le esigenze più comuni con un meccanismo semplice e potente, non è in grado di
3008 rispondere in maniera adeguata a situazioni che richiedono una gestione
3009 complessa dei permessi di accesso.\footnote{già un requisito come quello di
3010 dare accesso in scrittura ad alcune persone ed in sola lettura ad altre non
3011 si può soddisfare in maniera semplice.}
3013 Per questo motivo erano state progressivamente introdotte nelle varie versioni
3014 di Unix dei meccanismi di gestione dei permessi dei file più flessibili, nella
3015 forma delle cosiddette \textit{Access Control List} (indicate usualmente con
3016 la sigla ACL). Nello sforzo di standardizzare queste funzionalità era stato
3017 creato un gruppo di lavoro il cui scopo era estendere lo standard POSIX 1003
3018 attraverso due nuovi insiemi di specifiche, la POSIX 1003.1e per l'interfaccia
3019 di programmazione e la POSIX 1003.2c per i comandi di shell.
3021 Gli obiettivi erano però forse troppo ambizioni, e nel gennaio del 1998 i
3022 finanziamenti vennero ritirati senza che si fosse arrivati alla definizione di
3023 uno standard, dato però che una parte della documentazione prodotta era di
3024 alta qualità venne deciso di rilasciare al pubblico la diciassettesima bozza
3025 del documento, quella che va sotto il nome di \textit{POSIX 1003.1e Draft 17},
3026 che è divenuta la base sulla quale si definiscono le cosiddette \textit{Posix
3029 A differenza di altri sistemi (ad esempio FreeBSD) nel caso di Linux si è
3030 scelto di realizzare le ACL attraverso l'uso degli
3031 \itindex{Extended~Attributes} \textit{Extended Attributes} (appena trattati in
3032 sez.~\ref{sec:file_xattr}), e fornire tutte le relative funzioni di gestione
3033 tramite una libreria, \texttt{libacl} che nasconde i dettagli implementativi
3034 delle ACL e presenta ai programmi una interfaccia che fa riferimento allo
3035 standard POSIX 1003.1e.
3037 Anche in questo caso le funzioni di questa libreria non fanno parte delle
3038 \acr{glibc} e devono essere installate a parte;\footnote{la versione corrente
3039 della libreria è \texttt{libacl1}, e nel caso si usi Debian la si può
3040 installare con il pacchetto omonimo e con il collegato \texttt{libacl1-dev}
3041 per i file di sviluppo.} pertanto se un programma le utilizza si dovrà
3042 indicare esplicitamente l'uso della libreria \texttt{libacl} invocando il
3043 compilatore con l'opzione \texttt{-lacl}. Si tenga presente inoltre che per
3044 poterle utilizzare le ACL devono essere attivate esplicitamente montando il
3045 filesystem\footnote{che deve supportarle, ma questo è ormai vero per
3046 praticamente tutti i filesystem più comuni, con l'eccezione di NFS per il
3047 quale esiste però un supporto sperimentale.} su cui le si vogliono
3048 utilizzare con l'opzione \texttt{acl} attiva. Dato che si tratta di una
3049 estensione è infatti opportuno utilizzarle soltanto laddove siano necessarie.
3051 Una ACL è composta da un insieme di voci, e ciascuna voce è a sua volta
3052 costituita da un \textsl{tipo}, da un eventuale
3053 \textsl{qualificatore},\footnote{deve essere presente soltanto per le voci di
3054 tipo \const{ACL\_USER} e \const{ACL\_GROUP}.} e da un insieme di permessi.
3055 Ad ogni oggetto sul filesystem si può associare una ACL che ne governa i
3056 permessi di accesso, detta \textit{access ACL}. Inoltre per le directory si
3057 può impostare una ACL aggiuntiva, detta \textit{default ACL}, che serve ad
3058 indicare quale dovrà essere la ACL assegnata di default nella creazione di un
3059 file all'interno della directory stessa. Come avviene per i permessi le ACL
3060 possono essere impostate solo del proprietario del file, o da un processo con
3061 la capability \index{capabilities} \const{CAP\_FOWNER}.
3066 \begin{tabular}{|l|p{8cm}|}
3068 \textbf{Tipo} & \textbf{Descrizione} \\
3071 \const{ACL\_USER\_OBJ} & voce che contiene i diritti di accesso del
3072 proprietario del file.\\
3073 \const{ACL\_USER} & voce che contiene i diritti di accesso per
3074 l'utente indicato dal rispettivo
3076 \const{ACL\_GROUP\_OBJ}& voce che contiene i diritti di accesso del
3077 gruppo proprietario del file.\\
3078 \const{ACL\_GROUP} & voce che contiene i diritti di accesso per
3079 il gruppo indicato dal rispettivo
3081 \const{ACL\_MASK} & voce che contiene la maschera dei massimi
3082 permessi di accesso che possono essere garantiti
3083 da voci del tipo \const{ACL\_USER},
3084 \const{ACL\_GROUP} e \const{ACL\_GROUP\_OBJ}.\\
3085 \const{ACL\_OTHER} & voce che contiene i diritti di accesso di chi
3086 non corrisponde a nessuna altra voce dell'ACL.\\
3089 \caption{Le costanti che identificano i tipi delle voci di una ACL.}
3090 \label{tab:acl_tag_types}
3093 L'elenco dei vari tipi di voci presenti in una ACL, con una breve descrizione
3094 del relativo significato, è riportato in tab.~\ref{tab:acl_tag_types}. Tre di
3095 questi tipi, \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e
3096 \const{ACL\_OTHER}, corrispondono direttamente ai tre permessi ordinari dei
3097 file (proprietario, gruppo proprietario e tutti gli altri) e per questo una
3098 ACL valida deve sempre contenere una ed una sola voce per ciascuno di questi
3101 Una ACL può poi contenere un numero arbitrario di voci di tipo
3102 \const{ACL\_USER} e \const{ACL\_GROUP}, ciascuna delle quali indicherà i
3103 permessi assegnati all'utente e al gruppo indicato dal relativo qualificatore;
3104 ovviamente ciascuna di queste voci dovrà fare riferimento ad un utente o ad un
3105 gruppo diverso, e non corrispondenti a quelli proprietari del file. Inoltre se
3106 in una ACL esiste una voce di uno di questi due tipi è obbligatoria anche la
3107 presenza di una ed una sola voce di tipo \const{ACL\_MASK}, che negli altri
3110 Quest'ultimo tipo di voce contiene la maschera dei permessi che possono essere
3111 assegnati tramite voci di tipo \const{ACL\_USER}, \const{ACL\_GROUP} e
3112 \const{ACL\_GROUP\_OBJ}; se in una di queste voci si fosse specificato un
3113 permesso non presente in \const{ACL\_MASK} questo verrebbe ignorato. L'uso di
3114 una ACL di tipo \const{ACL\_MASK} è di particolare utilità quando essa
3115 associata ad una \textit{default ACL} su una directory, in quanto i permessi
3116 così specificati verranno ereditati da tutti i file creati nella stessa
3117 directory. Si ottiene così una sorta di \itindex{umask} \textit{umask}
3118 associata ad un oggetto sul filesystem piuttosto che a un processo.
3120 Dato che le ACL vengono a costituire una estensione dei permessi ordinari, uno
3121 dei problemi che si erano posti nella loro standardizzazione era appunto
3122 quello della corrispondenza fra questi e le ACL. Come accennato i permessi
3123 ordinari vengono mappati le tre voci di tipo \const{ACL\_USER\_OBJ},
3124 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} che devono essere presenti in
3125 qualunque ACL; un cambiamento ad una di queste voci viene automaticamente
3126 riflesso sui permessi ordinari dei file\footnote{per permessi ordinari si
3127 intende quelli mantenuti nell'\textit{inode}, che devono restare dato che un
3128 filesystem può essere montato senza abilitare le ACL.} e viceversa. In
3129 realtà la mappatura è diretta solo per le voci \const{ACL\_USER\_OBJ} e
3130 \const{ACL\_OTHER}, nel caso di \const{ACL\_GROUP\_OBJ} questo vale soltanto
3131 se non è presente una voce di tipo \const{ACL\_MASK}, se invece questa è
3132 presente verranno tolti dai permessi di \const{ACL\_GROUP\_OBJ} tutti quelli
3133 non presenti in \const{ACL\_MASK}.\footnote{questo diverso comportamento a
3134 seconda delle condizioni è stato introdotto dalla standardizzazione
3135 \textit{POSIX 1003.1e Draft 17} per mantenere il comportamento invariato sui
3136 sistemi dotati di ACL per tutte quelle applicazioni che sono conformi
3137 soltanto all'ordinario standard \textit{POSIX 1003.1}.}
3139 Un secondo aspetto dell'incidenza delle ACL sul comportamento del sistema è
3140 quello relativo alla creazione di nuovi file,\footnote{o oggetti sul
3141 filesystem, il comportamento discusso vale per le funzioni \func{open} e
3142 \func{creat} (vedi sez.~\ref{sec:file_open}), \func{mkdir} (vedi
3143 sez.~\ref{sec:file_dir_creat_rem}), \func{mknod} e \func{mkfifo} (vedi
3144 sez.~\ref{sec:file_mknod}).} che come accennato può essere modificato dalla
3145 presenza di una \textit{default ACL} sulla directory che contiene quel file.
3146 Se questa non c'è valgono le regole usuali illustrate in
3147 sez.~\ref{sec:file_perm_management}, per cui essi sono determinati dalla
3148 \itindex{umask} \textit{umask} del processo, e la sola differenza è che i
3149 permessi ordinari da esse risultanti vengono automaticamente rimappati anche
3150 su una ACL di accesso assegnata automaticamente al nuovo file, che contiene
3151 soltanto le tre corrispondenti voci di tipo \const{ACL\_USER\_OBJ},
3152 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER}.
3154 Se invece è presente una ACL di default sulla directory che contiene il nuovo
3155 file questa diventerà automaticamente la sua ACL di accesso, a meno di non
3156 aver indicato, nelle funzioni di creazione che lo consentono, uno specifico
3157 valore per i permessi ordinari;\footnote{tutte le funzioni citate in
3158 precedenza supportano un argomento \var{mode} che indichi un insieme di
3159 permessi iniziale.} in tal caso saranno eliminati dalle voci corrispondenti
3160 nella ACL tutti quelli non presenti in tale indicazione.
3162 Dato che questa è la ragione che ha portato alla loro creazione, la principale
3163 modifica introdotta con la presenza della ACL è quella alle regole del
3164 controllo di accesso ai file illustrate in sez.~\ref{sec:file_perm_overview}.
3165 Come nel caso ordinario per il controllo vengono sempre utilizzati gli
3166 identificatori del gruppo \textit{effective} del processo, ma in presenza di
3167 ACL i passi attraverso i quali viene stabilito se esso ha diritto di accesso
3170 \item Se l'user-ID del processo è nullo l'accesso è sempre garantito senza
3172 \item Se l'user-ID del processo corrisponde al proprietario del file allora:
3174 \item se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
3175 l'accesso è consentito;
3176 \item altrimenti l'accesso è negato.
3178 \item Se l'user-ID del processo corrisponde ad un qualunque qualificatore
3179 presente in una voce \const{ACL\_USER} allora:
3181 \item se la voce \const{ACL\_USER} corrispondente e la voce
3182 \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
3184 \item altrimenti l'accesso è negato.
3186 \item Se è il group-ID del processo o uno dei group-ID supplementari
3187 corrisponde al gruppo proprietario del file allora:
3189 \item se la voce \const{ACL\_GROUP\_OBJ} e una eventuale voce
3190 \const{ACL\_MASK} (se non vi sono voci di tipo \const{ACL\_GROUP} questa
3191 può non essere presente) contengono entrambe il permesso richiesto,
3192 l'accesso è consentito;
3193 \item altrimenti l'accesso è negato.
3195 \item Se è il group-ID del processo o uno dei group-ID supplementari
3196 corrisponde ad un qualunque qualificatore presente in una voce
3197 \const{ACL\_GROUP} allora:
3199 \item se la voce \const{ACL\_GROUP} corrispondente e la voce
3200 \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
3202 \item altrimenti l'accesso è negato.
3204 \item Se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
3205 l'accesso è consentito, altrimenti l'accesso è negato.
3208 I passi di controllo vengono eseguiti esattamente in questa sequenza, e la
3209 decisione viene presa non appena viene trovata una corrispondenza con gli
3210 identificatori del processo. Questo significa che i permessi presenti in una
3211 voce di tipo \const{ACL\_USER} hanno la precedenza sui permessi ordinari
3212 associati al gruppo proprietario del file (vale a dire su
3213 \const{ACL\_GROUP\_OBJ}).
3215 Per la gestione delle ACL lo standard \textit{POSIX 1003.1e Draft 17} ha
3216 previsto delle apposite funzioni ed tutta una serie di tipi di dati
3217 dedicati;\footnote{fino a definire un tipo di dato e delle costanti apposite
3218 per identificare i permessi standard di lettura, scrittura ed esecuzione.}
3219 tutte le operazioni devono essere effettuate attraverso tramite questi tipi di
3220 dati, che incapsulano tutte le informazioni contenute nelle ACL. La prima di
3221 queste funzioni che prendiamo in esame è \funcd{acl\_init}, il cui prototipo
3224 \headdecl{sys/types.h}
3225 \headdecl{sys/acl.h}
3227 \funcdecl{acl\_t acl\_init(int count)}
3229 Inizializza un'area di lavoro per una ACL di \param{count} voci.
3231 \bodydesc{La funzione restituisce un puntatore all'area di lavoro in caso di
3232 successo e \const{NULL} in caso di errore, nel qual caso \var{errno}
3233 assumerà uno dei valori:
3235 \item[\errcode{EINVAL}] il valore di \param{count} è negativo.
3236 \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile.
3241 La funzione alloca ed inizializza un'area di memoria che verrà usata per
3242 mantenere i dati di una ACL contenente fino ad un massimo di \const{count}
3243 voci. La funzione ritorna un valore di tipo \type{acl\_t}, da usare in tutte
3244 le altre funzioni che operano sulla ACL. La funzione si limita alla
3245 allocazione iniziale e non inserisce nessun valore nella ACL che resta vuota.
3246 Si tenga presente che pur essendo \type{acl\_t} un tipo opaco che identifica
3247 ``\textsl{l'oggetto}'' ACL, il valore restituito dalla funzione non è altro
3248 che un puntatore all'area di memoria allocata per i dati richiesti; pertanto
3249 in caso di fallimento verrà restituito un puntatore nullo e si dovrà
3250 confrontare il valore di ritorno della funzione con ``\code{(acl\_t) NULL}''.
3252 Una volta che si siano completate le operazioni sui dati di una ACL la memoria
3253 allocata dovrà essere liberata esplicitamente attraverso una chiamata alla
3254 funzione \funcd{acl\_free}, il cui prototipo è:
3256 \headdecl{sys/types.h}
3257 \headdecl{sys/acl.h}
3259 \funcdecl{int acl\_free(void * obj\_p)}
3261 Disalloca la memoria riservata per i dati di una ACL.
3263 \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ se
3264 \param{obj\_p} non è un puntatore valido, nel qual caso \var{errno}
3265 assumerà il valore \errcode{EINVAL}
3269 Si noti come la funzione richieda come argomento un puntatore di tipo
3270 ``\ctyp{void *}'', essa infatti può essere usata non solo per liberare la
3271 memoria allocata per i dati di una ACL, ma anche per quella usata per creare
3272 le stringhe di descrizione testuale delle ACL o per ottenere i valori dei
3273 qualificatori di una voce; pertanto a seconda dei casi occorrerà eseguire un
3274 \textit{cast} a ``\ctyp{void *}'' del tipo di dato di cui si vuole eseguire la
3275 disallocazione. Si tenga presente poi che oltre a \func{acl\_init} esistono
3276 molte altre funzioni che possono allocare memoria per i dati delle ACL, è
3277 pertanto opportuno tenere traccia di tutte queste funzioni perché alla fine
3278 delle operazioni tutta la memoria allocata dovrà essere liberata con
3281 Una volta che si abbiano a disposizione i dati di una ACL tramite il
3282 riferimento ad oggetto di tipo \type{acl\_t} questi potranno essere copiati
3283 con la funzione \funcd{acl\_dup}, il cui prototipo è:
3285 \headdecl{sys/types.h}
3286 \headdecl{sys/acl.h}
3288 \funcdecl{acl\_t acl\_dup(acl\_t acl)}
3290 Crea una copia della ACL \param{acl}.
3292 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3293 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3294 \var{errno} assumerà uno dei valori:
3296 \item[\errcode{EINVAL}] l'argomento \param{acl} non è un puntatore valido
3298 \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile per eseguire
3304 La funzione crea una copia dei dati della ACL indicata tramite l'argomento
3305 \param{acl}, allocando autonomamente tutto spazio necessario alla copia e
3306 restituendo un secondo oggetto di tipo \type{acl\_t} come riferimento a
3307 quest'ultima. Valgono per questo le stesse considerazioni fatte per il valore
3308 di ritorno di \func{acl\_init}, ed in particolare il fatto che occorrerà
3309 prevedere una ulteriore chiamata esplicita a \func{acl\_free} per liberare la
3310 memoria occupata dalla copia.
3312 Se si deve creare una ACL manualmente l'uso di \func{acl\_init} è scomodo,
3313 dato che la funzione restituisce una ACL vuota, una alternativa allora è usare
3314 \funcd{acl\_from\_mode} che consente di creare una ACL a partire da un valore
3315 di permessi ordinari, il prototipo della funzione è:
3317 \headdecl{sys/types.h}
3318 \headdecl{sys/acl.h}
3320 \funcdecl{acl\_t acl\_from\_mode(mode\_t mode)}
3322 Crea una ACL inizializzata con i permessi di \param{mode}.
3324 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3325 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3326 \var{errno} assumerà il valore \errval{ENOMEM}.
3331 La funzione restituisce una ACL inizializzata con le tre voci obbligatorie
3332 \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} già
3333 impostate secondo la corrispondenza ai valori dei permessi ordinari indicati
3334 dalla maschera passata nell'argomento \param{mode}. Questa funzione è una
3335 estensione usata dalle ACL di Linux e non è portabile, ma consente di
3336 semplificare l'inizializzazione in maniera molto comoda.
3338 Altre due funzioni che consentono di creare una ACL già inizializzata sono
3339 \funcd{acl\_get\_fd} e \funcd{acl\_get\_file}, che però sono per lo più
3340 utilizzate per leggere la ACL corrente di un file; i rispettivi prototipi
3343 \headdecl{sys/types.h}
3344 \headdecl{sys/acl.h}
3346 \funcdecl{acl\_t acl\_get\_file(const char *path\_p, acl\_type\_t type)}
3347 \funcdecl{acl\_t acl\_get\_fd(int fd)}
3349 Ottiene i dati delle ACL di un file.
3351 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3352 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3353 \var{errno} assumerà uno dei valori:
3355 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3356 \item[\errcode{ENOTSUP}] il filesystem cui fa riferimento il file non
3359 ed inoltre \errval{EBADF} per \func{acl\_get\_fd}, ed \errval{EINVAL} per
3360 valori scorretti di \param{type} e tutti i possibili errori per l'accesso ad
3361 un file per \func{acl\_get\_file}.
3366 Le due funzioni ritornano, con un oggetto di tipo \type{acl\_t}, il valore
3367 della ACL correntemente associata ad un file, che può essere identificato
3368 tramite un file descriptor usando \func{acl\_get\_fd} o con un pathname usando
3369 \func{acl\_get\_file}. Nel caso di quest'ultima funzione, che può richiedere
3370 anche la ACL relativa ad una directory, il secondo argomento \param{type}
3371 consente di specificare se si vuole ottenere la ACL di default o quella di
3372 accesso. Questo argomento deve essere di tipo \type{acl\_type\_t} e può
3373 assumere solo i due valori riportati in tab.~\ref{tab:acl_type}.
3378 \begin{tabular}{|l|l|}
3380 \textbf{Tipo} & \textbf{Descrizione} \\
3383 \const{ACL\_TYPE\_ACCESS} & indica una ACL di accesso.\\
3384 \const{ACL\_TYPE\_DEFAULT}& indica una ACL di default.\\
3387 \caption{Le costanti che identificano il tipo di ACL.}
3388 \label{tab:acl_type}
3391 Si tenga presente che nel caso di \func{acl\_get\_file} occorrerà che il
3392 processo chiamante abbia privilegi di accesso sufficienti a poter leggere gli
3393 attributi estesi dei file (come illustrati in sez.~\ref{sec:file_xattr});
3394 inoltre una ACL di tipo \const{ACL\_TYPE\_DEFAULT} potrà essere richiesta
3395 soltanto per una directory, e verrà restituita solo se presente, altrimenti
3396 verrà restituita una ACL vuota.
3398 Infine si potrà creare una ACL direttamente dalla sua rappresentazione
3399 testuale con la funzione \funcd{acl\_from\_text}, il cui prototipo è:
3401 \headdecl{sys/types.h}
3402 \headdecl{sys/acl.h}
3404 \funcdecl{acl\_t acl\_from\_text(const char *buf\_p)}
3406 Crea una ACL a partire dalla sua rappresentazione testuale.
3408 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3409 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3410 \var{errno} assumerà uno dei valori:
3412 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3413 \item[\errcode{EINVAL}] la rappresentazione testuale all'indirizzo
3414 \param{buf\_p} non è valida.
3420 La funzione prende come argomento il puntatore ad un buffer dove si è inserita
3421 la rappresentazione testuale della ACL che si vuole creare, la memoria
3422 necessaria viene automaticamente allocata ed in caso di successo viene
3423 restituito come valore di ritorno un oggetto di tipo \type{acl\_t} con il
3424 contenuto della stessa, che come per le precedenti funzioni, dovrà essere
3425 disallocato esplicitamente al termine del suo utilizzo.
3427 La rappresentazione testuale di una ACL è quella usata anche dai comandi
3428 ordinari per la gestione delle ACL (\texttt{getfacl} e \texttt{setfacl}), che
3429 prevede due diverse forme, estesa e breve, entrambe supportate da
3430 \func{acl\_from\_text}. La forma estesa prevede che sia specificata una voce
3431 per riga, nella forma:
3433 tipo:qualificatore:permessi
3435 dove il tipo può essere uno fra \texttt{user}, \texttt{group}, \texttt{other}
3436 e \texttt{mask}. Il qualificatore è presente solo per \texttt{user} e
3437 \texttt{group} e indica l'utente o il gruppo a cui la voce si riferisce; i
3438 permessi sono espressi con una tripletta di lettere analoga a quella usata per
3439 i permessi dei file.\footnote{vale a dire \texttt{r} per il permesso di
3440 lettura, \texttt{w} per il permesso di scrittura, \texttt{x} per il permesso
3441 di esecuzione (scritti in quest'ordine) e \texttt{-} per l'assenza del
3444 Va precisato che i due tipi \texttt{user} e \texttt{group} sono usati
3445 rispettivamente per indicare delle voci relative ad utenti e
3446 gruppi,\footnote{cioè per voci di tipo \const{ACL\_USER\_OBJ} e
3447 \const{ACL\_USER} per \texttt{user} e \const{ACL\_GROUP\_OBJ} e
3448 \const{ACL\_GROUP} per \texttt{group}.} applicate sia a quelli proprietari
3449 del file che a quelli generici; quelle dei proprietari si riconoscono per
3450 l'assenza di un qualificatore, ed in genere si scrivono per prima delle altre.
3451 Il significato delle voci di tipo \texttt{mask} e \texttt{mark} è evidente. In
3452 questa forma si possono anche inserire dei commenti precedendoli con il
3453 carattere ``\texttt{\#}''.
3455 La forma breve prevede invece la scrittura delle singole voci su una riga,
3456 separate da virgole; come specificatori del tipo di voce si possono usare le
3457 iniziali dei valori usati nella forma estesa (cioè ``\texttt{u}'',
3458 ``\texttt{g}'', ``\texttt{o}'' e ``\texttt{m}''), mentre le altri parte della
3459 voce sono le stesse. In questo caso non sono consentiti permessi.
3461 Per la conversione inversa, che consente di ottenere la rappresentazione
3462 testuale di una ACL, sono invece disponibili due funzioni, la prima delle due,
3463 di uso più immediato, è \funcd{acl\_to\_text}, il cui prototipo è:
3465 \headdecl{sys/types.h}
3466 \headdecl{sys/acl.h}
3468 \funcdecl{char * acl\_to\_text(acl\_t acl, ssize\_t *len\_p)}
3470 Produce la rappresentazione testuale di una ACL.
3472 \bodydesc{La funzione restituisce il puntatore ad una stringa con la
3473 rappresentazione testuale della ACL in caso di successo e
3474 \code(acl\_t){NULL} in caso di errore, nel qual caso \var{errno} assumerà
3477 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3478 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
3484 La funzione restituisce il puntatore ad una stringa terminata da NUL
3485 contenente la rappresentazione in forma estesa della ACL passata come
3486 argomento, ed alloca automaticamente la memoria necessaria. Questa dovrà poi
3487 essere liberata, quando non più necessaria, con \func{acl\_free}. Se
3488 nell'argomento \param{len\_p} si passa un valore puntatore ad una variabile
3489 intera in questa verrà restituita la dimensione della stringa con la
3490 rappresentazione testuale (non comprendente il carattere nullo finale).
3492 La seconda funzione, \funcd{acl\_to\_any\_text}, permette di controllare con
3493 dovizia di dettagli la generazione della stringa contenente la
3494 rappresentazione testuale della ACL, il suo prototipo è:
3496 \headdecl{sys/types.h}
3497 \headdecl{sys/acl.h}
3499 \funcdecl{char * acl\_to\_any\_text(acl\_t acl, const char *prefix, char
3500 separator, int options)}
3502 Produce la rappresentazione testuale di una ACL.
3504 \bodydesc{La funzione restituisce il puntatore ad una stringa con la
3505 rappresentazione testuale della ACL in caso di successo e \code{NULL} in
3506 caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
3508 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3509 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
3515 La funzione converte in formato testo la ACL indicata dall'argomento
3516 \param{acl}, usando il carattere \param{separator} come separatore delle
3517 singole voci; se l'argomento \param{prefix} non è nullo la stringa da esso
3518 indicata viene utilizzata come prefisso per le singole voci.
3520 L'ultimo argomento, \param{options}, consente di controllare la modalità con
3521 cui viene generata la rappresentazione testuale. Un valore nullo fa si che
3522 vengano usati gli identificatori standard \texttt{user}, \texttt{group},
3523 \texttt{other} e \texttt{mask} con i nomi di utenti e gruppi risolti rispetto
3524 ai loro valori numerici. Altrimenti si può specificare un valore in forma di
3525 maschera binaria, da ottenere con un OR aritmetico dei valori riportati in
3526 tab.~\ref{tab:acl_to_text_options}.
3531 \begin{tabular}{|l|p{8cm}|}
3533 \textbf{Tipo} & \textbf{Descrizione} \\
3536 \const{TEXT\_ABBREVIATE} & stampa le voci in forma abbreviata.\\
3537 \const{TEXT\_NUMERIC\_IDS} & non effettua la risoluzione numerica di
3538 user-ID e group-ID.\\
3539 \const{TEXT\_SOME\_EFFECTIVE}& per ciascuna voce che contiene permessi che
3540 vengono eliminati dalla \const{ACL\_MASK}
3541 viene generato un commento con i permessi
3542 effettivamente risultanti; il commento è
3543 separato con un tabulatore.\\
3544 \const{TEXT\_ALL\_EFFECTIVE} & viene generato un commento con i permessi
3545 effettivi per ciascuna voce che contiene
3546 permessi citati nella \const{ACL\_MASK},
3547 anche quando questi non vengono modificati
3548 da essa; il commento è separato con un
3550 \const{TEXT\_SMART\_INDENT} & da usare in combinazione con le precedenti
3551 \const{TEXT\_SOME\_EFFECTIVE} e
3552 \const{TEXT\_ALL\_EFFECTIVE} aumenta
3553 automaticamente il numero di spaziatori
3554 prima degli eventuali commenti in modo da
3555 mantenerli allineati.\\
3558 \caption{Possibili valori per l'argomento \param{options} di
3559 \func{acl\_to\_any\_text}.}
3560 \label{tab:acl_to_text_options}
3563 Come per \func{acl\_to\_text} anche in questo caso il buffer contenente la
3564 rappresentazione testuale dell'ACL, di cui la funzione restituisce
3565 l'indirizzo, viene allocato automaticamente, e dovrà essere esplicitamente
3566 disallocato con una chiamata ad \func{acl\_free}. Si tenga presente infine che
3567 questa funzione è una estensione specifica di Linux, e non è presente nella
3568 bozza dello standard POSIX.1e.
3571 \itindend{Access~Control~List}
3574 % TODO trattare le ACL, la documentazione di sistema è nei pacchetti
3576 % vedi anche http://www.suse.de/~agruen/acl/linux-acls/online/
3580 \subsection{La funzione \func{chroot}}
3581 \label{sec:file_chroot}
3583 % TODO introdurre nuova sezione sulle funzionalità di sicurezza avanzate, con
3584 % dentro chroot SELinux e AppArmor ???
3586 Benché non abbia niente a che fare con permessi, utenti e gruppi, la funzione
3587 \func{chroot} viene usata spesso per restringere le capacità di accesso di un
3588 programma ad una sezione limitata del filesystem, per cui ne parleremo in
3591 Come accennato in sez.~\ref{sec:proc_fork} ogni processo oltre ad una
3592 directory di lavoro, ha anche una directory \textsl{radice}\footnote{entrambe
3593 sono contenute in due campi (rispettivamente \var{pwd} e \var{root}) di
3594 \struct{fs\_struct}; vedi fig.~\ref{fig:proc_task_struct}.} che, pur essendo
3595 di norma corrispondente alla radice dell'albero di file e directory come visto
3596 dal kernel (ed illustrato in sez.~\ref{sec:file_organization}), ha per il
3597 processo il significato specifico di directory rispetto alla quale vengono
3598 risolti i \itindsub{pathname}{assoluto}\textit{pathname}
3599 assoluti.\footnote{cioè quando un processo chiede la risoluzione di un
3600 \textit{pathname}, il kernel usa sempre questa directory come punto di
3601 partenza.} Il fatto che questo valore sia specificato per ogni processo apre
3602 allora la possibilità di modificare le modalità di risoluzione dei
3603 \textit{pathname} assoluti da parte di un processo cambiando questa directory,
3604 così come si fa coi \itindsub{pathname}{relativo}\textit{pathname} relativi
3605 cambiando la directory di lavoro.
3607 Normalmente la directory radice di un processo coincide anche con la radice
3608 del filesystem usata dal kernel, e dato che il suo valore viene ereditato dal
3609 padre da ogni processo figlio, in generale i processi risolvono i
3610 \itindsub{pathname}{assoluto} \textit{pathname} assoluti a partire sempre
3611 dalla stessa directory, che corrisponde alla radice del sistema.
3613 In certe situazioni però, per motivi di sicurezza, è utile poter impedire che
3614 un processo possa accedere a tutto il filesystem; per far questo si può
3615 cambiare la sua directory radice con la funzione \funcd{chroot}, il cui
3617 \begin{prototype}{unistd.h}{int chroot(const char *path)}
3618 Cambia la directory radice del processo a quella specificata da
3621 \bodydesc{La funzione restituisce zero in caso di successo e -1 per
3622 un errore, in caso di errore \var{errno} può assumere i valori:
3624 \item[\errcode{EPERM}] l'user-ID effettivo del processo non è zero.
3626 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
3627 \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EACCES}, \errval{ELOOP};
3628 \errval{EROFS} e \errval{EIO}.}
3630 \noindent in questo modo la directory radice del processo diventerà
3631 \param{path} (che ovviamente deve esistere) ed ogni
3632 \itindsub{pathname}{assoluto}\textit{pathname} assoluto usato dalle funzioni
3633 chiamate nel processo sarà risolto a partire da essa, rendendo impossibile
3634 accedere alla parte di albero sovrastante. Si ha così quella che viene
3635 chiamata una \textit{chroot jail}, in quanto il processo non può più accedere
3636 a file al di fuori della sezione di albero in cui è stato
3637 \textsl{imprigionato}.
3639 Solo un processo con i privilegi di amministratore può usare questa funzione,
3640 e la nuova radice, per quanto detto in sez.~\ref{sec:proc_fork}, sarà ereditata
3641 da tutti i suoi processi figli. Si tenga presente però che la funzione non
3642 cambia la directory di lavoro, che potrebbe restare fuori dalla \textit{chroot
3645 Questo è il motivo per cui la funzione è efficace solo se dopo averla eseguita
3646 si cedono i privilegi di root. Infatti se per un qualche motivo il processo
3647 resta con la directory di lavoro fuori dalla \textit{chroot jail}, potrà
3648 comunque accedere a tutto il resto del filesystem usando
3649 \itindsub{pathname}{relativo}\textit{pathname} relativi, i quali, partendo
3650 dalla directory di lavoro che è fuori della \textit{chroot jail}, potranno
3651 (con l'uso di \texttt{..}) risalire fino alla radice effettiva del filesystem.
3653 Ma se ad un processo restano i privilegi di amministratore esso potrà comunque
3654 portare la sua directory di lavoro fuori dalla \textit{chroot jail} in cui si
3655 trova. Basta infatti creare una nuova \textit{chroot jail} con l'uso di
3656 \func{chroot} su una qualunque directory contenuta nell'attuale directory di
3657 lavoro. Per questo motivo l'uso di questa funzione non ha molto senso quando
3658 un processo necessita dei privilegi di root per le sue normali operazioni.
3660 Un caso tipico di uso di \func{chroot} è quello di un server FTP anonimo, in
3661 questo caso infatti si vuole che il server veda solo i file che deve
3662 trasferire, per cui in genere si esegue una \func{chroot} sulla directory che
3663 contiene i file. Si tenga presente però che in questo caso occorrerà
3664 replicare all'interno della \textit{chroot jail} tutti i file (in genere
3665 programmi e librerie) di cui il server potrebbe avere bisogno.
3670 % LocalWords: sez like filesystem unlink MacOS Windows VMS inode kernel unistd
3671 % LocalWords: un'etichetta int const char oldpath newpath errno EXDEV EPERM st
3672 % LocalWords: EEXIST EMLINK EACCES ENAMETOOLONG ENOTDIR EFAULT ENOMEM EROFS ls
3673 % LocalWords: ELOOP ENOSPC EIO pathname nlink stat vfat fsck EISDIR ENOENT cap
3674 % LocalWords: POSIX socket fifo sticky root system call count crash nell' init
3675 % LocalWords: descriptor remove rename rmdir stdio glibc libc NFS DT obj dup
3676 % LocalWords: ENOTEMPTY EBUSY mount point EINVAL soft symbolic tab symlink fig
3677 % LocalWords: dangling access chdir chmod chown creat exec lchown lstat mkdir
3678 % LocalWords: mkfifo mknod opendir pathconf readlink truncate path buff size
3679 % LocalWords: grub bootloader grep linux MAXSYMLINKS cat VFS sys dirname fcntl
3680 % LocalWords: dev umask IFREG IFBLK IFCHR IFIFO SVr sgid BSD SVID NULL from to
3681 % LocalWords: stream dirent EMFILE ENFILE dirfd SOURCE fchdir readdir struct
3682 % LocalWords: EBADF namlen HAVE thread entry result value argument fileno ino
3683 % LocalWords: name TYPE OFF RECLEN UNKNOWN REG SOCK CHR BLK type IFTODT DTTOIF
3684 % LocalWords: DTYPE off reclen seekdir telldir void rewinddir closedir select
3685 % LocalWords: namelist compar malloc qsort alphasort versionsort strcoll myls
3686 % LocalWords: strcmp DirScan direntry while current working home shell pwd get
3687 % LocalWords: getcwd ERANGE getwd change fd race condition tmpnam getfacl mark
3688 % LocalWords: string tmpdir TMP tempnam pfx TMPNAME suid tmp EXCL tmpfile pid
3689 % LocalWords: EINTR mktemp mkstemp stlib template filename XXXXXX OpenBSD buf
3690 % LocalWords: mkdtemp fstat filedes nell'header padding ISREG ISDIR ISCHR IFMT
3691 % LocalWords: ISBLK ISFIFO ISLNK ISSOCK IFSOCK IFLNK IFDIR ISUID UID ISGID GID
3692 % LocalWords: ISVTX IRUSR IWUSR IXUSR IRGRP IWGRP IXGRP IROTH IWOTH IXOTH du
3693 % LocalWords: blocks blksize holes lseek TRUNC ftruncate length lenght ETXTBSY
3694 % LocalWords: hole atime read utime mtime write ctime modification leafnode cp
3695 % LocalWords: make fchmod fchown utimbuf times actime modtime Mac owner uid fs
3696 % LocalWords: gid Control List patch mandatory control execute group other all
3697 % LocalWords: dell' effective passwd IGID locking swap saved text IRWXU IRWXG
3698 % LocalWords: IRWXO ext reiser capability FSETID mask capabilities chroot jail
3699 % LocalWords: FTP Di filter reiserfs Attributes Solaris Posix FreeBSD libacl
3700 % LocalWords: XFS SELinux namespace attribute security trusted Draft Modules
3701 % LocalWords: attributes mime ADMIN FOWNER libattr lattr getxattr lgetxattr of
3702 % LocalWords: fgetxattr attr ssize ENOATTR ENOTSUP NUL setxattr lsetxattr list
3703 % LocalWords: fsetxattr flags XATTR REPLACE listxattr llistxattr flistxattr by
3704 % LocalWords: removexattr lremovexattr fremovexattr attributename lacl acl
3705 % LocalWords: OBJ setfacl len any prefix separator options NUMERIC IDS SMART
3707 %%% Local Variables:
3709 %%% TeX-master: "gapil"
3711 % LocalWords: INDENT