3 %% Copyright (C) 2000-2007 Simone Piccardi. Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
12 \chapter{File e directory}
13 \label{cha:files_and_dirs}
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando dalle funzioni di libreria che si usano per
17 copiarli, spostarli e cambiarne i nomi. Esamineremo poi l'interfaccia che
18 permette la manipolazione dei vari attributi di file e directory ed alla fine
19 faremo una trattazione dettagliata su come è strutturato il sistema base di
20 protezioni e controllo dell'accesso ai file e sulle funzioni che ne permettono
21 la gestione. Tutto quello che riguarda invece la manipolazione del contenuto
22 dei file è lasciato ai capitoli successivi.
26 \section{La gestione di file e directory}
29 Come già accennato in sez.~\ref{sec:file_filesystem} in un sistema unix-like
30 la gestione dei file ha delle caratteristiche specifiche che derivano
31 direttamente dall'architettura del sistema. In questa sezione esamineremo le
32 funzioni usate per la manipolazione di file e directory, per la creazione di
33 link simbolici e diretti, per la gestione e la lettura delle directory.
35 In particolare ci soffermeremo sulle conseguenze che derivano
36 dall'architettura dei filesystem illustrata nel capitolo precedente per quanto
37 riguarda il comportamento e gli effetti delle varie funzioni.
40 \subsection{Le funzioni \func{link} e \func{unlink}}
43 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
44 dei nomi fittizi (come gli alias del MacOS o i collegamenti di Windows o i
45 nomi logici del VMS) che permettono di fare riferimento allo stesso file
46 chiamandolo con nomi diversi o accedendovi da directory diverse.
48 Questo è possibile anche in ambiente Unix, dove tali collegamenti sono
49 usualmente chiamati \textit{link}; ma data l'architettura del sistema riguardo
50 la gestione dei file (ed in particolare quanto trattato in
51 sez.~\ref{sec:file_arch_func}) ci sono due metodi sostanzialmente diversi per
52 fare questa operazione.
54 Come spiegato in sez.~\ref{sec:file_filesystem} l'accesso al contenuto di un
55 file su disco avviene passando attraverso il suo \itindex{inode}
56 \textit{inode}, che è la struttura usata dal kernel che lo identifica
57 univocamente all'interno di un singolo filesystem. Il nome del file che si
58 trova nella voce di una directory è solo un'etichetta, mantenuta all'interno
59 della directory, che viene associata ad un puntatore che fa riferimento al
60 suddetto \textit{inode}.
62 Questo significa che, fintanto che si resta sullo stesso filesystem, la
63 realizzazione di un link è immediata, ed uno stesso file può avere tanti nomi
64 diversi, dati da altrettante associazioni diverse allo stesso \itindex{inode}
65 \textit{inode} effettuate tramite ``etichette'' diverse in directory
66 diverse. Si noti anche che nessuno di questi nomi viene ad assumere una
67 particolare preferenza o originalità rispetto agli altri, in quanto tutti
68 fanno comunque riferimento allo stesso \itindex{inode} \textit{inode}.
70 Per aggiungere ad una directory una voce che faccia riferimento ad un
71 \itindex{inode} \textit{inode} già esistente si utilizza la funzione
72 \func{link}; si suole chiamare questo tipo di associazione un collegamento
73 diretto, o \textit{hard link}. Il prototipo della funzione è il seguente:
74 \begin{prototype}{unistd.h}
75 {int link(const char *oldpath, const char *newpath)}
76 Crea un nuovo collegamento diretto.
78 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
79 errore nel qual caso \var{errno} viene impostata ai valori:
81 \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
82 riferimento ad un filesystem montato sullo stesso \textit{mount point}.
83 \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
84 \param{newpath} non supporta i link diretti o è una directory.
85 \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
87 \item[\errcode{EMLINK}] ci sono troppi link al file \param{oldpath} (il
88 numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
89 sez.~\ref{sec:sys_limits}).
91 ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOTDIR},
92 \errval{EFAULT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
93 \errval{ENOSPC}, \errval{EIO}.}
96 La funzione crea sul \itindex{pathname} \textit{pathname} \param{newpath} un
97 collegamento diretto al file indicato da \param{oldpath}. Per quanto detto la
98 creazione di un nuovo collegamento diretto non copia il contenuto del file, ma
99 si limita a creare una voce nella directory specificata da \param{newpath} e
100 ad aumentare di uno il numero di riferimenti al file (riportato nel campo
101 \var{st\_nlink} della struttura \struct{stat}, vedi sez.~\ref{sec:file_stat})
102 aggiungendo il nuovo nome ai precedenti. Si noti che uno stesso file può
103 essere così chiamato con vari nomi in diverse directory.
105 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
106 collegamento diretto è possibile solo se entrambi i \itindex{pathname}
107 \textit{pathname} sono nello stesso filesystem; inoltre il filesystem deve
108 supportare i collegamenti diretti (il meccanismo non è disponibile ad esempio
109 con il filesystem \acr{vfat} di Windows). In realtà la funzione ha un
110 ulteriore requisito, e cioè che non solo che i due file siano sullo stesso
111 filesystem, ma anche che si faccia riferimento ad essi sullo stesso
112 \textit{mount point}.\footnote{si tenga presente infatti (vedi
113 sez.~\ref{sec:sys_file_config}) che a partire dal kernel 2.4 uno stesso
114 filesystem può essere montato più volte su directory diverse.}
116 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
117 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
118 l'amministratore è in grado di creare un collegamento diretto ad un'altra
119 directory: questo viene fatto perché con una tale operazione è possibile
120 creare dei \textit{loop} nel filesystem (vedi l'esempio mostrato in
121 sez.~\ref{sec:file_symlink}, dove riprenderemo il discorso) che molti programmi
122 non sono in grado di gestire e la cui rimozione diventerebbe estremamente
123 complicata (in genere per questo tipo di errori occorre far girare il
124 programma \cmd{fsck} per riparare il filesystem).
126 Data la pericolosità di questa operazione e la disponibilità dei link
127 simbolici che possono fornire la stessa funzionalità senza questi problemi,
128 nel caso di Linux questa capacità è stata completamente disabilitata, e al
129 tentativo di creare un link diretto ad una directory la funzione \func{link}
130 restituisce l'errore \errcode{EPERM}.
132 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
133 \textit{hard link} ad un link simbolico. In questo caso lo standard POSIX
134 prevederebbe che quest'ultimo venga risolto e che il collegamento sia
135 effettuato rispetto al file cui esso punta, e che venga riportato un errore
136 qualora questo non esista o non sia un file. Questo era anche il comportamento
137 iniziale di Linux ma a partire dai kernel della serie 2.0.x\footnote{per la
138 precisione il comportamento era quello previsto dallo standard POSIX fino al
139 kernel di sviluppo 1.3.56, ed è stato temporaneamente ripristinato anche
140 durante lo sviluppo della serie 2.1.x, per poi tornare al comportamento
141 attuale fino ad oggi (per riferimento si veda
142 \href{http://lwn.net/Articles/293902}
143 {\texttt{http://lwn.net/Articles/293902}}).} è stato adottato un
144 comportamento che non segue più lo standard per cui l'\textit{hard link} viene
145 creato rispetto al link simbolico, e non al file cui questo punta.
147 La ragione di questa differenza rispetto allo standard, presente anche in
148 altri sistemi unix-like, sono dovute al fatto che un link simbolico può fare
149 riferimento anche ad un file non esistente o a una directory, per i quali
150 l'\textit{hard link} non può essere creato, per cui la scelta di seguire il
151 link simbolico è stata ritenuta una scelta scorretta nella progettazione
152 dell'interfaccia. Infatti se non ci fosse il comportamento adottato da Linux
153 sarebbe impossibile creare un \textit{hard link} ad un link simbolico, perché
154 la funzione lo risolverebbe e l'\textit{hard link} verrebbe creato verso la
155 destinazione. Invece evitando di seguire lo standard l'operazione diventa
156 possibile, ed anche il comportamento della funzione risulta molto più
157 comprensibile. Tanto più che se proprio se si vuole creare un \textit{hard
158 link} rispetto alla destinazione di un link simbolico è sempre possibile
159 farlo direttamente.\footnote{ciò non toglie che questo comportamento fuori
160 standard possa causare problemi, come nell'esempio descritto nell'articolo
161 citato nella nota precedente, a programmi che non si aspettano questa
162 differenza rispetto allo standard POSIX.}
164 La rimozione di un file (o più precisamente della voce che lo referenzia
165 all'interno di una directory) si effettua con la funzione \funcd{unlink}; il
166 suo prototipo è il seguente:
167 \begin{prototype}{unistd.h}{int unlink(const char *pathname)}
171 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
172 errore, nel qual caso il file non viene toccato. La variabile
173 \var{errno} viene impostata secondo i seguenti codici di errore:
175 \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una directory.
177 \item[\errcode{EROFS}] \param{pathname} è su un filesystem montato in sola
179 \item[\errcode{EISDIR}] \param{pathname} fa riferimento a una directory.
181 ed inoltre: \errval{EACCES}, \errval{EFAULT}, \errval{ENOENT},
182 \errval{ENOTDIR}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
186 \footnotetext{questo è un valore specifico ritornato da Linux che non consente
187 l'uso di \func{unlink} con le directory (vedi sez.~\ref{sec:file_remove}).
188 Non è conforme allo standard POSIX, che prescrive invece l'uso di
189 \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
190 abbia privilegi sufficienti.}
192 La funzione cancella il nome specificato da \param{pathname} nella relativa
193 directory e decrementa il numero di riferimenti nel relativo \itindex{inode}
194 \textit{inode}. Nel caso di link simbolico cancella il link simbolico; nel
195 caso di socket, fifo o file di dispositivo \index{file!di~dispositivo} rimuove
196 il nome, ma come per i file i processi che hanno aperto uno di questi oggetti
197 possono continuare ad utilizzarlo.
199 Per cancellare una voce in una directory è necessario avere il permesso di
200 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
201 il diritto di esecuzione sulla directory che la contiene (affronteremo in
202 dettaglio l'argomento dei permessi di file e directory in
203 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
204 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
205 occorrerà anche essere proprietari del file o proprietari della directory (o
206 root, per cui nessuna delle restrizioni è applicata).
208 Una delle caratteristiche di queste funzioni è che la creazione/rimozione del
209 nome dalla directory e l'incremento/decremento del numero di riferimenti
210 \itindex{inode} nell'\textit{inode} devono essere effettuati in maniera
211 atomica (si veda sez.~\ref{sec:proc_atom_oper}) senza possibili interruzioni
212 fra le due operazioni. Per questo entrambe queste funzioni sono realizzate
213 tramite una singola system call.
215 Si ricordi infine che un file non viene eliminato dal disco fintanto che tutti
216 i riferimenti ad esso sono stati cancellati: solo quando il \textit{link
217 count} mantenuto \itindex{inode} nell'\textit{inode} diventa zero lo spazio
218 occupato su disco viene rimosso (si ricordi comunque che a questo si aggiunge
219 sempre un'ulteriore condizione,\footnote{come vedremo in
220 cap.~\ref{cha:file_unix_interface} il kernel mantiene anche una tabella dei
221 file aperti nei vari processi, che a sua volta contiene i riferimenti agli
222 \itindex{inode} \textit{inode} ad essi relativi. Prima di procedere alla
223 cancellazione dello spazio occupato su disco dal contenuto di un file il
224 kernel controlla anche questa tabella, per verificare che anche in essa non
225 ci sia più nessun riferimento all'\textit{inode} in questione.} e cioè che
226 non ci siano processi che abbiano il suddetto file aperto).
228 Questa proprietà viene spesso usata per essere sicuri di non lasciare file
229 temporanei su disco in caso di crash dei programmi; la tecnica è quella di
230 aprire il file e chiamare \func{unlink} subito dopo, in questo modo il
231 contenuto del file è sempre disponibile all'interno del processo attraverso il
232 suo file descriptor (vedi sez.~\ref{sec:file_fd}) fintanto che il processo non
233 chiude il file, ma non ne resta traccia in nessuna directory, e lo spazio
234 occupato su disco viene immediatamente rilasciato alla conclusione del
235 processo (quando tutti i file vengono chiusi).
238 \subsection{Le funzioni \func{remove} e \func{rename}}
239 \label{sec:file_remove}
241 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
242 \func{unlink} sulle directory; per cancellare una directory si può usare la
243 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}), oppure la
244 funzione \funcd{remove}.
246 Questa è la funzione prevista dallo standard ANSI C per cancellare un file o
247 una directory (e funziona anche per i sistemi che non supportano i link
248 diretti). Per i file è identica a \func{unlink} e per le directory è identica
249 a \func{rmdir}; il suo prototipo è:
250 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
251 Cancella un nome dal filesystem.
253 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
254 errore, nel qual caso il file non viene toccato.
256 I codici di errore riportati in \var{errno} sono quelli della chiamata
257 utilizzata, pertanto si può fare riferimento a quanto illustrato nelle
258 descrizioni di \func{unlink} e \func{rmdir}.}
261 La funzione utilizza la funzione \func{unlink}\footnote{questo vale usando le
262 \acr{glibc}; nelle libc4 e nelle libc5 la funzione \func{remove} è un
263 semplice alias alla funzione \func{unlink} e quindi non può essere usata per
264 le directory.} per cancellare i file e la funzione \func{rmdir} per
265 cancellare le directory; si tenga presente che per alcune implementazioni del
266 protocollo NFS utilizzare questa funzione può comportare la scomparsa di file
269 Per cambiare nome ad un file o a una directory (che devono comunque essere
270 nello stesso filesystem) si usa invece la funzione \funcd{rename},\footnote{la
271 funzione è definita dallo standard ANSI C, ma si applica solo per i file, lo
272 standard POSIX estende la funzione anche alle directory.} il cui prototipo
274 \begin{prototype}{stdio.h}
275 {int rename(const char *oldpath, const char *newpath)}
279 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
280 errore, nel qual caso il file non viene toccato. La variabile
281 \var{errno} viene impostata secondo i seguenti codici di errore:
283 \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
284 \param{oldpath} non è una directory.
285 \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
287 \item[\errcode{ENOTEMPTY}] \param{newpath} è una directory già esistente e
289 \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
290 parte di qualche processo (come directory di lavoro o come radice) o del
291 sistema (come mount point).
292 \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
293 \param{oldpath} o più in generale si è cercato di creare una directory come
294 sotto-directory di se stessa.
295 \item[\errcode{ENOTDIR}] uno dei componenti dei \itindex{pathname}
296 \textit{pathname} non è una directory o \param{oldpath} è una directory e
297 \param{newpath} esiste e non è una directory.
299 ed inoltre \errval{EACCES}, \errval{EPERM}, \errval{EMLINK},
300 \errval{ENOENT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP} e
304 La funzione rinomina il file \param{oldpath} in \param{newpath}, eseguendo se
305 necessario lo spostamento di un file fra directory diverse. Eventuali altri
306 link diretti allo stesso file non vengono influenzati.
308 Il comportamento della funzione è diverso a seconda che si voglia rinominare
309 un file o una directory; se ci riferisce ad un file allora \param{newpath}, se
310 esiste, non deve essere una directory (altrimenti si ha l'errore
311 \errcode{EISDIR}). Nel caso \param{newpath} indichi un file esistente questo
312 viene cancellato e rimpiazzato (atomicamente).
314 Se \param{oldpath} è una directory allora \param{newpath}, se esiste, deve
315 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
316 (se non è una directory) o \errcode{ENOTEMPTY} (se non è vuota). Chiaramente
317 \param{newpath} non può contenere \param{oldpath} altrimenti si avrà un errore
320 Se \param{oldpath} si riferisce ad un link simbolico questo sarà rinominato; se
321 \param{newpath} è un link simbolico verrà cancellato come qualunque altro
322 file. Infine qualora \param{oldpath} e \param{newpath} siano due nomi dello
323 stesso file lo standard POSIX prevede che la funzione non dia errore, e non
324 faccia nulla, lasciando entrambi i nomi; Linux segue questo standard, anche
325 se, come fatto notare dal manuale delle \textit{glibc}, il comportamento più
326 ragionevole sarebbe quello di cancellare \param{oldpath}.
328 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
329 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
330 può esistere cioè nessun istante in cui un altro processo può trovare attivi
331 entrambi i nomi dello stesso file, o, in caso di sostituzione di un file
332 esistente, non trovare quest'ultimo prima che la sostituzione sia stata
335 In ogni caso se \param{newpath} esiste e l'operazione fallisce per un qualche
336 motivo (come un crash del kernel), \func{rename} garantisce di lasciare
337 presente un'istanza di \param{newpath}. Tuttavia nella sovrascrittura potrà
338 esistere una finestra in cui sia \param{oldpath} che \param{newpath} fanno
339 riferimento allo stesso file.
342 \subsection{I link simbolici}
343 \label{sec:file_symlink}
345 Come abbiamo visto in sez.~\ref{sec:file_link} la funzione \func{link} crea
346 riferimenti agli \itindex{inode} \textit{inode}, pertanto può funzionare
347 soltanto per file che risiedono sullo stesso filesystem e solo per un
348 filesystem di tipo Unix. Inoltre abbiamo visto che in Linux non è consentito
349 eseguire un link diretto ad una directory.
351 Per ovviare a queste limitazioni i sistemi Unix supportano un'altra forma di
352 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
353 come avviene in altri sistemi operativi, dei file speciali che contengono
354 semplicemente il riferimento ad un altro file (o directory). In questo modo è
355 possibile effettuare link anche attraverso filesystem diversi, a file posti in
356 filesystem che non supportano i link diretti, a delle directory, ed anche a
357 file che non esistono ancora.
359 Il sistema funziona in quanto i link simbolici sono riconosciuti come tali dal
360 kernel\footnote{è uno dei diversi tipi di file visti in
361 tab.~\ref{tab:file_file_types}, contrassegnato come tale
362 nell'\textit{inode}, e riconoscibile dal valore del campo \var{st\_mode}
363 della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).} per cui
364 alcune funzioni di libreria (come \func{open} o \func{stat}) quando ricevono
365 come argomento un link simbolico vengono automaticamente applicate al file da
366 esso specificato. La funzione che permette di creare un nuovo link simbolico
367 è \funcd{symlink}, ed il suo prototipo è:
368 \begin{prototype}{unistd.h}
369 {int symlink(const char *oldpath, const char *newpath)}
370 Crea un nuovo link simbolico di nome \param{newpath} il cui contenuto è
373 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
374 errore, nel qual caso la variabile \var{errno} assumerà i valori:
376 \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
377 supporta i link simbolici.
378 \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
379 \param{oldpath} è una stringa vuota.
380 \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
381 \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
384 ed inoltre \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
385 \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{ENOSPC} e
389 Si tenga presente che la funzione non effettua nessun controllo sull'esistenza
390 di un file di nome \param{oldpath}, ma si limita ad inserire quella stringa
391 nel link simbolico. Pertanto un link simbolico può anche riferirsi ad un file
392 che non esiste: in questo caso si ha quello che viene chiamato un
393 \textit{dangling link}, letteralmente un \textsl{link ciondolante}.
395 Come accennato i link simbolici sono risolti automaticamente dal kernel
396 all'invocazione delle varie system call; in tab.~\ref{tab:file_symb_effect} si
397 è riportato un elenco dei comportamenti delle varie funzioni di libreria che
398 operano sui file nei confronti della risoluzione dei link simbolici,
399 specificando quali seguono il link simbolico e quali invece possono operare
400 direttamente sul suo contenuto.
404 \begin{tabular}[c]{|l|c|c|}
406 \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
409 \func{access} & $\bullet$ & -- \\
410 \func{chdir} & $\bullet$ & -- \\
411 \func{chmod} & $\bullet$ & -- \\
412 \func{chown} & -- & $\bullet$ \\
413 \func{creat} & $\bullet$ & -- \\
414 \func{exec} & $\bullet$ & -- \\
415 \func{lchown} & $\bullet$ & -- \\
416 \func{link}\footnotemark & -- & $\bullet$ \\
417 \func{lstat} & -- & $\bullet$ \\
418 \func{mkdir} & $\bullet$ & -- \\
419 \func{mkfifo} & $\bullet$ & -- \\
420 \func{mknod} & $\bullet$ & -- \\
421 \func{open} & $\bullet$ & -- \\
422 \func{opendir} & $\bullet$ & -- \\
423 \func{pathconf} & $\bullet$ & -- \\
424 \func{readlink} & -- & $\bullet$ \\
425 \func{remove} & -- & $\bullet$ \\
426 \func{rename} & -- & $\bullet$ \\
427 \func{stat} & $\bullet$ & -- \\
428 \func{truncate} & $\bullet$ & -- \\
429 \func{unlink} & -- & $\bullet$ \\
432 \caption{Uso dei link simbolici da parte di alcune funzioni.}
433 \label{tab:file_symb_effect}
436 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
437 dallo standard POSIX, si veda quanto detto in sez.~\ref{sec:file_link}.}
439 Si noti che non si è specificato il comportamento delle funzioni che operano
440 con i file descriptor, in quanto la risoluzione del link simbolico viene in
441 genere effettuata dalla funzione che restituisce il file descriptor
442 (normalmente la \func{open}, vedi sez.~\ref{sec:file_open}) e tutte le
443 operazioni seguenti fanno riferimento solo a quest'ultimo.
445 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
446 \func{open} seguono i link simbolici, occorrono funzioni apposite per accedere
447 alle informazioni del link invece che a quelle del file a cui esso fa
448 riferimento. Quando si vuole leggere il contenuto di un link simbolico si usa
449 la funzione \funcd{readlink}, il cui prototipo è:
450 \begin{prototype}{unistd.h}
451 {int readlink(const char *path, char *buff, size\_t size)}
452 Legge il contenuto del link simbolico indicato da \param{path} nel buffer
453 \param{buff} di dimensione \param{size}.
455 \bodydesc{La funzione restituisce il numero di caratteri letti dentro
456 \param{buff} o -1 per un errore, nel qual caso la variabile
457 \var{errno} assumerà i valori:
459 \item[\errcode{EINVAL}] \param{path} non è un link simbolico o \param{size}
462 ed inoltre \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
463 \errval{EACCES}, \errval{ELOOP}, \errval{EIO}, \errval{EFAULT} e
467 La funzione apre il link simbolico, ne legge il contenuto, lo scrive nel
468 buffer, e lo richiude. Si tenga presente che la funzione non termina la
469 stringa con un carattere nullo e la tronca alla dimensione specificata da
470 \param{size} per evitare di sovrascrivere oltre le dimensioni del buffer.
474 \includegraphics[width=8.5cm]{img/link_loop}
475 \caption{Esempio di loop nel filesystem creato con un link simbolico.}
476 \label{fig:file_link_loop}
479 Un caso comune che si può avere con i link simbolici è la creazione dei
480 cosiddetti \textit{loop}. La situazione è illustrata in
481 fig.~\ref{fig:file_link_loop}, che riporta la struttura della directory
482 \file{/boot}. Come si vede si è creato al suo interno un link simbolico che
483 punta di nuovo a \file{/boot}.\footnote{il loop mostrato in
484 fig.~\ref{fig:file_link_loop} è un usato per poter permettere a \cmd{grub}
485 (un bootloader in grado di leggere direttamente da vari filesystem il file
486 da lanciare come sistema operativo) di vedere i file contenuti nella
487 directory \file{/boot} con lo stesso \textit{pathname} con cui verrebbero
488 visti dal sistema operativo, anche se essi si trovano, come accade spesso,
489 su una partizione separata (che \cmd{grub}, all'avvio, vede come radice).}
491 Questo può causare problemi per tutti quei programmi che effettuano la
492 scansione di una directory senza tener conto dei link simbolici, ad esempio se
493 lanciassimo un comando del tipo \code{grep -r linux *}, il loop nella
494 directory porterebbe il comando ad esaminare \file{/boot}, \file{/boot/boot},
495 \file{/boot/boot/boot} e così via.
497 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
498 un \itindex{pathname} \textit{pathname} possano essere seguiti un numero
499 limitato di link simbolici, il cui valore limite è specificato dalla costante
500 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
501 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}.
503 Un punto da tenere sempre presente è che, come abbiamo accennato, un link
504 simbolico può fare riferimento anche ad un file che non esiste; ad esempio
505 possiamo creare un file temporaneo nella nostra directory con un link del
508 $ ln -s /tmp/tmp_file temporaneo
510 anche se \file{/tmp/tmp\_file} non esiste. Questo può generare confusione, in
511 quanto aprendo in scrittura \file{temporaneo} verrà creato
512 \file{/tmp/tmp\_file} e scritto; ma accedendo in sola lettura a
513 \file{temporaneo}, ad esempio con \cmd{cat}, otterremmo:
516 cat: temporaneo: No such file or directory
518 con un errore che può sembrare sbagliato, dato che un'ispezione con \cmd{ls}
519 ci mostrerebbe invece l'esistenza di \file{temporaneo}.
522 \subsection{La creazione e la cancellazione delle directory}
523 \label{sec:file_dir_creat_rem}
525 Benché in sostanza le directory non siano altro che dei file contenenti
526 elenchi di nomi ed \itindex{inode} \textit{inode}, non è possibile trattarle
527 come file ordinari e devono essere create direttamente dal kernel attraverso
528 una opportuna system call.\footnote{questo è quello che permette anche,
529 attraverso l'uso del VFS, l'utilizzo di diversi formati per la gestione dei
530 suddetti elenchi.} La funzione usata per creare una directory è
531 \funcd{mkdir}, ed il suo prototipo è:
533 \headdecl{sys/stat.h}
534 \headdecl{sys/types.h}
535 \funcdecl{int mkdir(const char *dirname, mode\_t mode)}
537 Crea una nuova directory.
539 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
540 errore, nel qual caso \var{errno} assumerà i valori:
542 \item[\errcode{EEXIST}] un file (o una directory) con quel nome esiste di
544 \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
545 cui si vuole inserire la nuova directory.
546 \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
547 directory contiene troppi file; sotto Linux questo normalmente non avviene
548 perché il filesystem standard consente la creazione di un numero di file
549 maggiore di quelli che possono essere contenuti nel disco, ma potendo
550 avere a che fare anche con filesystem di altri sistemi questo errore può
552 \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
553 la nuova directory o si è esaurita la quota disco dell'utente.
555 ed inoltre anche \errval{EPERM}, \errval{EFAULT}, \errval{ENAMETOOLONG},
556 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
560 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
561 standard presenti in ogni directory (cioè ``\file{.}'' e ``\file{..}''), con
562 il nome indicato dall'argomento \param{dirname}. Il nome può essere indicato
563 sia come \itindex{pathname} \textit{pathname} assoluto che come
564 \itindex{pathname} \textit{pathname} relativo.
566 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
567 directory viene creata sono specificati dall'argomento \param{mode}, i cui
568 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
569 tenga presente che questi sono modificati dalla maschera di creazione dei file
570 (si veda sez.~\ref{sec:file_perm_management}). La titolarità della nuova
571 directory è impostata secondo quanto riportato in
572 sez.~\ref{sec:file_ownership_management}.
574 La funzione che permette la cancellazione di una directory è invece
575 \funcd{rmdir}, ed il suo prototipo è:
576 \begin{prototype}{sys/stat.h}{int rmdir(const char *dirname)}
577 Cancella una directory.
579 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
580 errore, nel qual caso \var{errno} assumerà i valori:
582 \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
583 directory, oppure la directory che contiene \param{dirname} ha lo
584 \itindex{sticky~bit} \textit{sticky bit} impostato e l'user-ID effettivo
585 del processo non corrisponde al proprietario della directory.
586 \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
587 che contiene la directory che si vuole cancellare, o non c'è il permesso
588 di attraversare (esecuzione) una delle directory specificate in
590 \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o la
591 radice di qualche processo.
592 \item[\errcode{ENOTEMPTY}] la directory non è vuota.
594 ed inoltre anche \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
595 \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{EROFS}.}
598 La funzione cancella la directory \param{dirname}, che deve essere vuota (la
599 directory deve cioè contenere soltanto le due voci standard ``\file{.}'' e
600 ``\file{..}''). Il nome può essere indicato con il \itindex{pathname}
601 \textit{pathname} assoluto o relativo.
603 La modalità con cui avviene la cancellazione è analoga a quella di
604 \func{unlink}: fintanto che il numero di link \itindex{inode}
605 all'\textit{inode} della directory non diventa nullo e nessun processo ha la
606 directory aperta lo spazio occupato su disco non viene rilasciato. Se un
607 processo ha la directory aperta la funzione rimuove il link \itindex{inode}
608 all'\textit{inode} e nel caso sia l'ultimo, pure le voci standard ``\file{.}''
609 e ``\file{..}'', a questo punto il kernel non consentirà di creare più nuovi
610 file nella directory.
613 \subsection{La creazione di file speciali}
614 \label{sec:file_mknod}
616 Finora abbiamo parlato esclusivamente di file, directory e link simbolici; in
617 sez.~\ref{sec:file_file_types} abbiamo visto però che il sistema prevede pure
618 degli altri tipi di file speciali, come i \index{file!di~dispositivo} file di
619 dispositivo, le fifo ed i socket (questi ultimi sono un caso a parte, essendo
620 associati anche alla comunicazione via rete, per cui ci saranno trattati in
621 dettaglio a partire da cap.~\ref{cha:socket_intro}).
623 La manipolazione delle caratteristiche di questi diversi tipi di file e la
624 loro cancellazione può essere effettuata con le stesse funzioni che operano
625 sui file regolari; ma quando li si devono creare sono necessarie delle
626 funzioni apposite. La prima di queste funzioni è \funcd{mknod}, il cui
629 \headdecl{sys/types.h}
630 \headdecl{sys/stat.h}
633 \funcdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)}
635 Crea un \textit{inode} del tipo specificato sul filesystem.
637 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
638 errore, nel qual caso \var{errno} assumerà i valori:
640 \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
641 l'\texttt{inode}, o il filesystem su cui si è cercato di
642 creare \param{pathname} non supporta l'operazione.
643 \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
644 fifo, un socket o un dispositivo.
645 \item[\errcode{EEXIST}] \param{pathname} esiste già o è un link simbolico.
647 ed inoltre anche \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
648 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
649 \errval{ENOSPC}, \errval{EROFS}.}
652 La funzione, come suggerisce il nome, permette di creare un ``\textsl{nodo}''
653 sul filesystem, e viene in genere utilizzata per creare i file di dispositivo,
654 ma si può usare anche per creare file regolari. L'argomento
655 \param{mode} specifica sia il tipo di file che si vuole creare che i relativi
656 permessi, secondo i valori riportati in tab.~\ref{tab:file_mode_flags}, che
657 vanno combinati con un OR binario. I permessi sono comunque modificati nella
658 maniera usuale dal valore di \itindex{umask} \textit{umask} (si veda
659 sez.~\ref{sec:file_perm_management}).
661 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
662 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
663 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
664 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
665 per una fifo;\footnote{con Linux la funzione non può essere usata per creare
666 directory o link simbolici, si dovranno usare le funzioni \func{mkdir} e
667 \func{symlink} a questo dedicate.} un valore diverso comporterà l'errore
670 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
671 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
672 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
673 valore verrà ignorato. Solo l'amministratore può creare un file di
674 dispositivo usando questa funzione (il processo deve avere la
675 \textit{capability} \const{CAP\_MKNOD}), ma in Linux\footnote{questo è un
676 comportamento specifico di Linux, la funzione non è prevista dallo standard
677 POSIX.1 originale, mentre è presente in SVr4 e 4.4BSD, ma esistono
678 differenze nei comportamenti e nei codici di errore, tanto che questa è
679 stata introdotta in POSIX.1-2001 con una nota che la definisce portabile
680 solo quando viene usata per creare delle fifo, ma comunque deprecata essendo
681 utilizzabile a tale scopo la specifica \func{mkfifo}.} l'uso per la
682 creazione di un file ordinario, di una fifo o di un socket è consentito anche
685 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
686 al proprietario e al gruppo del processo che li ha creati, a meno che non si
687 sia attivato il bit \acr{sgid} per la directory o sia stata attivata la
688 semantica BSD per il filesystem (si veda
689 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
690 \itindex{inode} l'\textit{inode}.
692 Nella creazione di un file di dispositivo occorre poi specificare
693 correttamente il valore di \param{dev}; questo infatti è di tipo
694 \type{dev\_t}, che è un tipo primitivo (vedi
695 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
696 \textsl{numero} di dispositivo; il kernel infatti identifica ciascun
697 dispositivo con un valore numerico. Originariamente questo era un intero a 16
698 bit diviso in due parti di 8 bit chiamate rispettivamente
699 \itindex{major~number} \textit{major number} e \itindex{minor~number}
700 \textit{minor number}, che sono poi i due numeri mostrati dal comando
701 \texttt{ls -l} al posto della dimensione quando lo si esegue su un file di
704 Il \itindex{major~number} \textit{major number} identifica una classe di
705 dispositivi (ad esempio la seriale, o i dischi IDE) e serve in sostanza per
706 indicare al kernel quale è il modulo che gestisce quella classe di
707 dispositivi; per identificare uno specifico dispositivo di quella classe (ad
708 esempio una singola porta seriale, o una partizione di un disco) si usa invece
709 il \itindex{minor~number} \textit{minor number}. L'elenco aggiornato di questi
710 numeri con le relative corrispondenze ai vari dispositivi può essere trovato
711 nel file \texttt{Documentation/devices.txt} allegato alla documentazione dei
714 Data la crescita nel numero di dispositivi supportati, ben presto il limite
715 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
716 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
717 \type{dev\_t}, con delle dimensioni passate a 12 bit per il
718 \itindex{major~number} \textit{major number} e 20 bit per il
719 \itindex{minor~number} \textit{minor number}. La transizione però ha anche
720 comportato il passaggio di \type{dev\_t} a tipo opaco, e la necessità di
721 specificare il numero tramite delle opportune macro, così da non avere
722 problemi di compatibilità con eventuali ulteriori estensioni.
724 Le macro sono definite nel file \file{sys/sysmacros.h}, che viene
725 automaticamente incluso quando si include \file{sys/types.h}; si possono
726 pertanto ottenere i valori del \itindex{major~number} \textit{major number} e
727 \itindex{minor~number} \textit{minor number} di un dispositivo rispettivamente
728 con le macro \macro{major} e \macro{minor}:
730 \headdecl{sys/types.h}
731 \funcdecl{int \macro{major}(dev\_t dev)}
732 Restituisce il \itindex{major~number} \textit{major number} del dispositivo
735 \funcdecl{int \macro{minor}(dev\_t dev)}
736 Restituisce il \itindex{minor~number} \textit{minor number} del dispositivo
739 \noindent mentre una volta che siano noti \itindex{major~number} \textit{major
740 number} e \itindex{minor~number} \textit{minor number} si potrà costruire il
741 relativo identificativo con la macro \macro{makedev}:
743 \headdecl{sys/types.h}
744 \funcdecl{dev\_t \macro{minor}(int major, int minor)}
746 Restituisce l'identificativo di un dispositivo dati \itindex{major~number}
747 \textit{major number} e \itindex{minor~number} \textit{minor number}.
750 Infine con lo standard POSIX.1-2001 è stata introdotta una funzione specifica
751 per creare una fifo (tratteremo le fifo in in sez.~\ref{sec:ipc_named_pipe});
752 la funzione è \funcd{mkfifo} ed il suo prototipo è:
754 \headdecl{sys/types.h} \headdecl{sys/stat.h}
756 \funcdecl{int mkfifo(const char *pathname, mode\_t mode)}
760 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
761 errore, nel qual caso \var{errno} assumerà i valori \errval{EACCES},
762 \errval{EEXIST}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC},
763 \errval{ENOTDIR} e \errval{EROFS}.}
766 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
767 per \func{mknod} il file \param{pathname} non deve esistere (neanche come link
768 simbolico); al solito i permessi specificati da \param{mode} vengono
769 modificati dal valore di \itindex{umask} \textit{umask}.
773 \subsection{Accesso alle directory}
774 \label{sec:file_dir_read}
776 Benché le directory alla fine non siano altro che dei file che contengono
777 delle liste di nomi ed \itindex{inode} \textit{inode}, per il ruolo che
778 rivestono nella struttura del sistema, non possono essere trattate come dei
779 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
780 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
781 può essere un processo a inserirvi direttamente delle voci con le usuali
782 funzioni di scrittura.
784 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
785 kernel, sono molte le situazioni in cui i processi necessitano di poterne
786 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
787 in sez.~\ref{sec:file_open} che è possibile aprire una directory come se fosse
788 un file, anche se solo in sola lettura) in generale il formato con cui esse
789 sono scritte può dipendere dal tipo di filesystem, tanto che, come riportato
790 in tab.~\ref{tab:file_file_operations}, il VFS del kernel prevede una apposita
791 funzione per la lettura delle directory.
793 Tutto questo si riflette nello standard POSIX\footnote{le funzioni sono
794 previste pure in BSD e SVID.} che ha introdotto una apposita interfaccia per
795 la lettura delle directory, basata sui cosiddetti \textit{directory stream}
796 (chiamati così per l'analogia con i file stream dell'interfaccia standard ANSI
797 C di cap.~\ref{cha:files_std_interface}). La prima funzione di questa
798 interfaccia è \funcd{opendir}, il cui prototipo è:
800 \headdecl{sys/types.h} \headdecl{dirent.h}
802 \funcdecl{DIR * opendir(const char *dirname)}
804 Apre un \textit{directory stream}.
806 \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
807 in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
808 assumerà i valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
809 \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}.}
812 La funzione apre un \textit{directory stream} per la directory
813 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
814 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
815 \textit{directory stream}) da usare per tutte le operazioni successive, la
816 funzione inoltre posiziona lo stream sulla prima voce contenuta nella
819 Dato che le directory sono comunque dei file, in alcuni casi può servire
820 conoscere il \textit{file descriptor} associato ad un \textit{directory
821 stream}, a questo scopo si può usare la funzione \funcd{dirfd}, il cui
824 \headdecl{sys/types.h} \headdecl{dirent.h}
826 \funcdecl{int dirfd(DIR * dir)}
828 Restituisce il file descriptor associato ad un \textit{directory stream}.
830 \bodydesc{La funzione restituisce il file descriptor (un valore positivo) in
831 caso di successo e -1 in caso di errore.}
834 La funzione\footnote{questa funzione è una estensione di BSD non presente in
835 POSIX, introdotta con BSD 4.3-Reno; è presente in Linux con le libc5 (a
836 partire dalla versione 5.1.2) e con le \acr{glibc}.} restituisce il file
837 descriptor associato al \textit{directory stream} \param{dir}, essa è
838 disponibile solo definendo \macro{\_BSD\_SOURCE} o \macro{\_SVID\_SOURCE}. Di
839 solito si utilizza questa funzione in abbinamento alla funzione \func{fchdir}
840 per cambiare la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}) a
841 quella relativa allo stream che si sta esaminando.
843 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
844 possibile associarvi un \textit{directory stream} con la funzione
845 \funcd{fopendir},\footnote{questa funzione è però disponibile solo a partire
846 dalla versione 2.4 delle \acr{glibc}, e pur essendo candidata per
847 l'inclusione nella successiva revisione dello standard POSIX.1-2001, non è
848 ancora presente in nessuna specifica formale.} il cui prototipo è:
850 \headdecl{sys/types.h}
853 \funcdecl{DIR * fopendir(int fd)}
855 Associa un \textit{directory stream} al file descriptor \param{fd}.
857 \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
858 in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
859 assumerà il valore \errval{EBADF}.}
862 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
863 stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
864 stato aperto in precedenza e la funzione darà un errore qualora questo non
865 corrisponda ad una directory. Una volta utilizzata il file descriptor verrà
866 usato dalle funzioni che operano sul \textit{directory stream} e non deve
867 essere più utilizzato direttamente all'interno del proprio programma.
869 Una volta che si sia aperto un \textit{directory stream} la lettura del
870 contenuto della directory viene effettuata attraverso la funzione
871 \funcd{readdir}, il suo prototipo è:
873 \headdecl{sys/types.h} \headdecl{dirent.h}
875 \funcdecl{struct dirent *readdir(DIR *dir)}
877 Legge una voce dal \textit{directory stream}.
879 \bodydesc{La funzione restituisce il puntatore alla struttura contenente i
880 dati in caso di successo e \val{NULL} altrimenti, in caso di descrittore
881 non valido \var{errno} assumerà il valore \errval{EBADF}, il valore
882 \val{NULL} viene restituito anche quando si raggiunge la fine dello
886 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
887 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
888 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
889 esaurite tutte le voci in essa presenti.
891 I dati vengono memorizzati in una struttura \struct{dirent} (la cui
892 definizione\footnote{la definizione è quella usata a Linux, che si trova nel
893 file \file{/usr/include/bits/dirent.h}, essa non contempla la presenza del
894 campo \var{d\_namlen} che indica la lunghezza del nome del file (ed infatti
895 la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN} non è definita).} è riportata in
896 fig.~\ref{fig:file_dirent_struct}). La funzione restituisce il puntatore alla
897 struttura; si tenga presente però che quest'ultima è allocata staticamente,
898 per cui viene sovrascritta tutte le volte che si ripete la lettura di una voce
899 sullo stesso \textit{directory stream}.
901 Di questa funzione esiste anche una versione \index{funzioni!rientranti}
902 rientrante, \func{readdir\_r}, che non usa una struttura allocata
903 staticamente, e può essere utilizzata anche con i \itindex{thread}
904 \textit{thread}, il suo prototipo è:
906 \headdecl{sys/types.h} \headdecl{dirent.h}
908 \funcdecl{int readdir\_r(DIR *dir, struct dirent *entry,
909 struct dirent **result)}
911 Legge una voce dal \textit{directory stream}.
913 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
914 errore, gli errori sono gli stessi di \func{readdir}.}
917 La funzione restituisce in \param{result} (come
918 \itindex{value~result~argument} \textit{value result argument}) l'indirizzo
919 dove sono stati salvati i dati, che di norma corrisponde a quello della
920 struttura precedentemente allocata e specificata dall'argomento \param{entry}
921 (anche se non è assicurato che la funzione usi lo spazio fornito dall'utente).
924 \footnotesize \centering
925 \begin{minipage}[c]{15cm}
926 \includestruct{listati/dirent.c}
929 \caption{La struttura \structd{dirent} per la lettura delle informazioni dei
931 \label{fig:file_dirent_struct}
934 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
935 presenti nella directory; sia BSD che SVr4\footnote{lo standard POSIX prevede
936 invece solo la presenza del campo \var{d\_fileno}, identico \var{d\_ino},
937 che in Linux è definito come alias di quest'ultimo. Il campo \var{d\_name} è
938 considerato dipendente dall'implementazione.} prevedono che siano sempre
939 presenti il campo \var{d\_name}, che contiene il nome del file nella forma di
940 una stringa terminata da uno zero,\footnote{lo standard POSIX non specifica
941 una lunghezza, ma solo un limite \const{NAME\_MAX}; in SVr4 la lunghezza del
942 campo è definita come \code{NAME\_MAX+1} che di norma porta al valore di 256
943 byte usato anche in Linux.} ed il campo \var{d\_ino}, che contiene il numero
944 di \itindex{inode} \textit{inode} cui il file è associato (di solito
945 corrisponde al campo \var{st\_ino} di \struct{stat}).
947 La presenza di ulteriori campi opzionali è segnalata dalla definizione di
948 altrettante macro nella forma \code{\_DIRENT\_HAVE\_D\_XXX} dove \code{XXX} è
949 il nome del relativo campo; nel nostro caso sono definite le macro
950 \macro{\_DIRENT\_HAVE\_D\_TYPE}, \macro{\_DIRENT\_HAVE\_D\_OFF} e
951 \macro{\_DIRENT\_HAVE\_D\_RECLEN}.
956 \begin{tabular}[c]{|l|l|}
958 \textbf{Valore} & \textbf{Tipo di file} \\
961 \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
962 \const{DT\_REG} & File normale.\\
963 \const{DT\_DIR} & Directory.\\
964 \const{DT\_FIFO} & Fifo.\\
965 \const{DT\_SOCK} & Socket.\\
966 \const{DT\_CHR} & Dispositivo a caratteri.\\
967 \const{DT\_BLK} & Dispositivo a blocchi.\\
970 \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
971 della struttura \struct{dirent}.}
972 \label{tab:file_dtype_macro}
975 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
976 indica il tipo di file (fifo, directory, link simbolico, ecc.). I suoi
977 possibili valori\footnote{fino alla versione 2.1 delle \acr{glibc} questo
978 campo, pur presente nella struttura, non era implementato, e resta sempre al
979 valore \const{DT\_UNKNOWN}.} sono riportati in
980 tab.~\ref{tab:file_dtype_macro}; per la conversione da e verso l'analogo
981 valore mantenuto dentro il campo \var{st\_mode} di \struct{stat} sono definite
982 anche due macro di conversione \macro{IFTODT} e \macro{DTTOIF}:
984 \funcdecl{int IFTODT(mode\_t MODE)} Converte il tipo di file dal formato di
985 \var{st\_mode} a quello di \var{d\_type}.
987 \funcdecl{mode\_t DTTOIF(int DTYPE)} Converte il tipo di file dal formato di
988 \var{d\_type} a quello di \var{st\_mode}.
991 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
992 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
993 letta. Con questi due campi diventa possibile, determinando la posizione delle
994 varie voci, spostarsi all'interno dello stream usando la funzione
995 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
996 estensioni prese da BSD, non previste dallo standard POSIX.} il cui
998 \begin{prototype}{dirent.h}{void seekdir(DIR *dir, off\_t offset)}
999 Cambia la posizione all'interno di un \textit{directory stream}.
1002 La funzione non ritorna nulla e non segnala errori, è però necessario che il
1003 valore dell'argomento \param{offset} sia valido per lo stream \param{dir};
1004 esso pertanto deve essere stato ottenuto o dal valore di \var{d\_off} di
1005 \struct{dirent} o dal valore restituito dalla funzione \funcd{telldir}, che
1006 legge la posizione corrente; il prototipo di quest'ultima è:
1007 \begin{prototype}{dirent.h}{off\_t telldir(DIR *dir)}
1008 Ritorna la posizione corrente in un \textit{directory stream}.
1010 \bodydesc{La funzione restituisce la posizione corrente nello stream (un
1011 numero positivo) in caso di successo, e -1 altrimenti, nel qual caso
1012 \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
1013 valore errato per \param{dir}.}
1016 La sola funzione di posizionamento nello stream prevista dallo standard POSIX
1017 è \funcd{rewinddir}, che riporta la posizione a quella iniziale; il suo
1020 \headdecl{sys/types.h} \headdecl{dirent.h}
1022 \funcdecl{void rewinddir(DIR *dir)}
1024 Si posiziona all'inizio di un \textit{directory stream}.
1028 Una volta completate le operazioni si può chiudere il \textit{directory
1029 stream} con la funzione \funcd{closedir}, il cui prototipo è:
1031 \headdecl{sys/types.h} \headdecl{dirent.h}
1033 \funcdecl{int closedir(DIR * dir)}
1035 Chiude un \textit{directory stream}.
1037 \bodydesc{La funzione restituisce 0 in caso di successo e -1 altrimenti, nel
1038 qual caso \var{errno} assume il valore \errval{EBADF}.}
1041 A parte queste funzioni di base in BSD 4.3 è stata introdotta un'altra
1042 funzione che permette di eseguire una scansione completa (con tanto di ricerca
1043 ed ordinamento) del contenuto di una directory; la funzione è
1044 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
1045 \acr{libc4}.} ed il suo prototipo è:
1046 \begin{prototype}{dirent.h}{int scandir(const char *dir,
1047 struct dirent ***namelist, int(*filter)(const struct dirent *),
1048 int(*compar)(const struct dirent **, const struct dirent **))}
1050 Esegue una scansione di un \textit{directory stream}.
1052 \bodydesc{La funzione restituisce in caso di successo il numero di voci
1053 trovate, e -1 altrimenti.}
1056 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
1057 prototipo non è molto comprensibile; queste funzioni però sono quelle che
1058 controllano rispettivamente la selezione di una voce (quella passata con
1059 l'argomento \param{filter}) e l'ordinamento di tutte le voci selezionate
1060 (quella specificata dell'argomento \param{compar}).
1062 La funzione legge tutte le voci della directory indicata dall'argomento
1063 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
1064 \struct{dirent}) come argomento della funzione di selezione specificata da
1065 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
1066 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
1067 Qualora si specifichi un valore \val{NULL} per l'argomento \func{filter} non
1068 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
1070 Le voci selezionate possono essere riordinate tramite \func{qsort}, le modalità
1071 del riordinamento possono essere personalizzate usando la funzione
1072 \param{compar} come criterio di ordinamento di \func{qsort}, la funzione
1073 prende come argomenti le due strutture \struct{dirent} da confrontare
1074 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
1075 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
1076 \struct{dirent} viene restituito nell'argomento
1077 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
1078 restituisce, come \itindex{value~result~argument} \textit{value result
1079 argument}, l'indirizzo della stessa; questo significa che \param{namelist}
1080 deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
1081 si deve passare il suo indirizzo.}
1083 Per l'ordinamento, vale a dire come valori possibili per l'argomento
1084 \param{compar} sono disponibili due funzioni predefinite, \funcd{alphasort} e
1085 \funcd{versionsort}, i cui prototipi sono:
1089 \funcdecl{int alphasort(const void *a, const void *b)}
1091 \funcdecl{int versionsort(const void *a, const void *b)}
1093 Funzioni per l'ordinamento delle voci di \textit{directory stream}.
1095 \bodydesc{Le funzioni restituiscono un valore minore, uguale o maggiore di
1096 zero qualora il primo argomento sia rispettivamente minore, uguale o
1097 maggiore del secondo.}
1100 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
1101 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
1102 argomenti dei puntatori a delle strutture \struct{dirent}; le glibc usano il
1103 prototipo originario di BSD, mostrato anche nella definizione, che prevede
1104 puntatori a \ctyp{void}.} e deve essere specificata come argomento
1105 \param{compar} per ottenere un ordinamento alfabetico (secondo il valore del
1106 campo \var{d\_name} delle varie voci). Le \acr{glibc} prevedono come
1107 estensione\footnote{le glibc, a partire dalla versione 2.1, effettuano anche
1108 l'ordinamento alfabetico tenendo conto delle varie localizzazioni, usando
1109 \func{strcoll} al posto di \func{strcmp}.} anche \func{versionsort}, che
1110 ordina i nomi tenendo conto del numero di versione (cioè qualcosa per cui
1111 \texttt{file10} viene comunque dopo \texttt{file4}.)
1113 Un semplice esempio dell'uso di queste funzioni è riportato in
1114 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
1115 programma che, usando la funzione di scansione illustrata in
1116 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
1117 e la relativa dimensione (in sostanza una versione semplificata del comando
1120 \begin{figure}[!htb]
1121 \footnotesize \centering
1122 \begin{minipage}[c]{15.6cm}
1123 \includecodesample{listati/my_ls.c}
1125 \caption{Esempio di codice per eseguire la lista dei file contenuti in una
1127 \label{fig:file_my_ls}
1130 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
1131 la parte di gestione delle opzioni (che prevede solo l'uso di una funzione per
1132 la stampa della sintassi, anch'essa omessa) ma il codice completo potrà essere
1133 trovato coi sorgenti allegati nel file \file{myls.c}.
1135 In sostanza tutto quello che fa il programma, dopo aver controllato
1136 (\texttt{\small 10--13}) di avere almeno un argomento (che indicherà la
1137 directory da esaminare) è chiamare (\texttt{\small 14}) la funzione
1138 \func{DirScan} per eseguire la scansione, usando la funzione \code{do\_ls}
1139 (\texttt{\small 20--26}) per fare tutto il lavoro.
1141 Quest'ultima si limita (\texttt{\small 23}) a chiamare \func{stat} sul file
1142 indicato dalla directory entry passata come argomento (il cui nome è appunto
1143 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
1144 dati ad esso relativi, per poi provvedere (\texttt{\small 24}) a stampare il
1145 nome del file e la dimensione riportata in \var{data}.
1147 Dato che la funzione verrà chiamata all'interno di \func{DirScan} per ogni
1148 voce presente questo è sufficiente a stampare la lista completa dei file e
1149 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
1150 valore di ritorno per indicare una esecuzione senza errori.
1152 \begin{figure}[!htb]
1153 \footnotesize \centering
1154 \begin{minipage}[c]{15.6cm}
1155 \includecodesample{listati/DirScan.c}
1157 \caption{Codice della funzione di scansione di una directory contenuta nel
1158 file \file{DirScan.c}.}
1159 \label{fig:file_dirscan}
1162 Tutto il grosso del lavoro è svolto dalla funzione \func{DirScan}, riportata
1163 in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e permette
1164 di eseguire una funzione, passata come secondo argomento, su tutte le voci di
1165 una directory. La funzione inizia con l'aprire (\texttt{\small 19--23}) uno
1166 stream sulla directory passata come primo argomento, stampando un messaggio in
1169 Il passo successivo (\texttt{\small 24--25}) è cambiare directory di lavoro
1170 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzione
1171 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
1172 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
1173 (\texttt{\small 27--31}) sulle singole voci dello stream ci si trovi
1174 all'interno della directory.\footnote{questo è essenziale al funzionamento
1175 della funzione \code{do\_ls} (e ad ogni funzione che debba usare il campo
1176 \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
1177 struttura \struct{dirent} sono sempre relativi alla directory in questione,
1178 e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
1179 ottenere le dimensioni.}
1181 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
1182 alla funzione passata come secondo argomento, il ciclo di scansione della
1183 directory è molto semplice; si legge una voce alla volta (\texttt{\small 27})
1184 all'interno di una istruzione di \code{while} e fintanto che si riceve una
1185 voce valida (cioè un puntatore diverso da \val{NULL}) si esegue
1186 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
1187 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
1188 28}) qualora questa presenti una anomalia (identificata da un codice di
1189 ritorno negativo). Una volta terminato il ciclo la funzione si conclude con la
1190 chiusura (\texttt{\small 32}) dello stream\footnote{nel nostro caso, uscendo
1191 subito dopo la chiamata, questo non servirebbe, in generale però
1192 l'operazione è necessaria, dato che la funzione può essere invocata molte
1193 volte all'interno dello stesso processo, per cui non chiudere i
1194 \textit{directory stream} comporterebbe un consumo progressivo di risorse,
1195 con conseguente rischio di esaurimento delle stesse.} e la restituzione
1196 (\texttt{\small 33}) del codice di operazioni concluse con successo.
1199 \subsection{La directory di lavoro}
1200 \label{sec:file_work_dir}
1204 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
1205 directory nel filesystem,\footnote{questa viene mantenuta all'interno dei dati
1206 della sua \struct{task\_struct} (vedi fig.~\ref{fig:proc_task_struct}), più
1207 precisamente nel campo \texttt{pwd} della sotto-struttura
1208 \struct{fs\_struct}.} che è chiamata \textsl{directory corrente} o
1209 \textsl{directory di lavoro} (in inglese \textit{current working directory}).
1210 La directory di lavoro è quella da cui si parte quando un
1211 \itindsub{pathname}{relativo} \textit{pathname} è espresso in forma relativa,
1212 dove il ``\textsl{relativa}'' fa riferimento appunto a questa directory.
1214 Quando un utente effettua il login, questa directory viene impostata alla
1215 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
1216 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
1217 comando \cmd{pwd} la stampa sul terminale. Siccome la directory corrente
1218 resta la stessa quando viene creato un processo figlio (vedi
1219 sez.~\ref{sec:proc_fork}), la directory corrente della shell diventa anche la
1220 directory corrente di qualunque comando da essa lanciato.
1222 Dato che è il kernel che tiene traccia per ciascun processo \itindex{inode}
1223 dell'\textit{inode} della directory di lavoro, per ottenerne il
1224 \textit{pathname} occorre usare una apposita funzione di libreria,
1225 \funcd{getcwd},\footnote{con Linux \func{getcwd} è una \textit{system call}
1226 dalla versione 2.1.9, in precedenza il valore doveva essere ottenuto tramite
1227 il filesystem \texttt{/proc} da \procfile{/proc/self/cwd}.} il cui prototipo
1229 \begin{prototype}{unistd.h}{char *getcwd(char *buffer, size\_t size)}
1230 Legge il \textit{pathname} della directory di lavoro corrente.
1232 \bodydesc{La funzione restituisce il puntatore \param{buffer} se riesce,
1233 \val{NULL} se fallisce, in quest'ultimo caso la variabile
1234 \var{errno} è impostata con i seguenti codici di errore:
1236 \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
1238 \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
1239 lunghezza del \textit{pathname}.
1240 \item[\errcode{EACCES}] manca il permesso di lettura o di ricerca su uno dei
1241 componenti del \textit{pathname} (cioè su una delle directory superiori
1243 \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata.
1247 La funzione restituisce il \textit{pathname} completo della directory di
1248 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
1249 precedentemente allocata, per una dimensione massima di \param{size}. Il
1250 buffer deve essere sufficientemente largo da poter contenere il
1251 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
1252 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
1255 Si può anche specificare un puntatore nullo come
1256 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
1257 supportata da Linux e dalla \acr{glibc}.} nel qual caso la stringa sarà
1258 allocata automaticamente per una dimensione pari a \param{size} qualora questa
1259 sia diversa da zero, o della lunghezza esatta del \textit{pathname}
1260 altrimenti. In questo caso ci si deve ricordare di disallocare la stringa una
1261 volta cessato il suo utilizzo.
1263 Di questa funzione esiste una versione \code{char *getwd(char *buffer)} fatta
1264 per compatibilità all'indietro con BSD, che non consente di specificare la
1265 dimensione del buffer; esso deve essere allocato in precedenza ed avere una
1266 dimensione superiore a \const{PATH\_MAX} (di solito 256 byte, vedi
1267 sez.~\ref{sec:sys_limits}); il problema è che in Linux non esiste una
1268 dimensione superiore per un \textit{pathname}, per cui non è detto che il
1269 buffer sia sufficiente a contenere il nome del file, e questa è la ragione
1270 principale per cui questa funzione è deprecata.
1272 Un uso comune di \func{getcwd} è quello di salvare la directory di lavoro
1273 iniziale per poi potervi tornare in un tempo successivo, un metodo alternativo
1274 più veloce, se non si è a corto di file descriptor, è invece quello di aprire
1275 la directory corrente (vale a dire ``\texttt{.}'') e tornarvi in seguito con
1278 Una seconda usata per ottenere la directory di lavoro è \code{char
1279 *get\_current\_dir\_name(void)} che è sostanzialmente equivalente ad una
1280 \code{getcwd(NULL, 0)}, con la sola differenza che essa ritorna il valore
1281 della variabile di ambiente \val{PWD}, che essendo costruita dalla shell può
1282 contenere un \textit{pathname} comprendente anche dei link simbolici. Usando
1283 \func{getcwd} infatti, essendo il \textit{pathname} ricavato risalendo
1284 all'indietro l'albero della directory, si perderebbe traccia di ogni passaggio
1285 attraverso eventuali link simbolici.
1287 Per cambiare la directory di lavoro si può usare la funzione \funcd{chdir}
1288 (equivalente del comando di shell \cmd{cd}) il cui nome sta appunto per
1289 \textit{change directory}, il suo prototipo è:
1290 \begin{prototype}{unistd.h}{int chdir(const char *pathname)}
1291 Cambia la directory di lavoro in \param{pathname}.
1293 \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
1294 nel qual caso \var{errno} assumerà i valori:
1296 \item[\errcode{ENOTDIR}] non si è specificata una directory.
1297 \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
1300 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1301 \errval{ENOMEM}, \errval{ELOOP} e \errval{EIO}.}
1303 \noindent ed ovviamente \param{pathname} deve indicare una directory per la
1304 quale si hanno i permessi di accesso.
1306 Dato che anche le directory sono file, è possibile riferirsi ad esse anche
1307 tramite il file descriptor, e non solo tramite il \textit{pathname}, per fare
1308 questo si usa \funcd{fchdir}, il cui prototipo è:
1309 \begin{prototype}{unistd.h}{int fchdir(int fd)}
1310 Identica a \func{chdir}, ma usa il file descriptor \param{fd} invece del
1313 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1314 errore, in caso di errore \var{errno} assumerà i valori \errval{EBADF} o
1317 \noindent anche in questo caso \param{fd} deve essere un file descriptor
1318 valido che fa riferimento ad una directory. Inoltre l'unico errore di accesso
1319 possibile (tutti gli altri sarebbero occorsi all'apertura di \param{fd}), è
1320 quello in cui il processo non ha il permesso di accesso alla directory
1321 specificata da \param{fd}.
1327 \subsection{I file temporanei}
1328 \label{sec:file_temp_file}
1330 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
1331 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
1332 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
1333 creare il file dopo aver controllato che questo non esista, nel momento fra il
1334 controllo e la creazione si ha giusto lo spazio per una possibile
1335 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
1336 sez.~\ref{sec:proc_race_cond}).
1338 Le \acr{glibc} provvedono varie funzioni per generare nomi di file temporanei,
1339 di cui si abbia certezza di unicità (al momento della generazione); la prima
1340 di queste funzioni è \funcd{tmpnam} il cui prototipo è:
1341 \begin{prototype}{stdio.h}{char *tmpnam(char *string)}
1342 Restituisce il puntatore ad una stringa contente un nome di file valido e
1343 non esistente al momento dell'invocazione.
1345 \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1346 \val{NULL} in caso di fallimento. Non sono definiti errori.}
1348 \noindent se si è passato un puntatore \param{string} non nullo questo deve
1349 essere di dimensione \const{L\_tmpnam} (costante definita in \file{stdio.h},
1350 come \const{P\_tmpdir} e \const{TMP\_MAX}) ed il nome generato vi verrà
1351 copiato automaticamente; altrimenti il nome sarà generato in un buffer statico
1352 interno che verrà sovrascritto ad una chiamata successiva. Successive
1353 invocazioni della funzione continueranno a restituire nomi unici fino ad un
1354 massimo di \const{TMP\_MAX} volte. Al nome viene automaticamente aggiunto come
1355 prefisso la directory specificata da \const{P\_tmpdir}.
1357 Di questa funzione esiste una versione \index{funzioni!rientranti} rientrante,
1358 \func{tmpnam\_r}, che non fa nulla quando si passa \val{NULL} come argomento.
1359 Una funzione simile, \funcd{tempnam}, permette di specificare un prefisso per
1360 il file esplicitamente, il suo prototipo è:
1361 \begin{prototype}{stdio.h}{char *tempnam(const char *dir, const char *pfx)}
1362 Restituisce il puntatore ad una stringa contente un nome di file valido e
1363 non esistente al momento dell'invocazione.
1365 \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1366 \val{NULL} in caso di fallimento, \var{errno} viene impostata a
1367 \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
1370 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
1371 per cui è sempre \index{funzioni!rientranti} rientrante, occorre però
1372 ricordarsi di disallocare con \code{free} il puntatore che restituisce.
1373 L'argomento \param{pfx} specifica un prefisso di massimo 5 caratteri per il
1374 nome provvisorio. La funzione assegna come directory per il file temporaneo
1375 (verificando che esista e sia accessibili), la prima valida delle seguenti:
1377 \item La variabile di ambiente \const{TMPDIR} (non ha effetto se non è
1378 definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
1379 \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}).
1380 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}).
1381 \item Il valore della costante \const{P\_tmpdir}.
1382 \item la directory \file{/tmp}.
1385 In ogni caso, anche se la generazione del nome è casuale, ed è molto difficile
1386 ottenere un nome duplicato, nulla assicura che un altro processo non possa
1387 avere creato, fra l'ottenimento del nome e l'apertura del file, un altro file
1388 con lo stesso nome; per questo motivo quando si usa il nome ottenuto da una di
1389 queste funzioni occorre sempre aprire il nuovo file in modalità di esclusione
1390 (cioè con l'opzione \const{O\_EXCL} per i file descriptor o con il flag
1391 \code{x} per gli stream) che fa fallire l'apertura in caso il file sia già
1394 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
1395 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
1396 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
1397 \begin{prototype}{stdio.h}{FILE *tmpfile (void)}
1398 Restituisce un file temporaneo aperto in lettura/scrittura.
1400 \bodydesc{La funzione ritorna il puntatore allo stream associato al file
1401 temporaneo in caso di successo e \val{NULL} in caso di errore, nel qual
1402 caso \var{errno} assumerà i valori:
1404 \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
1405 \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
1407 ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
1408 \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES}.}
1411 La funzione restituisce direttamente uno stream già aperto (in modalità
1412 \code{r+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso, che viene
1413 automaticamente cancellato alla sua chiusura o all'uscita dal programma. Lo
1414 standard non specifica in quale directory verrà aperto il file, ma le
1415 \acr{glibc} prima tentano con \const{P\_tmpdir} e poi con \file{/tmp}. Questa
1416 funzione è \index{funzioni!rientranti} rientrante e non soffre di problemi di
1417 \itindex{race~condition} \textit{race condition}.
1419 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
1420 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
1421 modificano una stringa di input che serve da modello e che deve essere
1422 conclusa da 6 caratteri \code{X} che verranno sostituiti da un codice
1423 unico. La prima delle due è analoga a \func{tmpnam} e genera un nome casuale,
1425 \begin{prototype}{stlib.h}{char *mktemp(char *template)}
1426 Genera un filename univoco sostituendo le \code{XXXXXX} finali di
1429 \bodydesc{La funzione ritorna il puntatore \param{template} in caso di
1430 successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1433 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1436 \noindent dato che \param{template} deve poter essere modificata dalla
1437 funzione non si può usare una stringa costante. Tutte le avvertenze riguardo
1438 alle possibili \itindex{race~condition} \textit{race condition} date per
1439 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
1440 il valore usato per sostituire le \code{XXXXXX} viene formato con il \acr{pid}
1441 del processo più una lettera, il che mette a disposizione solo 26 possibilità
1442 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
1443 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
1446 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
1447 \func{tmpfile}, ma restituisce un file descriptor invece di uno stream; il suo
1449 \begin{prototype}{stlib.h}{int mkstemp(char *template)}
1450 Genera un file temporaneo con un nome ottenuto sostituendo le \code{XXXXXX}
1451 finali di \param{template}.
1453 \bodydesc{La funzione ritorna il file descriptor in caso successo e
1454 -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
1456 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1457 \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
1458 contenuto di \param{template} è indefinito.
1461 \noindent come per \func{mktemp} anche in questo caso \param{template} non può
1462 essere una stringa costante. La funzione apre un file in lettura/scrittura con
1463 la funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
1464 sez.~\ref{sec:file_open}), in questo modo al ritorno della funzione si ha la
1465 certezza di essere i soli utenti del file. I permessi sono impostati al valore
1466 \code{0600}\footnote{questo è vero a partire dalle \acr{glibc} 2.0.7, le
1467 versioni precedenti delle \acr{glibc} e le vecchie \acr{libc5} e \acr{libc4}
1468 usavano il valore \code{0666} che permetteva a chiunque di leggere i
1469 contenuti del file.} (si veda sez.~\ref{sec:file_perm_overview}).
1471 In OpenBSD è stata introdotta un'altra funzione\footnote{introdotta anche in
1472 Linux a partire dalle \acr{glibc} 2.1.91.} simile alle precedenti,
1473 \funcd{mkdtemp}, che crea una directory temporanea; il suo prototipo è:
1474 \begin{prototype}{stlib.h}{char *mkdtemp(char *template)}
1475 Genera una directory temporaneo il cui nome è ottenuto sostituendo le
1476 \code{XXXXXX} finali di \param{template}.
1478 \bodydesc{La funzione ritorna il puntatore al nome della directory in caso
1479 successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1482 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1484 più gli altri eventuali codici di errore di \func{mkdir}.}
1486 \noindent la directory è creata con permessi \code{0700} (al solito si veda
1487 cap.~\ref{cha:file_unix_interface} per i dettagli); dato che la creazione
1488 della directory è sempre esclusiva i precedenti problemi di
1489 \itindex{race~condition} \textit{race condition} non si pongono.
1492 \section{La manipolazione delle caratteristiche dei file}
1493 \label{sec:file_infos}
1495 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
1496 relative alle caratteristiche di ciascun file, a partire dalle informazioni
1497 relative al controllo di accesso, sono mantenute \itindex{inode}
1498 nell'\textit{inode}.
1500 Vedremo in questa sezione come sia possibile leggere tutte queste informazioni
1501 usando la funzione \func{stat}, che permette l'accesso a tutti i dati
1502 memorizzati \itindex{inode} nell'\textit{inode}; esamineremo poi le varie
1503 funzioni usate per manipolare tutte queste informazioni (eccetto quelle che
1504 riguardano la gestione del controllo di accesso, trattate in in
1505 sez.~\ref{sec:file_access_control}).
1508 \subsection{La lettura delle caratteristiche dei file}
1509 \label{sec:file_stat}
1511 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
1512 delle funzioni \func{stat} (\funcd{stat}, \funcd{fstat} e \funcd{lstat});
1513 questa è la funzione che ad esempio usa il comando \cmd{ls} per poter ottenere
1514 e mostrare tutti i dati relativi ad un file. I prototipi di queste funzioni
1517 \headdecl{sys/types.h}
1518 \headdecl{sys/stat.h}
1521 \funcdecl{int stat(const char *file\_name, struct stat *buf)} Legge le
1522 informazione del file specificato da \param{file\_name} e le inserisce in
1525 \funcdecl{int lstat(const char *file\_name, struct stat *buf)} Identica a
1526 \func{stat} eccetto che se il \param{file\_name} è un link simbolico vengono
1527 lette le informazioni relative ad esso e non al file a cui fa riferimento.
1529 \funcdecl{int fstat(int filedes, struct stat *buf)} Identica a \func{stat}
1530 eccetto che si usa con un file aperto, specificato tramite il suo file
1531 descriptor \param{filedes}.
1533 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
1534 errore, nel qual caso \var{errno} assumerà uno dei valori: \errval{EBADF},
1535 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ELOOP}, \errval{EFAULT},
1536 \errval{EACCES}, \errval{ENOMEM}, \errval{ENAMETOOLONG}.}
1538 \noindent il loro comportamento è identico, solo che operano rispettivamente
1539 su un file, su un link simbolico e su un file descriptor.
1541 La struttura \struct{stat} usata da queste funzioni è definita nell'header
1542 \file{sys/stat.h} e in generale dipende dall'implementazione; la versione
1543 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
1544 riportata dalla pagina di manuale di \func{stat} (in realtà la definizione
1545 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
1546 riservati per estensioni come tempi più precisi, o per il padding dei campi).
1548 \begin{figure}[!htb]
1551 \begin{minipage}[c]{15cm}
1552 \includestruct{listati/stat.h}
1555 \caption{La struttura \structd{stat} per la lettura delle informazioni dei
1557 \label{fig:file_stat_struct}
1560 Si noti come i vari membri della struttura siano specificati come tipi
1561 primitivi del sistema (di quelli definiti in
1562 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \file{sys/types.h}).
1564 % TODO: aggiornare con i cambiamenti ai tempi fatti con il 2.6
1566 \subsection{I tipi di file}
1567 \label{sec:file_types}
1569 Come riportato in tab.~\ref{tab:file_file_types} in Linux oltre ai file e alle
1570 directory esistono altri oggetti che possono stare su un filesystem. Il tipo
1571 di file è ritornato dalla funzione \func{stat} come maschera binaria nel campo
1572 \var{st\_mode} (che contiene anche le informazioni relative ai permessi) di
1573 una struttura \struct{stat}.
1575 Dato che il valore numerico può variare a seconda delle implementazioni, lo
1576 standard POSIX definisce un insieme di macro per verificare il tipo di file,
1577 queste vengono usate anche da Linux che supporta pure le estensioni allo
1578 standard per i link simbolici e i socket definite da BSD; l'elenco completo
1579 delle macro con cui è possibile estrarre l'informazione da \var{st\_mode} è
1580 riportato in tab.~\ref{tab:file_type_macro}.
1584 \begin{tabular}[c]{|l|l|}
1586 \textbf{Macro} & \textbf{Tipo del file} \\
1589 \macro{S\_ISREG(m)} & file normale.\\
1590 \macro{S\_ISDIR(m)} & directory.\\
1591 \macro{S\_ISCHR(m)} & dispositivo a caratteri.\\
1592 \macro{S\_ISBLK(m)} & dispositivo a blocchi.\\
1593 \macro{S\_ISFIFO(m)} & fifo.\\
1594 \macro{S\_ISLNK(m)} & link simbolico.\\
1595 \macro{S\_ISSOCK(m)} & socket.\\
1598 \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h}).}
1599 \label{tab:file_type_macro}
1602 Oltre alle macro di tab.~\ref{tab:file_type_macro} è possibile usare
1603 direttamente il valore di \var{st\_mode} per ricavare il tipo di file
1604 controllando direttamente i vari bit in esso memorizzati. Per questo sempre in
1605 \file{sys/stat.h} sono definite le costanti numeriche riportate in
1606 tab.~\ref{tab:file_mode_flags}.
1608 Il primo valore dell'elenco di tab.~\ref{tab:file_mode_flags} è la maschera
1609 binaria che permette di estrarre i bit nei quali viene memorizzato il tipo di
1610 file, i valori successivi sono le costanti corrispondenti ai singoli bit, e
1611 possono essere usati per effettuare la selezione sul tipo di file voluto, con
1612 un'opportuna combinazione.
1617 \begin{tabular}[c]{|l|c|l|}
1619 \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
1622 \const{S\_IFMT} & 0170000 & Maschera per i bit del tipo di file.\\
1623 \const{S\_IFSOCK} & 0140000 & Socket.\\
1624 \const{S\_IFLNK} & 0120000 & Link simbolico.\\
1625 \const{S\_IFREG} & 0100000 & File regolare.\\
1626 \const{S\_IFBLK} & 0060000 & Dispositivo a blocchi.\\
1627 \const{S\_IFDIR} & 0040000 & Directory.\\
1628 \const{S\_IFCHR} & 0020000 & Dispositivo a caratteri.\\
1629 \const{S\_IFIFO} & 0010000 & Fifo.\\
1631 \const{S\_ISUID} & 0004000 & Set UID bit \itindex{suid~bit}.\\
1632 \const{S\_ISGID} & 0002000 & Set GID bit \itindex{sgid~bit}.\\
1633 \const{S\_ISVTX} & 0001000 & Sticky bit \itindex{sticky~bit}.\\
1635 % \const{S\_IRWXU} & 00700 & Bitmask per i permessi del proprietario.\\
1636 \const{S\_IRUSR} & 00400 & Il proprietario ha permesso di lettura.\\
1637 \const{S\_IWUSR} & 00200 & Il proprietario ha permesso di scrittura.\\
1638 \const{S\_IXUSR} & 00100 & Il proprietario ha permesso di esecuzione.\\
1640 % \const{S\_IRWXG} & 00070 & Bitmask per i permessi del gruppo.\\
1641 \const{S\_IRGRP} & 00040 & Il gruppo ha permesso di lettura.\\
1642 \const{S\_IWGRP} & 00020 & Il gruppo ha permesso di scrittura.\\
1643 \const{S\_IXGRP} & 00010 & Il gruppo ha permesso di esecuzione.\\
1645 % \const{S\_IRWXO} & 00007 & Bitmask per i permessi di tutti gli altri\\
1646 \const{S\_IROTH} & 00004 & Gli altri hanno permesso di lettura.\\
1647 \const{S\_IWOTH} & 00002 & Gli altri hanno permesso di esecuzione.\\
1648 \const{S\_IXOTH} & 00001 & Gli altri hanno permesso di esecuzione.\\
1651 \caption{Costanti per l'identificazione dei vari bit che compongono il campo
1652 \var{st\_mode} (definite in \file{sys/stat.h}).}
1653 \label{tab:file_mode_flags}
1656 Ad esempio se si volesse impostare una condizione che permetta di controllare
1657 se un file è una directory o un file ordinario si potrebbe definire la macro
1659 \includecodesnip{listati/is_file_dir.h}
1660 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
1661 poi si effettua il confronto con la combinazione di tipi scelta.
1664 \subsection{Le dimensioni dei file}
1665 \label{sec:file_file_size}
1667 Il campo \var{st\_size} di una struttura \struct{stat} contiene la dimensione
1668 del file in byte, se si tratta di un file regolare. Nel caso di un link
1669 simbolico la dimensione è quella del \itindex{pathname} \textit{pathname} che
1670 il link stesso contiene; per le fifo questo campo è sempre nullo.
1672 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
1673 byte. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
1674 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
1675 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
1676 dimensione inferiore sarebbe inefficiente.
1678 Si tenga conto che la lunghezza del file riportata in \var{st\_size} non è
1679 detto che corrisponda all'occupazione dello spazio su disco per via della
1680 possibile esistenza dei cosiddetti \textit{holes} (letteralmente
1681 \textsl{buchi}) che si formano tutte le volte che si va a scrivere su un file
1682 dopo aver eseguito una \func{lseek} (vedi sez.~\ref{sec:file_lseek}) oltre la
1685 In questo caso si avranno risultati differenti a seconda del modo in cui si
1686 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
1687 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
1688 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
1689 caso per le parti non scritte vengono restituiti degli zeri, si avrà lo stesso
1690 risultato di \cmd{ls}.
1692 Se è sempre possibile allargare un file, scrivendoci sopra od usando la
1693 funzione \func{lseek} per spostarsi oltre la sua fine, esistono anche casi in
1694 cui si può avere bisogno di effettuare un troncamento, scartando i dati
1695 presenti al di là della dimensione scelta come nuova fine del file.
1697 Un file può sempre essere troncato a zero aprendolo con il flag
1698 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
1699 dimensione si possono usare le due funzioni \funcd{truncate} e
1700 \funcd{ftruncate}, i cui prototipi sono:
1702 \headdecl{unistd.h} \funcdecl{int truncate(const char *file\_name, off\_t
1703 length)} Fa si che la dimensione del file \param{file\_name} sia troncata
1704 ad un valore massimo specificato da \param{lenght}.
1706 \funcdecl{int ftruncate(int fd, off\_t length))} Identica a \func{truncate}
1707 eccetto che si usa con un file aperto, specificato tramite il suo file
1708 descriptor \param{fd}.
1710 \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per un
1711 errore, nel qual caso \var{errno} viene impostata opportunamente; per
1712 \func{ftruncate} si hanno i valori:
1714 \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
1715 \item[\errcode{EINVAL}] \param{fd} è un riferimento ad un socket, non a un
1716 file o non è aperto in scrittura.
1718 per \func{truncate} si hanno:
1720 \item[\errcode{EACCES}] il file non ha permesso di scrittura o non si ha il
1721 permesso di esecuzione una delle directory del \itindex{pathname}
1723 \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
1725 ed anche \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1726 \errval{EROFS}, \errval{EIO}, \errval{EFAULT}, \errval{ELOOP}.}
1729 Se il file è più lungo della lunghezza specificata i dati in eccesso saranno
1730 perduti; il comportamento in caso di lunghezza inferiore non è specificato e
1731 dipende dall'implementazione: il file può essere lasciato invariato o esteso
1732 fino alla lunghezza scelta; in quest'ultimo caso lo spazio viene riempito con
1733 zeri (e in genere si ha la creazione di un \textit{hole} nel file).
1736 \subsection{I tempi dei file}
1737 \label{sec:file_file_times}
1739 Il sistema mantiene per ciascun file tre tempi. Questi sono registrati
1740 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del file e
1741 possono essere letti tramite la funzione \func{stat}, che li restituisce
1742 attraverso tre campi della struttura \struct{stat} di
1743 fig.~\ref{fig:file_stat_struct}. Il significato di detti tempi e dei relativi
1744 campi è riportato nello schema in tab.~\ref{tab:file_file_times}, dove è anche
1745 riportato un esempio delle funzioni che effettuano cambiamenti su di essi.
1750 \begin{tabular}[c]{|c|l|l|c|}
1752 \textbf{Membro} & \textbf{Significato} & \textbf{Funzione}
1753 & \textbf{Opzione di \cmd{ls}} \\
1756 \var{st\_atime}& ultimo accesso ai dati del file &
1757 \func{read}, \func{utime} & \cmd{-u}\\
1758 \var{st\_mtime}& ultima modifica ai dati del file &
1759 \func{write}, \func{utime} & default\\
1760 \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
1761 \func{chmod}, \func{utime} & \cmd{-c}\\
1764 \caption{I tre tempi associati a ciascun file.}
1765 \label{tab:file_file_times}
1768 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
1769 modifica (il \textit{modification time} \var{st\_mtime}) e il tempo di
1770 cambiamento di stato (il \textit{change time} \var{st\_ctime}). Il primo
1771 infatti fa riferimento ad una modifica del contenuto di un file, mentre il
1772 secondo ad una modifica \itindex{inode} dell'\textit{inode}; siccome esistono
1773 molte operazioni (come la funzione \func{link} e molte altre che vedremo in
1774 seguito) che modificano solo le informazioni contenute \itindex{inode}
1775 nell'\textit{inode} senza toccare il contenuto del file, diventa necessario
1776 l'utilizzo di un altro tempo.
1778 Il sistema non tiene conto dell'ultimo accesso \itindex{inode}
1779 all'\textit{inode}, pertanto funzioni come \func{access} o \func{stat} non
1780 hanno alcuna influenza sui tre tempi. Il tempo di ultimo accesso (ai dati)
1781 viene di solito usato per cancellare i file che non servono più dopo un certo
1782 lasso di tempo (ad esempio il programma \cmd{leafnode} cancella i vecchi
1783 articoli sulla base di questo tempo).
1788 \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
1790 \multicolumn{1}{|p{3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
1791 \multicolumn{3}{|p{3.6cm}|}{\centering{
1792 \textbf{File o directory del riferimento}}}&
1793 \multicolumn{3}{|p{3.6cm}|}{\centering{
1794 \textbf{Directory contenente il riferimento}}}
1795 &\multicolumn{1}{|p{3.6cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
1798 \multicolumn{1}{|p{3cm}|}{}
1799 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1800 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1801 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1802 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1803 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1804 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1805 &\multicolumn{1}{|p{3cm}|}{} \\
1808 \func{chmod}, \func{fchmod}
1809 & -- & -- &$\bullet$& -- & -- & -- &\\
1810 \func{chown}, \func{fchown}
1811 & -- & -- &$\bullet$& -- & -- & -- &\\
1813 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
1814 con \const{O\_CREATE} \\
1816 & -- &$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
1817 con \const{O\_TRUNC} \\
1819 &$\bullet$& -- & -- & -- & -- & -- &\\
1821 & -- & -- &$\bullet$& -- & -- & -- &\\
1823 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&\\
1825 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&\\
1827 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&\\
1829 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
1830 con \const{O\_CREATE} \\
1832 & -- &$\bullet$&$\bullet$& -- & -- & -- &
1833 con \const{O\_TRUNC} \\
1835 &$\bullet$&$\bullet$&$\bullet$& -- & -- & -- &\\
1837 &$\bullet$& -- & -- & -- & -- & -- &\\
1839 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&
1840 se esegue \func{unlink}\\
1842 & -- & -- & -- & -- &$\bullet$&$\bullet$&
1843 se esegue \func{rmdir}\\
1845 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&
1846 per entrambi gli argomenti\\
1848 & -- & -- & -- & -- &$\bullet$&$\bullet$&\\
1849 \func{truncate}, \func{ftruncate}
1850 & -- &$\bullet$&$\bullet$& -- & -- & -- &\\
1852 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&\\
1854 &$\bullet$&$\bullet$&$\bullet$& -- & -- & -- &\\
1856 & -- &$\bullet$&$\bullet$& -- & -- & -- &\\
1859 \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo
1860 accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento
1861 \textsl{(c)} dalle varie funzioni operanti su file e directory.}
1862 \label{tab:file_times_effects}
1866 Il tempo di ultima modifica invece viene usato da \cmd{make} per decidere
1867 quali file necessitano di essere ricompilati o (talvolta insieme anche al
1868 tempo di cambiamento di stato) per decidere quali file devono essere
1869 archiviati per il backup. Il comando \cmd{ls} (quando usato con le opzioni
1870 \cmd{-l} o \cmd{-t}) mostra i tempi dei file secondo lo schema riportato
1871 nell'ultima colonna di tab.~\ref{tab:file_file_times}.
1873 L'effetto delle varie funzioni di manipolazione dei file sui tempi è
1874 illustrato in tab.~\ref{tab:file_times_effects}. Si sono riportati gli effetti
1875 sia per il file a cui si fa riferimento, sia per la directory che lo contiene;
1876 questi ultimi possono essere capiti se si tiene conto di quanto già detto, e
1877 cioè che anche le directory sono file (che contengono una lista di nomi) che
1878 il sistema tratta in maniera del tutto analoga a tutti gli altri.
1880 Per questo motivo tutte le volte che compiremo un'operazione su un file che
1881 comporta una modifica del nome contenuto nella directory, andremo anche a
1882 scrivere sulla directory che lo contiene cambiandone il tempo di modifica. Un
1883 esempio di questo può essere la cancellazione di un file, invece leggere o
1884 scrivere o cambiare i permessi di un file ha effetti solo sui tempi di
1887 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
1888 creazione del file, usato in molti altri sistemi operativi, ma che in Unix non
1889 esiste. Per questo motivo quando si copia un file, a meno di preservare
1890 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
1891 avrà sempre il tempo corrente come data di ultima modifica.
1893 I tempi di ultimo accesso e modifica possono essere cambiati usando la
1894 funzione \funcd{utime}, il cui prototipo è:
1895 \begin{prototype}{utime.h}
1896 {int utime(const char *filename, struct utimbuf *times)}
1898 Cambia i tempi di ultimo accesso e modifica \itindex{inode}
1899 dell'\textit{inode} specificato da \param{filename} secondo i campi
1900 \var{actime} e \var{modtime} di \param{times}. Se questa è \val{NULL} allora
1901 viene usato il tempo corrente.
1903 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1904 errore, nel qual caso \var{errno} assumerà uno dei valori:
1906 \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
1907 \item[\errcode{ENOENT}] \param{filename} non esiste.
1911 La funzione prende come argomento \param{times} una struttura
1912 \struct{utimbuf}, la cui definizione è riportata in
1913 fig.~\ref{fig:struct_utimebuf}, con la quale si possono specificare i nuovi
1914 valori che si vogliono impostare per tempi.
1916 \begin{figure}[!htb]
1917 \footnotesize \centering
1918 \begin{minipage}[c]{15cm}
1919 \includestruct{listati/utimbuf.h}
1922 \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
1924 \label{fig:struct_utimebuf}
1927 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
1928 cosa è l'argomento \param{times}; se è \val{NULL} la funzione imposta il
1929 tempo corrente ed è sufficiente avere accesso in scrittura al file; se invece
1930 si è specificato un valore la funzione avrà successo solo se si è proprietari
1931 del file (o si hanno i privilegi di amministratore).
1933 Si tenga presente che non è comunque possibile specificare il tempo di
1934 cambiamento di stato del file, che viene comunque cambiato dal kernel tutte le
1935 volte che si modifica \itindex{inode} l'\textit{inode} (quindi anche alla
1936 chiamata di \func{utime}). Questo serve anche come misura di sicurezza per
1937 evitare che si possa modificare un file nascondendo completamente le proprie
1938 tracce. In realtà la cosa resta possibile, se si è in grado di accedere al
1939 file di dispositivo, scrivendo direttamente sul disco senza passare attraverso
1940 il filesystem, ma ovviamente in questo modo la cosa è molto più complicata da
1945 \section{Il controllo di accesso ai file}
1946 \label{sec:file_access_control}
1948 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
1949 del controllo di accesso ai file, che viene implementato per qualunque
1950 filesystem standard.\footnote{per standard si intende che implementa le
1951 caratteristiche previste dallo standard POSIX; in Linux sono disponibili
1952 anche una serie di altri filesystem, come quelli di Windows e del Mac, che
1953 non supportano queste caratteristiche.} In questa sezione ne esamineremo i
1954 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
1957 \subsection{I permessi per l'accesso ai file}
1958 \label{sec:file_perm_overview}
1960 Ad ogni file Linux associa sempre l'utente che ne è proprietario (il
1961 cosiddetto \textit{owner}) ed un gruppo di appartenenza, secondo il meccanismo
1962 degli identificatori di utente e gruppo (\acr{uid} e \acr{gid}). Questi valori
1963 sono accessibili da programma tramite la funzione \func{stat}, e sono
1964 mantenuti nei campi \var{st\_uid} e \var{st\_gid} della struttura
1965 \struct{stat} (si veda sez.~\ref{sec:file_stat}).\footnote{questo è vero solo
1966 per filesystem di tipo Unix, ad esempio non è vero per il filesystem vfat di
1967 Windows, che non fornisce nessun supporto per l'accesso multiutente, e per
1968 il quale i permessi vengono assegnati in maniera fissa con un opzione in
1971 Il controllo di accesso ai file segue un modello abbastanza semplice che
1972 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
1973 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
1974 Control List} che sono state aggiunte ai filesystem standard con opportune
1975 estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
1976 controllo ancora più sofisticati come il \textit{mandatory access control}
1977 di SE-Linux.} ma nella maggior parte dei casi il meccanismo standard è più
1978 che sufficiente a soddisfare tutte le necessità più comuni. I tre permessi di
1979 base associati ad ogni file sono:
1981 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
1983 \item il permesso di scrittura (indicato con la lettera \texttt{w},
1984 dall'inglese \textit{write}).
1985 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
1986 dall'inglese \textit{execute}).
1988 mentre i tre livelli su cui sono divisi i privilegi sono:
1990 \item i privilegi per l'utente proprietario del file.
1991 \item i privilegi per un qualunque utente faccia parte del gruppo cui
1993 \item i privilegi per tutti gli altri utenti.
1996 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
1997 meno significativi sono usati a gruppi di tre per indicare i permessi base di
1998 lettura, scrittura ed esecuzione e sono applicati rispettivamente
1999 rispettivamente al proprietario, al gruppo, a tutti gli altri.
2003 \includegraphics[width=6cm]{img/fileperm}
2004 \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
2005 contenuti nel campo \var{st\_mode} di \struct{stat}.}
2006 \label{fig:file_perm_bit}
2009 I restanti tre bit (noti come \itindex{suid~bit} \textit{suid bit},
2010 \itindex{sgid~bit} \textit{sgid bit}, e \itindex{sticky~bit} \textit{sticky
2011 bit}) sono usati per indicare alcune caratteristiche più complesse del
2012 meccanismo del controllo di accesso su cui torneremo in seguito (in
2013 sez.~\ref{sec:file_special_perm}); lo schema di allocazione dei bit è
2014 riportato in fig.~\ref{fig:file_perm_bit}.
2016 Anche i permessi, come tutte le altre informazioni pertinenti al file, sono
2017 memorizzati \itindex{inode} nell'\textit{inode}; in particolare essi sono
2018 contenuti in alcuni bit del campo \var{st\_mode} della struttura \struct{stat}
2019 (si veda di nuovo fig.~\ref{fig:file_stat_struct}).
2021 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
2022 \cmd{u} (per \textit{user}), \cmd{g} (per \textit{group}) e \cmd{o} (per
2023 \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti insieme
2024 si usa la lettera \cmd{a} (per \textit{all}). Si tenga ben presente questa
2025 distinzione dato che in certi casi, mutuando la terminologia in uso nel VMS,
2026 si parla dei permessi base come di permessi per \textit{owner}, \textit{group}
2027 ed \textit{all}, le cui iniziali possono dar luogo a confusione. Le costanti
2028 che permettono di accedere al valore numerico di questi bit nel campo
2029 \var{st\_mode} sono riportate in tab.~\ref{tab:file_bit_perm}.
2034 \begin{tabular}[c]{|c|l|}
2036 \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
2039 \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
2040 \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
2041 \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\
2043 \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
2044 \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
2045 \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
2047 \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
2048 \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
2049 \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
2052 \caption{I bit dei permessi di accesso ai file, come definiti in
2053 \texttt{<sys/stat.h>}}
2054 \label{tab:file_bit_perm}
2057 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
2058 che si riferiscano a dei file, dei link simbolici o delle directory; qui ci
2059 limiteremo ad un riassunto delle regole generali, entrando nei dettagli più
2062 La prima regola è che per poter accedere ad un file attraverso il suo
2063 \itindex{pathname} \textit{pathname} occorre il permesso di esecuzione in
2064 ciascuna delle directory che compongono il \textit{pathname}; lo stesso vale
2065 per aprire un file nella directory corrente (per la quale appunto serve il
2066 diritto di esecuzione).
2068 Per una directory infatti il permesso di esecuzione significa che essa può
2069 essere attraversata nella risoluzione del \itindex{pathname}
2070 \textit{pathname}, ed è distinto dal permesso di lettura che invece implica
2071 che si può leggere il contenuto della directory.
2073 Questo significa che se si ha il permesso di esecuzione senza permesso di
2074 lettura si potrà lo stesso aprire un file in una directory (se si hanno i
2075 permessi opportuni per il medesimo) ma non si potrà vederlo con \cmd{ls}
2076 (mentre per crearlo occorrerà anche il permesso di scrittura per la
2079 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
2080 (si veda quanto riportato in tab.~\ref{tab:file_open_flags}) di sola lettura o
2081 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
2082 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
2083 il contenuto, lo stesso permesso è necessario per poter troncare il file.
2085 Non si può creare un file fintanto che non si disponga del permesso di
2086 esecuzione e di quello di scrittura per la directory di destinazione; gli
2087 stessi permessi occorrono per cancellare un file da una directory (si ricordi
2088 che questo non implica necessariamente la rimozione del contenuto del file dal
2089 disco), non è necessario nessun tipo di permesso per il file stesso (infatti
2090 esso non viene toccato, viene solo modificato il contenuto della directory,
2091 rimuovendo la voce che ad esso fa riferimento).
2093 Per poter eseguire un file (che sia un programma compilato od uno script di
2094 shell, od un altro tipo di file eseguibile riconosciuto dal kernel), occorre
2095 avere il permesso di esecuzione, inoltre solo i file regolari possono essere
2098 I permessi per un link simbolico sono ignorati, contano quelli del file a cui
2099 fa riferimento; per questo in genere il comando \cmd{ls} riporta per un link
2100 simbolico tutti i permessi come concessi; utente e gruppo a cui esso
2101 appartiene vengono pure ignorati quando il link viene risolto, vengono
2102 controllati solo quando viene richiesta la rimozione del link e quest'ultimo è
2103 in una directory con lo \itindex{sticky~bit} \textit{sticky bit} impostato (si
2104 veda sez.~\ref{sec:file_special_perm}).
2106 La procedura con cui il kernel stabilisce se un processo possiede un certo
2107 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
2108 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
2109 \var{st\_gid} accennati in precedenza) e l'user-ID effettivo, il group-ID
2110 effettivo e gli eventuali group-ID supplementari del processo.\footnote{in
2111 realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
2112 identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
2113 sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
2114 eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
2117 Per una spiegazione dettagliata degli identificatori associati ai processi si
2118 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
2119 sez.~\ref{sec:file_special_perm}, l'user-ID effettivo e il group-ID effettivo
2120 corrispondono ai valori dell'\acr{uid} e del \acr{gid} dell'utente che ha
2121 lanciato il processo, mentre i group-ID supplementari sono quelli dei gruppi
2122 cui l'utente appartiene.
2124 I passi attraverso i quali viene stabilito se il processo possiede il diritto
2125 di accesso sono i seguenti:
2127 \item Se l'user-ID effettivo del processo è zero (corrispondente
2128 all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
2129 controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
2131 \item Se l'user-ID effettivo del processo è uguale all'\acr{uid} del
2132 proprietario del file (nel qual caso si dice che il processo è proprietario
2135 \item se il relativo\footnote{per relativo si intende il bit di user-read se
2136 il processo vuole accedere in lettura, quello di user-write per
2137 l'accesso in scrittura, ecc.} bit dei permessi d'accesso dell'utente è
2138 impostato, l'accesso è consentito
2139 \item altrimenti l'accesso è negato
2141 \item Se il group-ID effettivo del processo o uno dei group-ID supplementari
2142 dei processi corrispondono al \acr{gid} del file allora:
2144 \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
2146 \item altrimenti l'accesso è negato
2148 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
2149 l'accesso è consentito, altrimenti l'accesso è negato.
2152 Si tenga presente che questi passi vengono eseguiti esattamente in
2153 quest'ordine. Questo vuol dire che se un processo è il proprietario di un file,
2154 l'accesso è consentito o negato solo sulla base dei permessi per l'utente; i
2155 permessi per il gruppo non vengono neanche controllati. Lo stesso vale se il
2156 processo appartiene ad un gruppo appropriato, in questo caso i permessi per
2157 tutti gli altri non vengono controllati.
2160 \subsection{I bit dei permessi speciali}
2161 \label{sec:file_special_perm}
2166 Come si è accennato (in sez.~\ref{sec:file_perm_overview}) nei dodici bit del
2167 campo \var{st\_mode} di \struct{stat} che vengono usati per il controllo di
2168 accesso oltre ai bit dei permessi veri e propri, ci sono altri tre bit che
2169 vengono usati per indicare alcune proprietà speciali dei file. Due di questi
2170 sono i bit detti \acr{suid} (da \textit{set-user-ID bit}) e \acr{sgid} (da
2171 \textit{set-group-ID bit}) che sono identificati dalle costanti
2172 \const{S\_ISUID} e \const{S\_ISGID}.
2174 Come spiegato in dettaglio in sez.~\ref{sec:proc_exec}, quando si lancia un
2175 programma il comportamento normale del kernel è quello di impostare gli
2176 identificatori del gruppo \textit{effective} del nuovo processo al valore dei
2177 corrispondenti del gruppo \textit{real} del processo corrente, che normalmente
2178 corrispondono a quelli dell'utente con cui si è entrati nel sistema.
2180 Se però il file del programma (che ovviamente deve essere
2181 eseguibile\footnote{per motivi di sicurezza il kernel ignora i bit \acr{suid}
2182 e \acr{sgid} per gli script eseguibili.}) ha il bit \acr{suid} impostato, il
2183 kernel assegnerà come user-ID effettivo al nuovo processo l'\acr{uid} del
2184 proprietario del file al posto dell'\acr{uid} del processo originario. Avere
2185 il bit \acr{sgid} impostato ha lo stesso effetto sul group-ID effettivo del
2188 I bit \acr{suid} e \acr{sgid} vengono usati per permettere agli utenti normali
2189 di usare programmi che richiedono privilegi speciali; l'esempio classico è il
2190 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
2191 quest'ultimo ovviamente può essere scritto solo dall'amministratore, ma non è
2192 necessario chiamare l'amministratore per cambiare la propria password. Infatti
2193 il comando \cmd{passwd} appartiene a root ma ha il bit \acr{suid} impostato
2194 per cui quando viene lanciato da un utente normale parte con i privilegi di
2197 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
2198 normalmente l'utente che lo ha lanciato comporta vari rischi, e questo tipo di
2199 programmi devono essere scritti accuratamente per evitare che possano essere
2200 usati per guadagnare privilegi non consentiti (l'argomento è affrontato in
2201 dettaglio in sez.~\ref{sec:proc_perms}).
2203 La presenza dei bit \acr{suid} e \acr{sgid} su un file può essere rilevata con
2204 il comando \cmd{ls -l}, che visualizza una lettera \cmd{s} al posto della
2205 \cmd{x} in corrispondenza dei permessi di utente o gruppo. La stessa lettera
2206 \cmd{s} può essere usata nel comando \cmd{chmod} per impostare questi bit.
2207 Infine questi bit possono essere controllati all'interno di \var{st\_mode} con
2208 l'uso delle due costanti \const{S\_ISUID} e \const{S\_IGID}, i cui valori sono
2209 riportati in tab.~\ref{tab:file_mode_flags}.
2211 Gli stessi bit vengono ad assumere in significato completamente diverso per le
2212 directory, normalmente infatti Linux usa la convenzione di SVr4 per indicare
2213 con questi bit l'uso della semantica BSD nella creazione di nuovi file (si
2214 veda sez.~\ref{sec:file_ownership_management} per una spiegazione dettagliata
2217 Infine Linux utilizza il bit \acr{sgid} per un'ulteriore estensione mutuata
2218 da SVr4. Il caso in cui un file ha il bit \acr{sgid} impostato senza che lo
2219 sia anche il corrispondente bit di esecuzione viene utilizzato per attivare
2220 per quel file il \itindex{mandatory~locking} \textit{mandatory locking}
2221 (affronteremo questo argomento in dettaglio più avanti, in
2222 sez.~\ref{sec:file_mand_locking}).
2228 \itindbeg{sticky~bit}
2230 L'ultimo dei bit rimanenti, identificato dalla costante \const{S\_ISVTX}, è in
2231 parte un rimasuglio delle origini dei sistemi Unix. A quell'epoca infatti la
2232 memoria virtuale e l'accesso ai file erano molto meno sofisticati e per
2233 ottenere la massima velocità possibile per i programmi usati più comunemente
2234 si poteva impostare questo bit.
2236 L'effetto di questo bit era che il \index{segmento!testo} segmento di testo
2237 del programma (si veda sez.~\ref{sec:proc_mem_layout} per i dettagli) veniva
2238 scritto nella swap la prima volta che questo veniva lanciato, e vi permaneva
2239 fino al riavvio della macchina (da questo il nome di \textsl{sticky bit});
2240 essendo la swap un file continuo o una partizione indicizzata direttamente si
2241 poteva risparmiare in tempo di caricamento rispetto alla ricerca attraverso la
2242 struttura del filesystem. Lo \textsl{sticky bit} è indicato usando la lettera
2243 \texttt{t} al posto della \texttt{x} nei permessi per gli altri.
2245 Ovviamente per evitare che gli utenti potessero intasare la swap solo
2246 l'amministratore era in grado di impostare questo bit, che venne chiamato
2247 anche con il nome di \textit{saved text bit}, da cui deriva quello della
2248 costante. Le attuali implementazioni di memoria virtuale e filesystem rendono
2249 sostanzialmente inutile questo procedimento.
2251 Benché ormai non venga più utilizzato per i file, lo \textit{sticky bit} ha
2252 invece assunto un uso importante per le directory;\footnote{lo \textit{sticky
2253 bit} per le directory è un'estensione non definita nello standard POSIX,
2254 Linux però la supporta, così come BSD e SVr4.} in questo caso se tale bit è
2255 impostato un file potrà essere rimosso dalla directory soltanto se l'utente ha
2256 il permesso di scrittura su di essa ed inoltre è vera una delle seguenti
2259 \item l'utente è proprietario del file
2260 \item l'utente è proprietario della directory
2261 \item l'utente è l'amministratore
2263 un classico esempio di directory che ha questo bit impostato è \file{/tmp}, i
2264 permessi infatti di solito sono i seguenti:
2267 drwxrwxrwt 6 root root 1024 Aug 10 01:03 /tmp
2269 quindi con lo \textit{sticky bit} bit impostato. In questo modo qualunque
2270 utente nel sistema può creare dei file in questa directory (che, come
2271 suggerisce il nome, è normalmente utilizzata per la creazione di file
2272 temporanei), ma solo l'utente che ha creato un certo file potrà cancellarlo o
2273 rinominarlo. In questo modo si evita che un utente possa, più o meno
2274 consapevolmente, cancellare i file temporanei creati degli altri utenti.
2276 \itindend{sticky~bit}
2278 \subsection{Le funzioni per la gestione dei permessi dei file}
2279 \label{sec:file_perm_management}
2281 Come visto in sez.~\ref{sec:file_access_control} il controllo di accesso ad un
2282 file viene fatto utilizzando l'user-ID ed il group-ID effettivo del processo;
2283 ci sono casi però in cui si può voler effettuare il controllo con l'user-ID
2284 reale ed il group-ID reale, vale a dire usando i valori di \acr{uid} e
2285 \acr{gid} relativi all'utente che ha lanciato il programma, e che, come
2286 accennato in sez.~\ref{sec:file_special_perm} e spiegato in dettaglio in
2287 sez.~\ref{sec:proc_perms}, non è detto siano uguali a quelli effettivi.
2289 Per far questo si può usare la funzione \funcd{access}, il cui prototipo è:
2290 \begin{prototype}{unistd.h}
2291 {int access(const char *pathname, int mode)}
2293 Verifica i permessi di accesso.
2295 \bodydesc{La funzione ritorna 0 se l'accesso è consentito, -1 se l'accesso non
2296 è consentito ed in caso di errore; nel qual caso la variabile \var{errno}
2299 \item[\errcode{EINVAL}] il valore di \param{mode} non è valido.
2300 \item[\errcode{EACCES}] l'accesso al file non è consentito, o non si ha il
2301 permesso di attraversare una delle directory di \param{pathname}.
2302 \item[\errcode{EROFS}] si è richiesto l'accesso in scrittura per un file su
2303 un filesystem montato in sola lettura.
2305 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2306 \errval{ENOTDIR}, \errval{ELOOP}, \errval{EIO}.}
2309 La funzione verifica i permessi di accesso, indicati da \param{mode}, per il
2310 file indicato da \param{pathname}. I valori possibili per l'argomento
2311 \param{mode} sono esprimibili come combinazione delle costanti numeriche
2312 riportate in tab.~\ref{tab:file_access_mode_val} (attraverso un OR binario
2313 delle stesse). I primi tre valori implicano anche la verifica dell'esistenza
2314 del file, se si vuole verificare solo quest'ultima si può usare \const{F\_OK},
2315 o anche direttamente \func{stat}. Nel caso in cui \param{pathname} si
2316 riferisca ad un link simbolico, questo viene seguito ed il controllo è fatto
2317 sul file a cui esso fa riferimento.
2319 La funzione controlla solo i bit dei permessi di accesso, si ricordi che il
2320 fatto che una directory abbia permesso di scrittura non significa che ci si
2321 possa scrivere come in un file, e il fatto che un file abbia permesso di
2322 esecuzione non comporta che contenga un programma eseguibile. La funzione
2323 ritorna zero solo se tutte i permessi controllati sono disponibili, in caso
2324 contrario (o di errore) ritorna -1.
2328 \begin{tabular}{|c|l|}
2330 \textbf{\param{mode}} & \textbf{Significato} \\
2333 \const{R\_OK} & Verifica il permesso di lettura. \\
2334 \const{W\_OK} & Verifica il permesso di scrittura. \\
2335 \const{X\_OK} & Verifica il permesso di esecuzione. \\
2336 \const{F\_OK} & Verifica l'esistenza del file. \\
2339 \caption{Valori possibile per l'argomento \param{mode} della funzione
2341 \label{tab:file_access_mode_val}
2344 Un esempio tipico per l'uso di questa funzione è quello di un processo che sta
2345 eseguendo un programma coi privilegi di un altro utente (ad esempio attraverso
2346 l'uso del \itindex{suid~bit} \textit{suid bit}) che vuole controllare se
2347 l'utente originale ha i permessi per accedere ad un certo file.
2349 % TODO documentare euidaccess (e eaccess)
2351 Per cambiare i permessi di un file il sistema mette ad disposizione due
2352 funzioni \funcd{chmod} e \funcd{fchmod}, che operano rispettivamente su un
2353 filename e su un file descriptor, i loro prototipi sono:
2355 \headdecl{sys/types.h}
2356 \headdecl{sys/stat.h}
2358 \funcdecl{int chmod(const char *path, mode\_t mode)} Cambia i permessi del
2359 file indicato da \param{path} al valore indicato da \param{mode}.
2361 \funcdecl{int fchmod(int fd, mode\_t mode)} Analoga alla precedente, ma usa
2362 il file descriptor \param{fd} per indicare il file.
2364 \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
2365 un errore, in caso di errore \var{errno} può assumere i valori:
2367 \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2368 proprietario del file o non è zero.
2369 \item[\errcode{EROFS}] il file è su un filesystem in sola lettura.
2371 ed inoltre \errval{EIO}; \func{chmod} restituisce anche \errval{EFAULT},
2372 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2373 \errval{EACCES}, \errval{ELOOP}; \func{fchmod} anche \errval{EBADF}.}
2376 Entrambe le funzioni utilizzano come secondo argomento \param{mode}, una
2377 variabile dell'apposito tipo primitivo \type{mode\_t} (vedi
2378 tab.~\ref{tab:intro_primitive_types}) utilizzato per specificare i permessi sui
2384 \begin{tabular}[c]{|c|c|l|}
2386 \textbf{\param{mode}} & \textbf{Valore} & \textbf{Significato} \\
2389 \const{S\_ISUID} & 04000 & Set user ID \itindex{suid~bit}.\\
2390 \const{S\_ISGID} & 02000 & Set group ID \itindex{sgid~bit}.\\
2391 \const{S\_ISVTX} & 01000 & Sticky bit \itindex{sticky~bit}.\\
2393 \const{S\_IRWXU} & 00700 & L'utente ha tutti i permessi.\\
2394 \const{S\_IRUSR} & 00400 & L'utente ha il permesso di lettura.\\
2395 \const{S\_IWUSR} & 00200 & L'utente ha il permesso di scrittura.\\
2396 \const{S\_IXUSR} & 00100 & L'utente ha il permesso di esecuzione.\\
2398 \const{S\_IRWXG} & 00070 & Il gruppo ha tutti i permessi.\\
2399 \const{S\_IRGRP} & 00040 & Il gruppo ha il permesso di lettura.\\
2400 \const{S\_IWGRP} & 00020 & Il gruppo ha il permesso di scrittura.\\
2401 \const{S\_IXGRP} & 00010 & Il gruppo ha il permesso di esecuzione.\\
2403 \const{S\_IRWXO} & 00007 & Gli altri hanno tutti i permessi.\\
2404 \const{S\_IROTH} & 00004 & Gli altri hanno il permesso di lettura.\\
2405 \const{S\_IWOTH} & 00002 & Gli altri hanno il permesso di scrittura.\\
2406 \const{S\_IXOTH} & 00001 & Gli altri hanno il permesso di esecuzione.\\
2409 \caption{Valori delle costanti usate per indicare i vari bit di
2410 \param{mode} utilizzato per impostare i permessi dei file.}
2411 \label{tab:file_permission_const}
2414 Le costanti con cui specificare i singoli bit di \param{mode} sono riportate
2415 in tab.~\ref{tab:file_permission_const}. Il valore di \param{mode} può essere
2416 ottenuto combinando fra loro con un OR binario le costanti simboliche relative
2417 ai vari bit, o specificato direttamente, come per l'omonimo comando di shell,
2418 con un valore numerico (la shell lo vuole in ottale, dato che i bit dei
2419 permessi sono divisibili in gruppi di tre), che si può calcolare direttamente
2420 usando lo schema si utilizzo dei bit illustrato in
2421 fig.~\ref{fig:file_perm_bit}.
2423 Ad esempio i permessi standard assegnati ai nuovi file (lettura e scrittura
2424 per il proprietario, sola lettura per il gruppo e gli altri) sono
2425 corrispondenti al valore ottale $0644$, un programma invece avrebbe anche il
2426 bit di esecuzione attivo, con un valore di $0755$, se si volesse attivare il
2427 bit \itindex{suid~bit} \acr{suid} il valore da fornire sarebbe $4755$.
2429 Il cambiamento dei permessi di un file eseguito attraverso queste funzioni ha
2430 comunque alcune limitazioni, previste per motivi di sicurezza. L'uso delle
2431 funzioni infatti è possibile solo se l'user-ID effettivo del processo
2432 corrisponde a quello del proprietario del file o dell'amministratore,
2433 altrimenti esse falliranno con un errore di \errcode{EPERM}.
2435 Ma oltre a questa regola generale, di immediata comprensione, esistono delle
2436 limitazioni ulteriori. Per questo motivo, anche se si è proprietari del file,
2437 non tutti i valori possibili di \param{mode} sono permessi o hanno effetto;
2438 in particolare accade che:
2440 \item siccome solo l'amministratore può impostare lo \itindex{sticky~bit}
2441 \textit{sticky bit}, se l'user-ID effettivo del processo non è zero esso
2442 viene automaticamente cancellato (senza notifica di errore) qualora sia
2443 stato indicato in \param{mode}.
2444 \item per quanto detto in sez.~\ref{sec:file_ownership_management} riguardo la
2445 creazione dei nuovi file, si può avere il caso in cui il file creato da un
2446 processo è assegnato ad un gruppo per il quale il processo non ha privilegi.
2447 Per evitare che si possa assegnare il bit \itindex{sgid~bit} \acr{sgid} ad
2448 un file appartenente ad un gruppo per cui non si hanno diritti, questo viene
2449 automaticamente cancellato da \param{mode} (senza notifica di errore)
2450 qualora il gruppo del file non corrisponda a quelli associati al processo
2451 (la cosa non avviene quando l'user-ID effettivo del processo è zero).
2454 Per alcuni filesystem\footnote{i filesystem più comuni (\textsl{ext2},
2455 \textsl{ext3}, \textsl{reiserfs}) supportano questa caratteristica, che è
2456 mutuata da BSD.} è inoltre prevista un'ulteriore misura di sicurezza, volta
2457 a scongiurare l'abuso dei \itindex{suid~bit} bit \acr{suid} e \acr{sgid}; essa
2458 consiste nel cancellare automaticamente questi bit dai permessi di un file
2459 qualora un processo che non appartenga all'amministratore\footnote{per la
2460 precisione un processo che non dispone della capability
2461 \const{CAP\_FSETID}.} effettui una scrittura. In questo modo anche se un
2462 utente malizioso scopre un file \acr{suid} su cui può scrivere, un'eventuale
2463 modifica comporterà la perdita di questo privilegio.
2465 Le funzioni \func{chmod} e \func{fchmod} ci permettono di modificare i
2466 permessi di un file, resta però il problema di quali sono i permessi assegnati
2467 quando il file viene creato. Le funzioni dell'interfaccia nativa di Unix, come
2468 vedremo in sez.~\ref{sec:file_open}, permettono di indicare esplicitamente i
2469 permessi di creazione di un file, ma questo non è possibile per le funzioni
2470 dell'interfaccia standard ANSI C che non prevede l'esistenza di utenti e
2471 gruppi, ed inoltre il problema si pone anche per l'interfaccia nativa quando i
2472 permessi non vengono indicati esplicitamente.
2476 Per le funzioni dell'interfaccia standard ANSI C l'unico riferimento possibile
2477 è quello della modalità di apertura del nuovo file (lettura/scrittura o sola
2478 lettura), che però può fornire un valore che è lo stesso per tutti e tre i
2479 permessi di sez.~\ref{sec:file_perm_overview} (cioè $666$ nel primo caso e
2480 $222$ nel secondo). Per questo motivo il sistema associa ad ogni
2481 processo\footnote{è infatti contenuta nel campo \var{umask} della struttura
2482 \struct{fs\_struct}, vedi fig.~\ref{fig:proc_task_struct}.} una maschera di
2483 bit, la cosiddetta \textit{umask}, che viene utilizzata per impedire che
2484 alcuni permessi possano essere assegnati ai nuovi file in sede di creazione. I
2485 bit indicati nella maschera vengono infatti cancellati dai permessi quando un
2486 nuovo file viene creato.\footnote{l'operazione viene fatta sempre: anche
2487 qualora si indichi esplicitamente un valore dei permessi nelle funzioni di
2488 creazione che lo consentono, i permessi contenuti nella \textit{umask}
2491 La funzione che permette di impostare il valore di questa maschera di
2492 controllo è \funcd{umask}, ed il suo prototipo è:
2493 \begin{prototype}{stat.h}
2494 {mode\_t umask(mode\_t mask)}
2496 Imposta la maschera dei permessi dei bit al valore specificato da \param{mask}
2497 (di cui vengono presi solo i 9 bit meno significativi).
2499 \bodydesc{La funzione ritorna il precedente valore della maschera. È una
2500 delle poche funzioni che non restituisce codici di errore.}
2503 In genere si usa questa maschera per impostare un valore predefinito che
2504 escluda preventivamente alcuni permessi (usualmente quello di scrittura per il
2505 gruppo e gli altri, corrispondente ad un valore per \param{mask} pari a
2506 $022$). In questo modo è possibile cancellare automaticamente i permessi non
2507 voluti. Di norma questo valore viene impostato una volta per tutte al login a
2508 $022$, e gli utenti non hanno motivi per modificarlo.
2513 \subsection{La gestione della titolarità dei file}
2514 \label{sec:file_ownership_management}
2516 Vedremo in sez.~\ref{sec:file_base_func} con quali funzioni si possono creare
2517 nuovi file, in tale occasione vedremo che è possibile specificare in sede di
2518 creazione quali permessi applicare ad un file, però non si può indicare a
2519 quale utente e gruppo esso deve appartenere. Lo stesso problema si presenta
2520 per la creazione di nuove directory (procedimento descritto in
2521 sez.~\ref{sec:file_dir_creat_rem}).
2523 Lo standard POSIX prescrive che l'\acr{uid} del nuovo file corrisponda
2524 all'user-ID effettivo del processo che lo crea; per il \acr{gid} invece prevede
2525 due diverse possibilità:
2527 \item il \acr{gid} del file corrisponde al group-ID effettivo del processo.
2528 \item il \acr{gid} del file corrisponde al \acr{gid} della directory in cui
2531 in genere BSD usa sempre la seconda possibilità, che viene per questo chiamata
2532 semantica BSD. Linux invece segue quella che viene chiamata semantica SVr4; di
2533 norma cioè il nuovo file viene creato, seguendo la prima opzione, con il
2534 \acr{gid} del processo, se però la directory in cui viene creato il file ha il
2535 bit \acr{sgid} impostato allora viene usata la seconda opzione.
2537 Usare la semantica BSD ha il vantaggio che il \acr{gid} viene sempre
2538 automaticamente propagato, restando coerente a quello della directory di
2539 partenza, in tutte le sotto-directory.
2541 La semantica SVr4 offre la possibilità di scegliere, ma per ottenere lo stesso
2542 risultato di coerenza che si ha con BSD necessita che per le nuove directory
2543 venga anche propagato anche il bit \acr{sgid}. Questo è il comportamento
2544 predefinito del comando \cmd{mkdir}, ed è in questo modo ad esempio che Debian
2545 assicura che le sotto-directory create nella home di un utente restino sempre
2546 con il \acr{gid} del gruppo primario dello stesso.
2548 Come per i permessi, il sistema fornisce anche delle funzioni che permettano
2549 di cambiare utente e gruppo cui il file appartiene; le funzioni in questione
2550 sono tre: \funcd{chown}, \funcd{fchown} e \funcd{lchown}, ed i loro prototipi
2553 \headdecl{sys/types.h}
2554 \headdecl{sys/stat.h}
2556 \funcdecl{int chown(const char *path, uid\_t owner, gid\_t group)}
2557 \funcdecl{int fchown(int fd, uid\_t owner, gid\_t group)}
2558 \funcdecl{int lchown(const char *path, uid\_t owner, gid\_t group)}
2560 Le funzioni cambiano utente e gruppo di appartenenza di un file ai valori
2561 specificati dalle variabili \param{owner} e \param{group}.
2563 \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
2564 un errore, in caso di errore \var{errno} può assumere i valori:
2566 \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2567 proprietario del file o non è zero, o utente e gruppo non sono validi
2569 Oltre a questi entrambe restituiscono gli errori \errval{EROFS} e
2570 \errval{EIO}; \func{chown} restituisce anche \errval{EFAULT},
2571 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2572 \errval{EACCES}, \errval{ELOOP}; \func{fchown} anche \errval{EBADF}.}
2575 In Linux soltanto l'amministratore (in sostanza un processo con la
2576 \itindex{capabilities} capability \const{CAP\_CHOWN}) può cambiare il
2577 proprietario di un file, seguendo la semantica di BSD che non consente agli
2578 utenti di assegnare i loro file ad altri (per evitare eventuali aggiramenti
2579 delle quote). L'amministratore può cambiare il gruppo di un file, il
2580 proprietario può cambiare il gruppo dei file che gli appartengono solo se il
2581 nuovo gruppo è il suo gruppo primario o uno dei gruppi di cui fa parte.
2583 La funzione \func{chown} segue i link simbolici, per operare direttamente su
2584 un link simbolico si deve usare la funzione \func{lchown}.\footnote{fino alla
2585 versione 2.1.81 in Linux \func{chown} non seguiva i link simbolici, da
2586 allora questo comportamento è stato assegnato alla funzione \func{lchown},
2587 introdotta per l'occasione, ed è stata creata una nuova system call per
2588 \func{chown} che seguisse i link simbolici.} La funzione \func{fchown} opera
2589 su un file aperto, essa è mutuata da BSD, ma non è nello standard POSIX.
2590 Un'altra estensione rispetto allo standard POSIX è che specificando -1 come
2591 valore per \param{owner} e \param{group} i valori restano immutati.
2593 Quando queste funzioni sono chiamate con successo da un processo senza i
2594 privilegi di root entrambi i bit \itindex{suid~bit} \acr{suid} e
2595 \itindex{sgid~bit} \acr{sgid} vengono cancellati. Questo non avviene per il
2596 bit \acr{sgid} nel caso in cui esso sia usato (in assenza del corrispondente
2597 permesso di esecuzione) per indicare che per il file è attivo il
2598 \itindex{mandatory~locking} \textit{mandatory locking}.
2601 \subsection{Un quadro d'insieme sui permessi}
2602 \label{sec:file_riepilogo}
2604 Avendo affrontato in maniera separata il comportamento delle varie funzioni ed
2605 il significato dei singoli bit dei permessi sui file, vale la pena fare un
2606 riepilogo in cui si riassumono le caratteristiche di ciascuno di essi, in modo
2607 da poter fornire un quadro d'insieme.
2609 In tab.~\ref{tab:file_fileperm_bits} si sono riassunti gli effetti dei vari
2610 bit dei permessi per un file; per quanto riguarda l'applicazione dei permessi
2611 per proprietario, gruppo ed altri si ricordi quanto illustrato in
2612 sez.~\ref{sec:file_perm_overview}. Per compattezza, nella tabelle si sono
2613 specificati i bit di \itindex{suid~bit} \textit{suid}, \itindex{sgid~bit}
2614 \textit{sgid} e \textit{sticky} \itindex{sticky~bit} con la notazione
2615 illustrata anche in fig.~\ref{fig:file_perm_bit}.
2620 \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
2622 \multicolumn{3}{|c|}{special}&
2623 \multicolumn{3}{|c|}{user}&
2624 \multicolumn{3}{|c|}{group}&
2625 \multicolumn{3}{|c|}{other}&
2626 \multirow{2}{*}{\textbf{Operazioni possibili}} \\
2628 \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2631 1&-&-&-&-&-&-&-&-&-&-&-&Se eseguito ha i permessi del proprietario.\\
2632 -&1&-&-&-&1&-&-&-&-&-&-&Se eseguito ha i permessi del gruppo proprietario.\\
2633 -&1&-&-&-&0&-&-&-&-&-&-&Il \itindex{mandatory~locking}
2634 \textit{mandatory locking} è abilitato.\\
2635 -&-&1&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2636 -&-&-&1&-&-&-&-&-&-&-&-&Permesso di lettura per il proprietario.\\
2637 -&-&-&-&1&-&-&-&-&-&-&-&Permesso di scrittura per il proprietario.\\
2638 -&-&-&-&-&1&-&-&-&-&-&-&Permesso di esecuzione per il proprietario.\\
2639 -&-&-&-&-&-&1&-&-&-&-&-&Permesso di lettura per il gruppo proprietario.\\
2640 -&-&-&-&-&-&-&1&-&-&-&-&Permesso di scrittura per il gruppo proprietario.\\
2641 -&-&-&-&-&-&-&-&1&-&-&-&Permesso di esecuzione per il gruppo proprietario.\\
2642 -&-&-&-&-&-&-&-&-&1&-&-&Permesso di lettura per tutti gli altri.\\
2643 -&-&-&-&-&-&-&-&-&-&1&-&Permesso di scrittura per tutti gli altri.\\
2644 -&-&-&-&-&-&-&-&-&-&-&1&Permesso di esecuzione per tutti gli altri.\\
2647 \caption{Tabella riassuntiva del significato dei bit dei permessi per un
2649 \label{tab:file_fileperm_bits}
2652 In tab.~\ref{tab:file_dirperm_bits} si sono invece riassunti gli effetti dei
2653 vari bit dei permessi per una directory; anche in questo caso si sono
2654 specificati i bit di \itindex{suid~bit} \textit{suid}, \itindex{sgid~bit}
2655 \textit{sgid} e \textit{sticky} \itindex{sticky~bit} con la notazione compatta
2656 illustrata in fig.~\ref{fig:file_perm_bit}.
2661 \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
2663 \multicolumn{3}{|c|}{special}&
2664 \multicolumn{3}{|c|}{user}&
2665 \multicolumn{3}{|c|}{group}&
2666 \multicolumn{3}{|c|}{other}&
2667 \multirow{2}{*}{\textbf{Operazioni possibili}} \\
2669 \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2672 1&-&-&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2673 -&1&-&-&-&-&-&-&-&-&-&-&Propaga il gruppo proprietario ai nuovi file
2675 -&-&1&-&-&-&-&-&-&-&-&-&Limita l'accesso in scrittura dei file nella
2677 -&-&-&1&-&-&-&-&-&-&-&-&Permesso di visualizzazione per il proprietario.\\
2678 -&-&-&-&1&-&-&-&-&-&-&-&Permesso di aggiornamento per il proprietario.\\
2679 -&-&-&-&-&1&-&-&-&-&-&-&Permesso di attraversamento per il proprietario.\\
2680 -&-&-&-&-&-&1&-&-&-&-&-&Permesso di visualizzazione per il gruppo
2682 -&-&-&-&-&-&-&1&-&-&-&-&Permesso di aggiornamento per il gruppo
2684 -&-&-&-&-&-&-&-&1&-&-&-&Permesso di attraversamento per il gruppo
2686 -&-&-&-&-&-&-&-&-&1&-&-&Permesso di visualizzazione per tutti gli altri.\\
2687 -&-&-&-&-&-&-&-&-&-&1&-&Permesso di aggiornamento per tutti gli altri.\\
2688 -&-&-&-&-&-&-&-&-&-&-&1&Permesso di attraversamento per tutti gli altri.\\
2691 \caption{Tabella riassuntiva del significato dei bit dei permessi per una
2693 \label{tab:file_dirperm_bits}
2696 Nelle tabelle si è indicato con il carattere ``-'' il fatto che il valore del
2697 bit in questione non è influente rispetto a quanto indicato nella riga della
2698 tabella; la descrizione dell'operazione fa riferimento soltanto alla
2699 combinazione di bit per i quali è stato riportato esplicitamente un valore.
2700 Si rammenti infine che il valore dei bit dei permessi non ha alcun effetto
2701 qualora il processo possieda i privilegi di amministratore.
2705 \section{Caratteristiche e funzionalità avanzate}
2706 \label{sec:file_dir_advances}
2708 Tratteremo qui alcune caratteristiche e funzionalità avanzate della gestione
2709 di file e directory, affrontando anche una serie di estensioni
2710 dell'interfaccia classica dei sistemi unix-like, principalmente utilizzate a
2711 scopi di sicurezza, che sono state introdotte nelle versioni più recenti di
2715 \subsection{Gli attributi estesi}
2716 \label{sec:file_xattr}
2718 \itindbeg{Extended~Attributes}
2720 Nelle sezioni precedenti abbiamo trattato in dettaglio le varie informazioni
2721 che il sistema mantiene negli \itindex{inode} \textit{inode}, e le varie
2722 funzioni che permettono di modificarle. Si sarà notato come in realtà queste
2723 informazioni siano estremamente ridotte. Questo è dovuto al fatto che Unix
2724 origina negli anni '70, quando le risorse di calcolo e di spazio disco erano
2725 minime. Con il venir meno di queste restrizioni è incominciata ad emergere
2726 l'esigenza di poter associare ai file delle ulteriori informazioni astratte
2727 (quelli che vengono chiamati i \textsl{meta-dati}) che però non potevano
2728 trovare spazio nei dati classici mantenuti negli \itindex{inode}
2731 Per risolvere questo problema alcuni sistemi unix-like (e fra questi anche
2732 Linux) hanno introdotto un meccanismo generico che consenta di associare delle
2733 informazioni ai singoli file,\footnote{l'uso più comune è quello della ACL,
2734 che tratteremo nella prossima sezione, ma si possono inserire anche altre
2735 informazioni.} detto \textit{Extended Attributes}. Gli \textsl{attributi
2736 estesi} non sono altro che delle coppie nome/valore che sono associate
2737 permanentemente ad un oggetto sul filesystem, analoghi di quello che sono le
2738 variabili di ambiente (vedi sez.~\ref{sec:proc_environ}) per un processo.
2740 Altri sistemi (come Solaris, MacOS e Windows) hanno adottato un meccanismo
2741 diverso in cui ad un file sono associati diversi flussi di dati, su cui
2742 possono essere mantenute ulteriori informazioni, che possono essere accedute
2743 con le normali operazioni di lettura e scrittura. Questi non vanno confusi con
2744 gli \textit{Extended Attributes} (anche se su Solaris hanno lo stesso nome),
2745 che sono un meccanismo molto più semplice, che pur essendo limitato (potendo
2746 contenere solo una quantità limitata di informazione) hanno il grande
2747 vantaggio di essere molto più semplici da realizzare, più
2748 efficienti,\footnote{cosa molto importante, specie per le applicazioni che
2749 richiedono una gran numero di accessi, come le ACL.} e di garantire
2750 l'atomicità di tutte le operazioni.
2752 In Linux gli attributi estesi sono sempre associati al singolo \itindex{inode}
2753 \textit{inode} e l'accesso viene sempre eseguito in forma atomica, in lettura
2754 il valore corrente viene scritto su un buffer in memoria, mentre la scrittura
2755 prevede che ogni valore precedente sia sovrascritto.
2757 Si tenga presente che non tutti i filesystem supportano gli \textit{Extended
2758 Attributes}, in particolare al momento della scrittura di queste dispense
2759 essi sono presenti solo su \textsl{ext2}, \textsl{ext3} e \textsl{XFS}.
2760 Inoltre a seconda della implementazione ci possono essere dei limiti sulla
2761 quantità di attributi che si possono utilizzare.\footnote{ad esempio nel caso
2762 di \textsl{ext2} ed \textsl{ext3} è richiesto che essi siano contenuti
2763 all'interno di un singolo blocco (pertanto con dimensioni massime pari a
2764 1024, 2048 o 4096 byte a seconda delle dimensioni di quest'ultimo impostate
2765 in fase di creazione del filesystem), mentre con \textsl{XFS} non ci sono
2766 limiti ed i dati vengono memorizzati in maniera diversa (nell'\textit{inode}
2767 stesso, in un blocco a parte, o in una struttura ad albero dedicata) per
2768 mantenerne la scalabilità.} Infine lo spazio utilizzato per mantenere gli
2769 attributi estesi viene tenuto in conto per il calcolo delle quote di utente e
2770 gruppo proprietari del file.
2772 Come meccanismo per mantenere informazioni aggiuntive associate al singolo
2773 file, gli \textit{Extended Attributes} possono avere usi anche molto diversi
2774 fra loro. Per poterli distinguere allora sono stati suddivisi in
2775 \textsl{classi}, a cui poter applicare requisiti diversi per l'accesso e la
2776 gestione. Per questo motivo il nome di un attributo deve essere sempre
2777 specificato nella forma \texttt{namespace.attribute}, dove \texttt{namespace}
2778 fa riferimento alla classe a cui l'attributo appartiene, mentre
2779 \texttt{attribute} è il nome ad esso assegnato. In tale forma il nome di un
2780 attributo esteso deve essere univoco. Al momento\footnote{della scrittura di
2781 questa sezione, kernel 2.6.23, ottobre 2007.} sono state definite le quattro
2782 classi di attributi riportate in tab.~\ref{tab:extended_attribute_class}.
2787 \begin{tabular}{|c|p{10cm}|}
2789 \textbf{Nome} & \textbf{Descrizione} \\
2792 \const{security}& Gli \textit{extended security attributes}: vengono
2793 utilizzati dalle estensioni di sicurezza del kernel (i
2794 \itindex{Linux~Security~Modules} \textit{Linux
2795 Security Modules}), per le realizzazione di meccanismi
2796 evoluti di controllo di accesso come \index{SELinux}
2798 \const{system} & Gli \textit{extended security attributes}: sono usati
2799 dal kernel per memorizzare dati di sistema associati ai
2800 file come le \itindex{Access~Control~List} ACL (vedi
2801 sez.~\ref{sec:file_ACL}) o le \itindex{capabilities}
2802 \textit{capabilities} (vedi
2803 sez.~\ref{sec:proc_capabilities}).\\
2804 \const{trusted} & I \textit{trusted extended attributes}: vengono
2805 utilizzati per poter realizzare in user space
2806 meccanismi che consentano di mantenere delle
2807 informazioni sui file che non devono essere accessibili
2808 ai processi ordinari.\\
2809 \const{user} & Gli \textit{extended user attributes}: utilizzati per
2810 mantenere informazioni aggiuntive sui file (come il
2811 \textit{mime-type}, la codifica dei caratteri o del
2812 file) accessibili dagli utenti.\\
2815 \caption{I nomi utilizzati valore di \texttt{namespace} per distinguere le
2816 varie classi di \textit{Extended Attributes}.}
2817 \label{tab:extended_attribute_class}
2821 Dato che uno degli usi degli \textit{Extended Attributes} è quello che li
2822 impiega per realizzare delle estensioni (come le ACL, \index{SELinux} SELinux,
2823 ecc.) al tradizionale meccanismo dei controlli di accesso di Unix, l'accesso
2824 ai loro valori viene regolato in maniera diversa a seconda sia della loro
2825 classe sia di quali, fra le estensioni che li utilizzano, sono poste in uso.
2826 In particolare, per ciascuna delle classi riportate in
2827 tab.~\ref{tab:extended_attribute_class}, si hanno i seguenti casi:
2828 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
2829 \item[\texttt{security}] L'accesso agli \textit{extended security attributes}
2830 dipende dalle politiche di sicurezza stabilite da loro stessi tramite
2831 l'utilizzo di un sistema di controllo basato sui
2832 \itindex{Linux~Security~Modules} \textit{Linux Security Modules} (ad esempio
2833 \index{SELinux} SELinux). Pertanto l'accesso in lettura o scrittura dipende
2834 dalle politiche di sicurezza implementate all'interno dal modulo di
2835 sicurezza che si sta utilizzando al momento (ciascuno avrà le sue). Se non è
2836 stato caricato nessun modulo di sicurezza l'accesso in lettura sarà
2837 consentito a tutti i processi, mentre quello in scrittura solo ai processi
2838 con privilegi amministrativi dotati della \index{capabilities}
2839 \textit{capability} \const{CAP\_SYS\_ADMIN}.
2841 \item[\texttt{system}] Anche l'accesso agli \textit{extended system
2842 attributes} dipende dalle politiche di accesso che il kernel realizza
2843 anche utilizzando gli stessi valori in essi contenuti. Ad esempio nel caso
2844 delle ACL l'accesso è consentito in lettura ai processi che hanno la
2845 capacità di eseguire una ricerca sul file (cioè hanno il permesso di lettura
2846 sulla directory che contiene il file) ed in scrittura al proprietario del
2847 file o ai processi dotati della \textit{capability} \index{capabilities}
2848 \const{CAP\_FOWNER}.\footnote{vale a dire una politica di accesso analoga a
2849 quella impiegata per gli ordinari permessi dei file.}
2851 \item[\texttt{trusted}] L'accesso ai \textit{trusted extended attributes}, sia
2852 per la lettura che per la scrittura, è consentito soltanto ai processi con
2853 privilegi amministrativi dotati della \index{capabilities}
2854 \textit{capability} \const{CAP\_SYS\_ADMIN}. In questo modo si possono
2855 utilizzare questi attributi per realizzare in user space dei meccanismi di
2856 controllo che accedono ad informazioni non disponibili ai processi ordinari.
2858 \item[\texttt{user}] L'accesso agli \textit{extended user attributes} è
2859 regolato dagli ordinari permessi dei file a cui essi fanno riferimento:
2860 occorre avere il permesso di lettura per leggerli e quello di scrittura per
2861 scriverli o modificarli. Dato l'uso di questi attributi, si è scelto cioè di
2862 applicare per il loro accesso gli stessi criteri che si usano per l'accesso
2863 al contenuto dei file (o delle directory) cui essi fanno riferimento.
2865 Questa scelta vale però soltanto per i file e le directory ordinarie, se
2866 valesse in generale infatti si avrebbe un serio problema di sicurezza dato
2867 che esistono diversi oggetti sul filesystem per i quali è normale avere
2868 avere il permesso di scrittura consentito a tutti gli utenti, come i link
2869 simbolici, o alcuni file di dispositivo come \texttt{/dev/null}. Se fosse
2870 possibile usare su di essi gli \textit{extended user attributes} un utente
2871 qualunque potrebbe inserirvi dati a piacere.\footnote{la cosa è stata notata
2872 su XFS, dove questo comportamento permetteva, non essendovi limiti sullo
2873 spazio occupabile dagli \textit{Extended Attributes}, di bloccare il
2874 sistema riempiendo il disco.}
2876 La semantica del controllo di accesso che abbiamo indicato inoltre non
2877 avrebbe alcun senso al di fuori di file e directory: i permessi di lettura e
2878 scrittura per un file di dispositivo attengono alle capacità di accesso al
2879 dispositivo sottostante,\footnote{motivo per cui si può formattare un disco
2880 anche se \texttt{/dev} è su un filesystem in sola lettura.} mentre per i
2881 link simbolici questi vengono semplicemente ignorati: in nessuno dei due
2882 casi hanno a che fare con il contenuto del file, e nella discussione
2883 relativa all'uso degli \textit{extended user attributes} nessuno è mai stato
2884 capace di indicare una qualche forma sensata di utilizzo degli stessi per
2885 link simbolici o file di dispositivo, e neanche per le fifo o i socket.
2887 Per questo motivo gli \textit{extended user attributes} sono stati
2888 completamente disabilitati per tutto ciò che non sia un file regolare o una
2889 directory.\footnote{si può verificare la semantica adottata consultando il
2890 file \texttt{fs/xattr.c} dei sorgenti del kernel.} Inoltre per le
2891 directory è stata introdotta una ulteriore restrizione, dovuta di nuovo alla
2892 presenza ordinaria di permessi di scrittura completi su directory come
2893 \texttt{/tmp}. Questo è un altro caso particolare, in cui il premesso di
2894 scrittura viene usato, unito alla presenza dello \itindex{sticky~bit}
2895 \textit{sticky bit}, per garantire il permesso di creazione di nuovi file.
2896 Per questo motivo, per evitare eventuali abusi, se una directory ha lo
2897 \itindex{sticky~bit} \textit{sticky bit} attivo sarà consentito scrivere i
2898 suoi \textit{extended user attributes} soltanto se si è proprietari della
2899 stessa, o si hanno i privilegi amministrativi della capability
2900 \index{capabilities} \const{CAP\_FOWNER}.
2903 Le funzioni per la gestione degli attributi estesi, come altre funzioni di
2904 gestione avanzate specifiche di Linux, non fanno parte delle \acr{glibc}, e
2905 sono fornite da una apposita libreria, \texttt{libattr}, che deve essere
2906 installata a parte;\footnote{la versione corrente della libreria è
2907 \texttt{libattr1}, e nel caso si usi Debian la si può installare con il
2908 pacchetto omonimo ed il collegato \texttt{libattr1-dev}.} pertanto se un
2909 programma le utilizza si dovrà indicare esplicitamente l'uso della suddetta
2910 libreria invocando il compilatore con l'opzione \texttt{-lattr}.
2912 Per poter leggere gli attributi estesi sono disponibili tre diverse funzioni,
2913 \funcd{getxattr}, \funcd{lgetxattr} e \funcd{fgetxattr}, che consentono
2914 rispettivamente di richiedere gli attributi relativi a un file, a un link
2915 simbolico e ad un file descriptor; i rispettivi prototipi sono:
2917 \headdecl{sys/types.h}
2918 \headdecl{attr/xattr.h}
2920 \funcdecl{ssize\_t getxattr(const char *path, const char *name, void
2921 *value, size\_t size)}
2923 \funcdecl{ssize\_t lgetxattr(const char *path, const char *name, void
2924 *value, size\_t size)}
2926 \funcdecl{ssize\_t fgetxattr(int filedes, const char *name, void *value,
2929 Le funzioni leggono il valore di un attributo esteso.
2931 \bodydesc{Le funzioni restituiscono un intero positivo che indica la
2932 dimensione dell'attributo richiesto in caso di successo, e $-1$ in caso di
2933 errore, nel qual caso \var{errno} assumerà i valori:
2935 \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
2936 \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
2937 non è sufficiente per contenere il risultato.
2938 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2939 filesystem o sono disabilitati.
2941 Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
2942 ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
2946 Le funzioni \func{getxattr} e \func{lgetxattr} prendono come primo argomento
2947 un pathname che indica il file di cui si vuole richiedere un attributo, la
2948 sola differenza è che la seconda, se il pathname indica un link simbolico,
2949 restituisce gli attributi di quest'ultimo e non quelli del file a cui esso fa
2950 riferimento. La funzione \func{fgetxattr} prende invece come primo argomento
2951 un numero di file descriptor, e richiede gli attributi del file ad esso
2954 Tutte e tre le funzioni richiedono di specificare nell'argomento \param{name}
2955 il nome dell'attributo di cui si vuole ottenere il valore. Il nome deve essere
2956 indicato comprensivo di prefisso del \textit{namespace} cui appartiene (uno
2957 dei valori di tab.~\ref{tab:extended_attribute_class}) nella forma
2958 \texttt{namespace.attributename}, come stringa terminata da un carattere NUL.
2959 Il suo valore verrà restituito nel buffer puntato dall'argomento \param{value}
2960 per una dimensione massima di \param{size} byte;\footnote{gli attributi estesi
2961 possono essere costituiti arbitrariamente da dati testuali o binari.} se
2962 quest'ultima non è sufficiente si avrà un errore di \errcode{ERANGE}.
2964 Per evitare di dover indovinare la dimensione di un attributo per tentativi si
2965 può eseguire una interrogazione utilizzando un valore nullo per \param{size};
2966 in questo caso non verrà letto nessun dato, ma verrà restituito come valore di
2967 ritorno della funzione chiamata la dimensione totale dell'attributo esteso
2968 richiesto, che si potrà usare come stima per allocare un buffer di dimensioni
2969 sufficienti.\footnote{si parla di stima perché anche se le funzioni
2970 restituiscono la dimensione esatta dell'attributo al momento in cui sono
2971 eseguite, questa potrebbe essere modificata in qualunque momento da un
2972 successivo accesso eseguito da un altro processo.}
2974 Un secondo gruppo di funzioni è quello che consente di impostare il valore di
2975 un attributo esteso, queste sono \funcd{setxattr}, \funcd{lsetxattr} e
2976 \funcd{fsetxattr}, e consentono di operare rispettivamente su un file, su un
2977 link simbolico o specificando un file descriptor; i loro prototipi sono:
2979 \headdecl{sys/types.h}
2980 \headdecl{attr/xattr.h}
2982 \funcdecl{int setxattr(const char *path, const char *name, const void
2983 *value, size\_t size, int flags)}
2985 \funcdecl{int lsetxattr(const char *path, const char *name, const void
2986 *value, size\_t size, int flags)}
2988 \funcdecl{int fsetxattr(int filedes, const char *name, const void *value,
2989 size\_t size, int flags)}
2991 Impostano il valore di un attributo esteso.
2993 \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
2994 errore, nel qual caso \var{errno} assumerà i valori:
2996 \item[\errcode{ENOATTR}] si è usato il flag \const{XATTR\_REPLACE} e
2997 l'attributo richiesto non esiste.
2998 \item[\errcode{EEXIST}] si è usato il flag \const{XATTR\_CREATE} ma
2999 l'attributo esiste già.
3000 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
3001 filesystem o sono disabilitati.
3003 Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
3004 ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
3009 Le tre funzioni prendono come primo argomento un valore adeguato al loro
3010 scopo, usato in maniera del tutto identica a quanto visto in precedenza per le
3011 analoghe che leggono gli attributi estesi. Il secondo argomento \param{name}
3012 deve indicare, anche in questo caso con gli stessi criteri appena visti per le
3013 analoghe \func{getxattr}, \func{lgetxattr} e \func{fgetxattr}, il nome
3014 (completo di suffisso) dell'attributo su cui si vuole operare.
3016 Il valore che verrà assegnato all'attributo dovrà essere preparato nel buffer
3017 puntato da \param{value}, e la sua dimensione totale (in byte) sarà indicata
3018 dall'argomento \param{size}. Infine l'argomento \param{flag} consente di
3019 controllare le modalità di sovrascrittura dell'attributo esteso, esso può
3020 prendere due valori: con \const{XATTR\_REPLACE} si richiede che l'attributo
3021 esista, nel qual caso verrà sovrascritto, altrimenti si avrà errore, mentre
3022 con \const{XATTR\_CREATE} si richiede che l'attributo non esista, nel qual
3023 caso verrà creato, altrimenti si avrà errore ed il valore attuale non sarà
3024 modificato. Utilizzando per \param{flag} un valore nullo l'attributo verrà
3025 modificato se è già presente, o creato se non c'è.
3027 Le funzioni finora illustrate permettono di leggere o scrivere gli attributi
3028 estesi, ma sarebbe altrettanto utile poter vedere quali sono gli attributi
3029 presenti; a questo provvedono le funzioni \funcd{listxattr},
3030 \funcd{llistxattr} e \funcd{flistxattr} i cui prototipi sono:
3032 \headdecl{sys/types.h}
3033 \headdecl{attr/xattr.h}
3035 \funcdecl{ssize\_t listxattr(const char *path, char *list, size\_t size)}
3037 \funcdecl{ssize\_t llistxattr(const char *path, char *list, size\_t size)}
3039 \funcdecl{ssize\_t flistxattr(int filedes, char *list, size\_t size)}
3041 Leggono la lista degli attributi estesi di un file.
3043 \bodydesc{Le funzioni restituiscono un intero positivo che indica la
3044 dimensione della lista in caso di successo, e $-1$ in caso di errore, nel
3045 qual caso \var{errno} assumerà i valori:
3047 \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
3048 non è sufficiente per contenere il risultato.
3049 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
3050 filesystem o sono disabilitati.
3052 Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
3053 ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
3058 Come per le precedenti le tre funzioni leggono gli attributi rispettivamente
3059 di un file, un link simbolico o specificando un file descriptor, da
3060 specificare con il loro primo argomento. Gli altri due argomenti, identici per
3061 tutte e tre, indicano rispettivamente il puntatore \param{list} al buffer dove
3062 deve essere letta la lista e la dimensione \param{size} di quest'ultimo.
3064 La lista viene fornita come sequenza non ordinata dei nomi dei singoli
3065 attributi estesi (sempre comprensivi del prefisso della loro classe) ciascuno
3066 dei quali è terminato da un carattere nullo. I nomi sono inseriti nel buffer
3067 uno di seguito all'altro. Il valore di ritorno della funzione indica la
3068 dimensione totale della lista in byte.
3070 Come per le funzioni di lettura dei singoli attributi se le dimensioni del
3071 buffer non sono sufficienti si avrà un errore, ma è possibile ottenere dal
3072 valore di ritorno della funzione una stima della dimensione totale della lista
3073 usando per \param{size} un valore nullo.
3075 Infine per rimuovere semplicemente un attributo esteso, si ha a disposizione
3076 un ultimo gruppo di funzioni: \funcd{removexattr}, \funcd{lremovexattr} e
3077 \funcd{fremovexattr}; i rispettivi prototipi sono:
3079 \headdecl{sys/types.h}
3080 \headdecl{attr/xattr.h}
3082 \funcdecl{int removexattr(const char *path, const char *name)}
3084 \funcdecl{int lremovexattr(const char *path, const char *name)}
3086 \funcdecl{int fremovexattr(int filedes, const char *name)}
3089 Rimuovono un attributo esteso di un file.
3091 \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
3092 errore, nel qual caso \var{errno} assumerà i valori:
3094 \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
3095 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
3096 filesystem o sono disabilitati.
3098 ed inoltre tutti gli errori di \func{stat}.
3102 Le tre funzioni rimuovono l'attributo esteso indicato dall'argomento
3103 \param{name} rispettivamente di un file, un link simbolico o specificando un
3104 file descriptor, da specificare con il loro primo argomento. Anche in questo
3105 caso l'argomento \param{name} deve essere specificato con le modalità già
3106 illustrate in precedenza per le altre funzioni relative agli attributi estesi.
3109 \itindend{Extended~Attributes}
3111 % TODO trattare gli attributi estesi e le funzioni la documentazione di
3112 % sistema è nei pacchetti libxattr1-dev e attr
3115 \subsection{Le \textit{Access Control List}}
3116 \label{sec:file_ACL}
3119 \itindbeg{Access~Control~List}
3121 Il modello classico dei permessi di Unix, per quanto funzionale ed efficiente,
3122 è comunque piuttosto limitato e per quanto possa aver coperto per lunghi anni
3123 le esigenze più comuni con un meccanismo semplice e potente, non è in grado di
3124 rispondere in maniera adeguata a situazioni che richiedono una gestione
3125 complessa dei permessi di accesso.\footnote{già un requisito come quello di
3126 dare accesso in scrittura ad alcune persone ed in sola lettura ad altre non
3127 si può soddisfare in maniera semplice.}
3129 Per questo motivo erano state progressivamente introdotte nelle varie versioni
3130 di Unix dei meccanismi di gestione dei permessi dei file più flessibili, nella
3131 forma delle cosiddette \textit{Access Control List} (indicate usualmente con
3132 la sigla ACL). Nello sforzo di standardizzare queste funzionalità era stato
3133 creato un gruppo di lavoro il cui scopo era estendere lo standard POSIX 1003
3134 attraverso due nuovi insiemi di specifiche, la POSIX 1003.1e per l'interfaccia
3135 di programmazione e la POSIX 1003.2c per i comandi di shell.
3137 Gli obiettivi erano però forse troppo ambizioni, e nel gennaio del 1998 i
3138 finanziamenti vennero ritirati senza che si fosse arrivati alla definizione di
3139 uno standard, dato però che una parte della documentazione prodotta era di
3140 alta qualità venne deciso di rilasciare al pubblico la diciassettesima bozza
3141 del documento, quella che va sotto il nome di \textit{POSIX 1003.1e Draft 17},
3142 che è divenuta la base sulla quale si definiscono le cosiddette \textit{Posix
3145 A differenza di altri sistemi (ad esempio FreeBSD) nel caso di Linux si è
3146 scelto di realizzare le ACL attraverso l'uso degli
3147 \itindex{Extended~Attributes} \textit{Extended Attributes} (appena trattati in
3148 sez.~\ref{sec:file_xattr}), e fornire tutte le relative funzioni di gestione
3149 tramite una libreria, \texttt{libacl} che nasconde i dettagli implementativi
3150 delle ACL e presenta ai programmi una interfaccia che fa riferimento allo
3151 standard POSIX 1003.1e.
3153 Anche in questo caso le funzioni di questa libreria non fanno parte delle
3154 \acr{glibc} e devono essere installate a parte;\footnote{la versione corrente
3155 della libreria è \texttt{libacl1}, e nel caso si usi Debian la si può
3156 installare con il pacchetto omonimo e con il collegato \texttt{libacl1-dev}
3157 per i file di sviluppo.} pertanto se un programma le utilizza si dovrà
3158 indicare esplicitamente l'uso della libreria \texttt{libacl} invocando il
3159 compilatore con l'opzione \texttt{-lacl}. Si tenga presente inoltre che per
3160 poterle utilizzare le ACL devono essere attivate esplicitamente montando il
3161 filesystem\footnote{che deve supportarle, ma questo è ormai vero per
3162 praticamente tutti i filesystem più comuni, con l'eccezione di NFS per il
3163 quale esiste però un supporto sperimentale.} su cui le si vogliono
3164 utilizzare con l'opzione \texttt{acl} attiva. Dato che si tratta di una
3165 estensione è infatti opportuno utilizzarle soltanto laddove siano necessarie.
3167 Una ACL è composta da un insieme di voci, e ciascuna voce è a sua volta
3168 costituita da un \textsl{tipo}, da un eventuale
3169 \textsl{qualificatore},\footnote{deve essere presente soltanto per le voci di
3170 tipo \const{ACL\_USER} e \const{ACL\_GROUP}.} e da un insieme di permessi.
3171 Ad ogni oggetto sul filesystem si può associare una ACL che ne governa i
3172 permessi di accesso, detta \textit{access ACL}. Inoltre per le directory si
3173 può impostare una ACL aggiuntiva, detta \textit{default ACL}, che serve ad
3174 indicare quale dovrà essere la ACL assegnata di default nella creazione di un
3175 file all'interno della directory stessa. Come avviene per i permessi le ACL
3176 possono essere impostate solo del proprietario del file, o da un processo con
3177 la capability \index{capabilities} \const{CAP\_FOWNER}.
3182 \begin{tabular}{|l|p{8cm}|}
3184 \textbf{Tipo} & \textbf{Descrizione} \\
3187 \const{ACL\_USER\_OBJ} & voce che contiene i diritti di accesso del
3188 proprietario del file.\\
3189 \const{ACL\_USER} & voce che contiene i diritti di accesso per
3190 l'utente indicato dal rispettivo
3192 \const{ACL\_GROUP\_OBJ}& voce che contiene i diritti di accesso del
3193 gruppo proprietario del file.\\
3194 \const{ACL\_GROUP} & voce che contiene i diritti di accesso per
3195 il gruppo indicato dal rispettivo
3197 \const{ACL\_MASK} & voce che contiene la maschera dei massimi
3198 permessi di accesso che possono essere garantiti
3199 da voci del tipo \const{ACL\_USER},
3200 \const{ACL\_GROUP} e \const{ACL\_GROUP\_OBJ}.\\
3201 \const{ACL\_OTHER} & voce che contiene i diritti di accesso di chi
3202 non corrisponde a nessuna altra voce dell'ACL.\\
3205 \caption{Le costanti che identificano i tipi delle voci di una ACL.}
3206 \label{tab:acl_tag_types}
3209 L'elenco dei vari tipi di voci presenti in una ACL, con una breve descrizione
3210 del relativo significato, è riportato in tab.~\ref{tab:acl_tag_types}. Tre di
3211 questi tipi, \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e
3212 \const{ACL\_OTHER}, corrispondono direttamente ai tre permessi ordinari dei
3213 file (proprietario, gruppo proprietario e tutti gli altri) e per questo una
3214 ACL valida deve sempre contenere una ed una sola voce per ciascuno di questi
3217 Una ACL può poi contenere un numero arbitrario di voci di tipo
3218 \const{ACL\_USER} e \const{ACL\_GROUP}, ciascuna delle quali indicherà i
3219 permessi assegnati all'utente e al gruppo indicato dal relativo qualificatore;
3220 ovviamente ciascuna di queste voci dovrà fare riferimento ad un utente o ad un
3221 gruppo diverso, e non corrispondenti a quelli proprietari del file. Inoltre se
3222 in una ACL esiste una voce di uno di questi due tipi è obbligatoria anche la
3223 presenza di una ed una sola voce di tipo \const{ACL\_MASK}, che negli altri
3226 Quest'ultimo tipo di voce contiene la maschera dei permessi che possono essere
3227 assegnati tramite voci di tipo \const{ACL\_USER}, \const{ACL\_GROUP} e
3228 \const{ACL\_GROUP\_OBJ}; se in una di queste voci si fosse specificato un
3229 permesso non presente in \const{ACL\_MASK} questo verrebbe ignorato. L'uso di
3230 una ACL di tipo \const{ACL\_MASK} è di particolare utilità quando essa
3231 associata ad una \textit{default ACL} su una directory, in quanto i permessi
3232 così specificati verranno ereditati da tutti i file creati nella stessa
3233 directory. Si ottiene così una sorta di \itindex{umask} \textit{umask}
3234 associata ad un oggetto sul filesystem piuttosto che a un processo.
3236 Dato che le ACL vengono a costituire una estensione dei permessi ordinari, uno
3237 dei problemi che si erano posti nella loro standardizzazione era appunto
3238 quello della corrispondenza fra questi e le ACL. Come accennato i permessi
3239 ordinari vengono mappati le tre voci di tipo \const{ACL\_USER\_OBJ},
3240 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} che devono essere presenti in
3241 qualunque ACL; un cambiamento ad una di queste voci viene automaticamente
3242 riflesso sui permessi ordinari dei file\footnote{per permessi ordinari si
3243 intende quelli mantenuti nell'\textit{inode}, che devono restare dato che un
3244 filesystem può essere montato senza abilitare le ACL.} e viceversa. In
3245 realtà la mappatura è diretta solo per le voci \const{ACL\_USER\_OBJ} e
3246 \const{ACL\_OTHER}, nel caso di \const{ACL\_GROUP\_OBJ} questo vale soltanto
3247 se non è presente una voce di tipo \const{ACL\_MASK}, se invece questa è
3248 presente verranno tolti dai permessi di \const{ACL\_GROUP\_OBJ} tutti quelli
3249 non presenti in \const{ACL\_MASK}.\footnote{questo diverso comportamento a
3250 seconda delle condizioni è stato introdotto dalla standardizzazione
3251 \textit{POSIX 1003.1e Draft 17} per mantenere il comportamento invariato sui
3252 sistemi dotati di ACL per tutte quelle applicazioni che sono conformi
3253 soltanto all'ordinario standard \textit{POSIX 1003.1}.}
3255 Un secondo aspetto dell'incidenza delle ACL sul comportamento del sistema è
3256 quello relativo alla creazione di nuovi file,\footnote{o oggetti sul
3257 filesystem, il comportamento discusso vale per le funzioni \func{open} e
3258 \func{creat} (vedi sez.~\ref{sec:file_open}), \func{mkdir} (vedi
3259 sez.~\ref{sec:file_dir_creat_rem}), \func{mknod} e \func{mkfifo} (vedi
3260 sez.~\ref{sec:file_mknod}).} che come accennato può essere modificato dalla
3261 presenza di una \textit{default ACL} sulla directory che contiene quel file.
3262 Se questa non c'è valgono le regole usuali illustrate in
3263 sez.~\ref{sec:file_perm_management}, per cui essi sono determinati dalla
3264 \itindex{umask} \textit{umask} del processo, e la sola differenza è che i
3265 permessi ordinari da esse risultanti vengono automaticamente rimappati anche
3266 su una ACL di accesso assegnata automaticamente al nuovo file, che contiene
3267 soltanto le tre corrispondenti voci di tipo \const{ACL\_USER\_OBJ},
3268 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER}.
3270 Se invece è presente una ACL di default sulla directory che contiene il nuovo
3271 file questa diventerà automaticamente la sua ACL di accesso, a meno di non
3272 aver indicato, nelle funzioni di creazione che lo consentono, uno specifico
3273 valore per i permessi ordinari;\footnote{tutte le funzioni citate in
3274 precedenza supportano un argomento \var{mode} che indichi un insieme di
3275 permessi iniziale.} in tal caso saranno eliminati dalle voci corrispondenti
3276 nella ACL tutti quelli non presenti in tale indicazione.
3278 Dato che questa è la ragione che ha portato alla loro creazione, la principale
3279 modifica introdotta con la presenza della ACL è quella alle regole del
3280 controllo di accesso ai file illustrate in sez.~\ref{sec:file_perm_overview}.
3281 Come nel caso ordinario per il controllo vengono sempre utilizzati gli
3282 identificatori del gruppo \textit{effective} del processo, ma in presenza di
3283 ACL i passi attraverso i quali viene stabilito se esso ha diritto di accesso
3286 \item Se l'user-ID del processo è nullo l'accesso è sempre garantito senza
3288 \item Se l'user-ID del processo corrisponde al proprietario del file allora:
3290 \item se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
3291 l'accesso è consentito;
3292 \item altrimenti l'accesso è negato.
3294 \item Se l'user-ID del processo corrisponde ad un qualunque qualificatore
3295 presente in una voce \const{ACL\_USER} allora:
3297 \item se la voce \const{ACL\_USER} corrispondente e la voce
3298 \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
3300 \item altrimenti l'accesso è negato.
3302 \item Se è il group-ID del processo o uno dei group-ID supplementari
3303 corrisponde al gruppo proprietario del file allora:
3305 \item se la voce \const{ACL\_GROUP\_OBJ} e una eventuale voce
3306 \const{ACL\_MASK} (se non vi sono voci di tipo \const{ACL\_GROUP} questa
3307 può non essere presente) contengono entrambe il permesso richiesto,
3308 l'accesso è consentito;
3309 \item altrimenti l'accesso è negato.
3311 \item Se è il group-ID del processo o uno dei group-ID supplementari
3312 corrisponde ad un qualunque qualificatore presente in una voce
3313 \const{ACL\_GROUP} allora:
3315 \item se la voce \const{ACL\_GROUP} corrispondente e la voce
3316 \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
3318 \item altrimenti l'accesso è negato.
3320 \item Se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
3321 l'accesso è consentito, altrimenti l'accesso è negato.
3324 I passi di controllo vengono eseguiti esattamente in questa sequenza, e la
3325 decisione viene presa non appena viene trovata una corrispondenza con gli
3326 identificatori del processo. Questo significa che i permessi presenti in una
3327 voce di tipo \const{ACL\_USER} hanno la precedenza sui permessi ordinari
3328 associati al gruppo proprietario del file (vale a dire su
3329 \const{ACL\_GROUP\_OBJ}).
3331 Per la gestione delle ACL lo standard \textit{POSIX 1003.1e Draft 17} ha
3332 previsto delle apposite funzioni ed tutta una serie di tipi di dati
3333 dedicati;\footnote{fino a definire un tipo di dato e delle costanti apposite
3334 per identificare i permessi standard di lettura, scrittura ed esecuzione.}
3335 tutte le operazioni devono essere effettuate attraverso tramite questi tipi di
3336 dati, che incapsulano tutte le informazioni contenute nelle ACL. La prima di
3337 queste funzioni che prendiamo in esame è \funcd{acl\_init}, il cui prototipo
3340 \headdecl{sys/types.h}
3341 \headdecl{sys/acl.h}
3343 \funcdecl{acl\_t acl\_init(int count)}
3345 Inizializza un'area di lavoro per una ACL di \param{count} voci.
3347 \bodydesc{La funzione restituisce un puntatore all'area di lavoro in caso di
3348 successo e \const{NULL} in caso di errore, nel qual caso \var{errno}
3349 assumerà uno dei valori:
3351 \item[\errcode{EINVAL}] il valore di \param{count} è negativo.
3352 \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile.
3357 La funzione alloca ed inizializza un'area di memoria che verrà usata per
3358 mantenere i dati di una ACL contenente fino ad un massimo di \const{count}
3359 voci. La funzione ritorna un valore di tipo \type{acl\_t}, da usare in tutte
3360 le altre funzioni che operano sulla ACL. La funzione si limita alla
3361 allocazione iniziale e non inserisce nessun valore nella ACL che resta vuota.
3362 Si tenga presente che pur essendo \type{acl\_t} un tipo opaco che identifica
3363 ``\textsl{l'oggetto}'' ACL, il valore restituito dalla funzione non è altro
3364 che un puntatore all'area di memoria allocata per i dati richiesti; pertanto
3365 in caso di fallimento verrà restituito un puntatore nullo e si dovrà
3366 confrontare il valore di ritorno della funzione con ``\code{(acl\_t) NULL}''.
3368 Una volta che si siano completate le operazioni sui dati di una ACL la memoria
3369 allocata dovrà essere liberata esplicitamente attraverso una chiamata alla
3370 funzione \funcd{acl\_free}, il cui prototipo è:
3372 \headdecl{sys/types.h}
3373 \headdecl{sys/acl.h}
3375 \funcdecl{int acl\_free(void * obj\_p)}
3377 Disalloca la memoria riservata per i dati di una ACL.
3379 \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ se
3380 \param{obj\_p} non è un puntatore valido, nel qual caso \var{errno}
3381 assumerà il valore \errcode{EINVAL}
3385 Si noti come la funzione richieda come argomento un puntatore di tipo
3386 ``\ctyp{void *}'', essa infatti può essere usata non solo per liberare la
3387 memoria allocata per i dati di una ACL, ma anche per quella usata per creare
3388 le stringhe di descrizione testuale delle ACL o per ottenere i valori dei
3389 qualificatori di una voce; pertanto a seconda dei casi occorrerà eseguire un
3390 \textit{cast} a ``\ctyp{void *}'' del tipo di dato di cui si vuole eseguire la
3391 disallocazione. Si tenga presente poi che oltre a \func{acl\_init} esistono
3392 molte altre funzioni che possono allocare memoria per i dati delle ACL, è
3393 pertanto opportuno tenere traccia di tutte queste funzioni perché alla fine
3394 delle operazioni tutta la memoria allocata dovrà essere liberata con
3397 Una volta che si abbiano a disposizione i dati di una ACL tramite il
3398 riferimento ad oggetto di tipo \type{acl\_t} questi potranno essere copiati
3399 con la funzione \funcd{acl\_dup}, il cui prototipo è:
3401 \headdecl{sys/types.h}
3402 \headdecl{sys/acl.h}
3404 \funcdecl{acl\_t acl\_dup(acl\_t acl)}
3406 Crea una copia della ACL \param{acl}.
3408 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3409 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3410 \var{errno} assumerà uno dei valori:
3412 \item[\errcode{EINVAL}] l'argomento \param{acl} non è un puntatore valido
3414 \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile per eseguire
3420 La funzione crea una copia dei dati della ACL indicata tramite l'argomento
3421 \param{acl}, allocando autonomamente tutto spazio necessario alla copia e
3422 restituendo un secondo oggetto di tipo \type{acl\_t} come riferimento a
3423 quest'ultima. Valgono per questo le stesse considerazioni fatte per il valore
3424 di ritorno di \func{acl\_init}, ed in particolare il fatto che occorrerà
3425 prevedere una ulteriore chiamata esplicita a \func{acl\_free} per liberare la
3426 memoria occupata dalla copia.
3428 Se si deve creare una ACL manualmente l'uso di \func{acl\_init} è scomodo,
3429 dato che la funzione restituisce una ACL vuota, una alternativa allora è usare
3430 \funcd{acl\_from\_mode} che consente di creare una ACL a partire da un valore
3431 di permessi ordinari, il prototipo della funzione è:
3433 \headdecl{sys/types.h}
3434 \headdecl{sys/acl.h}
3436 \funcdecl{acl\_t acl\_from\_mode(mode\_t mode)}
3438 Crea una ACL inizializzata con i permessi di \param{mode}.
3440 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3441 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3442 \var{errno} assumerà il valore \errval{ENOMEM}.
3447 La funzione restituisce una ACL inizializzata con le tre voci obbligatorie
3448 \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} già
3449 impostate secondo la corrispondenza ai valori dei permessi ordinari indicati
3450 dalla maschera passata nell'argomento \param{mode}. Questa funzione è una
3451 estensione usata dalle ACL di Linux e non è portabile, ma consente di
3452 semplificare l'inizializzazione in maniera molto comoda.
3454 Altre due funzioni che consentono di creare una ACL già inizializzata sono
3455 \funcd{acl\_get\_fd} e \funcd{acl\_get\_file}, che però sono per lo più
3456 utilizzate per leggere la ACL corrente di un file; i rispettivi prototipi
3459 \headdecl{sys/types.h}
3460 \headdecl{sys/acl.h}
3462 \funcdecl{acl\_t acl\_get\_file(const char *path\_p, acl\_type\_t type)}
3463 \funcdecl{acl\_t acl\_get\_fd(int fd)}
3465 Ottiene i dati delle ACL di un file.
3467 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3468 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3469 \var{errno} assumerà uno dei valori:
3471 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3472 \item[\errcode{ENOTSUP}] il filesystem cui fa riferimento il file non
3475 ed inoltre \errval{EBADF} per \func{acl\_get\_fd}, ed \errval{EINVAL} per
3476 valori scorretti di \param{type} e tutti i possibili errori per l'accesso ad
3477 un file per \func{acl\_get\_file}.
3482 Le due funzioni ritornano, con un oggetto di tipo \type{acl\_t}, il valore
3483 della ACL correntemente associata ad un file, che può essere identificato
3484 tramite un file descriptor usando \func{acl\_get\_fd} o con un pathname usando
3485 \func{acl\_get\_file}. Nel caso di quest'ultima funzione, che può richiedere
3486 anche la ACL relativa ad una directory, il secondo argomento \param{type}
3487 consente di specificare se si vuole ottenere la ACL di default o quella di
3488 accesso. Questo argomento deve essere di tipo \type{acl\_type\_t} e può
3489 assumere solo i due valori riportati in tab.~\ref{tab:acl_type}.
3494 \begin{tabular}{|l|l|}
3496 \textbf{Tipo} & \textbf{Descrizione} \\
3499 \const{ACL\_TYPE\_ACCESS} & indica una ACL di accesso.\\
3500 \const{ACL\_TYPE\_DEFAULT}& indica una ACL di default.\\
3503 \caption{Le costanti che identificano il tipo di ACL.}
3504 \label{tab:acl_type}
3507 Si tenga presente che nel caso di \func{acl\_get\_file} occorrerà che il
3508 processo chiamante abbia privilegi di accesso sufficienti a poter leggere gli
3509 attributi estesi dei file (come illustrati in sez.~\ref{sec:file_xattr});
3510 inoltre una ACL di tipo \const{ACL\_TYPE\_DEFAULT} potrà essere richiesta
3511 soltanto per una directory, e verrà restituita solo se presente, altrimenti
3512 verrà restituita una ACL vuota.
3514 Infine si potrà creare una ACL direttamente dalla sua rappresentazione
3515 testuale con la funzione \funcd{acl\_from\_text}, il cui prototipo è:
3517 \headdecl{sys/types.h}
3518 \headdecl{sys/acl.h}
3520 \funcdecl{acl\_t acl\_from\_text(const char *buf\_p)}
3522 Crea una ACL a partire dalla sua rappresentazione testuale.
3524 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3525 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3526 \var{errno} assumerà uno dei valori:
3528 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3529 \item[\errcode{EINVAL}] la rappresentazione testuale all'indirizzo
3530 \param{buf\_p} non è valida.
3536 La funzione prende come argomento il puntatore ad un buffer dove si è inserita
3537 la rappresentazione testuale della ACL che si vuole creare, la memoria
3538 necessaria viene automaticamente allocata ed in caso di successo viene
3539 restituito come valore di ritorno un oggetto di tipo \type{acl\_t} con il
3540 contenuto della stessa, che come per le precedenti funzioni, dovrà essere
3541 disallocato esplicitamente al termine del suo utilizzo.
3543 La rappresentazione testuale di una ACL è quella usata anche dai comandi
3544 ordinari per la gestione delle ACL (\texttt{getfacl} e \texttt{setfacl}), che
3545 prevede due diverse forme, estesa e breve, entrambe supportate da
3546 \func{acl\_from\_text}. La forma estesa prevede che sia specificata una voce
3547 per riga, nella forma:
3549 tipo:qualificatore:permessi
3551 dove il tipo può essere uno fra \texttt{user}, \texttt{group}, \texttt{other}
3552 e \texttt{mask}. Il qualificatore è presente solo per \texttt{user} e
3553 \texttt{group} e indica l'utente o il gruppo a cui la voce si riferisce; i
3554 permessi sono espressi con una tripletta di lettere analoga a quella usata per
3555 i permessi dei file.\footnote{vale a dire \texttt{r} per il permesso di
3556 lettura, \texttt{w} per il permesso di scrittura, \texttt{x} per il permesso
3557 di esecuzione (scritti in quest'ordine) e \texttt{-} per l'assenza del
3560 Va precisato che i due tipi \texttt{user} e \texttt{group} sono usati
3561 rispettivamente per indicare delle voci relative ad utenti e
3562 gruppi,\footnote{cioè per voci di tipo \const{ACL\_USER\_OBJ} e
3563 \const{ACL\_USER} per \texttt{user} e \const{ACL\_GROUP\_OBJ} e
3564 \const{ACL\_GROUP} per \texttt{group}.} applicate sia a quelli proprietari
3565 del file che a quelli generici; quelle dei proprietari si riconoscono per
3566 l'assenza di un qualificatore, ed in genere si scrivono per prima delle altre.
3567 Il significato delle voci di tipo \texttt{mask} e \texttt{mark} è evidente. In
3568 questa forma si possono anche inserire dei commenti precedendoli con il
3569 carattere ``\texttt{\#}''.
3571 La forma breve prevede invece la scrittura delle singole voci su una riga,
3572 separate da virgole; come specificatori del tipo di voce si possono usare le
3573 iniziali dei valori usati nella forma estesa (cioè ``\texttt{u}'',
3574 ``\texttt{g}'', ``\texttt{o}'' e ``\texttt{m}''), mentre le altri parte della
3575 voce sono le stesse. In questo caso non sono consentiti permessi.
3577 Per la conversione inversa, che consente di ottenere la rappresentazione
3578 testuale di una ACL, sono invece disponibili due funzioni, la prima delle due,
3579 di uso più immediato, è \funcd{acl\_to\_text}, il cui prototipo è:
3581 \headdecl{sys/types.h}
3582 \headdecl{sys/acl.h}
3584 \funcdecl{char * acl\_to\_text(acl\_t acl, ssize\_t *len\_p)}
3586 Produce la rappresentazione testuale di una ACL.
3588 \bodydesc{La funzione restituisce il puntatore ad una stringa con la
3589 rappresentazione testuale della ACL in caso di successo e
3590 \code(acl\_t){NULL} in caso di errore, nel qual caso \var{errno} assumerà
3593 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3594 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
3600 La funzione restituisce il puntatore ad una stringa terminata da NUL
3601 contenente la rappresentazione in forma estesa della ACL passata come
3602 argomento, ed alloca automaticamente la memoria necessaria. Questa dovrà poi
3603 essere liberata, quando non più necessaria, con \func{acl\_free}. Se
3604 nell'argomento \param{len\_p} si passa un valore puntatore ad una variabile
3605 intera in questa verrà restituita la dimensione della stringa con la
3606 rappresentazione testuale (non comprendente il carattere nullo finale).
3608 La seconda funzione, \funcd{acl\_to\_any\_text}, permette di controllare con
3609 dovizia di dettagli la generazione della stringa contenente la
3610 rappresentazione testuale della ACL, il suo prototipo è:
3612 \headdecl{sys/types.h}
3613 \headdecl{sys/acl.h}
3615 \funcdecl{char * acl\_to\_any\_text(acl\_t acl, const char *prefix, char
3616 separator, int options)}
3618 Produce la rappresentazione testuale di una ACL.
3620 \bodydesc{La funzione restituisce il puntatore ad una stringa con la
3621 rappresentazione testuale della ACL in caso di successo e \code{NULL} in
3622 caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
3624 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3625 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
3631 La funzione converte in formato testo la ACL indicata dall'argomento
3632 \param{acl}, usando il carattere \param{separator} come separatore delle
3633 singole voci; se l'argomento \param{prefix} non è nullo la stringa da esso
3634 indicata viene utilizzata come prefisso per le singole voci.
3636 L'ultimo argomento, \param{options}, consente di controllare la modalità con
3637 cui viene generata la rappresentazione testuale. Un valore nullo fa si che
3638 vengano usati gli identificatori standard \texttt{user}, \texttt{group},
3639 \texttt{other} e \texttt{mask} con i nomi di utenti e gruppi risolti rispetto
3640 ai loro valori numerici. Altrimenti si può specificare un valore in forma di
3641 maschera binaria, da ottenere con un OR aritmetico dei valori riportati in
3642 tab.~\ref{tab:acl_to_text_options}.
3647 \begin{tabular}{|l|p{8cm}|}
3649 \textbf{Tipo} & \textbf{Descrizione} \\
3652 \const{TEXT\_ABBREVIATE} & stampa le voci in forma abbreviata.\\
3653 \const{TEXT\_NUMERIC\_IDS} & non effettua la risoluzione numerica di
3654 user-ID e group-ID.\\
3655 \const{TEXT\_SOME\_EFFECTIVE}& per ciascuna voce che contiene permessi che
3656 vengono eliminati dalla \const{ACL\_MASK}
3657 viene generato un commento con i permessi
3658 effettivamente risultanti; il commento è
3659 separato con un tabulatore.\\
3660 \const{TEXT\_ALL\_EFFECTIVE} & viene generato un commento con i permessi
3661 effettivi per ciascuna voce che contiene
3662 permessi citati nella \const{ACL\_MASK},
3663 anche quando questi non vengono modificati
3664 da essa; il commento è separato con un
3666 \const{TEXT\_SMART\_INDENT} & da usare in combinazione con le precedenti
3667 \const{TEXT\_SOME\_EFFECTIVE} e
3668 \const{TEXT\_ALL\_EFFECTIVE} aumenta
3669 automaticamente il numero di spaziatori
3670 prima degli eventuali commenti in modo da
3671 mantenerli allineati.\\
3674 \caption{Possibili valori per l'argomento \param{options} di
3675 \func{acl\_to\_any\_text}.}
3676 \label{tab:acl_to_text_options}
3679 Come per \func{acl\_to\_text} anche in questo caso il buffer contenente la
3680 rappresentazione testuale dell'ACL, di cui la funzione restituisce
3681 l'indirizzo, viene allocato automaticamente, e dovrà essere esplicitamente
3682 disallocato con una chiamata ad \func{acl\_free}. Si tenga presente infine che
3683 questa funzione è una estensione specifica di Linux, e non è presente nella
3684 bozza dello standard POSIX.1e.
3687 \itindend{Access~Control~List}
3690 % TODO trattare le ACL, la documentazione di sistema è nei pacchetti
3692 % vedi anche http://www.suse.de/~agruen/acl/linux-acls/online/
3696 \subsection{La funzione \func{chroot}}
3697 \label{sec:file_chroot}
3699 % TODO introdurre nuova sezione sulle funzionalità di sicurezza avanzate, con
3700 % dentro chroot SELinux e AppArmor ???
3702 Benché non abbia niente a che fare con permessi, utenti e gruppi, la funzione
3703 \func{chroot} viene usata spesso per restringere le capacità di accesso di un
3704 programma ad una sezione limitata del filesystem, per cui ne parleremo in
3707 Come accennato in sez.~\ref{sec:proc_fork} ogni processo oltre ad una
3708 directory di lavoro, ha anche una directory \textsl{radice}\footnote{entrambe
3709 sono contenute in due campi (rispettivamente \var{pwd} e \var{root}) di
3710 \struct{fs\_struct}; vedi fig.~\ref{fig:proc_task_struct}.} che, pur essendo
3711 di norma corrispondente alla radice dell'albero di file e directory come visto
3712 dal kernel (ed illustrato in sez.~\ref{sec:file_organization}), ha per il
3713 processo il significato specifico di directory rispetto alla quale vengono
3714 risolti i \itindsub{pathname}{assoluto}\textit{pathname}
3715 assoluti.\footnote{cioè quando un processo chiede la risoluzione di un
3716 \textit{pathname}, il kernel usa sempre questa directory come punto di
3717 partenza.} Il fatto che questo valore sia specificato per ogni processo apre
3718 allora la possibilità di modificare le modalità di risoluzione dei
3719 \textit{pathname} assoluti da parte di un processo cambiando questa directory,
3720 così come si fa coi \itindsub{pathname}{relativo}\textit{pathname} relativi
3721 cambiando la directory di lavoro.
3723 Normalmente la directory radice di un processo coincide anche con la radice
3724 del filesystem usata dal kernel, e dato che il suo valore viene ereditato dal
3725 padre da ogni processo figlio, in generale i processi risolvono i
3726 \itindsub{pathname}{assoluto} \textit{pathname} assoluti a partire sempre
3727 dalla stessa directory, che corrisponde alla radice del sistema.
3729 In certe situazioni però è utile poter impedire che un processo possa accedere
3730 a tutto il filesystem; per far questo si può cambiare la sua directory radice
3731 con la funzione \funcd{chroot}, il cui prototipo è:
3732 \begin{prototype}{unistd.h}{int chroot(const char *path)}
3733 Cambia la directory radice del processo a quella specificata da
3736 \bodydesc{La funzione restituisce zero in caso di successo e -1 per
3737 un errore, in caso di errore \var{errno} può assumere i valori:
3739 \item[\errcode{EPERM}] l'user-ID effettivo del processo non è zero.
3741 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
3742 \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EACCES}, \errval{ELOOP};
3743 \errval{EROFS} e \errval{EIO}.}
3745 \noindent in questo modo la directory radice del processo diventerà
3746 \param{path} (che ovviamente deve esistere) ed ogni
3747 \itindsub{pathname}{assoluto}\textit{pathname} assoluto usato dalle funzioni
3748 chiamate nel processo sarà risolto a partire da essa, rendendo impossibile
3749 accedere alla parte di albero sovrastante. Si ha così quella che viene
3750 chiamata una \textit{chroot jail}, in quanto il processo non può più accedere
3751 a file al di fuori della sezione di albero in cui è stato
3752 \textsl{imprigionato}.
3754 Solo un processo con i privilegi di amministratore può usare questa funzione,
3755 e la nuova radice, per quanto detto in sez.~\ref{sec:proc_fork}, sarà ereditata
3756 da tutti i suoi processi figli. Si tenga presente però che la funzione non
3757 cambia la directory di lavoro, che potrebbe restare fuori dalla \textit{chroot
3760 Questo è il motivo per cui la funzione è efficace solo se dopo averla eseguita
3761 si cedono i privilegi di root. Infatti se per un qualche motivo il processo
3762 resta con la directory di lavoro fuori dalla \textit{chroot jail}, potrà
3763 comunque accedere a tutto il resto del filesystem usando
3764 \itindsub{pathname}{relativo}\textit{pathname} relativi, i quali, partendo
3765 dalla directory di lavoro che è fuori della \textit{chroot jail}, potranno
3766 (con l'uso di ``\texttt{..}'') risalire fino alla radice effettiva del
3769 Ma se ad un processo restano i privilegi di amministratore esso potrà comunque
3770 portare la sua directory di lavoro fuori dalla \textit{chroot jail} in cui si
3771 trova. Basta infatti creare una nuova \textit{chroot jail} con l'uso di
3772 \func{chroot} su una qualunque directory contenuta nell'attuale directory di
3773 lavoro. Per questo motivo l'uso di questa funzione non ha molto senso quando
3774 un processo necessita dei privilegi di root per le sue normali operazioni.
3776 Un caso tipico di uso di \func{chroot} è quello di un server FTP anonimo, in
3777 questo caso infatti si vuole che il server veda solo i file che deve
3778 trasferire, per cui in genere si esegue una \func{chroot} sulla directory che
3779 contiene i file. Si tenga presente però che in questo caso occorrerà
3780 replicare all'interno della \textit{chroot jail} tutti i file (in genere
3781 programmi e librerie) di cui il server potrebbe avere bisogno.
3785 % LocalWords: sez like filesystem unlink MacOS Windows VMS inode kernel unistd
3786 % LocalWords: un'etichetta int const char oldpath newpath errno EXDEV EPERM st
3787 % LocalWords: EEXIST EMLINK EACCES ENAMETOOLONG ENOTDIR EFAULT ENOMEM EROFS ls
3788 % LocalWords: ELOOP ENOSPC EIO pathname nlink stat vfat fsck EISDIR ENOENT cap
3789 % LocalWords: POSIX socket fifo sticky root system call count crash nell' init
3790 % LocalWords: descriptor remove rename rmdir stdio glibc libc NFS DT obj dup
3791 % LocalWords: ENOTEMPTY EBUSY mount point EINVAL soft symbolic tab symlink fig
3792 % LocalWords: dangling access chdir chmod chown creat exec lchown lstat mkdir
3793 % LocalWords: mkfifo mknod opendir pathconf readlink truncate path buff size
3794 % LocalWords: grub bootloader grep linux MAXSYMLINKS cat VFS sys dirname fcntl
3795 % LocalWords: dev umask IFREG IFBLK IFCHR IFIFO SVr sgid BSD SVID NULL from to
3796 % LocalWords: stream dirent EMFILE ENFILE dirfd SOURCE fchdir readdir struct
3797 % LocalWords: EBADF namlen HAVE thread entry result value argument fileno ino
3798 % LocalWords: name TYPE OFF RECLEN UNKNOWN REG SOCK CHR BLK type IFTODT DTTOIF
3799 % LocalWords: DTYPE off reclen seekdir telldir void rewinddir closedir select
3800 % LocalWords: namelist compar malloc qsort alphasort versionsort strcoll myls
3801 % LocalWords: strcmp DirScan direntry while current working home shell pwd get
3802 % LocalWords: getcwd ERANGE getwd change fd race condition tmpnam getfacl mark
3803 % LocalWords: string tmpdir TMP tempnam pfx TMPNAME suid tmp EXCL tmpfile pid
3804 % LocalWords: EINTR mktemp mkstemp stlib template filename XXXXXX OpenBSD buf
3805 % LocalWords: mkdtemp fstat filedes nell'header padding ISREG ISDIR ISCHR IFMT
3806 % LocalWords: ISBLK ISFIFO ISLNK ISSOCK IFSOCK IFLNK IFDIR ISUID UID ISGID GID
3807 % LocalWords: ISVTX IRUSR IWUSR IXUSR IRGRP IWGRP IXGRP IROTH IWOTH IXOTH du
3808 % LocalWords: blocks blksize holes lseek TRUNC ftruncate length lenght ETXTBSY
3809 % LocalWords: hole atime read utime mtime write ctime modification leafnode cp
3810 % LocalWords: make fchmod fchown utimbuf times actime modtime Mac owner uid fs
3811 % LocalWords: gid Control List patch mandatory control execute group other all
3812 % LocalWords: dell' effective passwd IGID locking swap saved text IRWXU IRWXG
3813 % LocalWords: IRWXO ext reiser capability FSETID mask capabilities chroot jail
3814 % LocalWords: FTP Di filter reiserfs Attributes Solaris Posix FreeBSD libacl
3815 % LocalWords: XFS SELinux namespace attribute security trusted Draft Modules
3816 % LocalWords: attributes mime ADMIN FOWNER libattr lattr getxattr lgetxattr of
3817 % LocalWords: fgetxattr attr ssize ENOATTR ENOTSUP NUL setxattr lsetxattr list
3818 % LocalWords: fsetxattr flags XATTR REPLACE listxattr llistxattr flistxattr by
3819 % LocalWords: removexattr lremovexattr fremovexattr attributename lacl acl
3820 % LocalWords: OBJ setfacl len any prefix separator options NUMERIC IDS SMART
3821 % LocalWords: INDENT major number IDE Documentation makedev fopendir proc
3823 %%% Local Variables:
3825 %%% TeX-master: "gapil"