3 %% Copyright (C) 2000-2012 Simone Piccardi. Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
12 \chapter{La gestione di file e directory}
13 \label{cha:files_and_dirs}
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando da un approfondimento dell'architettura del
17 sistema illustrata a grandi linee in sez.~\ref{sec:file_arch_overview} ed
18 illustrando le principali caratteristiche di un filesystem e le interfacce
19 che consentono di controllarne il montaggio e lo smontaggio.
21 Esamineremo poi le funzioni di libreria che si usano per copiare, spostare e
22 cambiare i nomi di file e directory e l'interfaccia che permette la
23 manipolazione dei loro attributi. Tratteremo inoltre la struttura di base del
24 sistema delle protezioni e del controllo dell'accesso ai file e le successive
25 estensioni (\textit{Extended Attributes}, ACL, quote disco,
26 \textit{capabilities}). Tutto quello che riguarda invece la gestione dell'I/O
27 sui file è lasciato al capitolo successivo.
31 \section{L'architettura della gestione dei file}
32 \label{sec:file_arch_func}
34 In questa sezione tratteremo con maggiori dettagli rispetto a quanto visto in
35 sez.~\ref{sec:file_arch_overview} il \textit{Virtual File System} di Linux e
36 come il kernel può gestire diversi tipi di filesystem, descrivendo prima le
37 caratteristiche generali di un filesystem di un sistema unix-like, per poi
38 fare una panoramica sul filesystem più usato con Linux, l'\acr{ext2} ed i suoi
42 \subsection{Il funzionamento del \textit{Virtual File System} di Linux}
43 \label{sec:file_vfs_work}
45 % NOTE articolo interessante:
46 % http://www.ibm.com/developerworks/linux/library/l-virtual-filesystem-switch/index.html?ca=dgr-lnxw97Linux-VFSdth-LXdW&S_TACT=105AGX59&S_CMP=GRlnxw97
48 \itindbeg{Virtual~File~System}
50 Come illustrato brevemente in sez.~\ref{sec:file_arch_overview} in Linux il
51 concetto di \textit{everything is a file} è stato implementato attraverso il
52 \textit{Virtual File System}, la cui struttura generale è illustrata in
53 fig.~\ref{fig:file_VFS_scheme}. Il VFS definisce un insieme di funzioni che
54 tutti i filesystem devono implementare per l'accesso ai file che contengono e
55 l'interfaccia che consente di eseguire l'I/O sui file, che questi siano di
60 L'interfaccia fornita dal VFS comprende in sostanza tutte le funzioni che
61 riguardano i file, le operazioni implementate dal VFS sono realizzate con una
62 astrazione che prevede quattro tipi di oggetti strettamente correlati: i
63 filesystem, le \textit{dentry}, gli \textit{inode} ed i file. A questi oggetti
64 corrispondono una serie di apposite strutture definite dal kernel che
65 contengono come campi le funzioni di gestione e realizzano l'infrastruttura
66 del VFS. L'interfaccia è molto complessa, ne faremo pertanto una trattazione
67 estremamente semplificata che consenta di comprenderne i principi
70 Il VFS usa una tabella mantenuta dal kernel che contiene il nome di ciascun
71 filesystem supportato, quando si vuole inserire il supporto di un nuovo
72 filesystem tutto quello che occorre è chiamare la funzione
73 \code{register\_filesystem} passando come argomento la struttura
74 \kstruct{file\_system\_type} (la cui definizione è riportata in
75 fig.~\ref{fig:kstruct_file_system_type}) relativa a quel filesystem. Questa
76 verrà inserita nella tabella, ed il nuovo filesystem comparirà in
77 \procfile{/proc/filesystems}.
80 \footnotesize \centering
81 \begin{minipage}[c]{\textwidth}
82 \includestruct{listati/file_system_type.h}
85 \caption{Estratto della struttura \kstructd{file\_system\_type} usata dal
86 VFS (da \texttt{include/linux/fs.h}).}
87 \label{fig:kstruct_file_system_type}
90 La struttura \kstruct{file\_system\_type}, oltre ad una serie di dati interni,
91 come il nome del tipo di filesystem nel campo \var{name},\footnote{quello che
92 viene riportato in \procfile{/proc/filesystems} e che viene usato come
93 valore del parametro dell'opzione \texttt{-t} del comando \texttt{mount} che
94 indica il tipo di filesystem.} contiene i riferimenti alle funzioni di base
95 che consentono l'utilizzo di quel filesystem. In particolare la funzione
96 \code{mount} del quarto campo è quella che verrà invocata tutte le volte che
97 si dovrà effettuare il montaggio di un filesystem di quel tipo. Per ogni nuovo
98 filesystem si dovrà allocare una di queste strutture ed inizializzare i
99 relativi campi con i dati specifici di quel filesystem, ed in particolare si
100 dovrà creare anche la relativa versione della funzione \code{mount}.
103 \itindbeg{pathname~resolution}
105 Come illustrato in fig.~\ref{fig:kstruct_file_system_type} questa funzione
106 restituisce una \textit{dentry}, abbreviazione che sta per \textit{directory
107 entry}. Le \textit{dentry} sono gli oggetti che il kernel usa per eseguire
108 la \textit{pathname resolution}, ciascuna di esse corrisponde ad un
109 \textit{pathname} e contiene il riferimento ad un \textit{inode}, che come
110 vedremo a breve è l'oggetto usato dal kernel per identificare un un
111 file.\footnote{in questo caso si parla di file come di un qualunque oggetto
112 generico che sta sul filesystem e non dell'oggetto file del VFS cui
113 accennavamo prima.} La \textit{dentry} ottenuta dalla chiamata alla funzione
114 \code{mount} sarà inserita in corrispondenza al \textit{pathname} della
115 directory in cui il filesystem è stato montato.
117 % NOTA: struct dentry è dichiarata in include/linux/dcache.h
119 Le \textit{dentry} sono oggetti del VFS che vivono esclusivamente in memoria,
120 nella cosiddetta \textit{directory entry cache} (spesso chiamata in breve
121 \textit{dcache}). Ogni volta che una \textit{system call} specifica un
122 \textit{pathname} viene effettuata una ricerca nella \textit{dcache} per
123 ottenere immediatamente la \textit{dentry} corrispondente,\footnote{il buon
124 funzionamento della \textit{dcache} è in effetti di una delle parti più
125 critiche per le prestazioni del sistema.} che a sua volta ci darà, tramite
126 l'\textit{inode}, il riferimento al file.
128 Dato che normalmente non è possibile mantenere nella \textit{dcache} le
129 informazioni relative a tutto l'albero dei file la procedura della
130 \textit{pathname resolution} richiede un meccanismo con cui riempire gli
131 eventuali vuoti. Il meccanismo prevede che tutte le volte che si arriva ad una
132 \textit{dentry} mancante venga invocata la funzione \texttt{lookup}
133 dell'\textit{inode} associato alla \textit{dentry} precedente nella
134 risoluzione del \textit{pathname},\footnote{che a questo punto è una
135 directory, per cui si può cercare al suo interno il nome di un file.} il cui
136 scopo è risolvere il nome mancante e fornire la sua \textit{dentry} che a
137 questo punto verrà inserita nella cache.
139 Dato che tutte le volte che si monta un filesystem la funzione \texttt{mount}
140 della corrispondente \kstruct{file\_system\_type} inserisce la \textit{dentry}
141 iniziale nel \itindex{mount~point} \textit{mount point} dello stesso, si avrà
142 comunque un punto di partenza. Inoltre essendo questa \textit{dentry} relativa
143 a quel tipo di filesystem essa farà riferimento ad un \textit{inode} di quel
144 filesystem, e come vedremo questo farà sì che venga eseguita una
145 \texttt{lookup} adatta per effettuare la risoluzione dei nomi per quel
149 \itindend{pathname~resolution}
151 % Un secondo effetto della chiamata funzione \texttt{mount} di
152 % \kstruct{file\_system\_type} è quello di allocare una struttura
153 % \kstruct{super\_block} per ciascuna istanza montata, che contiene le
154 % informazioni generali di un qualunque filesystem montato, come le opzioni di
155 % montaggio, le dimensioni dei blocchi, quando il filesystem è stato montato
156 % ecc. Fra queste però viene pure inserta, nel campo \var{s\_op}, una ulteriore
157 % struttura \kstruct{super\_operations}, il cui contenuto sono i puntatori
158 % alle funzioni di gestione di un filesystem, anche inizializzata in modo da
159 % utilizzare le versioni specifiche di quel filesystem.
161 L'oggetto più importante per il funzionamento del VFS è probabilmente
162 l'\textit{inode}, ma con questo nome si può fare riferimento a due cose
163 diverse. La prima è la struttura su disco (su cui torneremo anche in
164 sez.~\ref{sec:file_filesystem}) che fa parte della organizzazione dei dati
165 realizzata dal filesystem e che contiene le informazioni relative alle
166 proprietà (i cosiddetti \textsl{metadati}) di ogni oggetto presente su di esso
167 (si intende al solito uno qualunque dei tipi di file di
168 tab.~\ref{tab:file_file_types}).
170 La seconda è la corrispondente struttura \kstruct{inode}, della cui
171 definizione si è riportato un estratto in
172 fig.~\ref{fig:kstruct_inode}.\footnote{l'estratto fa riferimento alla versione
173 del kernel 2.6.37.} Questa struttura viene mantenuta in memoria ed è a
174 questa che facevamo riferimento quando parlavamo dell'\textit{inode} associato
175 a ciascuna \textit{dentry}. Nella struttura in memoria sono presenti gli
176 stessi \textsl{metadati} memorizzati su disco, che vengono letti quando questa
177 struttura viene allocata e trascritti all'indietro se modificati.
180 \footnotesize \centering
181 \begin{minipage}[c]{\textwidth}
182 \includestruct{listati/inode.h}
185 \caption{Estratto della struttura \kstructd{inode} del kernel (da
186 \texttt{include/linux/fs.h}).}
187 \label{fig:kstruct_inode}
190 Il fatto che la struttura \kstruct{inode} sia mantenuta in memoria,
191 direttamente associata ad una \textit{dentry}, rende sostanzialmente immediate
192 le operazioni che devono semplicemente effettuare un accesso ai dati in essa
193 contenuti: è così ad esempio che viene realizzata la \textit{system call}
194 \func{stat} che vedremo in sez.~\ref{sec:file_stat}. Rispetto ai dati salvati
195 sul disco questa struttura contiene però anche quanto necessario alla
196 implementazione del VFS, ed in particolare è importante il campo \var{i\_op}
197 che, come illustrato in fig.~\ref{fig:kstruct_inode}, contiene il puntatore ad
198 una struttura di tipo \kstruct{inode\_operation}, la cui definizione si può
199 trovare nel file \texttt{include/kernel/fs.h} dei sorgenti del kernel.
201 Questa struttura non è altro che una tabella di funzioni, ogni suo membro cioè
202 è un puntatore ad una funzione e, come suggerisce il nome della struttura
203 stessa, queste funzioni sono quelle che definiscono le operazioni che il VFS
204 può compiere su un \textit{inode}. Si sono riportate in
205 tab.~\ref{tab:file_inode_operations} le più rilevanti.
210 \begin{tabular}[c]{|l|l|}
212 \textbf{Funzione} & \textbf{Operazione} \\
215 \textsl{\code{create}} & Chiamata per creare un nuovo file (vedi
216 sez.~\ref{sec:file_open}).\\
217 \textsl{\code{link}} & Crea un \textit{hard link} (vedi
218 sez.~\ref{sec:file_link}).\\
219 \textsl{\code{unlink}} & Cancella un \textit{hard link} (vedi
220 sez.~\ref{sec:file_link}).\\
221 \textsl{\code{symlink}}& Crea un link simbolico (vedi
222 sez.~\ref{sec:file_symlink}).\\
223 \textsl{\code{mkdir}} & Crea una directory (vedi
224 sez.~\ref{sec:file_dir_creat_rem}).\\
225 \textsl{\code{rmdir}} & Rimuove una directory (vedi
226 sez.~\ref{sec:file_dir_creat_rem}).\\
227 \textsl{\code{mknod}} & Crea un file speciale (vedi
228 sez.~\ref{sec:file_mknod}).\\
229 \textsl{\code{rename}} & Cambia il nome di un file (vedi
230 sez.~\ref{sec:file_remove}).\\
231 \textsl{\code{lookup}}& Risolve il nome di un file.\\
234 \caption{Le principali operazioni sugli \textit{inode} definite tramite
235 \kstruct{inode\_operation}.}
236 \label{tab:file_inode_operations}
239 Possiamo notare come molte di queste funzioni abbiano nomi sostanzialmente
240 identici alle varie \textit{system call} con le quali si gestiscono file e
241 directory, che tratteremo nel resto del capitolo. Quello che succede è che
242 tutte le volte che deve essere eseguita una \textit{system call}, o una
243 qualunque altra operazione su un \textit{inode} (come \texttt{lookup}) il VFS
244 andrà ad utilizzare la funzione corrispondente attraverso il puntatore
247 Sarà allora sufficiente che nella realizzazione di un filesystem si crei una
248 implementazione di queste funzioni per quel filesystem e si allochi una
249 opportuna istanza di \kstruct{inode\_operation} contenente i puntatori a dette
250 funzioni. A quel punto le strutture \kstruct{inode} usate per gli oggetti di
251 quel filesystem otterranno il puntatore alla relativa istanza di
252 \kstruct{inode\_operation} e verranno automaticamente usate le funzioni
255 Si noti però come in tab.~\ref{tab:file_inode_operations} non sia presente la
256 funzione \texttt{open} che invece è citata in
257 tab.~\ref{tab:file_file_operations}.\footnote{essa può essere comunque
258 invocata dato che nella struttura \kstruct{inode} è presente anche il
259 puntatore \var{i\_fop} alla struttura \kstruct{file\_operation} che fornisce
260 detta funzione.} Questo avviene perché su Linux l'apertura di un file
261 richiede comunque un'altra operazione che mette in gioco l'omonimo oggetto del
262 VFS: l'allocazione di una struttura di tipo \kstruct{file} che viene associata
263 ad ogni file aperto nel sistema.
265 I motivi per cui viene usata una struttura a parte sono diversi, anzitutto,
266 come illustrato in sez.~\ref{sec:file_fd}, questa è necessaria per le
267 operazioni eseguite dai processi con l'interfaccia dei file descriptor; ogni
268 processo infatti mantiene il riferimento ad una struttura \kstruct{file} per
269 ogni file che ha aperto, ed è tramite essa che esegue le operazioni di I/O.
271 Inoltre se le operazioni relative agli \textit{inode} fanno riferimento ad
272 oggetti posti all'interno di un filesystem e vi si applicano quindi le
273 funzioni fornite nell'implementazione di quest'ultimo, quando si apre un file
274 questo può essere anche un file di dispositivo, ed in questo caso il VFS
275 invece di usare le operazioni fornite dal filesystem (come farebbe per un file
276 di dati) dovrà invece ricorrere a quelle fornite dal driver del dispositivo.
281 \footnotesize \centering
282 \begin{minipage}[c]{\textwidth}
283 \includestruct{listati/file.h}
286 \caption{Estratto della struttura \kstructd{file} del kernel (da
287 \texttt{include/linux/fs.h}).}
288 \label{fig:kstruct_file}
291 Come si può notare dall'estratto di fig.~\ref{fig:kstruct_file}, la struttura
292 \kstruct{file} contiene, oltre ad alcune informazioni usate dall'interfaccia
293 dei file descriptor il cui significato emergerà più avanti, il puntatore
294 \var{f\_op} ad una struttura \kstruct{file\_operation}. Questa è l'analoga per
295 i file di \kstruct{inode\_operation}, e definisce le operazioni generiche
296 fornite dal VFS per i file. Si sono riportate in
297 tab.~\ref{tab:file_file_operations} le più significative.
302 \begin{tabular}[c]{|l|p{8cm}|}
304 \textbf{Funzione} & \textbf{Operazione} \\
307 \textsl{\code{open}} & Apre il file (vedi sez.~\ref{sec:file_open}).\\
308 \textsl{\code{read}} & Legge dal file (vedi sez.~\ref{sec:file_read}).\\
309 \textsl{\code{write}} & Scrive sul file (vedi
310 sez.~\ref{sec:file_write}).\\
311 \textsl{\code{llseek}} & Sposta la posizione corrente sul file (vedi
312 sez.~\ref{sec:file_lseek}).\\
313 \textsl{\code{ioctl}} & Accede alle operazioni di controllo
314 (vedi sez.~\ref{sec:file_ioctl}).\\
315 \textsl{\code{readdir}}& Legge il contenuto di una directory (vedi
316 sez.~\ref{sec:file_dir_read}).\\
317 \textsl{\code{poll}} & Usata nell'I/O multiplexing (vedi
318 sez.~\ref{sec:file_multiplexing}).\\
319 \textsl{\code{mmap}} & Mappa il file in memoria (vedi
320 sez.~\ref{sec:file_memory_map}).\\
321 \textsl{\code{release}}& Chiamata quando l'ultimo riferimento a un file
323 \textsl{\code{fsync}} & Sincronizza il contenuto del file (vedi
324 sez.~\ref{sec:file_sync}).\\
325 \textsl{\code{fasync}} & Abilita l'I/O asincrono (vedi
326 sez.~\ref{sec:file_asyncronous_io}) sul file.\\
329 \caption{Operazioni sui file definite tramite \kstruct{file\_operation}.}
330 \label{tab:file_file_operations}
333 Anche in questo caso tutte le volte che deve essere eseguita una
334 \textit{system call} o una qualunque altra operazione sul file il VFS andrà ad
335 utilizzare la funzione corrispondente attraverso il puntatore
336 \var{f\_op}. Dato che è cura del VFS quando crea la struttura all'apertura del
337 file assegnare a \var{f\_op} il puntatore alla versione di
338 \kstruct{file\_operation} corretta per quel file, sarà possibile scrivere allo
339 stesso modo sulla porta seriale come su un normale file di dati, e lavorare
340 sui file allo stesso modo indipendentemente dal filesystem.
342 Il VFS realizza la quasi totalità delle operazioni relative ai file grazie
343 alle funzioni presenti nelle due strutture \kstruct{inode\_operation} e
344 \kstruct{file\_operation}. Ovviamente non è detto che tutte le operazioni
345 possibili siano poi disponibili in tutti i casi, ad esempio \code{llseek} non
346 sarà presente per un dispositivo come la porta seriale o per una fifo, mentre
347 sui file del filesystem \texttt{vfat} non saranno disponibili i permessi, ma
348 resta il fatto che grazie al VFS le \textit{system call} per le operazioni sui
349 file possono restare sempre le stesse nonostante le enormi differenze che
350 possono esserci negli oggetti a cui si applicano.
353 \itindend{Virtual~File~System}
355 % NOTE: documentazione interessante:
356 % * sorgenti del kernel: Documentation/filesystems/vfs.txt
357 % * http://thecoffeedesk.com/geocities/rkfs.html
358 % * http://www.linux.it/~rubini/docs/vfs/vfs.html
362 \subsection{Il funzionamento di un filesystem Unix}
363 \label{sec:file_filesystem}
365 Come già accennato in sez.~\ref{sec:file_arch_overview} Linux (ed ogni sistema
366 unix-like) organizza i dati che tiene su disco attraverso l'uso di un
367 filesystem. Una delle caratteristiche di Linux rispetto agli altri Unix è
368 quella di poter supportare, grazie al VFS, una enorme quantità di filesystem
369 diversi, ognuno dei quali avrà una sua particolare struttura e funzionalità
370 proprie. Per questo non entreremo nei dettagli di un filesystem specifico, ma
371 daremo una descrizione a grandi linee che si adatta alle caratteristiche
372 comuni di qualunque filesystem di un sistema unix-like.
374 Una possibile strutturazione dell'informazione su un disco è riportata in
375 fig.~\ref{fig:file_disk_filesys}, dove si hanno tre filesystem su tre
376 partizioni. In essa per semplicità si è fatto riferimento alla struttura del
377 filesystem \acr{ext2}, che prevede una suddivisione dei dati in \textit{block
378 group}. All'interno di ciascun \textit{block group} viene anzitutto
379 replicato il cosiddetto \itindex{superblock} \textit{superblock}, (la
380 struttura che contiene l'indice iniziale del filesystem e che consente di
381 accedere a tutti i dati sottostanti) e creata una opportuna suddivisione dei
382 dati e delle informazioni per accedere agli stessi. Sulle caratteristiche di
383 \acr{ext2} e derivati torneremo in sez.~\ref{sec:file_ext2}.
387 È comunque caratteristica comune di tutti i filesystem per Unix,
388 indipendentemente da come poi viene strutturata nei dettagli questa
389 informazione, prevedere la presenza di due tipi di risorse: gli
390 \textit{inode}, cui abbiamo già accennato in sez.~\ref{sec:file_vfs_work}, che
391 sono le strutture che identificano i singoli oggetti sul filesystem, e i
392 blocchi, che invece attengono allo spazio disco che viene messo a disposizione
393 per i dati in essi contenuti.
397 \includegraphics[width=12cm]{img/disk_struct}
398 \caption{Organizzazione dello spazio su un disco in partizioni e
400 \label{fig:file_disk_filesys}
403 Se si va ad esaminare con maggiore dettaglio la strutturazione
404 dell'informazione all'interno del filesystem \textsl{ext2}, tralasciando i
405 dettagli relativi al funzionamento del filesystem stesso come la
406 strutturazione in gruppi dei blocchi, il \itindex{superblock}
407 \textit{superblock} e tutti i dati di gestione possiamo esemplificare la
408 situazione con uno schema come quello esposto in
409 fig.~\ref{fig:file_filesys_detail}.
413 \includegraphics[width=12cm]{img/filesys_struct}
414 \caption{Strutturazione dei dati all'interno di un filesystem.}
415 \label{fig:file_filesys_detail}
418 Da fig.~\ref{fig:file_filesys_detail} si evidenziano alcune delle
419 caratteristiche di base di un filesystem, che restano le stesse anche su
420 filesystem la cui organizzazione dei dati è totalmente diversa da quella
421 illustrata, e sulle quali è bene porre attenzione visto che sono fondamentali
422 per capire il funzionamento delle funzioni che manipolano i file e le
423 directory che tratteremo nel prosieguo del capitolo. In particolare è
424 opportuno tenere sempre presente che:
429 \item L'\textit{inode} contiene i cosiddetti \textsl{metadati}, vale dire le
430 informazioni riguardanti le proprietà del file come oggetto del filesystem:
431 il tipo di file, i permessi di accesso, le dimensioni, i puntatori ai
432 blocchi fisici che contengono i dati e così via. Le informazioni che la
433 funzione \func{stat} (vedi sez.~\ref{sec:file_stat}) fornisce provengono
434 dall'\textit{inode}. Dentro una directory si troverà solo il nome del file
435 e il numero dell'\textit{inode} ad esso associato; il nome non è una
436 proprietà del file e non viene mantenuto nell'\textit{inode}. Da da qui in
437 poi chiameremo il nome del file contenuto in una directory
438 ``\textsl{voce}'', come traduzione della nomenclatura inglese
439 \textit{directory entry} che non useremo per evitare confusione con le
440 \textit{dentry} del kernel viste in sez.~\ref{sec:file_vfs_work}.
442 \item Come mostrato in fig.~\ref{fig:file_filesys_detail} per i file
443 \texttt{macro.tex} e \texttt{gapil\_macro.tex}, ci possono avere più voci
444 che fanno riferimento allo stesso \textit{inode}. Fra le proprietà di un
445 file mantenute nell'\textit{inode} c'è anche il contatore con il numero di
446 riferimenti che sono stati fatti ad esso, il cosiddetto \textit{link
447 count}.\footnote{mantenuto anche nel campo \var{i\_nlink} della struttura
448 \kstruct{inode} di fig.~\ref{fig:kstruct_inode}.} Solo quando questo
449 contatore si annulla i dati del file possono essere effettivamente rimossi
450 dal disco. Per questo la funzione per cancellare un file si chiama
451 \func{unlink} (vedi sez.~\ref{sec:file_link}), ed in realtà non cancella
452 affatto i dati del file, ma si limita ad eliminare la relativa voce da una
453 directory e decrementare il numero di riferimenti nell'\textit{inode}.
455 \item All'interno di ogni filesystem ogni \textit{inode} è identificato da un
456 numero univoco. Il numero di \textit{inode} associato ad una voce in una
457 directory si riferisce ad questo numero e non ci può essere una directory
458 che contiene riferimenti ad \textit{inode} relativi ad altri filesystem.
459 Questa è la ragione che limita l'uso del comando \cmd{ln}, che crea una
460 nuova voce per un file esistente con la funzione \func{link} (vedi
461 sez.~\ref{sec:file_link}), a operare su file nel filesystem corrente.
463 \item Quando si cambia nome ad un file senza cambiare filesystem il contenuto
464 del file non viene spostato fisicamente, viene semplicemente creata una
465 nuova voce per l'\textit{inode} in questione e rimossa la precedente, questa
466 è la modalità in cui opera normalmente il comando \cmd{mv} attraverso la
467 funzione \func{rename} (vedi sez.~\ref{sec:file_remove}). Questa operazione
468 non modifica minimamente neanche l'\textit{inode} del file, dato che non si
469 opera sul file ma sulla directory che lo contiene.
471 \item Gli \textit{inode} dei file, che contengono i \textsl{metadati}, ed i
472 blocchi di spazio disco, che contengono i dati, sono risorse indipendenti ed
473 in genere vengono gestite come tali anche dai diversi filesystem; è pertanto
474 possibile esaurire sia lo spazio disco (il caso più comune) che lo spazio
475 per gli \textit{inode}. Nel primo caso non sarà possibile allocare ulteriore
476 spazio, ma si potranno creare file (vuoti), nel secondo non si potranno
477 creare nuovi file, ma si potranno estendere quelli che ci
478 sono.\footnote{questo comportamento non è generale, alcuni filesystem
479 evoluti possono evitare il problema dell'esaurimento degli \textit{inode}
480 riallocando lo spazio disco libero per i blocchi.}
486 \includegraphics[width=12cm]{img/dir_links}
487 \caption{Organizzazione dei \textit{link} per le directory.}
488 \label{fig:file_dirs_link}
491 Infine tenga presente che, essendo file pure loro, il numero di riferimenti
492 esiste anche per le directory. Per questo se a partire dalla situazione
493 mostrata in fig.~\ref{fig:file_filesys_detail} creiamo una nuova directory
494 \file{img} nella directory \file{gapil}, avremo una situazione come quella
495 illustrata in fig.~\ref{fig:file_dirs_link}.
497 La nuova directory avrà un numero di riferimenti pari a due, in quanto è
498 referenziata dalla directory da cui si era partiti (in cui è inserita la nuova
499 voce che fa riferimento a \texttt{img}) e dalla voce interna ``\texttt{.}''
500 che è presente in ogni directory. Questo è il valore che si troverà sempre
501 per ogni directory che non contenga a sua volta altre directory. Al contempo,
502 la directory da cui si era partiti avrà un numero di riferimenti di almeno
503 tre, in quanto adesso sarà referenziata anche dalla voce ``\texttt{..}'' di
504 \texttt{img}. L'aggiunta di una sottodirectory fa cioè crescere di uno il
505 \textit{link count} della directory genitrice.
510 \subsection{Alcuni dettagli sul filesystem \textsl{ext2} e successori}
511 \label{sec:file_ext2}
514 Benché non esista ``il'' filesystem di Linux, dato che esiste un supporto
515 nativo di diversi filesystem che sono in uso da anni, quello che gli avvicina
516 di più è la famiglia di filesystem evolutasi a partire dal \textit{second
517 extended filesystem}, o \acr{ext2}. Il filesystem \acr{ext2} ha subito un
518 grande sviluppo e diverse evoluzioni, fra cui l'aggiunta del
519 \textit{journaling} con il passaggio ad \acr{ext3}, che probabilmente è ancora
520 il filesystem più diffuso, ed una serie di ulteriori miglioramenti con il
521 successivo \acr{ext4}, che sta iniziando a sostituirlo gradualmente. In futuro
522 è previsto che questo debba essere sostituito da un filesystem completamente
523 diverso, \acr{btrfs}, che dovrebbe diventare il filesystem standard di Linux,
524 ma questo al momento è ancora in fase di sviluppo.\footnote{si fa riferimento
525 al momento dell'ultima revisione di di questo paragrafo, l'inizio del 2012.}
527 Il filesystem \acr{ext2} nasce come filesystem nativo per Linux a partire
528 dalle prime versioni del kernel e supporta tutte le caratteristiche di un
529 filesystem standard Unix: è in grado di gestire nomi di file lunghi (256
530 caratteri, estensibili a 1012) e supporta una dimensione massima dei file fino
531 a 4~Tb. I successivi filesystem \acr{ext3} ed \acr{ext4} sono evoluzioni di
532 questo filesystem, e sia pure con molti miglioramenti ed estensioni
533 significative ne mantengono le caratteristiche fondamentali.
535 Oltre alle caratteristiche standard, \acr{ext2} fornisce alcune estensioni che
536 non sono presenti su un classico filesystem di tipo Unix; le principali sono
539 \item i \textit{file attributes} consentono di modificare il comportamento del
540 kernel quando agisce su gruppi di file. Possono essere impostati su file e
541 directory e in quest'ultimo caso i nuovi file creati nella directory
542 ereditano i suoi attributi.
543 \item sono supportate entrambe le semantiche di BSD e SVr4 come opzioni di
544 montaggio. La semantica BSD comporta che i file in una directory sono creati
545 con lo stesso identificatore di gruppo della directory che li contiene. La
546 semantica SVr4 comporta che i file vengono creati con l'identificatore del
547 gruppo primario del processo, eccetto il caso in cui la directory ha il bit
548 di \acr{sgid} impostato (per una descrizione dettagliata del significato di
549 questi termini si veda sez.~\ref{sec:file_access_control}), nel qual caso
550 file e subdirectory ereditano sia il \ids{GID} che lo \acr{sgid}.
551 \item l'amministratore può scegliere la dimensione dei blocchi del filesystem
552 in fase di creazione, a seconda delle sue esigenze: blocchi più grandi
553 permettono un accesso più veloce, ma sprecano più spazio disco.
554 \item il filesystem implementa link simbolici veloci, in cui il nome del file
555 non è salvato su un blocco, ma tenuto all'interno \itindex{inode}
556 dell'\textit{inode} (evitando letture multiple e spreco di spazio), non
557 tutti i nomi però possono essere gestiti così per limiti di spazio (il
558 limite è 60 caratteri).
559 \item vengono supportati i file immutabili (che possono solo essere letti) per
560 la protezione di file di configurazione sensibili, o file
561 \textit{append-only} che possono essere aperti in scrittura solo per
562 aggiungere dati (caratteristica utilizzabile per la protezione dei file di
566 La struttura di \acr{ext2} è stata ispirata a quella del filesystem di BSD: un
567 filesystem è composto da un insieme di blocchi, la struttura generale è quella
568 riportata in fig.~\ref{fig:file_filesys_detail}, in cui la partizione è divisa
569 in gruppi di blocchi.
571 Ciascun gruppo di blocchi contiene una copia delle informazioni essenziali del
572 filesystem (i \itindex{superblock} \textit{superblock} sono quindi ridondati)
573 per una maggiore affidabilità e possibilità di recupero in caso di corruzione
574 del \itindex{superblock} \textit{superblock} principale. L'utilizzo di
575 raggruppamenti di blocchi ha inoltre degli effetti positivi nelle prestazioni
576 dato che viene ridotta la distanza fra i dati e la tabella degli
577 \itindex{inode} inode.
581 \includegraphics[width=9cm]{img/dir_struct}
582 \caption{Struttura delle directory nel \textit{second extended filesystem}.}
583 \label{fig:file_ext2_dirs}
586 Le directory sono implementate come una \itindex{linked~list} \textit{linked
587 list} con voci di dimensione variabile. Ciascuna voce della lista contiene
588 il numero di inode \itindex{inode}, la sua lunghezza, il nome del file e la sua
589 lunghezza, secondo lo schema in fig.~\ref{fig:file_ext2_dirs}; in questo modo
590 è possibile implementare nomi per i file anche molto lunghi (fino a 1024
591 caratteri) senza sprecare spazio disco.
593 Con l'introduzione del filesystem \textit{ext3} sono state introdotte diverse
594 modifiche strutturali, la principale di queste è quella che \textit{ext3} è un
595 filesystem \textit{journaled}, è cioè in grado di eseguire una registrazione
596 delle operazioni di scrittura su un giornale (uno speciale file interno) in
597 modo da poter garantire il ripristino della coerenza dei dati del
598 filesystem\footnote{si noti bene che si è parlato di dati \textsl{del}
599 filesystem, non di dati \textsl{nel} filesystem, quello di cui viene
600 garantito un veloce ripristino è relativo ai dati della struttura interna
601 del filesystem, non di eventuali dati contenuti nei file che potrebbero
602 essere stati persi.} in brevissimo tempo in caso di interruzione improvvisa
603 della corrente o di crollo del sistema che abbia causato una interruzione
604 della scrittura dei dati sul disco.
606 Oltre a questo \textit{ext3} introduce ulteriori modifiche volte a migliorare
607 sia le prestazioni che la semplicità di gestione del filesystem, in
608 particolare per le directory si è passato all'uso di alberi binari con
609 indicizzazione tramite hash al posto delle \textit{linked list} che abbiamo
610 illustrato, ottenendo un forte guadagno di prestazioni in caso di directory
611 contenenti un gran numero di file.
613 % TODO (bassa priorità) portare a ext3, ext4 e btrfs ed illustrare le
614 % problematiche che si possono incontrare (in particolare quelle relative alla
615 % perdita di contenuti in caso di crash del sistema)
616 % TODO (media priorità) trattare btrfs quando sarà usato come stabile
619 \subsection{La gestione dell'uso dei filesystem}
620 \label{sec:sys_file_config}
622 Come accennato in sez.~\ref{sec:file_arch_overview} per poter accedere ai file
623 occorre rendere disponibile al sistema il filesystem su cui essi sono
624 memorizzati. L'operazione di attivazione del filesystem è chiamata
625 \textsl{montaggio} e per far questo in Linux si usa la funzione \funcd{mount},
626 il cui prototipo è:\footnote{la funzione è una versione specifica di Linux che
627 usa la omonima \textit{system call} e non è portabile.}
631 \fdecl{mount(const char *source, const char *target, const char
633 \phantom{mount(}unsigned long mountflags, const void *data)}
634 \fdesc{Monta un filesystem.}
637 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
638 caso \var{errno} assumerà uno dei valori:
640 \item[\errcode{EACCES}] non si ha il permesso di accesso su uno dei
641 componenti del \textit{pathname}, o si è cercato di montare un filesystem
642 disponibile in sola lettura senza aver specificato \const{MS\_RDONLY} o il
643 device \param{source} è su un filesystem montato con l'opzione
645 \item[\errcode{EBUSY}] \param{source} è già montato, o non può essere
646 rimontato in sola lettura perché ci sono ancora file aperti in scrittura,
647 o non può essere montato su \param{target} perché la directory è ancora in
649 \item[\errcode{EINVAL}] il dispositivo \param{source} presenta un
650 \itindex{superblock} \textit{superblock} non valido, o si è cercato di
651 rimontare un filesystem non ancora montato, o di montarlo senza
652 che \param{target} sia un \itindex{mount~point} \textit{mount point} o di
653 spostarlo quando \param{target} non è un \itindex{mount~point}
654 \textit{mount point} o è la radice.
655 \item[\errcode{ELOOP}] si è cercato di spostare un \itindex{mount~point}
656 \textit{mount point} su una sottodirectory di \param{source} o si sono
657 incontrati troppi link simbolici nella risoluzione di un nome.
658 \item[\errcode{EMFILE}] in caso di filesystem virtuale, la tabella dei
659 dispositivi fittizi (chiamati \textit{dummy} nella documentazione inglese)
661 \item[\errcode{ENODEV}] il tipo \param{filesystemtype} non esiste o non è
662 configurato nel kernel.
663 \item[\errcode{ENOTBLK}] non si è usato un \textit{block device} per
664 \param{source} quando era richiesto.
665 \item[\errcode{ENXIO}] il \itindex{major~number} \textit{major number} del
666 dispositivo \param{source} è sbagliato.
667 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
669 ed inoltre \errval{EFAULT}, \errval{ENOMEM}, \errval{ENAMETOOLONG},
670 \errval{ENOENT}, \errval{ENOTDIR} nel loro significato generico.}
673 La funzione monta sulla directory indicata da \param{target}, detta
674 \itindex{mount~point} \textit{mount point}, il filesystem contenuto nel file
675 di dispositivo indicato da \param{source}. In entrambi i casi, come daremo per
676 assunto da qui in avanti tutte le volte che si parla di directory o file nel
677 passaggio di un argomento di una funzione, si intende che questi devono essere
678 indicati con la stringa contenente il loro \textit{pathname}.
680 Normalmente un filesystem è contenuto su un disco o una partizione, ma come
681 illustrato in sez.~\ref{sec:file_vfs_work} la struttura del
682 \itindex{Virtual~File~System} \textit{Virtual File System} è estremamente
683 flessibile e può essere usata anche per oggetti diversi da un disco. Ad
684 esempio usando il \textit{loop device} si può montare un file qualunque (come
685 l'immagine di un CD-ROM o di un floppy) che contiene l'immagine di un
686 filesystem, inoltre alcuni tipi di filesystem, come \texttt{proc} o
687 \texttt{sysfs} sono virtuali e non hanno un supporto che ne contenga i dati,
688 che invece sono generati al volo ad ogni lettura, e passati indietro al kernel
689 ad ogni scrittura.\footnote{costituiscono quindi un meccanismo di
690 comunicazione, attraverso l'ordinaria interfaccia dei file, con il kernel.}
692 Il tipo di filesystem che si vuole montare è specificato
693 dall'argomento \param{filesystemtype}, che deve essere una delle stringhe
694 riportate nel file \procfile{/proc/filesystems} che, come accennato in
695 sez.~\ref{sec:file_vfs_work}, contiene l'elenco dei filesystem supportati dal
696 kernel. Nel caso si sia indicato un filesystem virtuale, che non è associato a
697 nessun file di dispositivo, il contenuto di \param{source} viene ignorato.
699 L'argomento \param{data} viene usato per passare le impostazioni relative alle
700 caratteristiche specifiche di ciascun filesystem. Si tratta di una stringa di
701 parole chiave (separate da virgole e senza spazi) che indicano le cosiddette
702 ``\textsl{opzioni}'' del filesystem che devono essere impostate; in genere
703 viene usato direttamente il contenuto del parametro dell'opzione \texttt{-o}
704 del comando \texttt{mount}. I valori utilizzabili dipendono dal tipo di
705 filesystem e ciascuno ha i suoi, pertanto si rimanda alla documentazione della
706 pagina di manuale di questo comando e dei singoli filesystem.
708 Dopo l'esecuzione della funzione il contenuto del filesystem viene resto
709 disponibile nella directory specificata come \itindex{mount~point}
710 \textit{mount point}, il precedente contenuto di detta directory viene
711 mascherato dal contenuto della directory radice del filesystem montato. Fino
712 ai kernel della serie 2.2.x non era possibile montare un filesystem se un
713 \textit{mount point} era già in uso.
715 A partire dal kernel 2.4.x inoltre è divenuto possibile sia spostare
716 atomicamente un \itindex{mount~point} \textit{mount point} da una directory ad
717 un'altra, sia montare lo stesso filesystem in diversi \itindex{mount~point}
718 \textit{mount point}, sia montare più filesystem sullo stesso
719 \itindex{mount~point} \textit{mount point} impilandoli l'uno sull'altro, nel
720 qual caso vale comunque quanto detto in precedenza, e cioè che solo il
721 contenuto dell'ultimo filesystem montato sarà visibile.
723 Oltre alle opzioni specifiche di ciascun filesystem, che si passano nella
724 forma della lista di parole chiave indicata con l'argomento \param{data},
725 esistono pure alcune opzioni che si possono applicare in generale, anche se
726 non è detto che tutti i filesystem le supportino, che si specificano tramite
727 l'argomento \param{mountflags}. L'argomento inoltre può essere utilizzato per
728 modificare il comportamento della funzione \func{mount}, facendole compiere
729 una operazione diversa (ad esempio un rimontaggio, invece che un montaggio).
731 In Linux \param{mountflags} deve essere un intero a 32 bit; fino ai kernel
732 della serie 2.2.x i 16 più significativi avevano un valore riservato che
733 doveva essere specificato obbligatoriamente,\footnote{il valore era il
734 \itindex{magic~number} \textit{magic number} \code{0xC0ED}, si può usare la
735 costante \const{MS\_MGC\_MSK} per ottenere la parte di \param{mountflags}
736 riservata al \textit{magic number}, mentre per specificarlo si può dare un
737 OR aritmetico con la costante \const{MS\_MGC\_VAL}.} e si potevano usare
738 solo i 16 meno significativi. Oggi invece, con un numero di opzioni superiore,
739 sono utilizzati tutti e 32 i bit, ma qualora nei 16 più significativi sia
740 presente detto valore, che non esprime una combinazione valida, esso viene
741 ignorato. Il valore dell'argomento deve essere espresso come maschera binaria
742 e i vari bit devono essere impostati con un OR aritmetico dei rispettivi flag,
743 identificati dalle costanti riportate nell'elenco seguente:
745 \begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}}
746 \itindbeg{bind~mount}
747 \item[\const{MS\_BIND}] Effettua un cosiddetto \textit{bind mount}, in cui è
748 possibile montare una directory di un filesystem in un'altra directory,
749 l'opzione è disponibile a partire dai kernel della serie 2.4. In questo caso
750 verranno presi in considerazione solo gli argomenti \param{source}, che
751 stavolta indicherà la directory che si vuole montare e non un file di
752 dispositivo, e \param{target} che indicherà la directory su cui verrà
753 effettuato il \textit{bind mount}. Gli argomenti \param{filesystemtype}
754 e \param{data} vengono ignorati.
756 In sostanza quello che avviene è che in corrispondenza del \textit{pathname}
757 indicato da \param{target} viene montato l'\textit{inode} di \param{source},
758 così che la porzione di albero dei file presente sotto
759 \param{source} diventi visibile allo stesso modo sotto
760 \param{target}. Trattandosi esattamente dei dati dello stesso filesystem,
761 ogni modifica fatta in uno qualunque dei due rami di albero sarà visibile
762 nell'altro, visto che entrambi faranno riferimento agli stessi
765 Dal punto di vista del \itindex{Virtual~File~System} VFS l'operazione è
766 analoga al montaggio di un filesystem proprio nel fatto che anche in questo
767 caso si inserisce in corrispondenza della \textit{dentry} di \texttt{target}
768 un diverso \textit{inode}, che stavolta, invece di essere quello della
769 radice del filesystem indicato da un file di dispositivo, è quello di una
770 directory già montata.
772 Si tenga presente che proprio per questo sotto \param{target} comparirà il
773 contenuto che è presente sotto \param{source} all'interno del filesystem in
774 cui quest'ultima è contenuta. Questo potrebbe non corrispondere alla
775 porzione di albero che sta sotto \param{source} qualora in una
776 sottodirectory di quest'ultima si fosse effettuato un altro montaggio. In
777 tal caso infatti nella porzione di albero sotto \param{source} si troverebbe
778 il contenuto del nuovo filesystem (o di un altro \textit{bind mount}) mentre
779 sotto \param{target} ci sarebbe il contenuto presente nel filesystem
780 originale.\footnote{questo evita anche il problema dei \textit{loop} di
781 fig.~\ref{fig:file_link_loop}, dato che se anche si montasse su
782 \param{target} una directory in cui essa è contenuta, il cerchio non
783 potrebbe chiudersi perché ritornati a \param{target} dentro il
784 \textit{bind mount} vi si troverebbe solo il contenuto originale e non si
785 potrebbe tornare indietro.}
787 Fino al kernel 2.6.26 questo flag doveva essere usato da solo, in quanto il
788 \textit{bind mount} continuava ad utilizzare le stesse opzioni del montaggio
789 originale, dal 2.6.26 è stato introdotto il supporto per il cosiddetto
790 \textit{read-only bind mount} e viene onorata la presenza aggiuntiva del
791 flag \const{MS\_RDONLY}. In questo modo si ottiene che l'accesso ai file
792 sotto \param{target} sia effettuabile esclusivamente in sola lettura.
794 Il supporto per il \textit{bind mount} consente di superare i limiti
795 presenti per gli \textit{hard link} (di cui parleremo in
796 sez.~\ref{sec:file_link}) con la possibilità di fare riferimento alla
797 porzione dell'albero dei file di un filesystem presente a partire da una
798 certa directory, utilizzando una qualunque altra directory, anche se questa
799 sta su un filesystem diverso. Si può così fornire una alternativa all'uso
800 dei link simbolici (di cui parleremo in sez.~\ref{sec:file_symlink}) che
801 funziona correttamente anche all'intero di un \textit{chroot} (argomento su
802 cui torneremo in sez.~\ref{sec:file_chroot}).
803 \itindend{bind~mount}
805 \item[\const{MS\_DIRSYNC}] Richiede che ogni modifica al contenuto di una
806 directory venga immediatamente registrata su disco in maniera sincrona
807 (introdotta a partire dai kernel della serie 2.6). L'opzione si applica a
808 tutte le directory del filesystem, ma su alcuni filesystem è possibile
809 impostarla a livello di singole directory o per i sottorami di una directory
810 con il comando \cmd{chattr}.\footnote{questo avviene tramite delle opportune
811 \texttt{ioctl} (vedi sez.~\ref{sec:file_ioctl}).}
813 Questo consente di ridurre al minimo il rischio di perdita dei dati delle
814 directory in caso di crollo improvviso del sistema, al costo di una certa
815 perdita di prestazioni dato che le funzioni di scrittura relative ad
816 operazioni sulle directory non saranno più bufferizzate e si bloccheranno
817 fino all'arrivo dei dati sul disco prima che un programma possa proseguire.
819 \item[\const{MS\_MANDLOCK}] Consente l'uso del \textit{mandatory locking}
820 \itindex{mandatory~locking} (vedi sez.~\ref{sec:file_mand_locking}) sui file
821 del filesystem. Per poterlo utilizzare effettivamente però esso dovrà essere
822 comunque attivato esplicitamente per i singoli file impostando i permessi
823 come illustrato in sez.~\ref{sec:file_mand_locking}.
825 \item[\const{MS\_MOVE}] Effettua uno del spostamento del \itindex{mount~point}
826 \textit{mount point} di un filesystem. La directory del
827 \itindex{mount~point} \textit{mount point} originale deve essere indicata
828 nell'argomento \param{source}, e la sua nuova posizione
829 nell'argomento \param{target}. Tutti gli altri argomenti della funzione
832 Lo spostamento avviene atomicamente, ed il ramo di albero presente
833 sotto \param{source} sarà immediatamente visibile sotto \param{target}. Non
834 esiste cioè nessun momento in cui il filesystem non risulti montato in una o
835 nell'altra directory e pertanto è garantito che la risoluzione di
836 \itindsub{pathname}{relativo} \textit{pathname} relativi all'interno del
837 filesystem non possa fallire.
839 \item[\const{MS\_NOATIME}] Viene disabilitato sul filesystem l'aggiornamento
840 degli \textit{access time} (vedi sez.~\ref{sec:file_file_times}) per
841 qualunque tipo di file. Dato che l'aggiornamento degli \textit{access time}
842 è una funzionalità la cui utilità è spesso irrilevante ma comporta un costo
843 elevato visto che una qualunque lettura comporta comunque una scrittura su
844 disco,\footnote{e questo ad esempio ha conseguenze molto pesanti nell'uso
845 della batteria sui portatili.} questa opzione consente di disabilitarla
846 completamente. La soluzione può risultare troppo drastica dato che
847 l'informazione viene comunque utilizzata da alcuni programmi, per cui nello
848 sviluppo del kernel sono state introdotte altre opzioni che forniscono
849 soluzioni più appropriate e meno radicali.
851 \item[\const{MS\_NODEV}] Viene disabilitato sul filesystem l'accesso ai file
852 di dispositivo eventualmente presenti su di esso. L'opzione viene usata come
853 misura di precauzione per rendere inutile la presenza di eventuali file di
854 dispositivo su filesystem che non dovrebbero contenerne.\footnote{si ricordi
855 che le convenzioni del \itindex{Filesystem~Hierarchy~Standard~(FHS)}
856 \textit{Linux Filesystem Hierarchy Standard} richiedono che questi siano
857 mantenuti esclusivamente sotto \texttt{/dev}.}
859 Viene utilizzata, assieme a \const{MS\_NOEXEC} e \const{MS\_NOSUID}, per
860 fornire un accesso più controllato a quei filesystem di cui gli utenti hanno
861 il controllo dei contenuti, in particolar modo quelli posti su dispositivi
862 rimuovibili. In questo modo si evitano alla radice possibili situazioni in
863 cui un utente malizioso inserisce su uno di questi filesystem dei file di
864 dispositivo con permessi ``opportunamente'' ampliati che gli consentano di
865 accedere anche a risorse cui non dovrebbe.
867 \item[\const{MS\_NODIRATIME}] Viene disabilitato sul filesystem
868 l'aggiornamento degli \textit{access time} (vedi
869 sez.~\ref{sec:file_file_times}), ma soltanto per le directory. Costituisce
870 una alternativa per \const{MS\_NOATIME}, che elimina l'informazione per le
871 directory, che in pratica che non viene mai utilizzata, mantenendola per i
872 file in cui invece ha un impiego, sia pur limitato.
874 \item[\const{MS\_NOEXEC}] Viene disabilitata sul filesystem l'esecuzione di un
875 qualunque file eseguibile eventualmente presente su di esso. L'opzione viene
876 usata come misura di precauzione per rendere impossibile l'uso di programmi
877 posti su filesystem che non dovrebbero contenerne.
879 Anche in questo caso viene utilizzata per fornire un accesso più controllato
880 a quei filesystem di cui gli utenti hanno il controllo dei contenuti. Da
881 questo punto di vista l'opzione è meno importante delle analoghe
882 \const{MS\_NODEV} e \const{MS\_NOSUID} in quanto l'esecuzione di un
883 programma creato dall'utente pone un livello di rischio nettamente
884 inferiore, ed è in genere consentita per i file contenuti nella sua home
885 directory.\footnote{cosa che renderebbe superfluo l'attivazione di questa
886 opzione, il cui uso ha senso solo per ambienti molto controllati in cui si
887 vuole che gli utenti eseguano solo i programmi forniti
888 dall'amministratore.}
890 \item[\const{MS\_NOSUID}] Viene disabilitato sul filesystem l'effetto dei bit
891 dei permessi \itindex{suid~bit} \acr{suid} e \itindex{sgid~bit} \acr{sgid}
892 (vedi sez.~\ref{sec:file_special_perm}) eventualmente presenti sui file in
893 esso contenuti. L'opzione viene usata come misura di precauzione per rendere
894 inefficace l'effetto di questi bit per filesystem in cui non ci dovrebbero
895 essere file dotati di questi permessi.
897 Di nuovo viene utilizzata, analogamente a \const{MS\_NOEXEC} e
898 \const{MS\_NODEV}, per fornire un accesso più controllato a quei filesystem
899 di cui gli utenti hanno il controllo dei contenuti. In questo caso si evita
900 che un utente malizioso possa inserire su uno di questi filesystem un
901 eseguibile con il bit \itindex{suid~bit} \acr{suid} attivo e di proprietà
902 dell'amministratore o di un altro utente, che gli consentirebbe di eseguirlo
903 per conto di quest'ultimo.
905 \item[\const{MS\_PRIVATE}] Marca un \itindex{mount~point} \textit{mount point}
906 come privato. Si tratta di una delle nuove opzioni (insieme a
907 \const{MS\_SHARED}, \const{MS\_SLAVE} e \const{MS\_UNBINDABLE}) facenti
908 parte dell'infrastruttura degli \itindex{shared~subtree} \textit{shared
909 subtree} introdotta a partire dal kernel 2.6.15, che estendono le
910 funzionalità dei \itindex{bind~mount} \textit{bind mount}. In questo caso
911 \param{target} dovrà fare riferimento al \textit{mount point} che si intende
912 marcare, e tutti gli altri argomenti verranno ignorati.
914 Di default, finché non lo si marca altrimenti con una delle altre opzioni
915 dell'interfaccia \itindex{shared~subtree} \textit{shared subtree}, ogni
916 \textit{mount point} è privato. Ogni \textit{bind mount} ottenuto da un
917 \itindex{mount~point} \textit{mount point} di tipo \textit{private} si
918 comporta come descritto nella trattazione di \const{MS\_BIND}. Si usa questo
919 flag principalmente per revocare gli effetti delle altre opzioni e riportare
920 il comportamento a quello ordinario.
922 \item[\const{MS\_RDONLY}] Esegue il montaggio del filesystem in sola lettura,
923 non sarà possibile nessuna modifica ai suoi contenuti. Viene usato tutte le
924 volte che si deve accedere ai contenuti di un filesystem con la certezza che
925 questo non venga modificato (ad esempio per ispezionare un filesystem
926 corrotto). All'avvio di default il kernel monta la radice in questa
929 \item[\const{MS\_REC}] Applica ricorsivamente a tutti i \itindex{mount~point}
930 \textit{mount point} presenti al di sotto del \textit{mount point} indicato
931 gli effetti della opzione degli \itindex{shared~subtree} \textit{shared
932 subtree} associata. Anche questo caso l'argomento \param{target} deve fare
933 riferimento ad un \itindex{mount~point} \textit{mount point} e tutti gli
934 altri argomenti sono ignorati, ed il flag deve essere indicato assieme ad
935 una fra \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
936 \const{MS\_UNBINDABLE}.
938 \item[\const{MS\_RELATIME}] Indica di effettuare l'aggiornamento degli
939 \textit{access time} sul filesystem soltanto quando questo risulti
940 antecedente il valore corrente del \textit{modification time} o del
941 \textit{change time} (per i tempi dei file si veda
942 sez.~\ref{sec:file_file_times}). L'opzione è disponibile a partire dal
943 kernel 2.6.20, mentre dal 2.6.30 questo è diventato il comportamento di
944 default del sistema, che può essere riportato a quello tradizionale con
945 l'uso di \const{MS\_STRICTATIME}. Sempre dal 2.6.30 il comportamento è stato
946 anche modificato e l'\textit{access time} viene comunque aggiornato se è più
947 vecchio di un giorno.
949 L'opzione consente di evitare i problemi di prestazioni relativi
950 all'aggiornamento dell'\textit{access time} senza avere impatti negativi
951 riguardo le funzionalità, il comportamento adottato infatti consente di
952 rendere evidente che vi è stato un accesso dopo la scrittura, ed evitando al
953 contempo ulteriori operazioni su disco negli accessi successivi. In questo
954 modo l'informazione relativa al fatto che un file sia stato letto resta
955 disponibile, ed i programmi che ne fanno uso continuano a funzionare. Con
956 l'introduzione di questo comportamento l'uso delle alternative
957 \const{MS\_NOATIME} e \const{MS\_NODIRATIME} è sostanzialmente inutile.
959 \item[\const{MS\_REMOUNT}] Consente di rimontare un filesystem già montato
960 cambiandone le opzioni di montaggio in maniera atomica. In questo modo si
961 possono modificare le opzioni del filesystem anche se questo è in uso. Gli
962 argomenti \param{source} e \param{target} devono essere gli stessi usati per
963 il montaggio originale, mentre sia \param{data} che \param{mountflags}
964 conterranno le nuove opzioni, \param{filesystemtype} viene ignorato.
966 Qualunque opzione specifica del filesystem indicata con \param{data} può
967 essere modificata, mentre con \param{mountflags} possono essere modificate
968 solo alcune opzioni generiche. Con i kernel più recenti queste sono soltanto
969 \const{MS\_MANDLOCK}, \const{MS\_RDONLY} e \const{MS\_SYNCHRONOUS}, prima
970 del kernel 2.6.16 potevano essere modificate anche le ulteriori
971 \const{MS\_NOATIME} e \const{MS\_NODIRATIME}, ed infine prima del kernel
972 2.4.10 anche \const{MS\_NODEV}, \const{MS\_NOEXEC} e \const{MS\_NOSUID}.
974 \item[\const{MS\_SHARED}] Marca un \itindex{mount~point} \textit{mount point}
975 come \textit{shared mount}. Si tratta di una delle nuove opzioni (insieme a
976 \const{MS\_PRIVATE}, \const{MS\_SLAVE} e \const{MS\_UNBINDABLE}) facenti
977 parte dell'infrastruttura degli \itindex{shared~subtree} \textit{shared
978 subtree} introdotta a partire dal kernel 2.6.15, che estendono le
979 funzionalità dei \itindex{bind~mount} \textit{bind mount}. In questo caso
980 \param{target} dovrà fare riferimento al \itindex{mount~point} \textit{mount
981 point} che si intende marcare, e tutti gli altri argomenti verranno
984 Lo scopo dell'opzione è ottenere che tutti i successivi \itindex{bind~mount}
985 \textit{bind mount} effettuati da un \textit{mount point} marcato da essa
986 siano di tipo \textit{shared}, cioè ``\textsl{condividano}'' con l'originale
987 e fra di loro ogni ulteriore operazione di montaggio o smontaggio che
988 avviene su una directory al di sotto di uno qualunque di essi. Le operazioni
989 di montaggio e smontaggio effettuate al di sotto di un qualunque
990 \textit{mount point} così marcato verranno ``\textsl{propagate}'' a tutti i
991 \itindex{mount~point} \textit{mount point} della stessa condivisione, e la
992 sezione di albero di file vista al di sotto di ciascuno di essi sarà sempre
995 \item[\const{MS\_SILENT}] Richiede la soppressione di alcuni messaggi di
996 avvertimento nei log del kernel (vedi sez.~\ref{sec:sess_daemon}). L'opzione
997 è presente a partire dal kernel 2.6.17 e sostituisce, utilizzando un nome
998 non fuorviante, la precedente \const{MS\_VERBOSE}, introdotta nel kernel
999 2.6.12, che aveva lo stesso effetto.
1001 \item[\const{MS\_SLAVE}] Marca un \itindex{mount~point} \textit{mount point}
1002 come \textit{slave mount}. Si tratta di una delle nuove opzioni (insieme a
1003 \const{MS\_PRIVATE}, \const{MS\_SHARED} e \const{MS\_UNBINDABLE}) facenti
1004 parte dell'infrastruttura degli \itindex{shared~subtree} \textit{shared
1005 subtree} introdotta a partire dal kernel 2.6.15, che estendono le
1006 funzionalità dei \itindex{bind~mount} \textit{bind mount}. In questo caso
1007 \param{target} dovrà fare riferimento al \textit{mount point} che si intende
1008 marcare, e tutti gli altri argomenti verranno ignorati.
1010 Lo scopo dell'opzione è ottenere che tutti i successivi \textit{bind mount}
1011 effettuati da un \textit{mount point} marcato da essa siano di tipo
1012 \textit{slave}, cioè ``\textsl{condividano}'' ogni ulteriore operazione di
1013 montaggio o smontaggio che avviene su una directory al di sotto del
1014 \textit{mount point} originale. Le operazioni di montaggio e smontaggio in
1015 questo caso vengono ``\textsl{propagate}'' soltanto dal \textit{mount point}
1016 originale (detto anche \textit{master}) verso gli \textit{slave}, mentre
1017 essi potranno eseguire al loro interno ulteriori montaggi che non saranno
1018 propagati né negli altri né nel \itindex{mount~point} \textit{mount point}
1021 \item[\const{MS\_STRICTATIME}] Ripristina il comportamento tradizionale per
1022 cui l'\textit{access time} viene aggiornato ad ogni accesso al
1023 file. L'opzione è disponibile solo a partire dal kernel 2.6.30 quando il
1024 comportamento di default del kernel è diventato quello fornito da
1025 \const{MS\_RELATIME}.
1027 \item[\const{MS\_SYNCHRONOUS}] Abilita la scrittura sincrona richiedendo che
1028 ogni modifica al contenuto del filesystem venga immediatamente registrata su
1029 disco. Lo stesso comportamento può essere ottenuto con il flag
1030 \const{O\_SYNC} di \func{open} (vedi sez.~\ref{sec:file_open}).
1032 Questa opzione consente di ridurre al minimo il rischio di perdita dei dati
1033 in caso di crollo improvviso del sistema, al costo di una pesante perdita di
1034 prestazioni dato che tutte le funzioni di scrittura non saranno più
1035 bufferizzate e si bloccheranno fino all'arrivo dei dati sul disco. Per un
1036 compromesso in cui questo comportamento avviene solo per le directory, ed ha
1037 quindi una incidenza nettamente minore, si può usare \const{MS\_DIRSYNC}.
1039 \item[\const{MS\_UNBINDABLE}] Marca un \itindex{mount~point} \textit{mount
1040 point} come \textit{unbindable mount}. Si tratta di una delle nuove
1041 opzioni (insieme a \const{MS\_PRIVATE}, \const{MS\_SHARED} e
1042 \const{MS\_SLAVE}) facenti parte dell'infrastruttura degli
1043 \itindex{shared~subtree} \textit{shared subtree} introdotta a partire dal
1044 kernel 2.6.15, che estendono le funzionalità dei \itindex{bind~mount}
1045 \textit{bind mount}. In questo caso
1046 \param{target} dovrà fare riferimento al \textit{mount point} che si intende
1047 marcare, e tutti gli altri argomenti verranno ignorati.
1049 Un \textit{mount point} marcato in questo modo disabilita la capacità di
1050 eseguire dei \itindex{bind~mount} \textit{bind mount} del suo contenuto. Si
1051 comporta cioè come allo stesso modo di un \itindex{mount~point}
1052 \textit{mount point} ordinario di tipo \textit{private} con in più la
1053 restrizione che nessuna sua sottodirectory (anche se relativa ad un
1054 ulteriore montaggio) possa essere utilizzata per un come sorgente di un
1055 \itindex{bind~mount} \textit{bind mount}.
1059 % NOTE per \const{MS\_SLAVE},\const{MS\_SHARE}, \const{MS\_PRIVATE} e
1060 % \const{MS\_UNBINDABLE} dal 2.6.15 vedi shared subtrees, in particolare
1061 % * http://lwn.net/Articles/159077/ e
1062 % * Documentation/filesystems/sharedsubtree.txt
1064 % TODO: (bassa priorità) non documentati ma presenti in sys/mount.h:
1072 Una volta che non si voglia più utilizzare un certo filesystem è possibile
1073 ``\textsl{smontarlo}'' usando la funzione \funcd{umount}, il cui prototipo è:
1077 \fdecl{umount(const char *target)}
1078 \fdesc{Smonta un filesystem.}
1080 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1081 nel qual caso \var{errno} assumerà uno dei valori:
1083 \item[\errcode{EBUSY}] il filesystem è occupato.
1084 \item[\errcode{EINVAL}] \param{target} non è un \textit{mount point}.
1085 \item[\errcode{EPERM}] il processo non ha i privilegi di
1086 amministratore.\footnotemark
1088 ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
1089 \errval{ENOENT}, \errval{ENOMEM} nel loro significato generico. }
1092 \footnotetext{più precisamente la \itindex{capabilities} capacità
1093 \texttt{CAP\_SYS\_ADMIN}.}
1095 La funzione prende il nome della directory su cui il filesystem è montato e
1096 non il file o il dispositivo che è stato montato,\footnote{questo è vero a
1097 partire dal kernel 2.3.99-pre7, prima esistevano due chiamate separate e la
1098 funzione poteva essere usata anche specificando il file di dispositivo.} in
1099 quanto a partire dai kernel della serie 2.4.x è possibile montare lo stesso
1100 dispositivo in più punti. Nel caso più di un filesystem sia stato montato
1101 sullo stesso \itindex{mount~point} \textit{mount point} viene smontato quello
1102 che è stato montato per ultimo. Si tenga presente che la funzione fallisce se
1103 il filesystem è ``\textsl{occupato}'', cioè quando ci sono ancora dei file
1104 aperti sul filesystem, se questo contiene la \index{directory~di~lavoro}
1105 directory di lavoro di un qualunque processo o il \itindex{mount~point}
1106 \textit{mount point} di un altro filesystem.
1108 Linux provvede inoltre una seconda funzione, \funcd{umount2}, che consente un
1109 maggior controllo delle operazioni, come forzare lo smontaggio di un
1110 filesystem anche quando questo risulti occupato; il suo prototipo è:
1114 \fdecl{umount2(const char *target, int flags)}
1115 \fdesc{Smonta un filesystem.}
1117 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1118 nel qual caso \var{errno} assumerà uno dei valori:
1120 \item[\errcode{EBUSY}] \param{target} è la \index{directory~di~lavoro}
1121 directory di lavoro di qualche processo, o contiene dei file aperti, o un
1123 \item[\errcode{EAGAIN}] si è chiamata la funzione con \const{MNT\_EXPIRE}
1124 ed il filesystem non era occupato.
1125 \item[\errcode{EINVAL}] \param{target} non è un \itindex{mount~point}
1126 \textit{mount point} o si è usato \const{MNT\_EXPIRE} con
1127 \const{MNT\_FORCE} o \const{MNT\_DETACH} o si è specificato un flag non
1130 e tutti gli altri valori visti per \func{umount} con lo stesso significato.}
1133 Il valore di \param{flags} è una maschera binaria dei flag che controllano le
1134 modalità di smontaggio, che deve essere specificato con un OR aritmetico delle
1135 costanti illustrate in tab.~\ref{tab:umount2_flags}. Specificando
1136 \const{MNT\_FORCE} la funzione cercherà di liberare il filesystem anche se è
1137 occupato per via di una delle condizioni descritte in precedenza. A seconda
1138 del tipo di filesystem alcune (o tutte) possono essere superate, evitando
1139 l'errore di \errcode{EBUSY}. In tutti i casi prima dello smontaggio viene
1140 eseguita una sincronizzazione dei dati.
1145 \begin{tabular}[c]{|l|p{8cm}|}
1147 \textbf{Costante} & \textbf{Descrizione}\\
1150 \const{MNT\_FORCE} & forza lo smontaggio del filesystem anche se questo è
1151 occupato (presente dai kernel della serie 2.2).\\
1152 \const{MNT\_DETACH} & esegue uno smontaggio ``\textsl{pigro}'', in cui si
1153 blocca l'accesso ma si aspetta che il filesystem si
1154 liberi (presente dal kernel 2.4.11 e dalla
1155 \acr{glibc} 2.11).\\
1156 \const{MNT\_EXPIRE} & se non occupato marca un \itindex{mount~point}
1157 \textit{mount point} come ``\textsl{in scadenza}'' in
1158 modo che ad una successiva chiamata senza utilizzo
1159 del filesystem questo venga smontato (presente dal
1160 kernel 2.6.8 e dalla \acr{glibc} 2.11).\\
1161 \const{UMOUNT\_NOFOLLOW}& non dereferenzia \param{target} se questo è un
1162 link simbolico (vedi sez.~\ref{sec:file_symlink})
1163 evitando problemi di sicurezza (presente dal kernel
1167 \caption{Costanti che identificano i bit dell'argomento \param{flags}
1168 della funzione \func{umount2}.}
1169 \label{tab:umount2_flags}
1172 Con l'opzione \const{MNT\_DETACH} si richiede invece uno smontaggio
1173 ``\textsl{pigro}'' (o \textit{lazy umount}) in cui il filesystem diventa
1174 inaccessibile per i nuovi processi subito dopo la chiamata della funzione, ma
1175 resta accessibile per quelli che lo hanno ancora in uso e non viene smontato
1176 fintanto che resta occupato.
1178 Con \const{MNT\_EXPIRE}, che non può essere specificato insieme agli altri
1179 due, si marca il \itindex{mount~point} \textit{mount point} di un filesystem
1180 non occupato come ``\textsl{in scadenza}'', in tal caso \func{umount2} ritorna
1181 con un errore di \errcode{EAGAIN}, mentre in caso di filesystem occupato si
1182 sarebbe ricevuto \errcode{EBUSY}. Una volta marcato, se nel frattempo non
1183 viene fatto nessun uso del filesystem, ad una successiva chiamata con
1184 \const{MNT\_EXPIRE} questo verrà smontato. Questo flag consente di realizzare
1185 un meccanismo che smonti automaticamente i filesystem che restano inutilizzati
1186 per un certo periodo di tempo.
1188 Infine il flag \const{UMOUNT\_NOFOLLOW} non dereferenzia \param{target} se
1189 questo è un link simbolico (vedi sez.~\ref{sec:file_symlink}). Questa è una
1190 misura di sicurezza introdotta per evitare, per quei filesystem per il quale è
1191 prevista una gestione diretta da parte degli utenti, come quelli basati su
1192 FUSE,\footnote{il \textit{Filesystem in USEr space} (FUSE) è una delle più
1193 interessanti applicazioni del \itindex{Virtual~File~System} VFS che
1194 consente, tramite un opportuno modulo, di implementarne le funzioni in
1195 \textit{user space}, così da rendere possibile l'implementazione di un
1196 qualunque filesytem (con applicazioni di grande interesse come il filesystem
1197 cifrato \textit{encfs} o il filesystem di rete \textit{sshfs}) che possa
1198 essere usato direttamente per conto degli utenti.} che si possano passare
1199 ai programmi che effettuano lo smontaggio dei filesystem, che in genere sono
1200 privilegiati ma consentono di agire solo sui propri \textit{mount point}, dei
1201 link simbolici che puntano ad altri \textit{mount point}, ottenendo così la
1202 possibilità di smontare qualunque filesystem.
1205 Altre due funzioni specifiche di Linux,\footnote{esse si trovano anche su BSD,
1206 ma con una struttura diversa.} utili per ottenere in maniera diretta
1207 informazioni riguardo al filesystem su cui si trova un certo file, sono
1208 \funcd{statfs} e \funcd{fstatfs}, i cui prototipi sono:
1212 \fdecl{int statfs(const char *path, struct statfs *buf)}
1213 \fdecl{int fstatfs(int fd, struct statfs *buf)}
1214 \fdesc{Restituiscono informazioni relative ad un filesystem.}
1216 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
1217 nel qual caso \var{errno} assumerà uno dei valori:
1219 \item[\errcode{ENOSYS}] il filesystem su cui si trova il file specificato
1220 non supporta la funzione.
1221 \end{errlist} ed inoltre \errval{EFAULT} ed \errval{EIO} per entrambe,
1222 \errval{EBADF} per \func{fstatfs}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
1223 \errval{ENOENT}, \errval{EACCES}, \errval{ELOOP} per \func{statfs} nel loro
1224 significato generico.}
1227 Queste funzioni permettono di ottenere una serie di informazioni generali
1228 riguardo al filesystem su cui si trova il file specificato con un
1229 \textit{pathname} per \func{statfs} e con un file descriptor (vedi
1230 sez.~\ref{sec:file_fd}) per \func{statfs}. Le informazioni vengono restituite
1231 all'indirizzo \param{buf} di una struttura \struct{statfs} definita come in
1232 fig.~\ref{fig:sys_statfs}, ed i campi che sono indefiniti per il filesystem in
1233 esame sono impostati a zero. I valori del campo \var{f\_type} sono definiti
1234 per i vari filesystem nei relativi file di header dei sorgenti del kernel da
1235 costanti del tipo \var{XXX\_SUPER\_MAGIC}, dove \var{XXX} in genere è il nome
1236 del filesystem stesso.
1238 \begin{figure}[!htb]
1239 \footnotesize \centering
1240 \begin{minipage}[c]{\textwidth}
1241 \includestruct{listati/statfs.h}
1244 \caption{La struttura \structd{statfs}.}
1245 \label{fig:sys_statfs}
1248 Le \acr{glibc} provvedono infine una serie di funzioni per la gestione dei due
1249 file \conffile{/etc/fstab}\footnote{più precisamente \funcm{setfsent},
1250 \funcm{getfsent}, \funcm{getfsfile}, \funcm{getfsspec}, \funcm{endfsent}.}
1251 ed \conffile{/etc/mtab}\footnote{più precisamente \funcm{setmntent},
1252 \funcm{getmntent},\funcm{getmntent\_r}, \funcm{addmntent},\funcm{endmntent},
1253 \funcm{hasmntopt}.} che convenzionalmente sono usati in quasi tutti i
1254 sistemi unix-like per mantenere rispettivamente le informazioni riguardo ai
1255 filesystem da montare e a quelli correntemente montati. Le funzioni servono a
1256 leggere il contenuto di questi file in opportune strutture \struct{fstab} e
1257 \struct{mntent}, e, nel caso di \conffile{/etc/mtab}, per inserire e rimuovere
1258 le voci presenti nel file.
1260 In generale si dovrebbero usare queste funzioni, in particolare quelle
1261 relative a \conffile{/etc/mtab}, quando si debba scrivere un programma che
1262 effettua il montaggio di un filesystem. In realtà in questi casi è molto più
1263 semplice invocare direttamente il programma \cmd{mount}. Inoltre l'uso stesso
1264 di \conffile{/etc/mtab} è considerato una pratica obsoleta, in quanto se non
1265 aggiornato correttamente (cosa che è impossibile se la radice è montata in
1266 sola lettura) il suo contenuto diventa fuorviante.
1268 Per questo motivo il suo utilizzo viene deprecato ed in molti casi viene già
1269 oggi sostituito da un link simbolico a \procfile{/proc/mounts}, che contiene
1270 una versione degli stessi contenuti (vale a dire l'elenco dei filesystem
1271 montati) generata direttamente dal kernel, e quindi sempre disponibile e
1272 sempre aggiornata. Per questo motivo tralasceremo la trattazione, di queste
1273 funzioni, rimandando al manuale delle \acr{glibc} \cite{GlibcMan} per la
1274 documentazione completa.
1276 % TODO (bassa priorità) scrivere delle funzioni (getfsent e getmntent &C)
1277 % TODO (bassa priorità) documentare ? swapon e swapoff (man 2 ...)
1280 \section{La gestione di file e directory}
1281 \label{sec:file_dir}
1283 Come già accennato in sez.~\ref{sec:file_filesystem} in un sistema unix-like
1284 la gestione dei file ha delle caratteristiche specifiche che derivano
1285 direttamente dall'architettura del sistema. In questa sezione esamineremo le
1286 funzioni usate per la manipolazione di file e directory, per la creazione di
1287 link simbolici e diretti, per la gestione e la lettura delle directory. In
1288 particolare ci soffermeremo sulle conseguenze che derivano dalla struttura
1289 generica di un qualunque filesystem illustrata in
1290 sez.~\ref{sec:file_filesystem} per quanto attiene il comportamento e gli
1291 effetti delle varie funzioni.
1294 \subsection{Le funzioni \func{link} e \func{unlink}}
1295 \label{sec:file_link}
1297 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
1298 dei nomi fittizi (come gli alias del vecchio MacOS o i collegamenti di Windows
1299 o i nomi logici del VMS) che permettono di fare riferimento allo stesso file
1300 chiamandolo con nomi diversi o accedendovi da directory diverse.
1302 Questo è possibile anche in ambiente Unix, dove tali collegamenti sono
1303 usualmente chiamati ``\textit{link}''; ma data l'architettura del sistema
1304 riguardo la gestione dei file ci sono due metodi sostanzialmente diversi per
1305 fare questa operazione.
1307 Come spiegato in sez.~\ref{sec:file_filesystem} l'accesso al contenuto di un
1308 file su disco avviene passando attraverso il suo \itindex{inode}
1309 \textit{inode}, che è la struttura usata dal kernel che lo identifica
1310 univocamente all'interno di un singolo filesystem. Il nome del file che si
1311 trova nella voce di una directory è solo un'etichetta, mantenuta all'interno
1312 della directory, che viene associata ad un puntatore che fa riferimento al
1313 suddetto \textit{inode}.
1315 Questo significa che fintanto che si resta sullo stesso filesystem la
1316 realizzazione di un link è immediata ed uno stesso file può avere tanti nomi
1317 diversi, dati da altrettante associazioni diverse allo stesso \itindex{inode}
1318 \textit{inode} effettuate tramite ``etichette'' diverse (voci, nella
1319 nomenclatura di sez.~\ref{sec:file_filesystem}) in directory diverse. Si noti
1320 anche che nessuno di questi nomi viene ad assumere una particolare preferenza
1321 o originalità rispetto agli altri, in quanto tutti fanno comunque riferimento
1322 allo stesso \itindex{inode} \textit{inode}.
1324 Per aggiungere ad una directory una voce che faccia riferimento ad un
1325 \itindex{inode} \textit{inode} già esistente si utilizza la funzione
1326 \funcd{link}, e si suole chiamare questo tipo di associazione un collegamento
1327 diretto, o \textit{hard link}. Il prototipo della funzione è il seguente:
1331 \fdecl{int link(const char *oldpath, const char *newpath)}
1332 \fdesc{Crea un nuovo collegamento diretto (\textit{hard link}).}
1334 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1335 nel qual caso \var{errno} assumerà uno dei valori:
1337 \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
1339 \item[\errcode{EMLINK}] ci sono troppi link al file \param{oldpath} (il
1340 numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
1341 sez.~\ref{sec:sys_limits}).
1342 \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
1343 \param{newpath} non supporta i link diretti o è una directory.
1344 \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
1345 riferimento ad un filesystem montato sullo stesso \itindex{mount~point}
1346 \textit{mount point}.
1347 \end{errlist} ed inoltre \errval{EACCES}, \errval{EFAULT}, \errval{EIO},
1348 \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM},
1349 \errval{ENOSPC}, \errval{ENOTDIR}, \errval{EROFS} nel loro significato
1354 La funzione crea sul \textit{pathname} \param{newpath} un collegamento diretto
1355 al file indicato da \param{oldpath}. Per quanto detto la creazione di un
1356 nuovo collegamento diretto non copia il contenuto del file, ma si limita a
1357 creare una voce nella directory specificata da \param{newpath} e ad aumentare
1358 di uno il numero di riferimenti al file (riportato nel campo \var{st\_nlink}
1359 della struttura \struct{stat}, vedi sez.~\ref{sec:file_stat}) aggiungendo il
1360 nuovo nome ai precedenti. In questo modo lo stesso file può essere chiamato
1361 con vari nomi in diverse directory.
1363 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
1364 collegamento diretto è possibile solo se entrambi i \textit{pathname} sono
1365 nello stesso filesystem. Inoltre il filesystem deve supportare i collegamenti
1366 diretti (il meccanismo non è disponibile ad esempio con il filesystem
1367 \acr{vfat} di Windows). In realtà la funzione ha un ulteriore requisito, e
1368 cioè che non solo che i due file siano sullo stesso filesystem, ma anche che
1369 si faccia riferimento ad essi sullo stesso \itindex{mount~point} \textit{mount
1370 point}.\footnote{si tenga presente infatti (vedi
1371 sez.~\ref{sec:sys_file_config}) che a partire dal kernel 2.4 uno stesso
1372 filesystem può essere montato più volte su directory diverse.}
1374 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
1375 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
1376 l'amministratore è in grado di creare un collegamento diretto ad un'altra
1377 directory: questo viene fatto perché con una tale operazione è possibile
1378 creare dei \textit{loop} nel filesystem (vedi l'esempio mostrato in
1379 sez.~\ref{sec:file_symlink}, dove riprenderemo il discorso) che molti
1380 programmi non sono in grado di gestire e la cui rimozione diventerebbe
1381 piuttosto complicata (in genere per questo tipo di errori occorre eseguire il
1382 programma \cmd{fsck} per riparare il filesystem).
1384 Data la pericolosità di questa operazione e la disponibilità dei link
1385 simbolici (che vedremo in sez.~\ref{sec:file_symlink}) e dei
1386 \itindex{bind~mount} \textit{bind mount} (già visti in
1387 sez.~\ref{sec:sys_file_config}) che possono fornire la stessa funzionalità
1388 senza questi problemi, nel caso di Linux questa capacità è stata completamente
1389 disabilitata, e al tentativo di creare un link diretto ad una directory la
1390 funzione \func{link} restituisce l'errore \errcode{EPERM}.
1392 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
1393 \textit{hard link} ad un link simbolico. In questo caso lo standard
1394 POSIX.1-2001 prevederebbe che quest'ultimo venga risolto e che il collegamento
1395 sia effettuato rispetto al file cui esso punta, e che venga riportato un
1396 errore qualora questo non esista o non sia un file. Questo era anche il
1397 comportamento iniziale di Linux ma a partire dai kernel della serie
1398 2.0.x\footnote{per la precisione il comportamento era quello previsto dallo
1399 standard POSIX fino al kernel di sviluppo 1.3.56, ed è stato temporaneamente
1400 ripristinato anche durante lo sviluppo della serie 2.1.x, per poi tornare al
1401 comportamento attuale fino ad oggi (per riferimento si veda
1402 \url{http://lwn.net/Articles/293902}).} è stato adottato un comportamento
1403 che non segue più lo standard per cui l'\textit{hard link} viene creato
1404 rispetto al link simbolico, e non al file cui questo punta. La revisione
1405 POSIX.1-2008 lascia invece il comportamento dipendente dall'implementazione,
1406 cosa che rende Linux aderente allo standard.
1408 La ragione di questa differenza rispetto al vecchio standard, presente anche
1409 in altri sistemi unix-like, sono dovute al fatto che un link simbolico può
1410 fare riferimento anche ad un file non esistente o a una directory, per i quali
1411 l'\textit{hard link} non può essere creato, per cui la scelta di seguire il
1412 link simbolico è stata ritenuta una scelta scorretta nella progettazione
1413 dell'interfaccia. Infatti se non ci fosse il comportamento adottato da Linux
1414 sarebbe impossibile creare un \textit{hard link} ad un link simbolico, perché
1415 la funzione lo risolverebbe e l'\textit{hard link} verrebbe creato verso la
1416 destinazione. Invece evitando di seguire lo standard l'operazione diventa
1417 possibile, ed anche il comportamento della funzione risulta molto più
1418 comprensibile. Tanto più che se proprio se si vuole creare un \textit{hard
1419 link} rispetto alla destinazione di un link simbolico è sempre possibile
1420 farlo direttamente.\footnote{ciò non toglie che questo comportamento possa
1421 causare problemi, come nell'esempio descritto nell'articolo citato nella
1422 nota precedente, a programmi che non si aspettano questa differenza rispetto
1423 allo standard POSIX.}
1425 La rimozione di un file (o più precisamente della voce che lo referenzia
1426 all'interno di una directory) si effettua con la funzione \funcd{unlink}; il
1427 suo prototipo è il seguente:
1431 \fdecl{int unlink(const char *pathname)}
1432 \fdesc{Cancella un file.}
1434 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1435 nel qual caso \var{errno} assumerà uno dei valori:
1437 \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una
1438 directory.\footnotemark
1439 \item[\errcode{EROFS}] \param{pathname} è su un filesystem montato in sola
1441 \item[\errcode{EISDIR}] \param{pathname} fa riferimento a una directory.
1442 \end{errlist} ed inoltre \errval{EACCES}, \errval{EFAULT}, \errval{ENOENT},
1443 \errval{ENOTDIR}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
1444 \errval{EIO} nel loro significato generico.}
1447 \footnotetext{questo è un valore specifico ritornato da Linux che non consente
1448 l'uso di \func{unlink} con le directory (vedi sez.~\ref{sec:file_remove}).
1449 Non è conforme allo standard POSIX, che prescrive invece l'uso di
1450 \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
1451 abbia privilegi sufficienti.}
1453 La funzione cancella il nome specificato da \param{pathname} nella relativa
1454 directory e decrementa il numero di riferimenti nel relativo \itindex{inode}
1455 \textit{inode}. Nel caso di link simbolico cancella il link simbolico; nel
1456 caso di socket, fifo o file di dispositivo \index{file!di~dispositivo} rimuove
1457 il nome, ma come per i file i processi che hanno aperto uno di questi oggetti
1458 possono continuare ad utilizzarlo.
1460 Per cancellare una voce in una directory è necessario avere il permesso di
1461 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
1462 il diritto di esecuzione sulla directory che la contiene (affronteremo in
1463 dettaglio l'argomento dei permessi di file e directory in
1464 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
1465 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
1466 occorrerà anche essere proprietari del file o proprietari della directory (o
1467 root, per cui nessuna delle restrizioni è applicata).
1469 Una delle caratteristiche di queste funzioni è che la creazione/rimozione del
1470 nome dalla directory e l'incremento/decremento del numero di riferimenti
1471 \itindex{inode} nell'\textit{inode} devono essere effettuati in maniera
1472 atomica (si veda sez.~\ref{sec:proc_atom_oper}) senza possibili interruzioni
1473 fra le due operazioni. Per questo entrambe queste funzioni sono realizzate
1474 tramite una singola system call.
1476 Si ricordi infine che un file non viene eliminato dal disco fintanto che tutti
1477 i riferimenti ad esso sono stati cancellati: solo quando il \textit{link
1478 count} mantenuto \itindex{inode} nell'\textit{inode} diventa zero lo spazio
1479 occupato su disco viene rimosso (si ricordi comunque che a questo si aggiunge
1480 sempre un'ulteriore condizione,\footnote{come vedremo in
1481 cap.~\ref{cha:file_unix_interface} il kernel mantiene anche una tabella dei
1482 file aperti nei vari processi, che a sua volta contiene i riferimenti agli
1483 \itindex{inode} \textit{inode} ad essi relativi. Prima di procedere alla
1484 cancellazione dello spazio occupato su disco dal contenuto di un file il
1485 kernel controlla anche questa tabella, per verificare che anche in essa non
1486 ci sia più nessun riferimento all'\textit{inode} in questione.} e cioè che
1487 non ci siano processi che abbiano il suddetto file aperto).
1489 Questa proprietà viene spesso usata per essere sicuri di non lasciare file
1490 temporanei su disco in caso di crash dei programmi; la tecnica è quella di
1491 aprire il file e chiamare \func{unlink} subito dopo, in questo modo il
1492 contenuto del file è sempre disponibile all'interno del processo attraverso il
1493 suo file descriptor (vedi sez.~\ref{sec:file_fd}) fintanto che il processo non
1494 chiude il file, ma non ne resta traccia in nessuna directory, e lo spazio
1495 occupato su disco viene immediatamente rilasciato alla conclusione del
1496 processo (quando tutti i file vengono chiusi).
1499 \subsection{Le funzioni \func{remove} e \func{rename}}
1500 \label{sec:file_remove}
1502 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
1503 \func{unlink} sulle directory; per cancellare una directory si può usare la
1504 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}), oppure la
1505 funzione \funcd{remove}.
1507 Questa è la funzione prevista dallo standard ANSI C per cancellare un file o
1508 una directory (e funziona anche per i sistemi che non supportano i link
1509 diretti). Per i file è identica a \func{unlink} e per le directory è identica
1510 a \func{rmdir}; il suo prototipo è:
1514 \fdecl{int remove(const char *pathname)}
1515 \fdesc{Cancella un nome dal filesystem.}
1517 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1518 caso \var{errno} assumerà uno dei valori relativi alla chiamata utilizzata,
1519 pertanto si può fare riferimento a quanto illustrato nelle descrizioni di
1520 \func{unlink} e \func{rmdir}.}
1523 La funzione utilizza la funzione \func{unlink}\footnote{questo vale usando le
1524 \acr{glibc}; nelle libc4 e nelle libc5 la funzione \func{remove} è un
1525 semplice alias alla funzione \func{unlink} e quindi non può essere usata per
1526 le directory.} per cancellare i file e la funzione \func{rmdir} per
1527 cancellare le directory; si tenga presente che per alcune implementazioni del
1528 protocollo NFS utilizzare questa funzione può comportare la scomparsa di file
1531 Per cambiare nome ad un file o a una directory (che devono comunque essere
1532 nello stesso filesystem) si usa invece la funzione \funcd{rename},\footnote{la
1533 funzione è definita dallo standard ANSI C, ma si applica solo per i file, lo
1534 standard POSIX estende la funzione anche alle directory.} il cui prototipo
1539 \fdecl{int rename(const char *oldpath, const char *newpath)}
1540 \fdesc{Rinomina un file.}
1542 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1543 nel qual caso \var{errno} assumerà uno dei valori:
1545 \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
1546 \param{oldpath} non è una directory.
1547 \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
1549 \item[\errcode{ENOTEMPTY}] \param{newpath} è una directory già esistente e
1551 \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
1552 parte di qualche processo (come \index{directory~di~lavoro} directory di
1553 lavoro o come radice) o del sistema (come \itindex{mount~point}
1554 \textit{mount point}).
1555 \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
1556 \param{oldpath} o più in generale si è cercato di creare una directory come
1557 sotto-directory di se stessa.
1558 \item[\errcode{ENOTDIR}] uno dei componenti dei \textit{pathname} non è una
1559 directory o \param{oldpath} è una directory e
1560 \param{newpath} esiste e non è una directory.
1561 \end{errlist} ed inoltre \errval{EACCES}, \errval{EPERM}, \errval{EMLINK},
1562 \errval{ENOENT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP} e
1563 \errval{ENOSPC} nel loro significato generico.}
1566 La funzione rinomina il file \param{oldpath} in \param{newpath}, eseguendo se
1567 necessario lo spostamento di un file fra directory diverse. Eventuali altri
1568 link diretti allo stesso file non vengono influenzati.
1570 Il comportamento della funzione è diverso a seconda che si voglia rinominare
1571 un file o una directory; se ci riferisce ad un file allora \param{newpath}, se
1572 esiste, non deve essere una directory (altrimenti si ha l'errore
1573 \errcode{EISDIR}). Nel caso \param{newpath} indichi un file esistente questo
1574 viene cancellato e rimpiazzato (atomicamente).
1576 Se \param{oldpath} è una directory allora \param{newpath}, se esiste, deve
1577 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
1578 (se non è una directory) o \errcode{ENOTEMPTY} (se non è vuota). Chiaramente
1579 \param{newpath} non può contenere \param{oldpath} altrimenti si avrà un errore
1582 Se \param{oldpath} si riferisce ad un link simbolico questo sarà rinominato; se
1583 \param{newpath} è un link simbolico verrà cancellato come qualunque altro
1584 file. Infine qualora \param{oldpath} e \param{newpath} siano due nomi dello
1585 stesso file lo standard POSIX prevede che la funzione non dia errore, e non
1586 faccia nulla, lasciando entrambi i nomi; Linux segue questo standard, anche
1587 se, come fatto notare dal manuale delle \textit{glibc}, il comportamento più
1588 ragionevole sarebbe quello di cancellare \param{oldpath}.
1590 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
1591 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
1592 può esistere cioè nessun istante in cui un altro processo può trovare attivi
1593 entrambi i nomi dello stesso file, o, in caso di sostituzione di un file
1594 esistente, non trovare quest'ultimo prima che la sostituzione sia stata
1597 In ogni caso se \param{newpath} esiste e l'operazione fallisce per un qualche
1598 motivo (come un crash del kernel), \func{rename} garantisce di lasciare
1599 presente un'istanza di \param{newpath}. Tuttavia nella sovrascrittura potrà
1600 esistere una finestra in cui sia \param{oldpath} che \param{newpath} fanno
1601 riferimento allo stesso file.
1604 \subsection{I link simbolici}
1605 \label{sec:file_symlink}
1607 Come abbiamo visto in sez.~\ref{sec:file_link} la funzione \func{link} crea
1608 riferimenti agli \itindex{inode} \textit{inode}, pertanto può funzionare
1609 soltanto per file che risiedono sullo stesso filesystem e solo per un
1610 filesystem di tipo Unix. Inoltre abbiamo visto che in Linux non è consentito
1611 eseguire un link diretto ad una directory.
1613 Per ovviare a queste limitazioni i sistemi Unix supportano un'altra forma di
1614 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
1615 come avviene in altri sistemi operativi, dei file speciali che contengono
1616 semplicemente il riferimento ad un altro file (o directory). In questo modo è
1617 possibile effettuare link anche attraverso filesystem diversi, a file posti in
1618 filesystem che non supportano i link diretti, a delle directory, ed anche a
1619 file che non esistono ancora.
1621 Il sistema funziona in quanto i link simbolici sono riconosciuti come tali dal
1622 kernel\footnote{è uno dei diversi tipi di file visti in
1623 tab.~\ref{tab:file_file_types}, contrassegnato come tale
1624 nell'\textit{inode}, e riconoscibile dal valore del campo \var{st\_mode}
1625 della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).} per cui
1626 alcune funzioni di libreria (come \func{open} o \func{stat}) quando ricevono
1627 come argomento un link simbolico vengono automaticamente applicate al file da
1628 esso specificato. La funzione che permette di creare un nuovo link simbolico
1629 è \funcd{symlink}, ed il suo prototipo è:
1634 \fdecl{int symlink(const char *oldpath, const char *newpath)}
1635 \fdesc{Crea un nuovo link simbolico.}
1637 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1638 nel qual caso \var{errno} assumerà uno dei valori:
1640 \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
1641 supporta i link simbolici.
1642 \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
1643 \param{oldpath} è una stringa vuota.
1644 \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
1645 \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
1647 \end{errlist} ed inoltre \errval{EFAULT}, \errval{EACCES},
1648 \errval{ENAMETOOLONG}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1649 \errval{ENOSPC} e \errval{EIO} nel loro significato generico.}
1652 La funzione crea un nuovo link simbolico con \textit{pathname} \param{newpath}
1653 che fa riferimento ad \param{oldpath}. Si tenga presente che la funzione non
1654 effettua nessun controllo sull'esistenza di un file di nome \param{oldpath},
1655 ma si limita ad inserire il \textit{pathname} nel link simbolico. Pertanto un
1656 link simbolico può anche riferirsi ad un file che non esiste: in questo caso
1657 si ha quello che viene chiamato un \textit{dangling link}, letteralmente un
1658 \textsl{link ciondolante}.
1660 Come accennato i link simbolici sono risolti automaticamente dal kernel
1661 all'invocazione delle varie system call; in tab.~\ref{tab:file_symb_effect} si
1662 è riportato un elenco dei comportamenti delle varie funzioni di libreria che
1663 operano sui file nei confronti della risoluzione dei link simbolici,
1664 specificando quali seguono il link simbolico e quali invece possono operare
1665 direttamente sul suo contenuto.
1669 \begin{tabular}[c]{|l|c|c|}
1671 \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
1674 \func{access} & $\bullet$ & -- \\
1675 \func{chdir} & $\bullet$ & -- \\
1676 \func{chmod} & $\bullet$ & -- \\
1677 \func{chown} & -- & $\bullet$ \\
1678 \func{creat} & $\bullet$ & -- \\
1679 \func{exec} & $\bullet$ & -- \\
1680 \func{lchown} & $\bullet$ & -- \\
1681 \func{link}\footnotemark & -- & $\bullet$ \\
1682 \func{lstat} & -- & $\bullet$ \\
1683 \func{mkdir} & $\bullet$ & -- \\
1684 \func{mkfifo} & $\bullet$ & -- \\
1685 \func{mknod} & $\bullet$ & -- \\
1686 \func{open} & $\bullet$ & -- \\
1687 \func{opendir} & $\bullet$ & -- \\
1688 \func{pathconf} & $\bullet$ & -- \\
1689 \func{readlink} & -- & $\bullet$ \\
1690 \func{remove} & -- & $\bullet$ \\
1691 \func{rename} & -- & $\bullet$ \\
1692 \func{stat} & $\bullet$ & -- \\
1693 \func{truncate} & $\bullet$ & -- \\
1694 \func{unlink} & -- & $\bullet$ \\
1697 \caption{Uso dei link simbolici da parte di alcune funzioni.}
1698 \label{tab:file_symb_effect}
1701 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
1702 dallo standard POSIX, si veda quanto detto in sez.~\ref{sec:file_link}.}
1704 Si noti che non si è specificato il comportamento delle funzioni che operano
1705 con i file descriptor, in quanto la risoluzione del link simbolico viene in
1706 genere effettuata dalla funzione che restituisce il file descriptor
1707 (normalmente la \func{open}, vedi sez.~\ref{sec:file_open}) e tutte le
1708 operazioni seguenti fanno riferimento solo a quest'ultimo.
1710 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
1711 \func{open} seguono i link simbolici, occorrono funzioni apposite per accedere
1712 alle informazioni del link invece che a quelle del file a cui esso fa
1713 riferimento. Quando si vuole leggere il contenuto di un link simbolico si usa
1714 la funzione \funcd{readlink}, il cui prototipo è:
1715 \begin{prototype}{unistd.h}
1716 {int readlink(const char *path, char *buff, size\_t size)}
1717 Legge il contenuto del link simbolico indicato da \param{path} nel buffer
1718 \param{buff} di dimensione \param{size}.
1720 \bodydesc{La funzione restituisce il numero di caratteri letti dentro
1721 \param{buff} o -1 per un errore, nel qual caso la variabile
1722 \var{errno} assumerà i valori:
1724 \item[\errcode{EINVAL}] \param{path} non è un link simbolico o \param{size}
1727 ed inoltre \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1728 \errval{EACCES}, \errval{ELOOP}, \errval{EIO}, \errval{EFAULT} e
1732 La funzione apre il link simbolico, ne legge il contenuto, lo scrive nel
1733 buffer, e lo richiude. Si tenga presente che la funzione non termina la
1734 stringa con un carattere nullo e la tronca alla dimensione specificata da
1735 \param{size} per evitare di sovrascrivere oltre le dimensioni del buffer.
1739 \includegraphics[width=8.5cm]{img/link_loop}
1740 \caption{Esempio di loop nel filesystem creato con un link simbolico.}
1741 \label{fig:file_link_loop}
1744 Un caso comune che si può avere con i link simbolici è la creazione dei
1745 cosiddetti \textit{loop}. La situazione è illustrata in
1746 fig.~\ref{fig:file_link_loop}, che riporta la struttura della directory
1747 \file{/boot}. Come si vede si è creato al suo interno un link simbolico che
1748 punta di nuovo a \file{/boot}.\footnote{il loop mostrato in
1749 fig.~\ref{fig:file_link_loop} è un usato per poter permettere a \cmd{grub}
1750 (un bootloader in grado di leggere direttamente da vari filesystem il file
1751 da lanciare come sistema operativo) di vedere i file contenuti nella
1752 directory \file{/boot} con lo stesso \textit{pathname} con cui verrebbero
1753 visti dal sistema operativo, anche se essi si trovano, come accade spesso,
1754 su una partizione separata (che \cmd{grub}, all'avvio, vede come radice).}
1756 Questo può causare problemi per tutti quei programmi che effettuano la
1757 scansione di una directory senza tener conto dei link simbolici, ad esempio se
1758 lanciassimo un comando del tipo \code{grep -r linux *}, il loop nella
1759 directory porterebbe il comando ad esaminare \file{/boot}, \file{/boot/boot},
1760 \file{/boot/boot/boot} e così via.
1762 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
1763 un \textit{pathname} possano essere seguiti un numero limitato di link
1764 simbolici, il cui valore limite è specificato dalla costante
1765 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
1766 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}.
1768 Un punto da tenere sempre presente è che, come abbiamo accennato, un link
1769 simbolico può fare riferimento anche ad un file che non esiste; ad esempio
1770 possiamo creare un file temporaneo nella nostra directory con un link del
1773 $ ln -s /tmp/tmp_file temporaneo
1775 anche se \file{/tmp/tmp\_file} non esiste. Questo può generare confusione, in
1776 quanto aprendo in scrittura \file{temporaneo} verrà creato
1777 \file{/tmp/tmp\_file} e scritto; ma accedendo in sola lettura a
1778 \file{temporaneo}, ad esempio con \cmd{cat}, otterremmo:
1781 cat: temporaneo: No such file or directory
1783 con un errore che può sembrare sbagliato, dato che un'ispezione con \cmd{ls}
1784 ci mostrerebbe invece l'esistenza di \file{temporaneo}.
1787 \subsection{La creazione e la cancellazione delle directory}
1788 \label{sec:file_dir_creat_rem}
1790 Benché in sostanza le directory non siano altro che dei file contenenti
1791 elenchi di nomi ed \itindex{inode} \textit{inode}, non è possibile trattarle
1792 come file ordinari e devono essere create direttamente dal kernel attraverso
1793 una opportuna system call.\footnote{questo è quello che permette anche,
1794 attraverso l'uso del VFS, l'utilizzo di diversi formati per la gestione dei
1795 suddetti elenchi, dalle semplici liste a strutture complesse come alberi
1796 binari, hash, ecc. che consentono una ricerca veloce quando il numero di
1797 file è molto grande.} La funzione usata per creare una directory è
1798 \funcd{mkdir}, ed il suo prototipo è:
1800 \headdecl{sys/stat.h}
1801 \headdecl{sys/types.h}
1802 \funcdecl{int mkdir(const char *dirname, mode\_t mode)}
1804 Crea una nuova directory.
1806 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1807 errore, nel qual caso \var{errno} assumerà i valori:
1809 \item[\errcode{EEXIST}] un file (o una directory) con quel nome esiste di
1811 \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
1812 cui si vuole inserire la nuova directory.
1813 \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
1814 directory contiene troppi file; sotto Linux questo normalmente non avviene
1815 perché il filesystem standard consente la creazione di un numero di file
1816 maggiore di quelli che possono essere contenuti nel disco, ma potendo
1817 avere a che fare anche con filesystem di altri sistemi questo errore può
1819 \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
1820 la nuova directory o si è esaurita la quota disco dell'utente.
1822 ed inoltre anche \errval{EPERM}, \errval{EFAULT}, \errval{ENAMETOOLONG},
1823 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1827 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
1828 standard presenti in ogni directory (cioè ``\file{.}'' e ``\file{..}''), con
1829 il nome indicato dall'argomento \param{dirname}. Il nome può essere indicato
1830 sia come \itindsub{pathname}{assoluto} \textit{pathname} assoluto che come
1831 \itindsub{pathname}{relativo} \textit{pathname} relativo.
1833 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
1834 directory viene creata sono specificati dall'argomento \param{mode}, i cui
1835 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
1836 tenga presente che questi sono modificati dalla maschera di creazione dei file
1837 (si veda sez.~\ref{sec:file_perm_management}). La titolarità della nuova
1838 directory è impostata secondo quanto riportato in
1839 sez.~\ref{sec:file_ownership_management}.
1841 La funzione che permette la cancellazione di una directory è invece
1842 \funcd{rmdir}, ed il suo prototipo è:
1843 \begin{prototype}{sys/stat.h}{int rmdir(const char *dirname)}
1844 Cancella una directory.
1846 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1847 errore, nel qual caso \var{errno} assumerà i valori:
1849 \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
1850 directory, oppure la directory che contiene \param{dirname} ha lo
1851 \itindex{sticky~bit} \textit{sticky bit} impostato e l'\ids{UID} effettivo
1852 del processo non corrisponde al proprietario della directory.
1853 \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
1854 che contiene la directory che si vuole cancellare, o non c'è il permesso
1855 di attraversare (esecuzione) una delle directory specificate in
1857 \item[\errcode{EBUSY}] la directory specificata è la
1858 \index{directory~di~lavoro} directory di lavoro o la radice di qualche
1860 \item[\errcode{ENOTEMPTY}] la directory non è vuota.
1862 ed inoltre anche \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1863 \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{EROFS}.}
1866 La funzione cancella la directory \param{dirname}, che deve essere vuota (la
1867 directory deve cioè contenere soltanto le due voci standard ``\file{.}'' e
1868 ``\file{..}''). Il nome può essere indicato con il \textit{pathname} assoluto
1871 La modalità con cui avviene la cancellazione è analoga a quella di
1872 \func{unlink}: fintanto che il numero di link \itindex{inode}
1873 all'\textit{inode} della directory non diventa nullo e nessun processo ha la
1874 directory aperta lo spazio occupato su disco non viene rilasciato. Se un
1875 processo ha la directory aperta la funzione rimuove il link \itindex{inode}
1876 all'\textit{inode} e nel caso sia l'ultimo, pure le voci standard ``\file{.}''
1877 e ``\file{..}'', a questo punto il kernel non consentirà di creare più nuovi
1878 file nella directory.
1881 \subsection{La creazione di file speciali}
1882 \label{sec:file_mknod}
1884 \index{file!di~dispositivo|(}
1886 Finora abbiamo parlato esclusivamente di file, directory e link simbolici; in
1887 sez.~\ref{sec:file_file_types} abbiamo visto però che il sistema prevede pure
1888 degli altri tipi di file speciali, come i file di dispositivo, le fifo ed i
1889 socket (questi ultimi sono un caso a parte, essendo associati anche alla
1890 comunicazione via rete, per cui ci saranno trattati in dettaglio a partire da
1891 cap.~\ref{cha:socket_intro}).
1893 La manipolazione delle caratteristiche di questi diversi tipi di file e la
1894 loro cancellazione può essere effettuata con le stesse funzioni che operano
1895 sui file regolari; ma quando li si devono creare sono necessarie delle
1896 funzioni apposite. La prima di queste funzioni è \funcd{mknod}, il cui
1899 \headdecl{sys/types.h}
1900 \headdecl{sys/stat.h}
1903 \funcdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)}
1905 Crea un \textit{inode} del tipo specificato sul filesystem.
1907 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1908 errore, nel qual caso \var{errno} assumerà i valori:
1910 \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
1911 l'\texttt{inode}, o il filesystem su cui si è cercato di
1912 creare \param{pathname} non supporta l'operazione.
1913 \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
1914 fifo, un socket o un dispositivo.
1915 \item[\errcode{EEXIST}] \param{pathname} esiste già o è un link simbolico.
1917 ed inoltre anche \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
1918 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1919 \errval{ENOSPC}, \errval{EROFS}.}
1922 La funzione, come suggerisce il nome, permette di creare un ``\textsl{nodo}''
1923 sul filesystem, e viene in genere utilizzata per creare i file di dispositivo,
1924 ma si può usare anche per creare file regolari. L'argomento
1925 \param{mode} specifica sia il tipo di file che si vuole creare che i relativi
1926 permessi, secondo i valori riportati in tab.~\ref{tab:file_mode_flags}, che
1927 vanno combinati con un OR binario. I permessi sono comunque modificati nella
1928 maniera usuale dal valore di \itindex{umask} \textit{umask} (si veda
1929 sez.~\ref{sec:file_perm_management}).
1931 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
1932 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
1933 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
1934 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
1935 per una fifo;\footnote{con Linux la funzione non può essere usata per creare
1936 directory o link simbolici, si dovranno usare le funzioni \func{mkdir} e
1937 \func{symlink} a questo dedicate.} un valore diverso comporterà l'errore
1940 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
1941 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
1942 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
1943 valore verrà ignorato. Solo l'amministratore può creare un file di
1944 dispositivo usando questa funzione (il processo deve avere la
1945 \itindex{capabilities} \textit{capability} \const{CAP\_MKNOD}), ma in
1946 Linux\footnote{questo è un comportamento specifico di Linux, la funzione non è
1947 prevista dallo standard POSIX.1 originale, mentre è presente in SVr4 e
1948 4.4BSD, ma esistono differenze nei comportamenti e nei codici di errore,
1949 tanto che questa è stata introdotta in POSIX.1-2001 con una nota che la
1950 definisce portabile solo quando viene usata per creare delle fifo, ma
1951 comunque deprecata essendo utilizzabile a tale scopo la specifica
1952 \func{mkfifo}.} l'uso per la creazione di un file ordinario, di una fifo o
1953 di un socket è consentito anche agli utenti normali.
1955 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
1956 al proprietario e al gruppo del processo che li ha creati, a meno che non si
1957 sia attivato il bit \acr{sgid} per la directory o sia stata attivata la
1958 semantica BSD per il filesystem (si veda
1959 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
1960 \itindex{inode} l'\textit{inode}.
1962 Nella creazione di un file di dispositivo occorre poi specificare
1963 correttamente il valore di \param{dev}; questo infatti è di tipo
1964 \type{dev\_t}, che è un tipo primitivo (vedi
1965 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
1966 \textsl{numero} di dispositivo; il kernel infatti identifica ciascun
1967 dispositivo con un valore numerico. Originariamente questo era un intero a 16
1968 bit diviso in due parti di 8 bit chiamate rispettivamente
1969 \itindex{major~number} \textit{major number} e \itindex{minor~number}
1970 \textit{minor number}, che sono poi i due numeri mostrati dal comando
1971 \texttt{ls -l} al posto della dimensione quando lo si esegue su un file di
1974 Il \itindex{major~number} \textit{major number} identifica una classe di
1975 dispositivi (ad esempio la seriale, o i dischi IDE) e serve in sostanza per
1976 indicare al kernel quale è il modulo che gestisce quella classe di
1977 dispositivi; per identificare uno specifico dispositivo di quella classe (ad
1978 esempio una singola porta seriale, o una partizione di un disco) si usa invece
1979 il \itindex{minor~number} \textit{minor number}. L'elenco aggiornato di questi
1980 numeri con le relative corrispondenze ai vari dispositivi può essere trovato
1981 nel file \texttt{Documentation/devices.txt} allegato alla documentazione dei
1982 sorgenti del kernel.
1984 Data la crescita nel numero di dispositivi supportati, ben presto il limite
1985 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
1986 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
1987 \type{dev\_t}, con delle dimensioni passate a 12 bit per il
1988 \itindex{major~number} \textit{major number} e 20 bit per il
1989 \itindex{minor~number} \textit{minor number}. La transizione però ha anche
1990 comportato il passaggio di \type{dev\_t} a \index{tipo!opaco} tipo opaco, e la
1991 necessità di specificare il numero tramite delle opportune macro, così da non
1992 avere problemi di compatibilità con eventuali ulteriori estensioni.
1994 Le macro sono definite nel file \headfile{sys/sysmacros.h}, che viene
1995 automaticamente incluso quando si include \headfile{sys/types.h}; si possono
1996 pertanto ottenere i valori del \itindex{major~number} \textit{major number} e
1997 \itindex{minor~number} \textit{minor number} di un dispositivo rispettivamente
1998 con le macro \macro{major} e \macro{minor}:
2000 \headdecl{sys/types.h}
2001 \funcdecl{int \macro{major}(dev\_t dev)}
2002 Restituisce il \itindex{major~number} \textit{major number} del dispositivo
2005 \funcdecl{int \macro{minor}(dev\_t dev)}
2006 Restituisce il \itindex{minor~number} \textit{minor number} del dispositivo
2009 \noindent mentre una volta che siano noti \itindex{major~number} \textit{major
2010 number} e \itindex{minor~number} \textit{minor number} si potrà costruire il
2011 relativo identificativo con la macro \macro{makedev}:
2013 \headdecl{sys/types.h}
2014 \funcdecl{dev\_t \macro{minor}(int major, int minor)}
2016 Restituisce l'identificativo di un dispositivo dati \itindex{major~number}
2017 \textit{major number} e \itindex{minor~number} \textit{minor number}.
2020 \index{file!di~dispositivo|)}
2022 Infine con lo standard POSIX.1-2001 è stata introdotta una funzione specifica
2023 per creare una fifo (tratteremo le fifo in in sez.~\ref{sec:ipc_named_pipe});
2024 la funzione è \funcd{mkfifo} ed il suo prototipo è:
2026 \headdecl{sys/types.h} \headdecl{sys/stat.h}
2028 \funcdecl{int mkfifo(const char *pathname, mode\_t mode)}
2032 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
2033 errore, nel qual caso \var{errno} assumerà i valori \errval{EACCES},
2034 \errval{EEXIST}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC},
2035 \errval{ENOTDIR} e \errval{EROFS}.}
2038 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
2039 per \func{mknod} il file \param{pathname} non deve esistere (neanche come link
2040 simbolico); al solito i permessi specificati da \param{mode} vengono
2041 modificati dal valore di \itindex{umask} \textit{umask}.
2045 \subsection{Accesso alle directory}
2046 \label{sec:file_dir_read}
2048 Benché le directory alla fine non siano altro che dei file che contengono
2049 delle liste di nomi ed \itindex{inode} \textit{inode}, per il ruolo che
2050 rivestono nella struttura del sistema, non possono essere trattate come dei
2051 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
2052 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
2053 può essere un processo a inserirvi direttamente delle voci con le usuali
2054 funzioni di scrittura.
2056 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
2057 kernel, sono molte le situazioni in cui i processi necessitano di poterne
2058 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
2059 in sez.~\ref{sec:file_open} che è possibile aprire una directory come se fosse
2060 un file, anche se solo in sola lettura) in generale il formato con cui esse
2061 sono scritte può dipendere dal tipo di filesystem, tanto che, come riportato
2062 in tab.~\ref{tab:file_file_operations}, il VFS del kernel prevede una apposita
2063 funzione per la lettura delle directory.
2065 Tutto questo si riflette nello standard POSIX\footnote{le funzioni erano
2066 presenti in SVr4 e 4.3BSD, la loro specifica è riportata in POSIX.1-2001.}
2067 che ha introdotto una apposita interfaccia per la lettura delle directory,
2068 basata sui cosiddetti \textit{directory stream} (chiamati così per l'analogia
2069 con i file stream dell'interfaccia standard ANSI C di
2070 cap.~\ref{cha:files_std_interface}). La prima funzione di questa interfaccia è
2071 \funcd{opendir}, il cui prototipo è:
2073 \headdecl{sys/types.h} \headdecl{dirent.h}
2075 \funcdecl{DIR * opendir(const char *dirname)}
2077 Apre un \textit{directory stream}.
2079 \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
2080 in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
2081 assumerà i valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
2082 \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}.}
2085 La funzione apre un \textit{directory stream} per la directory
2086 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
2087 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
2088 \textit{directory stream}) da usare per tutte le operazioni successive, la
2089 funzione inoltre posiziona lo stream sulla prima voce contenuta nella
2092 Si tenga presente che comunque la funzione opera associando il
2093 \textit{directory stream} ad un opportuno file descriptor sottostante, sul
2094 quale vengono compiute le operazioni. Questo viene sempre aperto impostando il
2095 flag di \itindex{close-on-exec} \textit{close-on-exec}, così da evitare che
2096 resti aperto in caso di esecuzione di un altro programma.
2098 Nel caso in cui sia necessario conoscere il \textit{file descriptor} associato
2099 ad un \textit{directory stream} si può usare la funzione
2100 \funcd{dirfd},\footnote{questa funzione è una estensione introdotta con BSD
2101 4.3-Reno ed è presente in Linux con le libc5 (a partire dalla versione
2102 5.1.2) e con le \acr{glibc} ma non presente in POSIX fino alla revisione
2103 POSIX.1-2008, per questo per poterla utilizzare fino alla versione 2.10
2104 delle \acr{glibc} era necessario definire le macro \macro{\_BSD\_SOURCE} o
2105 \macro{\_SVID\_SOURCE}, dalla versione 2.10 si possono usare anche
2106 \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o
2107 \texttt{\macro{\_XOPEN\_SOURCE} >= 700}.} il cui prototipo è:
2109 \headdecl{sys/types.h} \headdecl{dirent.h}
2111 \funcdecl{int dirfd(DIR * dir)}
2113 Restituisce il file descriptor associato ad un \textit{directory stream}.
2115 \bodydesc{La funzione restituisce il file descriptor (un valore positivo) in
2116 caso di successo e -1 in caso di errore.}
2119 La funzione restituisce il file descriptor associato al \textit{directory
2120 stream} \param{dir}. Di solito si utilizza questa funzione in abbinamento a
2121 funzioni che operano sui file descriptor, ad esempio si potrà usare
2122 \func{fstat} per ottenere le proprietà della directory, o \func{fchdir} per
2123 spostare su di essa la \index{directory~di~lavoro} directory di lavoro (vedi
2124 sez.~\ref{sec:file_work_dir}).
2126 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
2127 possibile associarvi un \textit{directory stream} con la funzione
2128 \funcd{fdopendir},\footnote{questa funzione è però disponibile solo a partire
2129 dalla versione 2.4 delle \acr{glibc}, ed è stata introdotta nello standard
2130 POSIX solo a partire dalla revisione POSIX.1-2008, prima della versione 2.10
2131 delle \acr{glibc} per poterla utilizzare era necessario definire la macro
2132 \macro{\_GNU\_SOURCE}, dalla versione 2.10 si possono usare anche
2133 \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o \texttt{\_XOPEN\_SOURCE >=
2134 700} .} il cui prototipo è:
2136 \headdecl{sys/types.h} \headdecl{dirent.h}
2138 \funcdecl{DIR * fdopendir(int fd)}
2140 Associa un \textit{directory stream} al file descriptor \param{fd}.
2142 \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
2143 in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
2144 assumerà il valore \errval{EBADF}.}
2147 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
2148 stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
2149 stato aperto in precedenza; la funzione darà un errore qualora questo non
2150 corrisponda ad una directory. L'uso di questa funzione permette di rispondere
2151 agli stessi requisiti delle funzioni ``\textit{at}'' che vedremo in
2152 sez.~\ref{sec:file_openat}.
2154 Una volta utilizzata il file descriptor verrà usato internamente dalle
2155 funzioni che operano sul \textit{directory stream} e non dovrà essere più
2156 utilizzato all'interno del proprio programma; in particolare dovrà essere
2157 chiuso con \func{closedir} e non direttamente. Si tenga presente inoltre che
2158 \func{fdopendir} non modifica lo stato di un eventuale flag di
2159 \itindex{close-on-exec} \textit{close-on-exec}, che pertanto dovrà essere
2160 impostato esplicitamente in fase di apertura del file descriptor.
2162 Una volta che si sia aperto un \textit{directory stream} la lettura del
2163 contenuto della directory viene effettuata attraverso la funzione
2164 \funcd{readdir}; il suo prototipo è:
2166 \headdecl{sys/types.h} \headdecl{dirent.h}
2168 \funcdecl{struct dirent *readdir(DIR *dir)}
2170 Legge una voce dal \textit{directory stream}.
2172 \bodydesc{La funzione restituisce il puntatore alla struttura contenente i
2173 dati in caso di successo e \val{NULL} altrimenti, in caso di
2174 \textit{directory stream} non valido \var{errno} assumerà il valore
2175 \errval{EBADF}, il valore \val{NULL} viene restituito anche quando si
2176 raggiunge la fine dello stream.}
2179 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
2180 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
2181 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
2182 esaurite tutte le voci in essa presenti.
2184 \begin{figure}[!htb]
2185 \footnotesize \centering
2186 \begin{minipage}[c]{\textwidth}
2187 \includestruct{listati/dirent.c}
2190 \caption{La struttura \structd{dirent} per la lettura delle informazioni dei
2192 \label{fig:file_dirent_struct}
2195 I dati vengono memorizzati in una struttura \struct{dirent}, la cui
2196 definizione è riportata in fig.~\ref{fig:file_dirent_struct}.\footnote{la
2197 definizione è quella usata da Linux, che si trova nel file
2198 \file{/usr/include/bits/dirent.h}, essa non contempla la presenza del campo
2199 \var{d\_namlen} che indica la lunghezza del nome del file.} La funzione
2200 restituisce il puntatore alla struttura; si tenga presente però che
2201 quest'ultima è allocata staticamente, per cui viene sovrascritta tutte le
2202 volte che si ripete la lettura di una voce sullo stesso \textit{directory
2205 Di questa funzione esiste anche una versione \index{funzioni!rientranti}
2206 rientrante, \funcd{readdir\_r},\footnote{per usarla è necessario definire una
2207 qualunque delle macro \texttt{\macro{\_POSIX\_C\_SOURCE} >= 1},
2208 \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
2209 \macro{\_POSIX\_SOURCE}.} che non usa una struttura allocata staticamente, e
2210 può essere utilizzata anche con i \itindex{thread} \textit{thread}, il suo
2213 \headdecl{sys/types.h} \headdecl{dirent.h}
2215 \funcdecl{int readdir\_r(DIR *dir, struct dirent *entry,
2216 struct dirent **result)}
2218 Legge una voce dal \textit{directory stream}.
2220 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2221 errore, gli errori sono gli stessi di \func{readdir}.}
2224 La funzione restituisce in \param{result} (come
2225 \itindex{value~result~argument} \textit{value result argument}) l'indirizzo
2226 dove sono stati salvati i dati, che di norma corrisponde a quello della
2227 struttura precedentemente allocata e specificata dall'argomento \param{entry},
2228 anche se non è assicurato che la funzione usi lo spazio fornito dall'utente.
2230 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
2231 presenti nella directory; sia BSD che SVr4 prevedono che siano sempre presenti
2232 il campo \var{d\_name},\footnote{lo standard POSIX prevede invece solo la
2233 presenza del campo \var{d\_fileno}, identico \var{d\_ino}, che in Linux è
2234 definito come alias di quest'ultimo; il campo \var{d\_name} è considerato
2235 dipendente dall'implementazione.} che contiene il nome del file nella forma
2236 di una stringa terminata da uno zero,\footnote{lo standard POSIX non specifica
2237 una lunghezza, ma solo un limite \const{NAME\_MAX}; in SVr4 la lunghezza del
2238 campo è definita come \code{NAME\_MAX+1} che di norma porta al valore di 256
2239 byte usato anche in Linux.} ed il campo \var{d\_ino}, che contiene il numero
2240 di \textit{inode} cui il file è associato e corrisponde al campo \var{st\_ino}
2243 La presenza di ulteriori campi opzionali oltre i due citati è segnalata dalla
2244 definizione di altrettante macro nella forma \code{\_DIRENT\_HAVE\_D\_XXX}
2245 dove \code{XXX} è il nome del relativo campo; nel caso di Linux sono pertanto
2246 definite le macro \macro{\_DIRENT\_HAVE\_D\_TYPE},
2247 \macro{\_DIRENT\_HAVE\_D\_OFF} e \macro{\_DIRENT\_HAVE\_D\_RECLEN}, mentre non
2248 è definita la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN}.
2253 \begin{tabular}[c]{|l|l|}
2255 \textbf{Valore} & \textbf{Tipo di file} \\
2258 \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
2259 \const{DT\_REG} & File normale.\\
2260 \const{DT\_DIR} & Directory.\\
2261 \const{DT\_LNK} & Link simbolico.\\
2262 \const{DT\_FIFO} & Fifo.\\
2263 \const{DT\_SOCK} & Socket.\\
2264 \const{DT\_CHR} & Dispositivo a caratteri.\\
2265 \const{DT\_BLK} & Dispositivo a blocchi.\\
2268 \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
2269 della struttura \struct{dirent}.}
2270 \label{tab:file_dtype_macro}
2273 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
2274 indica il tipo di file (se fifo, directory, link simbolico, ecc.), e consente
2275 di evitare una successiva chiamata a \func{lstat} per determinarlo. I suoi
2276 possibili valori sono riportati in tab.~\ref{tab:file_dtype_macro}. Si tenga
2277 presente che questo valore è disponibile solo per i filesystem che ne
2278 supportano la restituzione (fra questi i più noti sono \textsl{btrfs},
2279 \textsl{ext2}, \textsl{ext3}, e \textsl{ext4}), per gli altri si otterrà
2280 sempre il valore \const{DT\_UNKNOWN}.\footnote{inoltre fino alla versione 2.1
2281 delle \acr{glibc}, pur essendo il campo \var{d\_type} presente, il suo uso
2282 non era implementato, e veniva restituito comunque il valore
2283 \const{DT\_UNKNOWN}.}
2285 Per la conversione da e verso l'analogo valore mantenuto dentro il campo
2286 \var{st\_mode} di \struct{stat} sono definite anche due macro di conversione,
2287 \macro{IFTODT} e \macro{DTTOIF}:
2289 \funcdecl{int IFTODT(mode\_t MODE)} Converte il tipo di file dal formato di
2290 \var{st\_mode} a quello di \var{d\_type}.
2292 \funcdecl{mode\_t DTTOIF(int DTYPE)} Converte il tipo di file dal formato di
2293 \var{d\_type} a quello di \var{st\_mode}.
2296 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
2297 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
2298 letta. Con questi due campi diventa possibile, determinando la posizione delle
2299 varie voci, spostarsi all'interno dello stream usando la funzione
2300 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
2301 estensioni prese da BSD, ed introdotte nello standard POSIX solo a partire
2302 dalla revisione POSIX.1-2001, per poterle utilizzare deve essere definita
2303 una delle macro \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE} o
2304 \macro{\_SVID\_SOURCE}.} il cui prototipo è:
2305 \begin{prototype}{dirent.h}{void seekdir(DIR *dir, off\_t offset)}
2306 Cambia la posizione all'interno di un \textit{directory stream}.
2309 La funzione non ritorna nulla e non segnala errori, è però necessario che il
2310 valore dell'argomento \param{offset} sia valido per lo stream \param{dir};
2311 esso pertanto deve essere stato ottenuto o dal valore di \var{d\_off} di
2312 \struct{dirent} o dal valore restituito dalla funzione \funcd{telldir}, che
2313 legge la posizione corrente; il prototipo di quest'ultima è:\footnote{prima
2314 delle \acr{glibc} 2.1.1 la funzione restituiva un valore di tipo
2315 \type{off\_t}, sostituito a partire dalla versione 2.1.2 da \ctyp{long} per
2316 conformità a POSIX.1-2001.}
2317 \begin{prototype}{dirent.h}{long telldir(DIR *dir)}
2318 Ritorna la posizione corrente in un \textit{directory stream}.
2320 \bodydesc{La funzione restituisce la posizione corrente nello stream (un
2321 numero positivo) in caso di successo, e -1 altrimenti, nel qual caso
2322 \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
2323 valore errato per \param{dir}.}
2326 La sola funzione di posizionamento nello stream prevista originariamente dallo
2327 standard POSIX è \funcd{rewinddir}, che riporta la posizione a quella
2328 iniziale; il suo prototipo è:
2330 \headdecl{sys/types.h} \headdecl{dirent.h}
2332 \funcdecl{void rewinddir(DIR *dir)}
2334 Si posiziona all'inizio di un \textit{directory stream}.
2337 Una volta completate le operazioni si può chiudere il \textit{directory
2338 stream}, ed il file descriptor ad esso associato, con la funzione
2339 \funcd{closedir}, il cui prototipo è:
2341 \headdecl{sys/types.h} \headdecl{dirent.h}
2343 \funcdecl{int closedir(DIR * dir)}
2345 Chiude un \textit{directory stream}.
2347 \bodydesc{La funzione restituisce 0 in caso di successo e -1 altrimenti, nel
2348 qual caso \var{errno} assume il valore \errval{EBADF}.}
2351 A parte queste funzioni di base in BSD 4.3 venne introdotta un'altra funzione
2352 che permette di eseguire una scansione completa, con tanto di ricerca ed
2353 ordinamento, del contenuto di una directory; la funzione è
2354 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
2355 \acr{libc4} e richiede siano definite le macro \macro{\_BSD\_SOURCE} o
2356 \macro{\_SVID\_SOURCE}.} ed il suo prototipo è:
2357 \begin{prototype}{dirent.h}{int scandir(const char *dir,
2358 struct dirent ***namelist, int(*filter)(const struct dirent *),
2359 int(*compar)(const struct dirent **, const struct dirent **))}
2361 Esegue una scansione di un \textit{directory stream}.
2363 \bodydesc{La funzione restituisce in caso di successo il numero di voci
2364 trovate, e -1 altrimenti.}
2367 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
2368 prototipo non è molto comprensibile; queste funzioni però sono quelle che
2369 controllano rispettivamente la selezione di una voce (quella passata con
2370 l'argomento \param{filter}) e l'ordinamento di tutte le voci selezionate
2371 (quella specificata dell'argomento \param{compar}).
2373 La funzione legge tutte le voci della directory indicata dall'argomento
2374 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
2375 \struct{dirent}) come argomento della funzione di selezione specificata da
2376 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
2377 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
2378 Qualora si specifichi un valore \val{NULL} per l'argomento \param{filter} non
2379 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
2381 Le voci selezionate possono essere riordinate tramite \funcm{qsort}, le
2382 modalità del riordinamento possono essere personalizzate usando la funzione
2383 \param{compar} come criterio di ordinamento di \funcm{qsort}, la funzione
2384 prende come argomenti le due strutture \struct{dirent} da confrontare
2385 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
2386 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
2387 \struct{dirent} viene restituito nell'argomento
2388 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
2389 restituisce, come \itindex{value~result~argument} \textit{value result
2390 argument}, l'indirizzo della stessa; questo significa che \param{namelist}
2391 deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
2392 si deve passare il suo indirizzo.}
2394 Per l'ordinamento, vale a dire come valori possibili per l'argomento
2395 \param{compar} sono disponibili due funzioni predefinite, \funcd{alphasort} e
2396 \funcd{versionsort}, i cui prototipi sono:
2400 \funcdecl{int alphasort(const void *a, const void *b)}
2402 \funcdecl{int versionsort(const void *a, const void *b)}
2404 Funzioni per l'ordinamento delle voci di \textit{directory stream}.
2406 \bodydesc{Le funzioni restituiscono un valore minore, uguale o maggiore di
2407 zero qualora il primo argomento sia rispettivamente minore, uguale o
2408 maggiore del secondo.}
2411 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
2412 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
2413 argomenti dei puntatori a delle strutture \struct{dirent}; le glibc usano il
2414 prototipo originario di BSD, mostrato anche nella definizione, che prevede
2415 puntatori a \ctyp{void}.} e deve essere specificata come argomento
2416 \param{compar} per ottenere un ordinamento alfabetico (secondo il valore del
2417 campo \var{d\_name} delle varie voci). Le \acr{glibc} prevedono come
2418 estensione\footnote{le glibc, a partire dalla versione 2.1, effettuano anche
2419 l'ordinamento alfabetico tenendo conto delle varie localizzazioni, usando
2420 \funcm{strcoll} al posto di \funcm{strcmp}.} anche \func{versionsort}, che
2421 ordina i nomi tenendo conto del numero di versione (cioè qualcosa per cui
2422 \texttt{file10} viene comunque dopo \texttt{file4}.)
2424 \begin{figure}[!htbp]
2425 \footnotesize \centering
2426 \begin{minipage}[c]{\codesamplewidth}
2427 \includecodesample{listati/my_ls.c}
2429 \caption{Esempio di codice per eseguire la lista dei file contenuti in una
2431 \label{fig:file_my_ls}
2434 Un semplice esempio dell'uso di queste funzioni è riportato in
2435 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
2436 programma che, usando la funzione di scansione illustrata in
2437 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
2438 e la relativa dimensione (in sostanza una versione semplificata del comando
2441 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
2442 la parte di gestione delle opzioni (che prevede solo l'uso di una funzione per
2443 la stampa della sintassi, anch'essa omessa) ma il codice completo potrà essere
2444 trovato coi sorgenti allegati nel file \file{myls.c}.
2446 In sostanza tutto quello che fa il programma, dopo aver controllato
2447 (\texttt{\small 12--15}) di avere almeno un argomento (che indicherà la
2448 directory da esaminare) è chiamare (\texttt{\small 16}) la funzione
2449 \func{DirScan} per eseguire la scansione, usando la funzione \code{do\_ls}
2450 (\texttt{\small 22--29}) per fare tutto il lavoro.
2452 Quest'ultima si limita (\texttt{\small 26}) a chiamare \func{stat} sul file
2453 indicato dalla directory entry passata come argomento (il cui nome è appunto
2454 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
2455 dati ad esso relativi, per poi provvedere (\texttt{\small 27}) a stampare il
2456 nome del file e la dimensione riportata in \var{data}.
2458 Dato che la funzione verrà chiamata all'interno di \func{DirScan} per ogni
2459 voce presente questo è sufficiente a stampare la lista completa dei file e
2460 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
2461 valore di ritorno per indicare una esecuzione senza errori.
2463 \begin{figure}[!htbp]
2464 \footnotesize \centering
2465 \begin{minipage}[c]{\codesamplewidth}
2466 \includecodesample{listati/DirScan.c}
2468 \caption{Codice della funzione di scansione di una directory contenuta nel
2469 file \file{DirScan.c}.}
2470 \label{fig:file_dirscan}
2473 Tutto il grosso del lavoro è svolto dalla funzione \func{DirScan}, riportata
2474 in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e permette
2475 di eseguire una funzione, passata come secondo argomento, su tutte le voci di
2476 una directory. La funzione inizia con l'aprire (\texttt{\small 18--22}) uno
2477 stream sulla directory passata come primo argomento, stampando un messaggio in
2480 Il passo successivo (\texttt{\small 23--24}) è cambiare
2481 \index{directory~di~lavoro} directory di lavoro (vedi
2482 sez.~\ref{sec:file_work_dir}), usando in sequenza le funzioni \func{dirfd} e
2483 \func{fchdir} (in realtà si sarebbe potuto usare direttamente \func{chdir} su
2484 \var{dirname}), in modo che durante il successivo ciclo (\texttt{\small
2485 26--30}) sulle singole voci dello stream ci si trovi all'interno della
2486 directory.\footnote{questo è essenziale al funzionamento della funzione
2487 \code{do\_ls}, e ad ogni funzione che debba usare il campo \var{d\_name}, in
2488 quanto i nomi dei file memorizzati all'interno di una struttura
2489 \struct{dirent} sono sempre relativi alla directory in questione, e senza
2490 questo posizionamento non si sarebbe potuto usare \func{stat} per ottenere
2493 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
2494 alla funzione passata come secondo argomento, il ciclo di scansione della
2495 directory è molto semplice; si legge una voce alla volta (\texttt{\small 26})
2496 all'interno di una istruzione di \code{while} e fintanto che si riceve una
2497 voce valida, cioè un puntatore diverso da \val{NULL}, si esegue
2498 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
2499 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
2500 28}) qualora questa presenti una anomalia, identificata da un codice di
2501 ritorno negativo. Una volta terminato il ciclo la funzione si conclude con la
2502 chiusura (\texttt{\small 32}) dello stream\footnote{nel nostro caso, uscendo
2503 subito dopo la chiamata, questo non servirebbe, in generale però
2504 l'operazione è necessaria, dato che la funzione può essere invocata molte
2505 volte all'interno dello stesso processo, per cui non chiudere i
2506 \textit{directory stream} comporterebbe un consumo progressivo di risorse,
2507 con conseguente rischio di esaurimento delle stesse.} e la restituzione
2508 (\texttt{\small 32}) del codice di operazioni concluse con successo.
2511 \subsection{La directory di lavoro}
2512 \label{sec:file_work_dir}
2514 \index{directory~di~lavoro|(}
2516 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
2517 directory nel filesystem,\footnote{questa viene mantenuta all'interno dei dati
2518 della sua \kstruct{task\_struct} (vedi fig.~\ref{fig:proc_task_struct}), più
2519 precisamente nel campo \texttt{pwd} della sotto-struttura
2520 \kstruct{fs\_struct}.} che è chiamata \textsl{directory corrente} o
2521 \textsl{directory di lavoro} (in inglese \textit{current working directory}).
2522 La directory di lavoro è quella da cui si parte quando un
2523 \itindsub{pathname}{relativo} \textit{pathname} è espresso in forma relativa,
2524 dove il ``\textsl{relativa}'' fa riferimento appunto a questa directory.
2526 Quando un utente effettua il login, questa directory viene impostata alla
2527 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
2528 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
2529 comando \cmd{pwd} la stampa sul terminale. Siccome la directory corrente
2530 resta la stessa quando viene creato un processo figlio (vedi
2531 sez.~\ref{sec:proc_fork}), la directory corrente della shell diventa anche la
2532 directory corrente di qualunque comando da essa lanciato.
2534 Dato che è il kernel che tiene traccia per ciascun processo \itindex{inode}
2535 dell'\textit{inode} della directory di lavoro, per ottenerne il
2536 \textit{pathname} occorre usare una apposita funzione di libreria,
2537 \funcd{getcwd},\footnote{con Linux \func{getcwd} è una \textit{system call}
2538 dalla versione 2.1.9, in precedenza il valore doveva essere ottenuto tramite
2539 il filesystem \texttt{/proc} da \procfile{/proc/self/cwd}.} il cui prototipo
2541 \begin{prototype}{unistd.h}{char *getcwd(char *buffer, size\_t size)}
2542 Legge il \textit{pathname} della directory di lavoro corrente.
2544 \bodydesc{La funzione restituisce il puntatore \param{buffer} se riesce,
2545 \val{NULL} se fallisce, in quest'ultimo caso la variabile
2546 \var{errno} è impostata con i seguenti codici di errore:
2548 \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
2550 \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
2551 lunghezza del \textit{pathname}.
2552 \item[\errcode{EACCES}] manca il permesso di lettura o di ricerca su uno dei
2553 componenti del \textit{pathname} (cioè su una delle directory superiori
2555 \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata.
2559 La funzione restituisce il \textit{pathname} completo della directory di
2560 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
2561 precedentemente allocata, per una dimensione massima di \param{size}. Il
2562 buffer deve essere sufficientemente largo da poter contenere il
2563 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
2564 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
2567 Si può anche specificare un puntatore nullo come
2568 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
2569 supportata da Linux e dalla \acr{glibc}.} nel qual caso la stringa sarà
2570 allocata automaticamente per una dimensione pari a \param{size} qualora questa
2571 sia diversa da zero, o della lunghezza esatta del \textit{pathname}
2572 altrimenti. In questo caso ci si deve ricordare di disallocare la stringa una
2573 volta cessato il suo utilizzo.
2575 Di questa funzione esiste una versione \code{char *getwd(char *buffer)} fatta
2576 per compatibilità all'indietro con BSD, che non consente di specificare la
2577 dimensione del buffer; esso deve essere allocato in precedenza ed avere una
2578 dimensione superiore a \const{PATH\_MAX} (di solito 256 byte, vedi
2579 sez.~\ref{sec:sys_limits}); il problema è che in Linux non esiste una
2580 dimensione superiore per un \textit{pathname}, per cui non è detto che il
2581 buffer sia sufficiente a contenere il nome del file, e questa è la ragione
2582 principale per cui questa funzione è deprecata.
2584 Un uso comune di \func{getcwd} è quello di salvare la directory di lavoro
2585 iniziale per poi potervi tornare in un tempo successivo, un metodo alternativo
2586 più veloce, se non si è a corto di file descriptor, è invece quello di aprire
2587 la directory corrente (vale a dire ``\texttt{.}'') e tornarvi in seguito con
2590 Una seconda usata per ottenere la directory di lavoro è \code{char
2591 *get\_current\_dir\_name(void)} che è sostanzialmente equivalente ad una
2592 \code{getcwd(NULL, 0)}, con la sola differenza che essa ritorna il valore
2593 della variabile di ambiente \envvar{PWD}, che essendo costruita dalla shell
2594 può contenere un \textit{pathname} comprendente anche dei link
2595 simbolici. Usando \func{getcwd} infatti, essendo il \textit{pathname} ricavato
2596 risalendo all'indietro l'albero della directory, si perderebbe traccia di ogni
2597 passaggio attraverso eventuali link simbolici.
2599 Per cambiare la directory di lavoro si può usare la funzione \funcd{chdir}
2600 (equivalente del comando di shell \cmd{cd}) il cui nome sta appunto per
2601 \textit{change directory}, il suo prototipo è:
2602 \begin{prototype}{unistd.h}{int chdir(const char *pathname)}
2603 Cambia la directory di lavoro in \param{pathname}.
2605 \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
2606 nel qual caso \var{errno} assumerà i valori:
2608 \item[\errcode{ENOTDIR}] non si è specificata una directory.
2609 \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
2612 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2613 \errval{ENOMEM}, \errval{ELOOP} e \errval{EIO}.}
2615 \noindent ed ovviamente \param{pathname} deve indicare una directory per la
2616 quale si hanno i permessi di accesso.
2618 Dato che anche le directory sono file, è possibile riferirsi ad esse anche
2619 tramite il file descriptor, e non solo tramite il \textit{pathname}, per fare
2620 questo si usa \funcd{fchdir}, il cui prototipo è:
2621 \begin{prototype}{unistd.h}{int fchdir(int fd)}
2622 Identica a \func{chdir}, ma usa il file descriptor \param{fd} invece del
2625 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
2626 errore, in caso di errore \var{errno} assumerà i valori \errval{EBADF} o
2629 \noindent anche in questo caso \param{fd} deve essere un file descriptor
2630 valido che fa riferimento ad una directory. Inoltre l'unico errore di accesso
2631 possibile (tutti gli altri sarebbero occorsi all'apertura di \param{fd}), è
2632 quello in cui il processo non ha il permesso di accesso alla directory
2633 specificata da \param{fd}.
2635 \index{directory~di~lavoro|)}
2638 \subsection{I file temporanei}
2639 \label{sec:file_temp_file}
2641 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
2642 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
2643 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
2644 creare il file dopo aver controllato che questo non esista, nel momento fra il
2645 controllo e la creazione si ha giusto lo spazio per una possibile
2646 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
2647 sez.~\ref{sec:proc_race_cond}).
2649 Le \acr{glibc} provvedono varie funzioni per generare nomi di file temporanei,
2650 di cui si abbia certezza di unicità al momento della generazione; storicamente
2651 la prima di queste funzioni create a questo scopo era
2652 \funcd{tmpnam},\footnote{la funzione è stata deprecata nella revisione
2653 POSIX.1-2008 dello standard POSIX.} il cui prototipo è:
2654 \begin{prototype}{stdio.h}{char *tmpnam(char *string)}
2655 Genera un nome univoco per un file temporaneo.
2657 \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
2658 \val{NULL} in caso di fallimento. Non sono definiti errori.}
2661 La funzione restituisce il puntatore ad una stringa contente un nome di file
2662 valido e non esistente al momento dell'invocazione; se si è passato come
2663 argomento \param{string} un puntatore non nullo ad un buffer di caratteri
2664 questo deve essere di dimensione \const{L\_tmpnam} ed il nome generato vi
2665 verrà copiato automaticamente; altrimenti il nome sarà generato in un buffer
2666 statico interno che verrà sovrascritto ad una chiamata successiva. Successive
2667 invocazioni della funzione continueranno a restituire nomi unici fino ad un
2668 massimo di \const{TMP\_MAX} volte, limite oltre il quale il comportamento è
2669 indefinito. Al nome viene automaticamente aggiunto come prefisso la directory
2670 specificata dalla costante \const{P\_tmpdir}.\footnote{le costanti
2671 \const{L\_tmpnam}, \const{P\_tmpdir} e \const{TMP\_MAX} sono definite in
2672 \headfile{stdio.h}.}
2674 Di questa funzione esiste una versione \index{funzioni!rientranti} rientrante,
2675 \funcm{tmpnam\_r}, che non fa nulla quando si passa \val{NULL} come argomento.
2676 Una funzione simile, \funcd{tempnam}, permette di specificare un prefisso per
2677 il file esplicitamente, il suo prototipo è:
2678 \begin{prototype}{stdio.h}{char *tempnam(const char *dir, const char *pfx)}
2679 Genera un nome univoco per un file temporaneo.
2681 \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
2682 \val{NULL} in caso di fallimento, \var{errno} viene impostata a
2683 \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
2686 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
2687 per cui è sempre \index{funzioni!rientranti} rientrante, occorre però
2688 ricordarsi di disallocare con \code{free} il puntatore che restituisce.
2689 L'argomento \param{pfx} specifica un prefisso di massimo 5 caratteri per il
2690 nome provvisorio. La funzione assegna come directory per il file temporaneo,
2691 verificando che esista e sia accessibile, la prima valida fra le seguenti:
2693 \item La variabile di ambiente \envvar{TMPDIR} (non ha effetto se non è
2694 definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
2695 \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}).
2696 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}).
2697 \item Il valore della costante \const{P\_tmpdir}.
2698 \item la directory \file{/tmp}.
2701 In ogni caso, anche se la generazione del nome è casuale, ed è molto difficile
2702 ottenere un nome duplicato, nulla assicura che un altro processo non possa
2703 avere creato, fra l'ottenimento del nome e l'apertura del file, un altro file
2704 con lo stesso nome; per questo motivo quando si usa il nome ottenuto da una di
2705 queste funzioni occorre sempre aprire il nuovo file in modalità di esclusione
2706 (cioè con l'opzione \const{O\_EXCL} per i file descriptor o con il flag
2707 \code{x} per gli stream) che fa fallire l'apertura in caso il file sia già
2710 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
2711 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
2712 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
2713 \begin{prototype}{stdio.h}{FILE *tmpfile(void)}
2714 Restituisce un file temporaneo aperto in lettura/scrittura.
2716 \bodydesc{La funzione ritorna il puntatore allo stream associato al file
2717 temporaneo in caso di successo e \val{NULL} in caso di errore, nel qual
2718 caso \var{errno} assumerà i valori:
2720 \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
2721 \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
2723 ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
2724 \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES}.}
2727 La funzione restituisce direttamente uno stream già aperto (in modalità
2728 \code{r+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso, che viene
2729 automaticamente cancellato alla sua chiusura o all'uscita dal programma. Lo
2730 standard non specifica in quale directory verrà aperto il file, ma le
2731 \acr{glibc} prima tentano con \const{P\_tmpdir} e poi con \file{/tmp}. Questa
2732 funzione è \index{funzioni!rientranti} rientrante e non soffre di problemi di
2733 \itindex{race~condition} \textit{race condition}.
2735 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
2736 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
2737 modificano una stringa di input che serve da modello e che deve essere
2738 conclusa da 6 caratteri \code{X} che verranno sostituiti da un codice
2739 unico. La prima delle due è analoga a \func{tmpnam} e genera un nome casuale,
2741 \begin{prototype}{stlib.h}{char *mktemp(char *template)}
2742 Genera un nome univoco per un file temporaneo.
2744 \bodydesc{La funzione ritorna il puntatore \param{template} in caso di
2745 successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
2748 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2752 La funzionane genera un nome univoco sostituendo le \code{XXXXXX} finali di
2753 \param{template}; dato che \param{template} deve poter essere modificata dalla
2754 funzione non si può usare una stringa costante. Tutte le avvertenze riguardo
2755 alle possibili \itindex{race~condition} \textit{race condition} date per
2756 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
2757 il valore usato per sostituire le \code{XXXXXX} viene formato con il \ids{PID}
2758 del processo più una lettera, il che mette a disposizione solo 26 possibilità
2759 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
2760 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
2763 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
2764 \func{tmpfile}, ma restituisce un file descriptor invece di un nome; il suo
2766 \begin{prototype}{stlib.h}{int mkstemp(char *template)}
2767 Genera un file temporaneo.
2769 \bodydesc{La funzione ritorna il file descriptor in caso di successo e
2770 -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
2772 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2773 \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
2774 contenuto di \param{template} è indefinito.
2778 Come per \func{mktemp} anche in questo caso \param{template} non può essere
2779 una stringa costante. La funzione apre un file in lettura/scrittura con la
2780 funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
2781 sez.~\ref{sec:file_open}), in questo modo al ritorno della funzione si ha la
2782 certezza di essere stati i creatori del file, i cui permessi (si veda
2783 sez.~\ref{sec:file_perm_overview}) sono impostati al valore \code{0600}
2784 (lettura e scrittura solo per il proprietario).\footnote{questo è vero a
2785 partire dalle \acr{glibc} 2.0.7, le versioni precedenti delle \acr{glibc} e
2786 le vecchie \acr{libc5} e \acr{libc4} usavano il valore \code{0666} che
2787 permetteva a chiunque di leggere e scrivere i contenuti del file.} Di
2788 questa funzione esiste una variante \funcd{mkostemp}, introdotta
2789 specificamente dalla \acr{glibc},\footnote{la funzione è stata introdotta
2790 nella versione 2.7 delle librerie e richiede che sia definita la macro
2791 \macro{\_GNU\_SOURCE}.} il cui prototipo è:
2792 \begin{prototype}{stlib.h}{int mkostemp(char *template, int flags)}
2793 Genera un file temporaneo.
2795 \bodydesc{La funzione ritorna il file descriptor in caso di successo e
2796 -1 in caso di errore, con gli stessi errori di \func{mkstemp}.}
2798 \noindent la cui sola differenza è la presenza dell'ulteriore argomento
2799 \var{flags} che consente di specificare i flag da passare ad \func{open}
2800 nell'apertura del file.
2803 In OpenBSD è stata introdotta un'altra funzione simile alle precedenti,
2804 \funcd{mkdtemp}, che crea invece una directory temporanea;\footnote{la
2805 funzione è stata introdotta nelle \acr{glibc} a partire dalla versione
2806 2.1.91 ed inserita nello standard POSIX.1-2008.} il suo prototipo è:
2807 \begin{prototype}{stlib.h}{char *mkdtemp(char *template)}
2808 Genera una directory temporanea.
2810 \bodydesc{La funzione ritorna il puntatore al nome della directory in caso
2811 successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
2814 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2816 più gli altri eventuali codici di errore di \func{mkdir}.}
2819 La funzione genera una directory il cui nome è ottenuto sostituendo le
2820 \code{XXXXXX} finali di \param{template} con permessi \code{0700} (al solito
2821 si veda cap.~\ref{cha:file_unix_interface} per i dettagli); dato che la
2822 creazione della directory è sempre esclusiva i precedenti problemi di
2823 \itindex{race~condition} \textit{race condition} non si pongono.
2826 \section{La manipolazione delle caratteristiche dei file}
2827 \label{sec:file_infos}
2829 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
2830 relative alle caratteristiche di ciascun file, a partire dalle informazioni
2831 relative al controllo di accesso, sono mantenute \itindex{inode}
2832 nell'\textit{inode}.
2834 Vedremo in questa sezione come sia possibile leggere tutte queste informazioni
2835 usando la funzione \func{stat}, che permette l'accesso a tutti i dati
2836 memorizzati \itindex{inode} nell'\textit{inode}; esamineremo poi le varie
2837 funzioni usate per manipolare tutte queste informazioni (eccetto quelle che
2838 riguardano la gestione del controllo di accesso, trattate in in
2839 sez.~\ref{sec:file_access_control}).
2842 \subsection{La lettura delle caratteristiche dei file}
2843 \label{sec:file_stat}
2845 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
2846 delle funzioni \func{stat} che sono quelle che usa il comando \cmd{ls} per
2847 poter ottenere e mostrare tutti i dati relativi ad un file; ne fanno parte le
2848 funzioni \funcd{stat}, \funcd{fstat} e \funcd{lstat}, i cui prototipi sono:
2850 \headdecl{sys/types.h}
2851 \headdecl{sys/stat.h}
2854 \funcdecl{int stat(const char *file\_name, struct stat *buf)}
2855 \funcdecl{int lstat(const char *file\_name, struct stat *buf)}
2856 \funcdecl{int fstat(int filedes, struct stat *buf)}
2857 Legge le informazioni di un file.
2859 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
2860 errore, nel qual caso \var{errno} assumerà uno dei valori: \errval{EBADF},
2861 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ELOOP}, \errval{EFAULT},
2862 \errval{EACCES}, \errval{ENOMEM}, \errval{ENAMETOOLONG}.}
2865 La funzione \func{stat} legge le informazioni del file il cui
2866 \textit{pathname} è specificato dalla stringa puntata da \param{file\_name} e
2867 le inserisce nel buffer puntato dall'argomento \param{buf}; la funzione
2868 \func{lstat} è identica a \func{stat} eccetto che se \param{file\_name} è un
2869 link simbolico vengono lette le informazioni relative ad esso e non al file a
2870 cui fa riferimento. Infine \func{fstat} esegue la stessa operazione su un file
2871 già aperto, specificato tramite il suo file descriptor \param{filedes}.
2873 La struttura \struct{stat} usata da queste funzioni è definita nell'header
2874 \headfile{sys/stat.h} e in generale dipende dall'implementazione; la versione
2875 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
2876 riportata dalla pagina di manuale di \func{stat}; in realtà la definizione
2877 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
2878 riservati per estensioni come tempi dei file più precisi (vedi
2879 sez.~\ref{sec:file_file_times}), o per il padding dei campi.
2881 \begin{figure}[!htb]
2884 \begin{minipage}[c]{\textwidth}
2885 \includestruct{listati/stat.h}
2888 \caption{La struttura \structd{stat} per la lettura delle informazioni dei
2890 \label{fig:file_stat_struct}
2893 Si noti come i vari membri della struttura siano specificati come tipi
2894 primitivi del sistema (di quelli definiti in
2895 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \headfile{sys/types.h}).
2897 \subsection{I tipi di file}
2898 \label{sec:file_types}
2900 Come riportato in tab.~\ref{tab:file_file_types} in Linux oltre ai file e alle
2901 directory esistono altri oggetti che possono stare su un filesystem. Il tipo
2902 di file è ritornato dalla funzione \func{stat} come maschera binaria nel campo
2903 \var{st\_mode} (che contiene anche le informazioni relative ai permessi) di
2904 una struttura \struct{stat}.
2906 Dato che il valore numerico può variare a seconda delle implementazioni, lo
2907 standard POSIX definisce un insieme di macro per verificare il tipo di file,
2908 queste vengono usate anche da Linux che supporta pure le estensioni allo
2909 standard per i link simbolici e i socket definite da BSD; l'elenco completo
2910 delle macro con cui è possibile estrarre l'informazione da \var{st\_mode} è
2911 riportato in tab.~\ref{tab:file_type_macro}.
2915 \begin{tabular}[c]{|l|l|}
2917 \textbf{Macro} & \textbf{Tipo del file} \\
2920 \macro{S\_ISREG}\texttt{(m)} & file normale.\\
2921 \macro{S\_ISDIR}\texttt{(m)} & directory.\\
2922 \macro{S\_ISCHR}\texttt{(m)} & dispositivo a caratteri.\\
2923 \macro{S\_ISBLK}\texttt{(m)} & dispositivo a blocchi.\\
2924 \macro{S\_ISFIFO}\texttt{(m)} & fifo.\\
2925 \macro{S\_ISLNK}\texttt{(m)} & link simbolico.\\
2926 \macro{S\_ISSOCK}\texttt{(m)} & socket.\\
2929 \caption{Macro per i tipi di file (definite in \headfile{sys/stat.h}).}
2930 \label{tab:file_type_macro}
2933 Oltre alle macro di tab.~\ref{tab:file_type_macro} è possibile usare
2934 direttamente il valore di \var{st\_mode} per ricavare il tipo di file
2935 controllando direttamente i vari bit in esso memorizzati. Per questo sempre in
2936 \headfile{sys/stat.h} sono definite le costanti numeriche riportate in
2937 tab.~\ref{tab:file_mode_flags}.
2939 Il primo valore dell'elenco di tab.~\ref{tab:file_mode_flags} è la maschera
2940 binaria che permette di estrarre i bit nei quali viene memorizzato il tipo di
2941 file, i valori successivi sono le costanti corrispondenti ai singoli bit, e
2942 possono essere usati per effettuare la selezione sul tipo di file voluto, con
2943 un'opportuna combinazione.
2948 \begin{tabular}[c]{|l|c|l|}
2950 \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
2953 \const{S\_IFMT} & 0170000 & Maschera per i bit del tipo di file.\\
2954 \const{S\_IFSOCK} & 0140000 & Socket.\\
2955 \const{S\_IFLNK} & 0120000 & Link simbolico.\\
2956 \const{S\_IFREG} & 0100000 & File regolare.\\
2957 \const{S\_IFBLK} & 0060000 & Dispositivo a blocchi.\\
2958 \const{S\_IFDIR} & 0040000 & Directory.\\
2959 \const{S\_IFCHR} & 0020000 & Dispositivo a caratteri.\\
2960 \const{S\_IFIFO} & 0010000 & Fifo.\\
2962 \const{S\_ISUID} & 0004000 & Set UID bit \itindex{suid~bit}.\\
2963 \const{S\_ISGID} & 0002000 & Set GID bit \itindex{sgid~bit}.\\
2964 \const{S\_ISVTX} & 0001000 & Sticky bit \itindex{sticky~bit}.\\
2966 % \const{S\_IRWXU} & 00700 & Bitmask per i permessi del proprietario.\\
2967 \const{S\_IRUSR} & 00400 & Il proprietario ha permesso di lettura.\\
2968 \const{S\_IWUSR} & 00200 & Il proprietario ha permesso di scrittura.\\
2969 \const{S\_IXUSR} & 00100 & Il proprietario ha permesso di esecuzione.\\
2971 % \const{S\_IRWXG} & 00070 & Bitmask per i permessi del gruppo.\\
2972 \const{S\_IRGRP} & 00040 & Il gruppo ha permesso di lettura.\\
2973 \const{S\_IWGRP} & 00020 & Il gruppo ha permesso di scrittura.\\
2974 \const{S\_IXGRP} & 00010 & Il gruppo ha permesso di esecuzione.\\
2976 % \const{S\_IRWXO} & 00007 & Bitmask per i permessi di tutti gli altri\\
2977 \const{S\_IROTH} & 00004 & Gli altri hanno permesso di lettura.\\
2978 \const{S\_IWOTH} & 00002 & Gli altri hanno permesso di esecuzione.\\
2979 \const{S\_IXOTH} & 00001 & Gli altri hanno permesso di esecuzione.\\
2982 \caption{Costanti per l'identificazione dei vari bit che compongono il campo
2983 \var{st\_mode} (definite in \headfile{sys/stat.h}).}
2984 \label{tab:file_mode_flags}
2987 Ad esempio se si volesse impostare una condizione che permetta di controllare
2988 se un file è una directory o un file ordinario si potrebbe definire la macro
2990 \includecodesnip{listati/is_file_dir.h}
2991 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
2992 poi si effettua il confronto con la combinazione di tipi scelta.
2995 \subsection{Le dimensioni dei file}
2996 \label{sec:file_file_size}
2998 Il campo \var{st\_size} di una struttura \struct{stat} contiene la dimensione
2999 del file in byte, se si tratta di un file regolare. Nel caso di un link
3000 simbolico la dimensione è quella del \textit{pathname} che il link stesso
3001 contiene; per le fifo questo campo è sempre nullo.
3003 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
3004 byte. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
3005 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
3006 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
3007 dimensione inferiore sarebbe inefficiente.
3009 Si tenga conto che la lunghezza del file riportata in \var{st\_size} non è
3010 detto che corrisponda all'occupazione dello spazio su disco per via della
3011 possibile esistenza dei cosiddetti \index{file!\textit{hole}} \textit{holes}
3012 (letteralmente \textsl{buchi}) che si formano tutte le volte che si va a
3013 scrivere su un \itindex{sparse~file} file dopo aver eseguito uno spostamento
3014 oltre la sua fine (tratteremo in dettaglio l'argomento in
3015 sez.~\ref{sec:file_lseek}).
3017 In questo caso si avranno risultati differenti a seconda del modo in cui si
3018 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
3019 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
3020 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
3021 caso per le parti non scritte vengono restituiti degli zeri, si avrà lo stesso
3022 risultato di \cmd{ls}.
3024 Se è sempre possibile allargare un file, scrivendoci sopra od usando la
3025 funzione \func{lseek} per spostarsi oltre la sua fine, esistono anche casi in
3026 cui si può avere bisogno di effettuare un troncamento, scartando i dati
3027 presenti al di là della dimensione scelta come nuova fine del file.
3029 Un file può sempre essere troncato a zero aprendolo con il flag
3030 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
3031 dimensione si possono usare le due funzioni \funcd{truncate} e
3032 \funcd{ftruncate}, i cui prototipi sono:
3036 \funcdecl{int truncate(const char *file\_name, off\_t length)}
3038 \funcdecl{int ftruncate(int fd, off\_t length))}
3040 Troncano un file alla lunghezza \param{length}.
3042 \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per un
3043 errore, nel qual caso \var{errno} viene impostata opportunamente; per
3044 \func{ftruncate} si hanno i valori:
3046 \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3047 \item[\errcode{EINVAL}] \param{fd} è un riferimento ad un socket, non a un
3048 file o non è aperto in scrittura.
3050 per \func{truncate} si hanno:
3052 \item[\errcode{EACCES}] il file non ha permesso di scrittura o non si ha il
3053 permesso di esecuzione una delle directory del \textit{pathname}.
3054 \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
3056 ed anche \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
3057 \errval{EROFS}, \errval{EIO}, \errval{EFAULT}, \errval{ELOOP}.}
3060 Entrambe le funzioni fan sì che la dimensione del file sia troncata ad un
3061 valore massimo specificato da \param{length}, e si distinguono solo per il
3062 fatto che il file viene indicato con il \textit{pathname} \param{file\_name}
3063 per \func{truncate} e con il file descriptor \param{fd} per \funcd{ftruncate};
3064 se il file è più lungo della lunghezza specificata i dati in eccesso saranno
3067 Il comportamento in caso di lunghezza inferiore non è specificato e dipende
3068 dall'implementazione: il file può essere lasciato invariato o esteso fino alla
3069 lunghezza scelta; nel caso di Linux viene esteso con la creazione di un
3070 \index{file!\textit{hole}} \textsl{buco} nel \itindex{sparse~file} file e ad
3071 una lettura si otterranno degli zeri; si tenga presente però che questo
3072 comportamento è supportato solo per filesystem nativi, ad esempio su un
3073 filesystem non nativo come il VFAT di Windows questo non è possibile.
3075 \subsection{I tempi dei file}
3076 \label{sec:file_file_times}
3078 Il sistema mantiene per ciascun file tre tempi, questi sono registrati
3079 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del file e
3080 possono essere letti tramite la funzione \func{stat}, che li restituisce
3081 attraverso tre specifici campi della struttura \struct{stat} di
3082 fig.~\ref{fig:file_stat_struct}. Il significato di detti tempi e dei relativi
3083 campi è riportato nello schema in tab.~\ref{tab:file_file_times}, dove è anche
3084 riportato un esempio delle funzioni che effettuano cambiamenti su di essi. Il
3085 valore è espresso nel cosiddetto \itindex{calendar~time} \textit{calendar
3086 time}, su cui torneremo in dettaglio in sez.~\ref{sec:sys_time}.
3091 \begin{tabular}[c]{|c|l|l|c|}
3093 \textbf{Membro} & \textbf{Significato} & \textbf{Funzione}
3094 & \textbf{Opzione di \cmd{ls}} \\
3097 \var{st\_atime}& ultimo accesso ai dati del file &
3098 \func{read}, \func{utime} & \cmd{-u}\\
3099 \var{st\_mtime}& ultima modifica ai dati del file &
3100 \func{write}, \func{utime} & default\\
3101 \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
3102 \func{chmod}, \func{utime} & \cmd{-c}\\
3105 \caption{I tre tempi associati a ciascun file.}
3106 \label{tab:file_file_times}
3109 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
3110 ultima modifica (il \textit{modification time}, \var{st\_mtime}) e il tempo di
3111 ultimo cambiamento di stato (il \textit{change time}, \var{st\_ctime}). Il
3112 primo infatti fa riferimento ad una modifica del contenuto di un file, mentre
3113 il secondo ad una modifica \itindex{inode} dell'\textit{inode}. Dato che
3114 esistono molte operazioni, come la funzione \func{link} e altre che vedremo in
3115 seguito, che modificano solo le informazioni contenute \itindex{inode}
3116 nell'\textit{inode} senza toccare il contenuto del file, diventa necessario
3117 l'utilizzo di questo secondo tempo.
3119 Il tempo di ultima modifica viene usato ad esempio da programmi come
3120 \cmd{make} per decidere quali file necessitano di essere ricompilati o
3121 (talvolta insieme anche al tempo di cambiamento di stato) per decidere quali
3122 file devono essere archiviati per il backup. Il tempo di ultimo accesso viene
3123 di solito usato per identificare i file che non vengono più utilizzati per un
3124 certo lasso di tempo. Ad esempio un programma come \texttt{leafnode} lo usa
3125 per cancellare gli articoli letti più vecchi, mentre \texttt{mutt} lo usa per
3126 marcare i messaggi di posta che risultano letti. Il sistema non tiene conto
3127 dell'ultimo accesso \itindex{inode} all'\textit{inode}, pertanto funzioni come
3128 \func{access} o \func{stat} non hanno alcuna influenza sui tre tempi. Il
3129 comando \cmd{ls} (quando usato con le opzioni \cmd{-l} o \cmd{-t}) mostra i
3130 tempi dei file secondo lo schema riportato nell'ultima colonna di
3131 tab.~\ref{tab:file_file_times}.
3133 L'aggiornamento del tempo di ultimo accesso è stato a lungo considerato un
3134 difetto progettuale di Unix, questo infatti comporta la necessità di
3135 effettuare un accesso in scrittura sul disco anche in tutti i casi in cui
3136 questa informazione non interessa e sarebbe possibile avere un semplice
3137 accesso in lettura sui dati bufferizzati. Questo comporta un ovvio costo sia
3138 in termini di prestazioni, che di consumo di risorse come la batteria per i
3139 portatili, o cicli di riscrittura per i dischi su memorie riscrivibili.
3141 % TODO aggiustare per il contenuto duplicato con le analoghe MS_*
3143 Per questo motivo, onde evitare di mantenere una informazione che nella
3144 maggior parte dei casi non interessa, è sempre stato possibile disabilitare
3145 l'aggiornamento del tempo di ultimo accesso con l'opzione di montaggio
3146 \texttt{noatime}. Dato però che questo può creare problemi a qualche
3147 programma, in Linux è stata introdotta la opzione \texttt{relatime} che esegue
3148 l'aggiornamento soltanto se il tempo di ultimo accesso è precedente al tempo di
3149 ultima modifica o cambiamento, così da rendere evidente che vi è stato un
3150 accesso dopo la scrittura, ed evitando al contempo ulteriori operazioni su
3151 disco negli accessi successivi. In questo modo l'informazione relativa al
3152 fatto che un file sia stato letto resta disponibile, e ad esempio i programmi
3153 citati in precedenza continuano a funzionare. Questa opzione, a partire dal
3154 kernel 2.6.30, è diventata il comportamento di default e non deve più essere
3155 specificata esplicitamente.\footnote{si può comunque riottenere il vecchio
3156 comportamento usando la opzione di montaggio \texttt{strictatime}.}
3161 \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
3163 \multicolumn{1}{|p{3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
3164 \multicolumn{3}{|p{3.6cm}|}{\centering{
3165 \textbf{File o directory del riferimento}}}&
3166 \multicolumn{3}{|p{3.6cm}|}{\centering{
3167 \textbf{Directory contenente il riferimento}}}
3168 &\multicolumn{1}{|p{3.6cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
3171 \multicolumn{1}{|p{3cm}|}{}
3172 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
3173 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
3174 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
3175 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
3176 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
3177 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
3178 &\multicolumn{1}{|p{3cm}|}{} \\
3181 \func{chmod}, \func{fchmod}
3182 & -- & -- &$\bullet$& -- & -- & -- &\\
3183 \func{chown}, \func{fchown}
3184 & -- & -- &$\bullet$& -- & -- & -- &\\
3186 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
3187 con \const{O\_CREATE} \\
3189 & -- &$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
3190 con \const{O\_TRUNC} \\
3192 &$\bullet$& -- & -- & -- & -- & -- &\\
3194 & -- & -- &$\bullet$& -- & -- & -- &\\
3196 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&\\
3198 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&\\
3200 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&\\
3202 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
3203 con \const{O\_CREATE} \\
3205 & -- &$\bullet$&$\bullet$& -- & -- & -- &
3206 con \const{O\_TRUNC} \\
3208 &$\bullet$&$\bullet$&$\bullet$& -- & -- & -- &\\
3210 &$\bullet$& -- & -- & -- & -- & -- &\\
3212 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&
3213 se esegue \func{unlink}\\
3215 & -- & -- & -- & -- &$\bullet$&$\bullet$&
3216 se esegue \func{rmdir}\\
3218 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&
3219 per entrambi gli argomenti\\
3221 & -- & -- & -- & -- &$\bullet$&$\bullet$&\\
3222 \func{truncate}, \func{ftruncate}
3223 & -- &$\bullet$&$\bullet$& -- & -- & -- &\\
3225 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&\\
3227 &$\bullet$&$\bullet$&$\bullet$& -- & -- & -- &\\
3229 & -- &$\bullet$&$\bullet$& -- & -- & -- &\\
3232 \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo
3233 accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento
3234 \textsl{(c)} dalle varie funzioni operanti su file e directory.}
3235 \label{tab:file_times_effects}
3239 L'effetto delle varie funzioni di manipolazione dei file sui relativi tempi è
3240 illustrato in tab.~\ref{tab:file_times_effects}, facendo riferimento al
3241 comportamento classico per quanto riguarda \var{st\_atime}. Si sono riportati
3242 gli effetti sia per il file a cui si fa riferimento, sia per la directory che
3243 lo contiene; questi ultimi possono essere capiti se si tiene conto di quanto
3244 già detto, e cioè che anche le directory sono anch'esse file che contengono
3245 una lista di nomi, che il sistema tratta in maniera del tutto analoga a tutti
3248 Per questo motivo tutte le volte che compiremo un'operazione su un file che
3249 comporta una modifica del nome contenuto nella directory, andremo anche a
3250 scrivere sulla directory che lo contiene cambiandone il tempo di modifica. Un
3251 esempio di questo tipo di operazione può essere la cancellazione di un file,
3252 invece leggere o scrivere o cambiare i permessi di un file ha effetti solo sui
3253 tempi di quest'ultimo.
3255 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
3256 creazione del file, usato in molti altri sistemi operativi, ma che in Unix non
3257 esiste. Per questo motivo quando si copia un file, a meno di preservare
3258 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
3259 avrà sempre il tempo corrente come data di ultima modifica.
3261 I tempi di ultimo accesso e modifica possono essere modificati esplicitamente
3262 usando la funzione \funcd{utime}, il cui prototipo è:
3263 \begin{prototype}{utime.h}
3264 {int utime(const char *filename, struct utimbuf *times)}
3265 Modifica i tempi di ultimo accesso e modifica di un file.
3267 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3268 errore, nel qual caso \var{errno} assumerà uno dei valori:
3270 \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
3271 \item[\errcode{EPERM}] non si è proprietari del file.
3273 ed inoltre \errval{EROFS} e \errval{ENOENT}.}
3276 La funzione cambia i tempi di ultimo accesso e modifica del file specificato
3277 dall'argomento \param{filename}, e richiede come secondo argomento il
3278 puntatore ad una struttura \struct{utimbuf}, la cui definizione è riportata in
3279 fig.~\ref{fig:struct_utimebuf}, con i nuovi valori di detti tempi
3280 (rispettivamente nei campi \var{actime} e \var{modtime}). Se si passa un
3281 puntatore nullo verrà impostato il tempo corrente.
3283 \begin{figure}[!htb]
3284 \footnotesize \centering
3285 \begin{minipage}[c]{\textwidth}
3286 \includestruct{listati/utimbuf.h}
3289 \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
3291 \label{fig:struct_utimebuf}
3294 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
3295 cosa è l'argomento \param{times}; se è \val{NULL} la funzione imposta il
3296 tempo corrente ed è sufficiente avere accesso in scrittura al file; se invece
3297 si è specificato un valore la funzione avrà successo solo se si è proprietari
3298 del file o si hanno i privilegi di amministratore.
3300 Si tenga presente che non è comunque possibile specificare il tempo di
3301 cambiamento di stato del file, che viene aggiornato direttamente dal kernel
3302 tutte le volte che si modifica \itindex{inode} l'\textit{inode} (quindi anche
3303 alla chiamata di \func{utime}). Questo serve anche come misura di sicurezza
3304 per evitare che si possa modificare un file nascondendo completamente le
3305 proprie tracce. In realtà la cosa resta possibile se si è in grado di accedere
3306 al \index{file!di~dispositivo} file di dispositivo, scrivendo direttamente sul
3307 disco senza passare attraverso il filesystem, ma ovviamente in questo modo la
3308 cosa è più complicata da realizzare.
3310 A partire dal kernel 2.6 la risoluzione dei tempi dei file, che nei campi di
3311 tab.~\ref{tab:file_file_times} è espressa in secondi, è stata portata ai
3312 nanosecondi per la gran parte dei filesystem. La ulteriore informazione può
3313 essere acceduta attraverso altri campi appositamente aggiunti alla struttura
3314 \struct{stat}. Se si sono definite le macro \macro{\_BSD\_SOURCE} o
3315 \macro{\_SVID\_SOURCE} questi sono \var{st\_atim.tv\_nsec},
3316 \var{st\_mtim.tv\_nsec} e \var{st\_ctim.tv\_nsec} se queste non sono definite,
3317 \var{st\_atimensec}, \var{st\_mtimensec} e \var{st\_mtimensec}. Qualora il
3318 supporto per questa maggior precisione sia assente questi campi aggiuntivi
3321 Per la gestione di questi nuovi valori è stata definita una seconda funzione
3322 di modifica, \funcd{utimes}, che consente di specificare tempi con maggior
3323 precisione; il suo prototipo è:
3326 {int utimes(const char *filename, struct timeval times[2])}
3327 Modifica i tempi di ultimo accesso e modifica di un file.
3329 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3330 errore, nel qual caso \var{errno} assumerà uno dei valori:
3332 \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
3333 \item[\errcode{EPERM}] non si è proprietari del file.
3335 ed inoltre \errval{EROFS} e \errval{ENOENT}.}
3338 La funzione è del tutto analoga alla precedente \func{utime} ma usa come
3339 secondo argomento un vettore di due strutture \struct{timeval}, la cui
3340 definizione è riportata in fig.~\ref{fig:sys_timeval_struct}, che consentono
3341 di indicare i tempi con una precisione del microsecondo. Il primo elemento
3342 di \param{times} indica il valore per il tempo di ultimo accesso, il secondo
3343 quello per il tempo di ultima modifica. Se si indica come secondo argomento un
3344 puntatore nullo di nuovo verrà utilizzato il tempo corrente.
3346 \begin{figure}[!htb]
3347 \footnotesize \centering
3348 \begin{minipage}[c]{\textwidth}
3349 \includestruct{listati/timeval.h}
3352 \caption{La struttura \structd{timeval} usata per indicare valori di tempo
3353 con la precisione del microsecondo.}
3354 \label{fig:sys_timeval_struct}
3357 Oltre ad \func{utimes} su Linux sono presenti altre due funzioni,\footnote{le
3358 due funzioni non sono definite in nessuno standard, ma sono presenti, oltre
3359 che su Linux, anche su BSD.} \funcd{futimes} e \funcd{lutimes}, che
3360 consentono rispettivamente di effettuare la modifica utilizzando un file
3361 già aperto o di eseguirla direttamente su un link simbolico. I relativi
3364 \headdecl{sys/time.h}
3366 \funcdecl{int futimes(int fd, const struct timeval tv[2])} Cambia i tempi
3367 di un file già aperto specificato tramite il file descriptor \param{fd}.
3369 \funcdecl{int lutimes(const char *filename, const struct timeval tv[2])}
3370 Cambia i tempi di \param{filename} anche se questo è un link simbolico.
3373 \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
3374 errore, nel qual caso \var{errno} assumerà gli stessi valori di
3375 \func{utimes}, con in più per \func{futimes}:
3377 \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3378 \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3382 Le due funzioni anno lo stesso comportamento di \texttt{utimes} e richiedono
3383 gli stessi privilegi per poter operare, la differenza è che con \func{futimes}
3384 si può indicare il file su cui operare facendo riferimento al relativo file
3385 descriptor mentre con \func{lutimes} nel caso in cui \param{filename} sia un
3386 link simbolico saranno modificati i suoi tempi invece di quelli del file a cui
3389 Nonostante il kernel, come accennato, supporti risoluzioni dei tempi dei file
3390 fino al nanosecondo, le funzioni fin qui esaminate non consentono di impostare
3391 valori con questa precisione. Per questo sono state introdotte due nuove
3392 funzioni, \funcd{futimens} e \func{utimensat}, in grado di eseguire questo
3393 compito; i rispettivi prototipi sono:
3395 \headdecl{sys/time.h}
3397 \funcdecl{futimens(int fd, const struct timespec times[2])} Cambia i tempi
3398 di un file già aperto, specificato dal file descriptor \param{fd}.
3400 \funcdecl{int utimensat(int dirfd, const char *pathname, const struct
3401 timespec times[2], int flags)} Cambia i tempi del file \param{pathname}.
3404 \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
3405 errore, nel qual caso \var{errno} assumerà gli stessi valori di
3406 \func{utimes}, con in più per \func{futimes}:
3408 \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3409 \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3413 Entrambe le funzioni utilizzano per indicare i valori dei tempi un
3414 vettore \param{times} di due strutture \struct{timespec} che permette di
3415 specificare un valore di tempo con una precisione fino al nanosecondo, la cui
3416 definizione è riportata in fig.~\ref{fig:sys_timespec_struct}.
3418 \begin{figure}[!htb]
3419 \footnotesize \centering
3420 \begin{minipage}[c]{\textwidth}
3421 \includestruct{listati/timespec.h}
3424 \caption{La struttura \structd{timespec} usata per indicare valori di tempo
3425 con la precisione del nanosecondo.}
3426 \label{fig:sys_timespec_struct}
3429 Come per le precedenti funzioni il primo elemento di \param{times} indica il
3430 tempo di ultimo accesso ed il secondo quello di ultima modifica, e se si usa
3431 il valore \val{NULL} verrà impostato il tempo corrente sia per l'ultimo
3432 accesso che per l'ultima modifica. Nei singoli elementi di \param{times} si
3433 possono inoltre utilizzare due valori speciali per il campo \var{tv\_nsec}:
3434 con \const{UTIME\_NOW} si richiede l'uso del tempo corrente, mentre con
3435 \const{UTIME\_OMIT} si richiede di non impostare il tempo. Si può così
3436 aggiornare in maniera specifica soltanto uno fra il tempo di ultimo accesso e
3437 quello di ultima modifica. Quando si usa uno di questi valori speciali per
3438 \var{tv\_nsec} il corrispondente valore di \var{tv\_sec} viene ignorato.
3440 Queste due funzioni sono una estensione definita in una recente revisione
3441 dello standard POSIX (la POSIX.1-2008); sono state introdotte a partire dal
3442 kernel 2.6.22, e supportate dalle \acr{glibc} a partire dalla versione
3443 2.6.\footnote{in precedenza, a partire dal kernel 2.6.16, era stata introdotta
3444 la funzione \funcm{futimesat} seguendo una bozza della revisione dello
3445 standard poi modificata, questa funzione, sostituita da \func{utimensat}, è
3446 stata dichiarata obsoleta, non è supportata da nessuno standard e non deve
3447 essere più utilizzata: pertanto non la tratteremo.} La prima è
3448 sostanzialmente una estensione di \func{futimes} che consente di specificare i
3449 tempi con precisione maggiore, la seconda supporta invece, rispetto ad
3450 \func{utimes}, una sintassi più complessa che, come vedremo in
3451 sez.~\ref{sec:file_openat} consente una indicazione sicura dei
3452 \itindsub{pathname}{relativo} \textit{pathname relativi} specificando la
3453 directory da usare come riferimento in \param{dirfd} e la possibilità di
3454 usare \param{flags} per indicare alla funzione di dereferenziare o meno i link
3455 simbolici; si rimanda pertanto la spiegazione del significato degli argomenti
3456 aggiuntivi alla trattazione generica delle varie funzioni che usano la stessa
3457 sintassi, effettuata in sez.~\ref{sec:file_openat}.
3460 \section{Il controllo di accesso ai file}
3461 \label{sec:file_access_control}
3463 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
3464 del controllo di accesso ai file, che viene implementato per qualunque
3465 filesystem standard.\footnote{per standard si intende che implementa le
3466 caratteristiche previste dallo standard POSIX; in Linux sono disponibili
3467 anche una serie di altri filesystem, come quelli di Windows e del Mac, che
3468 non supportano queste caratteristiche.} In questa sezione ne esamineremo i
3469 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
3472 \subsection{I permessi per l'accesso ai file}
3473 \label{sec:file_perm_overview}
3475 Ad ogni file Linux associa sempre l'utente che ne è proprietario (il
3476 cosiddetto \textit{owner}) ed un gruppo di appartenenza, secondo il meccanismo
3477 degli identificatori di utente e gruppo (\ids{UID} e \ids{GID}). Questi valori
3478 sono accessibili da programma tramite la funzione \func{stat}, e sono
3479 mantenuti nei campi \var{st\_uid} e \var{st\_gid} della struttura
3480 \struct{stat} (si veda sez.~\ref{sec:file_stat}).\footnote{questo è vero solo
3481 per filesystem di tipo Unix, ad esempio non è vero per il filesystem vfat di
3482 Windows, che non fornisce nessun supporto per l'accesso multiutente, e per
3483 il quale i permessi vengono assegnati in maniera fissa con un opzione in
3486 Il controllo di accesso ai file segue un modello abbastanza semplice che
3487 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
3488 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
3489 Control List} che sono state aggiunte ai filesystem standard con opportune
3490 estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
3491 controllo ancora più sofisticati come il \textit{mandatory access control}
3492 di SE-Linux.} ma nella maggior parte dei casi il meccanismo standard è più
3493 che sufficiente a soddisfare tutte le necessità più comuni. I tre permessi di
3494 base associati ad ogni file sono:
3496 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
3498 \item il permesso di scrittura (indicato con la lettera \texttt{w},
3499 dall'inglese \textit{write}).
3500 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
3501 dall'inglese \textit{execute}).
3503 mentre i tre livelli su cui sono divisi i privilegi sono:
3505 \item i privilegi per l'utente proprietario del file.
3506 \item i privilegi per un qualunque utente faccia parte del gruppo cui
3508 \item i privilegi per tutti gli altri utenti.
3511 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
3512 meno significativi sono usati a gruppi di tre per indicare i permessi base di
3513 lettura, scrittura ed esecuzione e sono applicati rispettivamente
3514 rispettivamente al proprietario, al gruppo, a tutti gli altri.
3518 \includegraphics[width=6cm]{img/fileperm}
3519 \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
3520 contenuti nel campo \var{st\_mode} di \struct{stat}.}
3521 \label{fig:file_perm_bit}
3524 I restanti tre bit (noti come \itindex{suid~bit} \textit{suid bit},
3525 \itindex{sgid~bit} \textit{sgid bit}, e \itindex{sticky~bit} \textit{sticky
3526 bit}) sono usati per indicare alcune caratteristiche più complesse del
3527 meccanismo del controllo di accesso su cui torneremo in seguito (in
3528 sez.~\ref{sec:file_special_perm}); lo schema di allocazione dei bit è
3529 riportato in fig.~\ref{fig:file_perm_bit}.
3531 Anche i permessi, come tutte le altre informazioni pertinenti al file, sono
3532 memorizzati \itindex{inode} nell'\textit{inode}; in particolare essi sono
3533 contenuti in alcuni bit del campo \var{st\_mode} della struttura \struct{stat}
3534 (si veda di nuovo fig.~\ref{fig:file_stat_struct}).
3536 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
3537 \cmd{u} (per \textit{user}), \cmd{g} (per \textit{group}) e \cmd{o} (per
3538 \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti insieme
3539 si usa la lettera \cmd{a} (per \textit{all}). Si tenga ben presente questa
3540 distinzione dato che in certi casi, mutuando la terminologia in uso nel VMS,
3541 si parla dei permessi base come di permessi per \textit{owner}, \textit{group}
3542 ed \textit{all}, le cui iniziali possono dar luogo a confusione. Le costanti
3543 che permettono di accedere al valore numerico di questi bit nel campo
3544 \var{st\_mode} sono riportate in tab.~\ref{tab:file_bit_perm}.
3549 \begin{tabular}[c]{|c|l|}
3551 \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
3554 \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
3555 \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
3556 \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\
3558 \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
3559 \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
3560 \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
3562 \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
3563 \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
3564 \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
3567 \caption{I bit dei permessi di accesso ai file, come definiti in
3568 \texttt{<sys/stat.h>}}
3569 \label{tab:file_bit_perm}
3572 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
3573 che si riferiscano a dei file, dei link simbolici o delle directory; qui ci
3574 limiteremo ad un riassunto delle regole generali, entrando nei dettagli più
3577 La prima regola è che per poter accedere ad un file attraverso il suo
3578 \textit{pathname} occorre il permesso di esecuzione in ciascuna delle
3579 directory che compongono il \textit{pathname}; lo stesso vale per aprire un
3580 file nella directory corrente (per la quale appunto serve il diritto di
3583 Per una directory infatti il permesso di esecuzione significa che essa può
3584 essere attraversata nella risoluzione del \textit{pathname}, ed è distinto dal
3585 permesso di lettura che invece implica che si può leggere il contenuto della
3588 Questo significa che se si ha il permesso di esecuzione senza permesso di
3589 lettura si potrà lo stesso aprire un file in una directory (se si hanno i
3590 permessi opportuni per il medesimo) ma non si potrà vederlo con \cmd{ls}
3591 (mentre per crearlo occorrerà anche il permesso di scrittura per la
3594 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
3595 (si veda quanto riportato in tab.~\ref{tab:file_open_flags}) di sola lettura o
3596 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
3597 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
3598 il contenuto, lo stesso permesso è necessario per poter troncare il file.
3600 Non si può creare un file fintanto che non si disponga del permesso di
3601 esecuzione e di quello di scrittura per la directory di destinazione; gli
3602 stessi permessi occorrono per cancellare un file da una directory (si ricordi
3603 che questo non implica necessariamente la rimozione del contenuto del file dal
3604 disco), non è necessario nessun tipo di permesso per il file stesso (infatti
3605 esso non viene toccato, viene solo modificato il contenuto della directory,
3606 rimuovendo la voce che ad esso fa riferimento).
3608 Per poter eseguire un file (che sia un programma compilato od uno script di
3609 shell, od un altro tipo di file eseguibile riconosciuto dal kernel), occorre
3610 avere il permesso di esecuzione, inoltre solo i file regolari possono essere
3613 I permessi per un link simbolico sono ignorati, contano quelli del file a cui
3614 fa riferimento; per questo in genere il comando \cmd{ls} riporta per un link
3615 simbolico tutti i permessi come concessi; utente e gruppo a cui esso
3616 appartiene vengono pure ignorati quando il link viene risolto, vengono
3617 controllati solo quando viene richiesta la rimozione del link e quest'ultimo è
3618 in una directory con lo \itindex{sticky~bit} \textit{sticky bit} impostato (si
3619 veda sez.~\ref{sec:file_special_perm}).
3621 La procedura con cui il kernel stabilisce se un processo possiede un certo
3622 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
3623 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
3624 \var{st\_gid} accennati in precedenza) e l'\ids{UID} effettivo, il \ids{GID}
3625 effettivo e gli eventuali \ids{GID} supplementari del processo.\footnote{in
3626 realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
3627 identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
3628 sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
3629 eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
3632 Per una spiegazione dettagliata degli identificatori associati ai processi si
3633 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
3634 sez.~\ref{sec:file_special_perm}, l'\ids{UID} effettivo e il \ids{GID} effettivo
3635 corrispondono ai valori dell'\ids{UID} e del \ids{GID} dell'utente che ha
3636 lanciato il processo, mentre i \ids{GID} supplementari sono quelli dei gruppi
3637 cui l'utente appartiene.
3639 I passi attraverso i quali viene stabilito se il processo possiede il diritto
3640 di accesso sono i seguenti:
3642 \item Se l'\ids{UID} effettivo del processo è zero (corrispondente
3643 all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
3644 controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
3646 \item Se l'\ids{UID} effettivo del processo è uguale all'\ids{UID} del
3647 proprietario del file (nel qual caso si dice che il processo è proprietario
3650 \item se il relativo\footnote{per relativo si intende il bit di user-read se
3651 il processo vuole accedere in lettura, quello di user-write per
3652 l'accesso in scrittura, ecc.} bit dei permessi d'accesso dell'utente è
3653 impostato, l'accesso è consentito
3654 \item altrimenti l'accesso è negato
3656 \item Se il \ids{GID} effettivo del processo o uno dei \ids{GID} supplementari
3657 dei processi corrispondono al \ids{GID} del file allora:
3659 \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
3661 \item altrimenti l'accesso è negato
3663 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
3664 l'accesso è consentito, altrimenti l'accesso è negato.
3667 Si tenga presente che questi passi vengono eseguiti esattamente in
3668 quest'ordine. Questo vuol dire che se un processo è il proprietario di un file,
3669 l'accesso è consentito o negato solo sulla base dei permessi per l'utente; i
3670 permessi per il gruppo non vengono neanche controllati. Lo stesso vale se il
3671 processo appartiene ad un gruppo appropriato, in questo caso i permessi per
3672 tutti gli altri non vengono controllati.
3675 \subsection{I bit dei permessi speciali}
3676 \label{sec:file_special_perm}
3681 Come si è accennato (in sez.~\ref{sec:file_perm_overview}) nei dodici bit del
3682 campo \var{st\_mode} di \struct{stat} che vengono usati per il controllo di
3683 accesso oltre ai bit dei permessi veri e propri, ci sono altri tre bit che
3684 vengono usati per indicare alcune proprietà speciali dei file. Due di questi
3685 sono i bit detti \acr{suid} (da \textit{set-user-ID bit}) e \acr{sgid} (da
3686 \textit{set-group-ID bit}) che sono identificati dalle costanti
3687 \const{S\_ISUID} e \const{S\_ISGID}.
3689 Come spiegato in dettaglio in sez.~\ref{sec:proc_exec}, quando si lancia un
3690 programma il comportamento normale del kernel è quello di impostare gli
3691 identificatori del gruppo \textit{effective} del nuovo processo al valore dei
3692 corrispondenti del gruppo \textit{real} del processo corrente, che normalmente
3693 corrispondono a quelli dell'utente con cui si è entrati nel sistema.
3695 Se però il file del programma (che ovviamente deve essere
3696 eseguibile\footnote{per motivi di sicurezza il kernel ignora i bit \acr{suid}
3697 e \acr{sgid} per gli script eseguibili.}) ha il bit \acr{suid} impostato, il
3698 kernel assegnerà come \ids{UID} effettivo al nuovo processo l'\ids{UID} del
3699 proprietario del file al posto dell'\ids{UID} del processo originario. Avere
3700 il bit \acr{sgid} impostato ha lo stesso effetto sul \ids{GID} effettivo del
3703 I bit \acr{suid} e \acr{sgid} vengono usati per permettere agli utenti normali
3704 di usare programmi che richiedono privilegi speciali; l'esempio classico è il
3705 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
3706 quest'ultimo ovviamente può essere scritto solo dall'amministratore, ma non è
3707 necessario chiamare l'amministratore per cambiare la propria password. Infatti
3708 il comando \cmd{passwd} appartiene a root ma ha il bit \acr{suid} impostato
3709 per cui quando viene lanciato da un utente normale parte con i privilegi di
3712 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
3713 normalmente l'utente che lo ha lanciato comporta vari rischi, e questo tipo di
3714 programmi devono essere scritti accuratamente per evitare che possano essere
3715 usati per guadagnare privilegi non consentiti (l'argomento è affrontato in
3716 dettaglio in sez.~\ref{sec:proc_perms}).
3718 La presenza dei bit \acr{suid} e \acr{sgid} su un file può essere rilevata con
3719 il comando \cmd{ls -l}, che visualizza una lettera \cmd{s} al posto della
3720 \cmd{x} in corrispondenza dei permessi di utente o gruppo. La stessa lettera
3721 \cmd{s} può essere usata nel comando \cmd{chmod} per impostare questi bit.
3722 Infine questi bit possono essere controllati all'interno di \var{st\_mode} con
3723 l'uso delle due costanti \const{S\_ISUID} e \const{S\_IGID}, i cui valori sono
3724 riportati in tab.~\ref{tab:file_mode_flags}.
3726 Gli stessi bit vengono ad assumere in significato completamente diverso per le
3727 directory, normalmente infatti Linux usa la convenzione di SVr4 per indicare
3728 con questi bit l'uso della semantica BSD nella creazione di nuovi file (si
3729 veda sez.~\ref{sec:file_ownership_management} per una spiegazione dettagliata
3732 Infine Linux utilizza il bit \acr{sgid} per un'ulteriore estensione mutuata
3733 da SVr4. Il caso in cui un file ha il bit \acr{sgid} impostato senza che lo
3734 sia anche il corrispondente bit di esecuzione viene utilizzato per attivare
3735 per quel file il \itindex{mandatory~locking} \textit{mandatory locking}
3736 (affronteremo questo argomento in dettaglio più avanti, in
3737 sez.~\ref{sec:file_mand_locking}).
3743 \itindbeg{sticky~bit}
3745 L'ultimo dei bit rimanenti, identificato dalla costante \const{S\_ISVTX}, è in
3746 parte un rimasuglio delle origini dei sistemi Unix. A quell'epoca infatti la
3747 memoria virtuale e l'accesso ai file erano molto meno sofisticati e per
3748 ottenere la massima velocità possibile per i programmi usati più comunemente
3749 si poteva impostare questo bit.
3751 L'effetto di questo bit era che il \index{segmento!testo} segmento di testo
3752 del programma (si veda sez.~\ref{sec:proc_mem_layout} per i dettagli) veniva
3753 scritto nella swap la prima volta che questo veniva lanciato, e vi permaneva
3754 fino al riavvio della macchina (da questo il nome di \textsl{sticky bit});
3755 essendo la swap un file continuo o una partizione indicizzata direttamente si
3756 poteva risparmiare in tempo di caricamento rispetto alla ricerca attraverso la
3757 struttura del filesystem. Lo \textsl{sticky bit} è indicato usando la lettera
3758 \texttt{t} al posto della \texttt{x} nei permessi per gli altri.
3760 Ovviamente per evitare che gli utenti potessero intasare la swap solo
3761 l'amministratore era in grado di impostare questo bit, che venne chiamato
3762 anche con il nome di \textit{saved text bit}, da cui deriva quello della
3763 costante. Le attuali implementazioni di memoria virtuale e filesystem rendono
3764 sostanzialmente inutile questo procedimento.
3766 Benché ormai non venga più utilizzato per i file, lo \textit{sticky bit} ha
3767 invece assunto un uso importante per le directory;\footnote{lo \textit{sticky
3768 bit} per le directory è un'estensione non definita nello standard POSIX,
3769 Linux però la supporta, così come BSD e SVr4.} in questo caso se tale bit è
3770 impostato un file potrà essere rimosso dalla directory soltanto se l'utente ha
3771 il permesso di scrittura su di essa ed inoltre è vera una delle seguenti
3774 \item l'utente è proprietario del file
3775 \item l'utente è proprietario della directory
3776 \item l'utente è l'amministratore
3778 un classico esempio di directory che ha questo bit impostato è \file{/tmp}, i
3779 permessi infatti di solito sono i seguenti:
3782 drwxrwxrwt 6 root root 1024 Aug 10 01:03 /tmp
3784 quindi con lo \textit{sticky bit} bit impostato. In questo modo qualunque
3785 utente nel sistema può creare dei file in questa directory (che, come
3786 suggerisce il nome, è normalmente utilizzata per la creazione di file
3787 temporanei), ma solo l'utente che ha creato un certo file potrà cancellarlo o
3788 rinominarlo. In questo modo si evita che un utente possa, più o meno
3789 consapevolmente, cancellare i file temporanei creati degli altri utenti.
3791 \itindend{sticky~bit}
3793 \subsection{Le funzioni per la gestione dei permessi dei file}
3794 \label{sec:file_perm_management}
3796 Come visto in sez.~\ref{sec:file_access_control} il controllo di accesso ad un
3797 file viene fatto utilizzando l'\ids{UID} ed il \ids{GID} effettivo del processo;
3798 ci sono casi però in cui si può voler effettuare il controllo con l'\ids{UID}
3799 reale ed il \ids{GID} reale, vale a dire usando i valori di \ids{UID} e
3800 \ids{GID} relativi all'utente che ha lanciato il programma, e che, come
3801 accennato in sez.~\ref{sec:file_special_perm} e spiegato in dettaglio in
3802 sez.~\ref{sec:proc_perms}, non è detto siano uguali a quelli effettivi.
3804 Per far questo si può usare la funzione \funcd{access}, il cui prototipo è:
3805 \begin{prototype}{unistd.h}
3806 {int access(const char *pathname, int mode)}
3808 Verifica i permessi di accesso.
3810 \bodydesc{La funzione ritorna 0 se l'accesso è consentito, -1 se l'accesso non
3811 è consentito ed in caso di errore; nel qual caso la variabile \var{errno}
3814 \item[\errcode{EINVAL}] il valore di \param{mode} non è valido.
3815 \item[\errcode{EACCES}] l'accesso al file non è consentito, o non si ha il
3816 permesso di attraversare una delle directory di \param{pathname}.
3817 \item[\errcode{EROFS}] si è richiesto l'accesso in scrittura per un file su
3818 un filesystem montato in sola lettura.
3820 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
3821 \errval{ENOTDIR}, \errval{ELOOP}, \errval{EIO}.}
3824 La funzione verifica i permessi di accesso, indicati da \param{mode}, per il
3825 file indicato da \param{pathname}. I valori possibili per l'argomento
3826 \param{mode} sono esprimibili come combinazione delle costanti numeriche
3827 riportate in tab.~\ref{tab:file_access_mode_val} (attraverso un OR binario
3828 delle stesse). I primi tre valori implicano anche la verifica dell'esistenza
3829 del file, se si vuole verificare solo quest'ultima si può usare \const{F\_OK},
3830 o anche direttamente \func{stat}. Nel caso in cui \param{pathname} si
3831 riferisca ad un link simbolico, questo viene seguito ed il controllo è fatto
3832 sul file a cui esso fa riferimento.
3834 La funzione controlla solo i bit dei permessi di accesso, si ricordi che il
3835 fatto che una directory abbia permesso di scrittura non significa che ci si
3836 possa scrivere come in un file, e il fatto che un file abbia permesso di
3837 esecuzione non comporta che contenga un programma eseguibile. La funzione
3838 ritorna zero solo se tutte i permessi controllati sono disponibili, in caso
3839 contrario (o di errore) ritorna -1.
3843 \begin{tabular}{|c|l|}
3845 \textbf{\param{mode}} & \textbf{Significato} \\
3848 \const{R\_OK} & Verifica il permesso di lettura. \\
3849 \const{W\_OK} & Verifica il permesso di scrittura. \\
3850 \const{X\_OK} & Verifica il permesso di esecuzione. \\
3851 \const{F\_OK} & Verifica l'esistenza del file. \\
3854 \caption{Valori possibile per l'argomento \param{mode} della funzione
3856 \label{tab:file_access_mode_val}
3859 Un esempio tipico per l'uso di questa funzione è quello di un processo che sta
3860 eseguendo un programma coi privilegi di un altro utente (ad esempio attraverso
3861 l'uso del \itindex{suid~bit} \textit{suid bit}) che vuole controllare se
3862 l'utente originale ha i permessi per accedere ad un certo file.
3864 Del tutto analoghe a \func{access} sono le due funzioni \funcd{euidaccess} e
3865 \funcd{eaccess} che ripetono lo stesso controllo usando però gli
3866 identificatori del gruppo effettivo, verificando quindi le effettive capacità
3867 di accesso ad un file. Le funzioni hanno entrambe lo stesso
3868 prototipo\footnote{in realtà \func{eaccess} è solo un sinonimo di
3869 \func{euidaccess} fornita per compatibilità con l'uso di questo nome in
3870 altri sistemi.} che è del tutto identico a quello di \func{access}. Prendono
3871 anche gli stessi valori e restituiscono gli stessi risultati e gli stessi
3874 Per cambiare i permessi di un file il sistema mette ad disposizione due
3875 funzioni \funcd{chmod} e \funcd{fchmod}, che operano rispettivamente su un
3876 filename e su un file descriptor, i loro prototipi sono:
3878 \headdecl{sys/types.h}
3879 \headdecl{sys/stat.h}
3881 \funcdecl{int chmod(const char *path, mode\_t mode)} Cambia i permessi del
3882 file indicato da \param{path} al valore indicato da \param{mode}.
3884 \funcdecl{int fchmod(int fd, mode\_t mode)} Analoga alla precedente, ma usa
3885 il file descriptor \param{fd} per indicare il file.
3887 \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
3888 un errore, in caso di errore \var{errno} può assumere i valori:
3890 \item[\errcode{EPERM}] l'\ids{UID} effettivo non corrisponde a quello del
3891 proprietario del file o non è zero.
3892 \item[\errcode{EROFS}] il file è su un filesystem in sola lettura.
3894 ed inoltre \errval{EIO}; \func{chmod} restituisce anche \errval{EFAULT},
3895 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
3896 \errval{EACCES}, \errval{ELOOP}; \func{fchmod} anche \errval{EBADF}.}
3899 Entrambe le funzioni utilizzano come secondo argomento \param{mode}, una
3900 variabile dell'apposito tipo primitivo \type{mode\_t} (vedi
3901 tab.~\ref{tab:intro_primitive_types}) utilizzato per specificare i permessi sui
3907 \begin{tabular}[c]{|c|c|l|}
3909 \textbf{\param{mode}} & \textbf{Valore} & \textbf{Significato} \\
3912 \const{S\_ISUID} & 04000 & Set user ID \itindex{suid~bit}.\\
3913 \const{S\_ISGID} & 02000 & Set group ID \itindex{sgid~bit}.\\
3914 \const{S\_ISVTX} & 01000 & Sticky bit \itindex{sticky~bit}.\\
3916 \const{S\_IRWXU} & 00700 & L'utente ha tutti i permessi.\\
3917 \const{S\_IRUSR} & 00400 & L'utente ha il permesso di lettura.\\
3918 \const{S\_IWUSR} & 00200 & L'utente ha il permesso di scrittura.\\
3919 \const{S\_IXUSR} & 00100 & L'utente ha il permesso di esecuzione.\\
3921 \const{S\_IRWXG} & 00070 & Il gruppo ha tutti i permessi.\\
3922 \const{S\_IRGRP} & 00040 & Il gruppo ha il permesso di lettura.\\
3923 \const{S\_IWGRP} & 00020 & Il gruppo ha il permesso di scrittura.\\
3924 \const{S\_IXGRP} & 00010 & Il gruppo ha il permesso di esecuzione.\\
3926 \const{S\_IRWXO} & 00007 & Gli altri hanno tutti i permessi.\\
3927 \const{S\_IROTH} & 00004 & Gli altri hanno il permesso di lettura.\\
3928 \const{S\_IWOTH} & 00002 & Gli altri hanno il permesso di scrittura.\\
3929 \const{S\_IXOTH} & 00001 & Gli altri hanno il permesso di esecuzione.\\
3932 \caption{Valori delle costanti usate per indicare i vari bit di
3933 \param{mode} utilizzato per impostare i permessi dei file.}
3934 \label{tab:file_permission_const}
3937 Le costanti con cui specificare i singoli bit di \param{mode} sono riportate
3938 in tab.~\ref{tab:file_permission_const}. Il valore di \param{mode} può essere
3939 ottenuto combinando fra loro con un OR binario le costanti simboliche relative
3940 ai vari bit, o specificato direttamente, come per l'omonimo comando di shell,
3941 con un valore numerico (la shell lo vuole in ottale, dato che i bit dei
3942 permessi sono divisibili in gruppi di tre), che si può calcolare direttamente
3943 usando lo schema si utilizzo dei bit illustrato in
3944 fig.~\ref{fig:file_perm_bit}.
3946 Ad esempio i permessi standard assegnati ai nuovi file (lettura e scrittura
3947 per il proprietario, sola lettura per il gruppo e gli altri) sono
3948 corrispondenti al valore ottale $0644$, un programma invece avrebbe anche il
3949 bit di esecuzione attivo, con un valore di $0755$, se si volesse attivare il
3950 bit \itindex{suid~bit} \acr{suid} il valore da fornire sarebbe $4755$.
3952 Il cambiamento dei permessi di un file eseguito attraverso queste funzioni ha
3953 comunque alcune limitazioni, previste per motivi di sicurezza. L'uso delle
3954 funzioni infatti è possibile solo se l'\ids{UID} effettivo del processo
3955 corrisponde a quello del proprietario del file o dell'amministratore,
3956 altrimenti esse falliranno con un errore di \errcode{EPERM}.
3958 Ma oltre a questa regola generale, di immediata comprensione, esistono delle
3959 limitazioni ulteriori. Per questo motivo, anche se si è proprietari del file,
3960 non tutti i valori possibili di \param{mode} sono permessi o hanno effetto;
3961 in particolare accade che:
3963 \item siccome solo l'amministratore può impostare lo \itindex{sticky~bit}
3964 \textit{sticky bit}, se l'\ids{UID} effettivo del processo non è zero esso
3965 viene automaticamente cancellato (senza notifica di errore) qualora sia
3966 stato indicato in \param{mode}.
3967 \item per quanto detto in sez.~\ref{sec:file_ownership_management} riguardo la
3968 creazione dei nuovi file, si può avere il caso in cui il file creato da un
3969 processo è assegnato ad un gruppo per il quale il processo non ha privilegi.
3970 Per evitare che si possa assegnare il bit \itindex{sgid~bit} \acr{sgid} ad
3971 un file appartenente ad un gruppo per cui non si hanno diritti, questo viene
3972 automaticamente cancellato da \param{mode} (senza notifica di errore)
3973 qualora il gruppo del file non corrisponda a quelli associati al processo
3974 (la cosa non avviene quando l'\ids{UID} effettivo del processo è zero).
3977 Per alcuni filesystem\footnote{i filesystem più comuni (\textsl{ext2},
3978 \textsl{ext3}, \textsl{ext4}, \textsl{ReiserFS}) supportano questa
3979 caratteristica, che è mutuata da BSD.} è inoltre prevista un'ulteriore
3980 misura di sicurezza, volta a scongiurare l'abuso dei \itindex{suid~bit} bit
3981 \acr{suid} e \acr{sgid}; essa consiste nel cancellare automaticamente questi
3982 bit dai permessi di un file qualora un processo che non appartenga
3983 all'amministratore\footnote{per la precisione un processo che non dispone
3984 della \itindex{capabilities} capacità \const{CAP\_FSETID}, vedi
3985 sez.~\ref{sec:proc_capabilities}.} effettui una scrittura. In questo modo
3986 anche se un utente malizioso scopre un file \acr{suid} su cui può scrivere,
3987 un'eventuale modifica comporterà la perdita di questo privilegio.
3989 Le funzioni \func{chmod} e \func{fchmod} ci permettono di modificare i
3990 permessi di un file, resta però il problema di quali sono i permessi assegnati
3991 quando il file viene creato. Le funzioni dell'interfaccia nativa di Unix, come
3992 vedremo in sez.~\ref{sec:file_open}, permettono di indicare esplicitamente i
3993 permessi di creazione di un file, ma questo non è possibile per le funzioni
3994 dell'interfaccia standard ANSI C che non prevede l'esistenza di utenti e
3995 gruppi, ed inoltre il problema si pone anche per l'interfaccia nativa quando i
3996 permessi non vengono indicati esplicitamente.
4000 Per le funzioni dell'interfaccia standard ANSI C l'unico riferimento possibile
4001 è quello della modalità di apertura del nuovo file (lettura/scrittura o sola
4002 lettura), che però può fornire un valore che è lo stesso per tutti e tre i
4003 permessi di sez.~\ref{sec:file_perm_overview} (cioè $666$ nel primo caso e
4004 $222$ nel secondo). Per questo motivo il sistema associa ad ogni
4005 processo\footnote{è infatti contenuta nel campo \var{umask} della struttura
4006 \kstruct{fs\_struct}, vedi fig.~\ref{fig:proc_task_struct}.} una maschera
4007 di bit, la cosiddetta \textit{umask}, che viene utilizzata per impedire che
4008 alcuni permessi possano essere assegnati ai nuovi file in sede di creazione. I
4009 bit indicati nella maschera vengono infatti cancellati dai permessi quando un
4010 nuovo file viene creato.\footnote{l'operazione viene fatta sempre: anche
4011 qualora si indichi esplicitamente un valore dei permessi nelle funzioni di
4012 creazione che lo consentono, i permessi contenuti nella \textit{umask}
4015 La funzione che permette di impostare il valore di questa maschera di
4016 controllo è \funcd{umask}, ed il suo prototipo è:
4017 \begin{prototype}{stat.h}
4018 {mode\_t umask(mode\_t mask)}
4020 Imposta la maschera dei permessi dei bit al valore specificato da \param{mask}
4021 (di cui vengono presi solo i 9 bit meno significativi).
4023 \bodydesc{La funzione ritorna il precedente valore della maschera. È una
4024 delle poche funzioni che non restituisce codici di errore.}
4027 In genere si usa questa maschera per impostare un valore predefinito che
4028 escluda preventivamente alcuni permessi (usualmente quello di scrittura per il
4029 gruppo e gli altri, corrispondente ad un valore per \param{mask} pari a
4030 $022$). In questo modo è possibile cancellare automaticamente i permessi non
4031 voluti. Di norma questo valore viene impostato una volta per tutte al login a
4032 $022$, e gli utenti non hanno motivi per modificarlo.
4037 \subsection{La gestione della titolarità dei file}
4038 \label{sec:file_ownership_management}
4040 Vedremo in sez.~\ref{sec:file_base_func} con quali funzioni si possono creare
4041 nuovi file, in tale occasione vedremo che è possibile specificare in sede di
4042 creazione quali permessi applicare ad un file, però non si può indicare a
4043 quale utente e gruppo esso deve appartenere. Lo stesso problema si presenta
4044 per la creazione di nuove directory (procedimento descritto in
4045 sez.~\ref{sec:file_dir_creat_rem}).
4047 Lo standard POSIX prescrive che l'\ids{UID} del nuovo file corrisponda
4048 all'\ids{UID} effettivo del processo che lo crea; per il \ids{GID} invece
4049 prevede due diverse possibilità:
4051 \item il \ids{GID} del file corrisponde al \ids{GID} effettivo del processo.
4052 \item il \ids{GID} del file corrisponde al \ids{GID} della directory in cui
4055 in genere BSD usa sempre la seconda possibilità, che viene per questo chiamata
4056 semantica BSD. Linux invece segue quella che viene chiamata semantica SVr4; di
4057 norma cioè il nuovo file viene creato, seguendo la prima opzione, con il
4058 \ids{GID} del processo, se però la directory in cui viene creato il file ha il
4059 bit \acr{sgid} impostato allora viene usata la seconda opzione.
4061 Usare la semantica BSD ha il vantaggio che il \ids{GID} viene sempre
4062 automaticamente propagato, restando coerente a quello della directory di
4063 partenza, in tutte le sotto-directory.
4065 La semantica SVr4 offre la possibilità di scegliere, ma per ottenere lo stesso
4066 risultato di coerenza che si ha con BSD necessita che quando si creano nuove
4067 directory venga anche propagato anche il bit \acr{sgid}. Questo è il
4068 comportamento predefinito del comando \cmd{mkdir}, ed è in questo modo ad
4069 esempio che le varie distribuzioni assicurano che le sotto-directory create
4070 nella home di un utente restino sempre con il \ids{GID} del gruppo primario
4073 La presenza del bit \acr{sgid} è inoltre molto comoda quando si hanno
4074 directory contenenti file condivisi all'intero di un gruppo in cui possono
4075 scrivere tutti i membri dello stesso, dato che assicura che i file che gli
4076 utenti vi creano appartengano sempre allo stesso gruppo. Questo non risolve
4077 però completamente i problemi di accesso da parte di altri utenti dello stesso
4078 gruppo, in quanto i permessi assegnati al gruppo potrebbero non essere
4079 sufficienti; in tal caso si deve aver cura di usare un valore di
4080 \itindex{umask} \textit{umask} che ne lasci di sufficienti.\footnote{in tal
4081 caso si può assegnare agli utenti del gruppo una \textit{umask} di $002$,
4082 anche se la soluzione migliore in questo caso è usare una ACL di default
4083 (vedi sez.~\ref{sec:file_ACL}).}
4085 Come avviene nel caso dei permessi il sistema fornisce anche delle funzioni,
4086 \funcd{chown}, \funcd{fchown} e \funcd{lchown}, che permettono di cambiare sia
4087 l'utente che il gruppo a cui un file appartiene; i rispettivi prototipi sono:
4089 \headdecl{sys/types.h}
4090 \headdecl{sys/stat.h}
4092 \funcdecl{int chown(const char *path, uid\_t owner, gid\_t group)}
4093 \funcdecl{int fchown(int fd, uid\_t owner, gid\_t group)}
4094 \funcdecl{int lchown(const char *path, uid\_t owner, gid\_t group)}
4096 Le funzioni cambiano utente e gruppo di appartenenza di un file ai valori
4097 specificati dalle variabili \param{owner} e \param{group}.
4099 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
4100 errore, nel qual caso caso \var{errno} assumerà i valori:
4102 \item[\errcode{EPERM}] l'\ids{UID} effettivo non corrisponde a quello del
4103 proprietario del file o non è zero, o utente e gruppo non sono validi
4105 Oltre a questi entrambe restituiscono gli errori \errval{EROFS} e
4106 \errval{EIO}; \func{chown} restituisce anche \errval{EFAULT},
4107 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
4108 \errval{EACCES}, \errval{ELOOP}; \func{fchown} anche \errval{EBADF}.}
4111 Con Linux solo l'amministratore\footnote{o in generale un processo con la
4112 \itindex{capabilities} capacità \const{CAP\_CHOWN}, vedi
4113 sez.~\ref{sec:proc_capabilities}.} può cambiare il proprietario di un file;
4114 in questo viene seguita la semantica usata da BSD che non consente agli utenti
4115 di assegnare i loro file ad altri utenti evitando eventuali aggiramenti delle
4116 quote. L'amministratore può cambiare sempre il gruppo di un file, il
4117 proprietario può cambiare il gruppo solo dei file che gli appartengono e solo
4118 se il nuovo gruppo è il suo gruppo primario o uno dei gruppi di cui fa parte.
4120 La funzione \func{chown} segue i link simbolici, per operare direttamente su
4121 un link simbolico si deve usare la funzione \func{lchown}.\footnote{fino alla
4122 versione 2.1.81 in Linux \func{chown} non seguiva i link simbolici, da
4123 allora questo comportamento è stato assegnato alla funzione \func{lchown},
4124 introdotta per l'occasione, ed è stata creata una nuova system call per
4125 \func{chown} che seguisse i link simbolici.} La funzione \func{fchown} opera
4126 su un file aperto, essa è mutuata da BSD, ma non è nello standard POSIX.
4127 Un'altra estensione rispetto allo standard POSIX è che specificando -1 come
4128 valore per \param{owner} e \param{group} i valori restano immutati.
4130 Quando queste funzioni sono chiamate con successo da un processo senza i
4131 privilegi di root entrambi i bit \itindex{suid~bit} \acr{suid} e
4132 \itindex{sgid~bit} \acr{sgid} vengono cancellati. Questo non avviene per il
4133 bit \acr{sgid} nel caso in cui esso sia usato (in assenza del corrispondente
4134 permesso di esecuzione) per indicare che per il file è attivo il
4135 \itindex{mandatory~locking} \textit{mandatory locking} (vedi
4136 sez.~\ref{sec:file_mand_locking}).
4139 \subsection{Un quadro d'insieme sui permessi}
4140 \label{sec:file_riepilogo}
4142 Avendo affrontato in maniera separata il comportamento delle varie funzioni
4143 che operano sui permessi dei file ed avendo trattato in sezioni diverse il
4144 significato dei singoli bit dei permessi, vale la pena di fare un riepilogo in
4145 cui si riassumano le caratteristiche di ciascuno di essi, in modo da poter
4146 fornire un quadro d'insieme.
4151 \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
4153 \multicolumn{3}{|c|}{special}&
4154 \multicolumn{3}{|c|}{user}&
4155 \multicolumn{3}{|c|}{group}&
4156 \multicolumn{3}{|c|}{other}&
4157 \multirow{2}{*}{\textbf{Significato per i file}} \\
4159 \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
4162 1&-&-&-&-&-&-&-&-&-&-&-&Se eseguito ha i permessi del proprietario.\\
4163 -&1&-&-&-&1&-&-&-&-&-&-&Se eseguito ha i permessi del gruppo proprietario.\\
4164 -&1&-&-&-&0&-&-&-&-&-&-&Il \itindex{mandatory~locking}
4165 \textit{mandatory locking} è abilitato.\\
4166 -&-&1&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
4167 -&-&-&1&-&-&-&-&-&-&-&-&Permesso di lettura per il proprietario.\\
4168 -&-&-&-&1&-&-&-&-&-&-&-&Permesso di scrittura per il proprietario.\\
4169 -&-&-&-&-&1&-&-&-&-&-&-&Permesso di esecuzione per il proprietario.\\
4170 -&-&-&-&-&-&1&-&-&-&-&-&Permesso di lettura per il gruppo proprietario.\\
4171 -&-&-&-&-&-&-&1&-&-&-&-&Permesso di scrittura per il gruppo proprietario.\\
4172 -&-&-&-&-&-&-&-&1&-&-&-&Permesso di esecuzione per il gruppo proprietario.\\
4173 -&-&-&-&-&-&-&-&-&1&-&-&Permesso di lettura per tutti gli altri.\\
4174 -&-&-&-&-&-&-&-&-&-&1&-&Permesso di scrittura per tutti gli altri.\\
4175 -&-&-&-&-&-&-&-&-&-&-&1&Permesso di esecuzione per tutti gli altri.\\
4178 \multicolumn{3}{|c|}{special}&
4179 \multicolumn{3}{|c|}{user}&
4180 \multicolumn{3}{|c|}{group}&
4181 \multicolumn{3}{|c|}{other}&
4182 \multirow{2}{*}{\textbf{Significato per le directory}} \\
4184 \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
4187 1&-&-&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
4188 -&1&-&-&-&-&-&-&-&-&-&-&Propaga il gruppo proprietario ai nuovi file
4190 -&-&1&-&-&-&-&-&-&-&-&-&Limita l'accesso in scrittura dei file nella
4192 -&-&-&1&-&-&-&-&-&-&-&-&Permesso di visualizzazione per il proprietario.\\
4193 -&-&-&-&1&-&-&-&-&-&-&-&Permesso di aggiornamento per il proprietario.\\
4194 -&-&-&-&-&1&-&-&-&-&-&-&Permesso di attraversamento per il proprietario.\\
4195 -&-&-&-&-&-&1&-&-&-&-&-&Permesso di visualizzazione per il gruppo
4197 -&-&-&-&-&-&-&1&-&-&-&-&Permesso di aggiornamento per il gruppo
4199 -&-&-&-&-&-&-&-&1&-&-&-&Permesso di attraversamento per il gruppo
4201 -&-&-&-&-&-&-&-&-&1&-&-&Permesso di visualizzazione per tutti gli altri.\\
4202 -&-&-&-&-&-&-&-&-&-&1&-&Permesso di aggiornamento per tutti gli altri.\\
4203 -&-&-&-&-&-&-&-&-&-&-&1&Permesso di attraversamento per tutti gli altri.\\
4206 \caption{Tabella riassuntiva del significato dei bit dei permessi per un
4208 \label{tab:file_fileperm_bits}
4211 Nella parte superiore di tab.~\ref{tab:file_fileperm_bits} si è riassunto il
4212 significato dei vari bit dei permessi per un file ordinario; per quanto
4213 riguarda l'applicazione dei permessi per proprietario, gruppo ed altri si
4214 ricordi quanto illustrato in sez.~\ref{sec:file_perm_overview}. Per
4215 compattezza, nella tabella si sono specificati i bit di \itindex{suid~bit}
4216 \textit{suid}, \itindex{sgid~bit} \textit{sgid} e \textit{sticky}
4217 \itindex{sticky~bit} con la notazione illustrata anche in
4218 fig.~\ref{fig:file_perm_bit}. Nella parte inferiore si sono invece riassunti
4219 i significati dei vari bit dei permessi per una directory; anche in questo
4220 caso si è riapplicato ai bit di \itindex{suid~bit} \textit{suid},
4221 \itindex{sgid~bit} \textit{sgid} e \textit{sticky} \itindex{sticky~bit} la
4222 notazione illustrata in fig.~\ref{fig:file_perm_bit}.
4224 Si ricordi infine che i permessi non hanno alcun significato per i link
4225 simbolici, mentre per i \index{file!di~dispositivo} file di dispositivo hanno
4226 senso soltanto i permessi di lettura e scrittura, che si riflettono sulla
4227 possibilità di compiere dette operazioni sul dispositivo stesso.
4229 Nella tabella si è indicato con il carattere ``-'' il fatto che il valore del
4230 bit in questione non è influente rispetto a quanto indicato nella riga della
4231 tabella; la descrizione del significato fa riferimento soltanto alla
4232 combinazione di bit per i quali è stato riportato esplicitamente un valore.
4233 Si rammenti infine che il valore dei bit dei permessi non ha alcun effetto
4234 qualora il processo possieda i privilegi di amministratore.
4237 \section{Caratteristiche e funzionalità avanzate}
4238 \label{sec:file_dir_advances}
4240 Tratteremo qui alcune caratteristiche e funzionalità avanzate della gestione
4241 di file e directory, affrontando anche una serie di estensioni
4242 dell'interfaccia classica dei sistemi unix-like, principalmente utilizzate a
4243 scopi di sicurezza, che sono state introdotte nelle versioni più recenti di
4246 \subsection{Gli attributi estesi}
4247 \label{sec:file_xattr}
4249 \itindbeg{Extended~Attributes}
4251 Nelle sezioni precedenti abbiamo trattato in dettaglio le varie informazioni
4252 che il sistema mantiene negli \itindex{inode} \textit{inode}, e le varie
4253 funzioni che permettono di modificarle. Si sarà notato come in realtà queste
4254 informazioni siano estremamente ridotte. Questo è dovuto al fatto che Unix
4255 origina negli anni '70, quando le risorse di calcolo e di spazio disco erano
4256 minime. Con il venir meno di queste restrizioni è incominciata ad emergere
4257 l'esigenza di poter associare ai file delle ulteriori informazioni astratte
4258 (quelli che vengono chiamati i \textsl{meta-dati}) che però non potevano
4259 trovare spazio nei dati classici mantenuti negli \itindex{inode}
4262 Per risolvere questo problema alcuni sistemi unix-like (e fra questi anche
4263 Linux) hanno introdotto un meccanismo generico, detto \textit{Extended
4264 Attributes} che consenta di associare delle informazioni ai singoli
4265 file.\footnote{l'uso più comune è quello della ACL, che tratteremo nella
4266 prossima sezione.} Gli \textsl{attributi estesi} non sono altro che delle
4267 coppie nome/valore che sono associate permanentemente ad un oggetto sul
4268 filesystem, analoghi di quello che sono le variabili di ambiente (vedi
4269 sez.~\ref{sec:proc_environ}) per un processo.
4271 Altri sistemi (come Solaris, MacOS e Windows) hanno adottato un meccanismo
4272 diverso in cui ad un file sono associati diversi flussi di dati, su cui
4273 possono essere mantenute ulteriori informazioni, che possono essere accedute
4274 con le normali operazioni di lettura e scrittura. Questi non vanno confusi con
4275 gli \textit{Extended Attributes} (anche se su Solaris hanno lo stesso nome),
4276 che sono un meccanismo molto più semplice, che pur essendo limitato (potendo
4277 contenere solo una quantità limitata di informazione) hanno il grande
4278 vantaggio di essere molto più semplici da realizzare, più
4279 efficienti,\footnote{cosa molto importante, specie per le applicazioni che
4280 richiedono una gran numero di accessi, come le ACL.} e di garantire
4281 l'atomicità di tutte le operazioni.
4283 In Linux gli attributi estesi sono sempre associati al singolo \itindex{inode}
4284 \textit{inode} e l'accesso viene sempre eseguito in forma atomica, in lettura
4285 il valore corrente viene scritto su un buffer in memoria, mentre la scrittura
4286 prevede che ogni valore precedente sia sovrascritto.
4288 Si tenga presente che non tutti i filesystem supportano gli \textit{Extended
4289 Attributes}; al momento della scrittura di queste dispense essi sono
4290 presenti solo sui vari \textsl{extN}, \textsl{ReiserFS}, \textsl{JFS},
4291 \textsl{XFS} e \textsl{Btrfs}.\footnote{l'elenco è aggiornato a Luglio 2011.}
4292 Inoltre a seconda della implementazione ci possono essere dei limiti sulla
4293 quantità di attributi che si possono utilizzare.\footnote{ad esempio nel caso
4294 di \textsl{ext2} ed \textsl{ext3} è richiesto che essi siano contenuti
4295 all'interno di un singolo blocco (pertanto con dimensioni massime pari a
4296 1024, 2048 o 4096 byte a seconda delle dimensioni di quest'ultimo impostate
4297 in fase di creazione del filesystem), mentre con \textsl{XFS} non ci sono
4298 limiti ed i dati vengono memorizzati in maniera diversa (nell'\textit{inode}
4299 stesso, in un blocco a parte, o in una struttura ad albero dedicata) per
4300 mantenerne la scalabilità.} Infine lo spazio utilizzato per mantenere gli
4301 attributi estesi viene tenuto in conto per il calcolo delle quote di utente e
4302 gruppo proprietari del file.
4304 Come meccanismo per mantenere informazioni aggiuntive associate al singolo
4305 file, gli \textit{Extended Attributes} possono avere usi anche molto diversi
4306 fra loro. Per poterli distinguere allora sono stati suddivisi in
4307 \textsl{classi}, a cui poter applicare requisiti diversi per l'accesso e la
4308 gestione. Per questo motivo il nome di un attributo deve essere sempre
4309 specificato nella forma \texttt{namespace.attribute}, dove \texttt{namespace}
4310 fa riferimento alla classe a cui l'attributo appartiene, mentre
4311 \texttt{attribute} è il nome ad esso assegnato. In tale forma il nome di un
4312 attributo esteso deve essere univoco. Al momento\footnote{della scrittura di
4313 questa sezione, kernel 2.6.23, ottobre 2007.} sono state definite le quattro
4314 classi di attributi riportate in tab.~\ref{tab:extended_attribute_class}.
4319 \begin{tabular}{|l|p{12cm}|}
4321 \textbf{Nome} & \textbf{Descrizione} \\
4324 \texttt{security}&Gli \textit{extended security attributes}: vengono
4325 utilizzati dalle estensioni di sicurezza del kernel (i
4326 \itindex{Linux~Security~Modules} \textit{Linux
4327 Security Modules}), per le realizzazione di meccanismi
4328 evoluti di controllo di accesso come \index{SELinux}
4329 SELinux o le \textit{capabilities} dei file di
4330 sez.~\ref{sec:proc_capabilities}.\\
4331 \texttt{system} & Gli \textit{extended security attributes}: sono usati
4332 dal kernel per memorizzare dati di sistema associati ai
4333 file come le \itindex{Access~Control~List~(ACL)} ACL (vedi
4334 sez.~\ref{sec:file_ACL}) o le \itindex{capabilities}
4335 \textit{capabilities} (vedi
4336 sez.~\ref{sec:proc_capabilities}).\\
4337 \texttt{trusted}& I \textit{trusted extended attributes}: vengono
4338 utilizzati per poter realizzare in user space
4339 meccanismi che consentano di mantenere delle
4340 informazioni sui file che non devono essere accessibili
4341 ai processi ordinari.\\
4342 \texttt{user} & Gli \textit{extended user attributes}: utilizzati per
4343 mantenere informazioni aggiuntive sui file (come il
4344 \textit{mime-type}, la codifica dei caratteri o del
4345 file) accessibili dagli utenti.\\
4348 \caption{I nomi utilizzati valore di \texttt{namespace} per distinguere le
4349 varie classi di \textit{Extended Attributes}.}
4350 \label{tab:extended_attribute_class}
4354 Dato che uno degli usi degli \textit{Extended Attributes} è quello che li
4355 impiega per realizzare delle estensioni (come le
4356 \itindex{Access~Control~List~(ACL)} ACL, \index{SELinux} SELinux, ecc.) al
4357 tradizionale meccanismo dei controlli di accesso di Unix, l'accesso ai loro
4358 valori viene regolato in maniera diversa a seconda sia della loro classe sia
4359 di quali, fra le estensioni che li utilizzano, sono poste in uso. In
4360 particolare, per ciascuna delle classi riportate in
4361 tab.~\ref{tab:extended_attribute_class}, si hanno i seguenti casi:
4362 \begin{basedescript}{\desclabelwidth{1.7cm}\desclabelstyle{\nextlinelabel}}
4363 \item[\texttt{security}] L'accesso agli \textit{extended security attributes}
4364 dipende dalle politiche di sicurezza stabilite da loro stessi tramite
4365 l'utilizzo di un sistema di controllo basato sui
4366 \itindex{Linux~Security~Modules} \textit{Linux Security Modules} (ad esempio
4367 \index{SELinux} SELinux). Pertanto l'accesso in lettura o scrittura dipende
4368 dalle politiche di sicurezza implementate all'interno dal modulo di
4369 sicurezza che si sta utilizzando al momento (ciascuno avrà le sue). Se non è
4370 stato caricato nessun modulo di sicurezza l'accesso in lettura sarà
4371 consentito a tutti i processi, mentre quello in scrittura solo ai processi
4372 con privilegi amministrativi dotati della \itindex{capabilities}
4373 \textit{capability} \const{CAP\_SYS\_ADMIN}.
4375 \item[\texttt{system}] Anche l'accesso agli \textit{extended system
4376 attributes} dipende dalle politiche di accesso che il kernel realizza
4377 anche utilizzando gli stessi valori in essi contenuti. Ad esempio nel caso
4378 delle \itindex{Access~Control~List~(ACL)} ACL l'accesso è consentito in
4379 lettura ai processi che hanno la capacità di eseguire una ricerca sul file
4380 (cioè hanno il permesso di lettura sulla directory che contiene il file) ed
4381 in scrittura al proprietario del file o ai processi dotati della
4382 \textit{capability} \itindex{capabilities}
4383 \const{CAP\_FOWNER}.\footnote{vale a dire una politica di accesso analoga a
4384 quella impiegata per gli ordinari permessi dei file.}
4386 \item[\texttt{trusted}] L'accesso ai \textit{trusted extended attributes}, sia
4387 per la lettura che per la scrittura, è consentito soltanto ai processi con
4388 privilegi amministrativi dotati della \itindex{capabilities}
4389 \textit{capability} \const{CAP\_SYS\_ADMIN}. In questo modo si possono
4390 utilizzare questi attributi per realizzare in user space dei meccanismi di
4391 controllo che accedono ad informazioni non disponibili ai processi ordinari.
4393 \item[\texttt{user}] L'accesso agli \textit{extended user attributes} è
4394 regolato dai normali permessi dei file: occorre avere il permesso di lettura
4395 per leggerli e quello di scrittura per scriverli o modificarli. Dato l'uso
4396 di questi attributi si è scelto di applicare al loro accesso gli stessi
4397 criteri che si usano per l'accesso al contenuto dei file (o delle directory)
4398 cui essi fanno riferimento. Questa scelta vale però soltanto per i file e le
4399 directory ordinarie, se valesse in generale infatti si avrebbe un serio
4400 problema di sicurezza dato che esistono diversi oggetti sul filesystem per i
4401 quali è normale avere avere il permesso di scrittura consentito a tutti gli
4402 utenti, come i link simbolici, o alcuni \index{file!di~dispositivo} file di
4403 dispositivo come \texttt{/dev/null}. Se fosse possibile usare su di essi gli
4404 \textit{extended user attributes} un utente qualunque potrebbe inserirvi
4405 dati a piacere.\footnote{la cosa è stata notata su XFS, dove questo
4406 comportamento permetteva, non essendovi limiti sullo spazio occupabile
4407 dagli \textit{Extended Attributes}, di bloccare il sistema riempiendo il
4410 La semantica del controllo di accesso indicata inoltre non avrebbe alcun
4411 senso al di fuori di file e directory: i permessi di lettura e scrittura per
4412 un \index{file!di~dispositivo} file di dispositivo attengono alle capacità
4413 di accesso al dispositivo sottostante,\footnote{motivo per cui si può
4414 formattare un disco anche se \texttt{/dev} è su un filesystem in sola
4415 lettura.} mentre per i link simbolici questi vengono semplicemente
4416 ignorati: in nessuno dei due casi hanno a che fare con il contenuto del
4417 file, e nella discussione relativa all'uso degli \textit{extended user
4418 attributes} nessuno è mai stato capace di indicare una qualche forma
4419 sensata di utilizzo degli stessi per link simbolici o
4420 \index{file!di~dispositivo} file di dispositivo, e neanche per le fifo o i
4421 socket. Per questo motivo essi sono stati completamente disabilitati per
4422 tutto ciò che non sia un file regolare o una directory.\footnote{si può
4423 verificare la semantica adottata consultando il file \texttt{fs/xattr.c}
4424 dei sorgenti del kernel.} Inoltre per le directory è stata introdotta una
4425 ulteriore restrizione, dovuta di nuovo alla presenza ordinaria di permessi
4426 di scrittura completi su directory come \texttt{/tmp}. Per questo motivo,
4427 per evitare eventuali abusi, se una directory ha lo \itindex{sticky~bit}
4428 \textit{sticky bit} attivo sarà consentito scrivere i suoi \textit{extended
4429 user attributes} soltanto se si è proprietari della stessa, o si hanno i
4430 privilegi amministrativi della capability \itindex{capabilities}
4431 \const{CAP\_FOWNER}.
4434 Le funzioni per la gestione degli attributi estesi, come altre funzioni di
4435 gestione avanzate specifiche di Linux, non fanno parte delle \acr{glibc}, e
4436 sono fornite da una apposita libreria, \texttt{libattr}, che deve essere
4437 installata a parte;\footnote{la versione corrente della libreria è
4438 \texttt{libattr1}.} pertanto se un programma le utilizza si dovrà indicare
4439 esplicitamente l'uso della suddetta libreria invocando il compilatore con
4440 l'opzione \texttt{-lattr}.
4442 Per poter leggere gli attributi estesi sono disponibili tre diverse funzioni,
4443 \funcd{getxattr}, \funcd{lgetxattr} e \funcd{fgetxattr}, che consentono
4444 rispettivamente di richiedere gli attributi relativi a un file, a un link
4445 simbolico e ad un file descriptor; i rispettivi prototipi sono:
4447 \headdecl{sys/types.h}
4448 \headdecl{attr/xattr.h}
4450 \funcdecl{ssize\_t getxattr(const char *path, const char *name, void
4451 *value, size\_t size)}
4453 \funcdecl{ssize\_t lgetxattr(const char *path, const char *name, void
4454 *value, size\_t size)}
4456 \funcdecl{ssize\_t fgetxattr(int filedes, const char *name, void *value,
4459 Le funzioni leggono il valore di un attributo esteso.
4461 \bodydesc{Le funzioni restituiscono un intero positivo che indica la
4462 dimensione dell'attributo richiesto in caso di successo, e $-1$ in caso di
4463 errore, nel qual caso \var{errno} assumerà i valori:
4465 \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
4466 \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
4467 non è sufficiente per contenere il risultato.
4468 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
4469 filesystem o sono disabilitati.
4471 e tutti gli errori di \func{stat}, come \errcode{EPERM} se non si hanno i
4472 permessi di accesso all'attributo. }
4475 Le funzioni \func{getxattr} e \func{lgetxattr} prendono come primo argomento
4476 un \textit{pathname} che indica il file di cui si vuole richiedere un
4477 attributo, la sola differenza è che la seconda, se il \textit{pathname} indica
4478 un link simbolico, restituisce gli attributi di quest'ultimo e non quelli del
4479 file a cui esso fa riferimento. La funzione \func{fgetxattr} prende invece
4480 come primo argomento un numero di file descriptor, e richiede gli attributi
4481 del file ad esso associato.
4483 Tutte e tre le funzioni richiedono di specificare nell'argomento \param{name}
4484 il nome dell'attributo di cui si vuole ottenere il valore. Il nome deve essere
4485 indicato comprensivo di prefisso del \textit{namespace} cui appartiene (uno
4486 dei valori di tab.~\ref{tab:extended_attribute_class}) nella forma
4487 \texttt{namespace.attributename}, come stringa terminata da un carattere NUL.
4488 Il suo valore verrà restituito nel buffer puntato dall'argomento \param{value}
4489 per una dimensione massima di \param{size} byte;\footnote{gli attributi estesi
4490 possono essere costituiti arbitrariamente da dati testuali o binari.} se
4491 quest'ultima non è sufficiente si avrà un errore di \errcode{ERANGE}.
4493 Per evitare di dover indovinare la dimensione di un attributo per tentativi si
4494 può eseguire una interrogazione utilizzando un valore nullo per \param{size};
4495 in questo caso non verrà letto nessun dato, ma verrà restituito come valore di
4496 ritorno della funzione chiamata la dimensione totale dell'attributo esteso
4497 richiesto, che si potrà usare come stima per allocare un buffer di dimensioni
4498 sufficienti.\footnote{si parla di stima perché anche se le funzioni
4499 restituiscono la dimensione esatta dell'attributo al momento in cui sono
4500 eseguite, questa potrebbe essere modificata in qualunque momento da un
4501 successivo accesso eseguito da un altro processo.}
4503 Un secondo gruppo di funzioni è quello che consente di impostare il valore di
4504 un attributo esteso, queste sono \funcd{setxattr}, \funcd{lsetxattr} e
4505 \funcd{fsetxattr}, e consentono di operare rispettivamente su un file, su un
4506 link simbolico o specificando un file descriptor; i loro prototipi sono:
4508 \headdecl{sys/types.h}
4509 \headdecl{attr/xattr.h}
4511 \funcdecl{int setxattr(const char *path, const char *name, const void
4512 *value, size\_t size, int flags)}
4514 \funcdecl{int lsetxattr(const char *path, const char *name, const void
4515 *value, size\_t size, int flags)}
4517 \funcdecl{int fsetxattr(int filedes, const char *name, const void *value,
4518 size\_t size, int flags)}
4520 Impostano il valore di un attributo esteso.
4522 \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
4523 errore, nel qual caso \var{errno} assumerà i valori:
4525 \item[\errcode{ENOATTR}] si è usato il flag \const{XATTR\_REPLACE} e
4526 l'attributo richiesto non esiste.
4527 \item[\errcode{EEXIST}] si è usato il flag \const{XATTR\_CREATE} ma
4528 l'attributo esiste già.
4529 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
4530 filesystem o sono disabilitati.
4532 Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
4533 ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
4538 Le tre funzioni prendono come primo argomento un valore adeguato al loro
4539 scopo, usato in maniera del tutto identica a quanto visto in precedenza per le
4540 analoghe che leggono gli attributi estesi. Il secondo argomento \param{name}
4541 deve indicare, anche in questo caso con gli stessi criteri appena visti per le
4542 analoghe \func{getxattr}, \func{lgetxattr} e \func{fgetxattr}, il nome
4543 (completo di suffisso) dell'attributo su cui si vuole operare.
4545 Il valore che verrà assegnato all'attributo dovrà essere preparato nel buffer
4546 puntato da \param{value}, e la sua dimensione totale (in byte) sarà indicata
4547 dall'argomento \param{size}. Infine l'argomento \param{flag} consente di
4548 controllare le modalità di sovrascrittura dell'attributo esteso, esso può
4549 prendere due valori: con \const{XATTR\_REPLACE} si richiede che l'attributo
4550 esista, nel qual caso verrà sovrascritto, altrimenti si avrà errore, mentre
4551 con \const{XATTR\_CREATE} si richiede che l'attributo non esista, nel qual
4552 caso verrà creato, altrimenti si avrà errore ed il valore attuale non sarà
4553 modificato. Utilizzando per \param{flag} un valore nullo l'attributo verrà
4554 modificato se è già presente, o creato se non c'è.
4556 Le funzioni finora illustrate permettono di leggere o scrivere gli attributi
4557 estesi, ma sarebbe altrettanto utile poter vedere quali sono gli attributi
4558 presenti; a questo provvedono le funzioni \funcd{listxattr},
4559 \funcd{llistxattr} e \funcd{flistxattr} i cui prototipi sono:
4561 \headdecl{sys/types.h}
4562 \headdecl{attr/xattr.h}
4564 \funcdecl{ssize\_t listxattr(const char *path, char *list, size\_t size)}
4566 \funcdecl{ssize\_t llistxattr(const char *path, char *list, size\_t size)}
4568 \funcdecl{ssize\_t flistxattr(int filedes, char *list, size\_t size)}
4570 Leggono la lista degli attributi estesi di un file.
4572 \bodydesc{Le funzioni restituiscono un intero positivo che indica la
4573 dimensione della lista in caso di successo, e $-1$ in caso di errore, nel
4574 qual caso \var{errno} assumerà i valori:
4576 \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
4577 non è sufficiente per contenere il risultato.
4578 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
4579 filesystem o sono disabilitati.
4581 Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
4582 ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
4587 Come per le precedenti le tre funzioni leggono gli attributi rispettivamente
4588 di un file, un link simbolico o specificando un file descriptor, da
4589 specificare con il loro primo argomento. Gli altri due argomenti, identici per
4590 tutte e tre, indicano rispettivamente il puntatore \param{list} al buffer dove
4591 deve essere letta la lista e la dimensione \param{size} di quest'ultimo.
4593 La lista viene fornita come sequenza non ordinata dei nomi dei singoli
4594 attributi estesi (sempre comprensivi del prefisso della loro classe) ciascuno
4595 dei quali è terminato da un carattere nullo. I nomi sono inseriti nel buffer
4596 uno di seguito all'altro. Il valore di ritorno della funzione indica la
4597 dimensione totale della lista in byte.
4599 Come per le funzioni di lettura dei singoli attributi se le dimensioni del
4600 buffer non sono sufficienti si avrà un errore, ma è possibile ottenere dal
4601 valore di ritorno della funzione una stima della dimensione totale della lista
4602 usando per \param{size} un valore nullo.
4604 Infine per rimuovere semplicemente un attributo esteso, si ha a disposizione
4605 un ultimo gruppo di funzioni: \funcd{removexattr}, \funcd{lremovexattr} e
4606 \funcd{fremovexattr}; i rispettivi prototipi sono:
4608 \headdecl{sys/types.h}
4609 \headdecl{attr/xattr.h}
4611 \funcdecl{int removexattr(const char *path, const char *name)}
4613 \funcdecl{int lremovexattr(const char *path, const char *name)}
4615 \funcdecl{int fremovexattr(int filedes, const char *name)}
4618 Rimuovono un attributo esteso di un file.
4620 \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
4621 errore, nel qual caso \var{errno} assumerà i valori:
4623 \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
4624 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
4625 filesystem o sono disabilitati.
4627 ed inoltre tutti gli errori di \func{stat}.
4631 Le tre funzioni rimuovono l'attributo esteso indicato dall'argomento
4632 \param{name} rispettivamente di un file, un link simbolico o specificando un
4633 file descriptor, da specificare con il loro primo argomento. Anche in questo
4634 caso l'argomento \param{name} deve essere specificato con le modalità già
4635 illustrate in precedenza per le altre funzioni relative agli attributi estesi.
4637 \itindend{Extended~Attributes}
4640 \subsection{Le \textit{Access Control List}}
4641 \label{sec:file_ACL}
4643 % la documentazione di sistema è nei pacchetti libacl1-dev e acl
4644 % vedi anche http://www.suse.de/~agruen/acl/linux-acls/online/
4646 \itindbeg{Access~Control~List~(ACL)}
4648 Il modello classico dei permessi di Unix, per quanto funzionale ed efficiente,
4649 è comunque piuttosto limitato e per quanto possa aver coperto per lunghi anni
4650 le esigenze più comuni con un meccanismo semplice e potente, non è in grado di
4651 rispondere in maniera adeguata a situazioni che richiedono una gestione
4652 complessa dei permessi di accesso.\footnote{già un requisito come quello di
4653 dare accesso in scrittura ad alcune persone ed in sola lettura ad altre non
4654 si può soddisfare in maniera semplice.}
4656 Per questo motivo erano state progressivamente introdotte nelle varie versioni
4657 di Unix dei meccanismi di gestione dei permessi dei file più flessibili, nella
4658 forma delle cosiddette \textit{Access Control List} (indicate usualmente con
4659 la sigla ACL). Nello sforzo di standardizzare queste funzionalità era stato
4660 creato un gruppo di lavoro il cui scopo era estendere lo standard POSIX 1003
4661 attraverso due nuovi insiemi di specifiche, la POSIX 1003.1e per l'interfaccia
4662 di programmazione e la POSIX 1003.2c per i comandi di shell.
4664 Gli obiettivi erano però forse troppo ambizioni, e nel gennaio del 1998 i
4665 finanziamenti vennero ritirati senza che si fosse arrivati alla definizione di
4666 uno standard, dato però che una parte della documentazione prodotta era di
4667 alta qualità venne deciso di rilasciare al pubblico la diciassettesima bozza
4668 del documento, quella che va sotto il nome di \textit{POSIX 1003.1e Draft 17},
4669 che è divenuta la base sulla quale si definiscono le cosiddette \textit{Posix
4672 A differenza di altri sistemi (ad esempio FreeBSD) nel caso di Linux si è
4673 scelto di realizzare le ACL attraverso l'uso degli
4674 \itindex{Extended~Attributes} \textit{Extended Attributes} (appena trattati in
4675 sez.~\ref{sec:file_xattr}), e fornire tutte le relative funzioni di gestione
4676 tramite una libreria, \texttt{libacl} che nasconde i dettagli implementativi
4677 delle ACL e presenta ai programmi una interfaccia che fa riferimento allo
4678 standard POSIX 1003.1e.
4680 Anche in questo caso le funzioni di questa libreria non fanno parte delle
4681 \acr{glibc} e devono essere installate a parte;\footnote{la versione corrente
4682 della libreria è \texttt{libacl1}, e nel caso si usi Debian la si può
4683 installare con il pacchetto omonimo e con il collegato \texttt{libacl1-dev}
4684 per i file di sviluppo.} pertanto se un programma le utilizza si dovrà
4685 indicare esplicitamente l'uso della libreria \texttt{libacl} invocando il
4686 compilatore con l'opzione \texttt{-lacl}. Si tenga presente inoltre che per
4687 poterle utilizzare le ACL devono essere attivate esplicitamente montando il
4688 filesystem\footnote{che deve supportarle, ma questo è ormai vero per
4689 praticamente tutti i filesystem più comuni, con l'eccezione di NFS per il
4690 quale esiste però un supporto sperimentale.} su cui le si vogliono
4691 utilizzare con l'opzione \texttt{acl} attiva. Dato che si tratta di una
4692 estensione è infatti opportuno utilizzarle soltanto laddove siano necessarie.
4694 Una ACL è composta da un insieme di voci, e ciascuna voce è a sua volta
4695 costituita da un \textsl{tipo}, da un eventuale
4696 \textsl{qualificatore},\footnote{deve essere presente soltanto per le voci di
4697 tipo \const{ACL\_USER} e \const{ACL\_GROUP}.} e da un insieme di permessi.
4698 Ad ogni oggetto sul filesystem si può associare una ACL che ne governa i
4699 permessi di accesso, detta \textit{access ACL}. Inoltre per le directory si
4700 può impostare una ACL aggiuntiva, detta \textit{default ACL}, che serve ad
4701 indicare quale dovrà essere la ACL assegnata di default nella creazione di un
4702 file all'interno della directory stessa. Come avviene per i permessi le ACL
4703 possono essere impostate solo del proprietario del file, o da un processo con
4704 la capability \itindex{capabilities} \const{CAP\_FOWNER}.
4709 \begin{tabular}{|l|p{8cm}|}
4711 \textbf{Tipo} & \textbf{Descrizione} \\
4714 \const{ACL\_USER\_OBJ} & voce che contiene i diritti di accesso del
4715 proprietario del file.\\
4716 \const{ACL\_USER} & voce che contiene i diritti di accesso per
4717 l'utente indicato dal rispettivo
4719 \const{ACL\_GROUP\_OBJ}& voce che contiene i diritti di accesso del
4720 gruppo proprietario del file.\\
4721 \const{ACL\_GROUP} & voce che contiene i diritti di accesso per
4722 il gruppo indicato dal rispettivo
4724 \const{ACL\_MASK} & voce che contiene la maschera dei massimi
4725 permessi di accesso che possono essere garantiti
4726 da voci del tipo \const{ACL\_USER},
4727 \const{ACL\_GROUP} e \const{ACL\_GROUP\_OBJ}.\\
4728 \const{ACL\_OTHER} & voce che contiene i diritti di accesso di chi
4729 non corrisponde a nessuna altra voce dell'ACL.\\
4732 \caption{Le costanti che identificano i tipi delle voci di una ACL.}
4733 \label{tab:acl_tag_types}
4736 L'elenco dei vari tipi di voci presenti in una ACL, con una breve descrizione
4737 del relativo significato, è riportato in tab.~\ref{tab:acl_tag_types}. Tre di
4738 questi tipi, \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e
4739 \const{ACL\_OTHER}, corrispondono direttamente ai tre permessi ordinari dei
4740 file (proprietario, gruppo proprietario e tutti gli altri) e per questo una
4741 ACL valida deve sempre contenere una ed una sola voce per ciascuno di questi
4744 Una ACL può poi contenere un numero arbitrario di voci di tipo
4745 \const{ACL\_USER} e \const{ACL\_GROUP}, ciascuna delle quali indicherà i
4746 permessi assegnati all'utente e al gruppo indicato dal relativo qualificatore;
4747 ovviamente ciascuna di queste voci dovrà fare riferimento ad un utente o ad un
4748 gruppo diverso, e non corrispondenti a quelli proprietari del file. Inoltre se
4749 in una ACL esiste una voce di uno di questi due tipi è obbligatoria anche la
4750 presenza di una ed una sola voce di tipo \const{ACL\_MASK}, che negli altri
4753 Quest'ultimo tipo di voce contiene la maschera dei permessi che possono essere
4754 assegnati tramite voci di tipo \const{ACL\_USER}, \const{ACL\_GROUP} e
4755 \const{ACL\_GROUP\_OBJ}; se in una di queste voci si fosse specificato un
4756 permesso non presente in \const{ACL\_MASK} questo verrebbe ignorato. L'uso di
4757 una ACL di tipo \const{ACL\_MASK} è di particolare utilità quando essa
4758 associata ad una \textit{default ACL} su una directory, in quanto i permessi
4759 così specificati verranno ereditati da tutti i file creati nella stessa
4760 directory. Si ottiene così una sorta di \itindex{umask} \textit{umask}
4761 associata ad un oggetto sul filesystem piuttosto che a un processo.
4763 Dato che le ACL vengono a costituire una estensione dei permessi ordinari, uno
4764 dei problemi che si erano posti nella loro standardizzazione era appunto
4765 quello della corrispondenza fra questi e le ACL. Come accennato i permessi
4766 ordinari vengono mappati le tre voci di tipo \const{ACL\_USER\_OBJ},
4767 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} che devono essere presenti in
4768 qualunque ACL; un cambiamento ad una di queste voci viene automaticamente
4769 riflesso sui permessi ordinari dei file\footnote{per permessi ordinari si
4770 intende quelli mantenuti nell'\textit{inode}, che devono restare dato che un
4771 filesystem può essere montato senza abilitare le ACL.} e viceversa. In
4772 realtà la mappatura è diretta solo per le voci \const{ACL\_USER\_OBJ} e
4773 \const{ACL\_OTHER}, nel caso di \const{ACL\_GROUP\_OBJ} questo vale soltanto
4774 se non è presente una voce di tipo \const{ACL\_MASK}, se invece questa è
4775 presente verranno tolti dai permessi di \const{ACL\_GROUP\_OBJ} tutti quelli
4776 non presenti in \const{ACL\_MASK}.\footnote{questo diverso comportamento a
4777 seconda delle condizioni è stato introdotto dalla standardizzazione
4778 \textit{POSIX 1003.1e Draft 17} per mantenere il comportamento invariato sui
4779 sistemi dotati di ACL per tutte quelle applicazioni che sono conformi
4780 soltanto all'ordinario standard \textit{POSIX 1003.1}.}
4782 Un secondo aspetto dell'incidenza delle ACL sul comportamento del sistema è
4783 quello relativo alla creazione di nuovi file,\footnote{o oggetti sul
4784 filesystem, il comportamento discusso vale per le funzioni \func{open} e
4785 \func{creat} (vedi sez.~\ref{sec:file_open}), \func{mkdir} (vedi
4786 sez.~\ref{sec:file_dir_creat_rem}), \func{mknod} e \func{mkfifo} (vedi
4787 sez.~\ref{sec:file_mknod}).} che come accennato può essere modificato dalla
4788 presenza di una \textit{default ACL} sulla directory che contiene quel file.
4789 Se questa non c'è valgono le regole usuali illustrate in
4790 sez.~\ref{sec:file_perm_management}, per cui essi sono determinati dalla
4791 \itindex{umask} \textit{umask} del processo, e la sola differenza è che i
4792 permessi ordinari da esse risultanti vengono automaticamente rimappati anche
4793 su una ACL di accesso assegnata automaticamente al nuovo file, che contiene
4794 soltanto le tre corrispondenti voci di tipo \const{ACL\_USER\_OBJ},
4795 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER}.
4797 Se invece è presente una ACL di default sulla directory che contiene il nuovo
4798 file questa diventerà automaticamente la sua ACL di accesso, a meno di non
4799 aver indicato, nelle funzioni di creazione che lo consentono, uno specifico
4800 valore per i permessi ordinari;\footnote{tutte le funzioni citate in
4801 precedenza supportano un argomento \var{mode} che indichi un insieme di
4802 permessi iniziale.} in tal caso saranno eliminati dalle voci corrispondenti
4803 nella ACL tutti quelli non presenti in tale indicazione.
4805 Dato che questa è la ragione che ha portato alla loro creazione, la principale
4806 modifica introdotta con la presenza della ACL è quella alle regole del
4807 controllo di accesso ai file illustrate in sez.~\ref{sec:file_perm_overview}.
4808 Come nel caso ordinario per il controllo vengono sempre utilizzati gli
4809 identificatori del gruppo \textit{effective} del processo, ma in presenza di
4810 ACL i passi attraverso i quali viene stabilito se esso ha diritto di accesso
4813 \item Se l'\ids{UID} del processo è nullo l'accesso è sempre garantito senza
4815 \item Se l'\ids{UID} del processo corrisponde al proprietario del file allora:
4817 \item se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
4818 l'accesso è consentito;
4819 \item altrimenti l'accesso è negato.
4821 \item Se l'\ids{UID} del processo corrisponde ad un qualunque qualificatore
4822 presente in una voce \const{ACL\_USER} allora:
4824 \item se la voce \const{ACL\_USER} corrispondente e la voce
4825 \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
4827 \item altrimenti l'accesso è negato.
4829 \item Se è il \ids{GID} del processo o uno dei \ids{GID} supplementari
4830 corrisponde al gruppo proprietario del file allora:
4832 \item se la voce \const{ACL\_GROUP\_OBJ} e una eventuale voce
4833 \const{ACL\_MASK} (se non vi sono voci di tipo \const{ACL\_GROUP} questa
4834 può non essere presente) contengono entrambe il permesso richiesto,
4835 l'accesso è consentito;
4836 \item altrimenti l'accesso è negato.
4838 \item Se è il \ids{GID} del processo o uno dei \ids{GID} supplementari
4839 corrisponde ad un qualunque qualificatore presente in una voce
4840 \const{ACL\_GROUP} allora:
4842 \item se la voce \const{ACL\_GROUP} corrispondente e la voce
4843 \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
4845 \item altrimenti l'accesso è negato.
4847 \item Se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
4848 l'accesso è consentito, altrimenti l'accesso è negato.
4851 I passi di controllo vengono eseguiti esattamente in questa sequenza, e la
4852 decisione viene presa non appena viene trovata una corrispondenza con gli
4853 identificatori del processo. Questo significa che i permessi presenti in una
4854 voce di tipo \const{ACL\_USER} hanno la precedenza sui permessi ordinari
4855 associati al gruppo proprietario del file (vale a dire su
4856 \const{ACL\_GROUP\_OBJ}).
4858 Per la gestione delle ACL lo standard \textit{POSIX 1003.1e Draft 17} ha
4859 previsto delle apposite funzioni ed tutta una serie di tipi di dati
4860 dedicati;\footnote{fino a definire un tipo di dato e delle costanti apposite
4861 per identificare i permessi standard di lettura, scrittura ed esecuzione.}
4862 tutte le operazioni devono essere effettuate attraverso tramite questi tipi di
4863 dati, che incapsulano tutte le informazioni contenute nelle ACL. La prima di
4864 queste funzioni che prendiamo in esame è \funcd{acl\_init}, il cui prototipo
4867 \headdecl{sys/types.h}
4868 \headdecl{sys/acl.h}
4870 \funcdecl{acl\_t acl\_init(int count)}
4872 Inizializza un'area di lavoro per una ACL di \param{count} voci.
4874 \bodydesc{La funzione restituisce un puntatore all'area di lavoro in caso di
4875 successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
4876 assumerà uno dei valori:
4878 \item[\errcode{EINVAL}] il valore di \param{count} è negativo.
4879 \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile.
4884 La funzione alloca ed inizializza un'area di memoria che verrà usata per
4885 mantenere i dati di una ACL contenente fino ad un massimo di \param{count}
4886 voci. La funzione ritorna un valore di tipo \type{acl\_t}, da usare in tutte
4887 le altre funzioni che operano sulla ACL. La funzione si limita alla
4888 allocazione iniziale e non inserisce nessun valore nella ACL che resta vuota.
4889 Si tenga presente che pur essendo \type{acl\_t} un \index{tipo!opaco} tipo
4890 opaco che identifica ``\textsl{l'oggetto}'' ACL, il valore restituito dalla
4891 funzione non è altro che un puntatore all'area di memoria allocata per i dati
4892 richiesti; pertanto in caso di fallimento verrà restituito un puntatore nullo
4893 e si dovrà confrontare il valore di ritorno della funzione con
4894 ``\code{(acl\_t) NULL}''.
4896 Una volta che si siano completate le operazioni sui dati di una ACL la memoria
4897 allocata dovrà essere liberata esplicitamente attraverso una chiamata alla
4898 funzione \funcd{acl\_free}, il cui prototipo è:
4900 \headdecl{sys/types.h}
4901 \headdecl{sys/acl.h}
4903 \funcdecl{int acl\_free(void * obj\_p)}
4905 Disalloca la memoria riservata per i dati di una ACL.
4907 \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ se
4908 \param{obj\_p} non è un puntatore valido, nel qual caso \var{errno}
4909 assumerà il valore \errcode{EINVAL}
4913 Si noti come la funzione richieda come argomento un puntatore di tipo
4914 ``\ctyp{void *}'', essa infatti può essere usata non solo per liberare la
4915 memoria allocata per i dati di una ACL, ma anche per quella usata per creare
4916 le stringhe di descrizione testuale delle ACL o per ottenere i valori dei
4917 qualificatori di una voce; pertanto a seconda dei casi occorrerà eseguire un
4918 \textit{cast} a ``\ctyp{void *}'' del tipo di dato di cui si vuole eseguire la
4919 disallocazione. Si tenga presente poi che oltre a \func{acl\_init} esistono
4920 molte altre funzioni che possono allocare memoria per i dati delle ACL, è
4921 pertanto opportuno tenere traccia di tutte queste funzioni perché alla fine
4922 delle operazioni tutta la memoria allocata dovrà essere liberata con
4925 Una volta che si abbiano a disposizione i dati di una ACL tramite il
4926 riferimento ad oggetto di tipo \type{acl\_t} questi potranno essere copiati
4927 con la funzione \funcd{acl\_dup}, il cui prototipo è:
4929 \headdecl{sys/types.h}
4930 \headdecl{sys/acl.h}
4932 \funcdecl{acl\_t acl\_dup(acl\_t acl)}
4934 Crea una copia della ACL \param{acl}.
4936 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
4937 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
4938 \var{errno} assumerà uno dei valori:
4940 \item[\errcode{EINVAL}] l'argomento \param{acl} non è un puntatore valido
4942 \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile per eseguire
4948 La funzione crea una copia dei dati della ACL indicata tramite l'argomento
4949 \param{acl}, allocando autonomamente tutto spazio necessario alla copia e
4950 restituendo un secondo oggetto di tipo \type{acl\_t} come riferimento a
4951 quest'ultima. Valgono per questo le stesse considerazioni fatte per il valore
4952 di ritorno di \func{acl\_init}, ed in particolare il fatto che occorrerà
4953 prevedere una ulteriore chiamata esplicita a \func{acl\_free} per liberare la
4954 memoria occupata dalla copia.
4956 Se si deve creare una ACL manualmente l'uso di \func{acl\_init} è scomodo,
4957 dato che la funzione restituisce una ACL vuota, una alternativa allora è usare
4958 \funcd{acl\_from\_mode} che consente di creare una ACL a partire da un valore
4959 di permessi ordinari, il prototipo della funzione è:
4961 \headdecl{sys/types.h}
4962 \headdecl{sys/acl.h}
4964 \funcdecl{acl\_t acl\_from\_mode(mode\_t mode)}
4966 Crea una ACL inizializzata con i permessi di \param{mode}.
4968 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
4969 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
4970 \var{errno} assumerà il valore \errval{ENOMEM}.
4975 La funzione restituisce una ACL inizializzata con le tre voci obbligatorie
4976 \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} già
4977 impostate secondo la corrispondenza ai valori dei permessi ordinari indicati
4978 dalla maschera passata nell'argomento \param{mode}. Questa funzione è una
4979 estensione usata dalle ACL di Linux e non è portabile, ma consente di
4980 semplificare l'inizializzazione in maniera molto comoda.
4982 Altre due funzioni che consentono di creare una ACL già inizializzata sono
4983 \funcd{acl\_get\_fd} e \funcd{acl\_get\_file}, che però sono per lo più
4984 utilizzate per leggere la ACL corrente di un file; i rispettivi prototipi
4987 \headdecl{sys/types.h}
4988 \headdecl{sys/acl.h}
4990 \funcdecl{acl\_t acl\_get\_file(const char *path\_p, acl\_type\_t type)}
4991 \funcdecl{acl\_t acl\_get\_fd(int fd)}
4993 Ottiene i dati delle ACL di un file.
4995 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
4996 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
4997 \var{errno} assumerà uno dei valori:
4999 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
5000 \item[\errcode{ENOTSUP}] il filesystem cui fa riferimento il file non
5003 ed inoltre \errval{EBADF} per \func{acl\_get\_fd}, ed \errval{EINVAL} per
5004 valori scorretti di \param{type} e tutti i possibili errori per l'accesso ad
5005 un file per \func{acl\_get\_file}.
5010 Le due funzioni ritornano, con un oggetto di tipo \type{acl\_t}, il valore
5011 della ACL correntemente associata ad un file, che può essere identificato
5012 tramite un file descriptor usando \func{acl\_get\_fd} o con un
5013 \textit{pathname} usando \func{acl\_get\_file}. Nel caso di quest'ultima
5014 funzione, che può richiedere anche la ACL relativa ad una directory, il
5015 secondo argomento \param{type} consente di specificare se si vuole ottenere la
5016 ACL di default o quella di accesso. Questo argomento deve essere di tipo
5017 \type{acl\_type\_t} e può assumere solo i due valori riportati in
5018 tab.~\ref{tab:acl_type}.
5023 \begin{tabular}{|l|l|}
5025 \textbf{Tipo} & \textbf{Descrizione} \\
5028 \const{ACL\_TYPE\_ACCESS} & indica una ACL di accesso.\\
5029 \const{ACL\_TYPE\_DEFAULT}& indica una ACL di default.\\
5032 \caption{Le costanti che identificano il tipo di ACL.}
5033 \label{tab:acl_type}
5036 Si tenga presente che nel caso di \func{acl\_get\_file} occorrerà che il
5037 processo chiamante abbia privilegi di accesso sufficienti a poter leggere gli
5038 attributi estesi dei file (come illustrati in sez.~\ref{sec:file_xattr});
5039 inoltre una ACL di tipo \const{ACL\_TYPE\_DEFAULT} potrà essere richiesta
5040 soltanto per una directory, e verrà restituita solo se presente, altrimenti
5041 verrà restituita una ACL vuota.
5043 Infine si potrà creare una ACL direttamente dalla sua rappresentazione
5044 testuale con la funzione \funcd{acl\_from\_text}, il cui prototipo è:
5046 \headdecl{sys/types.h}
5047 \headdecl{sys/acl.h}
5049 \funcdecl{acl\_t acl\_from\_text(const char *buf\_p)}
5051 Crea una ACL a partire dalla sua rappresentazione testuale.
5053 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
5054 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
5055 \var{errno} assumerà uno dei valori:
5057 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
5058 \item[\errcode{EINVAL}] la rappresentazione testuale all'indirizzo
5059 \param{buf\_p} non è valida.
5065 La funzione prende come argomento il puntatore ad un buffer dove si è inserita
5066 la rappresentazione testuale della ACL che si vuole creare, la memoria
5067 necessaria viene automaticamente allocata ed in caso di successo viene
5068 restituito come valore di ritorno un oggetto di tipo \type{acl\_t} con il
5069 contenuto della stessa, che come per le precedenti funzioni, dovrà essere
5070 disallocato esplicitamente al termine del suo utilizzo.
5072 La rappresentazione testuale di una ACL è quella usata anche dai comandi
5073 ordinari per la gestione delle ACL (\texttt{getfacl} e \texttt{setfacl}), che
5074 prevede due diverse forme, estesa e breve, entrambe supportate da
5075 \func{acl\_from\_text}. La forma estesa prevede che sia specificata una voce
5076 per riga, nella forma:
5078 tipo:qualificatore:permessi
5080 dove il tipo può essere uno fra \texttt{user}, \texttt{group}, \texttt{other}
5081 e \texttt{mask}. Il qualificatore è presente solo per \texttt{user} e
5082 \texttt{group} e indica l'utente o il gruppo a cui la voce si riferisce; i
5083 permessi sono espressi con una tripletta di lettere analoga a quella usata per
5084 i permessi dei file.\footnote{vale a dire \texttt{r} per il permesso di
5085 lettura, \texttt{w} per il permesso di scrittura, \texttt{x} per il permesso
5086 di esecuzione (scritti in quest'ordine) e \texttt{-} per l'assenza del
5089 Va precisato che i due tipi \texttt{user} e \texttt{group} sono usati
5090 rispettivamente per indicare delle voci relative ad utenti e
5091 gruppi,\footnote{cioè per voci di tipo \const{ACL\_USER\_OBJ} e
5092 \const{ACL\_USER} per \texttt{user} e \const{ACL\_GROUP\_OBJ} e
5093 \const{ACL\_GROUP} per \texttt{group}.} applicate sia a quelli proprietari
5094 del file che a quelli generici; quelle dei proprietari si riconoscono per
5095 l'assenza di un qualificatore, ed in genere si scrivono per prima delle altre.
5096 Il significato delle voci di tipo \texttt{mask} e \texttt{mark} è evidente. In
5097 questa forma si possono anche inserire dei commenti precedendoli con il
5098 carattere ``\texttt{\#}''.
5100 La forma breve prevede invece la scrittura delle singole voci su una riga,
5101 separate da virgole; come specificatori del tipo di voce si possono usare le
5102 iniziali dei valori usati nella forma estesa (cioè ``\texttt{u}'',
5103 ``\texttt{g}'', ``\texttt{o}'' e ``\texttt{m}''), mentre le altri parte della
5104 voce sono le stesse. In questo caso non sono consentiti permessi.
5106 Per la conversione inversa, che consente di ottenere la rappresentazione
5107 testuale di una ACL, sono invece disponibili due funzioni, la prima delle due,
5108 di uso più immediato, è \funcd{acl\_to\_text}, il cui prototipo è:
5110 \headdecl{sys/types.h}
5111 \headdecl{sys/acl.h}
5113 \funcdecl{char * acl\_to\_text(acl\_t acl, ssize\_t *len\_p)}
5115 Produce la rappresentazione testuale di una ACL.
5117 \bodydesc{La funzione restituisce il puntatore ad una stringa con la
5118 rappresentazione testuale della ACL in caso di successo e
5119 \code(acl\_t){NULL} in caso di errore, nel qual caso \var{errno} assumerà
5122 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
5123 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
5129 La funzione restituisce il puntatore ad una stringa terminata da NUL
5130 contenente la rappresentazione in forma estesa della ACL passata come
5131 argomento, ed alloca automaticamente la memoria necessaria. Questa dovrà poi
5132 essere liberata, quando non più necessaria, con \func{acl\_free}. Se
5133 nell'argomento \param{len\_p} si passa un valore puntatore ad una variabile
5134 intera in questa verrà restituita la dimensione della stringa con la
5135 rappresentazione testuale (non comprendente il carattere nullo finale).
5137 La seconda funzione, \funcd{acl\_to\_any\_text}, permette di controllare con
5138 dovizia di dettagli la generazione della stringa contenente la
5139 rappresentazione testuale della ACL, il suo prototipo è:
5141 \headdecl{sys/types.h}
5142 \headdecl{sys/acl.h}
5144 \funcdecl{char * acl\_to\_any\_text(acl\_t acl, const char *prefix, char
5145 separator, int options)}
5147 Produce la rappresentazione testuale di una ACL.
5149 \bodydesc{La funzione restituisce il puntatore ad una stringa con la
5150 rappresentazione testuale della ACL in caso di successo e \val{NULL} in
5151 caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
5153 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
5154 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
5160 La funzione converte in formato testo la ACL indicata dall'argomento
5161 \param{acl}, usando il carattere \param{separator} come separatore delle
5162 singole voci; se l'argomento \param{prefix} non è nullo la stringa da esso
5163 indicata viene utilizzata come prefisso per le singole voci.
5165 L'ultimo argomento, \param{options}, consente di controllare la modalità con
5166 cui viene generata la rappresentazione testuale. Un valore nullo fa si che
5167 vengano usati gli identificatori standard \texttt{user}, \texttt{group},
5168 \texttt{other} e \texttt{mask} con i nomi di utenti e gruppi risolti rispetto
5169 ai loro valori numerici. Altrimenti si può specificare un valore in forma di
5170 maschera binaria, da ottenere con un OR aritmetico dei valori riportati in
5171 tab.~\ref{tab:acl_to_text_options}.
5176 \begin{tabular}{|l|p{8cm}|}
5178 \textbf{Tipo} & \textbf{Descrizione} \\
5181 \const{TEXT\_ABBREVIATE} & stampa le voci in forma abbreviata.\\
5182 \const{TEXT\_NUMERIC\_IDS} & non effettua la risoluzione numerica di
5183 \ids{UID} e \ids{GID}.\\
5184 \const{TEXT\_SOME\_EFFECTIVE}& per ciascuna voce che contiene permessi che
5185 vengono eliminati dalla \const{ACL\_MASK}
5186 viene generato un commento con i permessi
5187 effettivamente risultanti; il commento è
5188 separato con un tabulatore.\\
5189 \const{TEXT\_ALL\_EFFECTIVE} & viene generato un commento con i permessi
5190 effettivi per ciascuna voce che contiene
5191 permessi citati nella \const{ACL\_MASK},
5192 anche quando questi non vengono modificati
5193 da essa; il commento è separato con un
5195 \const{TEXT\_SMART\_INDENT} & da usare in combinazione con le precedenti
5196 \const{TEXT\_SOME\_EFFECTIVE} e
5197 \const{TEXT\_ALL\_EFFECTIVE} aumenta
5198 automaticamente il numero di spaziatori
5199 prima degli eventuali commenti in modo da
5200 mantenerli allineati.\\
5203 \caption{Possibili valori per l'argomento \param{options} di
5204 \func{acl\_to\_any\_text}.}
5205 \label{tab:acl_to_text_options}
5208 Come per \func{acl\_to\_text} anche in questo caso il buffer contenente la
5209 rappresentazione testuale dell'ACL, di cui la funzione restituisce
5210 l'indirizzo, viene allocato automaticamente, e dovrà essere esplicitamente
5211 disallocato con una chiamata ad \func{acl\_free}. Si tenga presente infine che
5212 questa funzione è una estensione specifica di Linux, e non è presente nella
5213 bozza dello standard POSIX.1e.
5215 Per quanto utile per la visualizzazione o l'impostazione da comando delle ACL,
5216 la forma testuale non è la più efficiente per poter memorizzare i dati
5217 relativi ad una ACL, ad esempio quando si vuole eseguirne una copia a scopo di
5218 archiviazione. Per questo è stata prevista la possibilità di utilizzare una
5219 rappresentazione delle ACL in una apposita forma binaria contigua e
5220 persistente. È così possibile copiare il valore di una ACL in un buffer e da
5221 questa rappresentazione tornare indietro e generare una ACL.
5223 Lo standard POSIX.1e prevede a tale scopo tre funzioni, la prima e più
5224 semplice è \funcd{acl\_size}, che consente di ottenere la dimensione che avrà
5225 la citata rappresentazione binaria, in modo da poter allocare per essa un
5226 buffer di dimensione sufficiente, il suo prototipo è:
5228 \headdecl{sys/types.h}
5229 \headdecl{sys/acl.h}
5231 \funcdecl{ssize\_t acl\_size(acl\_t acl)}
5233 Determina la dimensione della rappresentazione binaria di una ACL.
5235 \bodydesc{La funzione restituisce in caso di successo la dimensione in byte
5236 della rappresentazione binaria della ACL indicata da \param{acl} e $-1$ in
5237 caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
5239 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
5245 Prima di effettuare la lettura della rappresentazione binaria è sempre
5246 necessario allocare un buffer di dimensione sufficiente a contenerla, pertanto
5247 prima si dovrà far ricorso a \funcd{acl\_size} per ottenere tale dimensione e
5248 poi allocare il buffer con una delle funzioni di
5249 sez.~\ref{sec:proc_mem_alloc}. Una volta terminato l'uso della
5250 rappresentazione binaria, il buffer dovrà essere esplicitamente disallocato.
5252 La funzione che consente di leggere la rappresentazione binaria di una ACL è
5253 \funcd{acl\_copy\_ext}, il cui prototipo è:
5255 \headdecl{sys/types.h}
5256 \headdecl{sys/acl.h}
5258 \funcdecl{ssize\_t acl\_copy\_ext(void *buf\_p, acl\_t acl, ssize\_t size)}
5260 Ottiene la rappresentazione binaria di una ACL.
5262 \bodydesc{La funzione restituisce in caso di successo la dimensione in byte
5263 della rappresentazione binaria della ACL indicata da \param{acl} e $-1$ in
5264 caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
5266 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida o
5267 \param{size} è negativo o nullo.
5268 \item[\errcode{ERANGE}] il valore di \param{size} è più piccolo della
5269 dimensione della rappresentazione della ACL.
5275 La funzione salverà la rappresentazione binaria della ACL indicata da
5276 \param{acl} sul buffer posto all'indirizzo \param{buf\_p} e lungo \param{size}
5277 byte, restituendo la dimensione della stessa come valore di ritorno. Qualora
5278 la dimensione della rappresentazione ecceda il valore di \param{size} la
5279 funzione fallirà con un errore di \errcode{ERANGE}. La funzione non ha nessun
5280 effetto sulla ACL indicata da \param{acl}.
5282 Viceversa se si vuole ripristinare una ACL a partire dalla rappresentazione
5283 binaria della stessa disponibile in un buffer si potrà usare la funzione
5284 \funcd{acl\_copy\_int}, il cui prototipo è:
5286 \headdecl{sys/types.h}
5287 \headdecl{sys/acl.h}
5289 \funcdecl{ssize\_t acl\_copy\_int(const void *buf\_p)}
5291 Ripristina la rappresentazione binaria di una ACL.
5293 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
5294 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
5295 \var{errno} assumerà uno dei valori:
5297 \item[\errcode{EINVAL}] il buffer all'indirizzo \param{buf\_p} non contiene
5298 una rappresentazione corretta di una ACL.
5299 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare un oggetto
5300 \type{acl\_t} per la ACL richiesta.
5306 La funzione in caso di successo alloca autonomamente un oggetto di tipo
5307 \type{acl\_t} che viene restituito come valore di ritorno con il contenuto
5308 della ACL rappresentata dai dati contenuti nel buffer puntato da
5309 \param{buf\_p}. Si ricordi che come per le precedenti funzioni l'oggetto
5310 \type{acl\_t} dovrà essere disallocato esplicitamente al termine del suo
5313 Una volta che si disponga della ACL desiderata, questa potrà essere impostata
5314 su un file o una directory. Per impostare una ACL sono disponibili due
5315 funzioni; la prima è \funcd{acl\_set\_file}, che opera sia su file che su
5316 directory, ed il cui prototipo è:
5318 \headdecl{sys/types.h}
5319 \headdecl{sys/acl.h}
5321 \funcdecl{int acl\_set\_file(const char *path, acl\_type\_t type, acl\_t
5324 Imposta una ACL su un file o una directory.
5326 \bodydesc{La funzione restituisce $0$ in caso di successo e $-1$ in caso di
5327 errore, nel qual caso \var{errno} assumerà uno dei valori:
5329 \item[\errcode{EACCES}] o un generico errore di accesso a \param{path} o il
5330 valore di \param{type} specifica una ACL il cui tipo non può essere
5331 assegnato a \param{path}.
5332 \item[\errcode{EINVAL}] o \param{acl} non è una ACL valida, o \param{type}
5333 ha in valore non corretto.
5334 \item[\errcode{ENOSPC}] non c'è spazio disco sufficiente per contenere i
5335 dati aggiuntivi della ACL.
5336 \item[\errcode{ENOTSUP}] si è cercato di impostare una ACL su un file
5337 contenuto in un filesystem che non supporta le ACL.
5339 ed inoltre \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
5340 \errval{EROFS}, \errval{EPERM}.
5344 La funzione consente di assegnare la ACL contenuta in \param{acl} al file o
5345 alla directory indicate dal \textit{pathname} \param{path}, mentre
5346 con \param{type} si indica il tipo di ACL utilizzando le costanti di
5347 tab.~\ref{tab:acl_type}, ma si tenga presente che le ACL di default possono
5348 essere solo impostate qualora \param{path} indichi una directory. Inoltre
5349 perché la funzione abbia successo la ACL dovrà essere valida, e contenere
5350 tutti le voci necessarie, unica eccezione è quella in cui si specifica una ACL
5351 vuota per cancellare la ACL di default associata a
5352 \param{path}.\footnote{questo però è una estensione della implementazione delle
5353 ACL di Linux, la bozza di standard POSIX.1e prevedeva l'uso della apposita
5354 funzione \funcd{acl\_delete\_def\_file}, che prende come unico argomento il
5355 \textit{pathname} della directory di cui si vuole cancellare l'ACL di
5356 default, per i dettagli si ricorra alla pagina di manuale.} La seconda
5357 funzione che consente di impostare una ACL è \funcd{acl\_set\_fd}, ed il suo
5360 \headdecl{sys/types.h}
5361 \headdecl{sys/acl.h}
5363 \funcdecl{int acl\_set\_fd(int fd, acl\_t acl)}
5365 Imposta una ACL su un file descriptor.
5367 \bodydesc{La funzione restituisce $0$ in caso di successo e $-1$ in caso di
5368 errore, nel qual caso \var{errno} assumerà uno dei valori:
5370 \item[\errcode{EINVAL}] o \param{acl} non è una ACL valida, o \param{type}
5371 ha in valore non corretto.
5372 \item[\errcode{ENOSPC}] non c'è spazio disco sufficiente per contenere i
5373 dati aggiuntivi della ACL.
5374 \item[\errcode{ENOTSUP}] si è cercato di impostare una ACL su un file
5375 contenuto in un filesystem che non supporta le ACL.
5377 ed inoltre \errval{EBADF}, \errval{EROFS}, \errval{EPERM}.
5381 La funzione è del tutto è analoga a \funcd{acl\_set\_file} ma opera
5382 esclusivamente sui file identificati tramite un file descriptor. Non dovendo
5383 avere a che fare con directory (e con la conseguente possibilità di avere una
5384 ACL di default) la funzione non necessita che si specifichi il tipo di ACL,
5385 che sarà sempre di accesso, e prende come unico argomento, a parte il file
5386 descriptor, la ACL da impostare.
5388 Le funzioni viste finora operano a livello di una intera ACL, eseguendo in una
5389 sola volta tutte le operazioni relative a tutte le voci in essa contenuta. In
5390 generale è possibile modificare un singolo valore all'interno di una singola
5391 voce direttamente con le funzioni previste dallo standard POSIX.1e. Queste
5392 funzioni però sono alquanto macchinose da utilizzare per cui è molto più
5393 semplice operare direttamente sulla rappresentazione testuale. Questo è il
5394 motivo per non tratteremo nei dettagli dette funzioni, fornendone solo una
5395 descrizione sommaria; chi fosse interessato potrà ricorrere alle pagina di
5398 Se si vuole operare direttamente sui contenuti di un oggetto di tipo
5399 \type{acl\_t} infatti occorre fare riferimento alle singole voci tramite gli
5400 opportuni puntatori di tipo \type{acl\_entry\_t}, che possono essere ottenuti
5401 dalla funzione \funcd{acl\_get\_entry} (per una voce esistente) o dalla
5402 funzione \funcd{acl\_create\_entry} per una voce da aggiungere. Nel caso della
5403 prima funzione si potrà poi ripetere la lettura per ottenere i puntatori alle
5404 singole voci successive alla prima.
5406 Una volta ottenuti detti puntatori si potrà operare sui contenuti delle singole
5407 voci; con le funzioni \funcd{acl\_get\_tag\_type}, \funcd{acl\_get\_qualifier},
5408 \funcd{acl\_get\_permset} si potranno leggere rispettivamente tipo,
5409 qualificatore e permessi mentre con le corrispondente funzioni
5410 \funcd{acl\_set\_tag\_type}, \funcd{acl\_set\_qualifier},
5411 \funcd{acl\_set\_permset} si possono impostare i valori; in entrambi i casi
5412 vengono utilizzati tipi di dato ad hoc.\footnote{descritti nelle singole
5413 pagine di manuale.} Si possono poi copiare i valori di una voce da una ACL
5414 ad un altra con \funcd{acl\_copy\_entry} o eliminare una voce da una ACL con
5415 \funcd{acl\_delete\_entry}.
5417 \itindend{Access~Control~List~(ACL)}
5420 \subsection{La gestione delle quote disco}
5421 \label{sec:disk_quota}
5423 Quella delle quote disco è una funzionalità introdotta inizialmente da BSD, e
5424 presente in Linux fino dai kernel dalla serie 2.0, che consente di porre dei
5425 tetti massimi al consumo delle risorse di un filesystem (spazio disco e
5426 \textit{inode}) da parte di utenti e gruppi. Dato che la funzionalità ha senso
5427 solo per i filesystem su cui si mantengono i dati degli utenti\footnote{in
5428 genere la si attiva sul filesystem che contiene le \textit{home} degli
5429 utenti, dato che non avrebbe senso per i file di sistema che in genere
5430 appartengono all'amministratore.} essa deve essere esplicitamente richiesta;
5431 questo si fa tramite due distinte opzioni di montaggio, \texttt{usrquota} e
5432 \texttt{grpquota} che abilitano le quote rispettivamente per gli utenti e per
5433 i gruppi. Grazie a questo è possibile usare le limitazioni sulle quote solo
5434 sugli utenti o solo sui gruppi.
5436 Il meccanismo prevede che per ciascun filesystem che supporta le quote disco
5437 (i vari \textit{extN}, \textit{btrfs}, \textit{XFS}, \textit{JFS},
5438 \textit{ReiserFS}) il kernel provveda sia a mantenere aggiornati i dati
5439 relativi al consumo delle risorse da parte di utenti e/o gruppi che a far
5440 rispettare i limiti imposti dal sistema, con la generazione di un errore di
5441 \errval{EDQUOT} per tutte le operazioni sui file che porterebbero ad un
5442 superamento degli stessi. Si tenga presente che questi due compiti sono
5443 separati, il primo si attiva al montaggio del filesystem con le quote
5444 attivate, il secondo deve essere abilitato esplicitamente.
5446 Per il mantenimento dei dati di consumo delle risorse vengono usati due file
5447 riservati (uno per le quote utente e l'altro per le quote gruppo) nella
5448 directory radice del filesystem su cui si sono attivate le quote;\footnote{la
5449 cosa vale per tutti i filesystem tranne \textit{XFS} che mantiene i dati
5450 internamente.} con la versione 2 del supporto delle quote, l'unica rimasta
5451 in uso, questi file sono \texttt{aquota.user} e \texttt{aquota.group}, in
5452 precedenza erano \texttt{quota.user} e \texttt{quota.group}. Dato che i file
5453 vengono aggiornati soltanto se il filesystem è stato montato con il supporto
5454 delle quote, se si abilita questo in un secondo tempo (o se si eseguono
5455 operazioni sul filesystem senza averlo abilitato) i dati contenuti possono non
5456 corrispondere esattamente allo stato corrente del consumo delle risorse; per
5457 questo in genere prima di montare in scrittura un filesystem su cui sono
5458 abilitate le quote in genere viene utilizzato il comando \cmd{quotacheck} per
5459 verificare e aggiornare i dati.
5461 Le restrizioni sul consumo delle risorse prevedono due limiti, il primo viene
5462 detto \textit{soft limit} e può essere superato per brevi periodi di tempo, il
5463 secondo viene detto \textit{hard limit} non può mai essere superato. Il
5464 periodo di tempo per cui è possibile superare il \textit{soft limit} è detto
5465 ``\textsl{periodo di grazia}'' (\textit{grace period}), passato questo tempo
5466 il passaggio del \textit{soft limit} viene trattato allo stesso modo
5467 dell'\textit{hard limit}. Questi limiti riguardano separatamente sia lo
5468 spazio disco (i blocchi) che il numero di file (gli \textit{inode}) e devono
5469 pertanto essere specificati per entrambe le risorse.
5471 La funzione che consente di controllare tutti i vari aspetti della gestione
5472 delle quote è \funcd{quotactl}, ed il suo prototipo è:
5474 \headdecl{sys/types.h}
5475 \headdecl{sys/quota.h}
5477 \funcdecl{quotactl(int cmd, const char *dev, int id, caddr\_t addr)}
5479 Esegue una operazione di controllo sulle quote disco.
5481 \bodydesc{La funzione restituisce $0$ in caso di successo e $-1$ in caso di
5482 errore, nel qual caso \var{errno} assumerà uno dei valori:
5484 \item[\errcode{EACCES}] il file delle quote non è un file ordinario.
5485 \item[\errcode{EBUSY}] si è richiesto \const{Q\_QUOTAON} ma le quote sono
5487 \item[\errcode{EFAULT}] l'indirizzo \param{addr} non è valido.
5488 \item[\errcode{EIO}] errore di lettura/scrittura sul file delle quote.
5489 \item[\errcode{EMFILE}] non si può aprire il file delle quote avendo
5490 superato il limite sul numero di file aperti nel sistema.
5491 \item[\errcode{EINVAL}] o \param{cmd} non è un comando valido,
5492 o il dispositivo \param{dev} non esiste.
5493 \item[\errcode{ENODEV}] \param{dev} non corrisponde ad un \textit{mount
5495 \item[\errcode{ENOPKG}] il kernel è stato compilato senza supporto per le
5497 \item[\errcode{ENOTBLK}] \param{dev} non è un dispositivo a blocchi.
5498 \item[\errcode{EPERM}] non si hanno i permessi per l'operazione richiesta.
5499 \item[\errcode{ESRCH}] è stato richiesto uno fra \const{Q\_GETQUOTA},
5500 \const{Q\_SETQUOTA}, \const{Q\_SETUSE}, \const{Q\_SETQLIM} per un
5501 filesystem senza quote attivate.
5506 La funzione richiede che il filesystem sul quale si vuole operare sia montato
5507 con il supporto delle quote abilitato; esso deve essere specificato con il
5508 nome del file di dispositivo nell'argomento \param{dev}. Per le operazioni che
5509 lo richiedono inoltre si dovrà indicare con l'argomento \param{id} l'utente o
5510 il gruppo (specificati rispettivamente per \ids{UID} e \ids{GID}) su cui si
5511 vuole operare. Alcune operazioni usano l'argomento \param{addr} per indicare
5512 un indirizzo ad un area di memoria il cui utilizzo dipende dall'operazione
5515 Il tipo di operazione che si intende effettuare deve essere indicato tramite
5516 il primo argomento \param{cmd}, questo in genere viene specificato con
5517 l'ausilio della macro \macro{QCMD}:
5519 \funcdecl{int QCMD(subcmd,type)} Imposta il comando \param{subcmd} per il
5520 tipo di quote (utente o gruppo) \param{type}.
5522 \noindent che consente di specificare, oltre al tipo di operazione, se questa
5523 deve applicarsi alle quote utente o alle quote gruppo, nel qual
5524 caso \param{type} deve essere rispettivamente \const{USRQUOTA} o
5531 \begin{tabular}{|l|p{10cm}|}
5533 \textbf{Comando} & \textbf{Descrizione} \\
5536 \const{Q\_QUOTAON} & Attiva l'applicazione delle quote disco per il
5537 filesystem indicato da \param{dev}, si deve passare
5538 in \param{addr} il \textit{pathname} al file che
5539 mantiene le quote, che deve esistere, e \param{id}
5540 deve indicare la versione del formato con uno dei
5541 valori di tab.~\ref{tab:quotactl_id_format};
5542 l'operazione richiede i privilegi di
5544 \const{Q\_QUOTAOFF} & Disattiva l'applicazione delle quote disco per il
5545 filesystem indicato da \param{dev}, \param{id}
5546 e \param{addr} vengono ignorati; l'operazione
5547 richiede i privilegi di amministratore.\\
5548 \const{Q\_GETQUOTA} & Legge i limiti ed i valori correnti delle quote nel
5549 filesystem indicato da \param{dev} per l'utente o
5550 il gruppo specificato da \param{id}; si devono avere
5551 i privilegi di amministratore per leggere i dati
5552 relativi ad altri utenti o a gruppi di cui non si fa
5553 parte, il risultato viene restituito in una struttura
5554 \struct{dqblk} all'indirizzo indicato
5556 \const{Q\_SETQUOTA} & Imposta i limiti per le quote nel filesystem
5557 indicato da \param{dev} per l'utente o il gruppo
5558 specificato da \param{id} secondo i valori ottenuti
5559 dalla struttura \struct{dqblk} puntata
5560 da \param{addr}; l'operazione richiede i privilegi
5561 di amministratore.\\
5562 \const{Q\_GETINFO} & Legge le informazioni (in sostanza i \textit{grace
5563 time}) delle quote del filesystem indicato
5564 da \param{dev} sulla struttura \struct{dqinfo}
5565 puntata da \param{addr}, \param{id} viene ignorato.\\
5566 \const{Q\_SETINFO} & Imposta le informazioni delle quote del filesystem
5567 indicato da \param{dev} come ottenuti dalla
5568 struttura \struct{dqinfo} puntata
5569 da \param{addr}, \param{id} viene ignorato;
5570 l'operazione richiede i privilegi di amministratore.\\
5571 \const{Q\_GETFMT} & Richiede il valore identificativo (quello di
5572 tab.~\ref{tab:quotactl_id_format}) per il formato
5573 delle quote attualmente in uso sul filesystem
5574 indicato da \param{dev}, che sarà memorizzato
5575 sul buffer di 4 byte puntato da \param{addr}.\\
5576 \const{Q\_SYNC} & Aggiorna la copia su disco dei dati delle quote del
5577 filesystem indicato da \param{dev}; in questo
5578 caso \param{dev} può anche essere \val{NULL} nel
5579 qual caso verranno aggiornati i dati per tutti i
5580 filesystem con quote attive, \param{id}
5581 e \param{addr} vengono comunque ignorati.\\
5582 \const{Q\_GETSTATS} & Ottiene statistiche ed altre informazioni generali
5583 relative al sistema delle quote per il filesystem
5584 indicato da \param{dev}, richiede che si
5585 passi come argomento \param{addr} l'indirizzo di una
5586 struttura \struct{dqstats}, mentre i valori
5587 di \param{id} e \param{dev} vengono ignorati;
5588 l'operazione è obsoleta e non supportata nei kernel
5589 più recenti, che espongono la stessa informazione
5590 nei file sotto \procfile{/proc/self/fs/quota/}.\\
5594 \caption{Possibili valori per l'argomento \param{subcmd} di
5596 \label{tab:quotactl_commands}
5600 Le diverse operazioni supportate da \func{quotactl}, da indicare con
5601 l'argomento \param{subcmd} di \macro{QCMD}, sono riportate in
5602 tab.~\ref{tab:quotactl_commands}. In generale le operazione di attivazione,
5603 disattivazione e di modifica dei limiti delle quote sono riservate e
5604 richiedono i privilegi di amministratore.\footnote{per essere precisi tutte le
5605 operazioni indicate come privilegiate in tab.~\ref{tab:quotactl_commands}
5606 richiedono la \textit{capability} \const{CAP\_SYS\_ADMIN}.} Inoltre gli
5607 utenti possono soltanto richiedere i dati relativi alle proprie quote, solo
5608 l'amministratore può ottenere i dati di tutti.
5613 \begin{tabular}{|l|p{10cm}|}
5615 \textbf{Identificatore} & \textbf{Descrizione} \\
5618 \const{QFMT\_VFS\_OLD}& il vecchio (ed obsoleto) formato delle quote.\\
5619 \const{QFMT\_VFS\_V0} & la versione 0 usata dal VFS di Linux (supporta
5620 \ids{UID} e \ids{GID} a 32 bit e limiti fino a
5621 $2^{42}$ byte e $2^{32}$ file.\\
5622 \const{QFMT\_VFS\_V1} & la versione 1 usata dal VFS di Linux (supporta
5623 \ids{UID} e \ids{GID} a 32 bit e limiti fino a
5624 $2^{64}$ byte e $2^{64}$ file.\\
5627 \caption{Valori di identificazione del formato delle quote.}
5628 \label{tab:quotactl_id_format}
5631 Alcuni dei comandi di tab.~\ref{tab:quotactl_commands} sono alquanto complessi
5632 e richiedono un approfondimento maggiore, in particolare \const{Q\_GETQUOTA} e
5633 \const{Q\_SETQUOTA} fanno riferimento ad una specifica struttura
5634 \struct{dqblk}, la cui definizione è riportata in
5635 fig.~\ref{fig:dqblk_struct},\footnote{la definizione mostrata è quella usata
5636 fino dal kernel 2.4.22, non prenderemo in considerazione le versioni
5637 obsolete.} nella quale vengono inseriti i dati relativi alle quote di un
5640 \begin{figure}[!htb]
5641 \footnotesize \centering
5642 \begin{minipage}[c]{\textwidth}
5643 \includestruct{listati/dqblk.h}
5646 \caption{La struttura \structd{dqblk} per i dati delle quote disco.}
5647 \label{fig:dqblk_struct}
5650 La struttura viene usata sia con \const{Q\_GETQUOTA} per ottenere i valori
5651 correnti dei limiti e dell'occupazione delle risorse, che con
5652 \const{Q\_SETQUOTA} per effettuare modifiche ai limiti; come si può notare ci
5653 sono alcuni campi (in sostanza \val{dqb\_curspace}, \val{dqb\_curinodes},
5654 \val{dqb\_btime}, \val{dqb\_itime}) che hanno senso solo in lettura in quanto
5655 riportano uno stato non modificabile da \func{quotactl}, come l'uso corrente
5656 di spazio e \textit{inode} o il tempo che resta nel caso si sia superato un
5657 \textit{soft limit}.
5662 \begin{tabular}{|l|p{10cm}|}
5664 \textbf{Costante} & \textbf{Descrizione} \\
5667 \const{QIF\_BLIMITS}& Limiti sui blocchi di
5668 spazio disco (\val{dqb\_bhardlimit} e
5669 \val{dqb\_bsoftlimit}).\\
5670 \const{QIF\_SPACE} & Uso corrente
5671 dello spazio disco (\val{dqb\_curspace}).\\
5672 \const{QIF\_ILIMITS}& Limiti sugli \textit{inode}
5673 (\val{dqb\_ihardlimit} e \val{dqb\_isoftlimit}).\\
5674 \const{QIF\_INODES} & Uso corrente
5675 degli \textit{inode} (\val{dqb\_curinodes}).\\
5676 \const{QIF\_BTIME} & Tempo di
5677 sforamento del \textit{soft limit} sul numero di
5678 blocchi (\val{dqb\_btime}).\\
5679 \const{QIF\_ITIME} & Tempo di
5680 sforamento del \textit{soft limit} sul numero di
5681 \textit{inode} (\val{dqb\_itime}).\\
5682 \const{QIF\_LIMITS} & L'insieme di \const{QIF\_BLIMITS} e
5683 \const{QIF\_ILIMITS}.\\
5684 \const{QIF\_USAGE} & L'insieme di \const{QIF\_SPACE} e
5685 \const{QIF\_INODES}.\\
5686 \const{QIF\_TIMES} & L'insieme di \const{QIF\_BTIME} e
5687 \const{QIF\_ITIME}.\\
5688 \const{QIF\_ALL} & Tutti i precedenti.\\
5691 \caption{Costanti per il campo \val{dqb\_valid} di \struct{dqblk}.}
5692 \label{tab:quotactl_qif_const}
5696 Inoltre in caso di modifica di un limite si può voler operare solo su una
5697 delle risorse (blocchi o \textit{inode});\footnote{non è possibile modificare
5698 soltanto uno dei limiti (\textit{hard} o \textit{soft}) occorre sempre
5699 rispecificarli entrambi.} per questo la struttura prevede un campo apposito,
5700 \val{dqb\_valid}, il cui scopo è quello di indicare quali sono gli altri campi
5701 che devono essere considerati validi. Questo campo è una maschera binaria che
5702 deve essere espressa nei termini di OR aritmetico delle apposite costanti di
5703 tab.~\ref{tab:quotactl_qif_const}, dove si è riportato il significato di
5704 ciascuna di esse ed i campi a cui fanno riferimento.
5706 In lettura con \const{Q\_SETQUOTA} eventuali valori presenti in \struct{dqblk}
5707 vengono comunque ignorati, al momento la funzione sovrascrive tutti i campi e
5708 li marca come validi in \val{dqb\_valid}. Si possono invece usare
5709 \const{QIF\_BLIMITS} o \const{QIF\_ILIMITS} per richiedere di impostare solo
5710 la rispettiva tipologia di limiti con \const{Q\_SETQUOTA}. Si tenga presente
5711 che il sistema delle quote richiede che l'occupazione di spazio disco sia
5712 indicata in termini di blocchi e non di byte; dato che questo dipende da come
5713 si è creato il filesystem potrà essere necessario effettuare qualche
5714 controllo.\footnote{in genere viene usato un default di 1024 byte per blocco,
5715 ma quando si hanno file di dimensioni medie maggiori può convenire usare
5716 valori più alti per ottenere prestazioni migliori in conseguenza di un
5717 minore frazionamento dei dati e di indici più corti.}
5719 Altre due operazioni che necessitano di un approfondimento sono
5720 \const{Q\_GETINFO} e \const{Q\_SETINFO}, che sostanzialmente consentono di
5721 ottenere i dati relativi alle impostazioni delle altre proprietà delle quote,
5722 che si riducono poi alla durata del \textit{grace time} per i due tipi di
5723 limiti. In questo caso queste si proprietà generali sono identiche per tutti
5724 gli utenti, per cui viene usata una operazione distinta dalle
5725 precedenti. Anche in questo caso le due operazioni richiedono l'uso di una
5726 apposita struttura \struct{dqinfo}, la cui definizione è riportata in
5727 fig.~\ref{fig:dqinfo_struct}.
5729 \begin{figure}[!htb]
5730 \footnotesize \centering
5731 \begin{minipage}[c]{\textwidth}
5732 \includestruct{listati/dqinfo.h}
5735 \caption{La struttura \structd{dqinfo} per i dati delle quote disco.}
5736 \label{fig:dqinfo_struct}
5739 Come per \struct{dqblk} anche in questo caso viene usato un campo della
5740 struttura, \val{dqi\_valid} come maschera binaria per dichiarare quale degli
5741 altri campi sono validi; le costanti usate per comporre questo valore sono
5742 riportate in tab.~\ref{tab:quotactl_iif_const} dove si è riportato il
5743 significato di ciascuna di esse ed i campi a cui fanno riferimento.
5748 \begin{tabular}{|l|l|}
5750 \textbf{Costante} & \textbf{Descrizione} \\
5753 \const{IIF\_BGRACE}& Il \textit{grace period} per i blocchi
5754 (\val{dqi\_bgrace}).\\
5755 \const{IIF\_IGRACE}& Il \textit{grace period} per gli \textit{inode}
5756 (\val{dqi\_igrace}).\\
5757 \const{IIF\_FLAGS} & I flag delle quote (\val{dqi\_flags}) (inusato ?).\\
5758 \const{IIF\_ALL} & Tutti i precedenti.\\
5761 \caption{Costanti per il campo \val{dqi\_valid} di \struct{dqinfo}.}
5762 \label{tab:quotactl_iif_const}
5765 Come in precedenza con \const{Q\_GETINFO} tutti i valori vengono letti
5766 sovrascrivendo il contenuto di \struct{dqinfo} e marcati come validi in
5767 \val{dqi\_valid}. In scrittura con \const{Q\_SETINFO} si può scegliere quali
5768 impostare, si tenga presente che i tempi dei campi \val{dqi\_bgrace} e
5769 \val{dqi\_igrace} devono essere specificati in secondi.
5771 Come esempi dell'uso di \func{quotactl} utilizzeremo estratti del codice di un
5772 modulo Python usato per fornire una interfaccia diretta a \func{quotactl}
5773 senza dover passare dalla scansione dei risultati di un comando. Il modulo si
5774 trova fra i pacchetti Debian messi a disposizione da Truelite Srl,
5775 all'indirizzo \url{http://labs.truelite.it/projects/packages}.\footnote{in
5776 particolare il codice C del modulo è nel file \texttt{quotamodule.c}
5777 visionabile a partire dall'indirizzo indicato nella sezione
5778 \textit{Repository}.}
5780 \begin{figure}[!htbp]
5781 \footnotesize \centering
5782 \begin{minipage}[c]{\codesamplewidth}
5783 \includecodesample{listati/get_quota.c}
5785 \caption{Esempio di codice per ottenere i dati delle quote.}
5786 \label{fig:get_quota}
5789 Il primo esempio, riportato in fig.~\ref{fig:get_quota}, riporta il codice
5790 della funzione che consente di leggere le quote. La funzione fa uso
5791 dell'interfaccia dal C verso Python, che definisce i vari simboli \texttt{Py*}
5792 (tipi di dato e funzioni). Non staremo ad approfondire i dettagli di questa
5793 interfaccia, per la quale esistono numerose trattazioni dettagliate, ci
5794 interessa solo esaminare l'uso di \func{quotactl}.
5796 In questo caso la funzione prende come argomenti (\texttt{\small 1}) l'intero
5797 \texttt{who} che indica se si vuole operare sulle quote utente o gruppo,
5798 l'identificatore \texttt{id} dell'utente o del gruppo scelto, ed il nome del
5799 file di dispositivo del filesystem su cui si sono attivate le
5800 quote.\footnote{questi vengono passati come argomenti dalle funzioni mappate
5801 come interfaccia pubblica del modulo (una per gruppi ed una per gli utenti)
5802 che si incaricano di decodificare i dati passati da una chiamata nel codice
5803 Python.} Questi argomenti vengono passati direttamente alla chiamata a
5804 \func{quotactl} (\texttt{\small 5}), a parte \texttt{who} che viene abbinato
5805 con \macro{QCMD} al comando \const{Q\_GETQUOTA} per ottenere i dati.
5807 La funzione viene eseguita all'interno di un condizionale (\texttt{\small
5808 5--16}) che in caso di successo provvede a costruire (\texttt{\small 6--12})
5809 opportunamente una risposta restituendo tramite la opportuna funzione di
5810 interfaccia un oggetto Python contenente i dati della struttura \struct{dqblk}
5811 relativi a uso corrente e limiti sia per i blocchi che per gli
5812 \textit{inode}. In caso di errore (\texttt{\small 13--15}) si usa un'altra
5813 funzione dell'interfaccia per passare il valore di \var{errno} come eccezione.
5815 \begin{figure}[!htbp]
5816 \footnotesize \centering
5817 \begin{minipage}[c]{\codesamplewidth}
5818 \includecodesample{listati/set_block_quota.c}
5820 \caption{Esempio di codice per impostare i limiti sullo spazio disco.}
5821 \label{fig:set_block_quota}
5824 Per impostare i limiti sullo spazio disco si potrà usare una seconda funzione,
5825 riportata in fig.~\ref{fig:set_block_quota}, che prende gli stessi argomenti
5826 della precedente, con lo stesso significato, a cui si aggiungono i valori per
5827 il \textit{soft limit} e l'\textit{hard limit}. In questo caso occorrerà,
5828 prima di chiamare \func{quotactl}, inizializzare opportunamente
5829 (\texttt{\small 5--7}) i campi della struttura \struct{dqblk} che si vogliono
5830 utilizzare (quelli relativi ai limiti sui blocchi) e specificare gli stessi
5831 con \const{QIF\_BLIMITS} in \var{dq.dqb\_valid}.
5833 Fatto questo la chiamata a \func{quotactl}, stavolta con il comando
5834 \const{Q\_SETQUOTA}, viene eseguita come in precedenza all'interno di un
5835 condizionale (\texttt{\small 9--14}). In questo caso non essendovi da
5836 restituire nessun dato in caso di successo si usa (\texttt{\small 10}) una
5837 apposita funzione di uscita, mentre si restituisce come prima una eccezione
5838 con il valore di \var{errno} in caso di errore (\texttt{\small 12--13}).
5841 \subsection{La gestione delle \textit{capabilities}}
5842 \label{sec:proc_capabilities}
5844 \itindbeg{capabilities}
5846 Come accennato in sez.~\ref{sec:proc_access_id} l'architettura classica della
5847 gestione dei privilegi in un sistema unix-like ha il sostanziale problema di
5848 fornire all'amministratore dei poteri troppo ampi, questo comporta che anche
5849 quando si siano predisposte delle misure di protezione per in essere in grado
5850 di difendersi dagli effetti di una eventuale compromissione del
5851 sistema,\footnote{come montare un filesystem in sola lettura per impedirne
5852 modifiche, o marcare un file come immutabile.} una volta che questa sia
5853 stata effettuata e si siano ottenuti i privilegi di amministratore, queste
5854 potranno essere comunque rimosse.\footnote{nei casi elencati nella precedente
5855 nota si potrà sempre rimontare il sistema in lettura-scrittura, o togliere
5856 la marcatura di immutabilità.}
5858 Il problema consiste nel fatto che nell'architettura tradizionale di un
5859 sistema unix-like i controlli di accesso sono basati su un solo livello di
5860 separazione: per i processi normali essi sono posti in atto, mentre per i
5861 processi con i privilegi di amministratore essi non vengono neppure eseguiti;
5862 per questo motivo non era previsto alcun modo per evitare che un processo con
5863 diritti di amministratore non potesse eseguire certe operazioni, o per cedere
5864 definitivamente alcuni privilegi da un certo momento in poi.
5866 Per ovviare a tutto ciò, a partire dai kernel della serie 2.2, è stato
5867 introdotto un meccanismo, detto \textit{capabilities}, che consentisse di
5868 suddividere i vari privilegi tradizionalmente associati all'amministratore in
5869 un insieme di \textsl{capacità} distinte. L'idea era che queste capacità
5870 potessero essere abilitate e disabilitate in maniera indipendente per ciascun
5871 processo con privilegi di amministratore, permettendo così una granularità
5872 molto più fine nella distribuzione degli stessi che evitasse la originaria
5873 situazione di ``\textsl{tutto o nulla}''.
5875 Il meccanismo completo delle \textit{capabilities}\footnote{l'implementazione
5876 si rifà ad una bozza di quello che doveva diventare lo standard POSIX.1e,
5877 poi abbandonato.} prevede inoltre la possibilità di associare le stesse ai
5878 singoli file eseguibili, in modo da poter stabilire quali capacità possono
5879 essere utilizzate quando viene messo in esecuzione uno specifico programma; ma
5880 il supporto per questa funzionalità, chiamata \textit{file capabilities}, è
5881 stato introdotto soltanto a partire dal kernel 2.6.24. Fino ad allora doveva
5882 essere il programma stesso ad eseguire una riduzione esplicita delle sue
5883 capacità, cosa che ha reso l'uso di questa funzionalità poco diffuso, vista la
5884 presenza di meccanismi alternativi per ottenere limitazioni delle capacità
5885 dell'amministratore a livello di sistema operativo, come \index{SELinux}
5888 Con questo supporto e con le ulteriori modifiche introdotte con il kernel
5889 2.6.25 il meccanismo delle \textit{capabilities} è stato totalmente
5890 rivoluzionato, rendendolo più aderente alle intenzioni originali dello
5891 standard POSIX, rimuovendo il significato che fino ad allora aveva avuto la
5892 capacità \const{CAP\_SETPCAP} e cambiando le modalità di funzionamento del
5893 cosiddetto \itindex{capabilities~bounding~set} \textit{capabilities bounding
5894 set}. Ulteriori modifiche sono state apportate con il kernel 2.6.26 per
5895 consentire la rimozione non ripristinabile dei privilegi di
5896 amministratore. Questo fa sì che il significato ed il comportamento del kernel
5897 finisca per dipendere dalla versione dello stesso e dal fatto che le nuove
5898 \textit{file capabilities} siano abilitate o meno. Per capire meglio la
5899 situazione e cosa è cambiato conviene allora spiegare con maggiori dettagli
5900 come funziona il meccanismo delle \textit{capabilities}.
5902 Il primo passo per frazionare i privilegi garantiti all'amministratore,
5903 supportato fin dalla introduzione iniziale del kernel 2.2, è stato quello in
5904 cui a ciascun processo sono stati associati tre distinti insiemi di
5905 \textit{capabilities}, denominati rispettivamente \textit{permitted},
5906 \textit{inheritable} ed \textit{effective}. Questi insiemi vengono mantenuti
5907 in forma di tre diverse maschere binarie,\footnote{il kernel li mantiene, come
5908 i vari identificatori di sez.~\ref{sec:proc_setuid}, all'interno della
5909 \struct{task\_struct} di ciascun processo (vedi
5910 fig.~\ref{fig:proc_task_struct}), nei tre campi \texttt{cap\_effective},
5911 \texttt{cap\_inheritable}, \texttt{cap\_permitted} del tipo
5912 \texttt{kernel\_cap\_t}; questo era, fino al kernel 2.6.25 definito come
5913 intero a 32 bit per un massimo di 32 \textit{capabilities} distinte,
5914 attualmente è stato aggiornato ad un vettore in grado di mantenerne fino a
5915 64.} in cui ciascun bit corrisponde ad una capacità diversa.
5917 L'utilizzo di tre distinti insiemi serve a fornire una interfaccia flessibile
5918 per l'uso delle \textit{capabilities}, con scopi analoghi a quelli per cui
5919 sono mantenuti i diversi insiemi di identificatori di
5920 sez.~\ref{sec:proc_setuid}; il loro significato, che è rimasto sostanzialmente
5921 lo stesso anche dopo le modifiche seguite alla introduzione delle
5922 \textit{file capabilities} è il seguente:
5923 \begin{basedescript}{\desclabelwidth{2.1cm}\desclabelstyle{\nextlinelabel}}
5924 \item[\textit{permitted}] l'insieme delle \textit{capabilities}
5925 ``\textsl{permesse}'', cioè l'insieme di quelle capacità che un processo
5926 \textsl{può} impostare come \textsl{effettive} o come
5927 \textsl{ereditabili}. Se un processo cancella una capacità da questo insieme
5928 non potrà più riassumerla.\footnote{questo nei casi ordinari, sono
5929 previste però una serie di eccezioni, dipendenti anche dal tipo di
5930 supporto, che vedremo meglio in seguito dato il notevole intreccio nella
5932 \item[\textit{inheritable}] l'insieme delle \textit{capabilities}
5933 ``\textsl{ereditabili}'', cioè di quelle che verranno trasmesse come insieme
5934 delle \textsl{permesse} ad un nuovo programma eseguito attraverso una
5935 chiamata ad \func{exec}.
5936 \item[\textit{effective}] l'insieme delle \textit{capabilities}
5937 ``\textsl{effettive}'', cioè di quelle che vengono effettivamente usate dal
5938 kernel quando deve eseguire il controllo di accesso per le varie operazioni
5939 compiute dal processo.
5940 \label{sec:capabilities_set}
5943 Con l'introduzione delle \textit{file capabilities} sono stati introdotti
5944 altri tre insiemi associabili a ciascun file.\footnote{la realizzazione viene
5945 eseguita con l'uso di uno specifico attributo esteso,
5946 \texttt{security.capability}, la cui modifica è riservata, (come illustrato
5947 in sez.~\ref{sec:file_xattr}) ai processi dotato della capacità
5948 \const{CAP\_SYS\_ADMIN}.} Le \textit{file capabilities} hanno effetto
5949 soltanto quando il file che le porta viene eseguito come programma con una
5950 \func{exec}, e forniscono un meccanismo che consente l'esecuzione dello stesso
5951 con maggiori privilegi; in sostanza sono una sorta di estensione del
5952 \acr{suid} bit limitato ai privilegi di amministratore. Anche questi tre
5953 insiemi sono identificati con gli stessi nomi di quello dei processi, ma il
5954 loro significato è diverso:
5955 \begin{basedescript}{\desclabelwidth{2.1cm}\desclabelstyle{\nextlinelabel}}
5956 \item[\textit{permitted}] (chiamato originariamente \textit{forced}) l'insieme
5957 delle capacità che con l'esecuzione del programma verranno aggiunte alle
5958 capacità \textsl{permesse} del processo.
5959 \item[\textit{inheritable}] (chiamato originariamente \textit{allowed})
5960 l'insieme delle capacità che con l'esecuzione del programma possono essere
5961 ereditate dal processo originario (che cioè non vengono tolte
5962 dall'\textit{inheritable set} del processo originale all'esecuzione di
5964 \item[\textit{effective}] in questo caso non si tratta di un insieme ma di un
5965 unico valore logico; se attivo all'esecuzione del programma tutte le
5966 capacità che risulterebbero \textsl{permesse} verranno pure attivate,
5967 inserendole automaticamente nelle \textsl{effettive}, se disattivato nessuna
5968 capacità verrà attivata (cioè l'\textit{effective set} resterà vuoto).
5971 \itindbeg{capabilities~bounding~set}
5973 Infine come accennato, esiste un ulteriore insieme, chiamato
5974 \textit{capabilities bounding set}, il cui scopo è quello di costituire un
5975 limite alle capacità che possono essere attivate per un programma. Il suo
5976 funzionamento però è stato notevolmente modificato con l'introduzione delle
5977 \textit{file capabilities} e si deve pertanto prendere in considerazione una
5978 casistica assai complessa.
5980 Per i kernel fino al 2.6.25, o se non si attiva il supporto per le
5981 \textit{file capabilities}, il \textit{capabilities bounding set} è un
5982 parametro generale di sistema, il cui valore viene riportato nel file
5983 \sysctlfile{kernel/cap-bound}. Il suo valore iniziale è definito in
5984 sede di compilazione del kernel, e da sempre ha previsto come default la
5985 presenza di tutte le \textit{capabilities} eccetto \const{CAP\_SETPCAP}. In
5986 questa situazione solo il primo processo eseguito nel sistema (quello con
5987 \textsl{pid} 1, di norma \texttt{/sbin/init}) ha la possibilità di
5988 modificarlo; ogni processo eseguito successivamente, se dotato dei privilegi
5989 di amministratore, è in grado soltanto di rimuovere una delle
5990 \textit{capabilities} già presenti dell'insieme.\footnote{per essere precisi
5991 occorreva la capacità \const{CAP\_SYS\_MODULE}.}
5993 In questo caso l'effetto complessivo del \textit{capabilities bounding set} è
5994 che solo le capacità in esso presenti possono essere trasmesse ad un altro
5995 programma attraverso una \func{exec}. Questo in sostanza significa che se un
5996 qualunque programma elimina da esso una capacità, considerato che
5997 \texttt{init} (almeno nelle versioni ordinarie) non supporta la reimpostazione
5998 del \textit{bounding set}, questa non sarà più disponibile per nessun processo
5999 a meno di un riavvio, eliminando così in forma definitiva quella capacità per
6000 tutti, compreso l'amministratore.\footnote{la qual cosa, visto il default
6001 usato per il \textit{capabilities bounding set}, significa anche che
6002 \const{CAP\_SETPCAP} non è stata praticamente mai usata nella sua forma
6005 Con il kernel 2.6.25 e le \textit{file capabilities} il \textit{bounding set}
6006 è diventato una proprietà di ciascun processo, che viene propagata invariata
6007 sia attraverso una \func{fork} che una \func{exec}. In questo caso il file
6008 \sysctlfile{kernel/cap-bound} non esiste e \texttt{init} non ha nessun
6009 ruolo speciale, inoltre in questo caso all'avvio il valore iniziale prevede la
6010 presenza di tutte le capacità (compresa \const{CAP\_SETPCAP}).
6012 Con questo nuovo meccanismo il \textit{bounding set} continua a ricoprire un
6013 ruolo analogo al precedente nel passaggio attraverso una \func{exec}, come
6014 limite alle capacità che possono essere aggiunte al processo in quanto
6015 presenti nel \textit{permitted set} del programma messo in esecuzione, in
6016 sostanza il nuovo programma eseguito potrà ricevere una capacità presente nel
6017 suo \textit{permitted set} (quello del file) solo se questa è anche nel
6018 \textit{bounding set} (del processo). In questo modo si possono rimuovere
6019 definitivamente certe capacità da un processo, anche qualora questo dovesse
6020 eseguire un programma privilegiato che prevede di riassegnarle.
6022 Si tenga presente però che in questo caso il \textit{bounding set} blocca
6023 esclusivamente le capacità indicate nel \textit{permitted set} del programma
6024 che verrebbero attivate in caso di esecuzione, e non quelle eventualmente già
6025 presenti nell'\textit{inheritable set} del processo (ad esempio perché
6026 presenti prima di averle rimosse dal \textit{bounding set}). In questo caso
6027 eseguendo un programma che abbia anche lui dette capacità nel suo
6028 \textit{inheritable set} queste verrebbero assegnate.
6030 In questa seconda versione inoltre il \textit{bounding set} costituisce anche
6031 un limite per le capacità che possono essere aggiunte all'\textit{inheritable
6032 set} del processo stesso con \func{capset}, sempre nel senso che queste
6033 devono essere presenti nel \textit{bounding set} oltre che nel
6034 \textit{permitted set} del processo. Questo limite vale anche per processi con
6035 i privilegi di amministratore,\footnote{si tratta sempre di avere la
6036 \textit{capability} \const{CAP\_SETPCAP}.} per i quali invece non vale la
6037 condizione che le \textit{capabilities} da aggiungere nell'\textit{inheritable
6038 set} debbano essere presenti nel proprio \textit{permitted set}.\footnote{lo
6039 scopo anche in questo caso è ottenere una rimozione definitiva della
6040 possibilità di passare una capacità rimossa dal \textit{bounding set}.}
6042 Come si può notare per fare ricorso alle \textit{capabilities} occorre
6043 comunque farsi carico di una notevole complessità di gestione, aggravata dalla
6044 presenza di una radicale modifica del loro funzionamento con l'introduzione
6045 delle \textit{file capabilities}. Considerato che il meccanismo originale era
6046 incompleto e decisamente problematico nel caso di programmi che non ne
6047 sapessero tener conto,\footnote{c'è stato un grosso problema di sicurezza con
6048 \texttt{sendmail}, riuscendo a rimuovere \const{CAP\_SETGID}
6049 dall'\textit{inheritable set} di un processo si ottenne di far fallire
6050 \func{setuid} in maniera inaspettata per il programma (che aspettandosi
6051 sempre il successo della funzione non ne controllava lo stato di uscita) con
6052 la conseguenza di effettuare come amministratore operazioni che altrimenti
6053 sarebbero state eseguite, senza poter apportare danni, da utente normale.}
6054 ci soffermeremo solo sulla implementazione completa presente a partire dal
6055 kernel 2.6.25, tralasciando ulteriori dettagli riguardo la versione
6058 Riassumendo le regole finora illustrate tutte le \textit{capabilities} vengono
6059 ereditate senza modifiche attraverso una \func{fork} mentre, indicati con
6060 \texttt{orig\_*} i valori degli insiemi del processo chiamante, con
6061 \texttt{file\_*} quelli del file eseguito e con \texttt{bound\_set} il
6062 \textit{capabilities bounding set}, dopo l'invocazione di \func{exec} il
6063 processo otterrà dei nuovi insiemi di capacità \texttt{new\_*} secondo la
6064 formula (espressa in pseudo-codice C) di fig.~\ref{fig:cap_across_exec}; si
6065 noti come in particolare il \textit{capabilities bounding set} non viene
6066 comunque modificato e resta lo stesso sia attraverso una \func{fork} che
6067 attraverso una \func{exec}.
6069 \begin{figure}[!htbp]
6070 \footnotesize \centering
6071 \begin{minipage}[c]{12cm}
6072 \includecodesnip{listati/cap-results.c}
6074 \caption{Espressione della modifica delle \textit{capabilities} attraverso
6076 \label{fig:cap_across_exec}
6079 \itindend{capabilities~bounding~set}
6081 A queste regole se ne aggiungono delle altre che servono a riprodurre il
6082 comportamento tradizionale di un sistema unix-like in tutta una serie di
6083 circostanze. La prima di queste è relativa a quello che avviene quando si
6084 esegue un file senza \textit{capabilities}; se infatti si considerasse questo
6085 equivalente al non averne assegnata alcuna, non essendo presenti capacità né
6086 nel \textit{permitted set} né nell'\textit{inheritable set} del file,
6087 nell'esecuzione di un qualunque programma l'amministratore perderebbe tutti i
6088 privilegi originali dal processo.
6090 Per questo motivo se un programma senza \textit{capabilities} assegnate viene
6091 eseguito da un processo con \ids{UID} reale 0, esso verrà trattato come
6092 se tanto il \textit{permitted set} che l'\textit{inheritable set} fossero con
6093 tutte le \textit{capabilities} abilitate, con l'\textit{effective set} attivo,
6094 col risultato di fornire comunque al processo tutte le capacità presenti nel
6095 proprio \textit{bounding set}. Lo stesso avviene quando l'eseguibile ha attivo
6096 il \acr{suid} bit ed appartiene all'amministratore, in entrambi i casi si
6097 riesce così a riottenere il comportamento classico di un sistema unix-like.
6099 Una seconda circostanza è quella relativa a cosa succede alle
6100 \textit{capabilities} di un processo nelle possibili transizioni da \ids{UID}
6101 nullo a \ids{UID} non nullo o viceversa (corrispondenti rispettivamente a
6102 cedere o riottenere i i privilegi di amministratore) che si possono effettuare
6103 con le varie funzioni viste in sez.~\ref{sec:proc_setuid}. In questo caso la
6104 casistica è di nuovo alquanto complessa, considerata anche la presenza dei
6105 diversi gruppi di identificatori illustrati in tab.~\ref{tab:proc_uid_gid}, si
6108 \item se si passa da \ids{UID} effettivo nullo a non nullo
6109 l'\textit{effective set} del processo viene totalmente azzerato, se
6110 viceversa si passa da \ids{UID} effettivo non nullo a nullo il
6111 \textit{permitted set} viene copiato nell'\textit{effective set};
6112 \item se si passa da \textit{file system} \ids{UID} nullo a non nullo verranno
6113 cancellate dall'\textit{effective set} del processo tutte le capacità
6114 attinenti i file, e cioè \const{CAP\_LINUX\_IMMUTABLE}, \const{CAP\_MKNOD},
6115 \const{CAP\_DAC\_OVERRIDE}, \const{CAP\_DAC\_READ\_SEARCH},
6116 \const{CAP\_MAC\_OVERRIDE}, \const{CAP\_CHOWN}, \const{CAP\_FSETID} e
6117 \const{CAP\_FOWNER} (le prime due a partire dal kernel 2.2.30), nella
6118 transizione inversa verranno invece inserite nell'\textit{effective set}
6119 quelle capacità della precedente lista che sono presenti nel suo
6120 \textit{permitted set}.
6121 \item se come risultato di una transizione riguardante gli identificativi dei
6122 gruppi \textit{real}, \textit{saved} ed \textit{effective} in cui si passa
6123 da una situazione in cui uno di questi era nullo ad una in cui sono tutti
6124 non nulli,\footnote{in sostanza questo è il caso di quando si chiama
6125 \func{setuid} per rimuovere definitivamente i privilegi di amministratore
6126 da un processo.} verranno azzerati completamente sia il \textit{permitted
6127 set} che l'\textit{effective set}.
6129 \label{sec:capability-uid-transition}
6131 La combinazione di tutte queste regole consente di riprodurre il comportamento
6132 ordinario di un sistema di tipo Unix tradizionale, ma può risultare
6133 problematica qualora si voglia passare ad una configurazione di sistema
6134 totalmente basata sull'applicazione delle \textit{capabilities}; in tal caso
6135 infatti basta ad esempio eseguire un programma con \acr{suid} bit di proprietà
6136 dell'amministratore per far riottenere ad un processo tutte le capacità
6137 presenti nel suo \textit{bounding set}, anche se si era avuta la cura di
6138 cancellarle dal \textit{permitted set}.
6140 \itindbeg{securebits}
6142 Per questo motivo a partire dal kernel 2.6.26, se le \textit{file
6143 capabilities} sono abilitate, ad ogni processo viene stata associata una
6144 ulteriore maschera binaria, chiamata \textit{securebits flags}, su cui sono
6145 mantenuti una serie di flag (vedi tab.~\ref{tab:securebits_values}) il cui
6146 valore consente di modificare queste regole speciali che si applicano ai
6147 processi con \ids{UID} nullo. La maschera viene sempre mantenuta
6148 attraverso una \func{fork}, mentre attraverso una \func{exec} viene sempre
6149 cancellato il flag \const{SECURE\_KEEP\_CAPS}.
6154 \begin{tabular}{|l|p{10cm}|}
6156 \textbf{Flag} & \textbf{Descrizione} \\
6159 \const{SECURE\_KEEP\_CAPS}& Il processo non subisce la cancellazione delle
6160 sue \textit{capabilities} quando tutti i suoi
6161 \ids{UID} passano ad un valore non
6162 nullo (regola di compatibilità per il cambio
6163 di \ids{UID} n.~3 del precedente
6164 elenco), sostituisce il precedente uso
6165 dell'operazione \const{PR\_SET\_KEEPCAPS} di
6167 \const{SECURE\_NO\_SETUID\_FIXUP}&Il processo non subisce le modifiche
6168 delle sue \textit{capabilities} nel passaggio
6169 da nullo a non nullo degli \ids{UID}
6170 dei gruppi \textit{effective} e
6171 \textit{file system} (regole di compatibilità
6172 per il cambio di \ids{UID} nn.~1 e 2 del
6173 precedente elenco).\\
6174 \const{SECURE\_NOROOT} & Il processo non assume nessuna capacità
6175 aggiuntiva quando esegue un programma, anche
6176 se ha \ids{UID} nullo o il programma ha
6177 il \acr{suid} bit attivo ed appartiene
6178 all'amministratore (regola di compatibilità
6179 per l'esecuzione di programmi senza
6180 \textit{capabilities}).\\
6183 \caption{Costanti identificative dei flag che compongono la maschera dei
6184 \textit{securebits}.}
6185 \label{tab:securebits_values}
6188 A ciascuno dei flag di tab.~\ref{tab:securebits_values} è inoltre abbinato un
6189 corrispondente flag di blocco, identificato da una costante omonima con
6190 l'estensione \texttt{\_LOCKED}, la cui attivazione è irreversibile ed ha
6191 l'effetto di rendere permanente l'impostazione corrente del corrispondente
6192 flag ordinario; in sostanza con \const{SECURE\_KEEP\_CAPS\_LOCKED} si rende
6193 non più modificabile \const{SECURE\_KEEP\_CAPS}, ed analogamente avviene con
6194 \const{SECURE\_NO\_SETUID\_FIXUP\_LOCKED} per
6195 \const{SECURE\_NO\_SETUID\_FIXUP} e con \const{SECURE\_NOROOT\_LOCKED} per
6196 \const{SECURE\_NOROOT}.
6198 Per l'impostazione di questi flag sono stata predisposte due specifiche
6199 operazioni di \func{prctl} (vedi sez.~\ref{sec:process_prctl}),
6200 \const{PR\_GET\_SECUREBITS}, che consente di ottenerne il valore, e
6201 \const{PR\_SET\_SECUREBITS}, che consente di modificarne il valore; per
6202 quest'ultima sono comunque necessari i privilegi di amministratore ed in
6203 particolare la capacità \const{CAP\_SETPCAP}. Prima dell'introduzione dei
6204 \textit{securebits} era comunque possibile ottenere lo stesso effetto di
6205 \const{SECURE\_KEEP\_CAPS} attraverso l'uso di un'altra operazione di
6206 \func{prctl}, \const{PR\_SET\_KEEPCAPS}.
6208 \itindend{securebits}
6210 Oltre alla gestione dei \textit{securebits} la nuova versione delle
6211 \textit{file capabilities} prevede l'uso di \func{prctl} anche per la gestione
6212 del \textit{capabilities bounding set}, attraverso altre due operazioni
6213 dedicate, \const{PR\_CAPBSET\_READ} per controllarne il valore e
6214 \const{PR\_CAPBSET\_DROP} per modificarlo; quest'ultima di nuovo è una
6215 operazione privilegiata che richiede la capacità \const{CAP\_SETPCAP} e che,
6216 come indica chiaramente il nome, permette solo la rimozione di una
6217 \textit{capability} dall'insieme; per i dettagli sull'uso di tutte queste
6218 operazioni si rimanda alla rilettura di sez.~\ref{sec:process_prctl}.
6220 % TODO verificare per process capability bounding set, vedi:
6221 % http://git.kernel.org/git/?p=linux/kernel/git/torvalds/linux-2.6.git;a=commit;h=3b7391de67da515c91f48aa371de77cb6cc5c07e
6223 % TODO capire cosa cambia con i patch vari, vedi
6224 % http://lwn.net/Articles/280279/
6225 % http://lwn.net/Articles/256519/
6226 % http://lwn.net/Articles/211883/
6229 Un elenco delle delle \textit{capabilities} disponibili su Linux, con una
6230 breve descrizione ed il nome delle costanti che le identificano, è riportato
6231 in tab.~\ref{tab:proc_capabilities};\footnote{l'elenco presentato questa
6232 tabella, ripreso dalla pagina di manuale (accessibile con \texttt{man
6233 capabilities}) e dalle definizioni in
6234 \texttt{include/linux/capabilities.h}, è aggiornato al kernel 2.6.26.} la
6235 tabella è divisa in due parti, la prima riporta le \textit{capabilities}
6236 previste anche nella bozza dello standard POSIX1.e, la seconda quelle
6237 specifiche di Linux. Come si può notare dalla tabella alcune
6238 \textit{capabilities} attengono a singole funzionalità e sono molto
6239 specializzate, mentre altre hanno un campo di applicazione molto vasto, che è
6240 opportuno dettagliare maggiormente.
6242 \begin{table}[!h!btp]
6245 \begin{tabular}{|l|p{10.5cm}|}
6247 \textbf{Capacità}&\textbf{Descrizione}\\
6251 % POSIX-draft defined capabilities.
6253 \const{CAP\_AUDIT\_CONTROL}& La capacità di abilitare e disabilitare il
6254 controllo dell'auditing (dal kernel 2.6.11).\\
6255 \const{CAP\_AUDIT\_WRITE}&La capacità di scrivere dati nel giornale di
6256 auditing del kernel (dal kernel 2.6.11).\\
6257 % TODO verificare questa roba dell'auditing
6258 \const{CAP\_CHOWN} & La capacità di cambiare proprietario e gruppo
6259 proprietario di un file (vedi
6260 sez.~\ref{sec:file_ownership_management}).\\
6261 \const{CAP\_DAC\_OVERRIDE}& La capacità di evitare il controllo dei
6262 permessi di lettura, scrittura ed esecuzione dei
6263 file,\footnotemark (vedi
6264 sez.~\ref{sec:file_access_control}).\\
6265 \const{CAP\_DAC\_READ\_SEARCH}& La capacità di evitare il controllo dei
6266 permessi di lettura ed esecuzione per
6268 sez.~\ref{sec:file_access_control}).\\
6269 \const{CAP\_FOWNER} & La capacità di evitare il controllo della
6270 proprietà di un file per tutte
6271 le operazioni privilegiate non coperte dalle
6272 precedenti \const{CAP\_DAC\_OVERRIDE} e
6273 \const{CAP\_DAC\_READ\_SEARCH}.\\
6274 \const{CAP\_FSETID} & La capacità di evitare la cancellazione
6275 automatica dei bit \itindex{suid~bit} \acr{suid}
6276 e \itindex{sgid~bit} \acr{sgid} quando un file
6277 per i quali sono impostati viene modificato da
6278 un processo senza questa capacità e la capacità
6279 di impostare il bit \acr{sgid} su un file anche
6280 quando questo è relativo ad un gruppo cui non si
6282 sez.~\ref{sec:file_perm_management}).\\
6283 \const{CAP\_KILL} & La capacità di mandare segnali a qualunque
6284 processo (vedi sez.~\ref{sec:sig_kill_raise}).\\
6285 \const{CAP\_SETFCAP} & La capacità di impostare le
6286 \textit{capabilities} di un file (dal kernel
6288 \const{CAP\_SETGID} & La capacità di manipolare i group ID dei
6289 processi, sia il principale che i supplementari,
6290 (vedi sez.~\ref{sec:proc_setgroups}) che quelli
6291 trasmessi tramite i socket \textit{unix domain}
6292 (vedi sez.~\ref{sec:unix_socket}).\\
6293 \const{CAP\_SETUID} & La capacità di manipolare gli user ID del
6294 processo (vedi sez.~\ref{sec:proc_setuid}) e di
6295 trasmettere un user ID arbitrario nel passaggio
6296 delle credenziali coi socket \textit{unix
6297 domain} (vedi sez.~\ref{sec:unix_socket}).\\
6299 % Linux specific capabilities
6302 \const{CAP\_IPC\_LOCK} & La capacità di effettuare il \textit{memory
6303 locking} \itindex{memory~locking} con le
6304 funzioni \func{mlock}, \func{mlockall},
6305 \func{shmctl}, \func{mmap} (vedi
6306 sez.~\ref{sec:proc_mem_lock} e
6307 sez.~\ref{sec:file_memory_map}). \\
6308 \const{CAP\_IPC\_OWNER} & La capacità di evitare il controllo dei permessi
6309 per le operazioni sugli oggetti di
6310 intercomunicazione fra processi (vedi
6311 sez.~\ref{sec:ipc_sysv}).\\
6312 \const{CAP\_LEASE} & La capacità di creare dei \textit{file lease}
6313 \itindex{file~lease} (vedi
6314 sez.~\ref{sec:file_asyncronous_lease})
6315 pur non essendo proprietari del file (dal kernel
6317 \const{CAP\_LINUX\_IMMUTABLE}& La capacità di impostare sui file gli
6318 attributi \textit{immutable} e
6319 \itindex{append~mode} \textit{append only} (se
6321 \const{CAP\_MKNOD} & La capacità di creare
6322 \index{file!di~dispositivo} file di dispositivo
6323 con \func{mknod} (vedi
6324 sez.~\ref{sec:file_mknod}) (dal kernel 2.4).\\
6325 \const{CAP\_NET\_ADMIN} & La capacità di eseguire alcune operazioni
6326 privilegiate sulla rete.\\
6327 \const{CAP\_NET\_BIND\_SERVICE}& La capacità di porsi in ascolto
6328 su porte riservate (vedi
6329 sez.~\ref{sec:TCP_func_bind}).\\
6330 \const{CAP\_NET\_BROADCAST}& La capacità di consentire l'uso di socket in
6331 \itindex{broadcast} \textit{broadcast} e
6332 \itindex{multicast} \textit{multicast}.\\
6333 \const{CAP\_NET\_RAW} & La capacità di usare socket \texttt{RAW} e
6334 \texttt{PACKET} (vedi sez.~\ref{sec:sock_type}).\\
6335 \const{CAP\_SETPCAP} & La capacità di modifiche privilegiate alle
6336 \textit{capabilities}.\\
6337 \const{CAP\_SYS\_ADMIN} & La capacità di eseguire una serie di compiti
6339 \const{CAP\_SYS\_BOOT} & La capacità di fare eseguire un riavvio del
6340 sistema (vedi sez.~\ref{sec:sys_reboot}).\\
6341 \const{CAP\_SYS\_CHROOT}& La capacità di eseguire la funzione
6342 \func{chroot} (vedi sez.~\ref{sec:file_chroot}).\\
6343 \const{CAP\_MAC\_ADMIN} & La capacità amministrare il \textit{Mandatory
6344 Access Control} di Smack (dal kernel 2.6.25).\\
6345 \const{CAP\_MAC\_OVERRIDE}& La capacità evitare il \textit{Mandatory
6346 Access Control} di Smack (dal kernel 2.6.25).\\
6347 \const{CAP\_SYS\_MODULE}& La capacità di caricare e rimuovere moduli del
6349 \const{CAP\_SYS\_NICE} & La capacità di modificare le varie priorità dei
6350 processi (vedi sez.~\ref{sec:proc_priority}).\\
6351 \const{CAP\_SYS\_PACCT} & La capacità di usare le funzioni di
6352 \textit{accounting} dei processi (vedi
6353 sez.~\ref{sec:sys_bsd_accounting}).\\
6354 \const{CAP\_SYS\_PTRACE}& La capacità di tracciare qualunque processo con
6356 sez.~\ref{sec:process_ptrace}).\\
6357 \const{CAP\_SYS\_RAWIO} & La capacità di operare sulle porte
6358 di I/O con \func{ioperm} e \func{iopl} (vedi
6359 sez.~\ref{sec:process_io_port}).\\
6360 \const{CAP\_SYS\_RESOURCE}& La capacità di superare le varie limitazioni
6362 \const{CAP\_SYS\_TIME} & La capacità di modificare il tempo di sistema
6363 (vedi sez.~\ref{sec:sys_time}).\\
6364 \const{CAP\_SYS\_TTY\_CONFIG}& La capacità di simulare un \textit{hangup}
6365 della console, con la funzione
6367 \const{CAP\_SYSLOG} & La capacità di gestire il buffer dei messaggi
6368 del kernel, (vedi sez.~\ref{sec:sess_daemon}),
6369 introdotta dal kernel 2.6.38 come capacità
6370 separata da \const{CAP\_SYS\_ADMIN}.\\
6371 \const{CAP\_WAKE\_ALARM}& La capacità di usare i timer di tipo
6372 \const{CLOCK\_BOOTTIME\_ALARM} e
6373 \const{CLOCK\_REALTIME\_ALARM}, vedi
6374 sez.~\ref{sec:sig_timer_adv} (dal kernel 3.0).\\
6377 \caption{Le costanti che identificano le \textit{capabilities} presenti nel
6379 \label{tab:proc_capabilities}
6382 \footnotetext{vale a dire i permessi caratteristici del modello classico del
6383 controllo di accesso chiamato \itindex{Discrectionary~Access~Control~(DAC)}
6384 \textit{Discrectionary Access Control} (da cui il nome DAC).}
6387 Prima di dettagliare il significato della capacità più generiche, conviene
6388 però dedicare un discorso a parte a \const{CAP\_SETPCAP}, il cui significato è
6389 stato completamente cambiato con l'introduzione delle \textit{file
6390 capabilities} nel kernel 2.6.24. In precedenza questa capacità era quella
6391 che permetteva al processo che la possedeva di impostare o rimuovere le
6392 \textit{capabilities} che fossero presenti nel \textit{permitted set} del
6393 chiamante di un qualunque altro processo. In realtà questo non è mai stato
6394 l'uso inteso nelle bozze dallo standard POSIX, ed inoltre, come si è già
6395 accennato, dato che questa capacità è assente nel \textit{capabilities
6396 bounding set} usato di default, essa non è neanche mai stata realmente
6399 Con l'introduzione \textit{file capabilities} e il cambiamento del significato
6400 del \textit{capabilities bounding set} la possibilità di modificare le
6401 capacità di altri processi è stata completamente rimossa, e
6402 \const{CAP\_SETPCAP} ha acquisito quello che avrebbe dovuto essere il suo
6403 significato originario, e cioè la capacità del processo di poter inserire nel
6404 suo \textit{inheritable set} qualunque capacità presente nel \textit{bounding
6405 set}. Oltre a questo la disponibilità di \const{CAP\_SETPCAP} consente ad un
6406 processo di eliminare una capacità dal proprio \textit{bounding set} (con la
6407 conseguente impossibilità successiva di eseguire programmi con quella
6408 capacità), o di impostare i \textit{securebits} delle \textit{capabilities}.
6410 La prima fra le capacità ``\textsl{ampie}'' che occorre dettagliare
6411 maggiormente è \const{CAP\_FOWNER}, che rimuove le restrizioni poste ad un
6412 processo che non ha la proprietà di un file in un vasto campo di
6413 operazioni;\footnote{vale a dire la richiesta che l'\ids{UID} effettivo del
6414 processo (o meglio l'\ids{UID} di filesystem, vedi
6415 sez.~\ref{sec:proc_setuid}) coincida con quello del proprietario.} queste
6416 comprendono i cambiamenti dei permessi e dei tempi del file (vedi
6417 sez.~\ref{sec:file_perm_management} e sez.~\ref{sec:file_file_times}), le
6418 impostazioni degli attributi dei file (vedi sez.~\ref{sec:file_ioctl}) e delle
6419 ACL (vedi sez.~\ref{sec:file_xattr} e \ref{sec:file_ACL}), poter ignorare lo
6420 \itindex{sticky~bit} \textit{sticky bit} nella cancellazione dei file (vedi
6421 sez.~\ref{sec:file_special_perm}), la possibilità di impostare il flag di
6422 \const{O\_NOATIME} con \func{open} e \func{fcntl} (vedi
6423 sez.~\ref{sec:file_open} e sez.~\ref{sec:file_fcntl}) senza restrizioni.
6425 Una seconda capacità che copre diverse operazioni, in questo caso riguardanti
6426 la rete, è \const{CAP\_NET\_ADMIN}, che consente di impostare le opzioni
6427 privilegiate dei socket (vedi sez.~\ref{sec:sock_generic_options}), abilitare
6428 il \itindex{multicast} \textit{multicasting}, eseguire la configurazione delle
6429 interfacce di rete (vedi sez.~\ref{sec:sock_ioctl_netdevice}) ed impostare la
6430 tabella di instradamento.
6432 Una terza \textit{capability} con vasto campo di applicazione è
6433 \const{CAP\_SYS\_ADMIN}, che copre una serie di operazioni amministrative,
6434 come impostare le quote disco (vedi sez.\ref{sec:disk_quota}), attivare e
6435 disattivare la swap, montare, rimontare e smontare filesystem (vedi
6436 sez.~\ref{sec:sys_file_config}), effettuare operazioni di controllo su
6437 qualunque oggetto dell'IPC di SysV (vedi sez.~\ref{sec:ipc_sysv}), operare
6438 sugli attributi estesi dei file di classe \texttt{security} o \texttt{trusted}
6439 (vedi sez.~\ref{sec:file_xattr}), specificare un \ids{UID} arbitrario
6440 nella trasmissione delle credenziali dei socket (vedi
6441 sez.~\ref{sec:socket_credential_xxx}), assegnare classi privilegiate
6442 (\const{IOPRIO\_CLASS\_RT} e prima del kernel 2.6.25 anche
6443 \const{IOPRIO\_CLASS\_IDLE}) per lo scheduling dell'I/O (vedi
6444 sez.~\ref{sec:io_priority}), superare il limite di sistema sul numero massimo
6445 di file aperti,\footnote{quello indicato da \sysctlfile{fs/file-max}.}
6446 effettuare operazioni privilegiate sulle chiavi mantenute dal kernel (vedi
6447 sez.~\ref{sec:keyctl_management}), usare la funzione \func{lookup\_dcookie},
6448 usare \const{CLONE\_NEWNS} con \func{unshare} e \func{clone}, (vedi
6449 sez.~\ref{sec:process_clone}).
6451 Originariamente \const{CAP\_SYS\_NICE} riguardava soltanto la capacità di
6452 aumentare le priorità di esecuzione dei processi, come la diminuzione del
6453 valore di \textit{nice} (vedi sez.~\ref{sec:proc_sched_stand}), l'uso delle
6454 priorità \textit{real-time} (vedi sez.~\ref{sec:proc_real_time}), o
6455 l'impostazione delle affinità di processore (vedi
6456 sez.~\ref{sec:proc_sched_multiprocess}); ma con l'introduzione di priorità
6457 anche riguardo le operazioni di accesso al disco, e, nel caso di sistemi NUMA,
6458 alla memoria, essa viene a coprire anche la possibilità di assegnare priorità
6459 arbitrarie nell'accesso a disco (vedi sez.~\ref{sec:io_priority}) e nelle
6460 politiche di allocazione delle pagine di memoria ai nodi di un sistema NUMA.
6462 Infine la \textit{capability} \const{CAP\_SYS\_RESOURCE} attiene alla
6463 possibilità di superare i limiti imposti sulle risorse di sistema, come usare
6464 lo spazio disco riservato all'amministratore sui filesystem che lo supportano,
6465 usare la funzione \func{ioctl} per controllare il \textit{journaling} sul
6466 filesystem \acr{ext3}, non subire le quote disco, aumentare i limiti sulle
6467 risorse di un processo (vedi sez.~\ref{sec:sys_resource_limit}) e quelle sul
6468 numero di processi, ed i limiti sulle dimensioni dei messaggi delle code del
6469 SysV IPC (vedi sez.~\ref{sec:ipc_sysv_mq}).
6471 Per la gestione delle \textit{capabilities} il kernel mette a disposizione due
6472 funzioni che permettono rispettivamente di leggere ed impostare i valori dei
6473 tre insiemi illustrati in precedenza. Queste due funzioni sono \funcd{capget}
6474 e \funcd{capset} e costituiscono l'interfaccia di gestione basso livello; i
6475 loro rispettivi prototipi sono:
6477 \headdecl{sys/capability.h}
6479 \funcdecl{int capget(cap\_user\_header\_t hdrp, cap\_user\_data\_t datap)}
6480 Legge le \textit{capabilities}.
6482 \funcdecl{int capset(cap\_user\_header\_t hdrp, const cap\_user\_data\_t
6484 Imposta le \textit{capabilities}.
6487 \bodydesc{Entrambe le funzioni ritornano 0 in caso di successo e -1 in caso
6488 di errore, nel qual caso \var{errno} può assumere i valori:
6490 \item[\errcode{ESRCH}] si è fatto riferimento ad un processo inesistente.
6491 \item[\errcode{EPERM}] si è tentato di aggiungere una capacità
6492 nell'insieme delle \textit{capabilities} permesse, o di impostare una
6493 capacità non presente nell'insieme di quelle permesse negli insieme
6494 delle effettive o ereditate, o si è cercato di impostare una
6495 \textit{capability} di un altro processo senza avare
6496 \const{CAP\_SETPCAP}.
6498 ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
6502 Queste due funzioni prendono come argomenti due tipi di dati dedicati,
6503 definiti come puntatori a due strutture specifiche di Linux, illustrate in
6504 fig.~\ref{fig:cap_kernel_struct}. Per un certo periodo di tempo era anche
6505 indicato che per poterle utilizzare fosse necessario che la macro
6506 \macro{\_POSIX\_SOURCE} risultasse non definita (ed era richiesto di inserire
6507 una istruzione \texttt{\#undef \_POSIX\_SOURCE} prima di includere
6508 \headfile{sys/capability.h}) requisito che non risulta più
6509 presente.\footnote{e non è chiaro neanche quanto sia mai stato davvero
6512 Si tenga presente che le strutture di fig.~\ref{fig:cap_kernel_struct}, come i
6513 prototipi delle due funzioni \func{capget} e \func{capset}, sono soggette ad
6514 essere modificate con il cambiamento del kernel (in particolare i tipi di dati
6515 delle strutture) ed anche se finora l'interfaccia è risultata stabile, non c'è
6516 nessuna assicurazione che questa venga mantenuta,\footnote{viene però
6517 garantito che le vecchie funzioni continuino a funzionare.} Pertanto se si
6518 vogliono scrivere programmi portabili che possano essere eseguiti senza
6519 modifiche o adeguamenti su qualunque versione del kernel è opportuno
6520 utilizzare le interfacce di alto livello che vedremo più avanti.
6522 \begin{figure}[!htb]
6525 \begin{minipage}[c]{\textwidth}
6526 \includestruct{listati/cap_user_header_t.h}
6529 \caption{Definizione delle strutture a cui fanno riferimento i puntatori
6530 \structd{cap\_user\_header\_t} e \structd{cap\_user\_data\_t} usati per
6531 l'interfaccia di gestione di basso livello delle \textit{capabilities}.}
6532 \label{fig:cap_kernel_struct}
6535 La struttura a cui deve puntare l'argomento \param{hdrp} serve ad indicare,
6536 tramite il campo \var{pid}, il PID del processo del quale si vogliono leggere
6537 o modificare le \textit{capabilities}. Con \func{capset} questo, se si usano
6538 le \textit{file capabilities}, può essere solo 0 o PID del processo chiamante,
6539 che sono equivalenti. Il campo \var{version} deve essere impostato al valore
6540 della versione delle stesse usata dal kernel (quello indicato da una delle
6541 costanti \texttt{\_LINUX\_CAPABILITY\_VERSION\_n} di
6542 fig.~\ref{fig:cap_kernel_struct}) altrimenti le funzioni ritorneranno con un
6543 errore di \errcode{EINVAL}, restituendo nel campo stesso il valore corretto
6544 della versione in uso. La versione due è comunque deprecata e non deve essere
6545 usata (il kernel stamperà un avviso). I valori delle \textit{capabilities}
6546 devono essere passati come maschere binarie;\footnote{e si tenga presente che
6547 i valori di tab.~\ref{tab:proc_capabilities} non possono essere combinati
6548 direttamente, indicando il numero progressivo del bit associato alla
6549 relativa capacità.} con l'introduzione delle \textit{capabilities} a 64 bit
6550 inoltre il puntatore \param{datap} non può essere più considerato come
6551 relativo ad una singola struttura, ma ad un vettore di due
6552 strutture.\footnote{è questo cambio di significato che ha portato a deprecare
6553 la versione 2, che con \func{capget} poteva portare ad un buffer overflow
6554 per vecchie applicazioni che continuavano a considerare \param{datap} come
6555 puntatore ad una singola struttura.}
6557 Dato che le precedenti funzioni, oltre ad essere specifiche di Linux, non
6558 garantiscono la stabilità nell'interfaccia, è sempre opportuno effettuare la
6559 gestione delle \textit{capabilities} utilizzando le funzioni di libreria a
6560 questo dedicate. Queste funzioni, che seguono quanto previsto nelle bozze
6561 dello standard POSIX.1e, non fanno parte delle \acr{glibc} e sono fornite in
6562 una libreria a parte,\footnote{la libreria è \texttt{libcap2}, nel caso di
6563 Debian può essere installata con il pacchetto omonimo.} pertanto se un
6564 programma le utilizza si dovrà indicare esplicitamente l'uso della suddetta
6565 libreria attraverso l'opzione \texttt{-lcap} del compilatore.
6567 Le funzioni dell'interfaccia delle bozze di POSIX.1e prevedono l'uso di un
6568 \index{tipo!opaco} tipo di dato opaco, \type{cap\_t}, come puntatore ai dati
6569 mantenuti nel cosiddetto \textit{capability state},\footnote{si tratta in
6570 sostanza di un puntatore ad una struttura interna utilizzata dalle librerie,
6571 i cui campi non devono mai essere acceduti direttamente.} in sono
6572 memorizzati tutti i dati delle \textit{capabilities}. In questo modo è
6573 possibile mascherare i dettagli della gestione di basso livello, che potranno
6574 essere modificati senza dover cambiare le funzioni dell'interfaccia, che
6575 faranno riferimento soltanto ad oggetti di questo tipo. L'interfaccia
6576 pertanto non soltanto fornisce le funzioni per modificare e leggere le
6577 \textit{capabilities}, ma anche quelle per gestire i dati attraverso
6580 La prima funzione dell'interfaccia è quella che permette di inizializzare un
6581 \textit{capability state}, allocando al contempo la memoria necessaria per i
6582 relativi dati. La funzione è \funcd{cap\_init} ed il suo prototipo è:
6584 \headdecl{sys/capability.h}
6586 \funcdecl{cap\_t cap\_init(void)}
6587 Crea ed inizializza un \textit{capability state}.
6589 \bodydesc{La funzione ritorna un valore non nullo in caso di successo e
6590 \val{NULL} in caso di errore, nel qual caso \var{errno} assumerà il
6591 valore \errval{ENOMEM}.
6595 La funzione restituisce il puntatore \type{cap\_t} ad uno stato inizializzato
6596 con tutte le \textit{capabilities} azzerate. In caso di errore (cioè quando
6597 non c'è memoria sufficiente ad allocare i dati) viene restituito \val{NULL}
6598 ed \var{errno} viene impostata a \errval{ENOMEM}. La memoria necessaria a
6599 mantenere i dati viene automaticamente allocata da \func{cap\_init}, ma dovrà
6600 essere disallocata esplicitamente quando non è più necessaria utilizzando, per
6601 questo l'interfaccia fornisce una apposita funzione, \funcd{cap\_free}, il cui
6604 \headdecl{sys/capability.h}
6606 \funcdecl{int cap\_free(void *obj\_d)}
6607 Disalloca la memoria allocata per i dati delle \textit{capabilities}.
6609 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
6610 errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
6614 La funzione permette di liberare la memoria allocata dalle altre funzioni
6615 della libreria sia per un \textit{capability state}, nel qual caso l'argomento
6616 dovrà essere un dato di tipo \type{cap\_t}, che per una descrizione testuale
6617 dello stesso,\footnote{cioè quanto ottenuto tramite la funzione
6618 \func{cap\_to\_text}.} nel qual caso l'argomento dovrà essere un dato di
6619 tipo \texttt{char *}. Per questo motivo l'argomento \param{obj\_d} è
6620 dichiarato come \texttt{void *} e deve sempre corrispondere ad un puntatore
6621 ottenuto tramite le altre funzioni della libreria, altrimenti la funzione
6622 fallirà con un errore di \errval{EINVAL}.
6624 Infine si può creare una copia di un \textit{capability state} ottenuto in
6625 precedenza tramite la funzione \funcd{cap\_dup}, il cui prototipo è:
6627 \headdecl{sys/capability.h}
6629 \funcdecl{cap\_t cap\_dup(cap\_t cap\_p)}
6630 Duplica un \textit{capability state} restituendone una copia.
6632 \bodydesc{La funzione ritorna un valore non nullo in caso di successo e
6633 \val{NULL} in caso di errore, nel qual caso \var{errno} potrà assumere i
6634 valori \errval{ENOMEM} o \errval{EINVAL}.
6638 La funzione crea una copia del \textit{capability state} posto all'indirizzo
6639 \param{cap\_p} che si è passato come argomento, restituendo il puntatore alla
6640 copia, che conterrà gli stessi valori delle \textit{capabilities} presenti
6641 nell'originale. La memoria necessaria viene allocata automaticamente dalla
6642 funzione. Una volta effettuata la copia i due \textit{capability state}
6643 potranno essere modificati in maniera completamente
6644 indipendente.\footnote{alla fine delle operazioni si ricordi però di
6645 disallocare anche la copia, oltre all'originale. }
6647 Una seconda classe di funzioni di servizio previste dall'interfaccia sono
6648 quelle per la gestione dei dati contenuti all'interno di un \textit{capability
6649 state}; la prima di queste è \funcd{cap\_clear}, il cui prototipo è:
6651 \headdecl{sys/capability.h}
6653 \funcdecl{int cap\_clear(cap\_t cap\_p)}
6654 Inizializza un \textit{capability state} cancellando tutte le
6655 \textit{capabilities}.
6657 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
6658 errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
6662 La funzione si limita ad azzerare tutte le \textit{capabilities} presenti nel
6663 \textit{capability state} all'indirizzo \param{cap\_p} passato come argomento,
6664 restituendo uno stato \textsl{vuoto}, analogo a quello che si ottiene nella
6665 creazione con \func{cap\_init}.
6670 \begin{tabular}[c]{|l|l|}
6672 \textbf{Valore} & \textbf{Significato} \\
6675 \const{CAP\_EFFECTIVE} & Capacità dell'insieme \textsl{effettivo}.\\
6676 \const{CAP\_PERMITTED} & Capacità dell'insieme \textsl{permesso}.\\
6677 \const{CAP\_INHERITABLE}& Capacità dell'insieme \textsl{ereditabile}.\\
6680 \caption{Valori possibili per il tipo di dato \type{cap\_flag\_t} che
6681 identifica gli insiemi delle \textit{capabilities}.}
6682 \label{tab:cap_set_identifier}
6685 Una variante di \func{cap\_clear} è \funcd{cap\_clear\_flag} che cancella da
6686 un \textit{capability state} tutte le \textit{capabilities} di un certo
6687 insieme fra quelli di pag.~\pageref{sec:capabilities_set}, il suo prototipo
6690 \headdecl{sys/capability.h}
6692 \funcdecl{int cap\_clear\_flag(cap\_t cap\_p, cap\_flag\_t flag)}
6694 Cancella dal \textit{capability state} \param{cap\_p} tutte le
6695 \textit{capabilities} dell'insieme \param{flag}.
6697 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
6698 errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}. }
6701 La funzione richiede che si indichi quale degli insiemi si intente cancellare
6702 con l'argomento \param{flag}. Questo deve essere specificato con una variabile
6703 di tipo \type{cap\_flag\_t} che può assumere esclusivamente\footnote{si tratta
6704 in effetti di un tipo enumerato, come si può verificare dalla sua
6705 definizione che si trova in \headfile{sys/capability.h}.} uno dei valori
6706 illustrati in tab.~\ref{tab:cap_set_identifier}.
6708 Si possono inoltre confrontare in maniera diretta due diversi
6709 \textit{capability state} con la funzione \funcd{cap\_compare}; il suo
6712 \headdecl{sys/capability.h}
6713 \funcdecl{int cap\_compare(cap\_t cap\_a, cap\_t cap\_b)}
6715 Confronta due \textit{capability state}.
6717 \bodydesc{La funzione ritorna 0 se i \textit{capability state} sono identici
6718 ed un valore positivo se differiscono, non sono previsti errori.}
6721 La funzione esegue un confronto fra i due \textit{capability state} passati
6722 come argomenti e ritorna in un valore intero il risultato, questo è nullo se
6723 sono identici o positivo se vi sono delle differenze. Il valore di ritorno
6724 della funzione consente inoltre di per ottenere ulteriori informazioni su
6725 quali sono gli insiemi di \textit{capabilities} che risultano differenti. Per
6726 questo si può infatti usare la apposita macro \macro{CAP\_DIFFERS}:
6728 \funcdecl{int CAP\_DIFFERS(value, flag)} Controlla lo stato di eventuali
6729 differenze delle \textit{capabilities} nell'insieme \texttt{flag}.
6732 La macro che richiede si passi nell'argomento \texttt{value} il risultato
6733 della funzione \func{cap\_compare} e in \texttt{flag} l'indicazione (coi
6734 valori di tab.~\ref{tab:cap_set_identifier}) dell'insieme che si intende
6735 controllare; restituirà un valore diverso da zero se le differenze rilevate da
6736 \func{cap\_compare} sono presenti nell'insieme indicato.
6738 Per la gestione dei singoli valori delle \textit{capabilities} presenti in un
6739 \textit{capability state} l'interfaccia prevede due funzioni specifiche,
6740 \funcd{cap\_get\_flag} e \funcd{cap\_set\_flag}, che permettono
6741 rispettivamente di leggere o impostare il valore di una capacità all'interno
6742 in uno dei tre insiemi già citati; i rispettivi prototipi sono:
6744 \headdecl{sys/capability.h}
6746 \funcdecl{int cap\_get\_flag(cap\_t cap\_p, cap\_value\_t cap, cap\_flag\_t
6747 flag, cap\_flag\_value\_t *value\_p)}
6748 Legge il valore di una \textit{capability}.
6750 \funcdecl{int cap\_set\_flag(cap\_t cap\_p, cap\_flag\_t flag, int ncap,
6751 cap\_value\_t *caps, cap\_flag\_value\_t value)}
6752 Imposta il valore di una \textit{capability}.
6754 \bodydesc{Le funzioni ritornano 0 in caso di successo e $-1$ in caso di
6755 errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
6759 In entrambe le funzioni l'argomento \param{cap\_p} indica il puntatore al
6760 \textit{capability state} su cui operare, mentre l'argomento \param{flag}
6761 indica su quale dei tre insiemi si intende operare, sempre con i valori di
6762 tab.~\ref{tab:cap_set_identifier}.
6764 La capacità che si intende controllare o impostare invece deve essere
6765 specificata attraverso una variabile di tipo \type{cap\_value\_t}, che può
6766 prendere come valore uno qualunque di quelli riportati in
6767 tab.~\ref{tab:proc_capabilities}, in questo caso però non è possibile
6768 combinare diversi valori in una maschera binaria, una variabile di tipo
6769 \type{cap\_value\_t} può indicare una sola capacità.\footnote{in
6770 \headfile{sys/capability.h} il tipo \type{cap\_value\_t} è definito come
6771 \ctyp{int}, ma i valori validi sono soltanto quelli di
6772 tab.~\ref{tab:proc_capabilities}.}
6774 Infine lo stato di una capacità è descritto ad una variabile di tipo
6775 \type{cap\_flag\_value\_t}, che a sua volta può assumere soltanto
6776 uno\footnote{anche questo è un tipo enumerato.} dei valori di
6777 tab.~\ref{tab:cap_value_type}.
6782 \begin{tabular}[c]{|l|l|}
6784 \textbf{Valore} & \textbf{Significato} \\
6787 \const{CAP\_CLEAR}& La capacità non è impostata.\\
6788 \const{CAP\_SET} & La capacità è impostata.\\
6791 \caption{Valori possibili per il tipo di dato \type{cap\_flag\_value\_t} che
6792 indica lo stato di una capacità.}
6793 \label{tab:cap_value_type}
6796 La funzione \func{cap\_get\_flag} legge lo stato della capacità indicata
6797 dall'argomento \param{cap} all'interno dell'insieme indicato dall'argomento
6798 \param{flag} lo restituisce nella variabile puntata
6799 dall'argomento \param{value\_p}. Questa deve essere di tipo
6800 \type{cap\_flag\_value\_t} ed assumerà uno dei valori di
6801 tab.~\ref{tab:cap_value_type}. La funzione consente pertanto di leggere solo
6802 lo stato di una capacità alla volta.
6804 La funzione \func{cap\_set\_flag} può invece impostare in una sola chiamata
6805 più \textit{capabilities}, anche se solo all'interno dello stesso insieme ed
6806 allo stesso valore. Per questo motivo essa prende un vettore di valori di tipo
6807 \type{cap\_value\_t} nell'argomento \param{caps}, la cui dimensione viene
6808 specificata dall'argomento \param{ncap}. Il tipo di impostazione da eseguire
6809 (cancellazione o impostazione) per le capacità elencate in \param{caps} viene
6810 indicato dall'argomento \param{value} sempre con i valori di
6811 tab.~\ref{tab:cap_value_type}.
6813 Per semplificare la gestione delle \textit{capabilities} l'interfaccia prevede
6814 che sia possibile utilizzare anche una rappresentazione testuale del contenuto
6815 di un \textit{capability state} e fornisce le opportune funzioni di
6816 gestione;\footnote{entrambe erano previste dalla bozza dello standard
6817 POSIX.1e.} la prima di queste, che consente di ottenere la rappresentazione
6818 testuale, è \funcd{cap\_to\_text}, il cui prototipo è:
6820 \headdecl{sys/capability.h}
6822 \funcdecl{char * cap\_to\_text(cap\_t caps, ssize\_t * length\_p)}
6824 Genera una visualizzazione testuale delle \textit{capabilities}.
6826 \bodydesc{La funzione ritorna un puntatore alla stringa con la descrizione
6827 delle \textit{capabilities} in caso di successo e \val{NULL} in caso di
6828 errore, nel qual caso \var{errno} può assumere i valori \errval{EINVAL} o
6833 La funzione ritorna l'indirizzo di una stringa contente la descrizione
6834 testuale del contenuto del \textit{capability state} \param{caps} passato come
6835 argomento, e, qualora l'argomento \param{length\_p} sia diverso da \val{NULL},
6836 restituisce nella variabile intera da questo puntata la lunghezza della
6837 stringa. La stringa restituita viene allocata automaticamente dalla funzione e
6838 pertanto dovrà essere liberata con \func{cap\_free}.
6840 La rappresentazione testuale, che viene usata anche di programmi di gestione a
6841 riga di comando, prevede che lo stato venga rappresentato con una stringa di
6842 testo composta da una serie di proposizioni separate da spazi, ciascuna delle
6843 quali specifica una operazione da eseguire per creare lo stato finale. Nella
6844 rappresentazione si fa sempre conto di partire da uno stato in cui tutti gli
6845 insiemi sono vuoti e si provvede a impostarne i contenuti.
6847 Ciascuna proposizione è nella forma di un elenco di capacità, espresso con i
6848 nomi di tab.~\ref{tab:proc_capabilities} separati da virgole, seguito da un
6849 operatore, e dall'indicazione degli insiemi a cui l'operazione si applica. I
6850 nomi delle capacità possono essere scritti sia maiuscoli che minuscoli, viene
6851 inoltre riconosciuto il nome speciale \texttt{all} che è equivalente a
6852 scrivere la lista completa. Gli insiemi sono identificati dalle tre lettere
6853 iniziali: ``\texttt{p}'' per il \textit{permitted}, ``\texttt{i}'' per
6854 l'\textit{inheritable} ed ``\texttt{e}'' per l'\textit{effective} che devono
6855 essere sempre minuscole e se ne può indicare più di uno.
6857 Gli operatori possibili sono solo tre: ``\texttt{+}'' che aggiunge le capacità
6858 elencate agli insiemi indicati, ``\texttt{-}'' che le toglie e ``\texttt{=}''
6859 che le assegna esattamente. I primi due richiedono che sia sempre indicato sia
6860 un elenco di capacità che gli insiemi a cui esse devono applicarsi, e
6861 rispettivamente attiveranno o disattiveranno le capacità elencate nell'insieme
6862 o negli insiemi specificati, ignorando tutto il resto. I due operatori possono
6863 anche essere combinati nella stessa proposizione, per aggiungere e togliere le
6864 capacità dell'elenco da insiemi diversi.
6866 L'assegnazione si applica invece su tutti gli insiemi allo stesso tempo,
6867 pertanto l'uso di ``\texttt{=}'' è equivalente alla cancellazione preventiva
6868 di tutte le capacità ed alla impostazione di quelle elencate negli insiemi
6869 specificati, questo significa che in genere lo si usa una sola volta
6870 all'inizio della stringa. In tal caso l'elenco delle capacità può non essere
6871 indicato e viene assunto che si stia facendo riferimento a tutte quante senza
6872 doverlo scrivere esplicitamente.
6874 Come esempi avremo allora che un processo non privilegiato di un utente, che
6875 non ha nessuna capacità attiva, avrà una rappresentazione nella forma
6876 ``\texttt{=}'' che corrisponde al fatto che nessuna capacità viene assegnata a
6877 nessun insieme (vale la cancellazione preventiva), mentre un processo con
6878 privilegi di amministratore avrà una rappresentazione nella forma
6879 ``\texttt{=ep}'' in cui tutte le capacità vengono assegnate agli insiemi
6880 \textit{permitted} ed \textit{effective} (e l'\textit{inheritable} è ignorato
6881 in quanto per le regole viste a pag.~\ref{sec:capability-uid-transition} le
6882 capacità verranno comunque attivate attraverso una \func{exec}). Infine, come
6883 esempio meno banale dei precedenti, otterremo per \texttt{init} una
6884 rappresentazione nella forma ``\texttt{=ep cap\_setpcap-e}'' dato che come
6885 accennato tradizionalmente \const{CAP\_SETPCAP} è sempre stata rimossa da
6888 Viceversa per passare ottenere un \textit{capability state} dalla sua
6889 rappresentazione testuale si può usare \funcd{cap\_from\_text}, il cui
6892 \headdecl{sys/capability.h}
6894 \funcdecl{cap\_t cap\_from\_text(const char *string)}
6896 Crea un \textit{capability state} dalla sua rappresentazione testuale.
6898 \bodydesc{La funzione ritorna un puntatore valido in caso di successo e
6899 \val{NULL} in caso di errore, nel qual caso \var{errno} può assumere i
6900 valori \errval{EINVAL} o \errval{ENOMEM}.}
6903 La funzione restituisce il puntatore ad un \textit{capability state}
6904 inizializzato con i valori indicati nella stringa \param{string} che ne
6905 contiene la rappresentazione testuale. La memoria per il \textit{capability
6906 state} viene allocata automaticamente dalla funzione e dovrà essere liberata
6907 con \func{cap\_free}.
6909 Alle due funzioni citate se ne aggiungono altre due che consentono di
6910 convertire i valori delle costanti di tab.~\ref{tab:proc_capabilities} nelle
6911 stringhe usate nelle rispettive rappresentazioni e viceversa. Le due funzioni,
6912 \funcd{cap\_to\_name} e \funcd{cap\_from\_name}, sono estensioni specifiche di
6913 Linux ed i rispettivi prototipi sono:
6915 \headdecl{sys/capability.h}
6917 \funcdecl{char * cap\_to\_name(cap\_value\_t cap)}
6918 \funcdecl{int cap\_from\_name(const char *name, cap\_value\_t *cap\_p)}
6919 Convertono le \textit{capabilities} dalle costanti alla rappresentazione
6920 testuale e viceversa.
6922 \bodydesc{La funzione \func{cap\_to\_name} ritorna un valore diverso da
6923 \val{NULL} in caso di successo e \val{NULL} in caso di errore, mentre
6924 \func{cap\_to\_name} ritorna rispettivamente 0 e $-1$; per entrambe in
6925 caso di errore \var{errno} può assumere i valori \errval{EINVAL} o
6929 La prima funzione restituisce la stringa (allocata automaticamente e che dovrà
6930 essere liberata con \func{cap\_free}) che corrisponde al valore della
6931 capacità \param{cap}, mentre la seconda restituisce nella variabile puntata
6932 da \param{cap\_p} il valore della capacità rappresentata dalla
6933 stringa \param{name}.
6935 Fin quei abbiamo trattato solo le funzioni di servizio relative alla
6936 manipolazione dei \textit{capability state} come strutture di dati;
6937 l'interfaccia di gestione prevede però anche le funzioni per trattare le
6938 \textit{capabilities} presenti nei processi. La prima di queste funzioni è
6939 \funcd{cap\_get\_proc} che consente la lettura delle \textit{capabilities} del
6940 processo corrente, il suo prototipo è:
6942 \headdecl{sys/capability.h}
6944 \funcdecl{cap\_t cap\_get\_proc(void)}
6945 Legge le \textit{capabilities} del processo corrente.
6947 \bodydesc{La funzione ritorna un valore diverso da \val{NULL} in caso di
6948 successo e \val{NULL} in caso di errore, nel qual caso \var{errno} può
6949 assumere i valori \errval{EINVAL}, \errval{EPERM} o \errval{ENOMEM}. }
6952 La funzione legge il valore delle \textit{capabilities} associate al processo
6953 da cui viene invocata, restituendo il risultato tramite il puntatore ad un
6954 \textit{capability state} contenente tutti i dati che provvede ad allocare
6955 autonomamente e che di nuovo occorrerà liberare con \func{cap\_free} quando
6956 non sarà più utilizzato.
6958 Se invece si vogliono leggere le \textit{capabilities} di un processo
6959 specifico occorre usare la funzione \funcd{capgetp}, il cui
6960 prototipo\footnote{su alcune pagine di manuale la funzione è descritta con un
6961 prototipo sbagliato, che prevede un valore di ritorno di tipo \type{cap\_t},
6962 ma il valore di ritorno è intero, come si può verificare anche dalla
6963 dichiarazione della stessa in \headfile{sys/capability.h}.} è:
6965 \headdecl{sys/capability.h}
6967 \funcdecl{int capgetp(pid\_t pid, cap\_t cap\_d)}
6968 Legge le \textit{capabilities} del processo indicato da \param{pid}.
6970 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
6971 errore, nel qual caso \var{errno} può assumere i valori \errval{EINVAL},
6972 \errval{EPERM} o \errval{ENOMEM}.
6975 %TODO controllare e correggere i codici di errore!!!
6977 La funzione legge il valore delle \textit{capabilities} del processo indicato
6978 con l'argomento \param{pid}, e restituisce il risultato nel \textit{capability
6979 state} posto all'indirizzo indicato con l'argomento
6980 \param{cap\_d}; a differenza della precedente in questo caso il
6981 \textit{capability state} deve essere stato creato in precedenza. Qualora il
6982 processo indicato non esista si avrà un errore di \errval{ESRCH}. Gli stessi
6983 valori possono essere letti direttamente nel filesystem \textit{proc}, nei
6984 file \texttt{/proc/<pid>/status}; ad esempio per \texttt{init} si otterrà
6988 CapInh: 0000000000000000
6989 CapPrm: 00000000fffffeff
6990 CapEff: 00000000fffffeff
6994 Infine per impostare le \textit{capabilities} del processo corrente (non
6995 esiste una funzione che permetta di cambiare le \textit{capabilities} di un
6996 altro processo) si deve usare la funzione \funcd{cap\_set\_proc}, il cui
6999 \headdecl{sys/capability.h}
7001 \funcdecl{int cap\_set\_proc(cap\_t cap\_p)}
7002 Imposta le \textit{capabilities} del processo corrente.
7004 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
7005 errore, nel qual caso \var{errno} può assumere i valori \errval{EINVAL},
7006 \errval{EPERM} o \errval{ENOMEM}.
7010 La funzione modifica le \textit{capabilities} del processo corrente secondo
7011 quanto specificato con l'argomento \param{cap\_p}, posto che questo sia
7012 possibile nei termini spiegati in precedenza (non sarà ad esempio possibile
7013 impostare capacità non presenti nell'insieme di quelle permesse). In caso di
7014 successo i nuovi valori saranno effettivi al ritorno della funzione, in caso
7015 di fallimento invece lo stato delle capacità resterà invariato. Si tenga
7016 presente che \textsl{tutte} le capacità specificate tramite \param{cap\_p}
7017 devono essere permesse; se anche una sola non lo è la funzione fallirà, e per
7018 quanto appena detto, lo stato delle \textit{capabilities} non verrà modificato
7019 (neanche per le parti eventualmente permesse).
7021 Come esempio di utilizzo di queste funzioni nei sorgenti allegati alla guida
7022 si è distribuito il programma \texttt{getcap.c}, che consente di leggere le
7023 \textit{capabilities} del processo corrente\footnote{vale a dire di sé stesso,
7024 quando lo si lancia, il che può sembrare inutile, ma serve a mostrarci quali
7025 sono le \textit{capabilities} standard che ottiene un processo lanciato
7026 dalla riga di comando.} o tramite l'opzione \texttt{-p}, quelle di un
7027 processo qualunque il cui pid viene passato come parametro dell'opzione.
7029 \begin{figure}[!htbp]
7030 \footnotesize \centering
7031 \begin{minipage}[c]{\codesamplewidth}
7032 \includecodesample{listati/getcap.c}
7035 \caption{Corpo principale del programma \texttt{getcap.c}.}
7036 \label{fig:proc_getcap}
7039 La sezione principale del programma è riportata in fig.~\ref{fig:proc_getcap},
7040 e si basa su una condizione sulla variabile \var{pid} che se si è usato
7041 l'opzione \texttt{-p} è impostata (nella sezione di gestione delle opzioni,
7042 che si è tralasciata) al valore del \textsl{pid} del processo di cui si vuole
7043 leggere le \textit{capabilities} e nulla altrimenti. Nel primo caso
7044 (\texttt{\small 1--6}) si utilizza direttamente (\texttt{\small 2})
7045 \func{cap\_get\_proc} per ottenere lo stato delle capacità del processo, nel
7046 secondo (\texttt{\small 7--14}) prima si inizializza (\texttt{\small 8}) uno
7047 stato vuoto e poi (\texttt{\small 9}) si legge il valore delle capacità del
7050 Il passo successivo è utilizzare (\texttt{\small 16}) \func{cap\_to\_text} per
7051 tradurre in una stringa lo stato, e poi (\texttt{\small 17}) stamparlo; infine
7052 (\texttt{\small 19--20}) si libera la memoria allocata dalle precedenti
7053 funzioni con \func{cap\_free} per poi ritornare dal ciclo principale della
7056 \itindend{capabilities}
7058 % TODO vedi http://lwn.net/Articles/198557/ e
7059 % http://www.madore.org/~david/linux/newcaps/
7063 \subsection{La gestione dei {chroot}}
7064 \label{sec:file_chroot}
7066 % TODO introdurre nuova sezione sulle funzionalità di sicurezza avanzate, con
7067 % dentro chroot SELinux e AppArmor, Tomoyo, Smack, cgroup o che altro ???
7069 % inserire setns (introdotta con il 3.0, vedi http://lwn.net/Articles/407495/)
7070 % e le funzionalità di isolamento dei container
7072 Benché non abbia niente a che fare con permessi, utenti e gruppi, la funzione
7073 \func{chroot} viene usata spesso per restringere le capacità di accesso di un
7074 programma ad una sezione limitata del filesystem, per cui ne parleremo in
7077 % TODO riferimenti ai bind mount, link simbolici ecc.
7079 Come accennato in sez.~\ref{sec:proc_fork} ogni processo oltre ad una
7080 \index{directory~di~lavoro} directory di lavoro, ha anche una directory
7081 \textsl{radice}\footnote{entrambe sono contenute in due campi (rispettivamente
7082 \var{pwd} e \var{root}) di \kstruct{fs\_struct}; vedi
7083 fig.~\ref{fig:proc_task_struct}.} che, pur essendo di norma corrispondente
7084 alla radice dell'albero di file e directory come visto dal kernel (ed
7085 illustrato in sez.~\ref{sec:file_pathname}), ha per il processo il significato
7086 specifico di directory rispetto alla quale vengono risolti i
7087 \itindsub{pathname}{assoluto}\textit{pathname} assoluti.\footnote{cioè quando
7088 un processo chiede la risoluzione di un \textit{pathname}, il kernel usa
7089 sempre questa directory come punto di partenza.} Il fatto che questo valore
7090 sia specificato per ogni processo apre allora la possibilità di modificare le
7091 modalità di risoluzione dei \textit{pathname} assoluti da parte di un processo
7092 cambiando questa directory, così come si fa coi
7093 \itindsub{pathname}{relativo}\textit{pathname} relativi cambiando la
7094 \index{directory~di~lavoro} directory di lavoro.
7096 Normalmente la directory radice di un processo coincide anche con la radice
7097 del filesystem usata dal kernel, e dato che il suo valore viene ereditato dal
7098 padre da ogni processo figlio, in generale i processi risolvono i
7099 \itindsub{pathname}{assoluto} \textit{pathname} assoluti a partire sempre
7100 dalla stessa directory, che corrisponde alla radice del sistema.
7102 In certe situazioni però è utile poter impedire che un processo possa accedere
7103 a tutto il filesystem; per far questo si può cambiare la sua directory radice
7104 con la funzione \funcd{chroot}, il cui prototipo è:
7105 \begin{prototype}{unistd.h}{int chroot(const char *path)}
7106 Cambia la directory radice del processo a quella specificata da
7109 \bodydesc{La funzione restituisce zero in caso di successo e -1 per
7110 un errore, in caso di errore \var{errno} può assumere i valori:
7112 \item[\errcode{EPERM}] l'\ids{UID} effettivo del processo non è zero.
7114 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
7115 \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EACCES}, \errval{ELOOP};
7116 \errval{EROFS} e \errval{EIO}.}
7118 \noindent in questo modo la directory radice del processo diventerà
7119 \param{path} (che ovviamente deve esistere) ed ogni
7120 \itindsub{pathname}{assoluto}\textit{pathname} assoluto usato dalle funzioni
7121 chiamate nel processo sarà risolto a partire da essa, rendendo impossibile
7122 accedere alla parte di albero sovrastante. Si ha così quella che viene
7123 chiamata una \textit{chroot jail}, in quanto il processo non può più accedere
7124 a file al di fuori della sezione di albero in cui è stato
7125 \textsl{imprigionato}.
7127 Solo un processo con i privilegi di amministratore può usare questa funzione,
7128 e la nuova radice, per quanto detto in sez.~\ref{sec:proc_fork}, sarà ereditata
7129 da tutti i suoi processi figli. Si tenga presente però che la funzione non
7130 cambia la directory di lavoro, che potrebbe restare fuori dalla \textit{chroot
7133 Questo è il motivo per cui la funzione è efficace solo se dopo averla eseguita
7134 si cedono i privilegi di root. Infatti se per un qualche motivo il processo
7135 resta con \index{directory~di~lavoro} la directory di lavoro fuori dalla
7136 \textit{chroot jail}, potrà comunque accedere a tutto il resto del filesystem
7137 usando \itindsub{pathname}{relativo}\textit{pathname} relativi, i quali,
7138 partendo dalla directory di lavoro che è fuori della \textit{chroot jail},
7139 potranno (con l'uso di ``\texttt{..}'') risalire fino alla radice effettiva
7142 Ma se ad un processo restano i privilegi di amministratore esso potrà comunque
7143 portare la sua \index{directory~di~lavoro} directory di lavoro fuori dalla
7144 \textit{chroot jail} in cui si trova. Basta infatti creare una nuova
7145 \textit{chroot jail} con l'uso di \func{chroot} su una qualunque directory
7146 contenuta nell'attuale directory di lavoro. Per questo motivo l'uso di questa
7147 funzione non ha molto senso quando un processo necessita dei privilegi di root
7148 per le sue normali operazioni.
7150 Un caso tipico di uso di \func{chroot} è quello di un server FTP anonimo, in
7151 questo caso infatti si vuole che il server veda solo i file che deve
7152 trasferire, per cui in genere si esegue una \func{chroot} sulla directory che
7153 contiene i file. Si tenga presente però che in questo caso occorrerà
7154 replicare all'interno della \textit{chroot jail} tutti i file (in genere
7155 programmi e librerie) di cui il server potrebbe avere bisogno.
7160 % TODO: trattare la funzione setns e i namespace file descriptors (vedi
7161 % http://lwn.net/Articles/407495/) introdotti con il kernel 3.0
7163 % TODO: spostare chroot e le funzioni affini relative ai container da qualche
7164 % parte diversa se è il caso.
7166 % LocalWords: sez like filesystem unlink MacOS Windows VMS inode kernel unistd
7167 % LocalWords: int const char oldpath newpath errno EXDEV EPERM st Smack SysV
7168 % LocalWords: EEXIST EMLINK EACCES ENAMETOOLONG ENOTDIR EFAULT ENOMEM EROFS ls
7169 % LocalWords: ELOOP ENOSPC EIO pathname nlink stat vfat fsck EISDIR ENOENT cap
7170 % LocalWords: POSIX socket fifo sticky root system call count crash init linux
7171 % LocalWords: descriptor remove rename rmdir stdio glibc libc NFS DT obj dup
7172 % LocalWords: ENOTEMPTY EBUSY mount point EINVAL soft symbolic tab symlink fig
7173 % LocalWords: dangling access chdir chmod chown creat exec lchown lstat mkdir
7174 % LocalWords: mkfifo mknod opendir pathconf readlink truncate path buff size
7175 % LocalWords: grub bootloader grep MAXSYMLINKS cat VFS sys dirname fcntl tv Py
7176 % LocalWords: dev umask IFREG IFBLK IFCHR IFIFO SVr sgid BSD SVID NULL from to
7177 % LocalWords: stream dirent EMFILE ENFILE dirfd SOURCE fchdir readdir struct
7178 % LocalWords: EBADF namlen HAVE thread entry result value argument fileno ext
7179 % LocalWords: name TYPE OFF RECLEN UNKNOWN REG SOCK CHR BLK type IFTODT DTTOIF
7180 % LocalWords: DTYPE off reclen seekdir telldir void rewinddir closedir select
7181 % LocalWords: namelist compar malloc qsort alphasort versionsort strcoll myls
7182 % LocalWords: strcmp DirScan direntry while current working home shell pwd get
7183 % LocalWords: getcwd ERANGE getwd change fd race condition tmpnam getfacl mark
7184 % LocalWords: string tmpdir TMP tempnam pfx TMPNAME suid tmp EXCL tmpfile pid
7185 % LocalWords: EINTR mktemp mkstemp stlib template filename XXXXXX OpenBSD buf
7186 % LocalWords: mkdtemp fstat filedes nell'header padding ISREG ISDIR ISCHR IFMT
7187 % LocalWords: ISBLK ISFIFO ISLNK ISSOCK IFSOCK IFLNK IFDIR ISUID UID ISGID GID
7188 % LocalWords: ISVTX IRUSR IWUSR IXUSR IRGRP IWGRP IXGRP IROTH IWOTH IXOTH OLD
7189 % LocalWords: blocks blksize holes lseek TRUNC ftruncate ETXTBSY length QCMD
7190 % LocalWords: hole atime read utime mtime write ctime modification leafnode cp
7191 % LocalWords: make fchmod fchown utimbuf times actime modtime Mac owner uid fs
7192 % LocalWords: gid Control List patch mandatory control execute group other all
7193 % LocalWords: effective passwd IGID locking swap saved text IRWXU IRWXG subcmd
7194 % LocalWords: IRWXO capability FSETID mask capabilities chroot jail QUOTAOFF
7195 % LocalWords: FTP filter Attributes Solaris FreeBSD libacl hash at dqblk SYNC
7196 % LocalWords: XFS SELinux namespace attribute security trusted Draft Modules
7197 % LocalWords: attributes mime ADMIN FOWNER libattr lattr getxattr lgetxattr of
7198 % LocalWords: fgetxattr attr ssize ENOATTR ENOTSUP NUL setxattr lsetxattr list
7199 % LocalWords: fsetxattr flags XATTR REPLACE listxattr llistxattr flistxattr by
7200 % LocalWords: removexattr lremovexattr fremovexattr attributename acl GETINFO
7201 % LocalWords: OBJ setfacl len any prefix separator options NUMERIC IDS SMART
7202 % LocalWords: INDENT major number IDE Documentation makedev proc copy LNK long
7203 % LocalWords: euidaccess eaccess delete def tag qualifier permset calendar NOW
7204 % LocalWords: mutt noatime relatime strictatime atim nsec mtim ctim atimensec
7205 % LocalWords: mtimensec utimes timeval futimes lutimes ENOSYS futimens OMIT PR
7206 % LocalWords: utimensat timespec sec futimesat LIDS DAC OVERRIDE SEARCH chattr
7207 % LocalWords: Discrectionary KILL SETGID domain SETUID setuid setreuid SETPCAP
7208 % LocalWords: setresuid setfsuid IMMUTABLE immutable append only BIND SERVICE
7209 % LocalWords: BROADCAST broadcast multicast multicasting RAW PACKET IPC LOCK
7210 % LocalWords: memory mlock mlockall shmctl mmap MODULE RAWIO ioperm iopl PACCT
7211 % LocalWords: ptrace accounting NICE RESOURCE TTY CONFIG hangup vhangup dell'
7212 % LocalWords: LEASE lease SETFCAP AUDIT permitted inherited inheritable AND nn
7213 % LocalWords: bounding execve fork capget capset header hdrp datap ESRCH undef
7214 % LocalWords: version libcap lcap clear ncap caps pag capgetp CapInh CapPrm RT
7215 % LocalWords: fffffeff CapEff getcap scheduling lookup dqinfo SETINFO GETFMT
7216 % LocalWords: NEWNS unshare nice NUMA ioctl journaling close XOPEN fdopendir
7217 % LocalWords: btrfs mkostemp extN ReiserFS JFS Posix usrquota grpquota EDQUOT
7218 % LocalWords: aquota quotacheck limit grace period quotactl cmd caddr addr dqb
7219 % LocalWords: QUOTAON ENODEV ENOPKG ENOTBLK GETQUOTA SETQUOTA SETUSE SETQLIM
7220 % LocalWords: forced allowed sendmail SYSLOG WAKE ALARM CLOCK BOOTTIME dqstats
7221 % LocalWords: REALTIME securebits GETSTATS QFMT curspace curinodes btime itime
7222 % LocalWords: QIF BLIMITS bhardlimit bsoftlimit ILIMITS ihardlimit isoftlimit
7223 % LocalWords: INODES LIMITS USAGE valid dqi IIF BGRACE bgrace IGRACE igrace is
7224 % LocalWords: Python Truelite Srl quotamodule Repository who nell' dall' KEEP
7225 % LocalWords: SECURE KEEPCAPS prctl FIXUP NOROOT LOCKED dell'IPC dell'I IOPRIO
7226 % LocalWords: CAPBSET CLASS IDLE dcookie overflow DIFFERS Virtual everything
7227 % LocalWords: dentry register resolution cache dcache operation llseek poll ln
7228 % LocalWords: multiplexing fsync fasync seek block superblock gapil tex img du
7229 % LocalWords: second linked journaled source filesystemtype unsigned device
7230 % LocalWords: mountflags NODEV ENXIO dummy devfs magic MGC RDONLY NOSUID MOVE
7231 % LocalWords: NOEXEC SYNCHRONOUS REMOUNT MANDLOCK NODIRATIME umount MNT statfs
7232 % LocalWords: fstatfs fstab mntent ino bound orig new setpcap metadati sysfs
7234 %%% Local Variables:
7236 %%% TeX-master: "gapil"
7238 % LocalWords: bind DIRSYNC lsattr Hierarchy FHS SHARED UNBINDABLE shared REC
7239 % LocalWords: subtree SILENT log unbindable BUSY EAGAIN EXPIRE DETACH NOFOLLOW