3 %% Copyright (C) 2000-2011 Simone Piccardi. Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
12 \chapter{La gestione di file e directory}
13 \label{cha:files_and_dirs}
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando da un approfondimento dell'architettura del
17 sistema illustrata a grandi linee in sez.~\ref{sec:file_arch_overview} ed
18 illustrando le principali caratteristiche di un filesystem e le interfacce
19 che consentono di controllarne il montaggio e lo smontaggio.
21 Esamineremo poi le funzioni di libreria che si usano per copiare, spostare e
22 cambiare i nomi di file e directory e l'interfaccia che permette la
23 manipolazione dei loro attributi. Tratteremo inoltre la struttura di base del
24 sistema delle protezioni e del controllo dell'accesso ai file e le successive
25 estensioni (\textit{Extended Attributes}, ACL, quote disco,
26 \textit{capabilities}). Tutto quello che riguarda invece la gestione dell'I/O
27 sui file è lasciato al capitolo successivo.
31 \section{L'architettura della gestione dei file}
32 \label{sec:file_arch_func}
34 In questa sezione tratteremo con maggiori dettagli rispetto a quanto visto in
35 sez.~\ref{sec:file_arch_overview} il \textit{Virtual File System} di Linux e
36 come il kernel può gestire diversi tipi di filesystem, descrivendo prima le
37 caratteristiche generali di un filesystem di un sistema unix-like, per poi
38 fare una panoramica sul filesystem più usato con Linux, l'\acr{ext2} ed i suoi
42 \subsection{Il funzionamento del \textit{Virtual File System} di Linux}
43 \label{sec:file_vfs_work}
45 % NOTE articolo interessante:
46 % http://www.ibm.com/developerworks/linux/library/l-virtual-filesystem-switch/index.html?ca=dgr-lnxw97Linux-VFSdth-LXdW&S_TACT=105AGX59&S_CMP=GRlnxw97
48 \itindbeg{Virtual~File~System}
50 Come illustrato brevemente in sez.~\ref{sec:file_arch_overview} in Linux il
51 concetto di \textit{everything is a file} è stato implementato attraverso il
52 \textit{Virtual File System}, la cui struttura generale è illustrata in
53 fig.~\ref{fig:file_VFS_scheme}. Il VFS definisce un insieme di funzioni che
54 tutti i filesystem devono implementare per l'accesso ai file che contengono e
55 l'interfaccia che consente di eseguire l'I/O sui file, che questi siano di
60 L'interfaccia fornita dal VFS comprende in sostanza tutte le funzioni che
61 riguardano i file, le operazioni implementate dal VFS sono realizzate con una
62 astrazione che prevede quattro tipi di oggetti strettamente correlati: i
63 filesystem, le \textit{dentry}, gli \textit{inode} ed i file. A questi oggetti
64 corrispondono una serie di apposite strutture definite dal kernel che
65 contengono come campi le funzioni di gestione e realizzano l'infrastruttura
66 del VFS. L'interfaccia è molto complessa, ne faremo pertanto una trattazione
67 estremamente semplificata che consenta di comprenderne i principi
70 Il VFS usa una tabella mantenuta dal kernel che contiene il nome di ciascun
71 filesystem supportato, quando si vuole inserire il supporto di un nuovo
72 filesystem tutto quello che occorre è chiamare la funzione
73 \code{register\_filesystem} passando come argomento la struttura
74 \kstruct{file\_system\_type} (la cui definizione è riportata in
75 fig.~\ref{fig:kstruct_file_system_type}) relativa a quel filesystem. Questa
76 verrà inserita nella tabella, ed il nuovo filesystem comparirà in
77 \procfile{/proc/filesystems}.
80 \footnotesize \centering
81 \begin{minipage}[c]{\textwidth}
82 \includestruct{listati/file_system_type.h}
85 \caption{Estratto della struttura \kstructd{file\_system\_type} usata dal
86 VFS (da \texttt{include/linux/fs.h}).}
87 \label{fig:kstruct_file_system_type}
90 La struttura \kstruct{file\_system\_type}, oltre ad una serie di dati interni,
91 come il nome del tipo di filesystem nel campo \var{name},\footnote{quello che
92 viene riportato in \procfile{/proc/filesystems} e che viene usato come
93 valore del parametro dell'opzione \texttt{-t} del comando \texttt{mount} che
94 indica il tipo di filesystem.} contiene i riferimenti alle funzioni di base
95 che consentono l'utilizzo di quel filesystem. In particolare la funzione
96 \code{mount} del quarto campo è quella che verrà invocata tutte le volte che
97 si dovrà effettuare il montaggio di un filesystem di quel tipo. Per ogni nuovo
98 filesystem si dovrà allocare una di queste strutture ed inizializzare i
99 relativi campi con i dati specifici di quel filesystem, ed in particolare si
100 dovrà creare anche la relativa versione della funzione \code{mount}.
104 Come illustrato in fig.~\ref{fig:kstruct_file_system_type} questa funzione
105 restituisce una \textit{dentry}, abbreviazione che sta per \textit{directory
106 entry}. Le \textit{dentry} sono gli oggetti che il kernel usa per eseguire
107 la \textit{pathname resolution}, ciascuna di esse corrisponde ad un
108 \textit{pathname} e contiene il riferimento ad un \textit{inode}, che come
109 vedremo a breve è l'oggetto usato dal kernel per identificare un un
110 file.\footnote{in questo caso si parla di file come di un qualunque oggetto
111 generico che sta sul filesystem e non dell'oggetto file del VFS cui
112 accennavamo prima.} La \textit{dentry} ottenuta dalla chiamata alla funzione
113 \code{mount} sarà inserita in corrispondenza al \textit{pathname} della
114 directory in cui il filesystem è stato montato.
116 % NOTA: struct dentry è dichiarata in include/linux/dcache.h
118 Le \textit{dentry} sono oggetti del VFS che vivono esclusivamente in memoria,
119 nella cosiddetta \textit{directory entry cache} (spesso chiamata in breve
120 \textit{dcache}). Ogni volta che una \textit{system call} specifica un
121 \textit{pathname} viene effettuata una ricerca nella \textit{dcache} per
122 ottenere immediatamente la \textit{dentry} corrispondente,\footnote{il buon
123 funzionamento della \textit{dcache} è in effetti di una delle parti più
124 critiche per le prestazioni del sistema.} che a sua volta ci darà, tramite
125 l'\textit{inode}, il riferimento al file.
127 Dato che normalmente non è possibile mantenere nella \textit{dcache} le
128 informazioni relative a tutto l'albero dei file la procedura della
129 \textit{pathname resolution} richiede un meccanismo con cui riempire gli
130 eventuali vuoti. Il meccanismo prevede che tutte le volte che si arriva ad una
131 \textit{dentry} mancante venga invocata la funzione \texttt{lookup}
132 dell'\textit{inode} associato alla \textit{dentry} precedente nella
133 risoluzione del \textit{pathname},\footnote{che a questo punto è una
134 directory, per cui si può cercare al suo interno il nome di un file.} il cui
135 scopo è risolvere il nome mancante e fornire la sua \textit{dentry} che a
136 questo punto verrà inserita nella cache.
138 Dato che tutte le volte che si monta un filesystem la funzione \texttt{mount}
139 della corrispondente \kstruct{file\_system\_type} inserisce la \textit{dentry}
140 iniziale nel \itindex{mount~point} \textit{mount point} dello stesso si avrà
141 comunque un punto di partenza. Inoltre essendo questa \textit{dentry} relativa
142 a quel tipo di filesystem essa farà riferimento ad un \textit{inode} di quel
143 filesystem, e come vedremo questo farà sì che venga eseguita una
144 \texttt{lookup} adatta per effettuare la risoluzione dei nomi per quel
149 % Un secondo effetto della chiamata funzione \texttt{mount} di
150 % \kstruct{file\_system\_type} è quello di allocare una struttura
151 % \kstruct{super\_block} per ciascuna istanza montata, che contiene le
152 % informazioni generali di un qualunque filesystem montato, come le opzioni di
153 % montaggio, le dimensioni dei blocchi, quando il filesystem è stato montato
154 % ecc. Fra queste però viene pure inserta, nel campo \var{s\_op}, una ulteriore
155 % struttura \kstruct{super\_operations}, il cui contenuto sono i puntatori
156 % alle funzioni di gestione di un filesystem, anche inizializzata in modo da
157 % utilizzare le versioni specifiche di quel filesystem.
159 L'oggetto più importante per il funzionamento del VFS è probabilmente
160 l'\textit{inode}, ma con questo nome si può fare riferimento a due cose
161 diverse. La prima è la struttura su disco (su cui torneremo anche in
162 sez.~\ref{sec:file_filesystem}) che fa parte della organizzazione dei dati
163 realizzata dal filesystem e che contiene le informazioni relative alle
164 proprietà (i cosiddetti \textsl{metadati}) di ogni oggetto presente su di esso
165 (si intende al solito uno qualunque dei tipi di file di
166 tab.~\ref{tab:file_file_types}).
168 La seconda è la corrispondente struttura \kstruct{inode}, della cui
169 definizione si è riportato un estratto in
170 fig.~\ref{fig:kstruct_inode}.\footnote{l'estratto fa riferimento alla versione
171 del kernel 2.6.37.} Questa struttura viene mantenuta in memoria ed è a
172 questa che facevamo riferimento quando parlavamo dell'\textit{inode} associato
173 a ciascuna \textit{dentry}. Nella struttura in memoria sono presenti gli
174 stessi \textsl{metadati} memorizzati su disco, che vengono letti quando questa
175 struttura viene allocata e trascritti all'indietro se modificati.
178 \footnotesize \centering
179 \begin{minipage}[c]{\textwidth}
180 \includestruct{listati/inode.h}
183 \caption{Estratto della struttura \kstructd{inode} del kernel (da
184 \texttt{include/linux/fs.h}).}
185 \label{fig:kstruct_inode}
188 Il fatto che la struttura \kstruct{inode} sia mantenuta in memoria,
189 direttamente associata ad una \textit{dentry}, rende sostanzialmente immediate
190 le operazioni che devono semplicemente effettuare un accesso ai dati in essa
191 contenuti: è così ad esempio che viene realizzata la \textit{system call}
192 \func{stat} che vedremo in sez.~\ref{sec:file_stat}. Rispetto ai dati salvati
193 sul disco questa struttura contiene però anche quanto necessario alla
194 implementazione del VFS, ed in particolare è importante il campo \var{i\_op}
195 che, come illustrato in fig.~\ref{fig:kstruct_inode}, contiene il puntatore ad
196 una struttura di tipo \kstruct{inode\_operation}, la cui definizione si può
197 trovare nel file \texttt{include/kernel/fs.h} dei sorgenti del kernel.
199 Questa struttura non è altro che una tabella di funzioni, ogni suo membro cioè
200 è un puntatore ad una funzione e, come suggerisce il nome della struttura
201 stessa, queste funzioni sono quelle che definiscono le operazioni che il VFS
202 può compiere su un \textit{inode}. Si sono riportate in
203 tab.~\ref{tab:file_inode_operations} le più rilevanti.
208 \begin{tabular}[c]{|l|l|}
210 \textbf{Funzione} & \textbf{Operazione} \\
213 \textsl{\code{create}} & Chiamata per creare un nuovo file (vedi
214 sez.~\ref{sec:file_open}).\\
215 \textsl{\code{link}} & Crea un \textit{hard link} (vedi
216 sez.~\ref{sec:file_link}).\\
217 \textsl{\code{unlink}} & Cancella un \textit{hard link} (vedi
218 sez.~\ref{sec:file_link}).\\
219 \textsl{\code{symlink}}& Crea un link simbolico (vedi
220 sez.~\ref{sec:file_symlink}).\\
221 \textsl{\code{mkdir}} & Crea una directory (vedi
222 sez.~\ref{sec:file_dir_creat_rem}).\\
223 \textsl{\code{rmdir}} & Rimuove una directory (vedi
224 sez.~\ref{sec:file_dir_creat_rem}).\\
225 \textsl{\code{mknod}} & Crea un file speciale (vedi
226 sez.~\ref{sec:file_mknod}).\\
227 \textsl{\code{rename}} & Cambia il nome di un file (vedi
228 sez.~\ref{sec:file_remove}).\\
229 \textsl{\code{lookup}}& Risolve il nome di un file.\\
232 \caption{Le principali operazioni sugli \textit{inode} definite tramite
233 \kstruct{inode\_operation}.}
234 \label{tab:file_inode_operations}
237 Possiamo notare come molte di queste funzioni abbiano nomi sostanzialmente
238 identici alle varie \textit{system call} con le quali si gestiscono file e
239 directory, che tratteremo nel resto del capitolo. Quello che succede è che
240 tutte le volte che deve essere eseguita una \textit{system call}, o una
241 qualunque altra operazione su un \textit{inode} (come \texttt{lookup}) il VFS
242 andrà ad utilizzare la funzione corrispondente attraverso il puntatore
245 Sarà allora sufficiente che nella realizzazione di un filesystem si crei una
246 implementazione di queste funzioni per quel filesystem e si allochi una
247 opportuna istanza di \kstruct{inode\_operation} contenente i puntatori a dette
248 funzioni. A quel punto le strutture \kstruct{inode} usate per gli oggetti di
249 quel filesystem otterranno il puntatore alla relativa istanza di
250 \kstruct{inode\_operation} e verranno automaticamente usate le funzioni
253 Si noti però come in tab.~\ref{tab:file_inode_operations} non sia presente la
254 funzione \texttt{open} che invece è citata in
255 tab.~\ref{tab:file_file_operations}.\footnote{essa può essere comunque
256 invocata dato che nella struttura \kstruct{inode} è presente anche il
257 puntatore \func{i\_fop} alla struttura \kstruct{file\_operation} che
258 fornisce detta funzione.} Questo avviene perché su Linux l'apertura di un
259 file richiede comunque un'altra operazione che mette in gioco l'omonimo
260 oggetto del VFS: l'allocazione di una struttura di tipo \kstruct{file} che
261 viene associata ad ogni file aperto nel sistema.
263 I motivi per cui viene usata una struttura a parte sono diversi, anzitutto,
264 come illustrato in sez.~\ref{sec:file_fd}, questa è necessaria per le
265 operazioni eseguite dai processi con l'interfaccia dei file descriptor; ogni
266 processo infatti mantiene il riferimento ad una struttura \kstruct{file} per
267 ogni file che ha aperto, ed è tramite essa che esegue le operazioni di I/O.
269 Inoltre se le operazioni relative agli \textit{inode} fanno riferimento ad
270 oggetti posti all'interno di un filesystem e vi si applicano quindi le
271 funzioni fornite nell'implementazione di quest'ultimo, quando si apre un file
272 questo può essere anche un file di dispositivo, ed in questo caso il VFS
273 invece di usare le operazioni fornite dal filesystem (come farebbe per un file
274 di dati) dovrà invece ricorrere a quelle fornite dal driver del dispositivo.
279 \footnotesize \centering
280 \begin{minipage}[c]{\textwidth}
281 \includestruct{listati/file.h}
284 \caption{Estratto della struttura \kstructd{file} del kernel (da
285 \texttt{include/linux/fs.h}).}
286 \label{fig:kstruct_file}
289 Come si può notare dall'estratto di fig.~\ref{fig:kstruct_file}, la struttura
290 contiene, oltre ad alcune informazioni usate dall'interfaccia dei file
291 descriptor il cui significato emergerà più avanti, il puntatore \struct{f\_op}
292 ad una struttura \kstruct{file\_operation}. Questa è l'analoga per i file di
293 \kstruct{inode\_operation}, e definisce le operazioni generiche fornite dal
294 VFS per i file. Si sono riportate in tab.~\ref{tab:file_file_operations} le
300 \begin{tabular}[c]{|l|p{8cm}|}
302 \textbf{Funzione} & \textbf{Operazione} \\
305 \textsl{\code{open}} & Apre il file (vedi sez.~\ref{sec:file_open}).\\
306 \textsl{\code{read}} & Legge dal file (vedi sez.~\ref{sec:file_read}).\\
307 \textsl{\code{write}} & Scrive sul file (vedi
308 sez.~\ref{sec:file_write}).\\
309 \textsl{\code{llseek}} & Sposta la posizione corrente sul file (vedi
310 sez.~\ref{sec:file_lseek}).\\
311 \textsl{\code{ioctl}} & Accede alle operazioni di controllo
312 (vedi sez.~\ref{sec:file_ioctl}).\\
313 \textsl{\code{readdir}}& Legge il contenuto di una directory (vedi
314 sez.~\ref{sec:file_dir_read}).\\
315 \textsl{\code{poll}} & Usata nell'I/O multiplexing (vedi
316 sez.~\ref{sec:file_multiplexing}).\\
317 \textsl{\code{mmap}} & Mappa il file in memoria (vedi
318 sez.~\ref{sec:file_memory_map}).\\
319 \textsl{\code{release}}& Chiamata quando l'ultimo riferimento a un file
321 \textsl{\code{fsync}} & Sincronizza il contenuto del file (vedi
322 sez.~\ref{sec:file_sync}).\\
323 \textsl{\code{fasync}} & Abilita l'I/O asincrono (vedi
324 sez.~\ref{sec:file_asyncronous_io}) sul file.\\
327 \caption{Operazioni sui file definite tramite \kstruct{file\_operation}.}
328 \label{tab:file_file_operations}
331 Anche in questo caso tutte le volte che deve essere eseguita una
332 \textit{system call} o una qualunque altra operazione sul file il VFS andrà ad
333 utilizzare la funzione corrispondente attraverso il puntatore
334 \var{f\_op}. Dato che è cura del VFS quando crea la struttura all'apertura del
335 file, assegnare a \var{f\_op} il puntatore alla versione di
336 \kstruct{file\_operation} corretta per quel file, sarà possibile scrivere allo
337 stesso modo sulla porta seriale come su un normale file di dati, e lavorare
338 sui file allo stesso modo indipendentemente dal filesystem.
340 Il VFS realizza la quasi totalità delle operazioni relative ai file grazie
341 alle funzioni presenti nelle due strutture \kstruct{inode\_operation} e
342 \kstruct{file\_operation}. Ovviamente non è detto che tutte le operazioni
343 possibili siano poi disponibili in tutti i casi, ad esempio una \code{seek}
344 non è realizzabile per un dispositivo come la porta seriale o per una fifo,
345 mentre sui file del filesystem \texttt{vfat} non sono disponibili i permessi,
346 ma resta il fatto che grazie al VFS le \textit{system call} per le operazioni
347 sui file restano sempre le stesse nonostante le enormi differenze che possono
348 esserci negli oggetti a cui si applicano.
351 \itindend{Virtual~File~System}
353 % NOTE: documentazione interessante:
354 % * sorgenti del kernel: Documentation/filesystems/vfs.txt
355 % * http://thecoffeedesk.com/geocities/rkfs.html
356 % * http://www.linux.it/~rubini/docs/vfs/vfs.html
358 \subsection{Il funzionamento di un filesystem Unix}
359 \label{sec:file_filesystem}
361 Come già accennato in sez.~\ref{sec:file_arch_overview} Linux (ed ogni sistema
362 unix-like) organizza i dati che tiene su disco attraverso l'uso di un
363 filesystem. Una delle caratteristiche di Linux rispetto agli altri Unix è
364 quella di poter supportare, grazie al VFS, una enorme quantità di filesystem
365 diversi, ognuno dei quali avrà una sua particolare struttura e funzionalità
366 proprie. Per questo non entreremo nei dettagli di un filesystem specifico, ma
367 daremo una descrizione a grandi linee che si adatta alle caratteristiche
368 comuni di qualunque filesystem di un sistema unix-like.
370 Una possibile strutturazione dell'informazione su un disco è riportata in
371 fig.~\ref{fig:file_disk_filesys}, dove si hanno tre filesystem su tre
372 partizioni. In essa per semplicità si è fatto riferimento alla struttura del
373 filesystem \acr{ext2}, che prevede una suddivisione dei dati in \textit{block
374 group}. All'interno di ciascun \textit{block group} viene anzitutto
375 replicato il cosiddetto \textit{superblock}, (la struttura che contiene
376 l'indice iniziale del filesystem e che consente di accedere a tutti i dati
377 sottostanti) e creata una opportuna suddivisione dei dati e delle informazioni
378 per accedere agli stessi. Sulle caratteristiche di \acr{ext2} e derivati
379 torneremo in sez.~\ref{sec:file_ext2}.
383 È comunque caratteristica comune di tutti i filesystem per Unix,
384 indipendentemente da come poi viene strutturata nei dettagli questa
385 informazione, prevedere la presenza di due tipi di risorse: gli
386 \textit{inode}, cui abbiamo già accennato in sez.~\ref{sec:file_vfs_work}, che
387 sono le strutture che identificano i singoli oggetti sul filesystem, e i
388 blocchi, che invece attengono allo spazio disco che viene messo a disposizione
389 per i dati in essi contenuti.
393 \includegraphics[width=12cm]{img/disk_struct}
394 \caption{Organizzazione dello spazio su un disco in partizioni e
396 \label{fig:file_disk_filesys}
399 Se si va ad esaminare con maggiore dettaglio la strutturazione
400 dell'informazione all'interno del filesystem \textsl{ext2}, tralasciando i
401 dettagli relativi al funzionamento del filesystem stesso come la
402 strutturazione in gruppi dei blocchi, il \textit{superblock} e tutti i dati di
403 gestione possiamo esemplificare la situazione con uno schema come quello
404 esposto in fig.~\ref{fig:file_filesys_detail}.
408 \includegraphics[width=12cm]{img/filesys_struct}
409 \caption{Strutturazione dei dati all'interno di un filesystem.}
410 \label{fig:file_filesys_detail}
413 Da fig.~\ref{fig:file_filesys_detail} si evidenziano alcune delle
414 caratteristiche di base di un filesystem, che restano le stesse anche su
415 filesystem la cui organizzazione dei dati è totalmente diversa da quella
416 illustrata, e sulle quali è bene porre attenzione visto che sono fondamentali
417 per capire il funzionamento delle funzioni che manipolano i file e le
418 directory che tratteremo nel prosieguo del capitolo. In particolare è
419 opportuno tenere sempre presente che:
424 \item L'\textit{inode} contiene i cosiddetti \textsl{metadati}, vale dire le
425 informazioni riguardanti le proprietà del file come oggetto del filesystem:
426 il tipo di file, i permessi di accesso, le dimensioni, i puntatori ai
427 blocchi fisici che contengono i dati e così via. Le informazioni che la
428 funzione \func{stat} (vedi sez.~\ref{sec:file_stat}) fornisce provengono
429 dall'\textit{inode}. Dentro una directory si troverà solo il nome del file
430 e il numero dell'\textit{inode} ad esso associato; il nome non è una
431 proprietà del file e non viene mantenuto nell'\textit{inode}. Da da qui in
432 poi chiameremo il nome del file contenuto in una directory
433 ``\textsl{voce}'', come traduzione della nomenclatura inglese
434 \textit{directory entry} che non useremo per evitare confusione con le
435 \textit{dentry} del kernel viste in sez.~\ref{sec:file_vfs_work}.
437 \item Come mostrato in fig.~\ref{fig:file_filesys_detail} per i file
438 \texttt{macro.tex} e \texttt{gapil\_macro.tex}, ci possono avere più voci
439 che fanno riferimento allo stesso \textit{inode}. Fra le proprietà di un
440 file mantenute nell'\textit{inode} c'è anche il contatore con il numero di
441 riferimenti che sono stati fatti ad esso, il cosiddetto \textit{link
442 count}.\footnote{mantenuto anche nel campo \var{i\_nlink} della struttura
443 \kstruct{inode} di fig.~\ref{fig:kstruct_inode}.} Solo quando questo
444 contatore si annulla i dati del file possono essere effettivamente rimossi
445 dal disco. Per questo la funzione per cancellare un file si chiama
446 \func{unlink} (vedi sez.~\ref{sec:file_link}), ed in realtà non cancella
447 affatto i dati del file, ma si limita ad eliminare la relativa voce da una
448 directory e decrementare il numero di riferimenti nell'\textit{inode}.
450 \item All'interno di ogni filesystem ogni \textit{inode} è identificato da un
451 numero univoco. Il numero di \textit{inode} associato ad una voce in una
452 directory si riferisce ad questo numero e non ci può essere una directory
453 che contiene riferimenti ad \textit{inode} relativi ad altri filesystem.
454 Questa è la ragione che limita l'uso del comando \cmd{ln}, che crea una
455 nuova voce per un file esistente con la funzione \func{link} (vedi
456 sez.~\ref{sec:file_link}) a file nel filesystem corrente.
458 \item Quando si cambia nome ad un file senza cambiare filesystem il contenuto
459 del file non viene spostato fisicamente, viene semplicemente creata una
460 nuova voce per l'\textit{inode} in questione e rimossa la precedente, questa
461 è la modalità in cui opera normalmente il comando \cmd{mv} attraverso la
462 funzione \func{rename} (vedi sez.~\ref{sec:file_remove}). Questa operazione
463 non modifica minimamente neanche l'\textit{inode} del file, dato che non si
464 opera su questo ma sulla directory che lo contiene.
466 \item Gli \textit{inode} dei file, che contengono i \textsl{metadati} ed i
467 blocchi di spazio disco, che contengono i dati, sono risorse indipendenti ed
468 in genere vengono gestite come tali anche dai diversi filesystem; è pertanto
469 possibile esaurire sia lo spazio disco (il caso più comune) che lo spazio
470 per gli \textit{inode}. Nel primo caso non sarà possibile allocare ulteriore
471 spazio, ma si potranno creare file (vuoti), nel secondo non si potranno
472 creare nuovi file, ma si potranno estendere quelli che ci
473 sono.\footnote{questo comportamento non è generale, alcuni filesystem evoluti
474 possono evitare il problema dell'esaurimento degli \textit{inode}
475 riallocando lo spazio disco libero per i blocchi.}
481 \includegraphics[width=12cm]{img/dir_links}
482 \caption{Organizzazione dei \textit{link} per le directory.}
483 \label{fig:file_dirs_link}
486 Infine tenga presente che, essendo file pure loro, il numero di riferimenti
487 esiste anche per le directory. Per questo se a partire dalla situazione
488 mostrata in fig.~\ref{fig:file_filesys_detail} creiamo una nuova directory
489 \file{img} nella directory \file{gapil}, avremo una situazione come quella
490 illustrata in fig.~\ref{fig:file_dirs_link}.
492 La nuova directory avrà un numero di riferimenti pari a due, in quanto è
493 referenziata dalla directory da cui si era partiti (in cui è inserita la nuova
494 voce che fa riferimento a \texttt{img}) e dalla voce interna ``\texttt{.}''
495 che è presente in ogni directory. Questo è il valore che si troverà sempre
496 per ogni directory che non contenga a sua volta altre directory. Al contempo,
497 la directory da cui si era partiti avrà un numero di riferimenti di almeno
498 tre, in quanto adesso sarà referenziata anche dalla voce ``\texttt{..}'' di
499 \texttt{img}. L'aggiunta di una sottodirectory fa cioè crescere di uno il
500 \textit{link count} della directory genitrice.
505 \subsection{Alcuni dettagli sul filesystem \textsl{ext2} e successori}
506 \label{sec:file_ext2}
509 Benché non esista il filesystem di Linux, dato che esiste un supporto nativo
510 di diversi filesystem che sono in uso da anni, quello che gli avvicina di più
511 è la famiglia di filesystem evolutasi a partire dal \textit{second extended
512 filesystem}, o \acr{ext2}, che nonostante il nome è stato il primo ad essere
513 usato in maniera estensiva. Il filesystem \acr{ext2} ha subito un grande
514 sviluppo e diverse evoluzioni, fra cui l'aggiunta del \textit{journaling} con
515 \acr{ext3}, probabilmente ancora il filesystem più diffuso, ed una serie di
516 ulteriori miglioramento con il successivo \acr{ext4}, che sta iniziando a
517 sostituirlo gradualmente. In futuro è previsto che questo debba essere
518 sostituito da un filesystem completamente diverso, \acr{btrfs}, che dovrebbe
519 diventare il filesystem standard di Linux, ma questo al momento è ancora in
520 fase di sviluppo.\footnote{si fa riferimento al momento dell'ultima revisione
521 di di questo paragrafo, l'inizio del 2012.}
523 Il filesystem \acr{ext2} nasce come filesystem nativo per Linux a partire
524 dalle prime versioni del kernel e supporta tutte le caratteristiche di un
525 filesystem standard Unix: è in grado di gestire nomi di file lunghi (256
526 caratteri, estensibili a 1012) e supporta una dimensione massima dei file fino
527 a 4~Tb. I successivi filesystem \acr{ext3} ed \acr{ext4} sono evoluzioni di
528 questo filesystem, e sia pure con molti miglioramenti ed estensioni
529 significative ne mantengono le caratteristiche fondamentali.
531 Oltre alle caratteristiche standard, \acr{ext2} fornisce alcune estensioni che
532 non sono presenti su un classico filesystem di tipo Unix; le principali sono
535 \item i \textit{file attributes} consentono di modificare il comportamento del
536 kernel quando agisce su gruppi di file. Possono essere impostati su file e
537 directory e in quest'ultimo caso i nuovi file creati nella directory
538 ereditano i suoi attributi.
539 \item sono supportate entrambe le semantiche di BSD e SVr4 come opzioni di
540 montaggio. La semantica BSD comporta che i file in una directory sono creati
541 con lo stesso identificatore di gruppo della directory che li contiene. La
542 semantica SVr4 comporta che i file vengono creati con l'identificatore del
543 gruppo primario del processo, eccetto il caso in cui la directory ha il bit
544 di \acr{sgid} impostato (per una descrizione dettagliata del significato di
545 questi termini si veda sez.~\ref{sec:file_access_control}), nel qual caso
546 file e subdirectory ereditano sia il \acr{gid} che lo \acr{sgid}.
547 \item l'amministratore può scegliere la dimensione dei blocchi del filesystem
548 in fase di creazione, a seconda delle sue esigenze: blocchi più grandi
549 permettono un accesso più veloce, ma sprecano più spazio disco.
550 \item il filesystem implementa link simbolici veloci, in cui il nome del file
551 non è salvato su un blocco, ma tenuto all'interno \itindex{inode}
552 dell'\textit{inode} (evitando letture multiple e spreco di spazio), non
553 tutti i nomi però possono essere gestiti così per limiti di spazio (il
554 limite è 60 caratteri).
555 \item vengono supportati i file immutabili (che possono solo essere letti) per
556 la protezione di file di configurazione sensibili, o file
557 \textit{append-only} che possono essere aperti in scrittura solo per
558 aggiungere dati (caratteristica utilizzabile per la protezione dei file di
562 La struttura di \acr{ext2} è stata ispirata a quella del filesystem di BSD: un
563 filesystem è composto da un insieme di blocchi, la struttura generale è quella
564 riportata in fig.~\ref{fig:file_filesys_detail}, in cui la partizione è divisa
565 in gruppi di blocchi.
567 Ciascun gruppo di blocchi contiene una copia delle informazioni essenziali del
568 filesystem (i \textit{superblock} sono quindi ridondati) per una maggiore
569 affidabilità e possibilità di recupero in caso di corruzione del
570 \textit{superblock} principale. L'utilizzo di raggruppamenti di blocchi ha
571 inoltre degli effetti positivi nelle prestazioni dato che viene ridotta la
572 distanza fra i dati e la tabella degli \itindex{inode} inode.
576 \includegraphics[width=9cm]{img/dir_struct}
577 \caption{Struttura delle directory nel \textit{second extended filesystem}.}
578 \label{fig:file_ext2_dirs}
581 Le directory sono implementate come una \itindex{linked~list} \textit{linked
582 list} con voci di dimensione variabile. Ciascuna voce della lista contiene
583 il numero di inode \itindex{inode}, la sua lunghezza, il nome del file e la sua
584 lunghezza, secondo lo schema in fig.~\ref{fig:file_ext2_dirs}; in questo modo
585 è possibile implementare nomi per i file anche molto lunghi (fino a 1024
586 caratteri) senza sprecare spazio disco.
588 Con l'introduzione del filesystem \textit{ext3} sono state introdotte diverse
589 modifiche strutturali, la principale di queste è quella che \textit{ext3} è un
590 filesystem \textit{journaled}, è cioè in grado di eseguire una registrazione
591 delle operazioni di scrittura su un giornale (uno speciale file interno) in
592 modo da poter garantire il ripristino della coerenza dei dati del
593 filesystem\footnote{si noti bene che si è parlato di dati \textsl{del}
594 filesystem, non di dati \textsl{nel} filesystem, quello di cui viene
595 garantito un veloce ripristino è relativo ai dati della struttura interna
596 del filesystem, non di eventuali dati contenuti nei file che potrebbero
597 essere stati persi.} in brevissimo tempo in caso di interruzione improvvisa
598 della corrente o di crollo del sistema che abbia causato una interruzione
599 della scrittura dei dati sul disco.
601 Oltre a questo \textit{ext3} introduce ulteriori modifiche volte a migliorare
602 sia le prestazioni che la semplicità di gestione del filesystem, in
603 particolare per le directory si è passato all'uso di alberi binari con
604 indicizzazione tramite hash al posto delle \textit{linked list} che abbiamo
605 illustrato, ottenendo un forte guadagno di prestazioni in caso di directory
606 contenenti un gran numero di file.
608 % TODO portare a ext3, ext4 e btrfs ed illustrare le problematiche che si
609 % possono incontrare (in particolare quelle relative alla perdita di contenuti
610 % in caso di crash del sistema)
613 \subsection{La gestione dei filesystem}
614 \label{sec:sys_file_config}
616 Come accennato in sez.~\ref{sec:file_arch_overview} per poter accedere ai file
617 occorre prima rendere disponibile al sistema il filesystem su cui essi sono
618 memorizzati; l'operazione di attivazione del filesystem è chiamata
619 \textsl{montaggio}, per far questo in Linux si usa la funzione \funcd{mount}
620 il cui prototipo è:\footnote{la funzione è una versione specifica di Linux e
625 \fdecl{mount(const char *source, const char *target, const char
627 \phantom{mount(}unsigned long mountflags, const void *data)}
628 \fdesc{Monta un filesystem.}
631 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
632 caso \var{errno} assumerà uno dei valori:
634 \item[\errcode{EACCES}] non si ha il permesso di accesso su uno dei
635 componenti del \itindex{pathname} \textit{pathname}, o si è cercato di
636 montare un filesystem disponibile in sola lettura senza aver specificato
637 \const{MS\_RDONLY} o il device \param{source} è su un filesystem montato
638 con l'opzione \const{MS\_NODEV}.
639 \item[\errcode{EBUSY}] \param{source} è già montato, o non può essere
640 rimontato in sola lettura perché ci sono ancora file aperti in scrittura,
641 o non può essere montato su \param{target} perché la directory è ancora in
643 \item[\errcode{EINVAL}] il dispositivo \param{source} presenta un
644 \textit{superblock} non valido, o si è cercato di rimontare un filesystem
645 non ancora montato, o di montarlo senza che \param{target} sia un
646 \itindex{mount~point} \textit{mount point} o di spostarlo
647 quando \param{target} non è un \itindex{mount~point} \textit{mount point}
649 \item[\errcode{EMFILE}] la tabella dei device \textit{dummy} è piena.
650 \item[\errcode{ENODEV}] il tipo \param{filesystemtype} non esiste o non è
651 configurato nel kernel.
652 \item[\errcode{ENOTBLK}] non si è usato un \textit{block device} per
653 \param{source} quando era richiesto.
654 \item[\errcode{ENXIO}] il \itindex{major~number} \textit{major number} del
655 dispositivo \param{source} è sbagliato.
656 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
658 ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENOMEM},
659 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR} nel loro
660 significato generico.}
663 La funzione monta sulla directory indicata \param{target}, detta
664 \itindex{mount~point} \textit{mount point}, il filesystem contenuto nel file
665 di dispositivo indicato \param{source}. In entrambi i casi, come daremo per
666 assunto da qui in avanti tutte le volte che si parla di directory o file nel
667 passaggio di un argomento di una funzione, si intende che questi devono essere
668 indicati con la stringa contenente il loro \itindex{pathname}
671 In generale un filesystem è contenuto su un disco, e come illustrato in
672 sez.~\ref{sec:file_vfs_work} l'operazione di montaggio corrisponde a rendere
673 visibile il contenuto del suddetto disco, identificato attraverso il file di
674 dispositivo ad esso associato, all'interno di una directory dell'albero dei
677 Ma la struttura del \textit{Virtual File System} vista in
678 sez.~\ref{sec:file_vfs_work} è estremamente flessibile e può essere usata
679 anche per oggetti diversi da un disco. Ad esempio usando il \textit{loop
680 device} si può montare un file qualunque (come l'immagine di un CD-ROM o di
681 un floppy) che contiene un filesystem, inoltre alcuni filesystem, come
682 \file{proc} o \file{devfs} sono del tutto virtuali, i loro dati sono generati
683 al volo ad ogni lettura, e passati al kernel ad ogni scrittura.
685 Il tipo di filesystem è specificato dall'argomento \param{filesystemtype}, che
686 deve essere una delle stringhe riportate nel file
687 \procfile{/proc/filesystems}, che come accennato in
688 sez.~\ref{sec:file_vfs_work} contiene l'elenco dei filesystem supportati dal
689 kernel. Nel caso si sia indicato uno dei filesystem virtuali, che non è
690 associato a nessun file di dispositivo, il contenuto di \param{source} viene
693 L'argomento \param{data} viene usato per passare le impostazioni relative alle
694 caratteristiche specifiche di ciascun filesystem. Si tratta di una stringa di
695 parole chiave (separate da virgole e senza spazi) che indicano le opzioni del
696 filesytem che devono essere impostate, in sostanza viene usato il contenuto
697 del parametro dell'opzione \texttt{-o} del comando \texttt{mount}. I valori
698 utilizzabili dipendono dal tipo di filesystem e ciascuno ha i suoi, pertanto
699 si rimanda alla documentazione della pagina di manuale di questo comando.
701 Dopo l'esecuzione della funzione il contenuto del filesystem viene resto
702 disponibile nella directory specificata come \itindex{mount~point}
703 \textit{mount point}, il precedente contenuto di detta directory viene
704 mascherato dal contenuto della directory radice del filesystem montato.
706 Dal kernel 2.4.x inoltre è divenuto possibile sia spostare atomicamente un
707 \itindex{mount~point} \textit{mount point} da una directory ad un'altra, sia
708 montare in diversi \itindex{mount~point} \textit{mount point} lo stesso
709 filesystem, sia montare più filesystem sullo stesso \itindex{mount~point}
710 \textit{mount point}, nel qual caso vale quanto appena detto, e solo il
711 contenuto dell'ultimo filesystem montato sarà visibile.
713 Ciascun filesystem è dotato di caratteristiche specifiche che possono essere
714 attivate o meno, alcune di queste sono generali (anche se non è detto siano
715 disponibili in ogni filesystem), e vengono specificate come opzioni di
716 montaggio con l'argomento \param{mountflags}.
718 In Linux \param{mountflags} deve essere un intero a 32 bit i cui 16 più
719 significativi sono un \itindex{magic~number} \textit{magic
720 number}\footnote{che nel caso è \code{0xC0ED}, si può usare la costante
721 \const{MS\_MGC\_MSK} per ottenere la parte di \param{mountflags} riservata
722 al \textit{magic number}.} mentre i 16 meno significativi sono usati per
723 specificare le opzioni; essi sono usati come maschera binaria e vanno
724 impostati con un OR aritmetico della costante \const{MS\_MGC\_VAL} con i
725 valori riportati in tab.~\ref{tab:sys_mount_flags}.
730 \begin{tabular}[c]{|l|r|p{8cm}|}
732 \textbf{Parametro} & \textbf{Valore}&\textbf{Significato}\\
735 \const{MS\_RDONLY} & 1 & Monta in sola lettura.\\
736 \const{MS\_NOSUID} & 2 & Ignora i bit \itindex{suid~bit} \acr{suid} e
737 \itindex{sgid~bit} \acr{sgid}.\\
738 \const{MS\_NODEV} & 4 & Impedisce l'accesso ai file di dispositivo.\\
739 \const{MS\_NOEXEC} & 8 & Impedisce di eseguire programmi.\\
740 \const{MS\_SYNCHRONOUS}& 16 & Abilita la scrittura sincrona.\\
741 \const{MS\_REMOUNT} & 32 & Rimonta il filesystem cambiando le opzioni.\\
742 \const{MS\_MANDLOCK} & 64 & Consente il \textit{mandatory locking}
743 \itindex{mandatory~locking} (vedi
744 sez.~\ref{sec:file_mand_locking}).\\
745 \const{S\_WRITE} & 128 & Scrive normalmente.\\
746 \const{S\_APPEND} & 256 & Consente la scrittura solo in
747 \itindex{append~mode} \textit{append mode}
748 (vedi sez.~\ref{sec:file_sharing}).\\
749 \const{S\_IMMUTABLE} & 512 & Impedisce che si possano modificare i file.\\
750 \const{MS\_NOATIME} &1024 & Non aggiorna gli \textit{access time} (vedi
751 sez.~\ref{sec:file_file_times}).\\
752 \const{MS\_NODIRATIME}&2048 & Non aggiorna gli \textit{access time} delle
754 \const{MS\_BIND} &4096 & Monta il filesystem altrove.\\
755 \const{MS\_MOVE} &8192 & Sposta atomicamente il punto di montaggio.\\
758 \caption{Tabella dei codici dei flag di montaggio di un filesystem.}
759 \label{tab:sys_mount_flags}
762 % TODO aggiornare con i nuovi flag di man mount
763 % gli S_* non esistono più come segnalato da Alessio...
764 % verificare i readonly mount bind del 2.6.26
766 La funzione \func{mount} può essere utilizzata anche per effettuare il
767 \textsl{rimontaggio} di un filesystem, cosa che permette di cambiarne al volo
768 alcune delle caratteristiche di funzionamento (ad esempio passare da sola
769 lettura a lettura/scrittura). Questa operazione è attivata attraverso uno dei
770 bit di \param{mountflags}, \const{MS\_REMOUNT}, che se impostato specifica che
771 deve essere effettuato il rimontaggio del filesystem (con le opzioni
772 specificate dagli altri bit), anche in questo caso il valore di \param{source}
775 Una volta che non si voglia più utilizzare un certo filesystem è possibile
776 \textsl{smontarlo} usando la funzione \funcd{umount}, il cui prototipo è:
780 \fdecl{umount(const char *target)}
781 \fdesc{Smonta un filesystem.}
783 {La funzione ritorna $0$ in caso
784 di successo e $-1$ per un errore,
785 nel qual caso \var{errno} assumerà uno dei valori:
787 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
788 \item[\errcode{EBUSY}] \param{target} è la directory di lavoro di qualche
789 processo, o contiene dei file aperti, o un altro mount point.
790 \end{errlist}ed inoltre \errval{ENOTDIR}, \errval{EFAULT}, \errval{ENOMEM},
791 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ELOOP} nel loro
792 significato generico.}
795 La funzione prende il nome della directory su cui il filesystem è montato e
796 non il file o il dispositivo che è stato montato,\footnote{questo è vero a
797 partire dal kernel 2.3.99-pre7, prima esistevano due chiamate separate e la
798 funzione poteva essere usata anche specificando il file di dispositivo.} in
799 quanto con il kernel 2.4.x è possibile montare lo stesso dispositivo in più
800 punti. Nel caso più di un filesystem sia stato montato sullo stesso
801 \itindex{mount~point} \textit{mount point} viene smontato quello che è stato
804 Si tenga presente che la funzione fallisce quando il filesystem è
805 \textsl{occupato}, questo avviene quando ci sono ancora file aperti sul
806 filesystem, se questo contiene la directory di lavoro corrente di un qualunque
807 processo o il \itindex{mount~point} \textit{mount point} di un altro
808 filesystem; in questo caso l'errore restituito è \errcode{EBUSY}.
810 Linux provvede inoltre una seconda funzione, \funcd{umount2}, che in alcuni
811 casi permette di forzare lo smontaggio di un filesystem, anche quando questo
812 risulti occupato; il suo prototipo è:
815 \fdecl{umount2(const char *target, int flags)}
816 \fdesc{Smonta un filesystem.}
818 {La funzione è identica a \func{umount} per valori di ritorno e codici di
822 Il valore di \param{flags} è una maschera binaria, e al momento l'unico valore
823 definito è il bit \const{MNT\_FORCE}; gli altri bit devono essere nulli.
824 Specificando \const{MNT\_FORCE} la funzione cercherà di liberare il filesystem
825 anche se è occupato per via di una delle condizioni descritte in precedenza. A
826 seconda del tipo di filesystem alcune (o tutte) possono essere superate,
827 evitando l'errore di \errcode{EBUSY}. In tutti i casi prima dello smontaggio
828 viene eseguita una sincronizzazione dei dati.
830 % TODO documentare MNT_DETACH e MNT_EXPIRE ...
832 Altre due funzioni specifiche di Linux,\footnote{esse si trovano anche su BSD,
833 ma con una struttura diversa.} utili per ottenere in maniera diretta
834 informazioni riguardo al filesystem su cui si trova un certo file, sono
835 \funcd{statfs} e \funcd{fstatfs}, i cui prototipi sono:
839 \fdecl{int statfs(const char *path, struct statfs *buf)}
840 \fdecl{int fstatfs(int fd, struct statfs *buf)}
841 \fdesc{Restituiscono informazioni relative ad un filesystem.}
843 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
844 nel qual caso \var{errno} assumerà uno dei valori:
846 \item[\errcode{ENOSYS}] il filesystem su cui si trova il file specificato non
847 \end{errlist} ed inoltre \errval{EFAULT} ed \errval{EIO} per entrambe,
848 \errval{EBADF} per \func{fstatfs}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
849 \errval{ENOENT}, \errval{EACCES}, \errval{ELOOP} per \func{statfs} nel loro
850 significato generico.}
854 Queste funzioni permettono di ottenere una serie di informazioni generali
855 riguardo al filesystem su cui si trova il file specificato; queste vengono
856 restituite all'indirizzo \param{buf} di una struttura \struct{statfs} definita
857 come in fig.~\ref{fig:sys_statfs}, ed i campi che sono indefiniti per il
858 filesystem in esame sono impostati a zero. I valori del campo \var{f\_type}
859 sono definiti per i vari filesystem nei relativi file di header dei sorgenti
860 del kernel da costanti del tipo \var{XXX\_SUPER\_MAGIC}, dove \var{XXX} in
861 genere è il nome del filesystem stesso.
864 \footnotesize \centering
865 \begin{minipage}[c]{\textwidth}
866 \includestruct{listati/statfs.h}
869 \caption{La struttura \structd{statfs}.}
870 \label{fig:sys_statfs}
874 Le \acr{glibc} provvedono infine una serie di funzioni per la gestione dei due
875 file \conffile{/etc/fstab} ed \conffile{/etc/mtab}, che convenzionalmente sono
876 usati in quasi tutti i sistemi unix-like per mantenere rispettivamente le
877 informazioni riguardo ai filesystem da montare e a quelli correntemente
878 montati. Le funzioni servono a leggere il contenuto di questi file in
879 opportune strutture \struct{fstab} e \struct{mntent}, e, per
880 \conffile{/etc/mtab} per inserire e rimuovere le voci presenti nel file.
882 In generale si dovrebbero usare queste funzioni (in particolare quelle
883 relative a \conffile{/etc/mtab}), quando si debba scrivere un programma che
884 effettua il montaggio di un filesystem; in realtà in questi casi è molto più
885 semplice invocare direttamente il programma \cmd{mount}, per cui ne
886 tralasceremo la trattazione, rimandando al manuale delle \acr{glibc}
887 \cite{glibc} per la documentazione completa.
889 % TODO scrivere relativamente alle varie funzioni (getfsent e getmntent &C)
890 % TODO documentare swapon e swapoff (man 2 ...)
896 \section{La gestione di file e directory}
899 Come già accennato in sez.~\ref{sec:file_filesystem} in un sistema unix-like
900 la gestione dei file ha delle caratteristiche specifiche che derivano
901 direttamente dall'architettura del sistema. In questa sezione esamineremo le
902 funzioni usate per la manipolazione di file e directory, per la creazione di
903 link simbolici e diretti, per la gestione e la lettura delle directory.
905 In particolare ci soffermeremo sulle conseguenze che derivano
906 dall'architettura dei filesystem illustrata nel capitolo precedente per quanto
907 riguarda il comportamento e gli effetti delle varie funzioni.
910 \subsection{Le funzioni \func{link} e \func{unlink}}
911 \label{sec:file_link}
913 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
914 dei nomi fittizi (come gli alias del vecchio MacOS o i collegamenti di Windows
915 o i nomi logici del VMS) che permettono di fare riferimento allo stesso file
916 chiamandolo con nomi diversi o accedendovi da directory diverse.
918 Questo è possibile anche in ambiente Unix, dove tali collegamenti sono
919 usualmente chiamati \textit{link}; ma data l'architettura del sistema riguardo
920 la gestione dei file ci sono due metodi sostanzialmente diversi per fare
923 Come spiegato in sez.~\ref{sec:file_filesystem} l'accesso al contenuto di un
924 file su disco avviene passando attraverso il suo \itindex{inode}
925 \textit{inode}, che è la struttura usata dal kernel che lo identifica
926 univocamente all'interno di un singolo filesystem. Il nome del file che si
927 trova nella voce di una directory è solo un'etichetta, mantenuta all'interno
928 della directory, che viene associata ad un puntatore che fa riferimento al
929 suddetto \textit{inode}.
931 Questo significa che, fintanto che si resta sullo stesso filesystem, la
932 realizzazione di un link è immediata, ed uno stesso file può avere tanti nomi
933 diversi, dati da altrettante associazioni diverse allo stesso \itindex{inode}
934 \textit{inode} effettuate tramite ``etichette'' diverse in directory
935 diverse. Si noti anche che nessuno di questi nomi viene ad assumere una
936 particolare preferenza o originalità rispetto agli altri, in quanto tutti
937 fanno comunque riferimento allo stesso \itindex{inode} \textit{inode}.
939 Per aggiungere ad una directory una voce che faccia riferimento ad un
940 \itindex{inode} \textit{inode} già esistente si utilizza la funzione
941 \func{link}; si suole chiamare questo tipo di associazione un collegamento
942 diretto, o \textit{hard link}. Il prototipo della funzione è il seguente:
943 \begin{prototype}{unistd.h}
944 {int link(const char *oldpath, const char *newpath)}
945 Crea un nuovo collegamento diretto.
947 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
948 errore nel qual caso \var{errno} viene impostata ai valori:
950 \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
951 riferimento ad un filesystem montato sullo stesso \itindex{mount~point}
952 \textit{mount point}.
953 \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
954 \param{newpath} non supporta i link diretti o è una directory.
955 \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
957 \item[\errcode{EMLINK}] ci sono troppi link al file \param{oldpath} (il
958 numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
959 sez.~\ref{sec:sys_limits}).
961 ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOTDIR},
962 \errval{EFAULT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
963 \errval{ENOSPC}, \errval{EIO}.}
966 La funzione crea sul \itindex{pathname} \textit{pathname} \param{newpath} un
967 collegamento diretto al file indicato da \param{oldpath}. Per quanto detto la
968 creazione di un nuovo collegamento diretto non copia il contenuto del file, ma
969 si limita a creare una voce nella directory specificata da \param{newpath} e
970 ad aumentare di uno il numero di riferimenti al file (riportato nel campo
971 \var{st\_nlink} della struttura \struct{stat}, vedi sez.~\ref{sec:file_stat})
972 aggiungendo il nuovo nome ai precedenti. Si noti che uno stesso file può
973 essere così chiamato con vari nomi in diverse directory.
975 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
976 collegamento diretto è possibile solo se entrambi i \itindex{pathname}
977 \textit{pathname} sono nello stesso filesystem; inoltre il filesystem deve
978 supportare i collegamenti diretti (il meccanismo non è disponibile ad esempio
979 con il filesystem \acr{vfat} di Windows). In realtà la funzione ha un
980 ulteriore requisito, e cioè che non solo che i due file siano sullo stesso
981 filesystem, ma anche che si faccia riferimento ad essi sullo stesso
982 \itindex{mount~point} \textit{mount point}.\footnote{si tenga presente infatti
983 (vedi sez.~\ref{sec:sys_file_config}) che a partire dal kernel 2.4 uno
984 stesso filesystem può essere montato più volte su directory diverse.}
986 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
987 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
988 l'amministratore è in grado di creare un collegamento diretto ad un'altra
989 directory: questo viene fatto perché con una tale operazione è possibile
990 creare dei \textit{loop} nel filesystem (vedi l'esempio mostrato in
991 sez.~\ref{sec:file_symlink}, dove riprenderemo il discorso) che molti programmi
992 non sono in grado di gestire e la cui rimozione diventerebbe estremamente
993 complicata (in genere per questo tipo di errori occorre far girare il
994 programma \cmd{fsck} per riparare il filesystem).
996 Data la pericolosità di questa operazione e la disponibilità dei link
997 simbolici che possono fornire la stessa funzionalità senza questi problemi,
998 nel caso di Linux questa capacità è stata completamente disabilitata, e al
999 tentativo di creare un link diretto ad una directory la funzione \func{link}
1000 restituisce l'errore \errcode{EPERM}.
1002 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
1003 \textit{hard link} ad un link simbolico. In questo caso lo standard POSIX
1004 prevederebbe che quest'ultimo venga risolto e che il collegamento sia
1005 effettuato rispetto al file cui esso punta, e che venga riportato un errore
1006 qualora questo non esista o non sia un file. Questo era anche il comportamento
1007 iniziale di Linux ma a partire dai kernel della serie 2.0.x\footnote{per la
1008 precisione il comportamento era quello previsto dallo standard POSIX fino al
1009 kernel di sviluppo 1.3.56, ed è stato temporaneamente ripristinato anche
1010 durante lo sviluppo della serie 2.1.x, per poi tornare al comportamento
1011 attuale fino ad oggi (per riferimento si veda
1012 \href{http://lwn.net/Articles/293902}
1013 {\texttt{http://lwn.net/Articles/293902}}).} è stato adottato un
1014 comportamento che non segue più lo standard per cui l'\textit{hard link} viene
1015 creato rispetto al link simbolico, e non al file cui questo punta.
1017 La ragione di questa differenza rispetto allo standard, presente anche in
1018 altri sistemi unix-like, sono dovute al fatto che un link simbolico può fare
1019 riferimento anche ad un file non esistente o a una directory, per i quali
1020 l'\textit{hard link} non può essere creato, per cui la scelta di seguire il
1021 link simbolico è stata ritenuta una scelta scorretta nella progettazione
1022 dell'interfaccia. Infatti se non ci fosse il comportamento adottato da Linux
1023 sarebbe impossibile creare un \textit{hard link} ad un link simbolico, perché
1024 la funzione lo risolverebbe e l'\textit{hard link} verrebbe creato verso la
1025 destinazione. Invece evitando di seguire lo standard l'operazione diventa
1026 possibile, ed anche il comportamento della funzione risulta molto più
1027 comprensibile. Tanto più che se proprio se si vuole creare un \textit{hard
1028 link} rispetto alla destinazione di un link simbolico è sempre possibile
1029 farlo direttamente.\footnote{ciò non toglie che questo comportamento fuori
1030 standard possa causare problemi, come nell'esempio descritto nell'articolo
1031 citato nella nota precedente, a programmi che non si aspettano questa
1032 differenza rispetto allo standard POSIX.}
1034 La rimozione di un file (o più precisamente della voce che lo referenzia
1035 all'interno di una directory) si effettua con la funzione \funcd{unlink}; il
1036 suo prototipo è il seguente:
1037 \begin{prototype}{unistd.h}{int unlink(const char *pathname)}
1041 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1042 errore, nel qual caso il file non viene toccato. La variabile
1043 \var{errno} viene impostata secondo i seguenti codici di errore:
1045 \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una directory.
1047 \item[\errcode{EROFS}] \param{pathname} è su un filesystem montato in sola
1049 \item[\errcode{EISDIR}] \param{pathname} fa riferimento a una directory.
1051 ed inoltre: \errval{EACCES}, \errval{EFAULT}, \errval{ENOENT},
1052 \errval{ENOTDIR}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
1056 \footnotetext{questo è un valore specifico ritornato da Linux che non consente
1057 l'uso di \func{unlink} con le directory (vedi sez.~\ref{sec:file_remove}).
1058 Non è conforme allo standard POSIX, che prescrive invece l'uso di
1059 \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
1060 abbia privilegi sufficienti.}
1062 La funzione cancella il nome specificato da \param{pathname} nella relativa
1063 directory e decrementa il numero di riferimenti nel relativo \itindex{inode}
1064 \textit{inode}. Nel caso di link simbolico cancella il link simbolico; nel
1065 caso di socket, fifo o file di dispositivo \index{file!di~dispositivo} rimuove
1066 il nome, ma come per i file i processi che hanno aperto uno di questi oggetti
1067 possono continuare ad utilizzarlo.
1069 Per cancellare una voce in una directory è necessario avere il permesso di
1070 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
1071 il diritto di esecuzione sulla directory che la contiene (affronteremo in
1072 dettaglio l'argomento dei permessi di file e directory in
1073 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
1074 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
1075 occorrerà anche essere proprietari del file o proprietari della directory (o
1076 root, per cui nessuna delle restrizioni è applicata).
1078 Una delle caratteristiche di queste funzioni è che la creazione/rimozione del
1079 nome dalla directory e l'incremento/decremento del numero di riferimenti
1080 \itindex{inode} nell'\textit{inode} devono essere effettuati in maniera
1081 atomica (si veda sez.~\ref{sec:proc_atom_oper}) senza possibili interruzioni
1082 fra le due operazioni. Per questo entrambe queste funzioni sono realizzate
1083 tramite una singola system call.
1085 Si ricordi infine che un file non viene eliminato dal disco fintanto che tutti
1086 i riferimenti ad esso sono stati cancellati: solo quando il \textit{link
1087 count} mantenuto \itindex{inode} nell'\textit{inode} diventa zero lo spazio
1088 occupato su disco viene rimosso (si ricordi comunque che a questo si aggiunge
1089 sempre un'ulteriore condizione,\footnote{come vedremo in
1090 cap.~\ref{cha:file_unix_interface} il kernel mantiene anche una tabella dei
1091 file aperti nei vari processi, che a sua volta contiene i riferimenti agli
1092 \itindex{inode} \textit{inode} ad essi relativi. Prima di procedere alla
1093 cancellazione dello spazio occupato su disco dal contenuto di un file il
1094 kernel controlla anche questa tabella, per verificare che anche in essa non
1095 ci sia più nessun riferimento all'\textit{inode} in questione.} e cioè che
1096 non ci siano processi che abbiano il suddetto file aperto).
1098 Questa proprietà viene spesso usata per essere sicuri di non lasciare file
1099 temporanei su disco in caso di crash dei programmi; la tecnica è quella di
1100 aprire il file e chiamare \func{unlink} subito dopo, in questo modo il
1101 contenuto del file è sempre disponibile all'interno del processo attraverso il
1102 suo file descriptor (vedi sez.~\ref{sec:file_fd}) fintanto che il processo non
1103 chiude il file, ma non ne resta traccia in nessuna directory, e lo spazio
1104 occupato su disco viene immediatamente rilasciato alla conclusione del
1105 processo (quando tutti i file vengono chiusi).
1108 \subsection{Le funzioni \func{remove} e \func{rename}}
1109 \label{sec:file_remove}
1111 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
1112 \func{unlink} sulle directory; per cancellare una directory si può usare la
1113 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}), oppure la
1114 funzione \funcd{remove}.
1116 Questa è la funzione prevista dallo standard ANSI C per cancellare un file o
1117 una directory (e funziona anche per i sistemi che non supportano i link
1118 diretti). Per i file è identica a \func{unlink} e per le directory è identica
1119 a \func{rmdir}; il suo prototipo è:
1120 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
1121 Cancella un nome dal filesystem.
1123 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1124 errore, nel qual caso il file non viene toccato.
1126 I codici di errore riportati in \var{errno} sono quelli della chiamata
1127 utilizzata, pertanto si può fare riferimento a quanto illustrato nelle
1128 descrizioni di \func{unlink} e \func{rmdir}.}
1131 La funzione utilizza la funzione \func{unlink}\footnote{questo vale usando le
1132 \acr{glibc}; nelle libc4 e nelle libc5 la funzione \func{remove} è un
1133 semplice alias alla funzione \func{unlink} e quindi non può essere usata per
1134 le directory.} per cancellare i file e la funzione \func{rmdir} per
1135 cancellare le directory; si tenga presente che per alcune implementazioni del
1136 protocollo NFS utilizzare questa funzione può comportare la scomparsa di file
1139 Per cambiare nome ad un file o a una directory (che devono comunque essere
1140 nello stesso filesystem) si usa invece la funzione \funcd{rename},\footnote{la
1141 funzione è definita dallo standard ANSI C, ma si applica solo per i file, lo
1142 standard POSIX estende la funzione anche alle directory.} il cui prototipo
1144 \begin{prototype}{stdio.h}
1145 {int rename(const char *oldpath, const char *newpath)}
1149 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1150 errore, nel qual caso il file non viene toccato. La variabile
1151 \var{errno} viene impostata secondo i seguenti codici di errore:
1153 \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
1154 \param{oldpath} non è una directory.
1155 \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
1157 \item[\errcode{ENOTEMPTY}] \param{newpath} è una directory già esistente e
1159 \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
1160 parte di qualche processo (come directory di lavoro o come radice) o del
1161 sistema (come \itindex{mount~point} \textit{mount point}).
1162 \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
1163 \param{oldpath} o più in generale si è cercato di creare una directory come
1164 sotto-directory di se stessa.
1165 \item[\errcode{ENOTDIR}] uno dei componenti dei \itindex{pathname}
1166 \textit{pathname} non è una directory o \param{oldpath} è una directory e
1167 \param{newpath} esiste e non è una directory.
1169 ed inoltre \errval{EACCES}, \errval{EPERM}, \errval{EMLINK},
1170 \errval{ENOENT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP} e
1174 La funzione rinomina il file \param{oldpath} in \param{newpath}, eseguendo se
1175 necessario lo spostamento di un file fra directory diverse. Eventuali altri
1176 link diretti allo stesso file non vengono influenzati.
1178 Il comportamento della funzione è diverso a seconda che si voglia rinominare
1179 un file o una directory; se ci riferisce ad un file allora \param{newpath}, se
1180 esiste, non deve essere una directory (altrimenti si ha l'errore
1181 \errcode{EISDIR}). Nel caso \param{newpath} indichi un file esistente questo
1182 viene cancellato e rimpiazzato (atomicamente).
1184 Se \param{oldpath} è una directory allora \param{newpath}, se esiste, deve
1185 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
1186 (se non è una directory) o \errcode{ENOTEMPTY} (se non è vuota). Chiaramente
1187 \param{newpath} non può contenere \param{oldpath} altrimenti si avrà un errore
1190 Se \param{oldpath} si riferisce ad un link simbolico questo sarà rinominato; se
1191 \param{newpath} è un link simbolico verrà cancellato come qualunque altro
1192 file. Infine qualora \param{oldpath} e \param{newpath} siano due nomi dello
1193 stesso file lo standard POSIX prevede che la funzione non dia errore, e non
1194 faccia nulla, lasciando entrambi i nomi; Linux segue questo standard, anche
1195 se, come fatto notare dal manuale delle \textit{glibc}, il comportamento più
1196 ragionevole sarebbe quello di cancellare \param{oldpath}.
1198 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
1199 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
1200 può esistere cioè nessun istante in cui un altro processo può trovare attivi
1201 entrambi i nomi dello stesso file, o, in caso di sostituzione di un file
1202 esistente, non trovare quest'ultimo prima che la sostituzione sia stata
1205 In ogni caso se \param{newpath} esiste e l'operazione fallisce per un qualche
1206 motivo (come un crash del kernel), \func{rename} garantisce di lasciare
1207 presente un'istanza di \param{newpath}. Tuttavia nella sovrascrittura potrà
1208 esistere una finestra in cui sia \param{oldpath} che \param{newpath} fanno
1209 riferimento allo stesso file.
1212 \subsection{I link simbolici}
1213 \label{sec:file_symlink}
1215 Come abbiamo visto in sez.~\ref{sec:file_link} la funzione \func{link} crea
1216 riferimenti agli \itindex{inode} \textit{inode}, pertanto può funzionare
1217 soltanto per file che risiedono sullo stesso filesystem e solo per un
1218 filesystem di tipo Unix. Inoltre abbiamo visto che in Linux non è consentito
1219 eseguire un link diretto ad una directory.
1221 Per ovviare a queste limitazioni i sistemi Unix supportano un'altra forma di
1222 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
1223 come avviene in altri sistemi operativi, dei file speciali che contengono
1224 semplicemente il riferimento ad un altro file (o directory). In questo modo è
1225 possibile effettuare link anche attraverso filesystem diversi, a file posti in
1226 filesystem che non supportano i link diretti, a delle directory, ed anche a
1227 file che non esistono ancora.
1229 Il sistema funziona in quanto i link simbolici sono riconosciuti come tali dal
1230 kernel\footnote{è uno dei diversi tipi di file visti in
1231 tab.~\ref{tab:file_file_types}, contrassegnato come tale
1232 nell'\textit{inode}, e riconoscibile dal valore del campo \var{st\_mode}
1233 della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).} per cui
1234 alcune funzioni di libreria (come \func{open} o \func{stat}) quando ricevono
1235 come argomento un link simbolico vengono automaticamente applicate al file da
1236 esso specificato. La funzione che permette di creare un nuovo link simbolico
1237 è \funcd{symlink}, ed il suo prototipo è:
1238 \begin{prototype}{unistd.h}
1239 {int symlink(const char *oldpath, const char *newpath)}
1240 Crea un nuovo link simbolico di nome \param{newpath} il cui contenuto è
1243 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1244 errore, nel qual caso la variabile \var{errno} assumerà i valori:
1246 \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
1247 supporta i link simbolici.
1248 \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
1249 \param{oldpath} è una stringa vuota.
1250 \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
1251 \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
1254 ed inoltre \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
1255 \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{ENOSPC} e
1259 Si tenga presente che la funzione non effettua nessun controllo sull'esistenza
1260 di un file di nome \param{oldpath}, ma si limita ad inserire quella stringa
1261 nel link simbolico. Pertanto un link simbolico può anche riferirsi ad un file
1262 che non esiste: in questo caso si ha quello che viene chiamato un
1263 \textit{dangling link}, letteralmente un \textsl{link ciondolante}.
1265 Come accennato i link simbolici sono risolti automaticamente dal kernel
1266 all'invocazione delle varie system call; in tab.~\ref{tab:file_symb_effect} si
1267 è riportato un elenco dei comportamenti delle varie funzioni di libreria che
1268 operano sui file nei confronti della risoluzione dei link simbolici,
1269 specificando quali seguono il link simbolico e quali invece possono operare
1270 direttamente sul suo contenuto.
1274 \begin{tabular}[c]{|l|c|c|}
1276 \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
1279 \func{access} & $\bullet$ & -- \\
1280 \func{chdir} & $\bullet$ & -- \\
1281 \func{chmod} & $\bullet$ & -- \\
1282 \func{chown} & -- & $\bullet$ \\
1283 \func{creat} & $\bullet$ & -- \\
1284 \func{exec} & $\bullet$ & -- \\
1285 \func{lchown} & $\bullet$ & -- \\
1286 \func{link}\footnotemark & -- & $\bullet$ \\
1287 \func{lstat} & -- & $\bullet$ \\
1288 \func{mkdir} & $\bullet$ & -- \\
1289 \func{mkfifo} & $\bullet$ & -- \\
1290 \func{mknod} & $\bullet$ & -- \\
1291 \func{open} & $\bullet$ & -- \\
1292 \func{opendir} & $\bullet$ & -- \\
1293 \func{pathconf} & $\bullet$ & -- \\
1294 \func{readlink} & -- & $\bullet$ \\
1295 \func{remove} & -- & $\bullet$ \\
1296 \func{rename} & -- & $\bullet$ \\
1297 \func{stat} & $\bullet$ & -- \\
1298 \func{truncate} & $\bullet$ & -- \\
1299 \func{unlink} & -- & $\bullet$ \\
1302 \caption{Uso dei link simbolici da parte di alcune funzioni.}
1303 \label{tab:file_symb_effect}
1306 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
1307 dallo standard POSIX, si veda quanto detto in sez.~\ref{sec:file_link}.}
1309 Si noti che non si è specificato il comportamento delle funzioni che operano
1310 con i file descriptor, in quanto la risoluzione del link simbolico viene in
1311 genere effettuata dalla funzione che restituisce il file descriptor
1312 (normalmente la \func{open}, vedi sez.~\ref{sec:file_open}) e tutte le
1313 operazioni seguenti fanno riferimento solo a quest'ultimo.
1315 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
1316 \func{open} seguono i link simbolici, occorrono funzioni apposite per accedere
1317 alle informazioni del link invece che a quelle del file a cui esso fa
1318 riferimento. Quando si vuole leggere il contenuto di un link simbolico si usa
1319 la funzione \funcd{readlink}, il cui prototipo è:
1320 \begin{prototype}{unistd.h}
1321 {int readlink(const char *path, char *buff, size\_t size)}
1322 Legge il contenuto del link simbolico indicato da \param{path} nel buffer
1323 \param{buff} di dimensione \param{size}.
1325 \bodydesc{La funzione restituisce il numero di caratteri letti dentro
1326 \param{buff} o -1 per un errore, nel qual caso la variabile
1327 \var{errno} assumerà i valori:
1329 \item[\errcode{EINVAL}] \param{path} non è un link simbolico o \param{size}
1332 ed inoltre \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1333 \errval{EACCES}, \errval{ELOOP}, \errval{EIO}, \errval{EFAULT} e
1337 La funzione apre il link simbolico, ne legge il contenuto, lo scrive nel
1338 buffer, e lo richiude. Si tenga presente che la funzione non termina la
1339 stringa con un carattere nullo e la tronca alla dimensione specificata da
1340 \param{size} per evitare di sovrascrivere oltre le dimensioni del buffer.
1344 \includegraphics[width=8.5cm]{img/link_loop}
1345 \caption{Esempio di loop nel filesystem creato con un link simbolico.}
1346 \label{fig:file_link_loop}
1349 Un caso comune che si può avere con i link simbolici è la creazione dei
1350 cosiddetti \textit{loop}. La situazione è illustrata in
1351 fig.~\ref{fig:file_link_loop}, che riporta la struttura della directory
1352 \file{/boot}. Come si vede si è creato al suo interno un link simbolico che
1353 punta di nuovo a \file{/boot}.\footnote{il loop mostrato in
1354 fig.~\ref{fig:file_link_loop} è un usato per poter permettere a \cmd{grub}
1355 (un bootloader in grado di leggere direttamente da vari filesystem il file
1356 da lanciare come sistema operativo) di vedere i file contenuti nella
1357 directory \file{/boot} con lo stesso \textit{pathname} con cui verrebbero
1358 visti dal sistema operativo, anche se essi si trovano, come accade spesso,
1359 su una partizione separata (che \cmd{grub}, all'avvio, vede come radice).}
1361 Questo può causare problemi per tutti quei programmi che effettuano la
1362 scansione di una directory senza tener conto dei link simbolici, ad esempio se
1363 lanciassimo un comando del tipo \code{grep -r linux *}, il loop nella
1364 directory porterebbe il comando ad esaminare \file{/boot}, \file{/boot/boot},
1365 \file{/boot/boot/boot} e così via.
1367 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
1368 un \itindex{pathname} \textit{pathname} possano essere seguiti un numero
1369 limitato di link simbolici, il cui valore limite è specificato dalla costante
1370 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
1371 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}.
1373 Un punto da tenere sempre presente è che, come abbiamo accennato, un link
1374 simbolico può fare riferimento anche ad un file che non esiste; ad esempio
1375 possiamo creare un file temporaneo nella nostra directory con un link del
1378 $ ln -s /tmp/tmp_file temporaneo
1380 anche se \file{/tmp/tmp\_file} non esiste. Questo può generare confusione, in
1381 quanto aprendo in scrittura \file{temporaneo} verrà creato
1382 \file{/tmp/tmp\_file} e scritto; ma accedendo in sola lettura a
1383 \file{temporaneo}, ad esempio con \cmd{cat}, otterremmo:
1386 cat: temporaneo: No such file or directory
1388 con un errore che può sembrare sbagliato, dato che un'ispezione con \cmd{ls}
1389 ci mostrerebbe invece l'esistenza di \file{temporaneo}.
1392 \subsection{La creazione e la cancellazione delle directory}
1393 \label{sec:file_dir_creat_rem}
1395 Benché in sostanza le directory non siano altro che dei file contenenti
1396 elenchi di nomi ed \itindex{inode} \textit{inode}, non è possibile trattarle
1397 come file ordinari e devono essere create direttamente dal kernel attraverso
1398 una opportuna system call.\footnote{questo è quello che permette anche,
1399 attraverso l'uso del VFS, l'utilizzo di diversi formati per la gestione dei
1400 suddetti elenchi, dalle semplici liste a strutture complesse come alberi
1401 binari, hash, ecc. che consentono una ricerca veloce quando il numero di
1402 file è molto grande.} La funzione usata per creare una directory è
1403 \funcd{mkdir}, ed il suo prototipo è:
1405 \headdecl{sys/stat.h}
1406 \headdecl{sys/types.h}
1407 \funcdecl{int mkdir(const char *dirname, mode\_t mode)}
1409 Crea una nuova directory.
1411 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1412 errore, nel qual caso \var{errno} assumerà i valori:
1414 \item[\errcode{EEXIST}] un file (o una directory) con quel nome esiste di
1416 \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
1417 cui si vuole inserire la nuova directory.
1418 \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
1419 directory contiene troppi file; sotto Linux questo normalmente non avviene
1420 perché il filesystem standard consente la creazione di un numero di file
1421 maggiore di quelli che possono essere contenuti nel disco, ma potendo
1422 avere a che fare anche con filesystem di altri sistemi questo errore può
1424 \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
1425 la nuova directory o si è esaurita la quota disco dell'utente.
1427 ed inoltre anche \errval{EPERM}, \errval{EFAULT}, \errval{ENAMETOOLONG},
1428 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1432 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
1433 standard presenti in ogni directory (cioè ``\file{.}'' e ``\file{..}''), con
1434 il nome indicato dall'argomento \param{dirname}. Il nome può essere indicato
1435 sia come \itindex{pathname} \textit{pathname} assoluto che come
1436 \itindex{pathname} \textit{pathname} relativo.
1438 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
1439 directory viene creata sono specificati dall'argomento \param{mode}, i cui
1440 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
1441 tenga presente che questi sono modificati dalla maschera di creazione dei file
1442 (si veda sez.~\ref{sec:file_perm_management}). La titolarità della nuova
1443 directory è impostata secondo quanto riportato in
1444 sez.~\ref{sec:file_ownership_management}.
1446 La funzione che permette la cancellazione di una directory è invece
1447 \funcd{rmdir}, ed il suo prototipo è:
1448 \begin{prototype}{sys/stat.h}{int rmdir(const char *dirname)}
1449 Cancella una directory.
1451 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1452 errore, nel qual caso \var{errno} assumerà i valori:
1454 \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
1455 directory, oppure la directory che contiene \param{dirname} ha lo
1456 \itindex{sticky~bit} \textit{sticky bit} impostato e l'\acr{uid} effettivo
1457 del processo non corrisponde al proprietario della directory.
1458 \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
1459 che contiene la directory che si vuole cancellare, o non c'è il permesso
1460 di attraversare (esecuzione) una delle directory specificate in
1462 \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o la
1463 radice di qualche processo.
1464 \item[\errcode{ENOTEMPTY}] la directory non è vuota.
1466 ed inoltre anche \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1467 \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{EROFS}.}
1470 La funzione cancella la directory \param{dirname}, che deve essere vuota (la
1471 directory deve cioè contenere soltanto le due voci standard ``\file{.}'' e
1472 ``\file{..}''). Il nome può essere indicato con il \itindex{pathname}
1473 \textit{pathname} assoluto o relativo.
1475 La modalità con cui avviene la cancellazione è analoga a quella di
1476 \func{unlink}: fintanto che il numero di link \itindex{inode}
1477 all'\textit{inode} della directory non diventa nullo e nessun processo ha la
1478 directory aperta lo spazio occupato su disco non viene rilasciato. Se un
1479 processo ha la directory aperta la funzione rimuove il link \itindex{inode}
1480 all'\textit{inode} e nel caso sia l'ultimo, pure le voci standard ``\file{.}''
1481 e ``\file{..}'', a questo punto il kernel non consentirà di creare più nuovi
1482 file nella directory.
1485 \subsection{La creazione di file speciali}
1486 \label{sec:file_mknod}
1488 \index{file!di~dispositivo|(}
1490 Finora abbiamo parlato esclusivamente di file, directory e link simbolici; in
1491 sez.~\ref{sec:file_file_types} abbiamo visto però che il sistema prevede pure
1492 degli altri tipi di file speciali, come i file di dispositivo, le fifo ed i
1493 socket (questi ultimi sono un caso a parte, essendo associati anche alla
1494 comunicazione via rete, per cui ci saranno trattati in dettaglio a partire da
1495 cap.~\ref{cha:socket_intro}).
1497 La manipolazione delle caratteristiche di questi diversi tipi di file e la
1498 loro cancellazione può essere effettuata con le stesse funzioni che operano
1499 sui file regolari; ma quando li si devono creare sono necessarie delle
1500 funzioni apposite. La prima di queste funzioni è \funcd{mknod}, il cui
1503 \headdecl{sys/types.h}
1504 \headdecl{sys/stat.h}
1507 \funcdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)}
1509 Crea un \textit{inode} del tipo specificato sul filesystem.
1511 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1512 errore, nel qual caso \var{errno} assumerà i valori:
1514 \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
1515 l'\texttt{inode}, o il filesystem su cui si è cercato di
1516 creare \param{pathname} non supporta l'operazione.
1517 \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
1518 fifo, un socket o un dispositivo.
1519 \item[\errcode{EEXIST}] \param{pathname} esiste già o è un link simbolico.
1521 ed inoltre anche \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
1522 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
1523 \errval{ENOSPC}, \errval{EROFS}.}
1526 La funzione, come suggerisce il nome, permette di creare un ``\textsl{nodo}''
1527 sul filesystem, e viene in genere utilizzata per creare i file di dispositivo,
1528 ma si può usare anche per creare file regolari. L'argomento
1529 \param{mode} specifica sia il tipo di file che si vuole creare che i relativi
1530 permessi, secondo i valori riportati in tab.~\ref{tab:file_mode_flags}, che
1531 vanno combinati con un OR binario. I permessi sono comunque modificati nella
1532 maniera usuale dal valore di \itindex{umask} \textit{umask} (si veda
1533 sez.~\ref{sec:file_perm_management}).
1535 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
1536 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
1537 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
1538 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
1539 per una fifo;\footnote{con Linux la funzione non può essere usata per creare
1540 directory o link simbolici, si dovranno usare le funzioni \func{mkdir} e
1541 \func{symlink} a questo dedicate.} un valore diverso comporterà l'errore
1544 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
1545 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
1546 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
1547 valore verrà ignorato. Solo l'amministratore può creare un file di
1548 dispositivo usando questa funzione (il processo deve avere la
1549 \itindex{capabilities} \textit{capability} \const{CAP\_MKNOD}), ma in
1550 Linux\footnote{questo è un comportamento specifico di Linux, la funzione non è
1551 prevista dallo standard POSIX.1 originale, mentre è presente in SVr4 e
1552 4.4BSD, ma esistono differenze nei comportamenti e nei codici di errore,
1553 tanto che questa è stata introdotta in POSIX.1-2001 con una nota che la
1554 definisce portabile solo quando viene usata per creare delle fifo, ma
1555 comunque deprecata essendo utilizzabile a tale scopo la specifica
1556 \func{mkfifo}.} l'uso per la creazione di un file ordinario, di una fifo o
1557 di un socket è consentito anche agli utenti normali.
1559 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
1560 al proprietario e al gruppo del processo che li ha creati, a meno che non si
1561 sia attivato il bit \acr{sgid} per la directory o sia stata attivata la
1562 semantica BSD per il filesystem (si veda
1563 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
1564 \itindex{inode} l'\textit{inode}.
1566 Nella creazione di un file di dispositivo occorre poi specificare
1567 correttamente il valore di \param{dev}; questo infatti è di tipo
1568 \type{dev\_t}, che è un tipo primitivo (vedi
1569 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
1570 \textsl{numero} di dispositivo; il kernel infatti identifica ciascun
1571 dispositivo con un valore numerico. Originariamente questo era un intero a 16
1572 bit diviso in due parti di 8 bit chiamate rispettivamente
1573 \itindex{major~number} \textit{major number} e \itindex{minor~number}
1574 \textit{minor number}, che sono poi i due numeri mostrati dal comando
1575 \texttt{ls -l} al posto della dimensione quando lo si esegue su un file di
1578 Il \itindex{major~number} \textit{major number} identifica una classe di
1579 dispositivi (ad esempio la seriale, o i dischi IDE) e serve in sostanza per
1580 indicare al kernel quale è il modulo che gestisce quella classe di
1581 dispositivi; per identificare uno specifico dispositivo di quella classe (ad
1582 esempio una singola porta seriale, o una partizione di un disco) si usa invece
1583 il \itindex{minor~number} \textit{minor number}. L'elenco aggiornato di questi
1584 numeri con le relative corrispondenze ai vari dispositivi può essere trovato
1585 nel file \texttt{Documentation/devices.txt} allegato alla documentazione dei
1586 sorgenti del kernel.
1588 Data la crescita nel numero di dispositivi supportati, ben presto il limite
1589 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
1590 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
1591 \type{dev\_t}, con delle dimensioni passate a 12 bit per il
1592 \itindex{major~number} \textit{major number} e 20 bit per il
1593 \itindex{minor~number} \textit{minor number}. La transizione però ha anche
1594 comportato il passaggio di \type{dev\_t} a \index{tipo!opaco} tipo opaco, e la
1595 necessità di specificare il numero tramite delle opportune macro, così da non
1596 avere problemi di compatibilità con eventuali ulteriori estensioni.
1598 Le macro sono definite nel file \file{sys/sysmacros.h}, che viene
1599 automaticamente incluso quando si include \file{sys/types.h}; si possono
1600 pertanto ottenere i valori del \itindex{major~number} \textit{major number} e
1601 \itindex{minor~number} \textit{minor number} di un dispositivo rispettivamente
1602 con le macro \macro{major} e \macro{minor}:
1604 \headdecl{sys/types.h}
1605 \funcdecl{int \macro{major}(dev\_t dev)}
1606 Restituisce il \itindex{major~number} \textit{major number} del dispositivo
1609 \funcdecl{int \macro{minor}(dev\_t dev)}
1610 Restituisce il \itindex{minor~number} \textit{minor number} del dispositivo
1613 \noindent mentre una volta che siano noti \itindex{major~number} \textit{major
1614 number} e \itindex{minor~number} \textit{minor number} si potrà costruire il
1615 relativo identificativo con la macro \macro{makedev}:
1617 \headdecl{sys/types.h}
1618 \funcdecl{dev\_t \macro{minor}(int major, int minor)}
1620 Restituisce l'identificativo di un dispositivo dati \itindex{major~number}
1621 \textit{major number} e \itindex{minor~number} \textit{minor number}.
1624 \index{file!di~dispositivo|)}
1626 Infine con lo standard POSIX.1-2001 è stata introdotta una funzione specifica
1627 per creare una fifo (tratteremo le fifo in in sez.~\ref{sec:ipc_named_pipe});
1628 la funzione è \funcd{mkfifo} ed il suo prototipo è:
1630 \headdecl{sys/types.h} \headdecl{sys/stat.h}
1632 \funcdecl{int mkfifo(const char *pathname, mode\_t mode)}
1636 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1637 errore, nel qual caso \var{errno} assumerà i valori \errval{EACCES},
1638 \errval{EEXIST}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC},
1639 \errval{ENOTDIR} e \errval{EROFS}.}
1642 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
1643 per \func{mknod} il file \param{pathname} non deve esistere (neanche come link
1644 simbolico); al solito i permessi specificati da \param{mode} vengono
1645 modificati dal valore di \itindex{umask} \textit{umask}.
1649 \subsection{Accesso alle directory}
1650 \label{sec:file_dir_read}
1652 Benché le directory alla fine non siano altro che dei file che contengono
1653 delle liste di nomi ed \itindex{inode} \textit{inode}, per il ruolo che
1654 rivestono nella struttura del sistema, non possono essere trattate come dei
1655 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
1656 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
1657 può essere un processo a inserirvi direttamente delle voci con le usuali
1658 funzioni di scrittura.
1660 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
1661 kernel, sono molte le situazioni in cui i processi necessitano di poterne
1662 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
1663 in sez.~\ref{sec:file_open} che è possibile aprire una directory come se fosse
1664 un file, anche se solo in sola lettura) in generale il formato con cui esse
1665 sono scritte può dipendere dal tipo di filesystem, tanto che, come riportato
1666 in tab.~\ref{tab:file_file_operations}, il VFS del kernel prevede una apposita
1667 funzione per la lettura delle directory.
1669 Tutto questo si riflette nello standard POSIX\footnote{le funzioni erano
1670 presenti in SVr4 e 4.3BSD, la loro specifica è riportata in POSIX.1-2001.}
1671 che ha introdotto una apposita interfaccia per la lettura delle directory,
1672 basata sui cosiddetti \textit{directory stream} (chiamati così per l'analogia
1673 con i file stream dell'interfaccia standard ANSI C di
1674 cap.~\ref{cha:files_std_interface}). La prima funzione di questa interfaccia è
1675 \funcd{opendir}, il cui prototipo è:
1677 \headdecl{sys/types.h} \headdecl{dirent.h}
1679 \funcdecl{DIR * opendir(const char *dirname)}
1681 Apre un \textit{directory stream}.
1683 \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
1684 in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
1685 assumerà i valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
1686 \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}.}
1689 La funzione apre un \textit{directory stream} per la directory
1690 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
1691 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
1692 \textit{directory stream}) da usare per tutte le operazioni successive, la
1693 funzione inoltre posiziona lo stream sulla prima voce contenuta nella
1696 Si tenga presente che comunque la funzione opera associando il
1697 \textit{directory stream} ad un opportuno file descriptor sottostante, sul
1698 quale vengono compiute le operazioni. Questo viene sempre aperto impostando il
1699 flag di \itindex{close-on-exec} \textit{close-on-exec}, così da evitare che
1700 resti aperto in caso di esecuzione di un altro programma.
1702 Nel caso in cui sia necessario conoscere il \textit{file descriptor} associato
1703 ad un \textit{directory stream} si può usare la funzione
1704 \funcd{dirfd},\footnote{questa funzione è una estensione introdotta con BSD
1705 4.3-Reno ed è presente in Linux con le libc5 (a partire dalla versione
1706 5.1.2) e con le \acr{glibc} ma non presente in POSIX fino alla revisione
1707 POSIX.1-2008, per questo per poterla utilizzare fino alla versione 2.10
1708 delle \acr{glibc} era necessario definire le macro \macro{\_BSD\_SOURCE} o
1709 \macro{\_SVID\_SOURCE}, dalla versione 2.10 si possono usare anche
1710 \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o
1711 \texttt{\macro{\_XOPEN\_SOURCE} >= 700}.} il cui prototipo è:
1713 \headdecl{sys/types.h} \headdecl{dirent.h}
1715 \funcdecl{int dirfd(DIR * dir)}
1717 Restituisce il file descriptor associato ad un \textit{directory stream}.
1719 \bodydesc{La funzione restituisce il file descriptor (un valore positivo) in
1720 caso di successo e -1 in caso di errore.}
1723 La funzione restituisce il file descriptor associato al \textit{directory
1724 stream} \param{dir}. Di solito si utilizza questa funzione in abbinamento a
1725 funzioni che operano sui file descriptor, ad esempio si potrà usare
1726 \func{fstat} per ottenere le proprietà della directory, o \func{fchdir} per
1727 spostare su di essa la directory di lavoro (vedi
1728 sez.~\ref{sec:file_work_dir}).
1730 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
1731 possibile associarvi un \textit{directory stream} con la funzione
1732 \funcd{fdopendir},\footnote{questa funzione è però disponibile solo a partire
1733 dalla versione 2.4 delle \acr{glibc}, ed è stata introdotta nello standard
1734 POSIX solo a partire dalla revisione POSIX.1-2008, prima della versione 2.10
1735 delle \acr{glibc} per poterla utilizzare era necessario definire la macro
1736 \macro{\_GNU\_SOURCE}, dalla versione 2.10 si possono usare anche
1737 \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o \texttt{\_XOPEN\_SOURCE >=
1738 700} .} il cui prototipo è:
1740 \headdecl{sys/types.h} \headdecl{dirent.h}
1742 \funcdecl{DIR * fdopendir(int fd)}
1744 Associa un \textit{directory stream} al file descriptor \param{fd}.
1746 \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
1747 in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
1748 assumerà il valore \errval{EBADF}.}
1751 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
1752 stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
1753 stato aperto in precedenza; la funzione darà un errore qualora questo non
1754 corrisponda ad una directory. L'uso di questa funzione permette di rispondere
1755 agli stessi requisiti delle funzioni ``\textit{at}'' che vedremo in
1756 sez.~\ref{sec:file_openat}.
1758 Una volta utilizzata il file descriptor verrà usato internamente dalle
1759 funzioni che operano sul \textit{directory stream} e non dovrà essere più
1760 utilizzato all'interno del proprio programma; in particolare dovrà essere
1761 chiuso con \func{closedir} e non direttamente. Si tenga presente inoltre che
1762 \func{fdopendir} non modifica lo stato di un eventuale flag di
1763 \itindex{close-on-exec} \textit{close-on-exec}, che pertanto dovrà essere
1764 impostato esplicitamente in fase di apertura del file descriptor.
1766 Una volta che si sia aperto un \textit{directory stream} la lettura del
1767 contenuto della directory viene effettuata attraverso la funzione
1768 \funcd{readdir}; il suo prototipo è:
1770 \headdecl{sys/types.h} \headdecl{dirent.h}
1772 \funcdecl{struct dirent *readdir(DIR *dir)}
1774 Legge una voce dal \textit{directory stream}.
1776 \bodydesc{La funzione restituisce il puntatore alla struttura contenente i
1777 dati in caso di successo e \val{NULL} altrimenti, in caso di
1778 \textit{directory stream} non valido \var{errno} assumerà il valore
1779 \errval{EBADF}, il valore \val{NULL} viene restituito anche quando si
1780 raggiunge la fine dello stream.}
1783 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
1784 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
1785 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
1786 esaurite tutte le voci in essa presenti.
1788 \begin{figure}[!htb]
1789 \footnotesize \centering
1790 \begin{minipage}[c]{\textwidth}
1791 \includestruct{listati/dirent.c}
1794 \caption{La struttura \structd{dirent} per la lettura delle informazioni dei
1796 \label{fig:file_dirent_struct}
1799 I dati vengono memorizzati in una struttura \struct{dirent}, la cui
1800 definizione è riportata in fig.~\ref{fig:file_dirent_struct}.\footnote{la
1801 definizione è quella usata da Linux, che si trova nel file
1802 \file{/usr/include/bits/dirent.h}, essa non contempla la presenza del campo
1803 \var{d\_namlen} che indica la lunghezza del nome del file.} La funzione
1804 restituisce il puntatore alla struttura; si tenga presente però che
1805 quest'ultima è allocata staticamente, per cui viene sovrascritta tutte le
1806 volte che si ripete la lettura di una voce sullo stesso \textit{directory
1809 Di questa funzione esiste anche una versione \index{funzioni!rientranti}
1810 rientrante, \func{readdir\_r},\footnote{per usarla è necessario definire una
1811 qualunque delle macro \texttt{\macro{\_POSIX\_C\_SOURCE} >= 1},
1812 \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
1813 \macro{\_POSIX\_SOURCE}.} che non usa una struttura allocata staticamente, e
1814 può essere utilizzata anche con i \itindex{thread} \textit{thread}, il suo
1817 \headdecl{sys/types.h} \headdecl{dirent.h}
1819 \funcdecl{int readdir\_r(DIR *dir, struct dirent *entry,
1820 struct dirent **result)}
1822 Legge una voce dal \textit{directory stream}.
1824 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1825 errore, gli errori sono gli stessi di \func{readdir}.}
1828 La funzione restituisce in \param{result} (come
1829 \itindex{value~result~argument} \textit{value result argument}) l'indirizzo
1830 dove sono stati salvati i dati, che di norma corrisponde a quello della
1831 struttura precedentemente allocata e specificata dall'argomento \param{entry},
1832 anche se non è assicurato che la funzione usi lo spazio fornito dall'utente.
1834 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
1835 presenti nella directory; sia BSD che SVr4 prevedono che siano sempre presenti
1836 il campo \var{d\_name},\footnote{lo standard POSIX prevede invece solo la
1837 presenza del campo \var{d\_fileno}, identico \var{d\_ino}, che in Linux è
1838 definito come alias di quest'ultimo; il campo \var{d\_name} è considerato
1839 dipendente dall'implementazione.} che contiene il nome del file nella forma
1840 di una stringa terminata da uno zero,\footnote{lo standard POSIX non specifica
1841 una lunghezza, ma solo un limite \const{NAME\_MAX}; in SVr4 la lunghezza del
1842 campo è definita come \code{NAME\_MAX+1} che di norma porta al valore di 256
1843 byte usato anche in Linux.} ed il campo \var{d\_ino}, che contiene il numero
1844 di \textit{inode} cui il file è associato e corrisponde al campo \var{st\_ino}
1847 La presenza di ulteriori campi opzionali oltre i due citati è segnalata dalla
1848 definizione di altrettante macro nella forma \code{\_DIRENT\_HAVE\_D\_XXX}
1849 dove \code{XXX} è il nome del relativo campo; nel caso di Linux sono pertanto
1850 definite le macro \macro{\_DIRENT\_HAVE\_D\_TYPE},
1851 \macro{\_DIRENT\_HAVE\_D\_OFF} e \macro{\_DIRENT\_HAVE\_D\_RECLEN}, mentre non
1852 è definita la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN}.
1857 \begin{tabular}[c]{|l|l|}
1859 \textbf{Valore} & \textbf{Tipo di file} \\
1862 \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
1863 \const{DT\_REG} & File normale.\\
1864 \const{DT\_DIR} & Directory.\\
1865 \const{DT\_LNK} & Link simbolico.\\
1866 \const{DT\_FIFO} & Fifo.\\
1867 \const{DT\_SOCK} & Socket.\\
1868 \const{DT\_CHR} & Dispositivo a caratteri.\\
1869 \const{DT\_BLK} & Dispositivo a blocchi.\\
1872 \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
1873 della struttura \struct{dirent}.}
1874 \label{tab:file_dtype_macro}
1877 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
1878 indica il tipo di file (se fifo, directory, link simbolico, ecc.), e consente
1879 di evitare una successiva chiamata a \func{lstat} per determinarlo. I suoi
1880 possibili valori sono riportati in tab.~\ref{tab:file_dtype_macro}. Si tenga
1881 presente che questo valore è disponibile solo per i filesystem che ne
1882 supportano la restituzione (fra questi i più noti sono \textsl{btrfs},
1883 \textsl{ext2}, \textsl{ext3}, e \textsl{ext4}), per gli altri si otterrà
1884 sempre il valore \const{DT\_UNKNOWN}.\footnote{inoltre fino alla versione 2.1
1885 delle \acr{glibc}, pur essendo il campo \var{d\_type} presente, il suo uso
1886 non era implementato, e veniva restituito comunque il valore
1887 \const{DT\_UNKNOWN}.}
1889 Per la conversione da e verso l'analogo valore mantenuto dentro il campo
1890 \var{st\_mode} di \struct{stat} sono definite anche due macro di conversione,
1891 \macro{IFTODT} e \macro{DTTOIF}:
1893 \funcdecl{int IFTODT(mode\_t MODE)} Converte il tipo di file dal formato di
1894 \var{st\_mode} a quello di \var{d\_type}.
1896 \funcdecl{mode\_t DTTOIF(int DTYPE)} Converte il tipo di file dal formato di
1897 \var{d\_type} a quello di \var{st\_mode}.
1900 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
1901 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
1902 letta. Con questi due campi diventa possibile, determinando la posizione delle
1903 varie voci, spostarsi all'interno dello stream usando la funzione
1904 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
1905 estensioni prese da BSD, ed introdotte nello standard POSIX solo a partire
1906 dalla revisione POSIX.1-2001, per poterle utilizzare deve essere definita
1907 una delle macro \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE} o
1908 \macro{\_SVID\_SOURCE}.} il cui prototipo è:
1909 \begin{prototype}{dirent.h}{void seekdir(DIR *dir, off\_t offset)}
1910 Cambia la posizione all'interno di un \textit{directory stream}.
1913 La funzione non ritorna nulla e non segnala errori, è però necessario che il
1914 valore dell'argomento \param{offset} sia valido per lo stream \param{dir};
1915 esso pertanto deve essere stato ottenuto o dal valore di \var{d\_off} di
1916 \struct{dirent} o dal valore restituito dalla funzione \funcd{telldir}, che
1917 legge la posizione corrente; il prototipo di quest'ultima è:\footnote{prima
1918 delle \acr{glibc} 2.1.1 la funzione restituiva un valore di tipo
1919 \type{off\_t}, sostituito a partire dalla versione 2.1.2 da \ctyp{long} per
1920 conformità a POSIX.1-2001.}
1921 \begin{prototype}{dirent.h}{long telldir(DIR *dir)}
1922 Ritorna la posizione corrente in un \textit{directory stream}.
1924 \bodydesc{La funzione restituisce la posizione corrente nello stream (un
1925 numero positivo) in caso di successo, e -1 altrimenti, nel qual caso
1926 \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
1927 valore errato per \param{dir}.}
1930 La sola funzione di posizionamento nello stream prevista originariamente dallo
1931 standard POSIX è \funcd{rewinddir}, che riporta la posizione a quella
1932 iniziale; il suo prototipo è:
1934 \headdecl{sys/types.h} \headdecl{dirent.h}
1936 \funcdecl{void rewinddir(DIR *dir)}
1938 Si posiziona all'inizio di un \textit{directory stream}.
1941 Una volta completate le operazioni si può chiudere il \textit{directory
1942 stream}, ed il file descriptor ad esso associato, con la funzione
1943 \funcd{closedir}, il cui prototipo è:
1945 \headdecl{sys/types.h} \headdecl{dirent.h}
1947 \funcdecl{int closedir(DIR * dir)}
1949 Chiude un \textit{directory stream}.
1951 \bodydesc{La funzione restituisce 0 in caso di successo e -1 altrimenti, nel
1952 qual caso \var{errno} assume il valore \errval{EBADF}.}
1955 A parte queste funzioni di base in BSD 4.3 venne introdotta un'altra funzione
1956 che permette di eseguire una scansione completa, con tanto di ricerca ed
1957 ordinamento, del contenuto di una directory; la funzione è
1958 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
1959 \acr{libc4} e richiede siano definite le macro \macro{\_BSD\_SOURCE} o
1960 \macro{\_SVID\_SOURCE}.} ed il suo prototipo è:
1961 \begin{prototype}{dirent.h}{int scandir(const char *dir,
1962 struct dirent ***namelist, int(*filter)(const struct dirent *),
1963 int(*compar)(const struct dirent **, const struct dirent **))}
1965 Esegue una scansione di un \textit{directory stream}.
1967 \bodydesc{La funzione restituisce in caso di successo il numero di voci
1968 trovate, e -1 altrimenti.}
1971 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
1972 prototipo non è molto comprensibile; queste funzioni però sono quelle che
1973 controllano rispettivamente la selezione di una voce (quella passata con
1974 l'argomento \param{filter}) e l'ordinamento di tutte le voci selezionate
1975 (quella specificata dell'argomento \param{compar}).
1977 La funzione legge tutte le voci della directory indicata dall'argomento
1978 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
1979 \struct{dirent}) come argomento della funzione di selezione specificata da
1980 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
1981 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
1982 Qualora si specifichi un valore \val{NULL} per l'argomento \func{filter} non
1983 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
1985 Le voci selezionate possono essere riordinate tramite \func{qsort}, le modalità
1986 del riordinamento possono essere personalizzate usando la funzione
1987 \param{compar} come criterio di ordinamento di \func{qsort}, la funzione
1988 prende come argomenti le due strutture \struct{dirent} da confrontare
1989 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
1990 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
1991 \struct{dirent} viene restituito nell'argomento
1992 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
1993 restituisce, come \itindex{value~result~argument} \textit{value result
1994 argument}, l'indirizzo della stessa; questo significa che \param{namelist}
1995 deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
1996 si deve passare il suo indirizzo.}
1998 Per l'ordinamento, vale a dire come valori possibili per l'argomento
1999 \param{compar} sono disponibili due funzioni predefinite, \funcd{alphasort} e
2000 \funcd{versionsort}, i cui prototipi sono:
2004 \funcdecl{int alphasort(const void *a, const void *b)}
2006 \funcdecl{int versionsort(const void *a, const void *b)}
2008 Funzioni per l'ordinamento delle voci di \textit{directory stream}.
2010 \bodydesc{Le funzioni restituiscono un valore minore, uguale o maggiore di
2011 zero qualora il primo argomento sia rispettivamente minore, uguale o
2012 maggiore del secondo.}
2015 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
2016 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
2017 argomenti dei puntatori a delle strutture \struct{dirent}; le glibc usano il
2018 prototipo originario di BSD, mostrato anche nella definizione, che prevede
2019 puntatori a \ctyp{void}.} e deve essere specificata come argomento
2020 \param{compar} per ottenere un ordinamento alfabetico (secondo il valore del
2021 campo \var{d\_name} delle varie voci). Le \acr{glibc} prevedono come
2022 estensione\footnote{le glibc, a partire dalla versione 2.1, effettuano anche
2023 l'ordinamento alfabetico tenendo conto delle varie localizzazioni, usando
2024 \func{strcoll} al posto di \func{strcmp}.} anche \func{versionsort}, che
2025 ordina i nomi tenendo conto del numero di versione (cioè qualcosa per cui
2026 \texttt{file10} viene comunque dopo \texttt{file4}.)
2028 \begin{figure}[!htbp]
2029 \footnotesize \centering
2030 \begin{minipage}[c]{\codesamplewidth}
2031 \includecodesample{listati/my_ls.c}
2033 \caption{Esempio di codice per eseguire la lista dei file contenuti in una
2035 \label{fig:file_my_ls}
2038 Un semplice esempio dell'uso di queste funzioni è riportato in
2039 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
2040 programma che, usando la funzione di scansione illustrata in
2041 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
2042 e la relativa dimensione (in sostanza una versione semplificata del comando
2045 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
2046 la parte di gestione delle opzioni (che prevede solo l'uso di una funzione per
2047 la stampa della sintassi, anch'essa omessa) ma il codice completo potrà essere
2048 trovato coi sorgenti allegati nel file \file{myls.c}.
2050 In sostanza tutto quello che fa il programma, dopo aver controllato
2051 (\texttt{\small 12--15}) di avere almeno un argomento (che indicherà la
2052 directory da esaminare) è chiamare (\texttt{\small 16}) la funzione
2053 \func{DirScan} per eseguire la scansione, usando la funzione \code{do\_ls}
2054 (\texttt{\small 22--29}) per fare tutto il lavoro.
2056 Quest'ultima si limita (\texttt{\small 26}) a chiamare \func{stat} sul file
2057 indicato dalla directory entry passata come argomento (il cui nome è appunto
2058 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
2059 dati ad esso relativi, per poi provvedere (\texttt{\small 27}) a stampare il
2060 nome del file e la dimensione riportata in \var{data}.
2062 Dato che la funzione verrà chiamata all'interno di \func{DirScan} per ogni
2063 voce presente questo è sufficiente a stampare la lista completa dei file e
2064 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
2065 valore di ritorno per indicare una esecuzione senza errori.
2067 \begin{figure}[!htbp]
2068 \footnotesize \centering
2069 \begin{minipage}[c]{\codesamplewidth}
2070 \includecodesample{listati/DirScan.c}
2072 \caption{Codice della funzione di scansione di una directory contenuta nel
2073 file \file{DirScan.c}.}
2074 \label{fig:file_dirscan}
2077 Tutto il grosso del lavoro è svolto dalla funzione \func{DirScan}, riportata
2078 in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e permette
2079 di eseguire una funzione, passata come secondo argomento, su tutte le voci di
2080 una directory. La funzione inizia con l'aprire (\texttt{\small 18--22}) uno
2081 stream sulla directory passata come primo argomento, stampando un messaggio in
2084 Il passo successivo (\texttt{\small 23--24}) è cambiare directory di lavoro
2085 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzioni
2086 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
2087 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
2088 (\texttt{\small 26--30}) sulle singole voci dello stream ci si trovi
2089 all'interno della directory.\footnote{questo è essenziale al funzionamento
2090 della funzione \code{do\_ls}, e ad ogni funzione che debba usare il campo
2091 \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
2092 struttura \struct{dirent} sono sempre relativi alla directory in questione,
2093 e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
2094 ottenere le dimensioni.}
2096 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
2097 alla funzione passata come secondo argomento, il ciclo di scansione della
2098 directory è molto semplice; si legge una voce alla volta (\texttt{\small 26})
2099 all'interno di una istruzione di \code{while} e fintanto che si riceve una
2100 voce valida, cioè un puntatore diverso da \val{NULL}, si esegue
2101 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
2102 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
2103 28}) qualora questa presenti una anomalia, identificata da un codice di
2104 ritorno negativo. Una volta terminato il ciclo la funzione si conclude con la
2105 chiusura (\texttt{\small 32}) dello stream\footnote{nel nostro caso, uscendo
2106 subito dopo la chiamata, questo non servirebbe, in generale però
2107 l'operazione è necessaria, dato che la funzione può essere invocata molte
2108 volte all'interno dello stesso processo, per cui non chiudere i
2109 \textit{directory stream} comporterebbe un consumo progressivo di risorse,
2110 con conseguente rischio di esaurimento delle stesse.} e la restituzione
2111 (\texttt{\small 32}) del codice di operazioni concluse con successo.
2114 \subsection{La directory di lavoro}
2115 \label{sec:file_work_dir}
2119 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
2120 directory nel filesystem,\footnote{questa viene mantenuta all'interno dei dati
2121 della sua \struct{task\_struct} (vedi fig.~\ref{fig:proc_task_struct}), più
2122 precisamente nel campo \texttt{pwd} della sotto-struttura
2123 \struct{fs\_struct}.} che è chiamata \textsl{directory corrente} o
2124 \textsl{directory di lavoro} (in inglese \textit{current working directory}).
2125 La directory di lavoro è quella da cui si parte quando un
2126 \itindsub{pathname}{relativo} \textit{pathname} è espresso in forma relativa,
2127 dove il ``\textsl{relativa}'' fa riferimento appunto a questa directory.
2129 Quando un utente effettua il login, questa directory viene impostata alla
2130 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
2131 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
2132 comando \cmd{pwd} la stampa sul terminale. Siccome la directory corrente
2133 resta la stessa quando viene creato un processo figlio (vedi
2134 sez.~\ref{sec:proc_fork}), la directory corrente della shell diventa anche la
2135 directory corrente di qualunque comando da essa lanciato.
2137 Dato che è il kernel che tiene traccia per ciascun processo \itindex{inode}
2138 dell'\textit{inode} della directory di lavoro, per ottenerne il
2139 \textit{pathname} occorre usare una apposita funzione di libreria,
2140 \funcd{getcwd},\footnote{con Linux \func{getcwd} è una \textit{system call}
2141 dalla versione 2.1.9, in precedenza il valore doveva essere ottenuto tramite
2142 il filesystem \texttt{/proc} da \procfile{/proc/self/cwd}.} il cui prototipo
2144 \begin{prototype}{unistd.h}{char *getcwd(char *buffer, size\_t size)}
2145 Legge il \textit{pathname} della directory di lavoro corrente.
2147 \bodydesc{La funzione restituisce il puntatore \param{buffer} se riesce,
2148 \val{NULL} se fallisce, in quest'ultimo caso la variabile
2149 \var{errno} è impostata con i seguenti codici di errore:
2151 \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
2153 \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
2154 lunghezza del \textit{pathname}.
2155 \item[\errcode{EACCES}] manca il permesso di lettura o di ricerca su uno dei
2156 componenti del \textit{pathname} (cioè su una delle directory superiori
2158 \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata.
2162 La funzione restituisce il \textit{pathname} completo della directory di
2163 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
2164 precedentemente allocata, per una dimensione massima di \param{size}. Il
2165 buffer deve essere sufficientemente largo da poter contenere il
2166 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
2167 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
2170 Si può anche specificare un puntatore nullo come
2171 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
2172 supportata da Linux e dalla \acr{glibc}.} nel qual caso la stringa sarà
2173 allocata automaticamente per una dimensione pari a \param{size} qualora questa
2174 sia diversa da zero, o della lunghezza esatta del \textit{pathname}
2175 altrimenti. In questo caso ci si deve ricordare di disallocare la stringa una
2176 volta cessato il suo utilizzo.
2178 Di questa funzione esiste una versione \code{char *getwd(char *buffer)} fatta
2179 per compatibilità all'indietro con BSD, che non consente di specificare la
2180 dimensione del buffer; esso deve essere allocato in precedenza ed avere una
2181 dimensione superiore a \const{PATH\_MAX} (di solito 256 byte, vedi
2182 sez.~\ref{sec:sys_limits}); il problema è che in Linux non esiste una
2183 dimensione superiore per un \textit{pathname}, per cui non è detto che il
2184 buffer sia sufficiente a contenere il nome del file, e questa è la ragione
2185 principale per cui questa funzione è deprecata.
2187 Un uso comune di \func{getcwd} è quello di salvare la directory di lavoro
2188 iniziale per poi potervi tornare in un tempo successivo, un metodo alternativo
2189 più veloce, se non si è a corto di file descriptor, è invece quello di aprire
2190 la directory corrente (vale a dire ``\texttt{.}'') e tornarvi in seguito con
2193 Una seconda usata per ottenere la directory di lavoro è \code{char
2194 *get\_current\_dir\_name(void)} che è sostanzialmente equivalente ad una
2195 \code{getcwd(NULL, 0)}, con la sola differenza che essa ritorna il valore
2196 della variabile di ambiente \val{PWD}, che essendo costruita dalla shell può
2197 contenere un \textit{pathname} comprendente anche dei link simbolici. Usando
2198 \func{getcwd} infatti, essendo il \textit{pathname} ricavato risalendo
2199 all'indietro l'albero della directory, si perderebbe traccia di ogni passaggio
2200 attraverso eventuali link simbolici.
2202 Per cambiare la directory di lavoro si può usare la funzione \funcd{chdir}
2203 (equivalente del comando di shell \cmd{cd}) il cui nome sta appunto per
2204 \textit{change directory}, il suo prototipo è:
2205 \begin{prototype}{unistd.h}{int chdir(const char *pathname)}
2206 Cambia la directory di lavoro in \param{pathname}.
2208 \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
2209 nel qual caso \var{errno} assumerà i valori:
2211 \item[\errcode{ENOTDIR}] non si è specificata una directory.
2212 \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
2215 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2216 \errval{ENOMEM}, \errval{ELOOP} e \errval{EIO}.}
2218 \noindent ed ovviamente \param{pathname} deve indicare una directory per la
2219 quale si hanno i permessi di accesso.
2221 Dato che anche le directory sono file, è possibile riferirsi ad esse anche
2222 tramite il file descriptor, e non solo tramite il \textit{pathname}, per fare
2223 questo si usa \funcd{fchdir}, il cui prototipo è:
2224 \begin{prototype}{unistd.h}{int fchdir(int fd)}
2225 Identica a \func{chdir}, ma usa il file descriptor \param{fd} invece del
2228 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
2229 errore, in caso di errore \var{errno} assumerà i valori \errval{EBADF} o
2232 \noindent anche in questo caso \param{fd} deve essere un file descriptor
2233 valido che fa riferimento ad una directory. Inoltre l'unico errore di accesso
2234 possibile (tutti gli altri sarebbero occorsi all'apertura di \param{fd}), è
2235 quello in cui il processo non ha il permesso di accesso alla directory
2236 specificata da \param{fd}.
2242 \subsection{I file temporanei}
2243 \label{sec:file_temp_file}
2245 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
2246 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
2247 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
2248 creare il file dopo aver controllato che questo non esista, nel momento fra il
2249 controllo e la creazione si ha giusto lo spazio per una possibile
2250 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
2251 sez.~\ref{sec:proc_race_cond}).
2253 Le \acr{glibc} provvedono varie funzioni per generare nomi di file temporanei,
2254 di cui si abbia certezza di unicità al momento della generazione; storicamente
2255 la prima di queste funzioni create a questo scopo era
2256 \funcd{tmpnam},\footnote{la funzione è stata deprecata nella revisione
2257 POSIX.1-2008 dello standard POSIX.} il cui prototipo è:
2258 \begin{prototype}{stdio.h}{char *tmpnam(char *string)}
2259 Genera un nome univoco per un file temporaneo.
2261 \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
2262 \val{NULL} in caso di fallimento. Non sono definiti errori.}
2265 La funzione restituisce il puntatore ad una stringa contente un nome di file
2266 valido e non esistente al momento dell'invocazione; se si è passato come
2267 argomento \param{string} un puntatore non nullo ad un buffer di caratteri
2268 questo deve essere di dimensione \const{L\_tmpnam} ed il nome generato vi
2269 verrà copiato automaticamente; altrimenti il nome sarà generato in un buffer
2270 statico interno che verrà sovrascritto ad una chiamata successiva. Successive
2271 invocazioni della funzione continueranno a restituire nomi unici fino ad un
2272 massimo di \const{TMP\_MAX} volte, limite oltre il quale il comportamento è
2273 indefinito. Al nome viene automaticamente aggiunto come prefisso la directory
2274 specificata dalla costante \const{P\_tmpdir}.\footnote{le costanti
2275 \const{L\_tmpnam}, \const{P\_tmpdir} e \const{TMP\_MAX} sono definite in
2278 Di questa funzione esiste una versione \index{funzioni!rientranti} rientrante,
2279 \func{tmpnam\_r}, che non fa nulla quando si passa \val{NULL} come argomento.
2280 Una funzione simile, \funcd{tempnam}, permette di specificare un prefisso per
2281 il file esplicitamente, il suo prototipo è:
2282 \begin{prototype}{stdio.h}{char *tempnam(const char *dir, const char *pfx)}
2283 Genera un nome univoco per un file temporaneo.
2285 \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
2286 \val{NULL} in caso di fallimento, \var{errno} viene impostata a
2287 \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
2290 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
2291 per cui è sempre \index{funzioni!rientranti} rientrante, occorre però
2292 ricordarsi di disallocare con \code{free} il puntatore che restituisce.
2293 L'argomento \param{pfx} specifica un prefisso di massimo 5 caratteri per il
2294 nome provvisorio. La funzione assegna come directory per il file temporaneo,
2295 verificando che esista e sia accessibile, la prima valida fra le seguenti:
2297 \item La variabile di ambiente \const{TMPDIR} (non ha effetto se non è
2298 definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
2299 \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}).
2300 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}).
2301 \item Il valore della costante \const{P\_tmpdir}.
2302 \item la directory \file{/tmp}.
2305 In ogni caso, anche se la generazione del nome è casuale, ed è molto difficile
2306 ottenere un nome duplicato, nulla assicura che un altro processo non possa
2307 avere creato, fra l'ottenimento del nome e l'apertura del file, un altro file
2308 con lo stesso nome; per questo motivo quando si usa il nome ottenuto da una di
2309 queste funzioni occorre sempre aprire il nuovo file in modalità di esclusione
2310 (cioè con l'opzione \const{O\_EXCL} per i file descriptor o con il flag
2311 \code{x} per gli stream) che fa fallire l'apertura in caso il file sia già
2314 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
2315 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
2316 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
2317 \begin{prototype}{stdio.h}{FILE *tmpfile(void)}
2318 Restituisce un file temporaneo aperto in lettura/scrittura.
2320 \bodydesc{La funzione ritorna il puntatore allo stream associato al file
2321 temporaneo in caso di successo e \val{NULL} in caso di errore, nel qual
2322 caso \var{errno} assumerà i valori:
2324 \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
2325 \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
2327 ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
2328 \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES}.}
2331 La funzione restituisce direttamente uno stream già aperto (in modalità
2332 \code{r+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso, che viene
2333 automaticamente cancellato alla sua chiusura o all'uscita dal programma. Lo
2334 standard non specifica in quale directory verrà aperto il file, ma le
2335 \acr{glibc} prima tentano con \const{P\_tmpdir} e poi con \file{/tmp}. Questa
2336 funzione è \index{funzioni!rientranti} rientrante e non soffre di problemi di
2337 \itindex{race~condition} \textit{race condition}.
2339 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
2340 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
2341 modificano una stringa di input che serve da modello e che deve essere
2342 conclusa da 6 caratteri \code{X} che verranno sostituiti da un codice
2343 unico. La prima delle due è analoga a \func{tmpnam} e genera un nome casuale,
2345 \begin{prototype}{stlib.h}{char *mktemp(char *template)}
2346 Genera un nome univoco per un file temporaneo.
2348 \bodydesc{La funzione ritorna il puntatore \param{template} in caso di
2349 successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
2352 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2356 La funzionane genera un nome univoco sostituendo le \code{XXXXXX} finali di
2357 \param{template}; dato che \param{template} deve poter essere modificata dalla
2358 funzione non si può usare una stringa costante. Tutte le avvertenze riguardo
2359 alle possibili \itindex{race~condition} \textit{race condition} date per
2360 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
2361 il valore usato per sostituire le \code{XXXXXX} viene formato con il \acr{pid}
2362 del processo più una lettera, il che mette a disposizione solo 26 possibilità
2363 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
2364 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
2367 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
2368 \func{tmpfile}, ma restituisce un file descriptor invece di un nome; il suo
2370 \begin{prototype}{stlib.h}{int mkstemp(char *template)}
2371 Genera un file temporaneo.
2373 \bodydesc{La funzione ritorna il file descriptor in caso di successo e
2374 -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
2376 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2377 \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
2378 contenuto di \param{template} è indefinito.
2382 Come per \func{mktemp} anche in questo caso \param{template} non può essere
2383 una stringa costante. La funzione apre un file in lettura/scrittura con la
2384 funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
2385 sez.~\ref{sec:file_open}), in questo modo al ritorno della funzione si ha la
2386 certezza di essere stati i creatori del file, i cui permessi (si veda
2387 sez.~\ref{sec:file_perm_overview}) sono impostati al valore \code{0600}
2388 (lettura e scrittura solo per il proprietario).\footnote{questo è vero a
2389 partire dalle \acr{glibc} 2.0.7, le versioni precedenti delle \acr{glibc} e
2390 le vecchie \acr{libc5} e \acr{libc4} usavano il valore \code{0666} che
2391 permetteva a chiunque di leggere e scrivere i contenuti del file.} Di
2392 questa funzione esiste una variante \funcd{mkostemp}, introdotta
2393 specificamente dalla \acr{glibc},\footnote{la funzione è stata introdotta
2394 nella versione 2.7 delle librerie e richiede che sia definita la macro
2395 \const{\_GNU\_SOURCE}.} il cui prototipo è:
2396 \begin{prototype}{stlib.h}{int mkostemp(char *template, int flags)}
2397 Genera un file temporaneo.
2399 \bodydesc{La funzione ritorna il file descriptor in caso di successo e
2400 -1 in caso di errore, con gli stessi errori di \func{mkstemp}.}
2402 \noindent la cui sola differenza è la presenza dell'ulteriore argomento
2403 \var{flags} che consente di specificare i flag da passare ad \func{open}
2404 nell'apertura del file.
2407 In OpenBSD è stata introdotta un'altra funzione simile alle precedenti,
2408 \funcd{mkdtemp}, che crea invece una directory temporanea;\footnote{la
2409 funzione è stata introdotta nelle \acr{glibc} a partire dalla versione
2410 2.1.91 ed inserita nello standard POSIX.1-2008.} il suo prototipo è:
2411 \begin{prototype}{stlib.h}{char *mkdtemp(char *template)}
2412 Genera una directory temporanea.
2414 \bodydesc{La funzione ritorna il puntatore al nome della directory in caso
2415 successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
2418 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
2420 più gli altri eventuali codici di errore di \func{mkdir}.}
2423 La funzione genera una directory il cui nome è ottenuto sostituendo le
2424 \code{XXXXXX} finali di \param{template} con permessi \code{0700} (al solito
2425 si veda cap.~\ref{cha:file_unix_interface} per i dettagli); dato che la
2426 creazione della directory è sempre esclusiva i precedenti problemi di
2427 \itindex{race~condition} \textit{race condition} non si pongono.
2430 \section{La manipolazione delle caratteristiche dei file}
2431 \label{sec:file_infos}
2433 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
2434 relative alle caratteristiche di ciascun file, a partire dalle informazioni
2435 relative al controllo di accesso, sono mantenute \itindex{inode}
2436 nell'\textit{inode}.
2438 Vedremo in questa sezione come sia possibile leggere tutte queste informazioni
2439 usando la funzione \func{stat}, che permette l'accesso a tutti i dati
2440 memorizzati \itindex{inode} nell'\textit{inode}; esamineremo poi le varie
2441 funzioni usate per manipolare tutte queste informazioni (eccetto quelle che
2442 riguardano la gestione del controllo di accesso, trattate in in
2443 sez.~\ref{sec:file_access_control}).
2446 \subsection{La lettura delle caratteristiche dei file}
2447 \label{sec:file_stat}
2449 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
2450 delle funzioni \func{stat} che sono quelle che usa il comando \cmd{ls} per
2451 poter ottenere e mostrare tutti i dati relativi ad un file; ne fanno parte le
2452 funzioni \funcd{stat}, \funcd{fstat} e \funcd{lstat}, i cui prototipi sono:
2454 \headdecl{sys/types.h}
2455 \headdecl{sys/stat.h}
2458 \funcdecl{int stat(const char *file\_name, struct stat *buf)}
2459 \funcdecl{int lstat(const char *file\_name, struct stat *buf)}
2460 \funcdecl{int fstat(int filedes, struct stat *buf)}
2461 Legge le informazioni di un file.
2463 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
2464 errore, nel qual caso \var{errno} assumerà uno dei valori: \errval{EBADF},
2465 \errval{ENOENT}, \errval{ENOTDIR}, \errval{ELOOP}, \errval{EFAULT},
2466 \errval{EACCES}, \errval{ENOMEM}, \errval{ENAMETOOLONG}.}
2469 La funzione \func{stat} legge le informazioni del file il cui pathname è
2470 specificato dalla stringa puntata da \param{file\_name} e le inserisce nel
2471 buffer puntato dall'argomento \param{buf}; la funzione \func{lstat} è identica
2472 a \func{stat} eccetto che se \param{file\_name} è un link simbolico vengono
2473 lette le informazioni relative ad esso e non al file a cui fa
2474 riferimento. Infine \func{fstat} esegue la stessa operazione su un file già
2475 aperto, specificato tramite il suo file descriptor \param{filedes}.
2477 La struttura \struct{stat} usata da queste funzioni è definita nell'header
2478 \file{sys/stat.h} e in generale dipende dall'implementazione; la versione
2479 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
2480 riportata dalla pagina di manuale di \func{stat}; in realtà la definizione
2481 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
2482 riservati per estensioni come tempi dei file più precisi (vedi
2483 sez.~\ref{sec:file_file_times}), o per il padding dei campi.
2485 \begin{figure}[!htb]
2488 \begin{minipage}[c]{\textwidth}
2489 \includestruct{listati/stat.h}
2492 \caption{La struttura \structd{stat} per la lettura delle informazioni dei
2494 \label{fig:file_stat_struct}
2497 Si noti come i vari membri della struttura siano specificati come tipi
2498 primitivi del sistema (di quelli definiti in
2499 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \file{sys/types.h}).
2501 \subsection{I tipi di file}
2502 \label{sec:file_types}
2504 Come riportato in tab.~\ref{tab:file_file_types} in Linux oltre ai file e alle
2505 directory esistono altri oggetti che possono stare su un filesystem. Il tipo
2506 di file è ritornato dalla funzione \func{stat} come maschera binaria nel campo
2507 \var{st\_mode} (che contiene anche le informazioni relative ai permessi) di
2508 una struttura \struct{stat}.
2510 Dato che il valore numerico può variare a seconda delle implementazioni, lo
2511 standard POSIX definisce un insieme di macro per verificare il tipo di file,
2512 queste vengono usate anche da Linux che supporta pure le estensioni allo
2513 standard per i link simbolici e i socket definite da BSD; l'elenco completo
2514 delle macro con cui è possibile estrarre l'informazione da \var{st\_mode} è
2515 riportato in tab.~\ref{tab:file_type_macro}.
2519 \begin{tabular}[c]{|l|l|}
2521 \textbf{Macro} & \textbf{Tipo del file} \\
2524 \macro{S\_ISREG}\texttt{(m)} & file normale.\\
2525 \macro{S\_ISDIR}\texttt{(m)} & directory.\\
2526 \macro{S\_ISCHR}\texttt{(m)} & dispositivo a caratteri.\\
2527 \macro{S\_ISBLK}\texttt{(m)} & dispositivo a blocchi.\\
2528 \macro{S\_ISFIFO}\texttt{(m)} & fifo.\\
2529 \macro{S\_ISLNK}\texttt{(m)} & link simbolico.\\
2530 \macro{S\_ISSOCK}\texttt{(m)} & socket.\\
2533 \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h}).}
2534 \label{tab:file_type_macro}
2537 Oltre alle macro di tab.~\ref{tab:file_type_macro} è possibile usare
2538 direttamente il valore di \var{st\_mode} per ricavare il tipo di file
2539 controllando direttamente i vari bit in esso memorizzati. Per questo sempre in
2540 \file{sys/stat.h} sono definite le costanti numeriche riportate in
2541 tab.~\ref{tab:file_mode_flags}.
2543 Il primo valore dell'elenco di tab.~\ref{tab:file_mode_flags} è la maschera
2544 binaria che permette di estrarre i bit nei quali viene memorizzato il tipo di
2545 file, i valori successivi sono le costanti corrispondenti ai singoli bit, e
2546 possono essere usati per effettuare la selezione sul tipo di file voluto, con
2547 un'opportuna combinazione.
2552 \begin{tabular}[c]{|l|c|l|}
2554 \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
2557 \const{S\_IFMT} & 0170000 & Maschera per i bit del tipo di file.\\
2558 \const{S\_IFSOCK} & 0140000 & Socket.\\
2559 \const{S\_IFLNK} & 0120000 & Link simbolico.\\
2560 \const{S\_IFREG} & 0100000 & File regolare.\\
2561 \const{S\_IFBLK} & 0060000 & Dispositivo a blocchi.\\
2562 \const{S\_IFDIR} & 0040000 & Directory.\\
2563 \const{S\_IFCHR} & 0020000 & Dispositivo a caratteri.\\
2564 \const{S\_IFIFO} & 0010000 & Fifo.\\
2566 \const{S\_ISUID} & 0004000 & Set UID bit \itindex{suid~bit}.\\
2567 \const{S\_ISGID} & 0002000 & Set GID bit \itindex{sgid~bit}.\\
2568 \const{S\_ISVTX} & 0001000 & Sticky bit \itindex{sticky~bit}.\\
2570 % \const{S\_IRWXU} & 00700 & Bitmask per i permessi del proprietario.\\
2571 \const{S\_IRUSR} & 00400 & Il proprietario ha permesso di lettura.\\
2572 \const{S\_IWUSR} & 00200 & Il proprietario ha permesso di scrittura.\\
2573 \const{S\_IXUSR} & 00100 & Il proprietario ha permesso di esecuzione.\\
2575 % \const{S\_IRWXG} & 00070 & Bitmask per i permessi del gruppo.\\
2576 \const{S\_IRGRP} & 00040 & Il gruppo ha permesso di lettura.\\
2577 \const{S\_IWGRP} & 00020 & Il gruppo ha permesso di scrittura.\\
2578 \const{S\_IXGRP} & 00010 & Il gruppo ha permesso di esecuzione.\\
2580 % \const{S\_IRWXO} & 00007 & Bitmask per i permessi di tutti gli altri\\
2581 \const{S\_IROTH} & 00004 & Gli altri hanno permesso di lettura.\\
2582 \const{S\_IWOTH} & 00002 & Gli altri hanno permesso di esecuzione.\\
2583 \const{S\_IXOTH} & 00001 & Gli altri hanno permesso di esecuzione.\\
2586 \caption{Costanti per l'identificazione dei vari bit che compongono il campo
2587 \var{st\_mode} (definite in \file{sys/stat.h}).}
2588 \label{tab:file_mode_flags}
2591 Ad esempio se si volesse impostare una condizione che permetta di controllare
2592 se un file è una directory o un file ordinario si potrebbe definire la macro
2594 \includecodesnip{listati/is_file_dir.h}
2595 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
2596 poi si effettua il confronto con la combinazione di tipi scelta.
2599 \subsection{Le dimensioni dei file}
2600 \label{sec:file_file_size}
2602 Il campo \var{st\_size} di una struttura \struct{stat} contiene la dimensione
2603 del file in byte, se si tratta di un file regolare. Nel caso di un link
2604 simbolico la dimensione è quella del \itindex{pathname} \textit{pathname} che
2605 il link stesso contiene; per le fifo questo campo è sempre nullo.
2607 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
2608 byte. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
2609 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
2610 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
2611 dimensione inferiore sarebbe inefficiente.
2613 Si tenga conto che la lunghezza del file riportata in \var{st\_size} non è
2614 detto che corrisponda all'occupazione dello spazio su disco per via della
2615 possibile esistenza dei cosiddetti \index{file!\textit{hole}} \textit{holes}
2616 (letteralmente \textsl{buchi}) che si formano tutte le volte che si va a
2617 scrivere su un \itindex{sparse~file} file dopo aver eseguito uno spostamento
2618 oltre la sua fine (tratteremo in dettaglio l'argomento in
2619 sez.~\ref{sec:file_lseek}).
2621 In questo caso si avranno risultati differenti a seconda del modo in cui si
2622 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
2623 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
2624 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
2625 caso per le parti non scritte vengono restituiti degli zeri, si avrà lo stesso
2626 risultato di \cmd{ls}.
2628 Se è sempre possibile allargare un file, scrivendoci sopra od usando la
2629 funzione \func{lseek} per spostarsi oltre la sua fine, esistono anche casi in
2630 cui si può avere bisogno di effettuare un troncamento, scartando i dati
2631 presenti al di là della dimensione scelta come nuova fine del file.
2633 Un file può sempre essere troncato a zero aprendolo con il flag
2634 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
2635 dimensione si possono usare le due funzioni \funcd{truncate} e
2636 \funcd{ftruncate}, i cui prototipi sono:
2640 \funcdecl{int truncate(const char *file\_name, off\_t length)}
2642 \funcdecl{int ftruncate(int fd, off\_t length))}
2644 Troncano un file alla lunghezza \param{length}.
2646 \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per un
2647 errore, nel qual caso \var{errno} viene impostata opportunamente; per
2648 \func{ftruncate} si hanno i valori:
2650 \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
2651 \item[\errcode{EINVAL}] \param{fd} è un riferimento ad un socket, non a un
2652 file o non è aperto in scrittura.
2654 per \func{truncate} si hanno:
2656 \item[\errcode{EACCES}] il file non ha permesso di scrittura o non si ha il
2657 permesso di esecuzione una delle directory del \itindex{pathname}
2659 \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
2661 ed anche \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2662 \errval{EROFS}, \errval{EIO}, \errval{EFAULT}, \errval{ELOOP}.}
2665 Entrambe le funzioni fan sì che la dimensione del file sia troncata ad un
2666 valore massimo specificato da \param{length}, e si distinguono solo per il
2667 fatto che il file viene indicato con il pathname \param{file\_name} per
2668 \func{truncate} e con il file descriptor \param{fd} per \funcd{ftruncate}; se
2669 il file è più lungo della lunghezza specificata i dati in eccesso saranno
2672 Il comportamento in caso di lunghezza inferiore non è specificato e dipende
2673 dall'implementazione: il file può essere lasciato invariato o esteso fino alla
2674 lunghezza scelta; nel caso di Linux viene esteso con la creazione di un
2675 \index{file!\textit{hole}} \textsl{buco} nel \itindex{sparse~file} file e ad
2676 una lettura si otterranno degli zeri; si tenga presente però che questo
2677 comportamento è supportato solo per filesystem nativi, ad esempio su un
2678 filesystem non nativo come il VFAT di Windows questo non è possibile.
2680 \subsection{I tempi dei file}
2681 \label{sec:file_file_times}
2683 Il sistema mantiene per ciascun file tre tempi, questi sono registrati
2684 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del file e
2685 possono essere letti tramite la funzione \func{stat}, che li restituisce
2686 attraverso tre specifici campi della struttura \struct{stat} di
2687 fig.~\ref{fig:file_stat_struct}. Il significato di detti tempi e dei relativi
2688 campi è riportato nello schema in tab.~\ref{tab:file_file_times}, dove è anche
2689 riportato un esempio delle funzioni che effettuano cambiamenti su di essi. Il
2690 valore è espresso nel cosiddetto \itindex{calendar~time} \textit{calendar
2691 time}, su cui torneremo in dettaglio in sez.~\ref{sec:sys_time}.
2696 \begin{tabular}[c]{|c|l|l|c|}
2698 \textbf{Membro} & \textbf{Significato} & \textbf{Funzione}
2699 & \textbf{Opzione di \cmd{ls}} \\
2702 \var{st\_atime}& ultimo accesso ai dati del file &
2703 \func{read}, \func{utime} & \cmd{-u}\\
2704 \var{st\_mtime}& ultima modifica ai dati del file &
2705 \func{write}, \func{utime} & default\\
2706 \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
2707 \func{chmod}, \func{utime} & \cmd{-c}\\
2710 \caption{I tre tempi associati a ciascun file.}
2711 \label{tab:file_file_times}
2714 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
2715 ultima modifica (il \textit{modification time}, \var{st\_mtime}) e il tempo di
2716 ultimo cambiamento di stato (il \textit{change time}, \var{st\_ctime}). Il
2717 primo infatti fa riferimento ad una modifica del contenuto di un file, mentre
2718 il secondo ad una modifica \itindex{inode} dell'\textit{inode}. Dato che
2719 esistono molte operazioni, come la funzione \func{link} e altre che vedremo in
2720 seguito, che modificano solo le informazioni contenute \itindex{inode}
2721 nell'\textit{inode} senza toccare il contenuto del file, diventa necessario
2722 l'utilizzo di questo secondo tempo.
2724 Il tempo di ultima modifica viene usato ad esempio da programmi come
2725 \cmd{make} per decidere quali file necessitano di essere ricompilati o
2726 (talvolta insieme anche al tempo di cambiamento di stato) per decidere quali
2727 file devono essere archiviati per il backup. Il tempo di ultimo accesso viene
2728 di solito usato per identificare i file che non vengono più utilizzati per un
2729 certo lasso di tempo. Ad esempio un programma come \texttt{leafnode} lo usa
2730 per cancellare gli articoli letti più vecchi, mentre \texttt{mutt} lo usa per
2731 marcare i messaggi di posta che risultano letti. Il sistema non tiene conto
2732 dell'ultimo accesso \itindex{inode} all'\textit{inode}, pertanto funzioni come
2733 \func{access} o \func{stat} non hanno alcuna influenza sui tre tempi. Il
2734 comando \cmd{ls} (quando usato con le opzioni \cmd{-l} o \cmd{-t}) mostra i
2735 tempi dei file secondo lo schema riportato nell'ultima colonna di
2736 tab.~\ref{tab:file_file_times}.
2738 L'aggiornamento del tempo di ultimo accesso è stato a lungo considerato un
2739 difetto progettuale di Unix, questo infatti comporta la necessità di
2740 effettuare un accesso in scrittura sul disco anche in tutti i casi in cui
2741 questa informazione non interessa e sarebbe possibile avere un semplice
2742 accesso in lettura sui dati bufferizzati. Questo comporta un ovvio costo sia
2743 in termini di prestazioni, che di consumo di risorse come la batteria per i
2744 portatili, o cicli di riscrittura per i dischi su memorie riscrivibili.
2746 Per questo motivo, onde evitare di mantenere una informazione che nella
2747 maggior parte dei casi non interessa, è sempre stato possibile disabilitare
2748 l'aggiornamento del tempo di ultimo accesso con l'opzione di montaggio
2749 \texttt{noatime}. Dato però che questo può creare problemi a qualche
2750 programma, in Linux è stata introdotta la opzione \texttt{relatime} che esegue
2751 l'aggiornamento soltanto se il tempo di ultimo accesso è precedente al tempo di
2752 ultima modifica o cambiamento, così da rendere evidente che vi è stato un
2753 accesso dopo la scrittura, ed evitando al contempo ulteriori operazioni su
2754 disco negli accessi successivi. In questo modo l'informazione relativa al
2755 fatto che un file sia stato letto resta disponibile, e ad esempio i programmi
2756 citati in precedenza continuano a funzionare. Questa opzione, a partire dal
2757 kernel 2.6.30, è diventata il comportamento di default e non deve più essere
2758 specificata esplicitamente.\footnote{si può comunque riottenere il vecchio
2759 comportamento usando la opzione di montaggio \texttt{strictatime}.}
2764 \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
2766 \multicolumn{1}{|p{3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
2767 \multicolumn{3}{|p{3.6cm}|}{\centering{
2768 \textbf{File o directory del riferimento}}}&
2769 \multicolumn{3}{|p{3.6cm}|}{\centering{
2770 \textbf{Directory contenente il riferimento}}}
2771 &\multicolumn{1}{|p{3.6cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
2774 \multicolumn{1}{|p{3cm}|}{}
2775 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
2776 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
2777 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
2778 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
2779 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
2780 &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
2781 &\multicolumn{1}{|p{3cm}|}{} \\
2784 \func{chmod}, \func{fchmod}
2785 & -- & -- &$\bullet$& -- & -- & -- &\\
2786 \func{chown}, \func{fchown}
2787 & -- & -- &$\bullet$& -- & -- & -- &\\
2789 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
2790 con \const{O\_CREATE} \\
2792 & -- &$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
2793 con \const{O\_TRUNC} \\
2795 &$\bullet$& -- & -- & -- & -- & -- &\\
2797 & -- & -- &$\bullet$& -- & -- & -- &\\
2799 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&\\
2801 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&\\
2803 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&\\
2805 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
2806 con \const{O\_CREATE} \\
2808 & -- &$\bullet$&$\bullet$& -- & -- & -- &
2809 con \const{O\_TRUNC} \\
2811 &$\bullet$&$\bullet$&$\bullet$& -- & -- & -- &\\
2813 &$\bullet$& -- & -- & -- & -- & -- &\\
2815 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&
2816 se esegue \func{unlink}\\
2818 & -- & -- & -- & -- &$\bullet$&$\bullet$&
2819 se esegue \func{rmdir}\\
2821 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&
2822 per entrambi gli argomenti\\
2824 & -- & -- & -- & -- &$\bullet$&$\bullet$&\\
2825 \func{truncate}, \func{ftruncate}
2826 & -- &$\bullet$&$\bullet$& -- & -- & -- &\\
2828 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&\\
2830 &$\bullet$&$\bullet$&$\bullet$& -- & -- & -- &\\
2832 & -- &$\bullet$&$\bullet$& -- & -- & -- &\\
2835 \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo
2836 accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento
2837 \textsl{(c)} dalle varie funzioni operanti su file e directory.}
2838 \label{tab:file_times_effects}
2842 L'effetto delle varie funzioni di manipolazione dei file sui relativi tempi è
2843 illustrato in tab.~\ref{tab:file_times_effects}, facendo riferimento al
2844 comportamento classico per quanto riguarda \var{st\_atime}. Si sono riportati
2845 gli effetti sia per il file a cui si fa riferimento, sia per la directory che
2846 lo contiene; questi ultimi possono essere capiti se si tiene conto di quanto
2847 già detto, e cioè che anche le directory sono anch'esse file che contengono
2848 una lista di nomi, che il sistema tratta in maniera del tutto analoga a tutti
2851 Per questo motivo tutte le volte che compiremo un'operazione su un file che
2852 comporta una modifica del nome contenuto nella directory, andremo anche a
2853 scrivere sulla directory che lo contiene cambiandone il tempo di modifica. Un
2854 esempio di questo tipo di operazione può essere la cancellazione di un file,
2855 invece leggere o scrivere o cambiare i permessi di un file ha effetti solo sui
2856 tempi di quest'ultimo.
2858 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
2859 creazione del file, usato in molti altri sistemi operativi, ma che in Unix non
2860 esiste. Per questo motivo quando si copia un file, a meno di preservare
2861 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
2862 avrà sempre il tempo corrente come data di ultima modifica.
2864 I tempi di ultimo accesso e modifica possono essere modificati esplicitamente
2865 usando la funzione \funcd{utime}, il cui prototipo è:
2866 \begin{prototype}{utime.h}
2867 {int utime(const char *filename, struct utimbuf *times)}
2868 Modifica i tempi di ultimo accesso e modifica di un file.
2870 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2871 errore, nel qual caso \var{errno} assumerà uno dei valori:
2873 \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
2874 \item[\errcode{EPERM}] non si è proprietari del file.
2876 ed inoltre \errval{EROFS} e \errval{ENOENT}.}
2879 La funzione cambia i tempi di ultimo accesso e modifica del file specificato
2880 dall'argomento \param{filename}, e richiede come secondo argomento il
2881 puntatore ad una struttura \struct{utimbuf}, la cui definizione è riportata in
2882 fig.~\ref{fig:struct_utimebuf}, con i nuovi valori di detti tempi
2883 (rispettivamente nei campi \var{actime} e \var{modtime}). Se si passa un
2884 puntatore nullo verrà impostato il tempo corrente.
2886 \begin{figure}[!htb]
2887 \footnotesize \centering
2888 \begin{minipage}[c]{\textwidth}
2889 \includestruct{listati/utimbuf.h}
2892 \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
2894 \label{fig:struct_utimebuf}
2897 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
2898 cosa è l'argomento \param{times}; se è \val{NULL} la funzione imposta il
2899 tempo corrente ed è sufficiente avere accesso in scrittura al file; se invece
2900 si è specificato un valore la funzione avrà successo solo se si è proprietari
2901 del file o si hanno i privilegi di amministratore.
2903 Si tenga presente che non è comunque possibile specificare il tempo di
2904 cambiamento di stato del file, che viene aggiornato direttamente dal kernel
2905 tutte le volte che si modifica \itindex{inode} l'\textit{inode} (quindi anche
2906 alla chiamata di \func{utime}). Questo serve anche come misura di sicurezza
2907 per evitare che si possa modificare un file nascondendo completamente le
2908 proprie tracce. In realtà la cosa resta possibile se si è in grado di accedere
2909 al \index{file!di~dispositivo} file di dispositivo, scrivendo direttamente sul
2910 disco senza passare attraverso il filesystem, ma ovviamente in questo modo la
2911 cosa è più complicata da realizzare.
2913 A partire dal kernel 2.6 la risoluzione dei tempi dei file, che nei campi di
2914 tab.~\ref{tab:file_file_times} è espressa in secondi, è stata portata ai
2915 nanosecondi per la gran parte dei filesystem. La ulteriore informazione può
2916 essere acceduta attraverso altri campi appositamente aggiunti alla struttura
2917 \struct{stat}. Se si sono definite le macro \macro{\_BSD\_SOURCE} o
2918 \macro{\_SVID\_SOURCE} questi sono \var{st\_atim.tv\_nsec},
2919 \var{st\_mtim.tv\_nsec} e \var{st\_ctim.tv\_nsec} se queste non sono definite,
2920 \var{st\_atimensec}, \var{st\_mtimensec} e \var{st\_mtimensec}. Qualora il
2921 supporto per questa maggior precisione sia assente questi campi aggiuntivi
2924 Per la gestione di questi nuovi valori è stata definita una seconda funzione
2925 di modifica, \funcd{utimes}, che consente di specificare tempi con maggior
2926 precisione; il suo prototipo è:
2929 {int utimes(const char *filename, struct timeval times[2])}
2930 Modifica i tempi di ultimo accesso e modifica di un file.
2932 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2933 errore, nel qual caso \var{errno} assumerà uno dei valori:
2935 \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
2936 \item[\errcode{EPERM}] non si è proprietari del file.
2938 ed inoltre \errval{EROFS} e \errval{ENOENT}.}
2941 La funzione è del tutto analoga alla precedente \func{utime} ma usa come
2942 secondo argomento un vettore di due strutture \struct{timeval}, la cui
2943 definizione è riportata in fig.~\ref{fig:sys_timeval_struct}, che consentono
2944 di indicare i tempi con una precisione del microsecondo. Il primo elemento
2945 di \param{times} indica il valore per il tempo di ultimo accesso, il secondo
2946 quello per il tempo di ultima modifica. Se si indica come secondo argomento un
2947 puntatore nullo di nuovo verrà utilizzato il tempo corrente.
2949 \begin{figure}[!htb]
2950 \footnotesize \centering
2951 \begin{minipage}[c]{\textwidth}
2952 \includestruct{listati/timeval.h}
2955 \caption{La struttura \structd{timeval} usata per indicare valori di tempo
2956 con la precisione del microsecondo.}
2957 \label{fig:sys_timeval_struct}
2960 Oltre ad \func{utimes} su Linux sono presenti altre due funzioni,\footnote{le
2961 due funzioni non sono definite in nessuno standard, ma sono presenti, oltre
2962 che su Linux, anche su BSD.} \funcd{futimes} e \funcd{lutimes}, che
2963 consentono rispettivamente di effettuare la modifica utilizzando un file
2964 già aperto o di eseguirla direttamente su un link simbolico. I relativi
2967 \headdecl{sys/time.h}
2969 \funcdecl{int futimes(int fd, const struct timeval tv[2])} Cambia i tempi
2970 di un file già aperto specificato tramite il file descriptor \param{fd}.
2972 \funcdecl{int lutimes(const char *filename, const struct timeval tv[2])}
2973 Cambia i tempi di \param{filename} anche se questo è un link simbolico.
2976 \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
2977 errore, nel qual caso \var{errno} assumerà gli stessi valori di
2978 \func{utimes}, con in più per \func{futimes}:
2980 \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
2981 \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
2985 Le due funzioni anno lo stesso comportamento di \texttt{utimes} e richiedono
2986 gli stessi privilegi per poter operare, la differenza è che con \func{futimes}
2987 si può indicare il file su cui operare facendo riferimento al relativo file
2988 descriptor mentre con \func{lutimes} nel caso in cui \param{filename} sia un
2989 link simbolico saranno modificati i suoi tempi invece di quelli del file a cui
2992 Nonostante il kernel, come accennato, supporti risoluzioni dei tempi dei file
2993 fino al nanosecondo, le funzioni fin qui esaminate non consentono di impostare
2994 valori con questa precisione. Per questo sono state introdotte due nuove
2995 funzioni, \funcd{futimens} e \func{utimensat}, in grado di eseguire questo
2996 compito; i rispettivi prototipi sono:
2998 \headdecl{sys/time.h}
3000 \funcdecl{futimens(int fd, const struct timespec times[2])} Cambia i tempi
3001 di un file già aperto, specificato dal file descriptor \param{fd}.
3003 \funcdecl{int utimensat(int dirfd, const char *pathname, const struct
3004 timespec times[2], int flags)} Cambia i tempi del file \param{pathname}.
3007 \bodydesc{Le funzioni restituiscono zero in caso di successo e $-1$ per un
3008 errore, nel qual caso \var{errno} assumerà gli stessi valori di
3009 \func{utimes}, con in più per \func{futimes}:
3011 \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3012 \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3016 Entrambe le funzioni utilizzano per indicare i valori dei tempi un
3017 vettore \param{times} di due strutture \struct{timespec} che permette di
3018 specificare un valore di tempo con una precisione fino al nanosecondo, la cui
3019 definizione è riportata in fig.~\ref{fig:sys_timespec_struct}.
3021 \begin{figure}[!htb]
3022 \footnotesize \centering
3023 \begin{minipage}[c]{\textwidth}
3024 \includestruct{listati/timespec.h}
3027 \caption{La struttura \structd{timespec} usata per indicare valori di tempo
3028 con la precisione del nanosecondo.}
3029 \label{fig:sys_timespec_struct}
3032 Come per le precedenti funzioni il primo elemento di \param{times} indica il
3033 tempo di ultimo accesso ed il secondo quello di ultima modifica, e se si usa
3034 il valore \val{NULL} verrà impostato il tempo corrente sia per l'ultimo
3035 accesso che per l'ultima modifica. Nei singoli elementi di \param{times} si
3036 possono inoltre utilizzare due valori speciali per il campo \var{tv\_nsec}:
3037 con \const{UTIME\_NOW} si richiede l'uso del tempo corrente, mentre con
3038 \const{UTIME\_OMIT} si richiede di non impostare il tempo. Si può così
3039 aggiornare in maniera specifica soltanto uno fra il tempo di ultimo accesso e
3040 quello di ultima modifica. Quando si usa uno di questi valori speciali per
3041 \var{tv\_nsec} il corrispondente valore di \var{tv\_sec} viene ignorato.
3043 Queste due funzioni sono una estensione definita in una recente revisione
3044 dello standard POSIX (la POSIX.1-2008); sono state introdotte a partire dal
3045 kernel 2.6.22, e supportate dalle \acr{glibc} a partire dalla versione
3046 2.6.\footnote{in precedenza, a partire dal kernel 2.6.16, era stata introdotta
3047 la funzione \func{futimesat} seguendo una bozza della revisione dello
3048 standard poi modificata, questa funzione, sostituita da \func{utimensat}, è
3049 stata dichiarata obsoleta, non è supportata da nessuno standard e non deve
3050 essere più utilizzata: pertanto non la tratteremo.} La prima è
3051 sostanzialmente una estensione di \func{futimes} che consente di specificare i
3052 tempi con precisione maggiore, la seconda supporta invece, rispetto ad
3053 \func{utimes}, una sintassi più complessa che, come vedremo in
3054 sez.~\ref{sec:file_openat} consente una indicazione sicura dei
3055 \textit{pathname relativi} specificando la directory da usare come riferimento
3056 in \param{dirfd} e la possibilità di usare \param{flags} per indicare alla
3057 funzione di dereferenziare o meno i link simbolici; si rimanda pertanto la
3058 spiegazione del significato degli argomenti aggiuntivi alla trattazione
3059 generica delle varie funzioni che usano la stessa sintassi, effettuata in
3060 sez.~\ref{sec:file_openat}.
3063 \section{Il controllo di accesso ai file}
3064 \label{sec:file_access_control}
3066 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
3067 del controllo di accesso ai file, che viene implementato per qualunque
3068 filesystem standard.\footnote{per standard si intende che implementa le
3069 caratteristiche previste dallo standard POSIX; in Linux sono disponibili
3070 anche una serie di altri filesystem, come quelli di Windows e del Mac, che
3071 non supportano queste caratteristiche.} In questa sezione ne esamineremo i
3072 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
3075 \subsection{I permessi per l'accesso ai file}
3076 \label{sec:file_perm_overview}
3078 Ad ogni file Linux associa sempre l'utente che ne è proprietario (il
3079 cosiddetto \textit{owner}) ed un gruppo di appartenenza, secondo il meccanismo
3080 degli identificatori di utente e gruppo (\acr{uid} e \acr{gid}). Questi valori
3081 sono accessibili da programma tramite la funzione \func{stat}, e sono
3082 mantenuti nei campi \var{st\_uid} e \var{st\_gid} della struttura
3083 \struct{stat} (si veda sez.~\ref{sec:file_stat}).\footnote{questo è vero solo
3084 per filesystem di tipo Unix, ad esempio non è vero per il filesystem vfat di
3085 Windows, che non fornisce nessun supporto per l'accesso multiutente, e per
3086 il quale i permessi vengono assegnati in maniera fissa con un opzione in
3089 Il controllo di accesso ai file segue un modello abbastanza semplice che
3090 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
3091 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
3092 Control List} che sono state aggiunte ai filesystem standard con opportune
3093 estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
3094 controllo ancora più sofisticati come il \textit{mandatory access control}
3095 di SE-Linux.} ma nella maggior parte dei casi il meccanismo standard è più
3096 che sufficiente a soddisfare tutte le necessità più comuni. I tre permessi di
3097 base associati ad ogni file sono:
3099 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
3101 \item il permesso di scrittura (indicato con la lettera \texttt{w},
3102 dall'inglese \textit{write}).
3103 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
3104 dall'inglese \textit{execute}).
3106 mentre i tre livelli su cui sono divisi i privilegi sono:
3108 \item i privilegi per l'utente proprietario del file.
3109 \item i privilegi per un qualunque utente faccia parte del gruppo cui
3111 \item i privilegi per tutti gli altri utenti.
3114 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
3115 meno significativi sono usati a gruppi di tre per indicare i permessi base di
3116 lettura, scrittura ed esecuzione e sono applicati rispettivamente
3117 rispettivamente al proprietario, al gruppo, a tutti gli altri.
3121 \includegraphics[width=6cm]{img/fileperm}
3122 \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
3123 contenuti nel campo \var{st\_mode} di \struct{stat}.}
3124 \label{fig:file_perm_bit}
3127 I restanti tre bit (noti come \itindex{suid~bit} \textit{suid bit},
3128 \itindex{sgid~bit} \textit{sgid bit}, e \itindex{sticky~bit} \textit{sticky
3129 bit}) sono usati per indicare alcune caratteristiche più complesse del
3130 meccanismo del controllo di accesso su cui torneremo in seguito (in
3131 sez.~\ref{sec:file_special_perm}); lo schema di allocazione dei bit è
3132 riportato in fig.~\ref{fig:file_perm_bit}.
3134 Anche i permessi, come tutte le altre informazioni pertinenti al file, sono
3135 memorizzati \itindex{inode} nell'\textit{inode}; in particolare essi sono
3136 contenuti in alcuni bit del campo \var{st\_mode} della struttura \struct{stat}
3137 (si veda di nuovo fig.~\ref{fig:file_stat_struct}).
3139 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
3140 \cmd{u} (per \textit{user}), \cmd{g} (per \textit{group}) e \cmd{o} (per
3141 \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti insieme
3142 si usa la lettera \cmd{a} (per \textit{all}). Si tenga ben presente questa
3143 distinzione dato che in certi casi, mutuando la terminologia in uso nel VMS,
3144 si parla dei permessi base come di permessi per \textit{owner}, \textit{group}
3145 ed \textit{all}, le cui iniziali possono dar luogo a confusione. Le costanti
3146 che permettono di accedere al valore numerico di questi bit nel campo
3147 \var{st\_mode} sono riportate in tab.~\ref{tab:file_bit_perm}.
3152 \begin{tabular}[c]{|c|l|}
3154 \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
3157 \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
3158 \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
3159 \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\
3161 \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
3162 \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
3163 \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
3165 \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
3166 \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
3167 \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
3170 \caption{I bit dei permessi di accesso ai file, come definiti in
3171 \texttt{<sys/stat.h>}}
3172 \label{tab:file_bit_perm}
3175 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
3176 che si riferiscano a dei file, dei link simbolici o delle directory; qui ci
3177 limiteremo ad un riassunto delle regole generali, entrando nei dettagli più
3180 La prima regola è che per poter accedere ad un file attraverso il suo
3181 \itindex{pathname} \textit{pathname} occorre il permesso di esecuzione in
3182 ciascuna delle directory che compongono il \textit{pathname}; lo stesso vale
3183 per aprire un file nella directory corrente (per la quale appunto serve il
3184 diritto di esecuzione).
3186 Per una directory infatti il permesso di esecuzione significa che essa può
3187 essere attraversata nella risoluzione del \itindex{pathname}
3188 \textit{pathname}, ed è distinto dal permesso di lettura che invece implica
3189 che si può leggere il contenuto della directory.
3191 Questo significa che se si ha il permesso di esecuzione senza permesso di
3192 lettura si potrà lo stesso aprire un file in una directory (se si hanno i
3193 permessi opportuni per il medesimo) ma non si potrà vederlo con \cmd{ls}
3194 (mentre per crearlo occorrerà anche il permesso di scrittura per la
3197 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
3198 (si veda quanto riportato in tab.~\ref{tab:file_open_flags}) di sola lettura o
3199 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
3200 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
3201 il contenuto, lo stesso permesso è necessario per poter troncare il file.
3203 Non si può creare un file fintanto che non si disponga del permesso di
3204 esecuzione e di quello di scrittura per la directory di destinazione; gli
3205 stessi permessi occorrono per cancellare un file da una directory (si ricordi
3206 che questo non implica necessariamente la rimozione del contenuto del file dal
3207 disco), non è necessario nessun tipo di permesso per il file stesso (infatti
3208 esso non viene toccato, viene solo modificato il contenuto della directory,
3209 rimuovendo la voce che ad esso fa riferimento).
3211 Per poter eseguire un file (che sia un programma compilato od uno script di
3212 shell, od un altro tipo di file eseguibile riconosciuto dal kernel), occorre
3213 avere il permesso di esecuzione, inoltre solo i file regolari possono essere
3216 I permessi per un link simbolico sono ignorati, contano quelli del file a cui
3217 fa riferimento; per questo in genere il comando \cmd{ls} riporta per un link
3218 simbolico tutti i permessi come concessi; utente e gruppo a cui esso
3219 appartiene vengono pure ignorati quando il link viene risolto, vengono
3220 controllati solo quando viene richiesta la rimozione del link e quest'ultimo è
3221 in una directory con lo \itindex{sticky~bit} \textit{sticky bit} impostato (si
3222 veda sez.~\ref{sec:file_special_perm}).
3224 La procedura con cui il kernel stabilisce se un processo possiede un certo
3225 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
3226 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
3227 \var{st\_gid} accennati in precedenza) e l'\acr{uid} effettivo, il \acr{gid}
3228 effettivo e gli eventuali \acr{gid} supplementari del processo.\footnote{in
3229 realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
3230 identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
3231 sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
3232 eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
3235 Per una spiegazione dettagliata degli identificatori associati ai processi si
3236 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
3237 sez.~\ref{sec:file_special_perm}, l'\acr{uid} effettivo e il \acr{gid} effettivo
3238 corrispondono ai valori dell'\acr{uid} e del \acr{gid} dell'utente che ha
3239 lanciato il processo, mentre i \acr{gid} supplementari sono quelli dei gruppi
3240 cui l'utente appartiene.
3242 I passi attraverso i quali viene stabilito se il processo possiede il diritto
3243 di accesso sono i seguenti:
3245 \item Se l'\acr{uid} effettivo del processo è zero (corrispondente
3246 all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
3247 controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
3249 \item Se l'\acr{uid} effettivo del processo è uguale all'\acr{uid} del
3250 proprietario del file (nel qual caso si dice che il processo è proprietario
3253 \item se il relativo\footnote{per relativo si intende il bit di user-read se
3254 il processo vuole accedere in lettura, quello di user-write per
3255 l'accesso in scrittura, ecc.} bit dei permessi d'accesso dell'utente è
3256 impostato, l'accesso è consentito
3257 \item altrimenti l'accesso è negato
3259 \item Se il \acr{gid} effettivo del processo o uno dei \acr{gid} supplementari
3260 dei processi corrispondono al \acr{gid} del file allora:
3262 \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
3264 \item altrimenti l'accesso è negato
3266 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
3267 l'accesso è consentito, altrimenti l'accesso è negato.
3270 Si tenga presente che questi passi vengono eseguiti esattamente in
3271 quest'ordine. Questo vuol dire che se un processo è il proprietario di un file,
3272 l'accesso è consentito o negato solo sulla base dei permessi per l'utente; i
3273 permessi per il gruppo non vengono neanche controllati. Lo stesso vale se il
3274 processo appartiene ad un gruppo appropriato, in questo caso i permessi per
3275 tutti gli altri non vengono controllati.
3278 \subsection{I bit dei permessi speciali}
3279 \label{sec:file_special_perm}
3284 Come si è accennato (in sez.~\ref{sec:file_perm_overview}) nei dodici bit del
3285 campo \var{st\_mode} di \struct{stat} che vengono usati per il controllo di
3286 accesso oltre ai bit dei permessi veri e propri, ci sono altri tre bit che
3287 vengono usati per indicare alcune proprietà speciali dei file. Due di questi
3288 sono i bit detti \acr{suid} (da \textit{set-user-ID bit}) e \acr{sgid} (da
3289 \textit{set-group-ID bit}) che sono identificati dalle costanti
3290 \const{S\_ISUID} e \const{S\_ISGID}.
3292 Come spiegato in dettaglio in sez.~\ref{sec:proc_exec}, quando si lancia un
3293 programma il comportamento normale del kernel è quello di impostare gli
3294 identificatori del gruppo \textit{effective} del nuovo processo al valore dei
3295 corrispondenti del gruppo \textit{real} del processo corrente, che normalmente
3296 corrispondono a quelli dell'utente con cui si è entrati nel sistema.
3298 Se però il file del programma (che ovviamente deve essere
3299 eseguibile\footnote{per motivi di sicurezza il kernel ignora i bit \acr{suid}
3300 e \acr{sgid} per gli script eseguibili.}) ha il bit \acr{suid} impostato, il
3301 kernel assegnerà come \acr{uid} effettivo al nuovo processo l'\acr{uid} del
3302 proprietario del file al posto dell'\acr{uid} del processo originario. Avere
3303 il bit \acr{sgid} impostato ha lo stesso effetto sul \acr{gid} effettivo del
3306 I bit \acr{suid} e \acr{sgid} vengono usati per permettere agli utenti normali
3307 di usare programmi che richiedono privilegi speciali; l'esempio classico è il
3308 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
3309 quest'ultimo ovviamente può essere scritto solo dall'amministratore, ma non è
3310 necessario chiamare l'amministratore per cambiare la propria password. Infatti
3311 il comando \cmd{passwd} appartiene a root ma ha il bit \acr{suid} impostato
3312 per cui quando viene lanciato da un utente normale parte con i privilegi di
3315 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
3316 normalmente l'utente che lo ha lanciato comporta vari rischi, e questo tipo di
3317 programmi devono essere scritti accuratamente per evitare che possano essere
3318 usati per guadagnare privilegi non consentiti (l'argomento è affrontato in
3319 dettaglio in sez.~\ref{sec:proc_perms}).
3321 La presenza dei bit \acr{suid} e \acr{sgid} su un file può essere rilevata con
3322 il comando \cmd{ls -l}, che visualizza una lettera \cmd{s} al posto della
3323 \cmd{x} in corrispondenza dei permessi di utente o gruppo. La stessa lettera
3324 \cmd{s} può essere usata nel comando \cmd{chmod} per impostare questi bit.
3325 Infine questi bit possono essere controllati all'interno di \var{st\_mode} con
3326 l'uso delle due costanti \const{S\_ISUID} e \const{S\_IGID}, i cui valori sono
3327 riportati in tab.~\ref{tab:file_mode_flags}.
3329 Gli stessi bit vengono ad assumere in significato completamente diverso per le
3330 directory, normalmente infatti Linux usa la convenzione di SVr4 per indicare
3331 con questi bit l'uso della semantica BSD nella creazione di nuovi file (si
3332 veda sez.~\ref{sec:file_ownership_management} per una spiegazione dettagliata
3335 Infine Linux utilizza il bit \acr{sgid} per un'ulteriore estensione mutuata
3336 da SVr4. Il caso in cui un file ha il bit \acr{sgid} impostato senza che lo
3337 sia anche il corrispondente bit di esecuzione viene utilizzato per attivare
3338 per quel file il \itindex{mandatory~locking} \textit{mandatory locking}
3339 (affronteremo questo argomento in dettaglio più avanti, in
3340 sez.~\ref{sec:file_mand_locking}).
3346 \itindbeg{sticky~bit}
3348 L'ultimo dei bit rimanenti, identificato dalla costante \const{S\_ISVTX}, è in
3349 parte un rimasuglio delle origini dei sistemi Unix. A quell'epoca infatti la
3350 memoria virtuale e l'accesso ai file erano molto meno sofisticati e per
3351 ottenere la massima velocità possibile per i programmi usati più comunemente
3352 si poteva impostare questo bit.
3354 L'effetto di questo bit era che il \index{segmento!testo} segmento di testo
3355 del programma (si veda sez.~\ref{sec:proc_mem_layout} per i dettagli) veniva
3356 scritto nella swap la prima volta che questo veniva lanciato, e vi permaneva
3357 fino al riavvio della macchina (da questo il nome di \textsl{sticky bit});
3358 essendo la swap un file continuo o una partizione indicizzata direttamente si
3359 poteva risparmiare in tempo di caricamento rispetto alla ricerca attraverso la
3360 struttura del filesystem. Lo \textsl{sticky bit} è indicato usando la lettera
3361 \texttt{t} al posto della \texttt{x} nei permessi per gli altri.
3363 Ovviamente per evitare che gli utenti potessero intasare la swap solo
3364 l'amministratore era in grado di impostare questo bit, che venne chiamato
3365 anche con il nome di \textit{saved text bit}, da cui deriva quello della
3366 costante. Le attuali implementazioni di memoria virtuale e filesystem rendono
3367 sostanzialmente inutile questo procedimento.
3369 Benché ormai non venga più utilizzato per i file, lo \textit{sticky bit} ha
3370 invece assunto un uso importante per le directory;\footnote{lo \textit{sticky
3371 bit} per le directory è un'estensione non definita nello standard POSIX,
3372 Linux però la supporta, così come BSD e SVr4.} in questo caso se tale bit è
3373 impostato un file potrà essere rimosso dalla directory soltanto se l'utente ha
3374 il permesso di scrittura su di essa ed inoltre è vera una delle seguenti
3377 \item l'utente è proprietario del file
3378 \item l'utente è proprietario della directory
3379 \item l'utente è l'amministratore
3381 un classico esempio di directory che ha questo bit impostato è \file{/tmp}, i
3382 permessi infatti di solito sono i seguenti:
3385 drwxrwxrwt 6 root root 1024 Aug 10 01:03 /tmp
3387 quindi con lo \textit{sticky bit} bit impostato. In questo modo qualunque
3388 utente nel sistema può creare dei file in questa directory (che, come
3389 suggerisce il nome, è normalmente utilizzata per la creazione di file
3390 temporanei), ma solo l'utente che ha creato un certo file potrà cancellarlo o
3391 rinominarlo. In questo modo si evita che un utente possa, più o meno
3392 consapevolmente, cancellare i file temporanei creati degli altri utenti.
3394 \itindend{sticky~bit}
3396 \subsection{Le funzioni per la gestione dei permessi dei file}
3397 \label{sec:file_perm_management}
3399 Come visto in sez.~\ref{sec:file_access_control} il controllo di accesso ad un
3400 file viene fatto utilizzando l'\acr{uid} ed il \acr{gid} effettivo del processo;
3401 ci sono casi però in cui si può voler effettuare il controllo con l'\acr{uid}
3402 reale ed il \acr{gid} reale, vale a dire usando i valori di \acr{uid} e
3403 \acr{gid} relativi all'utente che ha lanciato il programma, e che, come
3404 accennato in sez.~\ref{sec:file_special_perm} e spiegato in dettaglio in
3405 sez.~\ref{sec:proc_perms}, non è detto siano uguali a quelli effettivi.
3407 Per far questo si può usare la funzione \funcd{access}, il cui prototipo è:
3408 \begin{prototype}{unistd.h}
3409 {int access(const char *pathname, int mode)}
3411 Verifica i permessi di accesso.
3413 \bodydesc{La funzione ritorna 0 se l'accesso è consentito, -1 se l'accesso non
3414 è consentito ed in caso di errore; nel qual caso la variabile \var{errno}
3417 \item[\errcode{EINVAL}] il valore di \param{mode} non è valido.
3418 \item[\errcode{EACCES}] l'accesso al file non è consentito, o non si ha il
3419 permesso di attraversare una delle directory di \param{pathname}.
3420 \item[\errcode{EROFS}] si è richiesto l'accesso in scrittura per un file su
3421 un filesystem montato in sola lettura.
3423 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
3424 \errval{ENOTDIR}, \errval{ELOOP}, \errval{EIO}.}
3427 La funzione verifica i permessi di accesso, indicati da \param{mode}, per il
3428 file indicato da \param{pathname}. I valori possibili per l'argomento
3429 \param{mode} sono esprimibili come combinazione delle costanti numeriche
3430 riportate in tab.~\ref{tab:file_access_mode_val} (attraverso un OR binario
3431 delle stesse). I primi tre valori implicano anche la verifica dell'esistenza
3432 del file, se si vuole verificare solo quest'ultima si può usare \const{F\_OK},
3433 o anche direttamente \func{stat}. Nel caso in cui \param{pathname} si
3434 riferisca ad un link simbolico, questo viene seguito ed il controllo è fatto
3435 sul file a cui esso fa riferimento.
3437 La funzione controlla solo i bit dei permessi di accesso, si ricordi che il
3438 fatto che una directory abbia permesso di scrittura non significa che ci si
3439 possa scrivere come in un file, e il fatto che un file abbia permesso di
3440 esecuzione non comporta che contenga un programma eseguibile. La funzione
3441 ritorna zero solo se tutte i permessi controllati sono disponibili, in caso
3442 contrario (o di errore) ritorna -1.
3446 \begin{tabular}{|c|l|}
3448 \textbf{\param{mode}} & \textbf{Significato} \\
3451 \const{R\_OK} & Verifica il permesso di lettura. \\
3452 \const{W\_OK} & Verifica il permesso di scrittura. \\
3453 \const{X\_OK} & Verifica il permesso di esecuzione. \\
3454 \const{F\_OK} & Verifica l'esistenza del file. \\
3457 \caption{Valori possibile per l'argomento \param{mode} della funzione
3459 \label{tab:file_access_mode_val}
3462 Un esempio tipico per l'uso di questa funzione è quello di un processo che sta
3463 eseguendo un programma coi privilegi di un altro utente (ad esempio attraverso
3464 l'uso del \itindex{suid~bit} \textit{suid bit}) che vuole controllare se
3465 l'utente originale ha i permessi per accedere ad un certo file.
3467 Del tutto analoghe a \func{access} sono le due funzioni \funcd{euidaccess} e
3468 \funcd{eaccess} che ripetono lo stesso controllo usando però gli
3469 identificatori del gruppo effettivo, verificando quindi le effettive capacità
3470 di accesso ad un file. Le funzioni hanno entrambe lo stesso
3471 prototipo\footnote{in realtà \func{eaccess} è solo un sinonimo di
3472 \func{euidaccess} fornita per compatibilità con l'uso di questo nome in
3473 altri sistemi.} che è del tutto identico a quello di \func{access}. Prendono
3474 anche gli stessi valori e restituiscono gli stessi risultati e gli stessi
3477 Per cambiare i permessi di un file il sistema mette ad disposizione due
3478 funzioni \funcd{chmod} e \funcd{fchmod}, che operano rispettivamente su un
3479 filename e su un file descriptor, i loro prototipi sono:
3481 \headdecl{sys/types.h}
3482 \headdecl{sys/stat.h}
3484 \funcdecl{int chmod(const char *path, mode\_t mode)} Cambia i permessi del
3485 file indicato da \param{path} al valore indicato da \param{mode}.
3487 \funcdecl{int fchmod(int fd, mode\_t mode)} Analoga alla precedente, ma usa
3488 il file descriptor \param{fd} per indicare il file.
3490 \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
3491 un errore, in caso di errore \var{errno} può assumere i valori:
3493 \item[\errcode{EPERM}] l'\acr{uid} effettivo non corrisponde a quello del
3494 proprietario del file o non è zero.
3495 \item[\errcode{EROFS}] il file è su un filesystem in sola lettura.
3497 ed inoltre \errval{EIO}; \func{chmod} restituisce anche \errval{EFAULT},
3498 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
3499 \errval{EACCES}, \errval{ELOOP}; \func{fchmod} anche \errval{EBADF}.}
3502 Entrambe le funzioni utilizzano come secondo argomento \param{mode}, una
3503 variabile dell'apposito tipo primitivo \type{mode\_t} (vedi
3504 tab.~\ref{tab:intro_primitive_types}) utilizzato per specificare i permessi sui
3510 \begin{tabular}[c]{|c|c|l|}
3512 \textbf{\param{mode}} & \textbf{Valore} & \textbf{Significato} \\
3515 \const{S\_ISUID} & 04000 & Set user ID \itindex{suid~bit}.\\
3516 \const{S\_ISGID} & 02000 & Set group ID \itindex{sgid~bit}.\\
3517 \const{S\_ISVTX} & 01000 & Sticky bit \itindex{sticky~bit}.\\
3519 \const{S\_IRWXU} & 00700 & L'utente ha tutti i permessi.\\
3520 \const{S\_IRUSR} & 00400 & L'utente ha il permesso di lettura.\\
3521 \const{S\_IWUSR} & 00200 & L'utente ha il permesso di scrittura.\\
3522 \const{S\_IXUSR} & 00100 & L'utente ha il permesso di esecuzione.\\
3524 \const{S\_IRWXG} & 00070 & Il gruppo ha tutti i permessi.\\
3525 \const{S\_IRGRP} & 00040 & Il gruppo ha il permesso di lettura.\\
3526 \const{S\_IWGRP} & 00020 & Il gruppo ha il permesso di scrittura.\\
3527 \const{S\_IXGRP} & 00010 & Il gruppo ha il permesso di esecuzione.\\
3529 \const{S\_IRWXO} & 00007 & Gli altri hanno tutti i permessi.\\
3530 \const{S\_IROTH} & 00004 & Gli altri hanno il permesso di lettura.\\
3531 \const{S\_IWOTH} & 00002 & Gli altri hanno il permesso di scrittura.\\
3532 \const{S\_IXOTH} & 00001 & Gli altri hanno il permesso di esecuzione.\\
3535 \caption{Valori delle costanti usate per indicare i vari bit di
3536 \param{mode} utilizzato per impostare i permessi dei file.}
3537 \label{tab:file_permission_const}
3540 Le costanti con cui specificare i singoli bit di \param{mode} sono riportate
3541 in tab.~\ref{tab:file_permission_const}. Il valore di \param{mode} può essere
3542 ottenuto combinando fra loro con un OR binario le costanti simboliche relative
3543 ai vari bit, o specificato direttamente, come per l'omonimo comando di shell,
3544 con un valore numerico (la shell lo vuole in ottale, dato che i bit dei
3545 permessi sono divisibili in gruppi di tre), che si può calcolare direttamente
3546 usando lo schema si utilizzo dei bit illustrato in
3547 fig.~\ref{fig:file_perm_bit}.
3549 Ad esempio i permessi standard assegnati ai nuovi file (lettura e scrittura
3550 per il proprietario, sola lettura per il gruppo e gli altri) sono
3551 corrispondenti al valore ottale $0644$, un programma invece avrebbe anche il
3552 bit di esecuzione attivo, con un valore di $0755$, se si volesse attivare il
3553 bit \itindex{suid~bit} \acr{suid} il valore da fornire sarebbe $4755$.
3555 Il cambiamento dei permessi di un file eseguito attraverso queste funzioni ha
3556 comunque alcune limitazioni, previste per motivi di sicurezza. L'uso delle
3557 funzioni infatti è possibile solo se l'\acr{uid} effettivo del processo
3558 corrisponde a quello del proprietario del file o dell'amministratore,
3559 altrimenti esse falliranno con un errore di \errcode{EPERM}.
3561 Ma oltre a questa regola generale, di immediata comprensione, esistono delle
3562 limitazioni ulteriori. Per questo motivo, anche se si è proprietari del file,
3563 non tutti i valori possibili di \param{mode} sono permessi o hanno effetto;
3564 in particolare accade che:
3566 \item siccome solo l'amministratore può impostare lo \itindex{sticky~bit}
3567 \textit{sticky bit}, se l'\acr{uid} effettivo del processo non è zero esso
3568 viene automaticamente cancellato (senza notifica di errore) qualora sia
3569 stato indicato in \param{mode}.
3570 \item per quanto detto in sez.~\ref{sec:file_ownership_management} riguardo la
3571 creazione dei nuovi file, si può avere il caso in cui il file creato da un
3572 processo è assegnato ad un gruppo per il quale il processo non ha privilegi.
3573 Per evitare che si possa assegnare il bit \itindex{sgid~bit} \acr{sgid} ad
3574 un file appartenente ad un gruppo per cui non si hanno diritti, questo viene
3575 automaticamente cancellato da \param{mode} (senza notifica di errore)
3576 qualora il gruppo del file non corrisponda a quelli associati al processo
3577 (la cosa non avviene quando l'\acr{uid} effettivo del processo è zero).
3580 Per alcuni filesystem\footnote{i filesystem più comuni (\textsl{ext2},
3581 \textsl{ext3}, \textsl{ext4}, \textsl{ReiserFS}) supportano questa
3582 caratteristica, che è mutuata da BSD.} è inoltre prevista un'ulteriore
3583 misura di sicurezza, volta a scongiurare l'abuso dei \itindex{suid~bit} bit
3584 \acr{suid} e \acr{sgid}; essa consiste nel cancellare automaticamente questi
3585 bit dai permessi di un file qualora un processo che non appartenga
3586 all'amministratore\footnote{per la precisione un processo che non dispone
3587 della \itindex{capabilities} capacità \const{CAP\_FSETID}, vedi
3588 sez.~\ref{sec:proc_capabilities}.} effettui una scrittura. In questo modo
3589 anche se un utente malizioso scopre un file \acr{suid} su cui può scrivere,
3590 un'eventuale modifica comporterà la perdita di questo privilegio.
3592 Le funzioni \func{chmod} e \func{fchmod} ci permettono di modificare i
3593 permessi di un file, resta però il problema di quali sono i permessi assegnati
3594 quando il file viene creato. Le funzioni dell'interfaccia nativa di Unix, come
3595 vedremo in sez.~\ref{sec:file_open}, permettono di indicare esplicitamente i
3596 permessi di creazione di un file, ma questo non è possibile per le funzioni
3597 dell'interfaccia standard ANSI C che non prevede l'esistenza di utenti e
3598 gruppi, ed inoltre il problema si pone anche per l'interfaccia nativa quando i
3599 permessi non vengono indicati esplicitamente.
3603 Per le funzioni dell'interfaccia standard ANSI C l'unico riferimento possibile
3604 è quello della modalità di apertura del nuovo file (lettura/scrittura o sola
3605 lettura), che però può fornire un valore che è lo stesso per tutti e tre i
3606 permessi di sez.~\ref{sec:file_perm_overview} (cioè $666$ nel primo caso e
3607 $222$ nel secondo). Per questo motivo il sistema associa ad ogni
3608 processo\footnote{è infatti contenuta nel campo \var{umask} della struttura
3609 \struct{fs\_struct}, vedi fig.~\ref{fig:proc_task_struct}.} una maschera di
3610 bit, la cosiddetta \textit{umask}, che viene utilizzata per impedire che
3611 alcuni permessi possano essere assegnati ai nuovi file in sede di creazione. I
3612 bit indicati nella maschera vengono infatti cancellati dai permessi quando un
3613 nuovo file viene creato.\footnote{l'operazione viene fatta sempre: anche
3614 qualora si indichi esplicitamente un valore dei permessi nelle funzioni di
3615 creazione che lo consentono, i permessi contenuti nella \textit{umask}
3618 La funzione che permette di impostare il valore di questa maschera di
3619 controllo è \funcd{umask}, ed il suo prototipo è:
3620 \begin{prototype}{stat.h}
3621 {mode\_t umask(mode\_t mask)}
3623 Imposta la maschera dei permessi dei bit al valore specificato da \param{mask}
3624 (di cui vengono presi solo i 9 bit meno significativi).
3626 \bodydesc{La funzione ritorna il precedente valore della maschera. È una
3627 delle poche funzioni che non restituisce codici di errore.}
3630 In genere si usa questa maschera per impostare un valore predefinito che
3631 escluda preventivamente alcuni permessi (usualmente quello di scrittura per il
3632 gruppo e gli altri, corrispondente ad un valore per \param{mask} pari a
3633 $022$). In questo modo è possibile cancellare automaticamente i permessi non
3634 voluti. Di norma questo valore viene impostato una volta per tutte al login a
3635 $022$, e gli utenti non hanno motivi per modificarlo.
3640 \subsection{La gestione della titolarità dei file}
3641 \label{sec:file_ownership_management}
3643 Vedremo in sez.~\ref{sec:file_base_func} con quali funzioni si possono creare
3644 nuovi file, in tale occasione vedremo che è possibile specificare in sede di
3645 creazione quali permessi applicare ad un file, però non si può indicare a
3646 quale utente e gruppo esso deve appartenere. Lo stesso problema si presenta
3647 per la creazione di nuove directory (procedimento descritto in
3648 sez.~\ref{sec:file_dir_creat_rem}).
3650 Lo standard POSIX prescrive che l'\acr{uid} del nuovo file corrisponda
3651 all'\acr{uid} effettivo del processo che lo crea; per il \acr{gid} invece prevede
3652 due diverse possibilità:
3654 \item il \acr{gid} del file corrisponde al \acr{gid} effettivo del processo.
3655 \item il \acr{gid} del file corrisponde al \acr{gid} della directory in cui
3658 in genere BSD usa sempre la seconda possibilità, che viene per questo chiamata
3659 semantica BSD. Linux invece segue quella che viene chiamata semantica SVr4; di
3660 norma cioè il nuovo file viene creato, seguendo la prima opzione, con il
3661 \acr{gid} del processo, se però la directory in cui viene creato il file ha il
3662 bit \acr{sgid} impostato allora viene usata la seconda opzione.
3664 Usare la semantica BSD ha il vantaggio che il \acr{gid} viene sempre
3665 automaticamente propagato, restando coerente a quello della directory di
3666 partenza, in tutte le sotto-directory.
3668 La semantica SVr4 offre la possibilità di scegliere, ma per ottenere lo stesso
3669 risultato di coerenza che si ha con BSD necessita che quando si creano nuove
3670 directory venga anche propagato anche il bit \acr{sgid}. Questo è il
3671 comportamento predefinito del comando \cmd{mkdir}, ed è in questo modo ad
3672 esempio che le varie distribuzioni assicurano che le sotto-directory create
3673 nella home di un utente restino sempre con il \acr{gid} del gruppo primario
3676 La presenza del bit \acr{sgid} è inoltre molto comoda quando si hanno
3677 directory contenenti file condivisi all'intero di un gruppo in cui possono
3678 scrivere tutti i membri dello stesso, dato che assicura che i file che gli
3679 utenti vi creano appartengano sempre allo stesso gruppo. Questo non risolve
3680 però completamente i problemi di accesso da parte di altri utenti dello stesso
3681 gruppo, in quanto i permessi assegnati al gruppo potrebbero non essere
3682 sufficienti; in tal caso si deve aver cura di usare un valore di
3683 \itindex{umask} \textit{umask} che ne lasci di sufficienti.\footnote{in tal
3684 caso si può assegnare agli utenti del gruppo una \textit{umask} di $002$,
3685 anche se la soluzione migliore in questo caso è usare una ACL di default
3686 (vedi sez.~\ref{sec:file_ACL}).}
3688 Come avviene nel caso dei permessi il sistema fornisce anche delle funzioni,
3689 \funcd{chown}, \funcd{fchown} e \funcd{lchown}, che permettono di cambiare sia
3690 l'utente che il gruppo a cui un file appartiene; i rispettivi prototipi sono:
3692 \headdecl{sys/types.h}
3693 \headdecl{sys/stat.h}
3695 \funcdecl{int chown(const char *path, uid\_t owner, gid\_t group)}
3696 \funcdecl{int fchown(int fd, uid\_t owner, gid\_t group)}
3697 \funcdecl{int lchown(const char *path, uid\_t owner, gid\_t group)}
3699 Le funzioni cambiano utente e gruppo di appartenenza di un file ai valori
3700 specificati dalle variabili \param{owner} e \param{group}.
3702 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
3703 errore, nel qual caso caso \var{errno} assumerà i valori:
3705 \item[\errcode{EPERM}] l'\acr{uid} effettivo non corrisponde a quello del
3706 proprietario del file o non è zero, o utente e gruppo non sono validi
3708 Oltre a questi entrambe restituiscono gli errori \errval{EROFS} e
3709 \errval{EIO}; \func{chown} restituisce anche \errval{EFAULT},
3710 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
3711 \errval{EACCES}, \errval{ELOOP}; \func{fchown} anche \errval{EBADF}.}
3714 Con Linux solo l'amministratore\footnote{o in generale un processo con la
3715 \itindex{capabilities} capacità \const{CAP\_CHOWN}, vedi
3716 sez.~\ref{sec:proc_capabilities}.} può cambiare il proprietario di un file;
3717 in questo viene seguita la semantica usata da BSD che non consente agli utenti
3718 di assegnare i loro file ad altri utenti evitando eventuali aggiramenti delle
3719 quote. L'amministratore può cambiare sempre il gruppo di un file, il
3720 proprietario può cambiare il gruppo solo dei file che gli appartengono e solo
3721 se il nuovo gruppo è il suo gruppo primario o uno dei gruppi di cui fa parte.
3723 La funzione \func{chown} segue i link simbolici, per operare direttamente su
3724 un link simbolico si deve usare la funzione \func{lchown}.\footnote{fino alla
3725 versione 2.1.81 in Linux \func{chown} non seguiva i link simbolici, da
3726 allora questo comportamento è stato assegnato alla funzione \func{lchown},
3727 introdotta per l'occasione, ed è stata creata una nuova system call per
3728 \func{chown} che seguisse i link simbolici.} La funzione \func{fchown} opera
3729 su un file aperto, essa è mutuata da BSD, ma non è nello standard POSIX.
3730 Un'altra estensione rispetto allo standard POSIX è che specificando -1 come
3731 valore per \param{owner} e \param{group} i valori restano immutati.
3733 Quando queste funzioni sono chiamate con successo da un processo senza i
3734 privilegi di root entrambi i bit \itindex{suid~bit} \acr{suid} e
3735 \itindex{sgid~bit} \acr{sgid} vengono cancellati. Questo non avviene per il
3736 bit \acr{sgid} nel caso in cui esso sia usato (in assenza del corrispondente
3737 permesso di esecuzione) per indicare che per il file è attivo il
3738 \itindex{mandatory~locking} \textit{mandatory locking} (vedi
3739 sez.~\ref{sec:file_mand_locking}).
3742 \subsection{Un quadro d'insieme sui permessi}
3743 \label{sec:file_riepilogo}
3745 Avendo affrontato in maniera separata il comportamento delle varie funzioni
3746 che operano sui permessi dei file ed avendo trattato in sezioni diverse il
3747 significato dei singoli bit dei permessi, vale la pena di fare un riepilogo in
3748 cui si riassumano le caratteristiche di ciascuno di essi, in modo da poter
3749 fornire un quadro d'insieme.
3754 \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
3756 \multicolumn{3}{|c|}{special}&
3757 \multicolumn{3}{|c|}{user}&
3758 \multicolumn{3}{|c|}{group}&
3759 \multicolumn{3}{|c|}{other}&
3760 \multirow{2}{*}{\textbf{Significato per i file}} \\
3762 \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
3765 1&-&-&-&-&-&-&-&-&-&-&-&Se eseguito ha i permessi del proprietario.\\
3766 -&1&-&-&-&1&-&-&-&-&-&-&Se eseguito ha i permessi del gruppo proprietario.\\
3767 -&1&-&-&-&0&-&-&-&-&-&-&Il \itindex{mandatory~locking}
3768 \textit{mandatory locking} è abilitato.\\
3769 -&-&1&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
3770 -&-&-&1&-&-&-&-&-&-&-&-&Permesso di lettura per il proprietario.\\
3771 -&-&-&-&1&-&-&-&-&-&-&-&Permesso di scrittura per il proprietario.\\
3772 -&-&-&-&-&1&-&-&-&-&-&-&Permesso di esecuzione per il proprietario.\\
3773 -&-&-&-&-&-&1&-&-&-&-&-&Permesso di lettura per il gruppo proprietario.\\
3774 -&-&-&-&-&-&-&1&-&-&-&-&Permesso di scrittura per il gruppo proprietario.\\
3775 -&-&-&-&-&-&-&-&1&-&-&-&Permesso di esecuzione per il gruppo proprietario.\\
3776 -&-&-&-&-&-&-&-&-&1&-&-&Permesso di lettura per tutti gli altri.\\
3777 -&-&-&-&-&-&-&-&-&-&1&-&Permesso di scrittura per tutti gli altri.\\
3778 -&-&-&-&-&-&-&-&-&-&-&1&Permesso di esecuzione per tutti gli altri.\\
3781 \multicolumn{3}{|c|}{special}&
3782 \multicolumn{3}{|c|}{user}&
3783 \multicolumn{3}{|c|}{group}&
3784 \multicolumn{3}{|c|}{other}&
3785 \multirow{2}{*}{\textbf{Significato per le directory}} \\
3787 \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
3790 1&-&-&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
3791 -&1&-&-&-&-&-&-&-&-&-&-&Propaga il gruppo proprietario ai nuovi file
3793 -&-&1&-&-&-&-&-&-&-&-&-&Limita l'accesso in scrittura dei file nella
3795 -&-&-&1&-&-&-&-&-&-&-&-&Permesso di visualizzazione per il proprietario.\\
3796 -&-&-&-&1&-&-&-&-&-&-&-&Permesso di aggiornamento per il proprietario.\\
3797 -&-&-&-&-&1&-&-&-&-&-&-&Permesso di attraversamento per il proprietario.\\
3798 -&-&-&-&-&-&1&-&-&-&-&-&Permesso di visualizzazione per il gruppo
3800 -&-&-&-&-&-&-&1&-&-&-&-&Permesso di aggiornamento per il gruppo
3802 -&-&-&-&-&-&-&-&1&-&-&-&Permesso di attraversamento per il gruppo
3804 -&-&-&-&-&-&-&-&-&1&-&-&Permesso di visualizzazione per tutti gli altri.\\
3805 -&-&-&-&-&-&-&-&-&-&1&-&Permesso di aggiornamento per tutti gli altri.\\
3806 -&-&-&-&-&-&-&-&-&-&-&1&Permesso di attraversamento per tutti gli altri.\\
3809 \caption{Tabella riassuntiva del significato dei bit dei permessi per un
3811 \label{tab:file_fileperm_bits}
3814 Nella parte superiore di tab.~\ref{tab:file_fileperm_bits} si è riassunto il
3815 significato dei vari bit dei permessi per un file ordinario; per quanto
3816 riguarda l'applicazione dei permessi per proprietario, gruppo ed altri si
3817 ricordi quanto illustrato in sez.~\ref{sec:file_perm_overview}. Per
3818 compattezza, nella tabella si sono specificati i bit di \itindex{suid~bit}
3819 \textit{suid}, \itindex{sgid~bit} \textit{sgid} e \textit{sticky}
3820 \itindex{sticky~bit} con la notazione illustrata anche in
3821 fig.~\ref{fig:file_perm_bit}. Nella parte inferiore si sono invece riassunti
3822 i significati dei vari bit dei permessi per una directory; anche in questo
3823 caso si è riapplicato ai bit di \itindex{suid~bit} \textit{suid},
3824 \itindex{sgid~bit} \textit{sgid} e \textit{sticky} \itindex{sticky~bit} la
3825 notazione illustrata in fig.~\ref{fig:file_perm_bit}.
3827 Si ricordi infine che i permessi non hanno alcun significato per i link
3828 simbolici, mentre per i \index{file!di~dispositivo} file di dispositivo hanno
3829 senso soltanto i permessi di lettura e scrittura, che si riflettono sulla
3830 possibilità di compiere dette operazioni sul dispositivo stesso.
3832 Nella tabella si è indicato con il carattere ``-'' il fatto che il valore del
3833 bit in questione non è influente rispetto a quanto indicato nella riga della
3834 tabella; la descrizione del significato fa riferimento soltanto alla
3835 combinazione di bit per i quali è stato riportato esplicitamente un valore.
3836 Si rammenti infine che il valore dei bit dei permessi non ha alcun effetto
3837 qualora il processo possieda i privilegi di amministratore.
3840 \section{Caratteristiche e funzionalità avanzate}
3841 \label{sec:file_dir_advances}
3843 Tratteremo qui alcune caratteristiche e funzionalità avanzate della gestione
3844 di file e directory, affrontando anche una serie di estensioni
3845 dell'interfaccia classica dei sistemi unix-like, principalmente utilizzate a
3846 scopi di sicurezza, che sono state introdotte nelle versioni più recenti di
3849 \subsection{Gli attributi estesi}
3850 \label{sec:file_xattr}
3852 \itindbeg{Extended~Attributes}
3854 Nelle sezioni precedenti abbiamo trattato in dettaglio le varie informazioni
3855 che il sistema mantiene negli \itindex{inode} \textit{inode}, e le varie
3856 funzioni che permettono di modificarle. Si sarà notato come in realtà queste
3857 informazioni siano estremamente ridotte. Questo è dovuto al fatto che Unix
3858 origina negli anni '70, quando le risorse di calcolo e di spazio disco erano
3859 minime. Con il venir meno di queste restrizioni è incominciata ad emergere
3860 l'esigenza di poter associare ai file delle ulteriori informazioni astratte
3861 (quelli che vengono chiamati i \textsl{meta-dati}) che però non potevano
3862 trovare spazio nei dati classici mantenuti negli \itindex{inode}
3865 Per risolvere questo problema alcuni sistemi unix-like (e fra questi anche
3866 Linux) hanno introdotto un meccanismo generico, detto \textit{Extended
3867 Attributes} che consenta di associare delle informazioni ai singoli
3868 file.\footnote{l'uso più comune è quello della ACL, che tratteremo nella
3869 prossima sezione.} Gli \textsl{attributi estesi} non sono altro che delle
3870 coppie nome/valore che sono associate permanentemente ad un oggetto sul
3871 filesystem, analoghi di quello che sono le variabili di ambiente (vedi
3872 sez.~\ref{sec:proc_environ}) per un processo.
3874 Altri sistemi (come Solaris, MacOS e Windows) hanno adottato un meccanismo
3875 diverso in cui ad un file sono associati diversi flussi di dati, su cui
3876 possono essere mantenute ulteriori informazioni, che possono essere accedute
3877 con le normali operazioni di lettura e scrittura. Questi non vanno confusi con
3878 gli \textit{Extended Attributes} (anche se su Solaris hanno lo stesso nome),
3879 che sono un meccanismo molto più semplice, che pur essendo limitato (potendo
3880 contenere solo una quantità limitata di informazione) hanno il grande
3881 vantaggio di essere molto più semplici da realizzare, più
3882 efficienti,\footnote{cosa molto importante, specie per le applicazioni che
3883 richiedono una gran numero di accessi, come le ACL.} e di garantire
3884 l'atomicità di tutte le operazioni.
3886 In Linux gli attributi estesi sono sempre associati al singolo \itindex{inode}
3887 \textit{inode} e l'accesso viene sempre eseguito in forma atomica, in lettura
3888 il valore corrente viene scritto su un buffer in memoria, mentre la scrittura
3889 prevede che ogni valore precedente sia sovrascritto.
3891 Si tenga presente che non tutti i filesystem supportano gli \textit{Extended
3892 Attributes}; al momento della scrittura di queste dispense essi sono
3893 presenti solo sui vari \textsl{extN}, \textsl{ReiserFS}, \textsl{JFS},
3894 \textsl{XFS} e \textsl{Btrfs}.\footnote{l'elenco è aggiornato a Luglio 2011.}
3895 Inoltre a seconda della implementazione ci possono essere dei limiti sulla
3896 quantità di attributi che si possono utilizzare.\footnote{ad esempio nel caso
3897 di \textsl{ext2} ed \textsl{ext3} è richiesto che essi siano contenuti
3898 all'interno di un singolo blocco (pertanto con dimensioni massime pari a
3899 1024, 2048 o 4096 byte a seconda delle dimensioni di quest'ultimo impostate
3900 in fase di creazione del filesystem), mentre con \textsl{XFS} non ci sono
3901 limiti ed i dati vengono memorizzati in maniera diversa (nell'\textit{inode}
3902 stesso, in un blocco a parte, o in una struttura ad albero dedicata) per
3903 mantenerne la scalabilità.} Infine lo spazio utilizzato per mantenere gli
3904 attributi estesi viene tenuto in conto per il calcolo delle quote di utente e
3905 gruppo proprietari del file.
3907 Come meccanismo per mantenere informazioni aggiuntive associate al singolo
3908 file, gli \textit{Extended Attributes} possono avere usi anche molto diversi
3909 fra loro. Per poterli distinguere allora sono stati suddivisi in
3910 \textsl{classi}, a cui poter applicare requisiti diversi per l'accesso e la
3911 gestione. Per questo motivo il nome di un attributo deve essere sempre
3912 specificato nella forma \texttt{namespace.attribute}, dove \texttt{namespace}
3913 fa riferimento alla classe a cui l'attributo appartiene, mentre
3914 \texttt{attribute} è il nome ad esso assegnato. In tale forma il nome di un
3915 attributo esteso deve essere univoco. Al momento\footnote{della scrittura di
3916 questa sezione, kernel 2.6.23, ottobre 2007.} sono state definite le quattro
3917 classi di attributi riportate in tab.~\ref{tab:extended_attribute_class}.
3922 \begin{tabular}{|l|p{12cm}|}
3924 \textbf{Nome} & \textbf{Descrizione} \\
3927 \texttt{security}&Gli \textit{extended security attributes}: vengono
3928 utilizzati dalle estensioni di sicurezza del kernel (i
3929 \itindex{Linux~Security~Modules} \textit{Linux
3930 Security Modules}), per le realizzazione di meccanismi
3931 evoluti di controllo di accesso come \index{SELinux}
3932 SELinux o le \textit{capabilities} dei file di
3933 sez.~\ref{sec:proc_capabilities}.\\
3934 \texttt{system} & Gli \textit{extended security attributes}: sono usati
3935 dal kernel per memorizzare dati di sistema associati ai
3936 file come le \itindex{Access~Control~List~(ACL)} ACL (vedi
3937 sez.~\ref{sec:file_ACL}) o le \itindex{capabilities}
3938 \textit{capabilities} (vedi
3939 sez.~\ref{sec:proc_capabilities}).\\
3940 \texttt{trusted}& I \textit{trusted extended attributes}: vengono
3941 utilizzati per poter realizzare in user space
3942 meccanismi che consentano di mantenere delle
3943 informazioni sui file che non devono essere accessibili
3944 ai processi ordinari.\\
3945 \texttt{user} & Gli \textit{extended user attributes}: utilizzati per
3946 mantenere informazioni aggiuntive sui file (come il
3947 \textit{mime-type}, la codifica dei caratteri o del
3948 file) accessibili dagli utenti.\\
3951 \caption{I nomi utilizzati valore di \texttt{namespace} per distinguere le
3952 varie classi di \textit{Extended Attributes}.}
3953 \label{tab:extended_attribute_class}
3957 Dato che uno degli usi degli \textit{Extended Attributes} è quello che li
3958 impiega per realizzare delle estensioni (come le
3959 \itindex{Access~Control~List~(ACL)} ACL, \index{SELinux} SELinux, ecc.) al
3960 tradizionale meccanismo dei controlli di accesso di Unix, l'accesso ai loro
3961 valori viene regolato in maniera diversa a seconda sia della loro classe sia
3962 di quali, fra le estensioni che li utilizzano, sono poste in uso. In
3963 particolare, per ciascuna delle classi riportate in
3964 tab.~\ref{tab:extended_attribute_class}, si hanno i seguenti casi:
3965 \begin{basedescript}{\desclabelwidth{1.7cm}\desclabelstyle{\nextlinelabel}}
3966 \item[\texttt{security}] L'accesso agli \textit{extended security attributes}
3967 dipende dalle politiche di sicurezza stabilite da loro stessi tramite
3968 l'utilizzo di un sistema di controllo basato sui
3969 \itindex{Linux~Security~Modules} \textit{Linux Security Modules} (ad esempio
3970 \index{SELinux} SELinux). Pertanto l'accesso in lettura o scrittura dipende
3971 dalle politiche di sicurezza implementate all'interno dal modulo di
3972 sicurezza che si sta utilizzando al momento (ciascuno avrà le sue). Se non è
3973 stato caricato nessun modulo di sicurezza l'accesso in lettura sarà
3974 consentito a tutti i processi, mentre quello in scrittura solo ai processi
3975 con privilegi amministrativi dotati della \index{capabilities}
3976 \textit{capability} \const{CAP\_SYS\_ADMIN}.
3978 \item[\texttt{system}] Anche l'accesso agli \textit{extended system
3979 attributes} dipende dalle politiche di accesso che il kernel realizza
3980 anche utilizzando gli stessi valori in essi contenuti. Ad esempio nel caso
3981 delle \itindex{Access~Control~List~(ACL)} ACL l'accesso è consentito in
3982 lettura ai processi che hanno la capacità di eseguire una ricerca sul file
3983 (cioè hanno il permesso di lettura sulla directory che contiene il file) ed
3984 in scrittura al proprietario del file o ai processi dotati della
3985 \textit{capability} \index{capabilities} \const{CAP\_FOWNER}.\footnote{vale
3986 a dire una politica di accesso analoga a quella impiegata per gli ordinari
3989 \item[\texttt{trusted}] L'accesso ai \textit{trusted extended attributes}, sia
3990 per la lettura che per la scrittura, è consentito soltanto ai processi con
3991 privilegi amministrativi dotati della \index{capabilities}
3992 \textit{capability} \const{CAP\_SYS\_ADMIN}. In questo modo si possono
3993 utilizzare questi attributi per realizzare in user space dei meccanismi di
3994 controllo che accedono ad informazioni non disponibili ai processi ordinari.
3996 \item[\texttt{user}] L'accesso agli \textit{extended user attributes} è
3997 regolato dai normali permessi dei file: occorre avere il permesso di lettura
3998 per leggerli e quello di scrittura per scriverli o modificarli. Dato l'uso
3999 di questi attributi si è scelto di applicare al loro accesso gli stessi
4000 criteri che si usano per l'accesso al contenuto dei file (o delle directory)
4001 cui essi fanno riferimento. Questa scelta vale però soltanto per i file e le
4002 directory ordinarie, se valesse in generale infatti si avrebbe un serio
4003 problema di sicurezza dato che esistono diversi oggetti sul filesystem per i
4004 quali è normale avere avere il permesso di scrittura consentito a tutti gli
4005 utenti, come i link simbolici, o alcuni \index{file!di~dispositivo} file di
4006 dispositivo come \texttt{/dev/null}. Se fosse possibile usare su di essi gli
4007 \textit{extended user attributes} un utente qualunque potrebbe inserirvi
4008 dati a piacere.\footnote{la cosa è stata notata su XFS, dove questo
4009 comportamento permetteva, non essendovi limiti sullo spazio occupabile
4010 dagli \textit{Extended Attributes}, di bloccare il sistema riempiendo il
4013 La semantica del controllo di accesso indicata inoltre non avrebbe alcun
4014 senso al di fuori di file e directory: i permessi di lettura e scrittura per
4015 un \index{file!di~dispositivo} file di dispositivo attengono alle capacità
4016 di accesso al dispositivo sottostante,\footnote{motivo per cui si può
4017 formattare un disco anche se \texttt{/dev} è su un filesystem in sola
4018 lettura.} mentre per i link simbolici questi vengono semplicemente
4019 ignorati: in nessuno dei due casi hanno a che fare con il contenuto del
4020 file, e nella discussione relativa all'uso degli \textit{extended user
4021 attributes} nessuno è mai stato capace di indicare una qualche forma
4022 sensata di utilizzo degli stessi per link simbolici o
4023 \index{file!di~dispositivo} file di dispositivo, e neanche per le fifo o i
4024 socket. Per questo motivo essi sono stati completamente disabilitati per
4025 tutto ciò che non sia un file regolare o una directory.\footnote{si può
4026 verificare la semantica adottata consultando il file \texttt{fs/xattr.c}
4027 dei sorgenti del kernel.} Inoltre per le directory è stata introdotta una
4028 ulteriore restrizione, dovuta di nuovo alla presenza ordinaria di permessi
4029 di scrittura completi su directory come \texttt{/tmp}. Per questo motivo,
4030 per evitare eventuali abusi, se una directory ha lo \itindex{sticky~bit}
4031 \textit{sticky bit} attivo sarà consentito scrivere i suoi \textit{extended
4032 user attributes} soltanto se si è proprietari della stessa, o si hanno i
4033 privilegi amministrativi della capability \index{capabilities}
4034 \const{CAP\_FOWNER}.
4037 Le funzioni per la gestione degli attributi estesi, come altre funzioni di
4038 gestione avanzate specifiche di Linux, non fanno parte delle \acr{glibc}, e
4039 sono fornite da una apposita libreria, \texttt{libattr}, che deve essere
4040 installata a parte;\footnote{la versione corrente della libreria è
4041 \texttt{libattr1}.} pertanto se un programma le utilizza si dovrà indicare
4042 esplicitamente l'uso della suddetta libreria invocando il compilatore con
4043 l'opzione \texttt{-lattr}.
4045 Per poter leggere gli attributi estesi sono disponibili tre diverse funzioni,
4046 \funcd{getxattr}, \funcd{lgetxattr} e \funcd{fgetxattr}, che consentono
4047 rispettivamente di richiedere gli attributi relativi a un file, a un link
4048 simbolico e ad un file descriptor; i rispettivi prototipi sono:
4050 \headdecl{sys/types.h}
4051 \headdecl{attr/xattr.h}
4053 \funcdecl{ssize\_t getxattr(const char *path, const char *name, void
4054 *value, size\_t size)}
4056 \funcdecl{ssize\_t lgetxattr(const char *path, const char *name, void
4057 *value, size\_t size)}
4059 \funcdecl{ssize\_t fgetxattr(int filedes, const char *name, void *value,
4062 Le funzioni leggono il valore di un attributo esteso.
4064 \bodydesc{Le funzioni restituiscono un intero positivo che indica la
4065 dimensione dell'attributo richiesto in caso di successo, e $-1$ in caso di
4066 errore, nel qual caso \var{errno} assumerà i valori:
4068 \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
4069 \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
4070 non è sufficiente per contenere il risultato.
4071 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
4072 filesystem o sono disabilitati.
4074 e tutti gli errori di \func{stat}, come \errcode{EPERM} se non si hanno i
4075 permessi di accesso all'attributo. }
4078 Le funzioni \func{getxattr} e \func{lgetxattr} prendono come primo argomento
4079 un pathname che indica il file di cui si vuole richiedere un attributo, la
4080 sola differenza è che la seconda, se il pathname indica un link simbolico,
4081 restituisce gli attributi di quest'ultimo e non quelli del file a cui esso fa
4082 riferimento. La funzione \func{fgetxattr} prende invece come primo argomento
4083 un numero di file descriptor, e richiede gli attributi del file ad esso
4086 Tutte e tre le funzioni richiedono di specificare nell'argomento \param{name}
4087 il nome dell'attributo di cui si vuole ottenere il valore. Il nome deve essere
4088 indicato comprensivo di prefisso del \textit{namespace} cui appartiene (uno
4089 dei valori di tab.~\ref{tab:extended_attribute_class}) nella forma
4090 \texttt{namespace.attributename}, come stringa terminata da un carattere NUL.
4091 Il suo valore verrà restituito nel buffer puntato dall'argomento \param{value}
4092 per una dimensione massima di \param{size} byte;\footnote{gli attributi estesi
4093 possono essere costituiti arbitrariamente da dati testuali o binari.} se
4094 quest'ultima non è sufficiente si avrà un errore di \errcode{ERANGE}.
4096 Per evitare di dover indovinare la dimensione di un attributo per tentativi si
4097 può eseguire una interrogazione utilizzando un valore nullo per \param{size};
4098 in questo caso non verrà letto nessun dato, ma verrà restituito come valore di
4099 ritorno della funzione chiamata la dimensione totale dell'attributo esteso
4100 richiesto, che si potrà usare come stima per allocare un buffer di dimensioni
4101 sufficienti.\footnote{si parla di stima perché anche se le funzioni
4102 restituiscono la dimensione esatta dell'attributo al momento in cui sono
4103 eseguite, questa potrebbe essere modificata in qualunque momento da un
4104 successivo accesso eseguito da un altro processo.}
4106 Un secondo gruppo di funzioni è quello che consente di impostare il valore di
4107 un attributo esteso, queste sono \funcd{setxattr}, \funcd{lsetxattr} e
4108 \funcd{fsetxattr}, e consentono di operare rispettivamente su un file, su un
4109 link simbolico o specificando un file descriptor; i loro prototipi sono:
4111 \headdecl{sys/types.h}
4112 \headdecl{attr/xattr.h}
4114 \funcdecl{int setxattr(const char *path, const char *name, const void
4115 *value, size\_t size, int flags)}
4117 \funcdecl{int lsetxattr(const char *path, const char *name, const void
4118 *value, size\_t size, int flags)}
4120 \funcdecl{int fsetxattr(int filedes, const char *name, const void *value,
4121 size\_t size, int flags)}
4123 Impostano il valore di un attributo esteso.
4125 \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
4126 errore, nel qual caso \var{errno} assumerà i valori:
4128 \item[\errcode{ENOATTR}] si è usato il flag \const{XATTR\_REPLACE} e
4129 l'attributo richiesto non esiste.
4130 \item[\errcode{EEXIST}] si è usato il flag \const{XATTR\_CREATE} ma
4131 l'attributo esiste già.
4132 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
4133 filesystem o sono disabilitati.
4135 Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
4136 ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
4141 Le tre funzioni prendono come primo argomento un valore adeguato al loro
4142 scopo, usato in maniera del tutto identica a quanto visto in precedenza per le
4143 analoghe che leggono gli attributi estesi. Il secondo argomento \param{name}
4144 deve indicare, anche in questo caso con gli stessi criteri appena visti per le
4145 analoghe \func{getxattr}, \func{lgetxattr} e \func{fgetxattr}, il nome
4146 (completo di suffisso) dell'attributo su cui si vuole operare.
4148 Il valore che verrà assegnato all'attributo dovrà essere preparato nel buffer
4149 puntato da \param{value}, e la sua dimensione totale (in byte) sarà indicata
4150 dall'argomento \param{size}. Infine l'argomento \param{flag} consente di
4151 controllare le modalità di sovrascrittura dell'attributo esteso, esso può
4152 prendere due valori: con \const{XATTR\_REPLACE} si richiede che l'attributo
4153 esista, nel qual caso verrà sovrascritto, altrimenti si avrà errore, mentre
4154 con \const{XATTR\_CREATE} si richiede che l'attributo non esista, nel qual
4155 caso verrà creato, altrimenti si avrà errore ed il valore attuale non sarà
4156 modificato. Utilizzando per \param{flag} un valore nullo l'attributo verrà
4157 modificato se è già presente, o creato se non c'è.
4159 Le funzioni finora illustrate permettono di leggere o scrivere gli attributi
4160 estesi, ma sarebbe altrettanto utile poter vedere quali sono gli attributi
4161 presenti; a questo provvedono le funzioni \funcd{listxattr},
4162 \funcd{llistxattr} e \funcd{flistxattr} i cui prototipi sono:
4164 \headdecl{sys/types.h}
4165 \headdecl{attr/xattr.h}
4167 \funcdecl{ssize\_t listxattr(const char *path, char *list, size\_t size)}
4169 \funcdecl{ssize\_t llistxattr(const char *path, char *list, size\_t size)}
4171 \funcdecl{ssize\_t flistxattr(int filedes, char *list, size\_t size)}
4173 Leggono la lista degli attributi estesi di un file.
4175 \bodydesc{Le funzioni restituiscono un intero positivo che indica la
4176 dimensione della lista in caso di successo, e $-1$ in caso di errore, nel
4177 qual caso \var{errno} assumerà i valori:
4179 \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
4180 non è sufficiente per contenere il risultato.
4181 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
4182 filesystem o sono disabilitati.
4184 Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
4185 ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
4190 Come per le precedenti le tre funzioni leggono gli attributi rispettivamente
4191 di un file, un link simbolico o specificando un file descriptor, da
4192 specificare con il loro primo argomento. Gli altri due argomenti, identici per
4193 tutte e tre, indicano rispettivamente il puntatore \param{list} al buffer dove
4194 deve essere letta la lista e la dimensione \param{size} di quest'ultimo.
4196 La lista viene fornita come sequenza non ordinata dei nomi dei singoli
4197 attributi estesi (sempre comprensivi del prefisso della loro classe) ciascuno
4198 dei quali è terminato da un carattere nullo. I nomi sono inseriti nel buffer
4199 uno di seguito all'altro. Il valore di ritorno della funzione indica la
4200 dimensione totale della lista in byte.
4202 Come per le funzioni di lettura dei singoli attributi se le dimensioni del
4203 buffer non sono sufficienti si avrà un errore, ma è possibile ottenere dal
4204 valore di ritorno della funzione una stima della dimensione totale della lista
4205 usando per \param{size} un valore nullo.
4207 Infine per rimuovere semplicemente un attributo esteso, si ha a disposizione
4208 un ultimo gruppo di funzioni: \funcd{removexattr}, \funcd{lremovexattr} e
4209 \funcd{fremovexattr}; i rispettivi prototipi sono:
4211 \headdecl{sys/types.h}
4212 \headdecl{attr/xattr.h}
4214 \funcdecl{int removexattr(const char *path, const char *name)}
4216 \funcdecl{int lremovexattr(const char *path, const char *name)}
4218 \funcdecl{int fremovexattr(int filedes, const char *name)}
4221 Rimuovono un attributo esteso di un file.
4223 \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
4224 errore, nel qual caso \var{errno} assumerà i valori:
4226 \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
4227 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
4228 filesystem o sono disabilitati.
4230 ed inoltre tutti gli errori di \func{stat}.
4234 Le tre funzioni rimuovono l'attributo esteso indicato dall'argomento
4235 \param{name} rispettivamente di un file, un link simbolico o specificando un
4236 file descriptor, da specificare con il loro primo argomento. Anche in questo
4237 caso l'argomento \param{name} deve essere specificato con le modalità già
4238 illustrate in precedenza per le altre funzioni relative agli attributi estesi.
4240 \itindend{Extended~Attributes}
4243 \subsection{Le \textit{Access Control List}}
4244 \label{sec:file_ACL}
4246 % la documentazione di sistema è nei pacchetti libacl1-dev e acl
4247 % vedi anche http://www.suse.de/~agruen/acl/linux-acls/online/
4249 \itindbeg{Access~Control~List~(ACL)}
4251 Il modello classico dei permessi di Unix, per quanto funzionale ed efficiente,
4252 è comunque piuttosto limitato e per quanto possa aver coperto per lunghi anni
4253 le esigenze più comuni con un meccanismo semplice e potente, non è in grado di
4254 rispondere in maniera adeguata a situazioni che richiedono una gestione
4255 complessa dei permessi di accesso.\footnote{già un requisito come quello di
4256 dare accesso in scrittura ad alcune persone ed in sola lettura ad altre non
4257 si può soddisfare in maniera semplice.}
4259 Per questo motivo erano state progressivamente introdotte nelle varie versioni
4260 di Unix dei meccanismi di gestione dei permessi dei file più flessibili, nella
4261 forma delle cosiddette \textit{Access Control List} (indicate usualmente con
4262 la sigla ACL). Nello sforzo di standardizzare queste funzionalità era stato
4263 creato un gruppo di lavoro il cui scopo era estendere lo standard POSIX 1003
4264 attraverso due nuovi insiemi di specifiche, la POSIX 1003.1e per l'interfaccia
4265 di programmazione e la POSIX 1003.2c per i comandi di shell.
4267 Gli obiettivi erano però forse troppo ambizioni, e nel gennaio del 1998 i
4268 finanziamenti vennero ritirati senza che si fosse arrivati alla definizione di
4269 uno standard, dato però che una parte della documentazione prodotta era di
4270 alta qualità venne deciso di rilasciare al pubblico la diciassettesima bozza
4271 del documento, quella che va sotto il nome di \textit{POSIX 1003.1e Draft 17},
4272 che è divenuta la base sulla quale si definiscono le cosiddette \textit{Posix
4275 A differenza di altri sistemi (ad esempio FreeBSD) nel caso di Linux si è
4276 scelto di realizzare le ACL attraverso l'uso degli
4277 \itindex{Extended~Attributes} \textit{Extended Attributes} (appena trattati in
4278 sez.~\ref{sec:file_xattr}), e fornire tutte le relative funzioni di gestione
4279 tramite una libreria, \texttt{libacl} che nasconde i dettagli implementativi
4280 delle ACL e presenta ai programmi una interfaccia che fa riferimento allo
4281 standard POSIX 1003.1e.
4283 Anche in questo caso le funzioni di questa libreria non fanno parte delle
4284 \acr{glibc} e devono essere installate a parte;\footnote{la versione corrente
4285 della libreria è \texttt{libacl1}, e nel caso si usi Debian la si può
4286 installare con il pacchetto omonimo e con il collegato \texttt{libacl1-dev}
4287 per i file di sviluppo.} pertanto se un programma le utilizza si dovrà
4288 indicare esplicitamente l'uso della libreria \texttt{libacl} invocando il
4289 compilatore con l'opzione \texttt{-lacl}. Si tenga presente inoltre che per
4290 poterle utilizzare le ACL devono essere attivate esplicitamente montando il
4291 filesystem\footnote{che deve supportarle, ma questo è ormai vero per
4292 praticamente tutti i filesystem più comuni, con l'eccezione di NFS per il
4293 quale esiste però un supporto sperimentale.} su cui le si vogliono
4294 utilizzare con l'opzione \texttt{acl} attiva. Dato che si tratta di una
4295 estensione è infatti opportuno utilizzarle soltanto laddove siano necessarie.
4297 Una ACL è composta da un insieme di voci, e ciascuna voce è a sua volta
4298 costituita da un \textsl{tipo}, da un eventuale
4299 \textsl{qualificatore},\footnote{deve essere presente soltanto per le voci di
4300 tipo \const{ACL\_USER} e \const{ACL\_GROUP}.} e da un insieme di permessi.
4301 Ad ogni oggetto sul filesystem si può associare una ACL che ne governa i
4302 permessi di accesso, detta \textit{access ACL}. Inoltre per le directory si
4303 può impostare una ACL aggiuntiva, detta \textit{default ACL}, che serve ad
4304 indicare quale dovrà essere la ACL assegnata di default nella creazione di un
4305 file all'interno della directory stessa. Come avviene per i permessi le ACL
4306 possono essere impostate solo del proprietario del file, o da un processo con
4307 la capability \index{capabilities} \const{CAP\_FOWNER}.
4312 \begin{tabular}{|l|p{8cm}|}
4314 \textbf{Tipo} & \textbf{Descrizione} \\
4317 \const{ACL\_USER\_OBJ} & voce che contiene i diritti di accesso del
4318 proprietario del file.\\
4319 \const{ACL\_USER} & voce che contiene i diritti di accesso per
4320 l'utente indicato dal rispettivo
4322 \const{ACL\_GROUP\_OBJ}& voce che contiene i diritti di accesso del
4323 gruppo proprietario del file.\\
4324 \const{ACL\_GROUP} & voce che contiene i diritti di accesso per
4325 il gruppo indicato dal rispettivo
4327 \const{ACL\_MASK} & voce che contiene la maschera dei massimi
4328 permessi di accesso che possono essere garantiti
4329 da voci del tipo \const{ACL\_USER},
4330 \const{ACL\_GROUP} e \const{ACL\_GROUP\_OBJ}.\\
4331 \const{ACL\_OTHER} & voce che contiene i diritti di accesso di chi
4332 non corrisponde a nessuna altra voce dell'ACL.\\
4335 \caption{Le costanti che identificano i tipi delle voci di una ACL.}
4336 \label{tab:acl_tag_types}
4339 L'elenco dei vari tipi di voci presenti in una ACL, con una breve descrizione
4340 del relativo significato, è riportato in tab.~\ref{tab:acl_tag_types}. Tre di
4341 questi tipi, \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e
4342 \const{ACL\_OTHER}, corrispondono direttamente ai tre permessi ordinari dei
4343 file (proprietario, gruppo proprietario e tutti gli altri) e per questo una
4344 ACL valida deve sempre contenere una ed una sola voce per ciascuno di questi
4347 Una ACL può poi contenere un numero arbitrario di voci di tipo
4348 \const{ACL\_USER} e \const{ACL\_GROUP}, ciascuna delle quali indicherà i
4349 permessi assegnati all'utente e al gruppo indicato dal relativo qualificatore;
4350 ovviamente ciascuna di queste voci dovrà fare riferimento ad un utente o ad un
4351 gruppo diverso, e non corrispondenti a quelli proprietari del file. Inoltre se
4352 in una ACL esiste una voce di uno di questi due tipi è obbligatoria anche la
4353 presenza di una ed una sola voce di tipo \const{ACL\_MASK}, che negli altri
4356 Quest'ultimo tipo di voce contiene la maschera dei permessi che possono essere
4357 assegnati tramite voci di tipo \const{ACL\_USER}, \const{ACL\_GROUP} e
4358 \const{ACL\_GROUP\_OBJ}; se in una di queste voci si fosse specificato un
4359 permesso non presente in \const{ACL\_MASK} questo verrebbe ignorato. L'uso di
4360 una ACL di tipo \const{ACL\_MASK} è di particolare utilità quando essa
4361 associata ad una \textit{default ACL} su una directory, in quanto i permessi
4362 così specificati verranno ereditati da tutti i file creati nella stessa
4363 directory. Si ottiene così una sorta di \itindex{umask} \textit{umask}
4364 associata ad un oggetto sul filesystem piuttosto che a un processo.
4366 Dato che le ACL vengono a costituire una estensione dei permessi ordinari, uno
4367 dei problemi che si erano posti nella loro standardizzazione era appunto
4368 quello della corrispondenza fra questi e le ACL. Come accennato i permessi
4369 ordinari vengono mappati le tre voci di tipo \const{ACL\_USER\_OBJ},
4370 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} che devono essere presenti in
4371 qualunque ACL; un cambiamento ad una di queste voci viene automaticamente
4372 riflesso sui permessi ordinari dei file\footnote{per permessi ordinari si
4373 intende quelli mantenuti nell'\textit{inode}, che devono restare dato che un
4374 filesystem può essere montato senza abilitare le ACL.} e viceversa. In
4375 realtà la mappatura è diretta solo per le voci \const{ACL\_USER\_OBJ} e
4376 \const{ACL\_OTHER}, nel caso di \const{ACL\_GROUP\_OBJ} questo vale soltanto
4377 se non è presente una voce di tipo \const{ACL\_MASK}, se invece questa è
4378 presente verranno tolti dai permessi di \const{ACL\_GROUP\_OBJ} tutti quelli
4379 non presenti in \const{ACL\_MASK}.\footnote{questo diverso comportamento a
4380 seconda delle condizioni è stato introdotto dalla standardizzazione
4381 \textit{POSIX 1003.1e Draft 17} per mantenere il comportamento invariato sui
4382 sistemi dotati di ACL per tutte quelle applicazioni che sono conformi
4383 soltanto all'ordinario standard \textit{POSIX 1003.1}.}
4385 Un secondo aspetto dell'incidenza delle ACL sul comportamento del sistema è
4386 quello relativo alla creazione di nuovi file,\footnote{o oggetti sul
4387 filesystem, il comportamento discusso vale per le funzioni \func{open} e
4388 \func{creat} (vedi sez.~\ref{sec:file_open}), \func{mkdir} (vedi
4389 sez.~\ref{sec:file_dir_creat_rem}), \func{mknod} e \func{mkfifo} (vedi
4390 sez.~\ref{sec:file_mknod}).} che come accennato può essere modificato dalla
4391 presenza di una \textit{default ACL} sulla directory che contiene quel file.
4392 Se questa non c'è valgono le regole usuali illustrate in
4393 sez.~\ref{sec:file_perm_management}, per cui essi sono determinati dalla
4394 \itindex{umask} \textit{umask} del processo, e la sola differenza è che i
4395 permessi ordinari da esse risultanti vengono automaticamente rimappati anche
4396 su una ACL di accesso assegnata automaticamente al nuovo file, che contiene
4397 soltanto le tre corrispondenti voci di tipo \const{ACL\_USER\_OBJ},
4398 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER}.
4400 Se invece è presente una ACL di default sulla directory che contiene il nuovo
4401 file questa diventerà automaticamente la sua ACL di accesso, a meno di non
4402 aver indicato, nelle funzioni di creazione che lo consentono, uno specifico
4403 valore per i permessi ordinari;\footnote{tutte le funzioni citate in
4404 precedenza supportano un argomento \var{mode} che indichi un insieme di
4405 permessi iniziale.} in tal caso saranno eliminati dalle voci corrispondenti
4406 nella ACL tutti quelli non presenti in tale indicazione.
4408 Dato che questa è la ragione che ha portato alla loro creazione, la principale
4409 modifica introdotta con la presenza della ACL è quella alle regole del
4410 controllo di accesso ai file illustrate in sez.~\ref{sec:file_perm_overview}.
4411 Come nel caso ordinario per il controllo vengono sempre utilizzati gli
4412 identificatori del gruppo \textit{effective} del processo, ma in presenza di
4413 ACL i passi attraverso i quali viene stabilito se esso ha diritto di accesso
4416 \item Se l'\acr{uid} del processo è nullo l'accesso è sempre garantito senza
4418 \item Se l'\acr{uid} del processo corrisponde al proprietario del file allora:
4420 \item se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
4421 l'accesso è consentito;
4422 \item altrimenti l'accesso è negato.
4424 \item Se l'\acr{uid} del processo corrisponde ad un qualunque qualificatore
4425 presente in una voce \const{ACL\_USER} allora:
4427 \item se la voce \const{ACL\_USER} corrispondente e la voce
4428 \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
4430 \item altrimenti l'accesso è negato.
4432 \item Se è il \acr{gid} del processo o uno dei \acr{gid} supplementari
4433 corrisponde al gruppo proprietario del file allora:
4435 \item se la voce \const{ACL\_GROUP\_OBJ} e una eventuale voce
4436 \const{ACL\_MASK} (se non vi sono voci di tipo \const{ACL\_GROUP} questa
4437 può non essere presente) contengono entrambe il permesso richiesto,
4438 l'accesso è consentito;
4439 \item altrimenti l'accesso è negato.
4441 \item Se è il \acr{gid} del processo o uno dei \acr{gid} supplementari
4442 corrisponde ad un qualunque qualificatore presente in una voce
4443 \const{ACL\_GROUP} allora:
4445 \item se la voce \const{ACL\_GROUP} corrispondente e la voce
4446 \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
4448 \item altrimenti l'accesso è negato.
4450 \item Se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
4451 l'accesso è consentito, altrimenti l'accesso è negato.
4454 I passi di controllo vengono eseguiti esattamente in questa sequenza, e la
4455 decisione viene presa non appena viene trovata una corrispondenza con gli
4456 identificatori del processo. Questo significa che i permessi presenti in una
4457 voce di tipo \const{ACL\_USER} hanno la precedenza sui permessi ordinari
4458 associati al gruppo proprietario del file (vale a dire su
4459 \const{ACL\_GROUP\_OBJ}).
4461 Per la gestione delle ACL lo standard \textit{POSIX 1003.1e Draft 17} ha
4462 previsto delle apposite funzioni ed tutta una serie di tipi di dati
4463 dedicati;\footnote{fino a definire un tipo di dato e delle costanti apposite
4464 per identificare i permessi standard di lettura, scrittura ed esecuzione.}
4465 tutte le operazioni devono essere effettuate attraverso tramite questi tipi di
4466 dati, che incapsulano tutte le informazioni contenute nelle ACL. La prima di
4467 queste funzioni che prendiamo in esame è \funcd{acl\_init}, il cui prototipo
4470 \headdecl{sys/types.h}
4471 \headdecl{sys/acl.h}
4473 \funcdecl{acl\_t acl\_init(int count)}
4475 Inizializza un'area di lavoro per una ACL di \param{count} voci.
4477 \bodydesc{La funzione restituisce un puntatore all'area di lavoro in caso di
4478 successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
4479 assumerà uno dei valori:
4481 \item[\errcode{EINVAL}] il valore di \param{count} è negativo.
4482 \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile.
4487 La funzione alloca ed inizializza un'area di memoria che verrà usata per
4488 mantenere i dati di una ACL contenente fino ad un massimo di \param{count}
4489 voci. La funzione ritorna un valore di tipo \type{acl\_t}, da usare in tutte
4490 le altre funzioni che operano sulla ACL. La funzione si limita alla
4491 allocazione iniziale e non inserisce nessun valore nella ACL che resta vuota.
4492 Si tenga presente che pur essendo \type{acl\_t} un \index{tipo!opaco} tipo
4493 opaco che identifica ``\textsl{l'oggetto}'' ACL, il valore restituito dalla
4494 funzione non è altro che un puntatore all'area di memoria allocata per i dati
4495 richiesti; pertanto in caso di fallimento verrà restituito un puntatore nullo
4496 e si dovrà confrontare il valore di ritorno della funzione con
4497 ``\code{(acl\_t) NULL}''.
4499 Una volta che si siano completate le operazioni sui dati di una ACL la memoria
4500 allocata dovrà essere liberata esplicitamente attraverso una chiamata alla
4501 funzione \funcd{acl\_free}, il cui prototipo è:
4503 \headdecl{sys/types.h}
4504 \headdecl{sys/acl.h}
4506 \funcdecl{int acl\_free(void * obj\_p)}
4508 Disalloca la memoria riservata per i dati di una ACL.
4510 \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ se
4511 \param{obj\_p} non è un puntatore valido, nel qual caso \var{errno}
4512 assumerà il valore \errcode{EINVAL}
4516 Si noti come la funzione richieda come argomento un puntatore di tipo
4517 ``\ctyp{void *}'', essa infatti può essere usata non solo per liberare la
4518 memoria allocata per i dati di una ACL, ma anche per quella usata per creare
4519 le stringhe di descrizione testuale delle ACL o per ottenere i valori dei
4520 qualificatori di una voce; pertanto a seconda dei casi occorrerà eseguire un
4521 \textit{cast} a ``\ctyp{void *}'' del tipo di dato di cui si vuole eseguire la
4522 disallocazione. Si tenga presente poi che oltre a \func{acl\_init} esistono
4523 molte altre funzioni che possono allocare memoria per i dati delle ACL, è
4524 pertanto opportuno tenere traccia di tutte queste funzioni perché alla fine
4525 delle operazioni tutta la memoria allocata dovrà essere liberata con
4528 Una volta che si abbiano a disposizione i dati di una ACL tramite il
4529 riferimento ad oggetto di tipo \type{acl\_t} questi potranno essere copiati
4530 con la funzione \funcd{acl\_dup}, il cui prototipo è:
4532 \headdecl{sys/types.h}
4533 \headdecl{sys/acl.h}
4535 \funcdecl{acl\_t acl\_dup(acl\_t acl)}
4537 Crea una copia della ACL \param{acl}.
4539 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
4540 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
4541 \var{errno} assumerà uno dei valori:
4543 \item[\errcode{EINVAL}] l'argomento \param{acl} non è un puntatore valido
4545 \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile per eseguire
4551 La funzione crea una copia dei dati della ACL indicata tramite l'argomento
4552 \param{acl}, allocando autonomamente tutto spazio necessario alla copia e
4553 restituendo un secondo oggetto di tipo \type{acl\_t} come riferimento a
4554 quest'ultima. Valgono per questo le stesse considerazioni fatte per il valore
4555 di ritorno di \func{acl\_init}, ed in particolare il fatto che occorrerà
4556 prevedere una ulteriore chiamata esplicita a \func{acl\_free} per liberare la
4557 memoria occupata dalla copia.
4559 Se si deve creare una ACL manualmente l'uso di \func{acl\_init} è scomodo,
4560 dato che la funzione restituisce una ACL vuota, una alternativa allora è usare
4561 \funcd{acl\_from\_mode} che consente di creare una ACL a partire da un valore
4562 di permessi ordinari, il prototipo della funzione è:
4564 \headdecl{sys/types.h}
4565 \headdecl{sys/acl.h}
4567 \funcdecl{acl\_t acl\_from\_mode(mode\_t mode)}
4569 Crea una ACL inizializzata con i permessi di \param{mode}.
4571 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
4572 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
4573 \var{errno} assumerà il valore \errval{ENOMEM}.
4578 La funzione restituisce una ACL inizializzata con le tre voci obbligatorie
4579 \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} già
4580 impostate secondo la corrispondenza ai valori dei permessi ordinari indicati
4581 dalla maschera passata nell'argomento \param{mode}. Questa funzione è una
4582 estensione usata dalle ACL di Linux e non è portabile, ma consente di
4583 semplificare l'inizializzazione in maniera molto comoda.
4585 Altre due funzioni che consentono di creare una ACL già inizializzata sono
4586 \funcd{acl\_get\_fd} e \funcd{acl\_get\_file}, che però sono per lo più
4587 utilizzate per leggere la ACL corrente di un file; i rispettivi prototipi
4590 \headdecl{sys/types.h}
4591 \headdecl{sys/acl.h}
4593 \funcdecl{acl\_t acl\_get\_file(const char *path\_p, acl\_type\_t type)}
4594 \funcdecl{acl\_t acl\_get\_fd(int fd)}
4596 Ottiene i dati delle ACL di un file.
4598 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
4599 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
4600 \var{errno} assumerà uno dei valori:
4602 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
4603 \item[\errcode{ENOTSUP}] il filesystem cui fa riferimento il file non
4606 ed inoltre \errval{EBADF} per \func{acl\_get\_fd}, ed \errval{EINVAL} per
4607 valori scorretti di \param{type} e tutti i possibili errori per l'accesso ad
4608 un file per \func{acl\_get\_file}.
4613 Le due funzioni ritornano, con un oggetto di tipo \type{acl\_t}, il valore
4614 della ACL correntemente associata ad un file, che può essere identificato
4615 tramite un file descriptor usando \func{acl\_get\_fd} o con un pathname usando
4616 \func{acl\_get\_file}. Nel caso di quest'ultima funzione, che può richiedere
4617 anche la ACL relativa ad una directory, il secondo argomento \param{type}
4618 consente di specificare se si vuole ottenere la ACL di default o quella di
4619 accesso. Questo argomento deve essere di tipo \type{acl\_type\_t} e può
4620 assumere solo i due valori riportati in tab.~\ref{tab:acl_type}.
4625 \begin{tabular}{|l|l|}
4627 \textbf{Tipo} & \textbf{Descrizione} \\
4630 \const{ACL\_TYPE\_ACCESS} & indica una ACL di accesso.\\
4631 \const{ACL\_TYPE\_DEFAULT}& indica una ACL di default.\\
4634 \caption{Le costanti che identificano il tipo di ACL.}
4635 \label{tab:acl_type}
4638 Si tenga presente che nel caso di \func{acl\_get\_file} occorrerà che il
4639 processo chiamante abbia privilegi di accesso sufficienti a poter leggere gli
4640 attributi estesi dei file (come illustrati in sez.~\ref{sec:file_xattr});
4641 inoltre una ACL di tipo \const{ACL\_TYPE\_DEFAULT} potrà essere richiesta
4642 soltanto per una directory, e verrà restituita solo se presente, altrimenti
4643 verrà restituita una ACL vuota.
4645 Infine si potrà creare una ACL direttamente dalla sua rappresentazione
4646 testuale con la funzione \funcd{acl\_from\_text}, il cui prototipo è:
4648 \headdecl{sys/types.h}
4649 \headdecl{sys/acl.h}
4651 \funcdecl{acl\_t acl\_from\_text(const char *buf\_p)}
4653 Crea una ACL a partire dalla sua rappresentazione testuale.
4655 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
4656 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
4657 \var{errno} assumerà uno dei valori:
4659 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
4660 \item[\errcode{EINVAL}] la rappresentazione testuale all'indirizzo
4661 \param{buf\_p} non è valida.
4667 La funzione prende come argomento il puntatore ad un buffer dove si è inserita
4668 la rappresentazione testuale della ACL che si vuole creare, la memoria
4669 necessaria viene automaticamente allocata ed in caso di successo viene
4670 restituito come valore di ritorno un oggetto di tipo \type{acl\_t} con il
4671 contenuto della stessa, che come per le precedenti funzioni, dovrà essere
4672 disallocato esplicitamente al termine del suo utilizzo.
4674 La rappresentazione testuale di una ACL è quella usata anche dai comandi
4675 ordinari per la gestione delle ACL (\texttt{getfacl} e \texttt{setfacl}), che
4676 prevede due diverse forme, estesa e breve, entrambe supportate da
4677 \func{acl\_from\_text}. La forma estesa prevede che sia specificata una voce
4678 per riga, nella forma:
4680 tipo:qualificatore:permessi
4682 dove il tipo può essere uno fra \texttt{user}, \texttt{group}, \texttt{other}
4683 e \texttt{mask}. Il qualificatore è presente solo per \texttt{user} e
4684 \texttt{group} e indica l'utente o il gruppo a cui la voce si riferisce; i
4685 permessi sono espressi con una tripletta di lettere analoga a quella usata per
4686 i permessi dei file.\footnote{vale a dire \texttt{r} per il permesso di
4687 lettura, \texttt{w} per il permesso di scrittura, \texttt{x} per il permesso
4688 di esecuzione (scritti in quest'ordine) e \texttt{-} per l'assenza del
4691 Va precisato che i due tipi \texttt{user} e \texttt{group} sono usati
4692 rispettivamente per indicare delle voci relative ad utenti e
4693 gruppi,\footnote{cioè per voci di tipo \const{ACL\_USER\_OBJ} e
4694 \const{ACL\_USER} per \texttt{user} e \const{ACL\_GROUP\_OBJ} e
4695 \const{ACL\_GROUP} per \texttt{group}.} applicate sia a quelli proprietari
4696 del file che a quelli generici; quelle dei proprietari si riconoscono per
4697 l'assenza di un qualificatore, ed in genere si scrivono per prima delle altre.
4698 Il significato delle voci di tipo \texttt{mask} e \texttt{mark} è evidente. In
4699 questa forma si possono anche inserire dei commenti precedendoli con il
4700 carattere ``\texttt{\#}''.
4702 La forma breve prevede invece la scrittura delle singole voci su una riga,
4703 separate da virgole; come specificatori del tipo di voce si possono usare le
4704 iniziali dei valori usati nella forma estesa (cioè ``\texttt{u}'',
4705 ``\texttt{g}'', ``\texttt{o}'' e ``\texttt{m}''), mentre le altri parte della
4706 voce sono le stesse. In questo caso non sono consentiti permessi.
4708 Per la conversione inversa, che consente di ottenere la rappresentazione
4709 testuale di una ACL, sono invece disponibili due funzioni, la prima delle due,
4710 di uso più immediato, è \funcd{acl\_to\_text}, il cui prototipo è:
4712 \headdecl{sys/types.h}
4713 \headdecl{sys/acl.h}
4715 \funcdecl{char * acl\_to\_text(acl\_t acl, ssize\_t *len\_p)}
4717 Produce la rappresentazione testuale di una ACL.
4719 \bodydesc{La funzione restituisce il puntatore ad una stringa con la
4720 rappresentazione testuale della ACL in caso di successo e
4721 \code(acl\_t){NULL} in caso di errore, nel qual caso \var{errno} assumerà
4724 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
4725 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
4731 La funzione restituisce il puntatore ad una stringa terminata da NUL
4732 contenente la rappresentazione in forma estesa della ACL passata come
4733 argomento, ed alloca automaticamente la memoria necessaria. Questa dovrà poi
4734 essere liberata, quando non più necessaria, con \func{acl\_free}. Se
4735 nell'argomento \param{len\_p} si passa un valore puntatore ad una variabile
4736 intera in questa verrà restituita la dimensione della stringa con la
4737 rappresentazione testuale (non comprendente il carattere nullo finale).
4739 La seconda funzione, \funcd{acl\_to\_any\_text}, permette di controllare con
4740 dovizia di dettagli la generazione della stringa contenente la
4741 rappresentazione testuale della ACL, il suo prototipo è:
4743 \headdecl{sys/types.h}
4744 \headdecl{sys/acl.h}
4746 \funcdecl{char * acl\_to\_any\_text(acl\_t acl, const char *prefix, char
4747 separator, int options)}
4749 Produce la rappresentazione testuale di una ACL.
4751 \bodydesc{La funzione restituisce il puntatore ad una stringa con la
4752 rappresentazione testuale della ACL in caso di successo e \val{NULL} in
4753 caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
4755 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
4756 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
4762 La funzione converte in formato testo la ACL indicata dall'argomento
4763 \param{acl}, usando il carattere \param{separator} come separatore delle
4764 singole voci; se l'argomento \param{prefix} non è nullo la stringa da esso
4765 indicata viene utilizzata come prefisso per le singole voci.
4767 L'ultimo argomento, \param{options}, consente di controllare la modalità con
4768 cui viene generata la rappresentazione testuale. Un valore nullo fa si che
4769 vengano usati gli identificatori standard \texttt{user}, \texttt{group},
4770 \texttt{other} e \texttt{mask} con i nomi di utenti e gruppi risolti rispetto
4771 ai loro valori numerici. Altrimenti si può specificare un valore in forma di
4772 maschera binaria, da ottenere con un OR aritmetico dei valori riportati in
4773 tab.~\ref{tab:acl_to_text_options}.
4778 \begin{tabular}{|l|p{8cm}|}
4780 \textbf{Tipo} & \textbf{Descrizione} \\
4783 \const{TEXT\_ABBREVIATE} & stampa le voci in forma abbreviata.\\
4784 \const{TEXT\_NUMERIC\_IDS} & non effettua la risoluzione numerica di
4785 \acr{uid} e \acr{gid}.\\
4786 \const{TEXT\_SOME\_EFFECTIVE}& per ciascuna voce che contiene permessi che
4787 vengono eliminati dalla \const{ACL\_MASK}
4788 viene generato un commento con i permessi
4789 effettivamente risultanti; il commento è
4790 separato con un tabulatore.\\
4791 \const{TEXT\_ALL\_EFFECTIVE} & viene generato un commento con i permessi
4792 effettivi per ciascuna voce che contiene
4793 permessi citati nella \const{ACL\_MASK},
4794 anche quando questi non vengono modificati
4795 da essa; il commento è separato con un
4797 \const{TEXT\_SMART\_INDENT} & da usare in combinazione con le precedenti
4798 \const{TEXT\_SOME\_EFFECTIVE} e
4799 \const{TEXT\_ALL\_EFFECTIVE} aumenta
4800 automaticamente il numero di spaziatori
4801 prima degli eventuali commenti in modo da
4802 mantenerli allineati.\\
4805 \caption{Possibili valori per l'argomento \param{options} di
4806 \func{acl\_to\_any\_text}.}
4807 \label{tab:acl_to_text_options}
4810 Come per \func{acl\_to\_text} anche in questo caso il buffer contenente la
4811 rappresentazione testuale dell'ACL, di cui la funzione restituisce
4812 l'indirizzo, viene allocato automaticamente, e dovrà essere esplicitamente
4813 disallocato con una chiamata ad \func{acl\_free}. Si tenga presente infine che
4814 questa funzione è una estensione specifica di Linux, e non è presente nella
4815 bozza dello standard POSIX.1e.
4817 Per quanto utile per la visualizzazione o l'impostazione da comando delle ACL,
4818 la forma testuale non è la più efficiente per poter memorizzare i dati
4819 relativi ad una ACL, ad esempio quando si vuole eseguirne una copia a scopo di
4820 archiviazione. Per questo è stata prevista la possibilità di utilizzare una
4821 rappresentazione delle ACL in una apposita forma binaria contigua e
4822 persistente. È così possibile copiare il valore di una ACL in un buffer e da
4823 questa rappresentazione tornare indietro e generare una ACL.
4825 Lo standard POSIX.1e prevede a tale scopo tre funzioni, la prima e più
4826 semplice è \funcd{acl\_size}, che consente di ottenere la dimensione che avrà
4827 la citata rappresentazione binaria, in modo da poter allocare per essa un
4828 buffer di dimensione sufficiente, il suo prototipo è:
4830 \headdecl{sys/types.h}
4831 \headdecl{sys/acl.h}
4833 \funcdecl{ssize\_t acl\_size(acl\_t acl)}
4835 Determina la dimensione della rappresentazione binaria di una ACL.
4837 \bodydesc{La funzione restituisce in caso di successo la dimensione in byte
4838 della rappresentazione binaria della ACL indicata da \param{acl} e $-1$ in
4839 caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
4841 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
4847 Prima di effettuare la lettura della rappresentazione binaria è sempre
4848 necessario allocare un buffer di dimensione sufficiente a contenerla, pertanto
4849 prima si dovrà far ricorso a \funcd{acl\_size} per ottenere tale dimensione e
4850 poi allocare il buffer con una delle funzioni di
4851 sez.~\ref{sec:proc_mem_alloc}. Una volta terminato l'uso della
4852 rappresentazione binaria, il buffer dovrà essere esplicitamente disallocato.
4854 La funzione che consente di leggere la rappresentazione binaria di una ACL è
4855 \funcd{acl\_copy\_ext}, il cui prototipo è:
4857 \headdecl{sys/types.h}
4858 \headdecl{sys/acl.h}
4860 \funcdecl{ssize\_t acl\_copy\_ext(void *buf\_p, acl\_t acl, ssize\_t size)}
4862 Ottiene la rappresentazione binaria di una ACL.
4864 \bodydesc{La funzione restituisce in caso di successo la dimensione in byte
4865 della rappresentazione binaria della ACL indicata da \param{acl} e $-1$ in
4866 caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
4868 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida o
4869 \param{size} è negativo o nullo.
4870 \item[\errcode{ERANGE}] il valore di \param{size} è più piccolo della
4871 dimensione della rappresentazione della ACL.
4877 La funzione salverà la rappresentazione binaria della ACL indicata da
4878 \param{acl} sul buffer posto all'indirizzo \param{buf\_p} e lungo \param{size}
4879 byte, restituendo la dimensione della stessa come valore di ritorno. Qualora
4880 la dimensione della rappresentazione ecceda il valore di \param{size} la
4881 funzione fallirà con un errore di \errcode{ERANGE}. La funzione non ha nessun
4882 effetto sulla ACL indicata da \param{acl}.
4884 Viceversa se si vuole ripristinare una ACL a partire dalla rappresentazione
4885 binaria della stessa disponibile in un buffer si potrà usare la funzione
4886 \funcd{acl\_copy\_int}, il cui prototipo è:
4888 \headdecl{sys/types.h}
4889 \headdecl{sys/acl.h}
4891 \funcdecl{ssize\_t acl\_copy\_int(const void *buf\_p)}
4893 Ripristina la rappresentazione binaria di una ACL.
4895 \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
4896 di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
4897 \var{errno} assumerà uno dei valori:
4899 \item[\errcode{EINVAL}] il buffer all'indirizzo \param{buf\_p} non contiene
4900 una rappresentazione corretta di una ACL.
4901 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare un oggetto
4902 \type{acl\_t} per la ACL richiesta.
4908 La funzione in caso di successo alloca autonomamente un oggetto di tipo
4909 \type{acl\_t} che viene restituito come valore di ritorno con il contenuto
4910 della ACL rappresentata dai dati contenuti nel buffer puntato da
4911 \param{buf\_p}. Si ricordi che come per le precedenti funzioni l'oggetto
4912 \type{acl\_t} dovrà essere disallocato esplicitamente al termine del suo
4915 Una volta che si disponga della ACL desiderata, questa potrà essere impostata
4916 su un file o una directory. Per impostare una ACL sono disponibili due
4917 funzioni; la prima è \funcd{acl\_set\_file}, che opera sia su file che su
4918 directory, ed il cui prototipo è:
4920 \headdecl{sys/types.h}
4921 \headdecl{sys/acl.h}
4923 \funcdecl{int acl\_set\_file(const char *path, acl\_type\_t type, acl\_t
4926 Imposta una ACL su un file o una directory.
4928 \bodydesc{La funzione restituisce $0$ in caso di successo e $-1$ in caso di
4929 errore, nel qual caso \var{errno} assumerà uno dei valori:
4931 \item[\errcode{EACCES}] o un generico errore di accesso a \param{path} o il
4932 valore di \param{type} specifica una ACL il cui tipo non può essere
4933 assegnato a \param{path}.
4934 \item[\errcode{EINVAL}] o \param{acl} non è una ACL valida, o \param{type}
4935 ha in valore non corretto.
4936 \item[\errcode{ENOSPC}] non c'è spazio disco sufficiente per contenere i
4937 dati aggiuntivi della ACL.
4938 \item[\errcode{ENOTSUP}] si è cercato di impostare una ACL su un file
4939 contenuto in un filesystem che non supporta le ACL.
4941 ed inoltre \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
4942 \errval{EROFS}, \errval{EPERM}.
4946 La funzione consente di assegnare la ACL contenuta in \param{acl} al file o
4947 alla directory indicate dal pathname \param{path}, mentre con \param{type} si
4948 indica il tipo di ACL utilizzando le costanti di tab.~\ref{tab:acl_type}, ma
4949 si tenga presente che le ACL di default possono essere solo impostate
4950 qualora \param{path} indichi una directory. Inoltre perché la funzione abbia
4951 successo la ACL dovrà essere valida, e contenere tutti le voci necessarie,
4952 unica eccezione è quella in cui si specifica una ACL vuota per cancellare la
4953 ACL di default associata a \func{path}.\footnote{questo però è una estensione
4954 della implementazione delle ACL di Linux, la bozza di standard POSIX.1e
4955 prevedeva l'uso della apposita funzione \funcd{acl\_delete\_def\_file}, che
4956 prende come unico argomento il pathname della directory di cui si vuole
4957 cancellare l'ACL di default, per i dettagli si ricorra alla pagina di
4958 manuale.} La seconda funzione che consente di impostare una ACL è
4959 \funcd{acl\_set\_fd}, ed il suo prototipo è:
4961 \headdecl{sys/types.h}
4962 \headdecl{sys/acl.h}
4964 \funcdecl{int acl\_set\_fd(int fd, acl\_t acl)}
4966 Imposta una ACL su un file descriptor.
4968 \bodydesc{La funzione restituisce $0$ in caso di successo e $-1$ in caso di
4969 errore, nel qual caso \var{errno} assumerà uno dei valori:
4971 \item[\errcode{EINVAL}] o \param{acl} non è una ACL valida, o \param{type}
4972 ha in valore non corretto.
4973 \item[\errcode{ENOSPC}] non c'è spazio disco sufficiente per contenere i
4974 dati aggiuntivi della ACL.
4975 \item[\errcode{ENOTSUP}] si è cercato di impostare una ACL su un file
4976 contenuto in un filesystem che non supporta le ACL.
4978 ed inoltre \errval{EBADF}, \errval{EROFS}, \errval{EPERM}.
4982 La funzione è del tutto è analoga a \funcd{acl\_set\_file} ma opera
4983 esclusivamente sui file identificati tramite un file descriptor. Non dovendo
4984 avere a che fare con directory (e con la conseguente possibilità di avere una
4985 ACL di default) la funzione non necessita che si specifichi il tipo di ACL,
4986 che sarà sempre di accesso, e prende come unico argomento, a parte il file
4987 descriptor, la ACL da impostare.
4989 Le funzioni viste finora operano a livello di una intera ACL, eseguendo in una
4990 sola volta tutte le operazioni relative a tutte le voci in essa contenuta. In
4991 generale è possibile modificare un singolo valore all'interno di una singola
4992 voce direttamente con le funzioni previste dallo standard POSIX.1e. Queste
4993 funzioni però sono alquanto macchinose da utilizzare per cui è molto più
4994 semplice operare direttamente sulla rappresentazione testuale. Questo è il
4995 motivo per non tratteremo nei dettagli dette funzioni, fornendone solo una
4996 descrizione sommaria; chi fosse interessato potrà ricorrere alle pagina di
4999 Se si vuole operare direttamente sui contenuti di un oggetto di tipo
5000 \type{acl\_t} infatti occorre fare riferimento alle singole voci tramite gli
5001 opportuni puntatori di tipo \type{acl\_entry\_t}, che possono essere ottenuti
5002 dalla funzione \funcd{acl\_get\_entry} (per una voce esistente) o dalla
5003 funzione \funcd{acl\_create\_entry} per una voce da aggiungere. Nel caso della
5004 prima funzione si potrà poi ripetere la lettura per ottenere i puntatori alle
5005 singole voci successive alla prima.
5007 Una volta ottenuti detti puntatori si potrà operare sui contenuti delle singole
5008 voci; con le funzioni \funcd{acl\_get\_tag\_type}, \funcd{acl\_get\_qualifier},
5009 \funcd{acl\_get\_permset} si potranno leggere rispettivamente tipo,
5010 qualificatore e permessi mentre con le corrispondente funzioni
5011 \funcd{acl\_set\_tag\_type}, \funcd{acl\_set\_qualifier},
5012 \funcd{acl\_set\_permset} si possono impostare i valori; in entrambi i casi
5013 vengono utilizzati tipi di dato ad hoc.\footnote{descritti nelle singole
5014 pagine di manuale.} Si possono poi copiare i valori di una voce da una ACL
5015 ad un altra con \funcd{acl\_copy\_entry} o eliminare una voce da una ACL con
5016 \funcd{acl\_delete\_entry}.
5018 \itindend{Access~Control~List~(ACL)}
5021 \subsection{La gestione delle quote disco}
5022 \label{sec:disk_quota}
5024 Quella delle quote disco è una funzionalità introdotta inizialmente da BSD, e
5025 presente in Linux fino dai kernel dalla serie 2.0, che consente di porre dei
5026 tetti massimi al consumo delle risorse di un filesystem (spazio disco e
5027 \textit{inode}) da parte di utenti e gruppi. Dato che la funzionalità ha senso
5028 solo per i filesystem su cui si mantengono i dati degli utenti\footnote{in
5029 genere la si attiva sul filesystem che contiene le \textit{home} degli
5030 utenti, dato che non avrebbe senso per i file di sistema che in genere
5031 appartengono all'amministratore.} essa deve essere esplicitamente richiesta;
5032 questo si fa tramite due distinte opzioni di montaggio, \texttt{usrquota} e
5033 \texttt{grpquota} che abilitano le quote rispettivamente per gli utenti e per
5034 i gruppi. Grazie a questo è possibile usare le limitazioni sulle quote solo
5035 sugli utenti o solo sui gruppi.
5037 Il meccanismo prevede che per ciascun filesystem che supporta le quote disco
5038 (i vari \textit{extN}, \textit{btrfs}, \textit{XFS}, \textit{JFS},
5039 \textit{ReiserFS}) il kernel provveda sia a mantenere aggiornati i dati
5040 relativi al consumo delle risorse da parte di utenti e/o gruppi che a far
5041 rispettare i limiti imposti dal sistema, con la generazione di un errore di
5042 \errval{EDQUOT} per tutte le operazioni sui file che porterebbero ad un
5043 superamento degli stessi. Si tenga presente che questi due compiti sono
5044 separati, il primo si attiva al montaggio del filesystem con le quote
5045 attivate, il secondo deve essere abilitato esplicitamente.
5047 Per il mantenimento dei dati di consumo delle risorse vengono usati due file
5048 riservati (uno per le quote utente e l'altro per le quote gruppo) nella
5049 directory radice del filesystem su cui si sono attivate le quote;\footnote{la
5050 cosa vale per tutti i filesystem tranne \textit{XFS} che mantiene i dati
5051 internamente.} con la versione 2 del supporto delle quote, l'unica rimasta
5052 in uso, questi file sono \texttt{aquota.user} e \texttt{aquota.group}, in
5053 precedenza erano \texttt{quota.user} e \texttt{quota.group}. Dato che i file
5054 vengono aggiornati soltanto se il filesystem è stato montato con il supporto
5055 delle quote, se si abilita questo in un secondo tempo (o se si eseguono
5056 operazioni sul filesystem senza averlo abilitato) i dati contenuti possono non
5057 corrispondere esattamente allo stato corrente del consumo delle risorse; per
5058 questo in genere prima di montare in scrittura un filesystem su cui sono
5059 abilitate le quote in genere viene utilizzato il comando \cmd{quotacheck} per
5060 verificare e aggiornare i dati.
5062 Le restrizioni sul consumo delle risorse prevedono due limiti, il primo viene
5063 detto \textit{soft limit} e può essere superato per brevi periodi di tempo, il
5064 secondo viene detto \textit{hard limit} non può mai essere superato. Il
5065 periodo di tempo per cui è possibile superare il \textit{soft limit} è detto
5066 ``\textsl{periodo di grazia}'' (\textit{grace period}), passato questo tempo
5067 il passaggio del \textit{soft limit} viene trattato allo stesso modo
5068 dell'\textit{hard limit}. Questi limiti riguardano separatamente sia lo
5069 spazio disco (i blocchi) che il numero di file (gli \textit{inode}) e devono
5070 pertanto essere specificati per entrambe le risorse.
5072 La funzione che consente di controllare tutti i vari aspetti della gestione
5073 delle quote è \funcd{quotactl}, ed il suo prototipo è:
5075 \headdecl{sys/types.h}
5076 \headdecl{sys/quota.h}
5078 \funcdecl{quotactl(int cmd, const char *dev, int id, caddr\_t addr)}
5080 Esegue una operazione di controllo sulle quote disco.
5082 \bodydesc{La funzione restituisce $0$ in caso di successo e $-1$ in caso di
5083 errore, nel qual caso \var{errno} assumerà uno dei valori:
5085 \item[\errcode{EACCES}] il file delle quote non è un file ordinario.
5086 \item[\errcode{EBUSY}] si è richiesto \const{Q\_QUOTAON} ma le quote sono
5088 \item[\errcode{EFAULT}] l'indirizzo \param{addr} non è valido.
5089 \item[\errcode{EIO}] errore di lettura/scrittura sul file delle quote.
5090 \item[\errcode{EMFILE}] non si può aprire il file delle quote avendo
5091 superato il limite sul numero di file aperti nel sistema.
5092 \item[\errcode{EINVAL}] o \param{cmd} non è un comando valido,
5093 o il dispositivo \param{dev} non esiste.
5094 \item[\errcode{ENODEV}] \param{dev} non corrisponde ad un \textit{mount
5096 \item[\errcode{ENOPKG}] il kernel è stato compilato senza supporto per le
5098 \item[\errcode{ENOTBLK}] \param{dev} non è un dispositivo a blocchi.
5099 \item[\errcode{EPERM}] non si hanno i permessi per l'operazione richiesta.
5100 \item[\errcode{ESRCH}] è stato richiesto uno fra \const{Q\_GETQUOTA},
5101 \const{Q\_SETQUOTA}, \const{Q\_SETUSE}, \const{Q\_SETQLIM} per un
5102 filesystem senza quote attivate.
5107 La funzione richiede che il filesystem sul quale si vuole operare sia montato
5108 con il supporto delle quote abilitato; esso deve essere specificato con il
5109 nome del file di dispositivo nell'argomento \param{dev}. Per le operazioni che
5110 lo richiedono inoltre si dovrà indicare con l'argomento \param{id} l'utente o
5111 il gruppo (specificati rispettivamente per \acr{uid} e \acr{gid}) su cui si
5112 vuole operare. Alcune operazioni usano l'argomento \param{addr} per indicare
5113 un indirizzo ad un area di memoria il cui utilizzo dipende dall'operazione
5116 Il tipo di operazione che si intende effettuare deve essere indicato tramite
5117 il primo argomento \param{cmd}, questo in genere viene specificato con
5118 l'ausilio della macro \macro{QCMD}:
5120 \funcdecl{int QCMD(subcmd,type)} Imposta il comando \param{subcmd} per il
5121 tipo di quote (utente o gruppo) \param{type}.
5123 \noindent che consente di specificare, oltre al tipo di operazione, se questa
5124 deve applicarsi alle quote utente o alle quote gruppo, nel qual
5125 caso \param{type} deve essere rispettivamente \const{USRQUOTA} o
5132 \begin{tabular}{|l|p{10cm}|}
5134 \textbf{Comando} & \textbf{Descrizione} \\
5137 \const{Q\_QUOTAON} & Attiva l'applicazione delle quote disco per il
5138 filesystem indicato da \param{dev}, si deve passare
5139 in \param{addr} il pathname al file che mantiene le
5140 quote, che deve esistere, e \param{id} deve indicare
5141 la versione del formato con uno dei valori di
5142 tab.~\ref{tab:quotactl_id_format}; l'operazione
5143 richiede i privilegi di amministratore.\\
5144 \const{Q\_QUOTAOFF} & Disattiva l'applicazione delle quote disco per il
5145 filesystem indicato da \param{dev}, \param{id}
5146 e \param{addr} vengono ignorati; l'operazione
5147 richiede i privilegi di amministratore.\\
5148 \const{Q\_GETQUOTA} & Legge i limiti ed i valori correnti delle quote nel
5149 filesystem indicato da \param{dev} per l'utente o
5150 il gruppo specificato da \param{id}; si devono avere
5151 i privilegi di amministratore per leggere i dati
5152 relativi ad altri utenti o a gruppi di cui non si fa
5153 parte, il risultato viene restituito in una struttura
5154 \struct{dqblk} all'indirizzo indicato
5156 \const{Q\_SETQUOTA} & Imposta i limiti per le quote nel filesystem
5157 indicato da \param{dev} per l'utente o il gruppo
5158 specificato da \param{id} secondo i valori ottenuti
5159 dalla struttura \struct{dqblk} puntata
5160 da \param{addr}; l'operazione richiede i privilegi
5161 di amministratore.\\
5162 \const{Q\_GETINFO} & Legge le informazioni (in sostanza i \textit{grace
5163 time}) delle quote del filesystem indicato
5164 da \param{dev} sulla struttura \struct{dqinfo}
5165 puntata da \param{addr}, \param{id} viene ignorato.\\
5166 \const{Q\_SETINFO} & Imposta le informazioni delle quote del filesystem
5167 indicato da \param{dev} come ottenuti dalla
5168 struttura \struct{dqinfo} puntata
5169 da \param{addr}, \param{id} viene ignorato;
5170 l'operazione richiede i privilegi di amministratore.\\
5171 \const{Q\_GETFMT} & Richiede il valore identificativo (quello di
5172 tab.~\ref{tab:quotactl_id_format}) per il formato
5173 delle quote attualmente in uso sul filesystem
5174 indicato da \param{dev}, che sarà memorizzato
5175 sul buffer di 4 byte puntato da \param{addr}.\\
5176 \const{Q\_SYNC} & Aggiorna la copia su disco dei dati delle quote del
5177 filesystem indicato da \param{dev}; in questo
5178 caso \param{dev} può anche essere \val{NULL} nel
5179 qual caso verranno aggiornati i dati per tutti i
5180 filesystem con quote attive, \param{id}
5181 e \param{addr} vengono comunque ignorati.\\
5182 \const{Q\_GETSTATS} & Ottiene statistiche ed altre informazioni generali
5183 relative al sistema delle quote per il filesystem
5184 indicato da \param{dev}, richiede che si
5185 passi come argomento \param{addr} l'indirizzo di una
5186 struttura \struct{dqstats}, mentre i valori
5187 di \param{id} e \param{dev} vengono ignorati;
5188 l'operazione è obsoleta e non supportata nei kernel
5189 più recenti, che espongono la stessa informazione
5190 nei file sotto \procfile{/proc/self/fs/quota/}.\\
5194 \caption{Possibili valori per l'argomento \param{subcmd} di
5196 \label{tab:quotactl_commands}
5200 Le diverse operazioni supportate da \func{quotactl}, da indicare con
5201 l'argomento \param{subcmd} di \macro{QCMD}, sono riportate in
5202 tab.~\ref{tab:quotactl_commands}. In generale le operazione di attivazione,
5203 disattivazione e di modifica dei limiti delle quote sono riservate e
5204 richiedono i privilegi di amministratore.\footnote{per essere precisi tutte le
5205 operazioni indicate come privilegiate in tab.~\ref{tab:quotactl_commands}
5206 richiedono la \textit{capability} \const{CAP\_SYS\_ADMIN}.} Inoltre gli
5207 utenti possono soltanto richiedere i dati relativi alle proprie quote, solo
5208 l'amministratore può ottenere i dati di tutti.
5213 \begin{tabular}{|l|p{10cm}|}
5215 \textbf{Identificatore} & \textbf{Descrizione} \\
5218 \const{QFMT\_VFS\_OLD}& il vecchio (ed obsoleto) formato delle quote.\\
5219 \const{QFMT\_VFS\_V0} & la versione 0 usata dal VFS di Linux (supporta
5220 \acr{uid} e \acr{gid} a 32 bit e limiti fino a
5221 $2^{42}$ byte e $2^{32}$ file.\\
5222 \const{QFMT\_VFS\_V1} & la versione 1 usata dal VFS di Linux (supporta
5223 \acr{uid} e \acr{GID} a 32 bit e limiti fino a
5224 $2^{64}$ byte e $2^{64}$ file.\\
5227 \caption{Valori di identificazione del formato delle quote.}
5228 \label{tab:quotactl_id_format}
5231 Alcuni dei comandi di tab.~\ref{tab:quotactl_commands} sono alquanto complessi
5232 e richiedono un approfondimento maggiore, in particolare \const{Q\_GETQUOTA} e
5233 \const{Q\_SETQUOTA} fanno riferimento ad una specifica struttura
5234 \struct{dqblk}, la cui definizione è riportata in
5235 fig.~\ref{fig:dqblk_struct},\footnote{la definizione mostrata è quella usata
5236 fino dal kernel 2.4.22, non prenderemo in considerazione le versioni
5237 obsolete.} nella quale vengono inseriti i dati relativi alle quote di un
5240 \begin{figure}[!htb]
5241 \footnotesize \centering
5242 \begin{minipage}[c]{\textwidth}
5243 \includestruct{listati/dqblk.h}
5246 \caption{La struttura \structd{dqblk} per i dati delle quote disco.}
5247 \label{fig:dqblk_struct}
5250 La struttura viene usata sia con \const{Q\_GETQUOTA} per ottenere i valori
5251 correnti dei limiti e dell'occupazione delle risorse, che con
5252 \const{Q\_SETQUOTA} per effettuare modifiche ai limiti; come si può notare ci
5253 sono alcuni campi (in sostanza \val{dqb\_curspace}, \val{dqb\_curinodes},
5254 \val{dqb\_btime}, \val{dqb\_itime}) che hanno senso solo in lettura in quanto
5255 riportano uno stato non modificabile da \func{quotactl}, come l'uso corrente
5256 di spazio e \textit{inode} o il tempo che resta nel caso si sia superato un
5257 \textit{soft limit}.
5262 \begin{tabular}{|l|p{10cm}|}
5264 \textbf{Costante} & \textbf{Descrizione} \\
5267 \const{QIF\_BLIMITS}& Limiti sui blocchi di
5268 spazio disco (\val{dqb\_bhardlimit} e
5269 \val{dqb\_bsoftlimit}).\\
5270 \const{QIF\_SPACE} & Uso corrente
5271 dello spazio disco (\val{dqb\_curspace}).\\
5272 \const{QIF\_ILIMITS}& Limiti sugli \textit{inode}
5273 (\val{dqb\_ihardlimit} e \val{dqb\_isoftlimit}).\\
5274 \const{QIF\_INODES} & Uso corrente
5275 degli \textit{inode} (\val{dqb\_curinodes}).\\
5276 \const{QIF\_BTIME} & Tempo di
5277 sforamento del \textit{soft limit} sul numero di
5278 blocchi (\val{dqb\_btime}).\\
5279 \const{QIF\_ITIME} & Tempo di
5280 sforamento del \textit{soft limit} sul numero di
5281 \textit{inode} (\val{dqb\_itime}).\\
5282 \const{QIF\_LIMITS} & L'insieme di \const{QIF\_BLIMITS} e
5283 \const{QIF\_ILIMITS}.\\
5284 \const{QIF\_USAGE} & L'insieme di \const{QIF\_SPACE} e
5285 \const{QIF\_INODES}.\\
5286 \const{QIF\_TIMES} & L'insieme di \const{QIF\_BTIME} e
5287 \const{QIF\_ITIME}.\\
5288 \const{QIF\_ALL} & Tutti i precedenti.\\
5291 \caption{Costanti per il campo \val{dqb\_valid} di \struct{dqblk}.}
5292 \label{tab:quotactl_qif_const}
5296 Inoltre in caso di modifica di un limite si può voler operare solo su una
5297 delle risorse (blocchi o \textit{inode});\footnote{non è possibile modificare
5298 soltanto uno dei limiti (\textit{hard} o \textit{soft}) occorre sempre
5299 rispecificarli entrambi.} per questo la struttura prevede un campo apposito,
5300 \val{dqb\_valid}, il cui scopo è quello di indicare quali sono gli altri campi
5301 che devono essere considerati validi. Questo campo è una maschera binaria che
5302 deve essere espressa nei termini di OR aritmetico delle apposite costanti di
5303 tab.~\ref{tab:quotactl_qif_const}, dove si è riportato il significato di
5304 ciascuna di esse ed i campi a cui fanno riferimento.
5306 In lettura con \const{Q\_SETQUOTA} eventuali valori presenti in \struct{dqblk}
5307 vengono comunque ignorati, al momento la funzione sovrascrive tutti i campi e
5308 li marca come validi in \val{dqb\_valid}. Si possono invece usare
5309 \const{QIF\_BLIMITS} o \const{QIF\_ILIMITS} per richiedere di impostare solo
5310 la rispettiva tipologia di limiti con \const{Q\_SETQUOTA}. Si tenga presente
5311 che il sistema delle quote richiede che l'occupazione di spazio disco sia
5312 indicata in termini di blocchi e non di byte; dato che questo dipende da come
5313 si è creato il filesystem potrà essere necessario effettuare qualche
5314 controllo.\footnote{in genere viene usato un default di 1024 byte per blocco,
5315 ma quando si hanno file di dimensioni medie maggiori può convenire usare
5316 valori più alti per ottenere prestazioni migliori in conseguenza di un
5317 minore frazionamento dei dati e di indici più corti.}
5319 Altre due operazioni che necessitano di un approfondimento sono
5320 \const{Q\_GETINFO} e \const{Q\_SETINFO}, che sostanzialmente consentono di
5321 ottenere i dati relativi alle impostazioni delle altre proprietà delle quote,
5322 che si riducono poi alla durata del \textit{grace time} per i due tipi di
5323 limiti. In questo caso queste si proprietà generali sono identiche per tutti
5324 gli utenti, per cui viene usata una operazione distinta dalle
5325 precedenti. Anche in questo caso le due operazioni richiedono l'uso di una
5326 apposita struttura \struct{dqinfo}, la cui definizione è riportata in
5327 fig.~\ref{fig:dqinfo_struct}.
5329 \begin{figure}[!htb]
5330 \footnotesize \centering
5331 \begin{minipage}[c]{\textwidth}
5332 \includestruct{listati/dqinfo.h}
5335 \caption{La struttura \structd{dqinfo} per i dati delle quote disco.}
5336 \label{fig:dqinfo_struct}
5339 Come per \struct{dqblk} anche in questo caso viene usato un campo della
5340 struttura, \val{dqi\_valid} come maschera binaria per dichiarare quale degli
5341 altri campi sono validi; le costanti usate per comporre questo valore sono
5342 riportate in tab.~\ref{tab:quotactl_iif_const} dove si è riportato il
5343 significato di ciascuna di esse ed i campi a cui fanno riferimento.
5348 \begin{tabular}{|l|l|}
5350 \textbf{Costante} & \textbf{Descrizione} \\
5353 \const{IIF\_BGRACE}& Il \textit{grace period} per i blocchi
5354 (\val{dqi\_bgrace}).\\
5355 \const{IIF\_IGRACE}& Il \textit{grace period} per gli \textit{inode}
5356 (\val{dqi\_igrace}).\\
5357 \const{IIF\_FLAGS} & I flag delle quote (\val{dqi\_flags}) (inusato ?).\\
5358 \const{IIF\_ALL} & Tutti i precedenti.\\
5361 \caption{Costanti per il campo \val{dqi\_valid} di \struct{dqinfo}.}
5362 \label{tab:quotactl_iif_const}
5365 Come in precedenza con \const{Q\_GETINFO} tutti i valori vengono letti
5366 sovrascrivendo il contenuto di \struct{dqinfo} e marcati come validi in
5367 \val{dqi\_valid}. In scrittura con \const{Q\_SETINFO} si può scegliere quali
5368 impostare, si tenga presente che i tempi dei campi \val{dqi\_bgrace} e
5369 \val{dqi\_igrace} devono essere specificati in secondi.
5371 Come esempi dell'uso di \func{quotactl} utilizzeremo estratti del codice di un
5372 modulo Python usato per fornire una interfaccia diretta a \func{quotactl}
5373 senza dover passare dalla scansione dei risultati di un comando. Il modulo si
5374 trova fra i pacchetti Debian messi a disposizione da Truelite Srl,
5375 all'indirizzo \url{http://labs.truelite.it/projects/packages}.\footnote{in
5376 particolare il codice C del modulo è nel file \texttt{quotamodule.c}
5377 visionabile a partire dall'indirizzo indicato nella sezione
5378 \textit{Repository}.}
5380 \begin{figure}[!htbp]
5381 \footnotesize \centering
5382 \begin{minipage}[c]{\codesamplewidth}
5383 \includecodesample{listati/get_quota.c}
5385 \caption{Esempio di codice per ottenere i dati delle quote.}
5386 \label{fig:get_quota}
5389 Il primo esempio, riportato in fig.~\ref{fig:get_quota}, riporta il codice
5390 della funzione che consente di leggere le quote. La funzione fa uso
5391 dell'interfaccia dal C verso Python, che definisce i vari simboli \texttt{Py*}
5392 (tipi di dato e funzioni). Non staremo ad approfondire i dettagli di questa
5393 interfaccia, per la quale esistono numerose trattazioni dettagliate, ci
5394 interessa solo esaminare l'uso di \func{quotactl}.
5396 In questo caso la funzione prende come argomenti (\texttt{\small 1}) l'intero
5397 \texttt{who} che indica se si vuole operare sulle quote utente o gruppo,
5398 l'identificatore \texttt{id} dell'utente o del gruppo scelto, ed il nome del
5399 file di dispositivo del filesystem su cui si sono attivate le
5400 quote.\footnote{questi vengono passati come argomenti dalle funzioni mappate
5401 come interfaccia pubblica del modulo (una per gruppi ed una per gli utenti)
5402 che si incaricano di decodificare i dati passati da una chiamata nel codice
5403 Python.} Questi argomenti vengono passati direttamente alla chiamata a
5404 \func{quotactl} (\texttt{\small 5}), a parte \texttt{who} che viene abbinato
5405 con \macro{QCMD} al comando \const{Q\_GETQUOTA} per ottenere i dati.
5407 La funzione viene eseguita all'interno di un condizionale (\texttt{\small
5408 5--16}) che in caso di successo provvede a costruire (\texttt{\small 6--12})
5409 opportunamente una risposta restituendo tramite la opportuna funzione di
5410 interfaccia un oggetto Python contenente i dati della struttura \struct{dqblk}
5411 relativi a uso corrente e limiti sia per i blocchi che per gli
5412 \textit{inode}. In caso di errore (\texttt{\small 13--15}) si usa un'altra
5413 funzione dell'interfaccia per passare il valore di \var{errno} come eccezione.
5415 \begin{figure}[!htbp]
5416 \footnotesize \centering
5417 \begin{minipage}[c]{\codesamplewidth}
5418 \includecodesample{listati/set_block_quota.c}
5420 \caption{Esempio di codice per impostare i limiti sullo spazio disco.}
5421 \label{fig:set_block_quota}
5424 Per impostare i limiti sullo spazio disco si potrà usare una seconda funzione,
5425 riportata in fig.~\ref{fig:set_block_quota}, che prende gli stessi argomenti
5426 della precedente, con lo stesso significato, a cui si aggiungono i valori per
5427 il \textit{soft limit} e l'\textit{hard limit}. In questo caso occorrerà,
5428 prima di chiamare \func{quotactl}, inizializzare opportunamente
5429 (\texttt{\small 5--7}) i campi della struttura \struct{dqblk} che si vogliono
5430 utilizzare (quelli relativi ai limiti sui blocchi) e specificare gli stessi
5431 con \const{QIF\_BLIMITS} in \var{dq.dqb\_valid}.
5433 Fatto questo la chiamata a \func{quotactl}, stavolta con il comando
5434 \const{Q\_SETQUOTA}, viene eseguita come in precedenza all'interno di un
5435 condizionale (\texttt{\small 9--14}). In questo caso non essendovi da
5436 restituire nessun dato in caso di successo si usa (\texttt{\small 10}) una
5437 apposita funzione di uscita, mentre si restituisce come prima una eccezione
5438 con il valore di \var{errno} in caso di errore (\texttt{\small 12--13}).
5441 \subsection{La gestione delle \textit{capabilities}}
5442 \label{sec:proc_capabilities}
5444 \itindbeg{capabilities}
5446 Come accennato in sez.~\ref{sec:proc_access_id} l'architettura classica della
5447 gestione dei privilegi in un sistema unix-like ha il sostanziale problema di
5448 fornire all'amministratore dei poteri troppo ampi, questo comporta che anche
5449 quando si siano predisposte delle misure di protezione per in essere in grado
5450 di difendersi dagli effetti di una eventuale compromissione del
5451 sistema,\footnote{come montare un filesystem in sola lettura per impedirne
5452 modifiche, o marcare un file come immutabile.} una volta che questa sia
5453 stata effettuata e si siano ottenuti i privilegi di amministratore, queste
5454 potranno essere comunque rimosse.\footnote{nei casi elencati nella precedente
5455 nota si potrà sempre rimontare il sistema in lettura-scrittura, o togliere
5456 la marcatura di immutabilità.}
5458 Il problema consiste nel fatto che nell'architettura tradizionale di un
5459 sistema unix-like i controlli di accesso sono basati su un solo livello di
5460 separazione: per i processi normali essi sono posti in atto, mentre per i
5461 processi con i privilegi di amministratore essi non vengono neppure eseguiti;
5462 per questo motivo non era previsto alcun modo per evitare che un processo con
5463 diritti di amministratore non potesse eseguire certe operazioni, o per cedere
5464 definitivamente alcuni privilegi da un certo momento in poi.
5466 Per ovviare a tutto ciò, a partire dai kernel della serie 2.2, è stato
5467 introdotto un meccanismo, detto \textit{capabilities}, che consentisse di
5468 suddividere i vari privilegi tradizionalmente associati all'amministratore in
5469 un insieme di \textsl{capacità} distinte. L'idea era che queste capacità
5470 potessero essere abilitate e disabilitate in maniera indipendente per ciascun
5471 processo con privilegi di amministratore, permettendo così una granularità
5472 molto più fine nella distribuzione degli stessi che evitasse la originaria
5473 situazione di ``\textsl{tutto o nulla}''.
5475 Il meccanismo completo delle \textit{capabilities}\footnote{l'implementazione
5476 si rifà ad una bozza di quello che doveva diventare lo standard POSIX.1e,
5477 poi abbandonato.} prevede inoltre la possibilità di associare le stesse ai
5478 singoli file eseguibili, in modo da poter stabilire quali capacità possono
5479 essere utilizzate quando viene messo in esecuzione uno specifico programma; ma
5480 il supporto per questa funzionalità, chiamata \textit{file capabilities}, è
5481 stato introdotto soltanto a partire dal kernel 2.6.24. Fino ad allora doveva
5482 essere il programma stesso ad eseguire una riduzione esplicita delle sue
5483 capacità, cosa che ha reso l'uso di questa funzionalità poco diffuso, vista la
5484 presenza di meccanismi alternativi per ottenere limitazioni delle capacità
5485 dell'amministratore a livello di sistema operativo, come \index{SELinux}
5488 Con questo supporto e con le ulteriori modifiche introdotte con il kernel
5489 2.6.25 il meccanismo delle \textit{capabilities} è stato totalmente
5490 rivoluzionato, rendendolo più aderente alle intenzioni originali dello
5491 standard POSIX, rimuovendo il significato che fino ad allora aveva avuto la
5492 capacità \const{CAP\_SETPCAP} e cambiando le modalità di funzionamento del
5493 cosiddetto \itindex{capabilities~bounding~set} \textit{capabilities bounding
5494 set}. Ulteriori modifiche sono state apportate con il kernel 2.6.26 per
5495 consentire la rimozione non ripristinabile dei privilegi di
5496 amministratore. Questo fa sì che il significato ed il comportamento del kernel
5497 finisca per dipendere dalla versione dello stesso e dal fatto che le nuove
5498 \textit{file capabilities} siano abilitate o meno. Per capire meglio la
5499 situazione e cosa è cambiato conviene allora spiegare con maggiori dettagli
5500 come funziona il meccanismo delle \textit{capabilities}.
5502 Il primo passo per frazionare i privilegi garantiti all'amministratore,
5503 supportato fin dalla introduzione iniziale del kernel 2.2, è stato quello in
5504 cui a ciascun processo sono stati associati tre distinti insiemi di
5505 \textit{capabilities}, denominati rispettivamente \textit{permitted},
5506 \textit{inheritable} ed \textit{effective}. Questi insiemi vengono mantenuti
5507 in forma di tre diverse maschere binarie,\footnote{il kernel li mantiene, come
5508 i vari identificatori di sez.~\ref{sec:proc_setuid}, all'interno della
5509 \struct{task\_struct} di ciascun processo (vedi
5510 fig.~\ref{fig:proc_task_struct}), nei tre campi \texttt{cap\_effective},
5511 \texttt{cap\_inheritable}, \texttt{cap\_permitted} del tipo
5512 \texttt{kernel\_cap\_t}; questo era, fino al kernel 2.6.25 definito come
5513 intero a 32 bit per un massimo di 32 \textit{capabilities} distinte,
5514 attualmente è stato aggiornato ad un vettore in grado di mantenerne fino a
5515 64.} in cui ciascun bit corrisponde ad una capacità diversa.
5517 L'utilizzo di tre distinti insiemi serve a fornire una interfaccia flessibile
5518 per l'uso delle \textit{capabilities}, con scopi analoghi a quelli per cui
5519 sono mantenuti i diversi insiemi di identificatori di
5520 sez.~\ref{sec:proc_setuid}; il loro significato, che è rimasto sostanzialmente
5521 lo stesso anche dopo le modifiche seguite alla introduzione delle
5522 \textit{file capabilities} è il seguente:
5523 \begin{basedescript}{\desclabelwidth{2.1cm}\desclabelstyle{\nextlinelabel}}
5524 \item[\textit{permitted}] l'insieme delle \textit{capabilities}
5525 ``\textsl{permesse}'', cioè l'insieme di quelle capacità che un processo
5526 \textsl{può} impostare come \textsl{effettive} o come
5527 \textsl{ereditabili}. Se un processo cancella una capacità da questo insieme
5528 non potrà più riassumerla.\footnote{questo nei casi ordinari, sono
5529 previste però una serie di eccezioni, dipendenti anche dal tipo di
5530 supporto, che vedremo meglio in seguito dato il notevole intreccio nella
5532 \item[\textit{inheritable}] l'insieme delle \textit{capabilities}
5533 ``\textsl{ereditabili}'', cioè di quelle che verranno trasmesse come insieme
5534 delle \textsl{permesse} ad un nuovo programma eseguito attraverso una
5535 chiamata ad \func{exec}.
5536 \item[\textit{effective}] l'insieme delle \textit{capabilities}
5537 ``\textsl{effettive}'', cioè di quelle che vengono effettivamente usate dal
5538 kernel quando deve eseguire il controllo di accesso per le varie operazioni
5539 compiute dal processo.
5540 \label{sec:capabilities_set}
5543 Con l'introduzione delle \textit{file capabilities} sono stati introdotti
5544 altri tre insiemi associabili a ciascun file.\footnote{la realizzazione viene
5545 eseguita con l'uso di uno specifico attributo esteso,
5546 \texttt{security.capability}, la cui modifica è riservata, (come illustrato
5547 in sez.~\ref{sec:file_xattr}) ai processi dotato della capacità
5548 \const{CAP\_SYS\_ADMIN}.} Le \textit{file capabilities} hanno effetto
5549 soltanto quando il file che le porta viene eseguito come programma con una
5550 \func{exec}, e forniscono un meccanismo che consente l'esecuzione dello stesso
5551 con maggiori privilegi; in sostanza sono una sorta di estensione del
5552 \acr{suid} bit limitato ai privilegi di amministratore. Anche questi tre
5553 insiemi sono identificati con gli stessi nomi di quello dei processi, ma il
5554 loro significato è diverso:
5555 \begin{basedescript}{\desclabelwidth{2.1cm}\desclabelstyle{\nextlinelabel}}
5556 \item[\textit{permitted}] (chiamato originariamente \textit{forced}) l'insieme
5557 delle capacità che con l'esecuzione del programma verranno aggiunte alle
5558 capacità \textsl{permesse} del processo.
5559 \item[\textit{inheritable}] (chiamato originariamente \textit{allowed})
5560 l'insieme delle capacità che con l'esecuzione del programma possono essere
5561 ereditate dal processo originario (che cioè non vengono tolte
5562 dall'\textit{inheritable set} del processo originale all'esecuzione di
5564 \item[\textit{effective}] in questo caso non si tratta di un insieme ma di un
5565 unico valore logico; se attivo all'esecuzione del programma tutte le
5566 capacità che risulterebbero \textsl{permesse} verranno pure attivate,
5567 inserendole automaticamente nelle \textsl{effettive}, se disattivato nessuna
5568 capacità verrà attivata (cioè l'\textit{effective set} resterà vuoto).
5571 \itindbeg{capabilities~bounding~set}
5573 Infine come accennato, esiste un ulteriore insieme, chiamato
5574 \textit{capabilities bounding set}, il cui scopo è quello di costituire un
5575 limite alle capacità che possono essere attivate per un programma. Il suo
5576 funzionamento però è stato notevolmente modificato con l'introduzione delle
5577 \textit{file capabilities} e si deve pertanto prendere in considerazione una
5578 casistica assai complessa.
5580 Per i kernel fino al 2.6.25, o se non si attiva il supporto per le
5581 \textit{file capabilities}, il \textit{capabilities bounding set} è un
5582 parametro generale di sistema, il cui valore viene riportato nel file
5583 \sysctlfile{kernel/cap-bound}. Il suo valore iniziale è definito in
5584 sede di compilazione del kernel, e da sempre ha previsto come default la
5585 presenza di tutte le \textit{capabilities} eccetto \const{CAP\_SETPCAP}. In
5586 questa situazione solo il primo processo eseguito nel sistema (quello con
5587 \textsl{pid} 1, di norma \texttt{/sbin/init}) ha la possibilità di
5588 modificarlo; ogni processo eseguito successivamente, se dotato dei privilegi
5589 di amministratore, è in grado soltanto di rimuovere una delle
5590 \textit{capabilities} già presenti dell'insieme.\footnote{per essere precisi
5591 occorreva la capacità \const{CAP\_SYS\_MODULE}.}
5593 In questo caso l'effetto complessivo del \textit{capabilities bounding set} è
5594 che solo le capacità in esso presenti possono essere trasmesse ad un altro
5595 programma attraverso una \func{exec}. Questo in sostanza significa che se un
5596 qualunque programma elimina da esso una capacità, considerato che
5597 \texttt{init} (almeno nelle versioni ordinarie) non supporta la reimpostazione
5598 del \textit{bounding set}, questa non sarà più disponibile per nessun processo
5599 a meno di un riavvio, eliminando così in forma definitiva quella capacità per
5600 tutti, compreso l'amministratore.\footnote{la qual cosa, visto il default
5601 usato per il \textit{capabilities bounding set}, significa anche che
5602 \const{CAP\_SETPCAP} non è stata praticamente mai usata nella sua forma
5605 Con il kernel 2.6.25 e le \textit{file capabilities} il \textit{bounding set}
5606 è diventato una proprietà di ciascun processo, che viene propagata invariata
5607 sia attraverso una \func{fork} che una \func{exec}. In questo caso il file
5608 \sysctlfile{kernel/cap-bound} non esiste e \texttt{init} non ha nessun
5609 ruolo speciale, inoltre in questo caso all'avvio il valore iniziale prevede la
5610 presenza di tutte le capacità (compresa \const{CAP\_SETPCAP}).
5612 Con questo nuovo meccanismo il \textit{bounding set} continua a ricoprire un
5613 ruolo analogo al precedente nel passaggio attraverso una \func{exec}, come
5614 limite alle capacità che possono essere aggiunte al processo in quanto
5615 presenti nel \textit{permitted set} del programma messo in esecuzione, in
5616 sostanza il nuovo programma eseguito potrà ricevere una capacità presente nel
5617 suo \textit{permitted set} (quello del file) solo se questa è anche nel
5618 \textit{bounding set} (del processo). In questo modo si possono rimuovere
5619 definitivamente certe capacità da un processo, anche qualora questo dovesse
5620 eseguire un programma privilegiato che prevede di riassegnarle.
5622 Si tenga presente però che in questo caso il \textit{bounding set} blocca
5623 esclusivamente le capacità indicate nel \textit{permitted set} del programma
5624 che verrebbero attivate in caso di esecuzione, e non quelle eventualmente già
5625 presenti nell'\textit{inheritable set} del processo (ad esempio perché
5626 presenti prima di averle rimosse dal \textit{bounding set}). In questo caso
5627 eseguendo un programma che abbia anche lui dette capacità nel suo
5628 \textit{inheritable set} queste verrebbero assegnate.
5630 In questa seconda versione inoltre il \textit{bounding set} costituisce anche
5631 un limite per le capacità che possono essere aggiunte all'\textit{inheritable
5632 set} del processo stesso con \func{capset}, sempre nel senso che queste
5633 devono essere presenti nel \textit{bounding set} oltre che nel
5634 \textit{permitted set} del processo. Questo limite vale anche per processi con
5635 i privilegi di amministratore,\footnote{si tratta sempre di avere la
5636 \textit{capability} \const{CAP\_SETPCAP}.} per i quali invece non vale la
5637 condizione che le \textit{capabilities} da aggiungere nell'\textit{inheritable
5638 set} debbano essere presenti nel proprio \textit{permitted set}.\footnote{lo
5639 scopo anche in questo caso è ottenere una rimozione definitiva della
5640 possibilità di passare una capacità rimossa dal \textit{bounding set}.}
5642 Come si può notare per fare ricorso alle \textit{capabilities} occorre
5643 comunque farsi carico di una notevole complessità di gestione, aggravata dalla
5644 presenza di una radicale modifica del loro funzionamento con l'introduzione
5645 delle \textit{file capabilities}. Considerato che il meccanismo originale era
5646 incompleto e decisamente problematico nel caso di programmi che non ne
5647 sapessero tener conto,\footnote{c'è stato un grosso problema di sicurezza con
5648 \texttt{sendmail}, riuscendo a rimuovere \const{CAP\_SETGID}
5649 dall'\textit{inheritable set} di un processo si ottenne di far fallire
5650 \func{setuid} in maniera inaspettata per il programma (che aspettandosi
5651 sempre il successo della funzione non ne controllava lo stato di uscita) con
5652 la conseguenza di effettuare come amministratore operazioni che altrimenti
5653 sarebbero state eseguite, senza poter apportare danni, da utente normale.}
5654 ci soffermeremo solo sulla implementazione completa presente a partire dal
5655 kernel 2.6.25, tralasciando ulteriori dettagli riguardo la versione
5658 Riassumendo le regole finora illustrate tutte le \textit{capabilities} vengono
5659 ereditate senza modifiche attraverso una \func{fork} mentre, indicati con
5660 \texttt{orig\_*} i valori degli insiemi del processo chiamante, con
5661 \texttt{file\_*} quelli del file eseguito e con \texttt{bound\_set} il
5662 \textit{capabilities bounding set}, dopo l'invocazione di \func{exec} il
5663 processo otterrà dei nuovi insiemi di capacità \texttt{new\_*} secondo la
5664 formula (espressa in pseudo-codice C) di fig.~\ref{fig:cap_across_exec}; si
5665 noti come in particolare il \textit{capabilities bounding set} non viene
5666 comunque modificato e resta lo stesso sia attraverso una \func{fork} che
5667 attraverso una \func{exec}.
5669 \begin{figure}[!htbp]
5670 \footnotesize \centering
5671 \begin{minipage}[c]{12cm}
5672 \includecodesnip{listati/cap-results.c}
5674 \caption{Espressione della modifica delle \textit{capabilities} attraverso
5676 \label{fig:cap_across_exec}
5679 \itindend{capabilities~bounding~set}
5681 A queste regole se ne aggiungono delle altre che servono a riprodurre il
5682 comportamento tradizionale di un sistema unix-like in tutta una serie di
5683 circostanze. La prima di queste è relativa a quello che avviene quando si
5684 esegue un file senza \textit{capabilities}; se infatti si considerasse questo
5685 equivalente al non averne assegnata alcuna, non essendo presenti capacità né
5686 nel \textit{permitted set} né nell'\textit{inheritable set} del file,
5687 nell'esecuzione di un qualunque programma l'amministratore perderebbe tutti i
5688 privilegi originali dal processo.
5690 Per questo motivo se un programma senza \textit{capabilities} assegnate viene
5691 eseguito da un processo con \acr{uid} reale 0, esso verrà trattato come
5692 se tanto il \textit{permitted set} che l'\textit{inheritable set} fossero con
5693 tutte le \textit{capabilities} abilitate, con l'\textit{effective set} attivo,
5694 col risultato di fornire comunque al processo tutte le capacità presenti nel
5695 proprio \textit{bounding set}. Lo stesso avviene quando l'eseguibile ha attivo
5696 il \acr{suid} bit ed appartiene all'amministratore, in entrambi i casi si
5697 riesce così a riottenere il comportamento classico di un sistema unix-like.
5699 Una seconda circostanza è quella relativa a cosa succede alle
5700 \textit{capabilities} di un processo nelle possibili transizioni da \acr{uid}
5701 nullo a \acr{uid} non nullo o viceversa (corrispondenti rispettivamente a
5702 cedere o riottenere i i privilegi di amministratore) che si possono effettuare
5703 con le varie funzioni viste in sez.~\ref{sec:proc_setuid}. In questo caso la
5704 casistica è di nuovo alquanto complessa, considerata anche la presenza dei
5705 diversi gruppi di identificatori illustrati in tab.~\ref{tab:proc_uid_gid}, si
5708 \item se si passa da \acr{uid} effettivo nullo a non nullo
5709 l'\textit{effective set} del processo viene totalmente azzerato, se
5710 viceversa si passa da \acr{uid} effettivo non nullo a nullo il
5711 \textit{permitted set} viene copiato nell'\textit{effective set};
5712 \item se si passa da \textit{file system} \acr{uid} nullo a non nullo verranno
5713 cancellate dall'\textit{effective set} del processo tutte le capacità
5714 attinenti i file, e cioè \const{CAP\_LINUX\_IMMUTABLE}, \const{CAP\_MKNOD},
5715 \const{CAP\_DAC\_OVERRIDE}, \const{CAP\_DAC\_READ\_SEARCH},
5716 \const{CAP\_MAC\_OVERRIDE}, \const{CAP\_CHOWN}, \const{CAP\_FSETID} e
5717 \const{CAP\_FOWNER} (le prime due a partire dal kernel 2.2.30), nella
5718 transizione inversa verranno invece inserite nell'\textit{effective set}
5719 quelle capacità della precedente lista che sono presenti nel suo
5720 \textit{permitted set}.
5721 \item se come risultato di una transizione riguardante gli identificativi dei
5722 gruppi \textit{real}, \textit{saved} ed \textit{effective} in cui si passa
5723 da una situazione in cui uno di questi era nullo ad una in cui sono tutti
5724 non nulli,\footnote{in sostanza questo è il caso di quando si chiama
5725 \func{setuid} per rimuovere definitivamente i privilegi di amministratore
5726 da un processo.} verranno azzerati completamente sia il \textit{permitted
5727 set} che l'\textit{effective set}.
5729 \label{sec:capability-uid-transition}
5731 La combinazione di tutte queste regole consente di riprodurre il comportamento
5732 ordinario di un sistema di tipo Unix tradizionale, ma può risultare
5733 problematica qualora si voglia passare ad una configurazione di sistema
5734 totalmente basata sull'applicazione delle \textit{capabilities}; in tal caso
5735 infatti basta ad esempio eseguire un programma con \acr{suid} bit di proprietà
5736 dell'amministratore per far riottenere ad un processo tutte le capacità
5737 presenti nel suo \textit{bounding set}, anche se si era avuta la cura di
5738 cancellarle dal \textit{permitted set}.
5740 \itindbeg{securebits}
5742 Per questo motivo a partire dal kernel 2.6.26, se le \textit{file
5743 capabilities} sono abilitate, ad ogni processo viene stata associata una
5744 ulteriore maschera binaria, chiamata \textit{securebits flags}, su cui sono
5745 mantenuti una serie di flag (vedi tab.~\ref{tab:securebits_values}) il cui
5746 valore consente di modificare queste regole speciali che si applicano ai
5747 processi con \acr{uid} nullo. La maschera viene sempre mantenuta
5748 attraverso una \func{fork}, mentre attraverso una \func{exec} viene sempre
5749 cancellato il flag \const{SECURE\_KEEP\_CAPS}.
5754 \begin{tabular}{|l|p{10cm}|}
5756 \textbf{Flag} & \textbf{Descrizione} \\
5759 \const{SECURE\_KEEP\_CAPS}& Il processo non subisce la cancellazione delle
5760 sue \textit{capabilities} quando tutti i suoi
5761 \acr{uid} passano ad un valore non
5762 nullo (regola di compatibilità per il cambio
5763 di \acr{uid} n.~3 del precedente
5764 elenco), sostituisce il precedente uso
5765 dell'operazione \const{PR\_SET\_KEEPCAPS} di
5767 \const{SECURE\_NO\_SETUID\_FIXUP}&Il processo non subisce le modifiche
5768 delle sue \textit{capabilities} nel passaggio
5769 da nullo a non nullo degli \acr{uid}
5770 dei gruppi \textit{effective} e
5771 \textit{file system} (regole di compatibilità
5772 per il cambio di \acr{uid} nn.~1 e 2 del
5773 precedente elenco).\\
5774 \const{SECURE\_NOROOT} & Il processo non assume nessuna capacità
5775 aggiuntiva quando esegue un programma, anche
5776 se ha \acr{uid} nullo o il programma ha
5777 il \acr{suid} bit attivo ed appartiene
5778 all'amministratore (regola di compatibilità
5779 per l'esecuzione di programmi senza
5780 \textit{capabilities}).\\
5783 \caption{Costanti identificative dei flag che compongono la maschera dei
5784 \textit{securebits}.}
5785 \label{tab:securebits_values}
5788 A ciascuno dei flag di tab.~\ref{tab:securebits_values} è inoltre abbinato un
5789 corrispondente flag di blocco, identificato da una costante omonima con
5790 l'estensione \texttt{\_LOCKED}, la cui attivazione è irreversibile ed ha
5791 l'effetto di rendere permanente l'impostazione corrente del corrispondente
5792 flag ordinario; in sostanza con \const{SECURE\_KEEP\_CAPS\_LOCKED} si rende
5793 non più modificabile \const{SECURE\_KEEP\_CAPS}, ed analogamente avviene con
5794 \const{SECURE\_NO\_SETUID\_FIXUP\_LOCKED} per
5795 \const{SECURE\_NO\_SETUID\_FIXUP} e con \const{SECURE\_NOROOT\_LOCKED} per
5796 \const{SECURE\_NOROOT}.
5798 Per l'impostazione di questi flag sono stata predisposte due specifiche
5799 operazioni di \func{prctl} (vedi sez.~\ref{sec:process_prctl}),
5800 \const{PR\_GET\_SECUREBITS}, che consente di ottenerne il valore, e
5801 \const{PR\_SET\_SECUREBITS}, che consente di modificarne il valore; per
5802 quest'ultima sono comunque necessari i privilegi di amministratore ed in
5803 particolare la capacità \const{CAP\_SETPCAP}. Prima dell'introduzione dei
5804 \textit{securebits} era comunque possibile ottenere lo stesso effetto di
5805 \const{SECURE\_KEEP\_CAPS} attraverso l'uso di un'altra operazione di
5806 \func{prctl}, \const{PR\_SET\_KEEPCAPS}.
5808 \itindend{securebits}
5810 Oltre alla gestione dei \textit{securebits} la nuova versione delle
5811 \textit{file capabilities} prevede l'uso di \func{prctl} anche per la gestione
5812 del \textit{capabilities bounding set}, attraverso altre due operazioni
5813 dedicate, \const{PR\_CAPBSET\_READ} per controllarne il valore e
5814 \const{PR\_CAPBSET\_DROP} per modificarlo; quest'ultima di nuovo è una
5815 operazione privilegiata che richiede la capacità \const{CAP\_SETPCAP} e che,
5816 come indica chiaramente il nome, permette solo la rimozione di una
5817 \textit{capability} dall'insieme; per i dettagli sull'uso di tutte queste
5818 operazioni si rimanda alla rilettura di sez.~\ref{sec:process_prctl}.
5820 % TODO verificare per process capability bounding set, vedi:
5821 % http://git.kernel.org/git/?p=linux/kernel/git/torvalds/linux-2.6.git;a=commit;h=3b7391de67da515c91f48aa371de77cb6cc5c07e
5823 % TODO capire cosa cambia con i patch vari, vedi
5824 % http://lwn.net/Articles/280279/
5825 % http://lwn.net/Articles/256519/
5826 % http://lwn.net/Articles/211883/
5829 Un elenco delle delle \textit{capabilities} disponibili su Linux, con una
5830 breve descrizione ed il nome delle costanti che le identificano, è riportato
5831 in tab.~\ref{tab:proc_capabilities};\footnote{l'elenco presentato questa
5832 tabella, ripreso dalla pagina di manuale (accessibile con \texttt{man
5833 capabilities}) e dalle definizioni in \texttt{linux/capabilities.h}, è
5834 aggiornato al kernel 2.6.26.} la tabella è divisa in due parti, la prima
5835 riporta le \textit{capabilities} previste anche nella bozza dello standard
5836 POSIX1.e, la seconda quelle specifiche di Linux. Come si può notare dalla
5837 tabella alcune \textit{capabilities} attengono a singole funzionalità e sono
5838 molto specializzate, mentre altre hanno un campo di applicazione molto vasto,
5839 che è opportuno dettagliare maggiormente.
5841 \begin{table}[!h!btp]
5844 \begin{tabular}{|l|p{10.5cm}|}
5846 \textbf{Capacità}&\textbf{Descrizione}\\
5850 % POSIX-draft defined capabilities.
5852 \const{CAP\_AUDIT\_CONTROL}& La capacità di abilitare e disabilitare il
5853 controllo dell'auditing (dal kernel 2.6.11).\\
5854 \const{CAP\_AUDIT\_WRITE}&La capacità di scrivere dati nel giornale di
5855 auditing del kernel (dal kernel 2.6.11).\\
5856 % TODO verificare questa roba dell'auditing
5857 \const{CAP\_CHOWN} & La capacità di cambiare proprietario e gruppo
5858 proprietario di un file (vedi
5859 sez.~\ref{sec:file_ownership_management}).\\
5860 \const{CAP\_DAC\_OVERRIDE}& La capacità di evitare il controllo dei
5861 permessi di lettura, scrittura ed esecuzione dei
5862 file,\footnotemark (vedi
5863 sez.~\ref{sec:file_access_control}).\\
5864 \const{CAP\_DAC\_READ\_SEARCH}& La capacità di evitare il controllo dei
5865 permessi di lettura ed esecuzione per
5867 sez.~\ref{sec:file_access_control}).\\
5868 \const{CAP\_FOWNER} & La capacità di evitare il controllo della
5869 proprietà di un file per tutte
5870 le operazioni privilegiate non coperte dalle
5871 precedenti \const{CAP\_DAC\_OVERRIDE} e
5872 \const{CAP\_DAC\_READ\_SEARCH}.\\
5873 \const{CAP\_FSETID} & La capacità di evitare la cancellazione
5874 automatica dei bit \itindex{suid~bit} \acr{suid}
5875 e \itindex{sgid~bit} \acr{sgid} quando un file
5876 per i quali sono impostati viene modificato da
5877 un processo senza questa capacità e la capacità
5878 di impostare il bit \acr{sgid} su un file anche
5879 quando questo è relativo ad un gruppo cui non si
5881 sez.~\ref{sec:file_perm_management}).\\
5882 \const{CAP\_KILL} & La capacità di mandare segnali a qualunque
5883 processo (vedi sez.~\ref{sec:sig_kill_raise}).\\
5884 \const{CAP\_SETFCAP} & La capacità di impostare le
5885 \textit{capabilities} di un file (dal kernel
5887 \const{CAP\_SETGID} & La capacità di manipolare i group ID dei
5888 processi, sia il principale che i supplementari,
5889 (vedi sez.~\ref{sec:proc_setgroups}) che quelli
5890 trasmessi tramite i socket \textit{unix domain}
5891 (vedi sez.~\ref{sec:unix_socket}).\\
5892 \const{CAP\_SETUID} & La capacità di manipolare gli user ID del
5893 processo (vedi sez.~\ref{sec:proc_setuid}) e di
5894 trasmettere un user ID arbitrario nel passaggio
5895 delle credenziali coi socket \textit{unix
5896 domain} (vedi sez.~\ref{sec:unix_socket}).\\
5898 % Linux specific capabilities
5901 \const{CAP\_IPC\_LOCK} & La capacità di effettuare il \textit{memory
5902 locking} \itindex{memory~locking} con le
5903 funzioni \func{mlock}, \func{mlockall},
5904 \func{shmctl}, \func{mmap} (vedi
5905 sez.~\ref{sec:proc_mem_lock} e
5906 sez.~\ref{sec:file_memory_map}). \\
5907 \const{CAP\_IPC\_OWNER} & La capacità di evitare il controllo dei permessi
5908 per le operazioni sugli oggetti di
5909 intercomunicazione fra processi (vedi
5910 sez.~\ref{sec:ipc_sysv}).\\
5911 \const{CAP\_LEASE} & La capacità di creare dei \textit{file lease}
5912 \itindex{file~lease} (vedi
5913 sez.~\ref{sec:file_asyncronous_lease})
5914 pur non essendo proprietari del file (dal kernel
5916 \const{CAP\_LINUX\_IMMUTABLE}& La capacità di impostare sui file gli
5917 attributi \textit{immutable} e
5918 \itindex{append~mode} \textit{append only} (se
5920 \const{CAP\_MKNOD} & La capacità di creare
5921 \index{file!di~dispositivo} file di dispositivo
5922 con \func{mknod} (vedi
5923 sez.~\ref{sec:file_mknod}) (dal kernel 2.4).\\
5924 \const{CAP\_NET\_ADMIN} & La capacità di eseguire alcune operazioni
5925 privilegiate sulla rete.\\
5926 \const{CAP\_NET\_BIND\_SERVICE}& La capacità di porsi in ascolto
5927 su porte riservate (vedi
5928 sez.~\ref{sec:TCP_func_bind}).\\
5929 \const{CAP\_NET\_BROADCAST}& La capacità di consentire l'uso di socket in
5930 \itindex{broadcast} \textit{broadcast} e
5931 \itindex{multicast} \textit{multicast}.\\
5932 \const{CAP\_NET\_RAW} & La capacità di usare socket \texttt{RAW} e
5933 \texttt{PACKET} (vedi sez.~\ref{sec:sock_type}).\\
5934 \const{CAP\_SETPCAP} & La capacità di modifiche privilegiate alle
5935 \textit{capabilities}.\\
5936 \const{CAP\_SYS\_ADMIN} & La capacità di eseguire una serie di compiti
5938 \const{CAP\_SYS\_BOOT} & La capacità di fare eseguire un riavvio del
5939 sistema (vedi sez.~\ref{sec:sys_reboot}).\\
5940 \const{CAP\_SYS\_CHROOT}& La capacità di eseguire la funzione
5941 \func{chroot} (vedi sez.~\ref{sec:file_chroot}).\\
5942 \const{CAP\_MAC\_ADMIN} & La capacità amministrare il \textit{Mandatory
5943 Access Control} di Smack (dal kernel 2.6.25).\\
5944 \const{CAP\_MAC\_OVERRIDE}& La capacità evitare il \textit{Mandatory
5945 Access Control} di Smack (dal kernel 2.6.25).\\
5946 \const{CAP\_SYS\_MODULE}& La capacità di caricare e rimuovere moduli del
5948 \const{CAP\_SYS\_NICE} & La capacità di modificare le varie priorità dei
5949 processi (vedi sez.~\ref{sec:proc_priority}).\\
5950 \const{CAP\_SYS\_PACCT} & La capacità di usare le funzioni di
5951 \textit{accounting} dei processi (vedi
5952 sez.~\ref{sec:sys_bsd_accounting}).\\
5953 \const{CAP\_SYS\_PTRACE}& La capacità di tracciare qualunque processo con
5955 sez.~\ref{sec:process_ptrace}).\\
5956 \const{CAP\_SYS\_RAWIO} & La capacità di operare sulle porte
5957 di I/O con \func{ioperm} e \func{iopl} (vedi
5958 sez.~\ref{sec:process_io_port}).\\
5959 \const{CAP\_SYS\_RESOURCE}& La capacità di superare le varie limitazioni
5961 \const{CAP\_SYS\_TIME} & La capacità di modificare il tempo di sistema
5962 (vedi sez.~\ref{sec:sys_time}).\\
5963 \const{CAP\_SYS\_TTY\_CONFIG}& La capacità di simulare un \textit{hangup}
5964 della console, con la funzione
5966 \const{CAP\_SYSLOG} & La capacità di gestire il buffer dei messaggi
5967 del kernel, (vedi sez.~\ref{sec:sess_daemon}),
5968 introdotta dal kernel 2.6.38 come capacità
5969 separata da \const{CAP\_SYS\_ADMIN}.\\
5970 \const{CAP\_WAKE\_ALARM}& La capacità di usare i timer di tipo
5971 \const{CLOCK\_BOOTTIME\_ALARM} e
5972 \const{CLOCK\_REALTIME\_ALARM}, vedi
5973 sez.~\ref{sec:sig_timer_adv} (dal kernel 3.0).\\
5976 \caption{Le costanti che identificano le \textit{capabilities} presenti nel
5978 \label{tab:proc_capabilities}
5981 \footnotetext{vale a dire i permessi caratteristici del modello classico del
5982 controllo di accesso chiamato \itindex{Discrectionary~Access~Control~(DAC)}
5983 \textit{Discrectionary Access Control} (da cui il nome DAC).}
5986 Prima di dettagliare il significato della capacità più generiche, conviene
5987 però dedicare un discorso a parte a \const{CAP\_SETPCAP}, il cui significato è
5988 stato completamente cambiato con l'introduzione delle \textit{file
5989 capabilities} nel kernel 2.6.24. In precedenza questa capacità era quella
5990 che permetteva al processo che la possedeva di impostare o rimuovere le
5991 \textit{capabilities} che fossero presenti nel \textit{permitted set} del
5992 chiamante di un qualunque altro processo. In realtà questo non è mai stato
5993 l'uso inteso nelle bozze dallo standard POSIX, ed inoltre, come si è già
5994 accennato, dato che questa capacità è assente nel \textit{capabilities
5995 bounding set} usato di default, essa non è neanche mai stata realmente
5998 Con l'introduzione \textit{file capabilities} e il cambiamento del significato
5999 del \textit{capabilities bounding set} la possibilità di modificare le
6000 capacità di altri processi è stata completamente rimossa, e
6001 \const{CAP\_SETPCAP} ha acquisito quello che avrebbe dovuto essere il suo
6002 significato originario, e cioè la capacità del processo di poter inserire nel
6003 suo \textit{inheritable set} qualunque capacità presente nel \textit{bounding
6004 set}. Oltre a questo la disponibilità di \const{CAP\_SETPCAP} consente ad un
6005 processo di eliminare una capacità dal proprio \textit{bounding set} (con la
6006 conseguente impossibilità successiva di eseguire programmi con quella
6007 capacità), o di impostare i \textit{securebits} delle \textit{capabilities}.
6009 La prima fra le capacità ``\textsl{ampie}'' che occorre dettagliare
6010 maggiormente è \const{CAP\_FOWNER}, che rimuove le restrizioni poste ad un
6011 processo che non ha la proprietà di un file in un vasto campo di
6012 operazioni;\footnote{vale a dire la richiesta che l'\acr{uid} effettivo del
6013 processo (o meglio l'\acr{uid} di filesystem, vedi
6014 sez.~\ref{sec:proc_setuid}) coincida con quello del proprietario.} queste
6015 comprendono i cambiamenti dei permessi e dei tempi del file (vedi
6016 sez.~\ref{sec:file_perm_management} e sez.~\ref{sec:file_file_times}), le
6017 impostazioni degli attributi dei file (vedi sez.~\ref{sec:file_ioctl}) e delle
6018 ACL (vedi sez.~\ref{sec:file_xattr} e \ref{sec:file_ACL}), poter ignorare lo
6019 \itindex{sticky~bit} \textit{sticky bit} nella cancellazione dei file (vedi
6020 sez.~\ref{sec:file_special_perm}), la possibilità di impostare il flag di
6021 \const{O\_NOATIME} con \func{open} e \func{fcntl} (vedi
6022 sez.~\ref{sec:file_open} e sez.~\ref{sec:file_fcntl}) senza restrizioni.
6024 Una seconda capacità che copre diverse operazioni, in questo caso riguardanti
6025 la rete, è \const{CAP\_NET\_ADMIN}, che consente di impostare le opzioni
6026 privilegiate dei socket (vedi sez.~\ref{sec:sock_generic_options}), abilitare
6027 il \itindex{multicast} \textit{multicasting}, eseguire la configurazione delle
6028 interfacce di rete (vedi sez.~\ref{sec:sock_ioctl_netdevice}) ed impostare la
6029 tabella di instradamento.
6031 Una terza \textit{capability} con vasto campo di applicazione è
6032 \const{CAP\_SYS\_ADMIN}, che copre una serie di operazioni amministrative,
6033 come impostare le quote disco (vedi sez.\ref{sec:disk_quota}), attivare e
6034 disattivare la swap, montare, rimontare e smontare filesystem (vedi
6035 sez.~\ref{sec:sys_file_config}), effettuare operazioni di controllo su
6036 qualunque oggetto dell'IPC di SysV (vedi sez.~\ref{sec:ipc_sysv}), operare
6037 sugli attributi estesi dei file di classe \texttt{security} o \texttt{trusted}
6038 (vedi sez.~\ref{sec:file_xattr}), specificare un \acr{uid} arbitrario
6039 nella trasmissione delle credenziali dei socket (vedi
6040 sez.~\ref{sec:socket_credential_xxx}), assegnare classi privilegiate
6041 (\const{IOPRIO\_CLASS\_RT} e prima del kernel 2.6.25 anche
6042 \const{IOPRIO\_CLASS\_IDLE}) per lo scheduling dell'I/O (vedi
6043 sez.~\ref{sec:io_priority}), superare il limite di sistema sul numero massimo
6044 di file aperti,\footnote{quello indicato da \sysctlfile{fs/file-max}.}
6045 effettuare operazioni privilegiate sulle chiavi mantenute dal kernel (vedi
6046 sez.~\ref{sec:keyctl_management}), usare la funzione \func{lookup\_dcookie},
6047 usare \const{CLONE\_NEWNS} con \func{unshare} e \func{clone}, (vedi
6048 sez.~\ref{sec:process_clone}).
6050 Originariamente \const{CAP\_SYS\_NICE} riguardava soltanto la capacità di
6051 aumentare le priorità di esecuzione dei processi, come la diminuzione del
6052 valore di \textit{nice} (vedi sez.~\ref{sec:proc_sched_stand}), l'uso delle
6053 priorità \textit{real-time} (vedi sez.~\ref{sec:proc_real_time}), o
6054 l'impostazione delle affinità di processore (vedi
6055 sez.~\ref{sec:proc_sched_multiprocess}); ma con l'introduzione di priorità
6056 anche riguardo le operazioni di accesso al disco, e, nel caso di sistemi NUMA,
6057 alla memoria, essa viene a coprire anche la possibilità di assegnare priorità
6058 arbitrarie nell'accesso a disco (vedi sez.~\ref{sec:io_priority}) e nelle
6059 politiche di allocazione delle pagine di memoria ai nodi di un sistema NUMA.
6061 Infine la \textit{capability} \const{CAP\_SYS\_RESOURCE} attiene alla
6062 possibilità di superare i limiti imposti sulle risorse di sistema, come usare
6063 lo spazio disco riservato all'amministratore sui filesystem che lo supportano,
6064 usare la funzione \func{ioctl} per controllare il \textit{journaling} sul
6065 filesystem \acr{ext3}, non subire le quote disco, aumentare i limiti sulle
6066 risorse di un processo (vedi sez.~\ref{sec:sys_resource_limit}) e quelle sul
6067 numero di processi, ed i limiti sulle dimensioni dei messaggi delle code del
6068 SysV IPC (vedi sez.~\ref{sec:ipc_sysv_mq}).
6070 Per la gestione delle \textit{capabilities} il kernel mette a disposizione due
6071 funzioni che permettono rispettivamente di leggere ed impostare i valori dei
6072 tre insiemi illustrati in precedenza. Queste due funzioni sono \funcd{capget}
6073 e \funcd{capset} e costituiscono l'interfaccia di gestione basso livello; i
6074 loro rispettivi prototipi sono:
6076 \headdecl{sys/capability.h}
6078 \funcdecl{int capget(cap\_user\_header\_t hdrp, cap\_user\_data\_t datap)}
6079 Legge le \textit{capabilities}.
6081 \funcdecl{int capset(cap\_user\_header\_t hdrp, const cap\_user\_data\_t
6083 Imposta le \textit{capabilities}.
6086 \bodydesc{Entrambe le funzioni ritornano 0 in caso di successo e -1 in caso
6087 di errore, nel qual caso \var{errno} può assumere i valori:
6089 \item[\errcode{ESRCH}] si è fatto riferimento ad un processo inesistente.
6090 \item[\errcode{EPERM}] si è tentato di aggiungere una capacità
6091 nell'insieme delle \textit{capabilities} permesse, o di impostare una
6092 capacità non presente nell'insieme di quelle permesse negli insieme
6093 delle effettive o ereditate, o si è cercato di impostare una
6094 \textit{capability} di un altro processo senza avare
6095 \const{CAP\_SETPCAP}.
6097 ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
6101 Queste due funzioni prendono come argomenti due tipi di dati dedicati,
6102 definiti come puntatori a due strutture specifiche di Linux, illustrate in
6103 fig.~\ref{fig:cap_kernel_struct}. Per un certo periodo di tempo era anche
6104 indicato che per poterle utilizzare fosse necessario che la macro
6105 \macro{\_POSIX\_SOURCE} risultasse non definita (ed era richiesto di inserire
6106 una istruzione \texttt{\#undef \_POSIX\_SOURCE} prima di includere
6107 \texttt{sys/capability.h}) requisito che non risulta più presente.\footnote{e
6108 non è chiaro neanche quanto sia mai stato davvero necessario.}
6110 Si tenga presente che le strutture di fig.~\ref{fig:cap_kernel_struct}, come i
6111 prototipi delle due funzioni \func{capget} e \func{capset}, sono soggette ad
6112 essere modificate con il cambiamento del kernel (in particolare i tipi di dati
6113 delle strutture) ed anche se finora l'interfaccia è risultata stabile, non c'è
6114 nessuna assicurazione che questa venga mantenuta,\footnote{viene però
6115 garantito che le vecchie funzioni continuino a funzionare.} Pertanto se si
6116 vogliono scrivere programmi portabili che possano essere eseguiti senza
6117 modifiche o adeguamenti su qualunque versione del kernel è opportuno
6118 utilizzare le interfacce di alto livello che vedremo più avanti.
6120 \begin{figure}[!htb]
6123 \begin{minipage}[c]{\textwidth}
6124 \includestruct{listati/cap_user_header_t.h}
6127 \caption{Definizione delle strutture a cui fanno riferimento i puntatori
6128 \structd{cap\_user\_header\_t} e \structd{cap\_user\_data\_t} usati per
6129 l'interfaccia di gestione di basso livello delle \textit{capabilities}.}
6130 \label{fig:cap_kernel_struct}
6133 La struttura a cui deve puntare l'argomento \param{hdrp} serve ad indicare,
6134 tramite il campo \var{pid}, il PID del processo del quale si vogliono leggere
6135 o modificare le \textit{capabilities}. Con \func{capset} questo, se si usano
6136 le \textit{file capabilities}, può essere solo 0 o PID del processo chiamante,
6137 che sono equivalenti. Il campo \var{version} deve essere impostato al valore
6138 della versione delle stesse usata dal kernel (quello indicato da una delle
6139 costanti \texttt{\_LINUX\_CAPABILITY\_VERSION\_n} di
6140 fig.~\ref{fig:cap_kernel_struct}) altrimenti le funzioni ritorneranno con un
6141 errore di \errcode{EINVAL}, restituendo nel campo stesso il valore corretto
6142 della versione in uso. La versione due è comunque deprecata e non deve essere
6143 usata (il kernel stamperà un avviso). I valori delle \textit{capabilities}
6144 devono essere passati come maschere binarie;\footnote{e si tenga presente che
6145 i valori di tab.~\ref{tab:proc_capabilities} non possono essere combinati
6146 direttamente, indicando il numero progressivo del bit associato alla
6147 relativa capacità.} con l'introduzione delle \textit{capabilities} a 64 bit
6148 inoltre il puntatore \param{datap} non può essere più considerato come
6149 relativo ad una singola struttura, ma ad un vettore di due
6150 strutture.\footnote{è questo cambio di significato che ha portato a deprecare
6151 la versione 2, che con \func{capget} poteva portare ad un buffer overflow
6152 per vecchie applicazioni che continuavano a considerare \param{datap} come
6153 puntatore ad una singola struttura.}
6155 Dato che le precedenti funzioni, oltre ad essere specifiche di Linux, non
6156 garantiscono la stabilità nell'interfaccia, è sempre opportuno effettuare la
6157 gestione delle \textit{capabilities} utilizzando le funzioni di libreria a
6158 questo dedicate. Queste funzioni, che seguono quanto previsto nelle bozze
6159 dello standard POSIX.1e, non fanno parte delle \acr{glibc} e sono fornite in
6160 una libreria a parte,\footnote{la libreria è \texttt{libcap2}, nel caso di
6161 Debian può essere installata con il pacchetto omonimo.} pertanto se un
6162 programma le utilizza si dovrà indicare esplicitamente l'uso della suddetta
6163 libreria attraverso l'opzione \texttt{-lcap} del compilatore.
6165 Le funzioni dell'interfaccia delle bozze di POSIX.1e prevedono l'uso di un
6166 \index{tipo!opaco} tipo di dato opaco, \type{cap\_t}, come puntatore ai dati
6167 mantenuti nel cosiddetto \textit{capability state},\footnote{si tratta in
6168 sostanza di un puntatore ad una struttura interna utilizzata dalle librerie,
6169 i cui campi non devono mai essere acceduti direttamente.} in sono
6170 memorizzati tutti i dati delle \textit{capabilities}. In questo modo è
6171 possibile mascherare i dettagli della gestione di basso livello, che potranno
6172 essere modificati senza dover cambiare le funzioni dell'interfaccia, che
6173 faranno riferimento soltanto ad oggetti di questo tipo. L'interfaccia
6174 pertanto non soltanto fornisce le funzioni per modificare e leggere le
6175 \textit{capabilities}, ma anche quelle per gestire i dati attraverso
6178 La prima funzione dell'interfaccia è quella che permette di inizializzare un
6179 \textit{capability state}, allocando al contempo la memoria necessaria per i
6180 relativi dati. La funzione è \funcd{cap\_init} ed il suo prototipo è:
6182 \headdecl{sys/capability.h}
6184 \funcdecl{cap\_t cap\_init(void)}
6185 Crea ed inizializza un \textit{capability state}.
6187 \bodydesc{La funzione ritorna un valore non nullo in caso di successo e
6188 \val{NULL} in caso di errore, nel qual caso \var{errno} assumerà il
6189 valore \errval{ENOMEM}.
6193 La funzione restituisce il puntatore \type{cap\_t} ad uno stato inizializzato
6194 con tutte le \textit{capabilities} azzerate. In caso di errore (cioè quando
6195 non c'è memoria sufficiente ad allocare i dati) viene restituito \val{NULL}
6196 ed \var{errno} viene impostata a \errval{ENOMEM}. La memoria necessaria a
6197 mantenere i dati viene automaticamente allocata da \func{cap\_init}, ma dovrà
6198 essere disallocata esplicitamente quando non è più necessaria utilizzando, per
6199 questo l'interfaccia fornisce una apposita funzione, \funcd{cap\_free}, il cui
6202 \headdecl{sys/capability.h}
6204 \funcdecl{int cap\_free(void *obj\_d)}
6205 Disalloca la memoria allocata per i dati delle \textit{capabilities}.
6207 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
6208 errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
6212 La funzione permette di liberare la memoria allocata dalle altre funzioni
6213 della libreria sia per un \textit{capability state}, nel qual caso l'argomento
6214 dovrà essere un dato di tipo \type{cap\_t}, che per una descrizione testuale
6215 dello stesso,\footnote{cioè quanto ottenuto tramite la funzione
6216 \func{cap\_to\_text}.} nel qual caso l'argomento dovrà essere un dato di
6217 tipo \texttt{char *}. Per questo motivo l'argomento \param{obj\_d} è
6218 dichiarato come \texttt{void *} e deve sempre corrispondere ad un puntatore
6219 ottenuto tramite le altre funzioni della libreria, altrimenti la funzione
6220 fallirà con un errore di \errval{EINVAL}.
6222 Infine si può creare una copia di un \textit{capability state} ottenuto in
6223 precedenza tramite la funzione \funcd{cap\_dup}, il cui prototipo è:
6225 \headdecl{sys/capability.h}
6227 \funcdecl{cap\_t cap\_dup(cap\_t cap\_p)}
6228 Duplica un \textit{capability state} restituendone una copia.
6230 \bodydesc{La funzione ritorna un valore non nullo in caso di successo e
6231 \val{NULL} in caso di errore, nel qual caso \var{errno} potrà assumere i
6232 valori \errval{ENOMEM} o \errval{EINVAL}.
6236 La funzione crea una copia del \textit{capability state} posto all'indirizzo
6237 \param{cap\_p} che si è passato come argomento, restituendo il puntatore alla
6238 copia, che conterrà gli stessi valori delle \textit{capabilities} presenti
6239 nell'originale. La memoria necessaria viene allocata automaticamente dalla
6240 funzione. Una volta effettuata la copia i due \textit{capability state}
6241 potranno essere modificati in maniera completamente
6242 indipendente.\footnote{alla fine delle operazioni si ricordi però di
6243 disallocare anche la copia, oltre all'originale. }
6245 Una seconda classe di funzioni di servizio previste dall'interfaccia sono
6246 quelle per la gestione dei dati contenuti all'interno di un \textit{capability
6247 state}; la prima di queste è \funcd{cap\_clear}, il cui prototipo è:
6249 \headdecl{sys/capability.h}
6251 \funcdecl{int cap\_clear(cap\_t cap\_p)}
6252 Inizializza un \textit{capability state} cancellando tutte le
6253 \textit{capabilities}.
6255 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
6256 errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
6260 La funzione si limita ad azzerare tutte le \textit{capabilities} presenti nel
6261 \textit{capability state} all'indirizzo \param{cap\_p} passato come argomento,
6262 restituendo uno stato \textsl{vuoto}, analogo a quello che si ottiene nella
6263 creazione con \func{cap\_init}.
6268 \begin{tabular}[c]{|l|l|}
6270 \textbf{Valore} & \textbf{Significato} \\
6273 \const{CAP\_EFFECTIVE} & Capacità dell'insieme \textsl{effettivo}.\\
6274 \const{CAP\_PERMITTED} & Capacità dell'insieme \textsl{permesso}.\\
6275 \const{CAP\_INHERITABLE}& Capacità dell'insieme \textsl{ereditabile}.\\
6278 \caption{Valori possibili per il tipo di dato \type{cap\_flag\_t} che
6279 identifica gli insiemi delle \textit{capabilities}.}
6280 \label{tab:cap_set_identifier}
6283 Una variante di \func{cap\_clear} è \funcd{cap\_clear\_flag} che cancella da
6284 un \textit{capability state} tutte le \textit{capabilities} di un certo
6285 insieme fra quelli di pag.~\pageref{sec:capabilities_set}, il suo prototipo
6288 \headdecl{sys/capability.h}
6290 \funcdecl{int cap\_clear\_flag(cap\_t cap\_p, cap\_flag\_t flag)}
6292 Cancella dal \textit{capability state} \param{cap\_p} tutte le
6293 \textit{capabilities} dell'insieme \param{flag}.
6295 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
6296 errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}. }
6299 La funzione richiede che si indichi quale degli insiemi si intente cancellare
6300 con l'argomento \param{flag}. Questo deve essere specificato con una variabile
6301 di tipo \type{cap\_flag\_t} che può assumere esclusivamente\footnote{si tratta
6302 in effetti di un tipo enumerato, come si può verificare dalla sua
6303 definizione che si trova in \texttt{/usr/include/sys/capability.h}.} uno dei
6304 valori illustrati in tab.~\ref{tab:cap_set_identifier}.
6306 Si possono inoltre confrontare in maniera diretta due diversi
6307 \textit{capability state} con la funzione \funcd{cap\_compare}; il suo
6310 \headdecl{sys/capability.h}
6311 \funcdecl{int cap\_compare(cap\_t cap\_a, cap\_t cap\_b)}
6313 Confronta due \textit{capability state}.
6315 \bodydesc{La funzione ritorna 0 se i \textit{capability state} sono identici
6316 ed un valore positivo se differiscono, non sono previsti errori.}
6319 La funzione esegue un confronto fra i due \textit{capability state} passati
6320 come argomenti e ritorna in un valore intero il risultato, questo è nullo se
6321 sono identici o positivo se vi sono delle differenze. Il valore di ritorno
6322 della funzione consente inoltre di per ottenere ulteriori informazioni su
6323 quali sono gli insiemi di \textit{capabilities} che risultano differenti. Per
6324 questo si può infatti usare la apposita macro \macro{CAP\_DIFFERS}:
6326 \funcdecl{int CAP\_DIFFERS(value, flag)} Controlla lo stato di eventuali
6327 differenze delle \textit{capabilities} nell'insieme \texttt{flag}.
6330 La macro che richiede si passi nell'argomento \texttt{value} il risultato
6331 della funzione \func{cap\_compare} e in \texttt{flag} l'indicazione (coi
6332 valori di tab.~\ref{tab:cap_set_identifier}) dell'insieme che si intende
6333 controllare; restituirà un valore diverso da zero se le differenze rilevate da
6334 \func{cap\_compare} sono presenti nell'insieme indicato.
6336 Per la gestione dei singoli valori delle \textit{capabilities} presenti in un
6337 \textit{capability state} l'interfaccia prevede due funzioni specifiche,
6338 \funcd{cap\_get\_flag} e \funcd{cap\_set\_flag}, che permettono
6339 rispettivamente di leggere o impostare il valore di una capacità all'interno
6340 in uno dei tre insiemi già citati; i rispettivi prototipi sono:
6342 \headdecl{sys/capability.h}
6344 \funcdecl{int cap\_get\_flag(cap\_t cap\_p, cap\_value\_t cap, cap\_flag\_t
6345 flag, cap\_flag\_value\_t *value\_p)}
6346 Legge il valore di una \textit{capability}.
6348 \funcdecl{int cap\_set\_flag(cap\_t cap\_p, cap\_flag\_t flag, int ncap,
6349 cap\_value\_t *caps, cap\_flag\_value\_t value)}
6350 Imposta il valore di una \textit{capability}.
6352 \bodydesc{Le funzioni ritornano 0 in caso di successo e $-1$ in caso di
6353 errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
6357 In entrambe le funzioni l'argomento \param{cap\_p} indica il puntatore al
6358 \textit{capability state} su cui operare, mentre l'argomento \param{flag}
6359 indica su quale dei tre insiemi si intende operare, sempre con i valori di
6360 tab.~\ref{tab:cap_set_identifier}.
6362 La capacità che si intende controllare o impostare invece deve essere
6363 specificata attraverso una variabile di tipo \type{cap\_value\_t}, che può
6364 prendere come valore uno qualunque di quelli riportati in
6365 tab.~\ref{tab:proc_capabilities}, in questo caso però non è possibile
6366 combinare diversi valori in una maschera binaria, una variabile di tipo
6367 \type{cap\_value\_t} può indicare una sola capacità.\footnote{in
6368 \texttt{sys/capability.h} il tipo \type{cap\_value\_t} è definito come
6369 \ctyp{int}, ma i valori validi sono soltanto quelli di
6370 tab.~\ref{tab:proc_capabilities}.}
6372 Infine lo stato di una capacità è descritto ad una variabile di tipo
6373 \type{cap\_flag\_value\_t}, che a sua volta può assumere soltanto
6374 uno\footnote{anche questo è un tipo enumerato.} dei valori di
6375 tab.~\ref{tab:cap_value_type}.
6380 \begin{tabular}[c]{|l|l|}
6382 \textbf{Valore} & \textbf{Significato} \\
6385 \const{CAP\_CLEAR}& La capacità non è impostata.\\
6386 \const{CAP\_SET} & La capacità è impostata.\\
6389 \caption{Valori possibili per il tipo di dato \type{cap\_flag\_value\_t} che
6390 indica lo stato di una capacità.}
6391 \label{tab:cap_value_type}
6394 La funzione \func{cap\_get\_flag} legge lo stato della capacità indicata
6395 dall'argomento \param{cap} all'interno dell'insieme indicato dall'argomento
6396 \param{flag} lo restituisce nella variabile puntata
6397 dall'argomento \param{value\_p}. Questa deve essere di tipo
6398 \type{cap\_flag\_value\_t} ed assumerà uno dei valori di
6399 tab.~\ref{tab:cap_value_type}. La funzione consente pertanto di leggere solo
6400 lo stato di una capacità alla volta.
6402 La funzione \func{cap\_set\_flag} può invece impostare in una sola chiamata
6403 più \textit{capabilities}, anche se solo all'interno dello stesso insieme ed
6404 allo stesso valore. Per questo motivo essa prende un vettore di valori di tipo
6405 \type{cap\_value\_t} nell'argomento \param{caps}, la cui dimensione viene
6406 specificata dall'argomento \param{ncap}. Il tipo di impostazione da eseguire
6407 (cancellazione o impostazione) per le capacità elencate in \param{caps} viene
6408 indicato dall'argomento \param{value} sempre con i valori di
6409 tab.~\ref{tab:cap_value_type}.
6411 Per semplificare la gestione delle \textit{capabilities} l'interfaccia prevede
6412 che sia possibile utilizzare anche una rappresentazione testuale del contenuto
6413 di un \textit{capability state} e fornisce le opportune funzioni di
6414 gestione;\footnote{entrambe erano previste dalla bozza dello standard
6415 POSIX.1e.} la prima di queste, che consente di ottenere la rappresentazione
6416 testuale, è \funcd{cap\_to\_text}, il cui prototipo è:
6418 \headdecl{sys/capability.h}
6420 \funcdecl{char * cap\_to\_text(cap\_t caps, ssize\_t * length\_p)}
6422 Genera una visualizzazione testuale delle \textit{capabilities}.
6424 \bodydesc{La funzione ritorna un puntatore alla stringa con la descrizione
6425 delle \textit{capabilities} in caso di successo e \val{NULL} in caso di
6426 errore, nel qual caso \var{errno} può assumere i valori \errval{EINVAL} o
6431 La funzione ritorna l'indirizzo di una stringa contente la descrizione
6432 testuale del contenuto del \textit{capability state} \param{caps} passato come
6433 argomento, e, qualora l'argomento \param{length\_p} sia diverso da \val{NULL},
6434 restituisce nella variabile intera da questo puntata la lunghezza della
6435 stringa. La stringa restituita viene allocata automaticamente dalla funzione e
6436 pertanto dovrà essere liberata con \func{cap\_free}.
6438 La rappresentazione testuale, che viene usata anche di programmi di gestione a
6439 riga di comando, prevede che lo stato venga rappresentato con una stringa di
6440 testo composta da una serie di proposizioni separate da spazi, ciascuna delle
6441 quali specifica una operazione da eseguire per creare lo stato finale. Nella
6442 rappresentazione si fa sempre conto di partire da uno stato in cui tutti gli
6443 insiemi sono vuoti e si provvede a impostarne i contenuti.
6445 Ciascuna proposizione è nella forma di un elenco di capacità, espresso con i
6446 nomi di tab.~\ref{tab:proc_capabilities} separati da virgole, seguito da un
6447 operatore, e dall'indicazione degli insiemi a cui l'operazione si applica. I
6448 nomi delle capacità possono essere scritti sia maiuscoli che minuscoli, viene
6449 inoltre riconosciuto il nome speciale \texttt{all} che è equivalente a
6450 scrivere la lista completa. Gli insiemi sono identificati dalle tre lettere
6451 iniziali: ``\texttt{p}'' per il \textit{permitted}, ``\texttt{i}'' per
6452 l'\textit{inheritable} ed ``\texttt{e}'' per l'\textit{effective} che devono
6453 essere sempre minuscole e se ne può indicare più di uno.
6455 Gli operatori possibili sono solo tre: ``\texttt{+}'' che aggiunge le capacità
6456 elencate agli insiemi indicati, ``\texttt{-}'' che le toglie e ``\texttt{=}''
6457 che le assegna esattamente. I primi due richiedono che sia sempre indicato sia
6458 un elenco di capacità che gli insiemi a cui esse devono applicarsi, e
6459 rispettivamente attiveranno o disattiveranno le capacità elencate nell'insieme
6460 o negli insiemi specificati, ignorando tutto il resto. I due operatori possono
6461 anche essere combinati nella stessa proposizione, per aggiungere e togliere le
6462 capacità dell'elenco da insiemi diversi.
6464 L'assegnazione si applica invece su tutti gli insiemi allo stesso tempo,
6465 pertanto l'uso di ``\texttt{=}'' è equivalente alla cancellazione preventiva
6466 di tutte le capacità ed alla impostazione di quelle elencate negli insiemi
6467 specificati, questo significa che in genere lo si usa una sola volta
6468 all'inizio della stringa. In tal caso l'elenco delle capacità può non essere
6469 indicato e viene assunto che si stia facendo riferimento a tutte quante senza
6470 doverlo scrivere esplicitamente.
6472 Come esempi avremo allora che un processo non privilegiato di un utente, che
6473 non ha nessuna capacità attiva, avrà una rappresentazione nella forma
6474 ``\texttt{=}'' che corrisponde al fatto che nessuna capacità viene assegnata a
6475 nessun insieme (vale la cancellazione preventiva), mentre un processo con
6476 privilegi di amministratore avrà una rappresentazione nella forma
6477 ``\texttt{=ep}'' in cui tutte le capacità vengono assegnate agli insiemi
6478 \textit{permitted} ed \textit{effective} (e l'\textit{inheritable} è ignorato
6479 in quanto per le regole viste a pag.~\ref{sec:capability-uid-transition} le
6480 capacità verranno comunque attivate attraverso una \func{exec}). Infine, come
6481 esempio meno banale dei precedenti, otterremo per \texttt{init} una
6482 rappresentazione nella forma ``\texttt{=ep cap\_setpcap-e}'' dato che come
6483 accennato tradizionalmente \const{CAP\_SETPCAP} è sempre stata rimossa da
6486 Viceversa per passare ottenere un \textit{capability state} dalla sua
6487 rappresentazione testuale si può usare \funcd{cap\_from\_text}, il cui
6490 \headdecl{sys/capability.h}
6492 \funcdecl{cap\_t cap\_from\_text(const char *string)}
6494 Crea un \textit{capability state} dalla sua rappresentazione testuale.
6496 \bodydesc{La funzione ritorna un puntatore valido in caso di successo e
6497 \val{NULL} in caso di errore, nel qual caso \var{errno} può assumere i
6498 valori \errval{EINVAL} o \errval{ENOMEM}.}
6501 La funzione restituisce il puntatore ad un \textit{capability state}
6502 inizializzato con i valori indicati nella stringa \param{string} che ne
6503 contiene la rappresentazione testuale. La memoria per il \textit{capability
6504 state} viene allocata automaticamente dalla funzione e dovrà essere liberata
6505 con \func{cap\_free}.
6507 Alle due funzioni citate se ne aggiungono altre due che consentono di
6508 convertire i valori delle costanti di tab.~\ref{tab:proc_capabilities} nelle
6509 stringhe usate nelle rispettive rappresentazioni e viceversa. Le due funzioni,
6510 \func{cap\_to\_name} e \func{cap\_from\_name}, sono estensioni specifiche di
6511 Linux ed i rispettivi prototipi sono:
6513 \headdecl{sys/capability.h}
6515 \funcdecl{char * cap\_to\_name(cap\_value\_t cap)}
6516 \funcdecl{int cap\_from\_name(const char *name, cap\_value\_t *cap\_p)}
6517 Convertono le \textit{capabilities} dalle costanti alla rappresentazione
6518 testuale e viceversa.
6520 \bodydesc{La funzione \func{cap\_to\_name} ritorna un valore diverso da
6521 \val{NULL} in caso di successo e \val{NULL} in caso di errore, mentre
6522 \func{cap\_to\_name} ritorna rispettivamente 0 e $-1$; per entrambe in
6523 caso di errore \var{errno} può assumere i valori \errval{EINVAL} o
6527 La prima funzione restituisce la stringa (allocata automaticamente e che dovrà
6528 essere liberata con \func{cap\_free}) che corrisponde al valore della
6529 capacità \param{cap}, mentre la seconda restituisce nella variabile puntata
6530 da \param{cap\_p} il valore della capacità rappresentata dalla
6531 stringa \param{name}.
6533 Fin quei abbiamo trattato solo le funzioni di servizio relative alla
6534 manipolazione dei \textit{capability state} come strutture di dati;
6535 l'interfaccia di gestione prevede però anche le funzioni per trattare le
6536 \textit{capabilities} presenti nei processi. La prima di queste funzioni è
6537 \funcd{cap\_get\_proc} che consente la lettura delle \textit{capabilities} del
6538 processo corrente, il suo prototipo è:
6540 \headdecl{sys/capability.h}
6542 \funcdecl{cap\_t cap\_get\_proc(void)}
6543 Legge le \textit{capabilities} del processo corrente.
6545 \bodydesc{La funzione ritorna un valore diverso da \val{NULL} in caso di
6546 successo e \val{NULL} in caso di errore, nel qual caso \var{errno} può
6547 assumere i valori \errval{EINVAL}, \errval{EPERM} o \errval{ENOMEM}. }
6550 La funzione legge il valore delle \textit{capabilities} associate al processo
6551 da cui viene invocata, restituendo il risultato tramite il puntatore ad un
6552 \textit{capability state} contenente tutti i dati che provvede ad allocare
6553 autonomamente e che di nuovo occorrerà liberare con \func{cap\_free} quando
6554 non sarà più utilizzato.
6556 Se invece si vogliono leggere le \textit{capabilities} di un processo
6557 specifico occorre usare la funzione \funcd{capgetp}, il cui
6558 prototipo\footnote{su alcune pagine di manuale la funzione è descritta con un
6559 prototipo sbagliato, che prevede un valore di ritorno di tipo \type{cap\_t},
6560 ma il valore di ritorno è intero, come si può verificare anche dalla
6561 dichiarazione della stessa in \texttt{sys/capability.h}.} è:
6563 \headdecl{sys/capability.h}
6565 \funcdecl{int capgetp(pid\_t pid, cap\_t cap\_d)}
6566 Legge le \textit{capabilities} del processo indicato da \param{pid}.
6568 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
6569 errore, nel qual caso \var{errno} può assumere i valori \errval{EINVAL},
6570 \errval{EPERM} o \errval{ENOMEM}.
6573 %TODO controllare e correggere i codici di errore!!!
6575 La funzione legge il valore delle \textit{capabilities} del processo indicato
6576 con l'argomento \param{pid}, e restituisce il risultato nel \textit{capability
6577 state} posto all'indirizzo indicato con l'argomento
6578 \param{cap\_d}; a differenza della precedente in questo caso il
6579 \textit{capability state} deve essere stato creato in precedenza. Qualora il
6580 processo indicato non esista si avrà un errore di \errval{ESRCH}. Gli stessi
6581 valori possono essere letti direttamente nel filesystem \textit{proc}, nei
6582 file \texttt{/proc/<pid>/status}; ad esempio per \texttt{init} si otterrà
6586 CapInh: 0000000000000000
6587 CapPrm: 00000000fffffeff
6588 CapEff: 00000000fffffeff
6592 Infine per impostare le \textit{capabilities} del processo corrente (non
6593 esiste una funzione che permetta di cambiare le \textit{capabilities} di un
6594 altro processo) si deve usare la funzione \funcd{cap\_set\_proc}, il cui
6597 \headdecl{sys/capability.h}
6599 \funcdecl{int cap\_set\_proc(cap\_t cap\_p)}
6600 Imposta le \textit{capabilities} del processo corrente.
6602 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
6603 errore, nel qual caso \var{errno} può assumere i valori \errval{EINVAL},
6604 \errval{EPERM} o \errval{ENOMEM}.
6608 La funzione modifica le \textit{capabilities} del processo corrente secondo
6609 quanto specificato con l'argomento \param{cap\_p}, posto che questo sia
6610 possibile nei termini spiegati in precedenza (non sarà ad esempio possibile
6611 impostare capacità non presenti nell'insieme di quelle permesse). In caso di
6612 successo i nuovi valori saranno effettivi al ritorno della funzione, in caso
6613 di fallimento invece lo stato delle capacità resterà invariato. Si tenga
6614 presente che \textsl{tutte} le capacità specificate tramite \param{cap\_p}
6615 devono essere permesse; se anche una sola non lo è la funzione fallirà, e per
6616 quanto appena detto, lo stato delle \textit{capabilities} non verrà modificato
6617 (neanche per le parti eventualmente permesse).
6619 Come esempio di utilizzo di queste funzioni nei sorgenti allegati alla guida
6620 si è distribuito il programma \texttt{getcap.c}, che consente di leggere le
6621 \textit{capabilities} del processo corrente\footnote{vale a dire di sé stesso,
6622 quando lo si lancia, il che può sembrare inutile, ma serve a mostrarci quali
6623 sono le \textit{capabilities} standard che ottiene un processo lanciato
6624 dalla riga di comando.} o tramite l'opzione \texttt{-p}, quelle di un
6625 processo qualunque il cui pid viene passato come parametro dell'opzione.
6627 \begin{figure}[!htbp]
6628 \footnotesize \centering
6629 \begin{minipage}[c]{\codesamplewidth}
6630 \includecodesample{listati/getcap.c}
6633 \caption{Corpo principale del programma \texttt{getcap.c}.}
6634 \label{fig:proc_getcap}
6637 La sezione principale del programma è riportata in fig.~\ref{fig:proc_getcap},
6638 e si basa su una condizione sulla variabile \var{pid} che se si è usato
6639 l'opzione \texttt{-p} è impostata (nella sezione di gestione delle opzioni,
6640 che si è tralasciata) al valore del \textsl{pid} del processo di cui si vuole
6641 leggere le \textit{capabilities} e nulla altrimenti. Nel primo caso
6642 (\texttt{\small 1--6}) si utilizza direttamente (\texttt{\small 2})
6643 \func{cap\_get\_proc} per ottenere lo stato delle capacità del processo, nel
6644 secondo (\texttt{\small 7--14}) prima si inizializza (\texttt{\small 8}) uno
6645 stato vuoto e poi (\texttt{\small 9}) si legge il valore delle capacità del
6648 Il passo successivo è utilizzare (\texttt{\small 16}) \func{cap\_to\_text} per
6649 tradurre in una stringa lo stato, e poi (\texttt{\small 17}) stamparlo; infine
6650 (\texttt{\small 19--20}) si libera la memoria allocata dalle precedenti
6651 funzioni con \func{cap\_free} per poi ritornare dal ciclo principale della
6654 \itindend{capabilities}
6656 % TODO vedi http://lwn.net/Articles/198557/ e
6657 % http://www.madore.org/~david/linux/newcaps/
6661 \subsection{La funzione \func{chroot}}
6662 \label{sec:file_chroot}
6664 % TODO introdurre nuova sezione sulle funzionalità di sicurezza avanzate, con
6665 % dentro chroot SELinux e AppArmor, Tomoyo, Smack, cgroup o che altro ???
6667 % inserire setns (introdotta con il 3.0, vedi http://lwn.net/Articles/407495/)
6668 % e le funzionalità di isolamento dei container
6670 Benché non abbia niente a che fare con permessi, utenti e gruppi, la funzione
6671 \func{chroot} viene usata spesso per restringere le capacità di accesso di un
6672 programma ad una sezione limitata del filesystem, per cui ne parleremo in
6675 Come accennato in sez.~\ref{sec:proc_fork} ogni processo oltre ad una
6676 directory di lavoro, ha anche una directory \textsl{radice}\footnote{entrambe
6677 sono contenute in due campi (rispettivamente \var{pwd} e \var{root}) di
6678 \struct{fs\_struct}; vedi fig.~\ref{fig:proc_task_struct}.} che, pur essendo
6679 di norma corrispondente alla radice dell'albero di file e directory come visto
6680 dal kernel (ed illustrato in sez.~\ref{sec:file_pathname}), ha per il processo
6681 il significato specifico di directory rispetto alla quale vengono risolti i
6682 \itindsub{pathname}{assoluto}\textit{pathname} assoluti.\footnote{cioè quando
6683 un processo chiede la risoluzione di un \textit{pathname}, il kernel usa
6684 sempre questa directory come punto di partenza.} Il fatto che questo valore
6685 sia specificato per ogni processo apre allora la possibilità di modificare le
6686 modalità di risoluzione dei \textit{pathname} assoluti da parte di un processo
6687 cambiando questa directory, così come si fa coi
6688 \itindsub{pathname}{relativo}\textit{pathname} relativi cambiando la directory
6691 Normalmente la directory radice di un processo coincide anche con la radice
6692 del filesystem usata dal kernel, e dato che il suo valore viene ereditato dal
6693 padre da ogni processo figlio, in generale i processi risolvono i
6694 \itindsub{pathname}{assoluto} \textit{pathname} assoluti a partire sempre
6695 dalla stessa directory, che corrisponde alla radice del sistema.
6697 In certe situazioni però è utile poter impedire che un processo possa accedere
6698 a tutto il filesystem; per far questo si può cambiare la sua directory radice
6699 con la funzione \funcd{chroot}, il cui prototipo è:
6700 \begin{prototype}{unistd.h}{int chroot(const char *path)}
6701 Cambia la directory radice del processo a quella specificata da
6704 \bodydesc{La funzione restituisce zero in caso di successo e -1 per
6705 un errore, in caso di errore \var{errno} può assumere i valori:
6707 \item[\errcode{EPERM}] l'\acr{uid} effettivo del processo non è zero.
6709 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
6710 \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EACCES}, \errval{ELOOP};
6711 \errval{EROFS} e \errval{EIO}.}
6713 \noindent in questo modo la directory radice del processo diventerà
6714 \param{path} (che ovviamente deve esistere) ed ogni
6715 \itindsub{pathname}{assoluto}\textit{pathname} assoluto usato dalle funzioni
6716 chiamate nel processo sarà risolto a partire da essa, rendendo impossibile
6717 accedere alla parte di albero sovrastante. Si ha così quella che viene
6718 chiamata una \textit{chroot jail}, in quanto il processo non può più accedere
6719 a file al di fuori della sezione di albero in cui è stato
6720 \textsl{imprigionato}.
6722 Solo un processo con i privilegi di amministratore può usare questa funzione,
6723 e la nuova radice, per quanto detto in sez.~\ref{sec:proc_fork}, sarà ereditata
6724 da tutti i suoi processi figli. Si tenga presente però che la funzione non
6725 cambia la directory di lavoro, che potrebbe restare fuori dalla \textit{chroot
6728 Questo è il motivo per cui la funzione è efficace solo se dopo averla eseguita
6729 si cedono i privilegi di root. Infatti se per un qualche motivo il processo
6730 resta con la directory di lavoro fuori dalla \textit{chroot jail}, potrà
6731 comunque accedere a tutto il resto del filesystem usando
6732 \itindsub{pathname}{relativo}\textit{pathname} relativi, i quali, partendo
6733 dalla directory di lavoro che è fuori della \textit{chroot jail}, potranno
6734 (con l'uso di ``\texttt{..}'') risalire fino alla radice effettiva del
6737 Ma se ad un processo restano i privilegi di amministratore esso potrà comunque
6738 portare la sua directory di lavoro fuori dalla \textit{chroot jail} in cui si
6739 trova. Basta infatti creare una nuova \textit{chroot jail} con l'uso di
6740 \func{chroot} su una qualunque directory contenuta nell'attuale directory di
6741 lavoro. Per questo motivo l'uso di questa funzione non ha molto senso quando
6742 un processo necessita dei privilegi di root per le sue normali operazioni.
6744 Un caso tipico di uso di \func{chroot} è quello di un server FTP anonimo, in
6745 questo caso infatti si vuole che il server veda solo i file che deve
6746 trasferire, per cui in genere si esegue una \func{chroot} sulla directory che
6747 contiene i file. Si tenga presente però che in questo caso occorrerà
6748 replicare all'interno della \textit{chroot jail} tutti i file (in genere
6749 programmi e librerie) di cui il server potrebbe avere bisogno.
6754 % TODO: trattare la funzione setns e i namespace file descriptors (vedi
6755 % http://lwn.net/Articles/407495/) introdotti con il kernel 3.0
6757 % TODO: spostare chroot e le funzioni affini relative ai container da qualche
6758 % parte diversa se è il caso.
6760 % LocalWords: sez like filesystem unlink MacOS Windows VMS inode kernel unistd
6761 % LocalWords: int const char oldpath newpath errno EXDEV EPERM st Smack SysV
6762 % LocalWords: EEXIST EMLINK EACCES ENAMETOOLONG ENOTDIR EFAULT ENOMEM EROFS ls
6763 % LocalWords: ELOOP ENOSPC EIO pathname nlink stat vfat fsck EISDIR ENOENT cap
6764 % LocalWords: POSIX socket fifo sticky root system call count crash init linux
6765 % LocalWords: descriptor remove rename rmdir stdio glibc libc NFS DT obj dup
6766 % LocalWords: ENOTEMPTY EBUSY mount point EINVAL soft symbolic tab symlink fig
6767 % LocalWords: dangling access chdir chmod chown creat exec lchown lstat mkdir
6768 % LocalWords: mkfifo mknod opendir pathconf readlink truncate path buff size
6769 % LocalWords: grub bootloader grep MAXSYMLINKS cat VFS sys dirname fcntl tv Py
6770 % LocalWords: dev umask IFREG IFBLK IFCHR IFIFO SVr sgid BSD SVID NULL from to
6771 % LocalWords: stream dirent EMFILE ENFILE dirfd SOURCE fchdir readdir struct
6772 % LocalWords: EBADF namlen HAVE thread entry result value argument fileno ext
6773 % LocalWords: name TYPE OFF RECLEN UNKNOWN REG SOCK CHR BLK type IFTODT DTTOIF
6774 % LocalWords: DTYPE off reclen seekdir telldir void rewinddir closedir select
6775 % LocalWords: namelist compar malloc qsort alphasort versionsort strcoll myls
6776 % LocalWords: strcmp DirScan direntry while current working home shell pwd get
6777 % LocalWords: getcwd ERANGE getwd change fd race condition tmpnam getfacl mark
6778 % LocalWords: string tmpdir TMP tempnam pfx TMPNAME suid tmp EXCL tmpfile pid
6779 % LocalWords: EINTR mktemp mkstemp stlib template filename XXXXXX OpenBSD buf
6780 % LocalWords: mkdtemp fstat filedes nell'header padding ISREG ISDIR ISCHR IFMT
6781 % LocalWords: ISBLK ISFIFO ISLNK ISSOCK IFSOCK IFLNK IFDIR ISUID UID ISGID GID
6782 % LocalWords: ISVTX IRUSR IWUSR IXUSR IRGRP IWGRP IXGRP IROTH IWOTH IXOTH OLD
6783 % LocalWords: blocks blksize holes lseek TRUNC ftruncate ETXTBSY length QCMD
6784 % LocalWords: hole atime read utime mtime write ctime modification leafnode cp
6785 % LocalWords: make fchmod fchown utimbuf times actime modtime Mac owner uid fs
6786 % LocalWords: gid Control List patch mandatory control execute group other all
6787 % LocalWords: effective passwd IGID locking swap saved text IRWXU IRWXG subcmd
6788 % LocalWords: IRWXO capability FSETID mask capabilities chroot jail QUOTAOFF
6789 % LocalWords: FTP filter Attributes Solaris FreeBSD libacl hash at dqblk SYNC
6790 % LocalWords: XFS SELinux namespace attribute security trusted Draft Modules
6791 % LocalWords: attributes mime ADMIN FOWNER libattr lattr getxattr lgetxattr of
6792 % LocalWords: fgetxattr attr ssize ENOATTR ENOTSUP NUL setxattr lsetxattr list
6793 % LocalWords: fsetxattr flags XATTR REPLACE listxattr llistxattr flistxattr by
6794 % LocalWords: removexattr lremovexattr fremovexattr attributename acl GETINFO
6795 % LocalWords: OBJ setfacl len any prefix separator options NUMERIC IDS SMART
6796 % LocalWords: INDENT major number IDE Documentation makedev proc copy LNK long
6797 % LocalWords: euidaccess eaccess delete def tag qualifier permset calendar NOW
6798 % LocalWords: mutt noatime relatime strictatime atim nsec mtim ctim atimensec
6799 % LocalWords: mtimensec utimes timeval futimes lutimes ENOSYS futimens OMIT PR
6800 % LocalWords: utimensat timespec sec futimesat LIDS DAC OVERRIDE SEARCH chattr
6801 % LocalWords: Discrectionary KILL SETGID domain SETUID setuid setreuid SETPCAP
6802 % LocalWords: setresuid setfsuid IMMUTABLE immutable append only BIND SERVICE
6803 % LocalWords: BROADCAST broadcast multicast multicasting RAW PACKET IPC LOCK
6804 % LocalWords: memory mlock mlockall shmctl mmap MODULE RAWIO ioperm iopl PACCT
6805 % LocalWords: ptrace accounting NICE RESOURCE TTY CONFIG hangup vhangup dell'
6806 % LocalWords: LEASE lease SETFCAP AUDIT permitted inherited inheritable AND nn
6807 % LocalWords: bounding execve fork capget capset header hdrp datap ESRCH undef
6808 % LocalWords: version libcap lcap clear ncap caps pag capgetp CapInh CapPrm RT
6809 % LocalWords: fffffeff CapEff getcap scheduling lookup dqinfo SETINFO GETFMT
6810 % LocalWords: NEWNS unshare nice NUMA ioctl journaling close XOPEN fdopendir
6811 % LocalWords: btrfs mkostemp extN ReiserFS JFS Posix usrquota grpquota EDQUOT
6812 % LocalWords: aquota quotacheck limit grace period quotactl cmd caddr addr dqb
6813 % LocalWords: QUOTAON ENODEV ENOPKG ENOTBLK GETQUOTA SETQUOTA SETUSE SETQLIM
6814 % LocalWords: forced allowed sendmail SYSLOG WAKE ALARM CLOCK BOOTTIME dqstats
6815 % LocalWords: REALTIME securebits GETSTATS QFMT curspace curinodes btime itime
6816 % LocalWords: QIF BLIMITS bhardlimit bsoftlimit ILIMITS ihardlimit isoftlimit
6817 % LocalWords: INODES LIMITS USAGE valid dqi IIF BGRACE bgrace IGRACE igrace is
6818 % LocalWords: Python Truelite Srl quotamodule Repository who nell' dall' KEEP
6819 % LocalWords: SECURE KEEPCAPS prctl FIXUP NOROOT LOCKED dell'IPC dell'I IOPRIO
6820 % LocalWords: CAPBSET CLASS IDLE dcookie overflow DIFFERS Virtual everything
6821 % LocalWords: dentry register resolution cache dcache operation llseek poll
6822 % LocalWords: multiplexing fsync fasync seek block superblock gapil tex img
6823 % LocalWords: second linked journaled source filesystemtype unsigned device
6824 % LocalWords: mountflags NODEV ENXIO dummy devfs magic MGC RDONLY NOSUID MOVE
6825 % LocalWords: NOEXEC SYNCHRONOUS REMOUNT MANDLOCK NODIRATIME umount MNT statfs
6826 % LocalWords: fstatfs fstab mntent ino bound orig new setpcap
6828 %%% Local Variables:
6830 %%% TeX-master: "gapil"