3 %% Copyright (C) 2000-2024 Simone Piccardi. Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
12 \chapter{La gestione di file e directory}
13 \label{cha:files_and_dirs}
15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
16 file e directory, iniziando da un approfondimento dell'architettura del
17 sistema illustrata a grandi linee in sez.~\ref{sec:file_arch_overview} ed
18 illustrando le principali caratteristiche di un filesystem e le interfacce
19 che consentono di controllarne il montaggio e lo smontaggio.
21 Esamineremo poi le funzioni di libreria che si usano per copiare, spostare e
22 cambiare i nomi di file e directory e l'interfaccia che permette la
23 manipolazione dei loro attributi. Tratteremo inoltre la struttura di base del
24 sistema delle protezioni e del controllo dell'accesso ai file e le successive
25 estensioni (\textit{Extended Attributes}, ACL, quote disco). Tutto quello che
26 riguarda invece la gestione dell'I/O sui file è lasciato al capitolo
31 \section{L'architettura della gestione dei file}
32 \label{sec:file_arch_func}
34 In questa sezione tratteremo con maggiori dettagli rispetto a quanto visto in
35 sez.~\ref{sec:file_arch_overview} il \textit{Virtual File System} di Linux e
36 come il kernel può gestire diversi tipi di filesystem, descrivendo prima le
37 caratteristiche generali di un filesystem di un sistema unix-like, per poi
38 fare una panoramica sul filesystem tradizionalmente più usato con Linux,
39 l'\acr{ext2} ed i suoi successori.
42 \subsection{Il funzionamento del \textit{Virtual File System} di Linux}
43 \label{sec:file_vfs_work}
45 % NOTE articolo interessante:
46 % http://www.ibm.com/developerworks/linux/library/l-virtual-filesystem-switch/index.html?ca=dgr-lnxw97Linux-VFSdth-LXdW&S_TACT=105AGX59&S_CMP=GRlnxw97
48 \itindbeg{Virtual~File~System~(VFS)}
50 Come illustrato brevemente in sez.~\ref{sec:file_arch_overview} in Linux il
51 concetto di \textit{everything is a file} è stato implementato attraverso il
52 \textit{Virtual File System}, la cui struttura generale è illustrata in
53 fig.~\ref{fig:file_VFS_scheme}. Il VFS definisce un insieme di funzioni che
54 tutti i filesystem devono implementare per l'accesso ai file che contengono e
55 l'interfaccia che consente di eseguire l'I/O sui file, che questi siano di
60 L'interfaccia fornita dal VFS comprende in sostanza tutte le funzioni che
61 riguardano i file, le operazioni implementate dal VFS sono realizzate con una
62 astrazione che prevede quattro tipi di oggetti strettamente correlati: i
63 filesystem, le \textit{dentry}, gli \textit{inode} ed i file. A questi oggetti
64 corrispondono una serie di apposite strutture definite dal kernel che
65 contengono come campi le funzioni di gestione e realizzano l'infrastruttura
66 del VFS. L'interfaccia è molto complessa, ne faremo pertanto una trattazione
67 estremamente semplificata che consenta di comprenderne i principi
70 Il VFS usa una tabella mantenuta dal kernel che contiene il nome di ciascun
71 filesystem supportato, quando si vuole inserire il supporto di un nuovo
72 filesystem tutto quello che occorre è chiamare la funzione
73 \code{register\_filesystem} passando come argomento la struttura
74 \kstruct{file\_system\_type} (la cui definizione è riportata in
75 fig.~\ref{fig:kstruct_file_system_type}) relativa a quel filesystem. Questa
76 verrà inserita nella tabella, ed il nuovo filesystem comparirà in
77 \procfile{/proc/filesystems}.
80 \footnotesize \centering
81 \begin{minipage}[c]{0.80\textwidth}
82 \includestruct{listati/file_system_type.h}
85 \caption{Estratto della struttura \kstructd{file\_system\_type} usata dal
86 VFS (da \texttt{include/linux/fs.h}).}
87 \label{fig:kstruct_file_system_type}
90 La struttura \kstruct{file\_system\_type}, oltre ad una serie di dati interni,
91 come il nome del tipo di filesystem nel campo \var{name},\footnote{quello che
92 viene riportato in \procfile{/proc/filesystems} e che viene usato come
93 valore del parametro dell'opzione \texttt{-t} del comando \texttt{mount} che
94 indica il tipo di filesystem.} contiene i riferimenti alle funzioni di base
95 che consentono l'utilizzo di quel filesystem. In particolare la funzione
96 \code{mount} del quarto campo è quella che verrà invocata tutte le volte che
97 si dovrà effettuare il montaggio di un filesystem di quel tipo. Per ogni nuovo
98 filesystem si dovrà allocare una di queste strutture ed inizializzare i
99 relativi campi con i dati specifici di quel filesystem, ed in particolare si
100 dovrà creare anche la relativa versione della funzione \code{mount}.
103 \itindbeg{pathname~resolution}
105 Come illustrato in fig.~\ref{fig:kstruct_file_system_type} questa funzione
106 restituisce una \textit{dentry}, abbreviazione che sta per \textit{directory
107 entry}. Le \textit{dentry} sono gli oggetti che il kernel usa per eseguire
108 la \textit{pathname resolution}, ciascuna di esse corrisponde ad un
109 \textit{pathname} e contiene il riferimento ad un \textit{inode}, che come
110 vedremo a breve è l'oggetto usato dal kernel per identificare un
111 file.\footnote{in questo caso si parla di file come di un qualunque oggetto
112 generico che sta sul filesystem e non dell'oggetto file del VFS cui
113 accennavamo prima.} La \textit{dentry} ottenuta dalla chiamata alla funzione
114 \code{mount} sarà inserita in corrispondenza al \textit{pathname} della
115 directory in cui il filesystem è stato montato.
117 % NOTA: struct dentry è dichiarata in include/linux/dcache.h
119 Le \textit{dentry} sono oggetti del VFS che vivono esclusivamente in memoria,
120 nella cosiddetta \textit{directory entry cache} (spesso chiamata in breve
121 \textit{dcache}). Ogni volta che una \textit{system call} specifica un
122 \textit{pathname} viene effettuata una ricerca nella \textit{dcache} per
123 ottenere immediatamente la \textit{dentry} corrispondente,\footnote{il buon
124 funzionamento della \textit{dcache} è in effetti di una delle parti più
125 critiche per le prestazioni del sistema.} che a sua volta ci darà, tramite
126 l'\textit{inode}, il riferimento al file.
128 Dato che normalmente non è possibile mantenere nella \textit{dcache} le
129 informazioni relative a tutto l'albero dei file la procedura della
130 \textit{pathname resolution} richiede un meccanismo con cui riempire gli
131 eventuali vuoti. Il meccanismo prevede che tutte le volte che si arriva ad una
132 \textit{dentry} mancante venga invocata la funzione \texttt{lookup}
133 dell'\textit{inode} associato alla \textit{dentry} precedente nella
134 risoluzione del \textit{pathname},\footnote{che a questo punto è una
135 directory, per cui si può cercare al suo interno il nome di un file.} il cui
136 scopo è risolvere il nome mancante e fornire la sua \textit{dentry} che a
137 questo punto verrà inserita nella cache.
139 Dato che tutte le volte che si monta un filesystem la funzione \texttt{mount}
140 (vedi sez.~\ref{sec:filesystem_mounting}) della corrispondente
141 \kstruct{file\_system\_type} inserisce la \textit{dentry} iniziale nel
142 \textit{mount point} dello stesso, si avrà comunque un punto di
143 partenza. Inoltre essendo questa \textit{dentry} relativa a quel tipo di
144 filesystem essa farà riferimento ad un \textit{inode} di quel filesystem, e
145 come vedremo questo farà sì che venga eseguita una \texttt{lookup} adatta per
146 effettuare la risoluzione dei nomi per quel filesystem.
149 \itindend{pathname~resolution}
151 % Un secondo effetto della chiamata funzione \texttt{mount} di
152 % \kstruct{file\_system\_type} è quello di allocare una struttura
153 % \kstruct{super\_block} per ciascuna istanza montata, che contiene le
154 % informazioni generali di un qualunque filesystem montato, come le opzioni di
155 % montaggio, le dimensioni dei blocchi, quando il filesystem è stato montato
156 % ecc. Fra queste però viene pure inserta, nel campo \var{s\_op}, una ulteriore
157 % struttura \kstruct{super\_operations}, il cui contenuto sono i puntatori
158 % alle funzioni di gestione di un filesystem, anche inizializzata in modo da
159 % utilizzare le versioni specifiche di quel filesystem.
161 L'oggetto più importante per il funzionamento del VFS è probabilmente
162 l'\textit{inode}, ma con questo nome si può fare riferimento a due cose
163 diverse. La prima è la struttura su disco (su cui torneremo anche in
164 sez.~\ref{sec:file_filesystem}) che fa parte della organizzazione dei dati
165 realizzata dal filesystem e che contiene le informazioni relative alle
166 proprietà (i cosiddetti \textsl{metadati}) di ogni oggetto presente su di esso
167 (si intende al solito uno qualunque dei tipi di file di
168 tab.~\ref{tab:file_file_types}).
170 La seconda è la corrispondente struttura \kstruct{inode}, della cui
171 definizione si è riportato un estratto in
172 fig.~\ref{fig:kstruct_inode}.\footnote{l'estratto fa riferimento alla versione
173 del kernel 2.6.37.} Questa struttura viene mantenuta in memoria ed è a
174 questa che facevamo riferimento quando parlavamo dell'\textit{inode} associato
175 a ciascuna \textit{dentry}. Nella struttura in memoria sono presenti gli
176 stessi \textsl{metadati} memorizzati su disco, che vengono letti quando questa
177 struttura viene allocata e trascritti all'indietro se modificati.
180 \footnotesize \centering
181 \begin{minipage}[c]{0.8\textwidth}
182 \includestruct{listati/inode.h}
185 \caption{Estratto della struttura \kstructd{inode} del kernel (da
186 \texttt{include/linux/fs.h}).}
187 \label{fig:kstruct_inode}
190 Il fatto che la struttura \kstruct{inode} sia mantenuta in memoria,
191 direttamente associata ad una \textit{dentry}, rende sostanzialmente immediate
192 le operazioni che devono semplicemente effettuare un accesso ai dati in essa
193 contenuti: è così ad esempio che viene realizzata la \textit{system call}
194 \func{stat} che vedremo in sez.~\ref{sec:file_stat}. Rispetto ai dati salvati
195 sul disco questa struttura contiene però anche quanto necessario alla
196 implementazione del VFS, ed in particolare è importante il campo \var{i\_op}
197 che, come illustrato in fig.~\ref{fig:kstruct_inode}, contiene il puntatore ad
198 una struttura di tipo \kstruct{inode\_operation}, la cui definizione si può
199 trovare nel file \texttt{include/kernel/fs.h} dei sorgenti del kernel.
201 Questa struttura non è altro che una tabella di funzioni, ogni suo membro cioè
202 è un puntatore ad una funzione e, come suggerisce il nome della struttura
203 stessa, queste funzioni sono quelle che definiscono le operazioni che il VFS
204 può compiere su un \textit{inode}. Si sono riportate in
205 tab.~\ref{tab:file_inode_operations} le più rilevanti.
210 \begin{tabular}[c]{|l|l|}
212 \textbf{Funzione} & \textbf{Operazione} \\
215 \textsl{\code{create}} & Chiamata per creare un nuovo file (vedi
216 sez.~\ref{sec:file_open_close}).\\
217 \textsl{\code{link}} & Crea un \textit{hard link} (vedi
218 sez.~\ref{sec:link_symlink_rename}).\\
219 \textsl{\code{unlink}} & Cancella un \textit{hard link} (vedi
220 sez.~\ref{sec:link_symlink_rename}).\\
221 \textsl{\code{symlink}}& Crea un collegamento simbolico (vedi
222 sez.~\ref{sec:link_symlink_rename}).\\
223 \textsl{\code{mkdir}} & Crea una directory (vedi
224 sez.~\ref{sec:file_dir_creat_rem}).\\
225 \textsl{\code{rmdir}} & Rimuove una directory (vedi
226 sez.~\ref{sec:file_dir_creat_rem}).\\
227 \textsl{\code{mknod}} & Crea un file speciale (vedi
228 sez.~\ref{sec:file_mknod}).\\
229 \textsl{\code{rename}} & Cambia il nome di un file (vedi
230 sez.~\ref{sec:link_symlink_rename}).\\
231 \textsl{\code{lookup}}& Risolve il nome di un file.\\
234 \caption{Le principali operazioni sugli \textit{inode} definite tramite
235 \kstructd{inode\_operation}.}
236 \label{tab:file_inode_operations}
239 Possiamo notare come molte di queste funzioni abbiano nomi sostanzialmente
240 identici alle varie \textit{system call} con le quali si gestiscono file e
241 directory, che tratteremo nel resto del capitolo. Quello che succede è che
242 tutte le volte che deve essere eseguita una \textit{system call}, o una
243 qualunque altra operazione su un \textit{inode} (come \texttt{lookup}) il VFS
244 andrà ad utilizzare la funzione corrispondente attraverso il puntatore
247 Sarà allora sufficiente che nella realizzazione di un filesystem si crei una
248 implementazione di queste funzioni per quel filesystem e si allochi una
249 opportuna istanza di \kstruct{inode\_operation} contenente i puntatori a dette
250 funzioni. A quel punto le strutture \kstruct{inode} usate per gli oggetti di
251 quel filesystem otterranno il puntatore alla relativa istanza di
252 \kstruct{inode\_operation} e verranno automaticamente usate le funzioni
255 Si noti però come in tab.~\ref{tab:file_inode_operations} non sia presente la
256 funzione \texttt{open} che invece è citata in
257 tab.~\ref{tab:file_file_operations}.\footnote{essa può essere comunque
258 invocata dato che nella struttura \kstruct{inode} è presente anche il
259 puntatore \var{i\_fop} alla struttura \kstruct{file\_operation} che fornisce
260 detta funzione.} Questo avviene perché su Linux l'apertura di un file
261 richiede comunque un'altra operazione che mette in gioco l'omonimo oggetto del
262 VFS: l'allocazione di una struttura di tipo \kstruct{file} che viene associata
263 ad ogni file aperto nel sistema. I motivi per cui viene usata una struttura a
264 parte sono diversi, anzitutto, come illustrato in sez.~\ref{sec:file_fd},
265 questa è necessaria per le operazioni eseguite dai processi con l'interfaccia
266 dei file descriptor. Ogni processo infatti mantiene il riferimento ad una
267 struttura \kstruct{file} per ogni file che ha aperto, ed è tramite essa che
268 esegue le operazioni di I/O. Inoltre il kernel mantiene un elenco di tutti i
269 file aperti nella \textit{file table} (torneremo su questo in
270 sez.~\ref{sec:file_fd}).
272 Inoltre se le operazioni relative agli \textit{inode} fanno riferimento ad
273 oggetti posti all'interno di un filesystem e vi si applicano quindi le
274 funzioni fornite nell'implementazione di quest'ultimo, quando si apre un file
275 questo può essere anche un file di dispositivo, ed in questo caso il VFS
276 invece di usare le operazioni fornite dal filesystem (come farebbe per un file
277 di dati) dovrà invece ricorrere a quelle fornite dal driver del dispositivo.
282 \footnotesize \centering
283 \begin{minipage}[c]{0.8\textwidth}
284 \includestruct{listati/file.h}
287 \caption{Estratto della struttura \kstructd{file} del kernel (da
288 \texttt{include/linux/fs.h}).}
289 \label{fig:kstruct_file}
292 Come si può notare dall'estratto di fig.~\ref{fig:kstruct_file}, la struttura
293 \kstruct{file} contiene, oltre ad alcune informazioni usate dall'interfaccia
294 dei file descriptor il cui significato emergerà più avanti (vedi
295 sez.~\ref{sec:file_unix_interface}), il puntatore \var{f\_op} ad una struttura
296 \kstruct{file\_operation}. Questa è l'analoga per i file di
297 \kstruct{inode\_operation}, e definisce le operazioni generiche fornite dal
298 VFS per i file. Si sono riportate in tab.~\ref{tab:file_file_operations} le
304 \begin{tabular}[c]{|l|p{8cm}|}
306 \textbf{Funzione} & \textbf{Operazione} \\
309 \textsl{\code{open}} & Apre il file (vedi
310 sez.~\ref{sec:file_open_close}).\\
311 \textsl{\code{read}} & Legge dal file (vedi sez.~\ref{sec:file_read}).\\
312 \textsl{\code{write}} & Scrive sul file (vedi
313 sez.~\ref{sec:file_write}).\\
314 \textsl{\code{llseek}} & Sposta la posizione corrente sul file (vedi
315 sez.~\ref{sec:file_lseek}).\\
316 \textsl{\code{ioctl}} & Accede alle operazioni di controllo
317 (vedi sez.~\ref{sec:file_fcntl_ioctl}).\\
318 \textsl{\code{readdir}}& Legge il contenuto di una directory (vedi
319 sez.~\ref{sec:file_dir_read}).\\
320 \textsl{\code{poll}} & Usata nell'I/O multiplexing (vedi
321 sez.~\ref{sec:file_multiplexing}).\\
322 \textsl{\code{mmap}} & Mappa il file in memoria (vedi
323 sez.~\ref{sec:file_memory_map}).\\
324 \textsl{\code{release}}& Chiamata quando l'ultimo riferimento a un file
326 \textsl{\code{fsync}} & Sincronizza il contenuto del file (vedi
327 sez.~\ref{sec:file_sync}).\\
328 \textsl{\code{fasync}} & Abilita l'I/O asincrono (vedi
329 sez.~\ref{sec:file_asyncronous_io}) sul file.\\
332 \caption{Operazioni sui file definite tramite \kstructd{file\_operation}.}
333 \label{tab:file_file_operations}
336 Anche in questo caso tutte le volte che deve essere eseguita una
337 \textit{system call} o una qualunque altra operazione sul file il VFS andrà ad
338 utilizzare la funzione corrispondente attraverso il puntatore
339 \var{f\_op}. Dato che è cura del VFS quando crea la struttura all'apertura del
340 file assegnare a \var{f\_op} il puntatore alla versione di
341 \kstruct{file\_operation} corretta per quel file, sarà possibile scrivere allo
342 stesso modo sulla porta seriale come su un normale file di dati, e lavorare
343 sui file allo stesso modo indipendentemente dal filesystem.
345 Il VFS realizza la quasi totalità delle operazioni relative ai file grazie
346 alle funzioni presenti nelle due strutture \kstruct{inode\_operation} e
347 \kstruct{file\_operation}. Ovviamente non è detto che tutte le operazioni
348 possibili siano poi disponibili in tutti i casi, ad esempio \code{llseek} non
349 sarà presente per un dispositivo come la porta seriale o per una
350 \textit{fifo}, mentre sui file del filesystem \texttt{vfat} non saranno
351 disponibili i permessi, ma resta il fatto che grazie al VFS le \textit{system
352 call} per le operazioni sui file possono restare sempre le stesse nonostante
353 le enormi differenze che possono esserci negli oggetti a cui si applicano.
356 \itindend{Virtual~File~System~(VFS)}
358 % NOTE: documentazione interessante:
359 % * sorgenti del kernel: Documentation/filesystems/vfs.txt
360 % * http://thecoffeedesk.com/geocities/rkfs.html
361 % * http://www.linux.it/~rubini/docs/vfs/vfs.html
365 \subsection{Il funzionamento di un filesystem Unix}
366 \label{sec:file_filesystem}
368 Come già accennato in sez.~\ref{sec:file_arch_overview} Linux (ed ogni sistema
369 unix-like) organizza i dati che tiene su disco attraverso l'uso di un
370 filesystem. Una delle caratteristiche di Linux rispetto agli altri Unix è
371 quella di poter supportare, grazie al VFS, una enorme quantità di filesystem
372 diversi, ognuno dei quali avrà una sua particolare struttura e funzionalità
373 proprie. Per questo non entreremo nei dettagli di un filesystem specifico, ma
374 daremo una descrizione a grandi linee che si adatta alle caratteristiche
375 comuni di qualunque filesystem di un sistema unix-like.
377 \itindbeg{superblock}
379 Una possibile strutturazione dell'informazione su un disco è riportata in
380 fig.~\ref{fig:file_disk_filesys}, dove si hanno tre filesystem su tre
381 partizioni. In essa per semplicità si è fatto riferimento alla struttura del
382 filesystem \acr{ext2}, che prevede una suddivisione dei dati in \textit{block
383 group}. All'interno di ciascun \textit{block group} viene anzitutto
384 replicato il cosiddetto \textit{superblock}, (la struttura che contiene
385 l'indice iniziale del filesystem e che consente di accedere a tutti i dati
386 sottostanti) e creata una opportuna suddivisione dei dati e delle informazioni
387 per accedere agli stessi. Sulle caratteristiche di \acr{ext2} e derivati
388 torneremo in sez.~\ref{sec:file_ext2}.
390 \itindend{superblock}
393 È comunque caratteristica comune di tutti i filesystem per Unix,
394 indipendentemente da come poi viene strutturata nei dettagli questa
395 informazione, prevedere la presenza di due tipi di risorse: gli
396 \textit{inode}, cui abbiamo già accennato in sez.~\ref{sec:file_vfs_work}, che
397 sono le strutture che identificano i singoli oggetti sul filesystem, e i
398 blocchi, che invece attengono allo spazio disco che viene messo a disposizione
399 per i dati in essi contenuti.
403 \includegraphics[width=11cm]{img/disk_struct}
404 \caption{Organizzazione dello spazio su un disco in partizioni e
406 \label{fig:file_disk_filesys}
409 Se si va ad esaminare con maggiore dettaglio la strutturazione
410 dell'informazione all'interno del filesystem \acr{ext2}, tralasciando i
411 dettagli relativi al funzionamento del filesystem stesso come la
412 strutturazione in gruppi dei blocchi, il \textit{superblock} e tutti i dati di
413 gestione possiamo esemplificare la situazione con uno schema come quello
414 esposto in fig.~\ref{fig:file_filesys_detail}.
418 \includegraphics[width=11cm]{img/filesys_struct}
419 \caption{Strutturazione dei dati all'interno di un filesystem.}
420 \label{fig:file_filesys_detail}
423 Da fig.~\ref{fig:file_filesys_detail} si evidenziano alcune delle
424 caratteristiche di base di un filesystem, che restano le stesse anche su
425 filesystem la cui organizzazione dei dati è totalmente diversa da quella
426 illustrata, e sulle quali è bene porre attenzione visto che sono fondamentali
427 per capire il funzionamento delle funzioni che manipolano i file e le
428 directory che tratteremo nel prosieguo del capitolo. In particolare è
429 opportuno tenere sempre presente che:
434 \item L'\textit{inode} contiene i cosiddetti \textsl{metadati}, vale dire le
435 informazioni riguardanti le proprietà del file come oggetto del filesystem:
436 il tipo di file, i permessi di accesso, le dimensioni, i puntatori ai
437 blocchi fisici che contengono i dati e così via. Le informazioni che la
438 funzione \func{stat} (vedi sez.~\ref{sec:file_stat}) fornisce provengono
439 dall'\textit{inode}. Dentro una directory si troverà solo il nome del file
440 e il numero dell'\textit{inode} ad esso associato; il nome non è una
441 proprietà del file e non viene mantenuto nell'\textit{inode}. Da da qui in
442 poi chiameremo il nome del file contenuto in una directory
443 ``\textsl{voce}'', come traduzione della nomenclatura inglese
444 \textit{directory entry} che non useremo per evitare confusione con le
445 \textit{dentry} del kernel viste in sez.~\ref{sec:file_vfs_work}.
447 \item Come mostrato in fig.~\ref{fig:file_filesys_detail} per i file
448 \texttt{macro.tex} e \texttt{gapil\_macro.tex}, ci possono avere più voci
449 che fanno riferimento allo stesso \textit{inode}. Fra le proprietà di un
450 file mantenute nell'\textit{inode} c'è anche il contatore con il numero di
451 riferimenti che sono stati fatti ad esso, il cosiddetto \textit{link
452 count}.\footnote{mantenuto anche nel campo \var{i\_nlink} della struttura
453 \kstruct{inode} di fig.~\ref{fig:kstruct_inode}.} Solo quando questo
454 contatore si annulla i dati del file possono essere effettivamente rimossi
455 dal disco. Per questo la funzione per cancellare un file si chiama
456 \func{unlink} (vedi sez.~\ref{sec:link_symlink_rename}), ed in realtà non
457 cancella affatto i dati del file, ma si limita ad eliminare la relativa voce
458 da una directory e decrementare il numero di riferimenti
461 \item All'interno di ogni filesystem ogni \textit{inode} è identificato da un
462 numero univoco. Il numero di \textit{inode} associato ad una voce in una
463 directory si riferisce ad questo numero e non ci può essere una directory
464 che contiene riferimenti ad \textit{inode} relativi ad altri filesystem.
465 Questa è la ragione che limita l'uso del comando \cmd{ln}, che crea una
466 nuova voce per un file esistente con la funzione \func{link} (vedi
467 sez.~\ref{sec:link_symlink_rename}), a operare su file nel filesystem
470 \item Quando si cambia nome ad un file senza cambiare filesystem il contenuto
471 del file non viene spostato fisicamente, viene semplicemente creata una
472 nuova voce per l'\textit{inode} in questione e rimossa la precedente, questa
473 è la modalità in cui opera normalmente il comando \cmd{mv} attraverso la
474 funzione \func{rename} (vedi sez.~\ref{sec:link_symlink_rename}). Questa
475 operazione non modifica minimamente neanche l'\textit{inode} del file, dato
476 che non si opera sul file ma sulla directory che lo contiene.
478 \item Gli \textit{inode} dei file, che contengono i \textsl{metadati}, ed i
479 blocchi di spazio disco, che contengono i dati, sono risorse indipendenti ed
480 in genere vengono gestite come tali anche dai diversi filesystem; è pertanto
481 possibile esaurire sia lo spazio disco (il caso più comune) che lo spazio
482 per gli \textit{inode}. Nel primo caso non sarà possibile allocare ulteriore
483 spazio, ma si potranno creare file (vuoti), nel secondo non si potranno
484 creare nuovi file, ma si potranno estendere quelli che ci
485 sono.\footnote{questo comportamento non è generale, alcuni filesystem più
486 sofisticati possono evitare il problema dell'esaurimento degli
487 \textit{inode} riallocando lo spazio disco libero per i blocchi.}
493 \includegraphics[width=12cm]{img/dir_links}
494 \caption{Organizzazione dei \textit{link} per le directory.}
495 \label{fig:file_dirs_link}
498 Infine tenga presente che, essendo file pure loro, il numero di riferimenti
499 esiste anche per le directory. Per questo se a partire dalla situazione
500 mostrata in fig.~\ref{fig:file_filesys_detail} creiamo una nuova directory
501 \file{img} nella directory \file{gapil}, avremo una situazione come quella
502 illustrata in fig.~\ref{fig:file_dirs_link}.
504 La nuova directory avrà un numero di riferimenti pari a due, in quanto è
505 referenziata dalla directory da cui si era partiti (in cui è inserita la nuova
506 voce che fa riferimento a \texttt{img}) e dalla voce interna ``\texttt{.}''
507 che è presente in ogni directory. Questo è il valore che si troverà sempre
508 per ogni directory che non contenga a sua volta altre directory. Al contempo,
509 la directory da cui si era partiti avrà un numero di riferimenti di almeno
510 tre, in quanto adesso sarà referenziata anche dalla voce ``\texttt{..}'' di
511 \texttt{img}. L'aggiunta di una sottodirectory fa cioè crescere di uno il
512 \textit{link count} della directory genitrice.
517 \subsection{Alcuni dettagli sul filesystem \acr{ext2} e successori}
518 \label{sec:file_ext2}
520 Benché non esista ``il'' filesystem di Linux, dato che esiste un supporto
521 nativo di diversi filesystem che sono in uso da anni, quello che gli avvicina
522 di più è la famiglia di filesystem evolutasi a partire dal \textit{second
523 extended filesystem}, o \acr{ext2}. Il filesystem \acr{ext2} ha subito un
524 grande sviluppo e diverse evoluzioni, fra cui l'aggiunta del
525 \textit{journaling} con il passaggio ad \acr{ext3}, che probabilmente è ancora
526 il filesystem più diffuso, ed una serie di ulteriori miglioramenti con il
527 successivo \acr{ext4}. In futuro è previsto che questo debba essere sostituito
528 da un filesystem completamente diverso, \acr{Btrfs}, che dovrebbe diventare il
529 filesystem standard di Linux, ma questo al momento è ancora in fase di
530 sviluppo.\footnote{si fa riferimento al momento dell'ultima revisione di
531 questo paragrafo, l'inizio del 2012.}
533 Il filesystem \acr{ext2} nasce come filesystem nativo per Linux a partire
534 dalle prime versioni del kernel e supporta tutte le caratteristiche di un
535 filesystem standard Unix: è in grado di gestire nomi di file lunghi (256
536 caratteri, estensibili a 1012) e supporta una dimensione massima dei file fino
537 a 4~Tb. I successivi filesystem \acr{ext3} ed \acr{ext4} sono evoluzioni di
538 questo filesystem, e sia pure con molti miglioramenti ed estensioni
539 significative ne mantengono le caratteristiche fondamentali.
541 Oltre alle caratteristiche standard, \acr{ext2} fornisce alcune estensioni che
542 non sono presenti su un classico filesystem di tipo Unix; le principali sono
545 \item gli attributi estesi (vedi sez.~\ref{sec:file_xattr}) che consentono di
546 estendere le informazioni salvabili come metadati e le ACL (vedi
547 sez.~\ref{sec:file_ACL}) che consentono di estendere il modello tradizionale
548 dei permessi sui file.
549 \item sono supportate entrambe le semantiche di BSD e SVr4 come opzioni di
550 montaggio. La semantica BSD comporta che i file in una directory sono creati
551 con lo stesso identificatore di gruppo della directory che li contiene. La
552 semantica SVr4 comporta che i file vengono creati con l'identificatore del
553 gruppo primario del processo, eccetto il caso in cui la directory ha il bit
554 di \acr{sgid} impostato (per una descrizione dettagliata del significato di
555 questi termini si veda sez.~\ref{sec:file_access_control}), nel qual caso
556 file e subdirectory ereditano sia il \ids{GID} che lo \acr{sgid}.
557 \item l'amministratore può scegliere la dimensione dei blocchi del filesystem
558 in fase di creazione, a seconda delle sue esigenze: blocchi più grandi
559 permettono un accesso più veloce, ma sprecano più spazio disco.
560 \item il filesystem implementa collegamenti simbolici veloci, in cui il nome
561 del file non è salvato su un blocco, ma tenuto all'interno
562 dell'\textit{inode} (evitando letture multiple e spreco di spazio), non
563 tutti i nomi però possono essere gestiti così per limiti di spazio (il
564 limite è 60 caratteri).
565 \item vengono supportati i cosiddetti \textit{file attributes} (vedi
566 sez.~\ref{sec:file_perm_overview}) che attivano comportamenti specifici per
567 i file su cui vengono attivati come marcarli come immutabili (che possono
568 cioè essere soltanto letti) per la protezione di file di configurazione
569 sensibili, o come \textit{append-only} (che possono essere aperti in
570 scrittura solo per aggiungere dati) per la protezione dei file di log.
573 La struttura di \acr{ext2} è stata ispirata a quella del filesystem di BSD: un
574 filesystem è composto da un insieme di blocchi, la struttura generale è quella
575 riportata in fig.~\ref{fig:file_filesys_detail}, in cui la partizione è divisa
576 in gruppi di blocchi.
578 Ciascun gruppo di blocchi contiene una copia delle informazioni essenziali del
579 filesystem (i \textit{superblock} sono quindi ridondati) per una maggiore
580 affidabilità e possibilità di recupero in caso di corruzione del
581 \textit{superblock} principale. L'utilizzo di raggruppamenti di blocchi ha
582 inoltre degli effetti positivi nelle prestazioni dato che viene ridotta la
583 distanza fra i dati e la tabella degli \textit{inode}.
587 \includegraphics[width=9cm]{img/dir_struct}
588 \caption{Struttura delle directory nel \textit{second extended filesystem}.}
589 \label{fig:file_ext2_dirs}
593 Le directory sono implementate come una \textit{linked list} con voci di
594 dimensione variabile. Ciascuna voce della lista contiene il numero di
595 \textit{inode}, la sua lunghezza, il nome del file e la sua lunghezza, secondo
596 lo schema in fig.~\ref{fig:file_ext2_dirs}; in questo modo è possibile
597 implementare nomi per i file anche molto lunghi (fino a 1024 caratteri) senza
598 sprecare spazio disco.
600 Con l'introduzione del filesystem \acr{ext3} sono state introdotte diverse
601 modifiche strutturali, la principale di queste è quella che \acr{ext3} è un
602 filesystem \textit{journaled}, è cioè in grado di eseguire una registrazione
603 delle operazioni di scrittura su un giornale (uno speciale file interno) in
604 modo da poter garantire il ripristino della coerenza dei dati del
605 filesystem\footnote{si noti bene che si è parlato di dati \textsl{del}
606 filesystem, non di dati \textsl{nel} filesystem, quello di cui viene
607 garantito un veloce ripristino è relativo ai dati della struttura interna
608 del filesystem, non di eventuali dati contenuti nei file che potrebbero
609 essere stati persi.} in brevissimo tempo in caso di interruzione improvvisa
610 della corrente o di crollo del sistema che abbia causato una interruzione
611 della scrittura dei dati sul disco.
613 Oltre a questo \acr{ext3} introduce ulteriori modifiche volte a migliorare
614 sia le prestazioni che la semplicità di gestione del filesystem, in
615 particolare per le directory si è passato all'uso di alberi binari con
616 indicizzazione tramite \textit{hash} al posto delle \textit{linked list} che
617 abbiamo illustrato, ottenendo un forte guadagno di prestazioni in caso di
618 directory contenenti un gran numero di file.
620 % TODO (bassa priorità) portare a ext3, ext4 e btrfs ed illustrare le
621 % problematiche che si possono incontrare (in particolare quelle relative alla
622 % perdita di contenuti in caso di crash del sistema)
623 % TODO (media priorità) trattare btrfs quando sarà usato come stabile
626 \subsection{La gestione dell'uso dei filesystem}
627 \label{sec:filesystem_mounting}
629 Come accennato in sez.~\ref{sec:file_arch_overview} per poter accedere ai file
630 occorre rendere disponibile al sistema il filesystem su cui essi sono
631 memorizzati. L'operazione di attivazione del filesystem è chiamata
632 \textsl{montaggio} e per far questo in Linux si usa la funzione di sistema
633 \funcd{mount}, il cui prototipo è:\footnote{la funzione è una versione
634 specifica di Linux che usa la omonima \textit{system call} e non è
639 \fdecl{mount(const char *source, const char *target, const char
641 \phantom{mount(}unsigned long mountflags, const void *data)}
642 \fdesc{Monta un filesystem.}
644 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
645 caso \var{errno} assumerà uno dei valori:
647 \item[\errcode{EACCES}] non si ha il permesso di accesso su uno dei
648 componenti del \textit{pathname}, o si è cercato di montare un filesystem
649 disponibile in sola lettura senza aver specificato \const{MS\_RDONLY} o il
650 device \param{source} è su un filesystem montato con l'opzione
652 \item[\errcode{EBUSY}] \param{source} è già montato, o non può essere
653 rimontato in sola lettura perché ci sono ancora file aperti in scrittura,
654 o non può essere montato su \param{target} perché la directory è ancora in
656 \item[\errcode{EINVAL}] il dispositivo \param{source} presenta un
657 \textit{superblock} non valido, o si è cercato di rimontare un filesystem
658 non ancora montato, o di montarlo senza che \param{target} sia un
659 \textit{mount point} o di spostarlo quando \param{target} non è un
660 \textit{mount point} o è la radice o si è usato un valore di
661 \param{mountflags} non valido.
662 \item[\errcode{ELOOP}] si è cercato di spostare un \textit{mount point} su
663 una sottodirectory di \param{source} o si sono incontrati troppi
664 collegamenti simbolici nella risoluzione di un nome.
665 \item[\errcode{EMFILE}] in caso di filesystem virtuale, la tabella dei
666 dispositivi fittizi (chiamati \textit{dummy} nella documentazione inglese)
668 \item[\errcode{ENODEV}] il tipo \param{filesystemtype} non esiste o non è
669 configurato nel kernel.
670 \item[\errcode{ENOTBLK}] non si è usato un \textit{block device} per
671 \param{source} quando era richiesto.
672 \item[\errcode{ENXIO}] il \textit{major number} del
673 dispositivo \param{source} è sbagliato.
674 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
676 ed inoltre \errval{EFAULT}, \errval{ENOMEM}, \errval{ENAMETOOLONG},
677 \errval{ENOENT}, \errval{ENOTDIR} nel loro significato generico.}
680 \itindbeg{mount~point}
682 L'uso più comune della funzione è quello di montare sulla directory indicata
683 da \param{target}, detta \textit{mount point}, il filesystem contenuto nel
684 file di dispositivo indicato da \param{source}. In entrambi i casi, come
685 daremo per assunto da qui in avanti tutte le volte che si parla di directory o
686 file nel passaggio di un argomento di una funzione, si intende che questi
687 devono essere indicati con la stringa contenente il loro \textit{pathname}.
689 Normalmente un filesystem è contenuto su un disco o una partizione, ma come
690 illustrato in sez.~\ref{sec:file_vfs_work} la struttura del \textit{Virtual
691 File System} è estremamente flessibile e può essere usata anche per oggetti
692 diversi da un disco. Ad esempio usando il \textit{loop device} si può montare
693 un file qualunque (come l'immagine di un CD-ROM o di un floppy) che contiene
694 l'immagine di un filesystem, inoltre alcuni tipi di filesystem, come
695 \texttt{proc} o \texttt{sysfs} sono virtuali e non hanno un supporto che ne
696 contenga i dati che sono generati al volo dal kernel ad ogni lettura, e
697 inviati al kernel ad ogni scrittura (costituiscono quindi un meccanismo di
698 comunicazione, attraverso l'ordinaria interfaccia dei file, con il kernel).
700 Il tipo di filesystem che si vuole montare è specificato
701 dall'argomento \param{filesystemtype}, che deve essere una delle stringhe
702 riportate nel file \procfilem{/proc/filesystems} che, come accennato in
703 sez.~\ref{sec:file_vfs_work}, contiene l'elenco dei filesystem supportati dal
704 kernel. Nel caso si sia indicato un filesystem virtuale, che non è associato a
705 nessun file di dispositivo, il contenuto di \param{source} viene ignorato.
707 L'argomento \param{data} viene usato per passare le impostazioni relative alle
708 caratteristiche specifiche di ciascun filesystem. Si tratta di una stringa di
709 parole chiave (separate da virgole e senza spazi) che indicano le cosiddette
710 ``\textsl{opzioni}'' del filesystem che devono essere impostate; in genere
711 viene usato direttamente il contenuto del parametro dell'opzione \texttt{-o}
712 del comando \texttt{mount}. I valori utilizzabili dipendono dal tipo di
713 filesystem e ciascuno ha i suoi, pertanto si rimanda alla documentazione della
714 pagina di manuale di questo comando e dei singoli filesystem.
716 Dopo l'esecuzione della funzione il contenuto del filesystem viene reso
717 disponibile nella directory specificata come \textit{mount point} ed il
718 precedente contenuto di detta directory viene mascherato dal contenuto della
719 directory radice del filesystem montato. Fino ai kernel della serie 2.2.x non
720 era possibile montare un filesystem se un \textit{mount point} era già in uso,
721 coi kernel successivi è possibile montare più filesystem sullo stesso
722 \textit{mount point} impilandoli l'uno sull'altro, anche in questo caso vale
723 quanto appena detto, e solo il contenuto dell'ultimo filesystem montato sarà
724 visibile, mascherando quelli sottostanti.
726 In realtà quella di montare un filesystem è solo una delle operazioni che si
727 possono effettuare con \func{mount}, la funzione infatti è dedicata a tutte le
728 operazioni relative alla gestione del montaggio dei filesystem e dei
729 \textit{mount point}. Ad esempio fin dalle sue origini poteva essere
730 utilizzata per effettuare il rimontaggio di un filesystem con opzioni diverse,
731 ed a partire dal kernel 2.4.x è divenuto possibile usarla per spostare
732 atomicamente un \textit{mount point} da una directory ad un'altra, per montare
733 lo stesso filesystem in diversi \textit{mount point}, per montare una
734 directory su un'altra (il cosiddetto \textit{bind mount}).
736 \itindend{mount~point}
738 Il tipo di operazione compiuto da \func{mount} viene stabilito in base al
739 valore dell'argomento \param{mountflags}, che oltre alla selezione del tipo di
740 operazione da compiere, consente anche di indicare alcune opzioni generiche
741 valide per qualunque filesystem.\footnote{benché queste siano espresse nel
742 comando \cmd{mount} con l'opzione \texttt{-o} esse non vengono impostate nei
743 valori di \param{data}, che serve solo per le opzioni specifiche di ogni
744 filesystem.} Il valore dell'argomento deve essere espresso come maschera
745 binaria e i vari bit che lo compongono, detti anche \textit{mount flags},
746 devono essere impostati con un OR aritmetico dei valori dalle opportune
747 costanti che illustreremo a breve.
749 In Linux \param{mountflags} deve essere un intero a 32 bit;
750 fino ai kernel della serie 2.2.x i 16 più significativi avevano un valore
751 riservato che doveva essere specificato obbligatoriamente,\footnote{il valore
752 era il \textit{magic number} \code{0xC0ED}, si può usare la costante
753 \constd{MS\_MGC\_MSK} per ottenere la parte di \param{mountflags} riservata
754 al \textit{magic number}, mentre per specificarlo si può dare un OR
755 aritmetico con la costante \constd{MS\_MGC\_VAL}.} e si potevano usare solo
756 i 16 meno significativi. Oggi invece, con un numero di opzioni superiore, sono
757 utilizzati tutti e 32 i bit, ma qualora nei 16 più significativi sia presente
758 detto valore, che non esprime una combinazione valida, esso viene ignorato.
760 Come accennato il tipo di operazione eseguito da \func{mount} viene stabilito
761 in base al contenuto di \param{mountflags}, la scelta viene effettuata
762 controllando nell'ordine:
764 \item se è presente il flag \const{MS\_REMOUNT}, nel qual caso verrà eseguito
765 il rimontaggio del filesystem, con le nuove opzioni indicate da \param{data}
766 e dagli altri flag di \param{mountflags};
767 \item se è presente il flag \const{MS\_BIND}, nel qual caso verrà eseguito un
768 \textit{bind mount} (argomento che tratteremo più avanti);
769 \item se è presente uno fra \const{MS\_SHARED}, \const{MS\_PRIVATE},
770 \const{MS\_SLAVE}, \const{MS\_UNBINDABLE}, nel qual caso verrà cambiata la
771 modalità di propagazione del montaggio (detti valori sono mutualmente
773 \item se è presente \const{MS\_MOVE}, nel qual caso verrà effettuato uno
774 spostamento del \textit{mount point};
775 \item se nessuno dei precedenti è presente si tratta di una ordinaria
776 operazione di montaggio di un filesystem.
779 Il fatto che questi valori vengano controllati in quest'ordine significa che
780 l'effetto di alcuni di questi flag possono cambiare se usati in combinazione
781 con gli altri che vengono prima nella sequenza (è quanto avviene ad esempio
782 per \const{MS\_BIND} usato con \const{MS\_REMOUNT}). Tratteremo questi
783 \textit{mount flags} speciali per primi, nell'ordine appena illustrato,
784 tornando sugli altri più avanti.
786 Usando il flag \constd{MS\_REMOUNT} si richiede a \func{mount} di rimontare un
787 filesystem già montato cambiandone le opzioni di montaggio in maniera atomica
788 (non è cioè necessario smontare e rimontare il filesystem per effettuare il
789 cambiamento). Questa operazione consente di modificare le opzioni del
790 filesystem anche se questo è in uso. Gli argomenti \param{source} e
791 \param{target} devono essere gli stessi usati per il montaggio originale,
792 mentre sia \param{data} che \param{mountflags} conterranno le nuove opzioni,
793 \param{filesystemtype} viene ignorato. Perché l'operazione abbia successo
794 occorre comunque che il cambiamento sia possibile (ad esempio non sarà
795 possibile rimontare in sola lettura un filesystem su cui sono aperti file per
796 la lettura/scrittura).
798 Qualunque opzione specifica del filesystem indicata con \param{data} può
799 essere modificata (ma si dovranno rielencare tutte quelle volute), mentre con
800 \param{mountflags} possono essere modificate solo alcune opzioni generiche:
801 \const{MS\_LAZYTIME}, \const{MS\_MANDLOCK}, \const{MS\_NOATIME},
802 \const{MS\_NODEV}, \const{MS\_NODIRATIME}, \const{MS\_NOEXEC},
803 \const{MS\_NOSUID}, \const{MS\_RELATIME}, \const{MS\_RDONLY},
804 \const{MS\_STRICTATIME} e \const{MS\_SYNCHRONOUS}. Inoltre dal kernel 3.17 il
805 comportamento relativo alle opzioni che operano sui tempi di ultimo accesso
806 dei file (vedi sez.~\ref{sec:file_file_times}) è cambiato e se non si è
807 indicato nessuno dei vari \texttt{MS\_*ATIME} vengono mantenute le
808 impostazioni esistenti anziché forzare l'uso di \const{MS\_RELATIME}.
810 \itindbeg{bind~mount}
812 Usando il flag \constd{MS\_BIND} si richiede a \func{mount} di effettuare un
813 cosiddetto \textit{bind mount}, l'operazione che consente di montare una
814 directory di un filesystem in un'altra directory. L'opzione è disponibile a
815 partire dai kernel della serie 2.4. In questo caso verranno presi in
816 considerazione solo gli argomenti \param{source}, che stavolta indicherà la
817 directory che si vuole montare e non un file di dispositivo, e \param{target}
818 che indicherà la directory su cui verrà effettuato il \textit{bind mount}. Gli
819 argomenti \param{filesystemtype} e \param{data} vengono ignorati.
821 Quello che avviene con questa operazione è che in corrispondenza del
822 \textit{pathname} indicato da \param{target} viene montato l'\textit{inode} di
823 \param{source}, così che la porzione di albero dei file presente sotto
824 \param{source} diventi visibile allo stesso modo sotto
825 \param{target}. Trattandosi esattamente dei dati dello stesso filesystem, ogni
826 modifica fatta in uno qualunque dei due rami di albero sarà visibile
827 nell'altro, visto che entrambi faranno riferimento agli stessi \textit{inode}.
829 Dal punto di vista del VFS l'operazione è analoga al montaggio di un
830 filesystem proprio nel fatto che anche in questo caso si inserisce in
831 corrispondenza della \textit{dentry} di \texttt{target} un diverso
832 \textit{inode}, che stavolta, invece di essere quello della radice del
833 filesystem indicato da un file di dispositivo, è quello di una directory già
836 Si tenga presente che proprio per questo sotto \param{target} comparirà il
837 contenuto che è presente sotto \param{source} all'interno del filesystem in
838 cui quest'ultima è contenuta. Questo potrebbe non corrispondere alla porzione
839 di albero che sta sotto \param{source} qualora in una sottodirectory di
840 quest'ultima si fosse effettuato un altro montaggio. In tal caso infatti nella
841 porzione di albero sotto \param{source} si troverebbe il contenuto del nuovo
842 filesystem (o di un altro \textit{bind mount}) mentre sotto \param{target} ci
843 sarebbe il contenuto presente nel filesystem originale.
845 L'unico altro \textit{mount flag} usabile direttamente con \const{MS\_BIND} è
846 \const{MS\_REC} che consente di eseguire una operazione di \textit{bind mount}
847 ricorsiva, in cui sotto \param{target} vengono montati ricorsivamente anche
848 tutti gli eventuali ulteriori \textit{bind mount} già presenti sotto
851 E' però possibile, a partire dal kernel 2.6.26, usare questo flag insieme a
852 \const{MS\_REMOUNT}, nel qual caso consente di effettuare una modifica delle
853 opzioni di montaggio del \textit{bind mount} ed in particolare effettuare il
854 cosiddetto \textit{read-only bind mount} in cui viene onorata anche la
855 presenza aggiuntiva del flag \const{MS\_RDONLY}. In questo modo si ottiene che
856 l'accesso ai file sotto \param{target} sia effettuabile esclusivamente in sola
857 lettura, mantenendo il normale accesso in lettura/scrittura sotto
860 Il supporto per il \textit{bind mount} consente di superare i limiti presenti
861 per gli \textit{hard link} (di cui parleremo in
862 sez.~\ref{sec:link_symlink_rename}) con la possibilità di fare riferimento
863 alla porzione dell'albero dei file di un filesystem presente a partire da una
864 certa directory utilizzando una qualunque altra directory, anche se questa sta
865 su un filesystem diverso.\footnote{e non c'è neanche il problema di non esser
866 più in grado di cancellare un \textit{hard link} ad una directory sullo
867 stesso filesystem (vedi sez.~\ref{sec:link_symlink_rename}), per cui su
868 Linux questi non sono possibili, dato che in questo caso per la rimozione
869 del collegamento basta smontare \param{target}.} Si può così fornire una
870 alternativa all'uso dei collegamenti simbolici (di cui parleremo in
871 sez.~\ref{sec:link_symlink_rename}) che funziona correttamente anche
872 all'intero di un \textit{chroot} (argomento su cui torneremo in
873 sez.~\ref{sec:file_chroot}).
875 \itindend{bind~mount}
876 \itindbeg{shared~subtree}
878 I quattro flag \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
879 \const{MS\_UNBINDABLE} sono stati introdotti a partire dal kernel 2.6.15 per
880 realizzare l'infrastruttura dei cosiddetti \textit{shared subtree}, che
881 estendono le funzionalità dei \textit{bind mount}. La funzionalità nasce
882 dalle esigenze di poter utilizzare a pieno le funzionalità di isolamento
883 fornite dal kernel per i processi (i \textit{namespace}, che tratteremo in
884 sez.~\ref{sec:process_namespaces}) in particolare per quanto riguarda la
885 possibilità di far avere ad un processo una visione ristretta dei filesystem
886 montati (il \textit{mount namespace}), ma l'applicazione è comunque rilevante
887 anche con un classico \textit{chroot} (vedi sez.~\ref{sec:file_chroot}).
891 Abbiamo visto come nella modalità ordinaria in cui si esegue un
892 \textit{bind mount} sotto \param{target} compaia lo stesso ramo di albero dei
893 file presente sotto \param{source}, ma limitato a quanto presente nel
894 filesystem di \param{source}; i risultati di un eventuale
895 ``\textit{submount}'' effettuato all'interno di \param{source} non saranno
896 visibili. Ed anche se quelli presenti al momento dell'uso di \const{MS\_BIND}
897 possono essere riottenuti usando \const{MS\_REC}, ogni eventuale
898 ``\textit{submount}'' successivo (che avvenga sotto \param{source} o sotto
899 \param{target}) resterà ``\textsl{privato}'' al ramo di albero su cui è
903 \itindbeg{mount peer group}
905 Ci sono casi però in cui può risultare utile che eventuali
906 ``\textit{submount}'' siano visibili sui rami di albero presenti al di sotto
907 di tutte le directory coinvolte in un \textit{bind mount}, anche se effettuati
908 in un secondo tempo. Per poter ottenere questa funzionalità i
909 \textit{bind mount} sono stati estesi introducendo i \textit{mount peer
910 group}, che consentono di raggrupparli in modo da poter inviare a ciascuno
911 di essi tutti gli eventi relativi a montaggi o smontaggi effettuati al loro
912 interno ed avere sempre una propagazione degli stessi che li renda coerenti.
914 Quando si effettua un montaggio ordinario, o si esegue un \textit{bind mount},
915 di default non viene utilizzato nessun \textit{mount peer group} ed il
916 \textit{mount point} viene classificato come ``\textsl{privato}'', nel senso
917 che abbiamo appena visto. Si può però marcare un \textit{mount point} come
918 ``\textsl{condiviso}'', ed in questo modo esso verrà associato ad un
919 \textit{mount peer group} insieme a tutti gli altri ulteriori \textit{mount
920 point} per i quali sia stato eseguito un \textit{bind mount}. Questo fa sì
921 che tutte le volte che si effettua un montaggio o uno smontaggio all'interno
922 di uno qualunque dei \textit{mount point} del gruppo, questo venga propagato
923 anche su tutti gli altri e sotto tutti sia visibile sempre lo stesso ramo di
926 A completare l'infrastruttura degli \textit{shared subtree} sono state
927 previste due ulteriori funzionalità: la prima è quella di marcare un
928 \textit{mount point} come ``\textit{slave}'', in tal caso le operazioni di
929 montaggio e smontaggio effettuate al suo interno non verranno più propagate
930 agli altri membri del \textit{mount peer group} di cui fa parte, ma continuerà
931 a ricevere quelle eseguite negli altri membri.
933 La seconda funzionalità è quella di marcare un \textit{mount point} come
934 ``\textit{unbindable}''; questo anzitutto impedirà che possa essere usato come
935 sorgente di un \textit{bind mount} ed inoltre lo renderà privato, con la
936 conseguenza che quando è presente all'interno di altri \textit{bind mount},
937 all'interno di questi si vedrà solo il contenuto originale e non quello
938 risultante da eventuali ulteriori montaggi effettuati al suo interno.
940 \itindend{mount peer group}
942 I \textit{mount flag} che controllano le operazioni relative agli
943 \textit{shared subtree} sono descritti nella lista seguente. Si ricordi che
944 sono mutuamente esclusivi, e compatibili solo con l'uso degli ulteriori flag
945 \const{MS\_REC} (che applica ricorsivamente l'operazione a tutti gli eventuali
946 \textit{mount point} sottostanti) e \const{MS\_SILENT}; in tutti gli altri
947 casi \func{mount} fallirà con un errore di \errval{EINVAL}. L'unico altro
948 argomento che deve essere specificato quando li si usano è \param{target};
949 \param{source}, \param{data} e \param{filesystem} sono ignorati.
951 \begin{basedescript}{\desclabelwidth{1.9cm}\desclabelstyle{\nextlinelabel}}
953 \item[\constd{MS\_PRIVATE}] Marca un \textit{mount point} come \textit{private
954 mount}. Di default, finché non lo si marca altrimenti con una delle altre
955 opzioni dell'interfaccia, ogni \textit{mount point} è privato. Ogni
956 \textit{bind mount} ottenuto da un \textit{mount point} privato si comporta
957 come descritto nella trattazione di \const{MS\_BIND}. Si usa questo flag
958 principalmente per revocare gli effetti delle altre opzioni e riportare il
959 comportamento a quello ordinario.
961 \item[\constd{MS\_SHARED}] Marca un \textit{mount point} come \textit{shared
962 mount}. Lo scopo dell'opzione è ottenere che tutti i successivi
963 \textit{bind mount} ottenuti da un \textit{mount point} così marcato siano
964 di tipo \textit{shared} e vengano inseriti nello stesso \textit{mount peer
965 group} in modo da ``\textsl{condividere}'' ogni ulteriore operazione di
966 montaggio o smontaggio. Con questa opzione le operazioni di montaggio e
967 smontaggio effettuate al di sotto di uno \textit{shared mount} vengono
968 automaticamente ``\textsl{propagate}'' a tutti gli altri membri del
969 \textit{mount peer group} di cui fa parte, in modo che la sezione di albero
970 dei file visibile al di sotto di ciascuno di essi sia sempre la stessa.
972 \item[\constd{MS\_SLAVE}] Marca un \textit{mount point} come \textit{slave
973 mount}. Se il \textit{mount point} è parte di un \textit{mount peer group}
974 esso diventerà di tipo \textit{slave}: le operazioni di montaggio e
975 smontaggio al suo interno non verranno più propagate agli altri membri del
976 gruppo, ma continuerà a ricevere quelle eseguite negli altri membri. Se non
977 esistono altri membri nel gruppo il \textit{mount point} diventerà privato,
978 negli altri casi non subirà nessun cambiamento.
980 \item[\constd{MS\_UNBINDABLE}] Marca un \textit{mount point} come
981 \textit{unbindable mount}. Un \textit{mount point} marcato in questo modo
982 non può essere usato per un \textit{bind mount} del suo contenuto. Si
983 comporta cioè come allo stesso modo di un \textit{mount point} ordinario di
984 tipo \textit{private} con in più la restrizione che nessuna sua
985 sottodirectory (anche se relativa ad un ulteriore montaggio) possa essere
986 utilizzata come sorgente di un \textit{bind mount}.
989 \itindend{shared~subtree}
991 L'ultimo \textit{mount flag} che controlla una modalità operativa di
992 \func{mount} è \constd{MS\_MOVE}, che consente di effettuare lo spostamento
993 del \textit{mount point} di un filesystem. La directory del \textit{mount
994 point} originale deve essere indicata nell'argomento \param{source}, e la
995 sua nuova posizione nell'argomento \param{target}. Tutti gli altri argomenti
996 della funzione vengono ignorati.
998 Lo spostamento avviene atomicamente, ed il ramo di albero presente sotto
999 \param{source} sarà immediatamente visibile sotto \param{target}. Non esiste
1000 cioè nessun momento in cui il filesystem non risulti montato in una o
1001 nell'altra directory e pertanto è garantito che la risoluzione di
1002 \textit{pathname} relativi all'interno del filesystem non possa fallire.
1004 Elenchiamo infine i restanti \textit{mount flag}, il cui utilizzo non attiene
1005 alle operazioni di \func{mount}, ma soltanto l'impostazione di opzioni
1006 generiche relative al funzionamento di un filesystem e che vengono per lo più
1007 utilizzati solo in fase di montaggio:
1009 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
1010 \item[\constd{MS\_DIRSYNC}] Richiede che ogni modifica al contenuto di una
1011 directory venga immediatamente registrata su disco in maniera sincrona
1012 (introdotta a partire dai kernel della serie 2.6). L'opzione si applica a
1013 tutte le directory del filesystem, ma su alcuni filesystem è possibile
1014 impostarla a livello di singole directory o per i sotto-rami di una directory
1015 con il comando \cmd{chattr}.\footnote{questo avviene tramite delle opportune
1016 \texttt{ioctl} (vedi sez.~\ref{sec:file_fcntl_ioctl}).}
1018 Questo consente di ridurre al minimo il rischio di perdita dei dati delle
1019 directory in caso di crollo improvviso del sistema, al costo di una certa
1020 perdita di prestazioni dato che le funzioni di scrittura relative ad
1021 operazioni sulle directory non saranno più bufferizzate e si bloccheranno
1022 fino all'arrivo dei dati sul disco prima che un programma possa proseguire.
1024 \item[\constd{MS\_LAZYTIME}] Modifica la modalità di registrazione di tempi
1025 dei file (vedi sez.~\ref{sec:file_file_times}) per ridurre al massimo gli
1026 accessi a disco (particolarmente utile per i portatili). Attivandolo i tempi
1027 dei file vengono mantenuti in memoria e vengono salvati su disco solo in
1028 quattro casi: quando c'è da eseguire un aggiornamento dei dati
1029 dell'\textit{inode} per altri motivi, se viene usata una delle funzioni di
1030 sincronizzazione dei dati su disco (vedi sez.~\ref{sec:file_sync}), se
1031 l'\textit{inode} viene rimosso dalla memoria, o se è passato un giorno
1032 dall'ultima registrazione. Introdotto a partire dal kernel 4.0.
1034 In questo modo si possono ridurre significativamente le scritture su disco
1035 mantenendo tutte le informazioni riguardo ai tempi dei file, riducendo anche
1036 l'impatto dell'uso di \const{MS\_STRICTATIME}. Il costo da pagare è il
1037 rischio, in caso di crash del sistema, di avere dati vecchi fino a 24 ore
1038 per quel che riguarda i tempi dei file.
1040 \item[\constd{MS\_MANDLOCK}] Consente l'uso del \textit{mandatory locking}
1041 (vedi sez.~\ref{sec:file_mand_locking}) sui file del filesystem. Per poterlo
1042 utilizzare effettivamente però esso dovrà essere comunque attivato
1043 esplicitamente per i singoli file impostando i permessi come illustrato in
1044 sez.~\ref{sec:file_mand_locking}.
1046 \item[\constd{MS\_NOATIME}] Viene disabilitato sul filesystem l'aggiornamento
1047 dell'\textit{access time} (vedi sez.~\ref{sec:file_file_times}) per
1048 qualunque tipo di file. Dato che l'aggiornamento dell'\textit{access time} è
1049 una funzionalità la cui utilità è spesso irrilevante ma comporta un costo
1050 elevato visto che una qualunque lettura comporta comunque una scrittura su
1051 disco, questa opzione consente di disabilitarla completamente. La soluzione
1052 può risultare troppo drastica dato che l'informazione viene comunque
1053 utilizzata da alcuni programmi, per cui nello sviluppo del kernel sono state
1054 introdotte altre opzioni che forniscono soluzioni più appropriate e meno
1057 \item[\constd{MS\_NODEV}] Viene disabilitato sul filesystem l'accesso ai file
1058 di dispositivo eventualmente presenti su di esso. L'opzione viene usata come
1059 misura di precauzione per rendere inutile la presenza di eventuali file di
1060 dispositivo su filesystem che non dovrebbero contenerne.\footnote{si ricordi
1061 che le convenzioni del \textit{Linux Filesystem Hierarchy Standard}
1062 richiedono che questi siano mantenuti esclusivamente sotto \texttt{/dev}.}
1064 Viene utilizzata, assieme a \const{MS\_NOEXEC} e \const{MS\_NOSUID}, per
1065 fornire un accesso più controllato a quei filesystem di cui gli utenti hanno
1066 il controllo dei contenuti, in particolar modo quelli posti su dispositivi
1067 rimuovibili. In questo modo si evitano alla radice possibili situazioni in
1068 cui un utente malizioso inserisce su uno di questi filesystem dei file di
1069 dispositivo con permessi ``opportunamente'' ampliati che gli consentirebbero
1070 di accedere anche a risorse cui non dovrebbe.
1072 \item[\constd{MS\_NODIRATIME}] Viene disabilitato sul filesystem
1073 l'aggiornamento dell'\textit{access time} (vedi
1074 sez.~\ref{sec:file_file_times}) ma soltanto per le directory. Costituisce
1075 una alternativa per \const{MS\_NOATIME}, che elimina l'informazione per le
1076 directory, che in pratica che non viene mai utilizzata, mantenendola per i
1077 file in cui invece ha un impiego, sia pur limitato.
1079 \item[\constd{MS\_NOEXEC}] Viene disabilitata sul filesystem l'esecuzione di un
1080 qualunque file eseguibile eventualmente presente su di esso. L'opzione viene
1081 usata come misura di precauzione per rendere impossibile l'uso di programmi
1082 posti su filesystem che non dovrebbero contenerne.
1084 Anche in questo caso viene utilizzata per fornire un accesso più controllato
1085 a quei filesystem di cui gli utenti hanno il controllo dei contenuti. Da
1086 questo punto di vista l'opzione è meno importante delle analoghe
1087 \const{MS\_NODEV} e \const{MS\_NOSUID} in quanto l'esecuzione di un
1088 programma creato dall'utente pone un livello di rischio nettamente
1089 inferiore, ed è in genere consentita per i file contenuti nella sua home
1090 directory.\footnote{cosa che renderebbe superfluo l'attivazione di questa
1091 opzione, il cui uso ha senso solo per ambienti molto controllati in cui si
1092 vuole che gli utenti eseguano solo i programmi forniti
1093 dall'amministratore.}
1095 \item[\constd{MS\_NOSUID}] Viene disabilitato sul filesystem l'effetto dei bit
1096 dei permessi \acr{suid} e \acr{sgid} (vedi sez.~\ref{sec:file_special_perm})
1097 eventualmente presenti sui file in esso contenuti. L'opzione viene usata
1098 come misura di precauzione per rendere inefficace l'effetto di questi bit
1099 per filesystem in cui non ci dovrebbero essere file dotati di questi
1102 Di nuovo viene utilizzata, analogamente a \const{MS\_NOEXEC} e
1103 \const{MS\_NODEV}, per fornire un accesso più controllato a quei filesystem
1104 di cui gli utenti hanno il controllo dei contenuti. In questo caso si evita
1105 che un utente malizioso possa inserire su uno di questi filesystem un
1106 eseguibile con il bit \acr{suid} attivo e di proprietà dell'amministratore o
1107 di un altro utente, che gli consentirebbe di eseguirlo per conto di
1110 \item[\constd{MS\_RDONLY}] Esegue il montaggio del filesystem in sola lettura,
1111 non sarà possibile nessuna modifica ai suoi contenuti. Viene usato tutte le
1112 volte che si deve accedere ai contenuti di un filesystem con la certezza che
1113 questo non venga modificato (ad esempio per ispezionare un filesystem
1114 corrotto). All'avvio di default il kernel monta la radice in questa
1115 modalità. Si tenga presente che se non viene indicato il filesystem verrà
1116 montato, o rimontato nel caso lo si usi con \const{MS\_REMOUNT}, in
1117 lettura/scrittura; questo significa in sostanza che non esiste una opzione
1118 separata per indicare il montaggio in lettura/scrittura.
1120 \item[\constd{MS\_REC}] Applica ricorsivamente a tutti i \textit{mount point}
1121 presenti al di sotto del \textit{mount point} indicato gli effetti della
1122 opzione degli \textit{shared subtree} associata. In questo caso l'argomento
1123 \param{target} deve fare riferimento ad un \textit{mount point} e tutti gli
1124 altri argomenti sono ignorati, ed il flag deve essere indicato con uno fra
1125 \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
1126 \const{MS\_UNBINDABLE}. Può anche essere usato con \const{MS\_BIND} per
1127 richiedere il montaggio ricorsivo anche degli eventuali ulteriori
1128 \textit{bind mount} presenti sotto \param{target}.
1130 \item[\constd{MS\_RELATIME}] Indica di effettuare l'aggiornamento
1131 dell'\textit{access time} sul filesystem soltanto quando questo risulti
1132 antecedente il valore corrente del \textit{modification time} o del
1133 \textit{change time} (per i tempi dei file si veda
1134 sez.~\ref{sec:file_file_times}). L'opzione è disponibile a partire dal
1135 kernel 2.6.20, mentre dal 2.6.30 questo è diventato il comportamento di
1136 default del sistema, che può essere riportato a quello tradizionale con
1137 l'uso di \const{MS\_STRICTATIME}. Sempre dal 2.6.30 il comportamento è stato
1138 anche modificato e l'\textit{access time} viene comunque aggiornato se è più
1139 vecchio di un giorno.
1141 L'opzione consente di evitare i problemi di prestazioni relativi
1142 all'aggiornamento dell'\textit{access time} senza avere impatti negativi
1143 riguardo le funzionalità, il comportamento adottato infatti consente di
1144 rendere evidente che vi è stato un accesso dopo la scrittura, ed evitando al
1145 contempo ulteriori operazioni su disco negli accessi successivi. In questo
1146 modo l'informazione relativa al fatto che un file sia stato letto resta
1147 disponibile, ed i programmi che ne fanno uso continuano a funzionare. Con
1148 l'introduzione di questo comportamento l'uso delle alternative
1149 \const{MS\_NOATIME} e \const{MS\_NODIRATIME} è sostanzialmente inutile.
1151 \item[\constd{MS\_SILENT}] Richiede la soppressione di alcuni messaggi di
1152 avvertimento nei log del kernel (vedi sez.~\ref{sec:sess_daemon}). L'opzione
1153 è presente a partire dal kernel 2.6.17 e sostituisce, utilizzando un nome
1154 non fuorviante, la precedente \const{MS\_VERBOSE}, introdotta nel kernel
1155 2.6.12, che aveva lo stesso effetto.
1157 \item[\constd{MS\_STRICTATIME}] Ripristina il comportamento tradizionale per
1158 cui l'\textit{access time} viene aggiornato ad ogni accesso al
1159 file. L'opzione è disponibile solo a partire dal kernel 2.6.30 quando il
1160 comportamento di default del kernel è diventato quello fornito da
1161 \const{MS\_RELATIME}.
1163 \item[\constd{MS\_SYNCHRONOUS}] Abilita la scrittura sincrona richiedendo che
1164 ogni modifica al contenuto del filesystem venga immediatamente registrata su
1165 disco. Lo stesso comportamento può essere ottenuto con il flag
1166 \const{O\_SYNC} di \func{open} (vedi sez.~\ref{sec:file_open_close}).
1168 Questa opzione consente di ridurre al minimo il rischio di perdita dei dati
1169 in caso di crollo improvviso del sistema, al costo di una pesante perdita di
1170 prestazioni dato che tutte le funzioni di scrittura non saranno più
1171 bufferizzate e si bloccheranno fino all'arrivo dei dati sul disco. Per un
1172 compromesso in cui questo comportamento avviene solo per le directory, ed ha
1173 quindi una incidenza nettamente minore, si può usare \const{MS\_DIRSYNC}.
1177 % NOTE: per l'opzione \texttt{lazytime} introdotta con il kernel 4.0,
1178 % vedi http://lwn.net/Articles/621046/
1180 % NOTE per \const{MS\_SLAVE},\const{MS\_SHARE}, \const{MS\_PRIVATE} e
1181 % \const{MS\_UNBINDABLE} dal 2.6.15 vedi shared subtrees, in particolare
1182 % * http://lwn.net/Articles/159077/ e
1183 % * Documentation/filesystems/sharedsubtree.txt
1185 % TODO: (bassa priorità) trattare mount_setattr, vedi
1186 % https://lwn.net/Articles/896255/
1188 % TODO: (bassa priorità) non documentati ma presenti in sys/mount.h:
1196 Una volta che non si voglia più utilizzare un certo filesystem è possibile
1197 ``\textsl{smontarlo}'' usando la funzione di sistema \funcd{umount}, il cui
1202 \fdecl{umount(const char *target)}
1203 \fdesc{Smonta un filesystem.}
1205 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1206 nel qual caso \var{errno} assumerà uno dei valori:
1208 \item[\errcode{EBUSY}] il filesystem è occupato.
1209 \item[\errcode{EINVAL}] \param{target} non è un \textit{mount point}.
1210 \item[\errcode{EPERM}] il processo non ha i privilegi di
1211 amministratore.\footnotemark
1213 ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
1214 \errval{ENOENT}, \errval{ENOMEM} nel loro significato generico. }
1217 \footnotetext{più precisamente la capacità \const{CAP\_SYS\_ADMIN}, vedi
1218 sez.~\ref{sec:proc_capabilities}.}
1220 La funzione prende il nome della directory su cui il filesystem è montato e
1221 non il file o il dispositivo che è stato montato,\footnote{questo è vero a
1222 partire dal kernel 2.3.99-pre7, prima esistevano due chiamate separate e la
1223 funzione poteva essere usata anche specificando il file di dispositivo.} in
1224 quanto a partire dai kernel della serie 2.4.x è possibile montare lo stesso
1225 dispositivo in più punti. Nel caso più di un filesystem sia stato montato
1226 sullo stesso \textit{mount point} viene smontato quello che è stato montato
1227 per ultimo. Si tenga presente che la funzione fallisce se il filesystem è
1228 ``\textsl{occupato}'', cioè quando ci sono ancora dei file aperti sul
1229 filesystem, se questo contiene la directory di lavoro (vedi
1230 sez.~\ref{sec:file_work_dir}) di un qualunque processo o il \textit{mount
1231 point} di un altro filesystem.
1233 Linux provvede inoltre una seconda funzione di sistema, \funcd{umount2}, che
1234 consente un maggior controllo delle operazioni, come forzare lo smontaggio di
1235 un filesystem anche quando questo risulti occupato; il suo prototipo è:
1239 \fdecl{umount2(const char *target, int flags)}
1240 \fdesc{Smonta un filesystem.}
1242 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1243 nel qual caso \var{errno} assumerà uno dei valori:
1245 \item[\errcode{EAGAIN}] si è chiamata la funzione con \const{MNT\_EXPIRE}
1246 ed il filesystem non era occupato.
1247 \item[\errcode{EBUSY}] \param{target} è la directory di lavoro di qualche
1248 processo, o contiene dei file aperti, o un altro \textit{mount point}.
1249 \item[\errcode{EINVAL}] \param{target} non è un \textit{mount point} o si
1250 è usato \const{MNT\_EXPIRE} con \const{MNT\_FORCE} o
1251 \const{MNT\_DETACH} o si è specificato un flag non esistente.
1253 e tutti gli altri valori visti per \func{umount} con lo stesso significato.}
1256 Il valore di \param{flags} è una maschera binaria dei flag che controllano le
1257 modalità di smontaggio, che deve essere specificato con un OR aritmetico delle
1258 costanti illustrate in tab.~\ref{tab:umount2_flags}. Specificando
1259 \constd{MNT\_FORCE} la funzione cercherà di liberare il filesystem anche se è
1260 occupato per via di una delle condizioni descritte in precedenza. A seconda
1261 del tipo di filesystem alcune (o tutte) possono essere superate, evitando
1262 l'errore di \errcode{EBUSY}. In tutti i casi prima dello smontaggio viene
1263 eseguita una sincronizzazione dei dati.
1268 \begin{tabular}[c]{|l|p{8cm}|}
1270 \textbf{Costante} & \textbf{Descrizione}\\
1273 \const{MNT\_FORCE} & Forza lo smontaggio del filesystem anche se questo è
1274 occupato (presente dai kernel della serie 2.2).\\
1275 \const{MNT\_DETACH} & Esegue uno smontaggio ``\textsl{pigro}'', in cui si
1276 blocca l'accesso ma si aspetta che il filesystem si
1277 liberi (presente dal kernel 2.4.11 e dalla
1278 \acr{glibc} 2.11).\\
1279 \const{MNT\_EXPIRE} & Se non occupato marca un \textit{mount point} come
1280 ``\textsl{in scadenza}'' in modo che ad una
1281 successiva chiamata senza utilizzo del filesystem
1282 questo venga smontato (presente dal
1283 kernel 2.6.8 e dalla \acr{glibc} 2.11).\\
1284 \const{UMOUNT\_NOFOLLOW}& Non dereferenzia \param{target} se questo è un
1285 collegamento simbolico (vedi
1286 sez.~\ref{sec:link_symlink_rename}) evitando
1287 problemi di sicurezza (presente dal kernel
1291 \caption{Costanti che identificano i bit dell'argomento \param{flags}
1292 della funzione \func{umount2}.}
1293 \label{tab:umount2_flags}
1296 Con l'opzione \constd{MNT\_DETACH} si richiede invece uno smontaggio
1297 ``\textsl{pigro}'' (o \textit{lazy umount}) in cui il filesystem diventa
1298 inaccessibile per i nuovi processi subito dopo la chiamata della funzione, ma
1299 resta accessibile per quelli che lo hanno ancora in uso e non viene smontato
1300 fintanto che resta occupato.
1302 Con \constd{MNT\_EXPIRE}, che non può essere specificato insieme agli altri
1303 due, si marca il \textit{mount point} di un filesystem non occupato come
1304 ``\textsl{in scadenza}'', in tal caso \func{umount2} ritorna con un errore di
1305 \errcode{EAGAIN}, mentre in caso di filesystem occupato si sarebbe ricevuto
1306 \errcode{EBUSY}. Una volta marcato, se nel frattempo non viene fatto nessun
1307 uso del filesystem, ad una successiva chiamata con \const{MNT\_EXPIRE} questo
1308 verrà smontato. Questo flag consente di realizzare un meccanismo che smonti
1309 automaticamente i filesystem che restano inutilizzati per un certo periodo di
1312 Infine il flag \constd{UMOUNT\_NOFOLLOW} non dereferenzia \param{target} se
1313 questo è un collegamento simbolico (vedi
1314 sez.~\ref{sec:link_symlink_rename}). Questa è una misura di sicurezza
1315 introdotta per evitare, per quei filesystem per il quale è prevista una
1316 gestione diretta da parte degli utenti, come quelli basati su \itindex{FUSE}
1317 FUSE,\footnote{il \textit{Filesystem in USEr space} (FUSE) è una delle più
1318 interessanti applicazioni del VFS che consente, tramite un opportuno modulo,
1319 di implementarne le funzioni in \textit{user space}, così da rendere
1320 possibile l'implementazione di un qualunque filesystem (con applicazioni di
1321 grande interesse come il filesystem cifrato \textit{encfs} o il filesystem
1322 di rete \textit{sshfs}) che possa essere usato direttamente per conto degli
1323 utenti.} che si possano passare ai programmi che effettuano lo smontaggio
1324 dei filesystem, che in genere sono privilegiati ma consentono di agire solo
1325 sui propri \textit{mount point}, dei collegamenti simbolici che puntano ad
1326 altri \textit{mount point}, ottenendo così la possibilità di smontare
1327 qualunque filesystem.
1330 Altre due funzioni di sistema specifiche di Linux,\footnote{esse si trovano
1331 anche su BSD, ma con una struttura diversa.} utili per ottenere in maniera
1332 diretta informazioni riguardo al filesystem su cui si trova un certo file,
1333 sono \funcd{statfs} e \funcd{fstatfs}, i cui prototipi sono:
1337 \fdecl{int statfs(const char *path, struct statfs *buf)}
1338 \fdecl{int fstatfs(int fd, struct statfs *buf)}
1339 \fdesc{Restituiscono informazioni relative ad un filesystem.}
1341 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
1342 nel qual caso \var{errno} assumerà uno dei valori:
1344 \item[\errcode{ENOSYS}] il filesystem su cui si trova il file specificato
1345 non supporta la funzione.
1346 \end{errlist} ed inoltre \errval{EFAULT} ed \errval{EIO} per entrambe,
1347 \errval{EBADF} per \func{fstatfs}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
1348 \errval{ENOENT}, \errval{EACCES}, \errval{ELOOP} per \func{statfs} nel loro
1349 significato generico.}
1352 Queste funzioni permettono di ottenere una serie di informazioni generali
1353 riguardo al filesystem su cui si trova il file specificato con un
1354 \textit{pathname} per \func{statfs} e con un file descriptor (vedi
1355 sez.~\ref{sec:file_fd}) per \func{statfs}. Le informazioni vengono restituite
1356 all'indirizzo \param{buf} di una struttura \struct{statfs} definita come in
1357 fig.~\ref{fig:sys_statfs}, ed i campi che sono indefiniti per il filesystem in
1358 esame sono impostati a zero. I valori del campo \var{f\_type} sono definiti
1359 per i vari filesystem nei relativi file di header dei sorgenti del kernel da
1360 costanti del tipo \var{XXX\_SUPER\_MAGIC}, dove \var{XXX} in genere è il nome
1361 del filesystem stesso.
1363 \begin{figure}[!htb]
1364 \footnotesize \centering
1365 \begin{minipage}[c]{0.8\textwidth}
1366 \includestruct{listati/statfs.h}
1369 \caption{La struttura \structd{statfs}.}
1370 \label{fig:sys_statfs}
1373 \conffilebeg{/etc/mtab}
1375 La \acr{glibc} provvede infine una serie di funzioni per la gestione dei due
1376 file \conffiled{/etc/fstab}\footnote{più precisamente \funcm{setfsent},
1377 \funcm{getfsent}, \funcm{getfsfile}, \funcm{getfsspec}, \funcm{endfsent}.}
1378 ed \conffile{/etc/mtab}\footnote{più precisamente \funcm{setmntent},
1379 \funcm{getmntent},\funcm{getmntent\_r}, \funcm{addmntent},\funcm{endmntent},
1380 \funcm{hasmntopt}.} che convenzionalmente sono usati in quasi tutti i
1381 sistemi unix-like per mantenere rispettivamente le informazioni riguardo ai
1382 filesystem da montare e a quelli correntemente montati. Le funzioni servono a
1383 leggere il contenuto di questi file in opportune strutture \structd{fstab} e
1384 \structd{mntent}, e, nel caso di \conffile{/etc/mtab}, per inserire e
1385 rimuovere le voci presenti nel file.
1387 In generale si dovrebbero usare queste funzioni, in particolare quelle
1388 relative a \conffile{/etc/mtab}, quando si debba scrivere un programma che
1389 effettua il montaggio di un filesystem. In realtà in questi casi è molto più
1390 semplice invocare direttamente il programma \cmd{mount}. Inoltre l'uso stesso
1391 di \conffile{/etc/mtab} è considerato una pratica obsoleta, in quanto se non
1392 aggiornato correttamente (cosa che è impossibile se la radice è montata in
1393 sola lettura) il suo contenuto diventa fuorviante.
1395 Per questo motivo il suo utilizzo viene deprecato ed in molti casi viene già
1396 oggi sostituito da un collegamento simbolico a \procfile{/proc/mounts}, che
1397 contiene una versione degli stessi contenuti (vale a dire l'elenco dei
1398 filesystem montati) generata direttamente dal kernel, e quindi sempre
1399 disponibile e sempre aggiornata. Per questo motivo tralasceremo la
1400 trattazione, di queste funzioni, rimandando al manuale della \acr{glibc}
1401 \cite{GlibcMan} per la documentazione completa.
1403 \conffileend{/etc/mtab}
1405 % TODO (bassa priorità) scrivere delle funzioni (getfsent e getmntent &C)
1406 % TODO (bassa priorità) documentare ? swapon e swapoff (man 2 ...)
1408 % TODO con il 5.2 è stata introdotta una serie di nuove syscall per montare un
1409 % filesystem, vedi https://lwn.net/Articles/759499/ e
1410 % https://git.kernel.org/linus/f1b5618e013a
1413 \section{La gestione di file e directory}
1414 \label{sec:file_dir}
1416 In questa sezione esamineremo le funzioni usate per la manipolazione dei nomi
1417 file e directory, per la creazione di collegamenti simbolici e diretti, per la
1418 gestione e la lettura delle directory. In particolare ci soffermeremo sulle
1419 conseguenze che derivano dalla architettura di un filesystem unix-like
1420 illustrata in sez.~\ref{sec:file_filesystem} per quanto attiene il
1421 comportamento e gli effetti delle varie funzioni. Tratteremo infine la
1422 directory di lavoro e le funzioni per la gestione di file speciali e
1426 \subsection{La gestione dei nomi dei file}
1427 \label{sec:link_symlink_rename}
1429 % \subsection{Le funzioni \func{link} e \func{unlink}}
1430 % \label{sec:file_link}
1432 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
1433 dei nomi alternativi, come gli alias del vecchio MacOS o i collegamenti di
1434 Windows o i nomi logici del VMS, che permettono di fare riferimento allo
1435 stesso file chiamandolo con nomi diversi o accedendovi da directory diverse.
1436 Questo è possibile anche in ambiente Unix, dove un nome alternativo viene
1437 usualmente chiamato ``\textsl{collegamento}'' (o \textit{link}). Data
1438 l'architettura del sistema riguardo la gestione dei file vedremo però che ci
1439 sono due metodi sostanzialmente diversi per fare questa operazione.
1441 \itindbeg{hard~link}
1442 \index{collegamento!diretto|(}
1444 In sez.~\ref{sec:file_filesystem} abbiamo spiegato come la capacità di
1445 chiamare un file con nomi diversi sia connaturata con l'architettura di un
1446 filesystem per un sistema Unix, in quanto il nome del file che si trova in una
1447 directory è solo un'etichetta associata ad un puntatore che permette di
1448 ottenere il riferimento ad un \textit{inode}, e che è quest'ultimo che viene
1449 usato dal kernel per identificare univocamente gli oggetti sul filesystem.
1451 Questo significa che fintanto che si resta sullo stesso filesystem la
1452 realizzazione di un \textit{link} è immediata: uno stesso file può avere tanti
1453 nomi diversi, dati da altrettante associazioni diverse allo stesso
1454 \textit{inode} effettuate tramite ``etichette'' diverse in directory
1455 diverse. Si noti anche come nessuno di questi nomi possa assumere una
1456 particolare preferenza o originalità rispetto agli altri, in quanto tutti
1457 fanno comunque riferimento allo stesso \textit{inode} e quindi tutti
1458 otterranno lo stesso file.
1460 Quando si vuole aggiungere ad una directory una voce che faccia riferimento ad
1461 un file già esistente come appena descritto, per ottenere quello che viene
1462 denominato ``\textsl{collegamento diretto}'' (o \textit{hard link}), si deve
1463 usare la funzione di sistema \funcd{link}, il cui prototipo è:
1467 \fdecl{int link(const char *oldpath, const char *newpath)}
1468 \fdesc{Crea un nuovo collegamento diretto (\textit{hard link}).}
1470 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1471 nel qual caso \var{errno} assumerà uno dei valori:
1473 \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
1475 \item[\errcode{EMLINK}] ci sono troppi collegamenti al file \param{oldpath}
1476 (il numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
1477 sez.~\ref{sec:sys_limits}).
1478 \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
1479 \param{newpath} non supporta i collegamenti diretti, è una directory o per
1480 \param{oldpath} non si rispettano i criteri per i \textit{protected
1481 hardlink}.\footnotemark
1482 \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
1483 riferimento ad un filesystem montato sullo stesso
1484 \textit{mount point}.
1485 \end{errlist} ed inoltre \errval{EACCES}, \errval{EDQUOT}, \errval{EFAULT},
1486 \errval{EIO}, \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1487 \errval{ENOMEM}, \errval{ENOSPC}, \errval{ENOTDIR}, \errval{EROFS} nel loro
1488 significato generico.}
1491 \footnotetext{i \textit{protected hardlink} sono una funzionalità di
1492 protezione introdotta con il kernel 3.16 (si veda
1493 sez.~\ref{sec:procadv_security_misc} per i dettagli) che limita la capacità
1494 di creare un \textit{hard link} ad un file qualunque.}
1496 La funzione crea in \param{newpath} un collegamento diretto al file indicato
1497 da \param{oldpath}. Per quanto detto la creazione di un nuovo collegamento
1498 diretto non copia il contenuto del file, ma si limita a creare la voce
1499 specificata da \param{newpath} nella directory corrispondente e l'unica
1500 proprietà del file che verrà modificata sarà il numero di riferimenti al file
1501 (il campo \var{i\_nlink} della struttura \kstruct{inode}, vedi
1502 fig.~\ref{fig:kstruct_inode}) che verrà aumentato di uno. In questo modo lo
1503 stesso file potrà essere acceduto sia con \param{newpath} che
1504 con \param{oldpath}.
1506 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
1507 collegamento diretto è possibile solo se entrambi i \textit{pathname} sono
1508 nello stesso filesystem ed inoltre esso deve supportare gli \textit{hard link}
1509 (il meccanismo non è disponibile ad esempio con il filesystem \acr{vfat} di
1510 Windows). In realtà la funzione ha un ulteriore requisito, e cioè che non solo
1511 che i due file siano sullo stesso filesystem, ma anche che si faccia
1512 riferimento ad essi all'interno dello stesso \textit{mount point}.\footnote{si
1513 tenga presente infatti, come detto in sez.~\ref{sec:filesystem_mounting},
1514 che a partire dal kernel 2.4 uno stesso filesystem può essere montato più
1515 volte su directory diverse.}
1516 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
1517 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
1518 l'amministratore è in grado di creare un collegamento diretto ad un'altra
1519 directory: questo viene fatto perché con una tale operazione è possibile
1520 creare dei \textit{loop} nel filesystem (vedi fig.~\ref{fig:file_link_loop})
1521 la cui rimozione diventerebbe piuttosto complicata.\footnote{occorrerebbe
1522 infatti eseguire il programma \cmd{fsck} per riparare il filesystem, perché
1523 in caso di \textit{loop} la directory non potrebbe essere più svuotata,
1524 contenendo comunque se stessa, e quindi non potrebbe essere rimossa.}
1526 Data la pericolosità di questa operazione, e visto che i collegamenti
1527 simbolici (che tratteremo a breve) ed i \textit{bind mount} (già visti in
1528 sez.~\ref{sec:filesystem_mounting}) possono fornire la stessa funzionalità
1529 senza questi problemi, nel caso di Linux questa capacità è stata completamente
1530 disabilitata, e al tentativo di creare un collegamento diretto ad una
1531 directory la funzione \func{link} restituisce sempre l'errore \errcode{EPERM}.
1533 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
1534 \textit{hard link} ad un collegamento simbolico. In questo caso lo standard
1535 POSIX.1-2001 prevederebbe che quest'ultimo venga risolto e che il collegamento
1536 sia effettuato rispetto al file cui esso punta, e che venga riportato un
1537 errore qualora questo non esista o non sia un file. Questo era anche il
1538 comportamento iniziale di Linux ma a partire dai kernel della serie
1539 2.0.x\footnote{per la precisione il comportamento era quello previsto dallo
1540 standard POSIX fino al kernel di sviluppo 1.3.56, ed è stato temporaneamente
1541 ripristinato anche durante lo sviluppo della serie 2.1.x, per poi tornare al
1542 comportamento attuale fino ad oggi (per riferimento si veda
1543 \url{http://lwn.net/Articles/293902}).} è stato adottato un comportamento
1544 che non segue più lo standard per cui l'\textit{hard link} viene creato nei
1545 confronti del collegamento simbolico, e non del file cui questo punta. La
1546 revisione POSIX.1-2008 lascia invece il comportamento dipendente
1547 dall'implementazione, cosa che rende Linux conforme a questa versione
1548 successiva dello standard.
1550 \itindbeg{symbolic~link}
1551 \index{collegamento!simbolico|(}
1553 La ragione di questa differenza rispetto al vecchio standard, presente anche
1554 in altri sistemi unix-like, è dovuta al fatto che un collegamento simbolico
1555 può fare riferimento anche ad un file non esistente o a una directory, per i
1556 quali l'\textit{hard link} non può essere creato, per cui la scelta di seguire
1557 il collegamento simbolico è stata ritenuta una scelta scorretta nella
1558 progettazione dell'interfaccia. Infatti se non ci fosse il comportamento
1559 adottato da Linux sarebbe impossibile creare un \textit{hard link} ad un
1560 collegamento simbolico, perché la funzione lo risolverebbe e l'\textit{hard
1561 link} verrebbe creato verso la destinazione. Invece evitando di seguire lo
1562 standard l'operazione diventa possibile, ed anche il comportamento della
1563 funzione risulta molto più comprensibile. Tanto più che se proprio se si vuole
1564 creare un \textit{hard link} rispetto alla destinazione di un collegamento
1565 simbolico è sempre possibile farlo direttamente.\footnote{ciò non toglie che
1566 questo comportamento possa causare problemi, come nell'esempio descritto
1567 nell'articolo citato nella nota precedente, a programmi che non si aspettano
1568 questa differenza rispetto allo standard POSIX.}
1570 Dato che \func{link} crea semplicemente dei nomi che fanno riferimenti agli
1571 \textit{inode}, essa può funzionare soltanto per file che risiedono sullo
1572 stesso filesystem e solo per un filesystem di tipo Unix. Inoltre abbiamo
1573 visto che in Linux non è consentito eseguire un collegamento diretto ad una
1576 Per ovviare a queste limitazioni, come accennato all'inizio, i sistemi
1577 unix-like supportano un'altra forma di collegamento, detta
1578 ``\textsl{collegamento simbolico}'' (o anche \textit{soft link} o
1579 \textit{symbolic link}). In questo caso si tratta, come avviene in altri
1580 sistemi operativi, di file speciali che contengono semplicemente il
1581 riferimento ad un altro file (o directory). In questo modo è possibile
1582 effettuare \textit{link} anche attraverso filesystem diversi, a file posti in
1583 filesystem che non supportano i collegamenti diretti, a delle directory, ed
1584 anche a file che non esistono ancora.
1586 \itindend{hard~link}
1587 \index{collegamento!diretto|)}
1589 Il meccanismo funziona in quanto i \textit{symbolic link} sono riconosciuti
1590 come tali dal kernel\footnote{è uno dei diversi tipi di file visti in
1591 tab.~\ref{tab:file_file_types}, contrassegnato come tale nell'\textit{inode}
1592 e riconoscibile dal valore del campo \var{st\_mode} della struttura
1593 \struct{stat} (vedi sez.~\ref{sec:file_stat}).} e tutta una serie di
1594 funzioni di sistema (come \func{open} o \func{stat}) quando ricevono come
1595 argomento il \textit{pathname} di un collegamento simbolico vanno
1596 automaticamente ad operare sul file da esso specificato. La funzione di
1597 sistema che permette di creare un nuovo collegamento simbolico è
1598 \funcd{symlink}, ed il suo prototipo è:
1602 \fdecl{int symlink(const char *oldpath, const char *newpath)}
1603 \fdesc{Crea un nuovo collegamento simbolico (\textit{symbolic link}).}
1605 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1606 nel qual caso \var{errno} assumerà uno dei valori:
1608 \item[\errcode{EACCES}] o non si hanno i permessi sulla directory in cui
1609 creare il \textit{link}.
1610 \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
1611 \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
1612 \param{oldpath} è una stringa vuota.
1613 \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
1614 supporta i collegamenti simbolici.
1615 \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
1617 \end{errlist} ed inoltre \errval{EDQUOT}, \errval{EFAULT}, \errval{EIO},
1618 \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOMEM}, \errval{ENOSPC} e
1619 \errval{ENOTDIR} nel loro significato generico.}
1623 La funzione crea un nuovo collegamento simbolico \param{newpath} che fa
1624 riferimento ad \param{oldpath}. Si tenga presente che la funzione non
1625 effettua nessun controllo sull'esistenza di un file di nome \param{oldpath},
1626 ma si limita ad inserire il \textit{pathname} nel collegamento
1627 simbolico. Pertanto un collegamento simbolico può anche riferirsi ad un file
1628 che non esiste ed in questo caso si ha quello che viene chiamato un
1629 \itindex{dangling~link} \textit{dangling link}, letteralmente un
1630 \index{collegamento!ciondolante} ``\textsl{collegamento ciondolante}''. Ad
1631 esempio possiamo usare il comando \cmd{ln} per creare un collegamento
1632 simbolico nella nostra directory con:
1634 piccardi@hain:~/gapil$ \textbf{ln -s /tmp/tmp_file symlink}
1637 e questo avrà successo anche se \file{/tmp/tmp\_file} non esiste:
1639 piccardi@hain:~/gapil$ \textbf{ls symlink}
1643 ma questo può generare confusione, perché accedendo in lettura a
1644 \file{symlink}, ad esempio con \cmd{cat}, otterremmo:
1646 piccardi@hain:~/gapil$ \textbf{cat symlink}
1647 cat: symlink: No such file or directory
1650 con un errore che può sembrare sbagliato, dato che \cmd{ls} ci ha mostrato in
1651 precedenza l'esistenza di \file{symlink}. Se invece andassimo a scrivere su
1652 \file{symlink}, l'effetto sarebbe quello di ottenere la creazione di
1653 \file{/tmp/tmp\_file} (che a quel punto verrebbe creato) senza errori.
1655 Come accennato i collegamenti simbolici sono risolti automaticamente dal
1656 kernel all'invocazione delle varie \textit{system call}. In
1657 tab.~\ref{tab:file_symb_effect} si è riportato un elenco dei comportamenti
1658 delle varie funzioni di sistema che operano sui file nei confronti della
1659 risoluzione dei collegamenti simbolici, specificando quali li seguono e quali
1660 invece possono operare direttamente sui loro contenuti.
1664 \begin{tabular}[c]{|l|c|c|}
1666 \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
1669 \func{access} & $\bullet$ & -- \\
1670 \func{chdir} & $\bullet$ & -- \\
1671 \func{chmod} & $\bullet$ & -- \\
1672 \func{chown} & -- & $\bullet$ \\
1673 \func{creat} & $\bullet$ & -- \\
1674 \func{exec} & $\bullet$ & -- \\
1675 \func{lchown} & $\bullet$ & -- \\
1676 \func{link}\footnotemark & -- & $\bullet$ \\
1677 \func{lstat} & -- & $\bullet$ \\
1678 \func{mkdir} & $\bullet$ & -- \\
1679 \func{mkfifo} & $\bullet$ & -- \\
1680 \func{mknod} & $\bullet$ & -- \\
1681 \func{open} & $\bullet$ & -- \\
1682 \func{opendir} & $\bullet$ & -- \\
1683 \func{pathconf} & $\bullet$ & -- \\
1684 \func{readlink} & -- & $\bullet$ \\
1685 \func{remove} & -- & $\bullet$ \\
1686 \func{rename} & -- & $\bullet$ \\
1687 \func{stat} & $\bullet$ & -- \\
1688 \func{truncate} & $\bullet$ & -- \\
1689 \func{unlink} & -- & $\bullet$ \\
1692 \caption{Uso dei collegamenti simbolici da parte di alcune funzioni.}
1693 \label{tab:file_symb_effect}
1696 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
1697 dallo standard POSIX.1-2001.}
1699 Si noti che non si è specificato il comportamento delle funzioni che operano
1700 con i file descriptor (che tratteremo nel prossimo capitolo), in quanto la
1701 risoluzione del collegamento simbolico viene in genere effettuata dalla
1702 funzione che restituisce il file descriptor (normalmente la \func{open}, vedi
1703 sez.~\ref{sec:file_open_close}) e tutte le operazioni seguenti fanno
1704 riferimento solo a quest'ultimo.
1706 Si tenga anche presente che a partire dal kernel 3.16, se si abilita la
1707 funzionalità dei \textit{protected symlinks} (attiva di default in tutte le
1708 distribuzioni più recenti) la risoluzione dei nomi attraverso un collegamento
1709 simbolico può fallire per una serie di restrizione di sicurezza aggiuntive
1710 imposte dal meccanismo (si consulti sez.~\ref{sec:procadv_security_misc} per i
1713 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
1714 \func{open} seguono i collegamenti simbolici, occorrono funzioni apposite per
1715 accedere alle informazioni del collegamento invece che a quelle del file a cui
1716 esso fa riferimento. Quando si vuole leggere il contenuto di un collegamento
1717 simbolico si usa la funzione di sistema \funcd{readlink}, il cui prototipo è:
1721 \fdecl{int readlink(const char *pathname, char *buff, size\_t size)}
1722 \fdesc{Legge il contenuto di un collegamento simbolico.}
1724 {La funzione ritorna il numero di caratteri letti dentro \param{buff} in caso
1725 di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà uno
1728 \item[\errcode{EACCES}] non si hanno i permessi di attraversamento di una
1729 delle directory del pathname
1730 \item[\errcode{EINVAL}] \param{pathname} non è un collegamento simbolico
1731 o \param{size} non è positiva.
1732 \end{errlist} ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
1733 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}
1734 nel loro significato generico.}
1737 La funzione legge il \textit{pathname} a cui fa riferimento il collegamento
1738 simbolico indicato dall'argomento \param{pathname} scrivendolo sul buffer
1739 \param{buff} di dimensione \param{size}. Si tenga presente che la funzione non
1740 termina la stringa con un carattere nullo e che se questa è troppo lunga la
1741 tronca alla dimensione specificata da \param{size} per evitare di scrivere
1742 dati oltre le dimensioni del buffer.
1746 \includegraphics[width=8cm]{img/link_loop}
1747 \caption{Esempio di loop nel filesystem creato con un collegamento
1749 \label{fig:file_link_loop}
1752 Come accennato uno dei motivi per cui non sono consentiti \textit{hard link}
1753 alle directory è che questi possono creare dei \textit{loop} nella risoluzione
1754 dei nomi che non possono essere eliminati facilmente. Invece è sempre
1755 possibile, ed in genere anche molto utile, creare un collegamento simbolico ad
1756 una directory, anche se in questo caso si potranno ottenere anche dei
1759 La situazione è illustrata in fig.~\ref{fig:file_link_loop}, che riporta la
1760 struttura della directory \file{/boot}. Come si vede si è creato al suo
1761 interno un collegamento simbolico che punta di nuovo a
1762 \file{/boot}.\footnote{il \textit{loop} mostrato in
1763 fig.~\ref{fig:file_link_loop} è stato usato per poter permettere a al
1764 \textit{bootloader} \cmd{grub} di vedere i file contenuti nella directory
1765 \file{/boot} con lo stesso \textit{pathname} con cui verrebbero visti dal
1766 sistema operativo, anche quando si trovano, come accade spesso, su una
1767 partizione separata (che \cmd{grub} all'avvio vedrebbe come \file{/}).} Un
1768 \textit{loop} di di questo tipo però può causare problemi per tutti i
1769 programmi che effettuano la scansione di una directory, e ad esempio se
1770 lanciassimo un comando come \code{grep -r linux *}, il \textit{loop} nella
1771 directory porterebbe ad esaminare \file{/boot}, \file{/boot/boot},
1772 \file{/boot/boot/boot} e così via.
1774 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
1775 un \textit{pathname} possano essere seguiti fino ad un certo numero massimo di
1776 collegamenti simbolici, il cui valore limite è specificato dalla costante
1777 \constd{MAXSYMLINKS}. Se il limite viene superato si ha un errore ed
1778 \var{errno} viene impostata al valore \errcode{ELOOP}, che nella quasi
1779 totalità dei casi indica appunto che si è creato un collegamento simbolico che
1780 fa riferimento ad una directory del suo stesso \textit{pathname}.
1783 \itindend{symbolic~link}
1784 \index{collegamento!simbolico|)}
1786 Un'altra funzione relativa alla gestione dei nomi dei file, anche se a prima
1787 vista parrebbe riguardare un argomento completamente diverso, è quella per la
1788 cancellazione di un file. In realtà una \textit{system call} che serva proprio
1789 a cancellare un file non esiste neanche perché, come accennato in
1790 sez.~\ref{sec:file_filesystem}, quando in un sistema unix-like si richiede la
1791 rimozione di un file, quello che si va a cancellare è soltanto la voce che
1792 referenzia il suo \textit{inode} all'interno di una directory.
1794 La funzione di sistema che consente di effettuare questa operazione, il cui
1795 nome come si può notare ha poco a che fare con il concetto di rimozione, è
1796 \funcd{unlink}, ed il suo prototipo è:
1800 \fdecl{int unlink(const char *pathname)}
1801 \fdesc{Cancella un file.}
1803 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1804 nel qual caso \var{errno} assumerà uno dei valori:\footnotemark
1806 \item[\errcode{EACCES}] non si ha il permesso di scrittura sulla directory
1807 che contiene \param{pathname} o quello di attraversamento per una delle
1808 directory superiori.
1809 \item[\errcode{EBUSY}] \param{pathname} non può essere rimosso perché è in
1810 uso da parte del sistema (in particolare per i cosiddetti \textit{silly
1812 \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una
1814 \item[\errcode{EPERM}] il filesystem non consente l'operazione, o la
1815 directory che contiene \param{pathname} ha lo \textit{sticky bit} e non si
1816 è il proprietario del file o non si hanno privilegi amministrativi.
1817 \end{errlist} ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
1818 \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EROFS} nel loro
1819 significato generico.}
1822 \footnotetext{questa funzione su Linux ha alcune peculiarità nei codici di
1823 errore, in particolare riguardo la rimozione delle directory che non è mai
1824 permessa e che causa l'errore \errcode{EISDIR}; questo è un valore specifico
1825 di Linux non conforme allo standard POSIX che prescrive invece l'uso di
1826 \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
1827 abbia privilegi sufficienti, valore che invece Linux usa anche se il
1828 filesystem non supporta la funzione, inoltre il codice \errcode{EBUSY} nel
1829 caso la directory sia occupata su Linux non esiste.}
1831 La funzione elimina il nome specificato dall'argomento \param{pathname} nella
1832 directory che lo contiene e decrementa il numero di riferimenti nel relativo
1833 \textit{inode}; come per \func{link} queste due operazioni sono effettuate
1834 all'interno della \textit{system call} in maniera atomica rispetto ai
1837 Si ricordi che, anche se se ne è rimosso il nome, un file viene realmente
1838 cancellato soltanto quando il numero di collegamenti mantenuto
1839 nell'\textit{inode} diventa nullo; solo allora l'\textit{inode} viene
1840 disallocato e lo spazio che il file occupava sul disco viene liberato.
1842 Si tenga presente comunque che a questo si aggiunge sempre un'ulteriore
1843 condizione e cioè che non ci siano processi che stiano ancora lavorando sul il
1844 file. Come vedremo in sez.~\ref{sec:file_unix_interface} il kernel una tabella
1845 di tutti file aperti da ciascun processo, che a sua volta contiene i
1846 riferimenti agli \textit{inode} ad essi relativi. Prima di procedere alla
1847 cancellazione dello spazio occupato su disco dal contenuto di un file il
1848 kernel controlla anche questa tabella, per verificare che anche in essa non ci
1849 sia più nessun riferimento all'\textit{inode} in questione, assicurandosi con
1850 questo che nessun processo stia ancora usando il file.
1852 Nel caso di socket, \textit{fifo} o file di dispositivo la funzione rimuove il
1853 nome, e come per i file normali i processi che hanno aperto uno di questi
1854 oggetti possono continuare ad utilizzarli. Nel caso di cancellazione di un
1855 \textit{link} simbolico, che consiste solo nel rimando ad un altro file,
1856 questo viene immediatamente eliminato e non sarà più utilizzabile.
1858 Per cancellare una voce in una directory è necessario avere il permesso di
1859 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
1860 il diritto di esecuzione/attraversamento sulla directory che la contiene
1861 (affronteremo in dettaglio l'argomento dei permessi di file e directory in
1862 sez.~\ref{sec:file_access_control}). Se inoltre per la directory è impostato
1863 lo \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}), occorrerà
1864 anche essere proprietari del file o proprietari della directory o avere i
1865 privilegi di amministratore.
1867 Questa caratteristica del sistema, che consente di usare un file anche se lo
1868 si è ``cancellato'', può essere usata per essere sicuri di non lasciare file
1869 temporanei su disco in caso di uscita imprevista di un programma. La tecnica è
1870 quella di aprire un nuovo file e chiamare \func{unlink} su di esso subito
1871 dopo, in questo modo il contenuto del file sarà sempre disponibile all'interno
1872 del processo attraverso il suo file descriptor (vedi sez.~\ref{sec:file_fd}),
1873 ma non ne resterà traccia in nessuna directory, inoltre lo spazio occupato su
1874 disco verrà immediatamente rilasciato alla conclusione del processo, quando
1875 tutti i file vengono chiusi.
1877 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
1878 la funzione \func{unlink} sulle directory, che in tal caso fallisce con un
1879 errore di \errcode{EISDIR}. Per cancellare una directory si deve usare la
1880 apposita funzione di sistema \func{rmdir} (che vedremo in
1881 sez.~\ref{sec:file_dir_creat_rem}), oppure la funzione \func{remove}.
1883 Quest'ultima è la funzione prevista dallo standard ANSI C per effettuare una
1884 cancellazione generica di un file o di una directory e viene usata in generale
1885 anche per i sistemi operativi che non supportano gli \textit{hard link}. Nei
1886 sistemi unix-like \funcd{remove} è equivalente ad usare in maniera trasparente
1887 \func{unlink} per i file ed \func{rmdir} per le directory; il suo prototipo è:
1891 \fdecl{int remove(const char *pathname)}
1892 \fdesc{Cancella un file o una directory.}
1894 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1895 caso \var{errno} assumerà uno dei valori relativi alla chiamata utilizzata,
1896 pertanto si può fare riferimento a quanto illustrato nelle descrizioni di
1897 \func{unlink} e \func{rmdir}.}
1900 La funzione utilizza la funzione \func{unlink} per cancellare i file (e si
1901 applica anche a link simbolici, socket, \textit{fifo} e file di dispositivo) e
1902 la funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}) per
1903 cancellare le directory.\footnote{questo vale usando la \acr{glibc}; nella
1904 \acr{libc4} e nella \acr{libc5} la funzione \func{remove} era un semplice
1905 alias alla funzione \func{unlink} e quindi non poteva essere usata per le
1906 directory.} Si tenga presente che, per alcune limitazioni del protocollo
1907 NFS, utilizzare questa funzione su file che usano questo filesystem di rete
1908 può comportare la scomparsa di file ancora in uso.
1910 Infine per cambiare nome ad un file o a una directory si usa la funzione di
1911 sistema \funcd{rename},\footnote{la funzione è definita dallo standard ANSI C,
1912 ma si applica solo per i file, lo standard POSIX estende la funzione anche
1913 alle directory.} il cui prototipo è:
1917 \fdecl{int rename(const char *oldpath, const char *newpath)}
1918 \fdesc{Rinomina un file o una directory.}
1920 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1921 nel qual caso \var{errno} assumerà uno dei valori:
1923 \item[\errcode{EACCESS}] manca il permesso di scrittura sulle directory
1924 contenenti \param{oldpath} e \param{newpath} o di attraversare
1925 il loro \textit{pathname} o di scrivere su \param{newpath}
1926 se questa è una directory.
1927 \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
1928 parte di qualche processo (come directory di lavoro o come radice) o del
1929 sistema (come \textit{mount point}) ed il sistema non riesce a risolvere
1931 \item[\errcode{EEXIST}] \param{newpath} è una directory già esistente e
1932 non è vuota (anche \errcode{ENOTEMPTY}).
1933 \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
1934 \param{oldpath} o più in generale si è cercato di creare una directory come
1935 sotto-directory di sé stessa.
1936 \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
1937 \param{oldpath} non è una directory.
1938 \item[\errcode{ENOTDIR}] uno dei componenti dei \textit{pathname} non è una
1939 directory o \param{oldpath} è una directory e
1940 \param{newpath} esiste e non è una directory.
1941 \item[\errval{EPERM}] la directory contenente \param{oldpath} o quella
1942 contenente un \param{newpath} esistente hanno lo \textit{sticky bit} e non
1943 si è i proprietari dei rispettivi file (o non si hanno privilegi
1944 amministrativi) oppure il filesystem non supporta l'operazione.
1945 \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
1946 stesso filesystem e sotto lo stesso \textit{mount point}.
1947 \end{errlist} ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{EMLINK},
1948 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOSPC} e
1949 \errval{EROFS} nel loro significato generico.}
1952 La funzione rinomina in \param{newpath} il file o la directory indicati
1953 dall'argomento \param{oldpath}. Il nome viene eliminato nella directory
1954 originale e ricreato nella directory di destinazione mantenendo il riferimento
1955 allo stesso \textit{inode}. Non viene spostato nessun dato e l'\textit{inode}
1956 del file non subisce nessuna modifica in quanto le modifiche sono eseguite
1957 sulle directory che contengono \param{newpath} ed \param{oldpath}.
1959 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
1960 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
1961 c'è modifica, per quanto temporanea, al \textit{link count} del file e non può
1962 esistere un istante in cui un altro processo possa trovare attivi entrambi i
1963 nomi per lo stesso file se la destinazione non esiste o in cui questa sparisca
1964 temporaneamente se già esiste.
1966 Dato che opera in maniera analoga la funzione è soggetta alle stesse
1967 restrizioni di \func{link}, quindi è necessario che \param{oldpath}
1968 e \param{newpath} siano nello stesso filesystem e facciano riferimento allo
1969 stesso \textit{mount point}, e che il filesystem supporti questo tipo di
1970 operazione. Qualora questo non avvenga si dovrà effettuare l'operazione in
1971 maniera non atomica copiando il file a destinazione e poi cancellando
1974 Il comportamento della funzione è diverso a seconda che si voglia rinominare
1975 un file o una directory. Se ci riferisce ad un file allora \param{newpath}, se
1976 esiste, non deve essere una directory, altrimenti si avrà un errore di
1977 \errcode{EISDIR}. Se \param{newpath} indica un file già esistente questo verrà
1978 rimpiazzato atomicamente, ma nel caso in cui \func{rename} fallisca il kernel
1979 assicura che esso non sarà toccato. I caso di sovrascrittura però potrà
1980 esistere una breve finestra di tempo in cui sia \param{oldpath}
1981 che \param{newpath} potranno fare entrambi riferimento al file che viene
1984 Se \param{oldpath} è una directory allora \param{newpath}, se esistente, deve
1985 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
1986 (se non è una directory) o \errcode{ENOTEMPTY} o \errcode{EEXIST} (se non è
1987 vuota). Chiaramente \param{newpath} non potrà contenere \param{oldpath} nel
1988 suo \textit{pathname}, non essendo possibile rendere una directory una
1989 sottodirectory di sé stessa, se questo fosse il caso si otterrebbe un errore
1990 di \errcode{EINVAL}.
1992 Se \param{oldpath} si riferisce ad un collegamento simbolico questo sarà
1993 rinominato restando tale senza nessun effetto sul file a cui fa riferimento.
1994 Se invece \param{newpath} esiste ed è un collegamento simbolico verrà
1995 cancellato come qualunque altro file. Infine qualora \param{oldpath}
1996 e \param{newpath} siano due nomi che già fanno riferimento allo stesso file lo
1997 standard POSIX prevede che la funzione non ritorni un errore, e semplicemente
1998 non faccia nulla, lasciando entrambi i nomi. Linux segue questo standard,
1999 anche se, come fatto notare dal manuale della \acr{glibc}, il comportamento
2000 più ragionevole sarebbe quello di cancellare \param{oldpath}.
2002 In tutti i casi si dovranno avere i permessi di scrittura nelle directory
2003 contenenti \param{oldpath} e \param{newpath}, e nel caso \param{newpath} sia
2004 una directory vuota già esistente anche su di essa (perché dovrà essere
2005 aggiornata la voce ``\texttt{..}''). Se poi le directory
2006 contenenti \param{oldpath} o \param{newpath} hanno lo \textit{sticky bit}
2007 attivo (vedi sez.~\ref{sec:file_special_perm}) si dovrà essere i proprietari
2008 dei file (o delle directory) che si vogliono rinominare, o avere i permessi di
2012 \subsection{La creazione e la cancellazione delle directory}
2013 \label{sec:file_dir_creat_rem}
2015 Benché in sostanza le directory non siano altro che dei file contenenti
2016 elenchi di nomi con riferimenti ai rispettivi \textit{inode}, non è possibile
2017 trattarle come file ordinari e devono essere create direttamente dal kernel
2018 attraverso una opportuna \textit{system call}.\footnote{questo è quello che
2019 permette anche, attraverso l'uso del VFS, l'utilizzo di diversi formati per
2020 la gestione dei suddetti elenchi, dalle semplici liste a strutture complesse
2021 come alberi binari, hash, ecc. che consentono una ricerca veloce quando il
2022 numero di file è molto grande.} La funzione di sistema usata per creare una
2023 directory è \funcd{mkdir}, ed il suo prototipo è:
2028 \fdecl{int mkdir(const char *dirname, mode\_t mode)}
2029 \fdesc{Crea una nuova directory.}
2031 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2032 caso \var{errno} assumerà uno dei valori:
2034 \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
2035 cui si vuole inserire la nuova directory o di attraversamento per le
2036 directory al di sopra di essa.
2037 \item[\errcode{EEXIST}] un file o una directory o un collegamento simbolico
2038 con quel nome esiste già.
2039 \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
2040 directory contiene troppi file; sotto Linux questo normalmente non avviene
2041 perché il filesystem standard consente la creazione di un numero di file
2042 maggiore di quelli che possono essere contenuti nel disco, ma potendo
2043 avere a che fare anche con filesystem di altri sistemi questo errore può
2045 \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
2046 la nuova directory o si è esaurita la quota disco dell'utente.
2048 ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
2049 \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EPERM},
2050 \errval{EROFS} nel loro significato generico.}
2053 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
2054 standard presenti in ogni directory (``\file{.}'' e ``\file{..}''), con il
2055 nome indicato dall'argomento \param{dirname}.
2057 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
2058 directory viene creata sono specificati dall'argomento \param{mode}, i cui
2059 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
2060 tenga presente che questi sono modificati dalla maschera di creazione dei file
2061 (si veda sez.~\ref{sec:file_perm_management}). La titolarità della nuova
2062 directory è impostata secondo quanto illustrato in
2063 sez.~\ref{sec:file_ownership_management}.
2065 Come accennato in precedenza per eseguire la cancellazione di una directory è
2066 necessaria una specifica funzione di sistema, \funcd{rmdir}, il suo prototipo
2071 \fdecl{int rmdir(const char *dirname)}
2072 \fdesc{Cancella una directory.}
2074 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2075 caso \var{errno} assumerà uno dei valori:
2077 \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
2078 che contiene la directory che si vuole cancellare, o non c'è il permesso
2079 di attraversare (esecuzione) una delle directory specificate in
2081 \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o
2082 la radice di qualche processo o un \textit{mount point}.
2083 \item[\errcode{EINVAL}] si è usato ``\texttt{.}'' come ultimo componente
2085 \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
2086 directory, oppure la directory che contiene \param{dirname} ha lo
2087 \textit{sticky bit} impostato e non si è i proprietari della directory o
2088 non si hanno privilegi amministrativi.
2090 ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
2091 \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errcode{ENOTEMPTY} e
2092 \errval{EROFS} nel loro significato generico.}
2096 La funzione cancella la directory \param{dirname}, che deve essere vuota, la
2097 directory deve cioè contenere le due voci standard ``\file{.}'' e
2098 ``\file{..}'' e niente altro. Il nome può essere indicato con un
2099 \textit{pathname} assoluto o relativo, ma si deve fare riferimento al nome
2100 nella directory genitrice, questo significa che \textit{pathname} terminanti
2101 in ``\file{.}'' e ``\file{..}'' anche se validi in altri contesti, causeranno
2102 il fallimento della funzione.
2104 Inoltre per eseguire la cancellazione, oltre ad essere vuota, occorre anche
2105 che la directory non sia utilizzata, questo vuol dire anche che non deve
2106 essere la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}) o la
2107 directory radice (vedi sez.~\ref{sec:file_chroot}) di nessun processo, od
2108 essere utilizzata come \textit{mount point}.
2110 Se la directory cancellata risultasse aperta in qualche processo per una
2111 lettura dei suoi contenuti (vedi sez.~\ref{sec:file_dir_read}), pur
2112 scomparendo dal filesystem e non essendo più possibile accedervi o crearvi
2113 altri file, le risorse ad essa associate verrebbero disallocate solo alla
2114 chiusura di tutti questi ulteriori riferimenti.
2117 \subsection{Lettura e scansione delle directory}
2118 \label{sec:file_dir_read}
2120 Benché le directory alla fine non siano altro che dei file che contengono
2121 delle liste di nomi associati ai relativi \textit{inode}, per il ruolo che
2122 rivestono nella struttura del sistema non possono essere trattate come dei
2123 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
2124 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
2125 può essere un processo a inserirvi direttamente delle voci con le usuali
2126 funzioni di scrittura.
2128 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
2129 kernel, sono molte le situazioni in cui i processi necessitano di poterne
2130 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
2131 in sez.~\ref{sec:file_open_close} che è possibile aprire una directory come se
2132 fosse un file, anche se solo in sola lettura) in generale il formato con cui
2133 esse sono scritte può dipendere dal tipo di filesystem, tanto che, come
2134 riportato in tab.~\ref{tab:file_file_operations}, il VFS prevede una apposita
2135 funzione per la lettura delle directory.
2137 \itindbeg{directory~stream}
2139 Tutto questo si riflette nello standard POSIX\footnote{le funzioni erano
2140 presenti in SVr4 e 4.3BSD, la loro specifica è riportata in POSIX.1-2001.}
2141 che ha introdotto una apposita interfaccia per la lettura delle directory,
2142 basata sui cosiddetti \textit{directory stream}, chiamati così per l'analogia
2143 con i \textit{file stream} dell'interfaccia standard ANSI C che vedremo in
2144 sez.~\ref{sec:files_std_interface}. La prima funzione di questa interfaccia è
2145 \funcd{opendir}, il cui prototipo è:
2150 \fdecl{DIR *opendir(const char *dirname)}
2151 \fdesc{Apre un \textit{directory stream}.}
2153 {La funzione ritorna un puntatore al \textit{directory stream} in caso di
2154 successo e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
2155 dei valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
2156 \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR} nel loro significato
2160 La funzione apre un \textit{directory stream} per la directory
2161 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \typed{DIR} (che
2162 è il tipo opaco usato dalle librerie per gestire i \textit{directory stream})
2163 da usare per tutte le operazioni successive, la funzione inoltre posiziona lo
2164 \textit{stream} sulla prima voce contenuta nella directory.
2166 Si tenga presente che comunque la funzione opera associando il
2167 \textit{directory stream} ad un opportuno file descriptor (vedi
2168 sez.~\ref{sec:file_fd}) sottostante, sul quale vengono compiute le
2169 operazioni. Questo viene sempre aperto impostando il flag di
2170 \textit{close-on-exec} (si ricordi quanto detto in sez.~\ref{sec:proc_exec}),
2171 così da evitare che resti aperto in caso di esecuzione di un altro programma.
2173 Nel caso in cui sia necessario conoscere il file descriptor associato ad un
2174 \textit{directory stream} si può usare la funzione
2175 \funcd{dirfd},\footnote{questa funzione è una estensione introdotta con BSD
2176 4.3-Reno ed è presente in Linux con le libc5 (a partire dalla versione
2177 5.1.2) e con la \acr{glibc} ma non presente in POSIX fino alla revisione
2178 POSIX.1-2008, per questo per poterla utilizzare fino alla versione 2.10
2179 della \acr{glibc} era necessario definire le macro \macro{\_BSD\_SOURCE} o
2180 \macro{\_SVID\_SOURCE}, dalla versione 2.10 si possono usare anche
2181 \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o
2182 \texttt{\macro{\_XOPEN\_SOURCE} >= 700}.} il cui prototipo è:
2187 \fdecl{int dirfd(DIR *dir)}
2188 \fdesc{Legge il file descriptor associato ad un \textit{directory stream}.}
2190 {La funzione ritorna un valore positivo corrispondente al file descriptor in
2191 caso di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà
2194 \item[\errcode{EINVAL}] \param{dir} non è un puntatore ad un
2195 \textit{directory stream}.
2196 \item[\errcode{ENOTSUP}] l'implementazione non supporta l'uso di un file
2197 descriptor per la directory.
2202 La funzione restituisce il file descriptor associato al \textit{directory
2203 stream} \param{dir}. Di solito si utilizza questa funzione in abbinamento a
2204 funzioni che operano sui file descriptor, ad esempio si potrà usare
2205 \func{fstat} per ottenere le proprietà della directory, o \func{fchdir} per
2206 spostare su di essa la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}).
2208 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
2209 possibile associarvi un \textit{directory stream} con la funzione
2210 \funcd{fdopendir},\footnote{questa funzione è però disponibile solo a partire
2211 dalla versione 2.4 della \acr{glibc}, ed è stata introdotta nello standard
2212 POSIX solo a partire dalla revisione POSIX.1-2008, prima della versione 2.10
2213 della \acr{glibc} per poterla utilizzare era necessario definire la macro
2214 \macro{\_GNU\_SOURCE}, dalla versione 2.10 si possono usare anche
2215 \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o \texttt{\_XOPEN\_SOURCE >=
2216 700} .} il cui prototipo è:
2221 \fdecl{DIR *fdopendir(int fd)}
2222 \fdesc{Associa un \textit{directory stream} ad un file descriptor.}
2224 {La funzione ritorna un puntatore al \textit{directory stream} in caso di
2225 successo e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
2226 dei valori \errval{EBADF} o \errval{ENOMEM} nel loro significato generico.}
2229 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
2230 stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
2231 stato aperto in precedenza; la funzione darà un errore qualora questo non
2232 corrisponda ad una directory. L'uso di questa funzione permette di rispondere
2233 agli stessi requisiti delle funzioni ``\textit{at}'' che vedremo in
2234 sez.~\ref{sec:file_openat}.
2236 Una volta utilizzata il file descriptor verrà usato internamente dalle
2237 funzioni che operano sul \textit{directory stream} e non dovrà essere più
2238 utilizzato all'interno del proprio programma. In particolare dovrà essere
2239 chiuso attraverso il \textit{directory stream} con \func{closedir} e non
2240 direttamente. Si tenga presente inoltre che \func{fdopendir} non modifica lo
2241 stato di un eventuale flag di \textit{close-on-exec}, che pertanto dovrà
2242 essere impostato esplicitamente in fase di apertura del file descriptor.
2244 Una volta che si sia aperto un \textit{directory stream} la lettura del
2245 contenuto della directory viene effettuata attraverso la funzione
2246 \funcd{readdir}, il cui prototipo è:
2251 \fdecl{struct dirent *readdir(DIR *dir)}
2252 \fdesc{Legge una voce dal \textit{directory stream}.}
2254 {La funzione ritorna il puntatore alla struttura contenente i dati in caso di
2255 successo e \val{NULL} per un errore o se si è raggiunta la fine dello
2256 \textit{stream}. Il solo codice di errore restituito in \var{errno} è
2257 \errval{EBADF} qualora \param{dir} non indichi un \textit{directory stream}
2261 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
2262 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
2263 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
2264 esaurite tutte le voci in essa presenti, che viene segnalata dalla
2265 restituzione di \val{NULL} come valore di ritorno. Si può distinguere questa
2266 condizione da un errore in quanto in questo caso \var{errno} non verrebbe
2269 I dati letti da \func{readdir} vengono memorizzati in una struttura
2270 \struct{dirent}, la cui definizione è riportata in
2271 fig.~\ref{fig:file_dirent_struct}.\footnote{la definizione è quella usata da
2272 Linux, che si trova nel file \file{/usr/include/bits/dirent.h}, essa non
2273 contempla la presenza del campo \var{d\_namlen} che indica la lunghezza del
2274 nome del file.} La funzione non è rientrante e restituisce il puntatore ad
2275 una struttura allocata staticamente, che viene sovrascritta tutte le volte che
2276 si ripete la lettura di una voce sullo stesso \textit{directory stream}.
2278 Di questa funzione esiste anche una versione rientrante,
2279 \funcd{readdir\_r},\footnote{per usarla è necessario definire una qualunque
2280 delle macro \texttt{\macro{\_POSIX\_C\_SOURCE} >= 1},
2281 \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
2282 \macro{\_POSIX\_SOURCE}.} che non usa una struttura allocata staticamente, e
2283 può essere utilizzata anche con i \textit{thread}, il suo prototipo è:
2288 \fdecl{int readdir\_r(DIR *dir, struct dirent *entry, struct dirent **result)}
2289 \fdesc{Legge una voce dal \textit{directory stream}.}
2291 {La funzione ritorna $0$ in caso di successo ed un numero positivo per un
2292 errore, nel qual caso \var{errno} assumerà gli stessi valori di
2296 La funzione restituisce in \param{result} come \textit{value result argument}
2297 l'indirizzo della struttura \struct{dirent} dove sono stati salvati i dati,
2298 che deve essere allocata dal chiamante, ed il cui indirizzo deve essere
2299 indicato con l'argomento \param{entry}. Se si è raggiunta la fine del
2300 \textit{directory stream} invece in \param{result} viene restituito il valore
2303 \begin{figure}[!htb]
2304 \footnotesize \centering
2305 \begin{minipage}[c]{0.8\textwidth}
2306 \includestruct{listati/dirent.c}
2309 \caption{La struttura \structd{dirent} per la lettura delle informazioni dei
2311 \label{fig:file_dirent_struct}
2314 % Lo spazio per la \struct{dirent} dove vengono restituiti i dati della
2315 % directory deve essere allocato a cura del chiamante, dato che la dimensione
2318 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
2319 presenti nella directory. Sia BSD che SVr4 che POSIX.1-2001\footnote{il
2320 vecchio standard POSIX prevedeva invece solo la presenza del campo
2321 \var{d\_fileno}, identico \var{d\_ino}, che in Linux era definito come alias
2322 di quest'ultimo, mentre il campo \var{d\_name} era considerato dipendente
2323 dall'implementazione.} prevedono che siano sempre presenti il campo
2324 \var{d\_name}, che contiene il nome del file nella forma di una stringa
2325 terminata da uno zero, ed il campo \var{d\_ino}, che contiene il numero di
2326 \textit{inode} cui il file è associato e corrisponde al campo \var{st\_ino} di
2327 \struct{stat}. La presenza di ulteriori campi opzionali oltre i due citati è
2328 segnalata dalla definizione di altrettante macro nella forma
2329 \code{\_DIRENT\_HAVE\_D\_XXX} dove \code{XXX} è il nome del relativo
2330 campo. Come si può evincere da fig.~\ref{fig:file_dirent_struct} nel caso di
2331 Linux sono pertanto definite le macro \macrod{\_DIRENT\_HAVE\_D\_TYPE},
2332 \macrod{\_DIRENT\_HAVE\_D\_OFF} e \macrod{\_DIRENT\_HAVE\_D\_RECLEN}, mentre non
2333 è definita la macro \macrod{\_DIRENT\_HAVE\_D\_NAMLEN}.
2335 Dato che possono essere presenti campi opzionali e che lo standard
2336 POSIX.1-2001 non specifica una dimensione definita per il nome dei file (che
2337 può variare a seconda del filesystem), ma solo un limite superiore pari a
2338 \const{NAME\_MAX} (vedi tab.~\ref{tab:sys_file_macro}), in generale per
2339 allocare una struttura \struct{dirent} in maniera portabile occorre eseguire
2340 un calcolo per ottenere le dimensioni appropriate per il proprio
2341 sistema.\footnote{in SVr4 la lunghezza del campo è definita come
2342 \code{NAME\_MAX+1} che di norma porta al valore di 256 byte usato anche in
2343 fig.~\ref{fig:file_dirent_struct}.} Lo standard però richiede che il campo
2344 \var{d\_name} sia sempre l'ultimo della struttura, questo ci consente di
2345 ottenere la dimensione della prima parte con la macro di utilità generica
2346 \macro{offsetof}, che si può usare con il seguente prototipo:
2352 \fdecl{size\_t \macrod{offsetof}(type, member)}
2353 \fdesc{Restituisce la posizione del campo \param{member} nella
2354 struttura \param{type}.}
2359 Ottenuta allora con \code{offsetof(struct dirent, d\_name)} la dimensione
2360 della parte iniziale della struttura, basterà sommarci la dimensione massima
2361 dei nomi dei file nel filesystem che si sta usando, che si può ottenere
2362 attraverso la funzione \func{pathconf} (per la quale si rimanda a
2363 sez.~\ref{sec:sys_file_limits}) più un ulteriore carattere per la terminazione
2366 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
2367 indica il tipo di file (se \textit{fifo}, directory, collegamento simbolico,
2368 ecc.), e consente di evitare una successiva chiamata a \func{lstat} (vedi
2369 sez.~\ref{sec:file_stat}) per determinarlo. I suoi possibili valori sono
2370 riportati in tab.~\ref{tab:file_dtype_macro}. Si tenga presente che questo
2371 valore è disponibile solo per i filesystem che ne supportano la restituzione
2372 (fra questi i più noti sono \acr{Btrfs}, \acr{ext2}, \acr{ext3}, e
2373 \acr{ext4}), per gli altri si otterrà sempre il valore
2374 \const{DT\_UNKNOWN}.\footnote{inoltre fino alla versione 2.1 della
2375 \acr{glibc}, pur essendo il campo \var{d\_type} presente, il suo uso non era
2376 implementato, e veniva restituito comunque il valore \const{DT\_UNKNOWN}.}
2381 \begin{tabular}[c]{|l|l|}
2383 \textbf{Valore} & \textbf{Tipo di file} \\
2386 \constd{DT\_UNKNOWN} & Tipo sconosciuto.\\
2387 \constd{DT\_REG} & File normale.\\
2388 \constd{DT\_DIR} & Directory.\\
2389 \constd{DT\_LNK} & Collegamento simbolico.\\
2390 \constd{DT\_FIFO} & \textit{Fifo}.\\
2391 \constd{DT\_SOCK} & Socket.\\
2392 \constd{DT\_CHR} & Dispositivo a caratteri.\\
2393 \constd{DT\_BLK} & Dispositivo a blocchi.\\
2396 \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
2397 della struttura \struct{dirent}.}
2398 \label{tab:file_dtype_macro}
2401 Per la conversione da e verso l'analogo valore mantenuto dentro il campo
2402 \var{st\_mode} di \struct{stat} (vedi fig.~\ref{fig:file_stat_struct}) sono
2403 definite anche due macro di conversione, \macro{IFTODT} e \macro{DTTOIF}:
2409 \fdecl{int \macrod{IFTODT}(mode\_t MODE)}
2410 \fdesc{Converte il tipo di file dal formato di \var{st\_mode} a quello di
2412 \fdecl{mode\_t \macrod{DTTOIF}(int DTYPE)}
2413 \fdesc{Converte il tipo di file dal formato di \var{d\_type} a quello di
2419 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
2420 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
2421 letta. Con questi due campi diventa possibile, determinando la posizione delle
2422 varie voci, spostarsi all'interno dello \textit{stream} usando la funzione
2423 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
2424 estensioni prese da BSD, ed introdotte nello standard POSIX solo a partire
2425 dalla revisione POSIX.1-2001, per poterle utilizzare deve essere definita
2426 una delle macro \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE} o
2427 \macro{\_SVID\_SOURCE}.} il cui prototipo è:
2431 \fdecl{void seekdir(DIR *dir, off\_t offset)}
2432 \fdesc{Cambia la posizione all'interno di un \textit{directory stream}.}
2434 {La funzione non ritorna niente e non imposta errori.}
2437 La funzione non ritorna nulla e non segnala errori, è però necessario che il
2438 valore dell'argomento \param{offset} sia valido per lo
2439 \textit{stream} \param{dir}; esso pertanto deve essere stato ottenuto o dal
2440 valore di \var{d\_off} di \struct{dirent} o dal valore restituito dalla
2441 funzione \funcd{telldir}, che legge la posizione corrente; il cui prototipo
2442 è:\footnote{prima della \acr{glibc} 2.1.1 la funzione restituiva un valore di
2443 tipo \type{off\_t}, sostituito a partire dalla versione 2.1.2 da \ctyp{long}
2444 per conformità a POSIX.1-2001.}
2448 \fdecl{long telldir(DIR *dir)}
2449 \fdesc{Ritorna la posizione corrente in un \textit{directory stream}.}
2451 {La funzione ritorna la posizione corrente nello \textit{stream} (un numero
2452 positivo) in caso di successo e $-1$ per un errore, nel qual caso
2453 \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
2454 valore errato per \param{dir}. }
2457 La sola funzione di posizionamento per un \textit{directory stream} prevista
2458 originariamente dallo standard POSIX è \funcd{rewinddir}, che riporta la
2459 posizione a quella iniziale; il suo prototipo è:
2464 \fdecl{void rewinddir(DIR *dir)}
2465 \fdesc{Si posiziona all'inizio di un \textit{directory stream}.}
2467 {La funzione non ritorna niente e non imposta errori.}
2470 Una volta completate le operazioni si può chiudere il \textit{directory
2471 stream}, ed il file descriptor ad esso associato, con la funzione
2472 \funcd{closedir}, il cui prototipo è:
2477 \fdecl{int closedir(DIR *dir)}
2478 \fdesc{Chiude un \textit{directory stream}.}
2480 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2481 caso \var{errno} assume solo il valore \errval{EBADF}.}
2484 A parte queste funzioni di base in BSD 4.3 venne introdotta un'altra funzione
2485 che permette di eseguire una scansione completa, con tanto di ricerca ed
2486 ordinamento, del contenuto di una directory; la funzione è
2487 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
2488 \acr{libc4} e richiede siano definite le macro \macro{\_BSD\_SOURCE} o
2489 \macro{\_SVID\_SOURCE}.} ed il suo prototipo è:
2493 \fdecl{int scandir(const char *dir, struct dirent ***namelist, \\
2494 \phantom{int scandir(}int(*filter)(const struct dirent *), \\
2495 \phantom{int scandir(}int(*compar)(const struct dirent **, const struct dirent **))}
2496 \fdesc{Esegue una scansione di un \textit{directory stream}.}
2498 {La funzione ritorna il numero di voci trovate in caso di successo e $-1$ per
2499 un errore, nel qual caso \var{errno} può assumere solo il valore
2503 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
2504 prototipo non è molto comprensibile; queste funzioni però sono quelle che
2505 controllano rispettivamente la selezione di una voce, passata con
2506 l'argomento \param{filter}, e l'ordinamento di tutte le voci selezionate,
2507 specificata dell'argomento \param{compar}.
2509 La funzione legge tutte le voci della directory indicata dall'argomento
2510 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
2511 \struct{dirent}) come argomento della funzione di selezione specificata da
2512 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
2513 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
2514 Qualora si specifichi un valore \val{NULL} per l'argomento \param{filter} non
2515 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
2517 Le voci selezionate possono essere riordinate tramite \funcm{qsort}, le
2518 modalità del riordinamento possono essere personalizzate usando la funzione
2519 \param{compar} come criterio di ordinamento di \funcm{qsort}, la funzione
2520 prende come argomenti le due strutture \struct{dirent} da confrontare
2521 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
2522 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
2523 \struct{dirent} viene restituito nell'argomento
2524 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
2525 restituisce, come \textit{value result argument}, l'indirizzo della stessa;
2526 questo significa che \param{namelist} deve essere dichiarato come
2527 \code{struct dirent **namelist} ed alla funzione si deve passare il suo
2530 \itindend{directory~stream}
2532 Per l'ordinamento, vale a dire come valori possibili per l'argomento
2533 \param{compar}, sono disponibili due funzioni predefinite, \funcd{alphasort} e
2534 \funcd{versionsort}, i cui prototipi sono:
2538 \fdecl{int alphasort(const void *a, const void *b)}
2539 \fdecl{int versionsort(const void *a, const void *b)}
2540 \fdesc{Riordinano le voci di \textit{directory stream}.}
2542 {Le funzioni restituiscono un valore minore, uguale o maggiore di zero qualora
2543 il primo argomento sia rispettivamente minore, uguale o maggiore del secondo
2544 e non forniscono errori.}
2547 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
2548 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
2549 argomenti dei puntatori a delle strutture \struct{dirent}; la glibc usa il
2550 prototipo originario di BSD, mostrato anche nella definizione, che prevede
2551 puntatori a \ctyp{void}.} e deve essere specificata come argomento
2552 \param{compar} per ottenere un ordinamento alfabetico secondo il valore del
2553 campo \var{d\_name} delle varie voci. La \acr{glibc} prevede come
2554 estensione\footnote{la \acr{glibc}, a partire dalla versione 2.1, effettua
2555 anche l'ordinamento alfabetico tenendo conto delle varie localizzazioni,
2556 usando \funcm{strcoll} al posto di \funcm{strcmp}.} anche
2557 \func{versionsort}, che ordina i nomi tenendo conto del numero di versione,
2558 cioè qualcosa per cui \texttt{file10} viene comunque dopo \texttt{file4}.
2560 \begin{figure}[!htb]
2561 \footnotesize \centering
2562 \begin{minipage}[c]{\codesamplewidth}
2563 \includecodesample{listati/my_ls.c}
2565 \caption{Esempio di codice per eseguire la lista dei file contenuti in una
2567 \label{fig:file_my_ls}
2570 Un semplice esempio dell'uso di queste funzioni è riportato in
2571 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
2572 programma che, usando la funzione di scansione illustrata in
2573 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
2574 e la relativa dimensione, in sostanza una versione semplificata del comando
2577 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
2578 la parte di gestione delle opzioni, che prevede solo l'uso di una funzione per
2579 la stampa della sintassi, anch'essa omessa, ma il codice completo può essere
2580 trovato coi sorgenti allegati alla guida nel file \file{myls.c}.
2582 In sostanza tutto quello che fa il programma, dopo aver controllato
2583 (\texttt{\small 12-15}) di avere almeno un argomento, che indicherà la
2584 directory da esaminare, è chiamare (\texttt{\small 16}) la funzione
2585 \myfunc{dir\_scan} per eseguire la scansione, usando la funzione \code{do\_ls}
2586 (\texttt{\small 22-29}) per fare tutto il lavoro.
2588 Quest'ultima si limita (\texttt{\small 26}) a chiamare \func{stat} sul file
2589 indicato dalla directory entry passata come argomento (il cui nome è appunto
2590 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
2591 dati ad esso relativi, per poi provvedere (\texttt{\small 27}) a stampare il
2592 nome del file e la dimensione riportata in \var{data}.
2594 Dato che la funzione verrà chiamata all'interno di \myfunc{dir\_scan} per ogni
2595 voce presente, questo è sufficiente a stampare la lista completa dei file e
2596 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
2597 valore di ritorno per indicare una esecuzione senza errori.
2599 \begin{figure}[!htb]
2600 \footnotesize \centering
2601 \begin{minipage}[c]{\codesamplewidth}
2602 \includecodesample{listati/dir_scan.c}
2604 \caption{Codice della funzione di scansione di una directory contenuta nel
2605 file \file{dir\_scan.c}.}
2606 \label{fig:file_dirscan}
2609 Tutto il grosso del lavoro è svolto dalla funzione \myfunc{dir\_scan},
2610 riportata in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e
2611 permette di eseguire una funzione, passata come secondo argomento, su tutte le
2612 voci di una directory. La funzione inizia con l'aprire (\texttt{\small
2613 18-22}) uno \textit{stream} sulla directory passata come primo argomento,
2614 stampando un messaggio in caso di errore.
2616 Il passo successivo (\texttt{\small 23-24}) è cambiare directory di lavoro
2617 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzioni
2618 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
2619 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
2620 (\texttt{\small 26-30}) sulle singole voci dello \textit{stream} ci si trovi
2621 all'interno della directory.\footnote{questo è essenziale al funzionamento
2622 della funzione \code{do\_ls}, e ad ogni funzione che debba usare il campo
2623 \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
2624 struttura \struct{dirent} sono sempre relativi alla directory in questione,
2625 e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
2626 ottenere le dimensioni.}
2628 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
2629 alla funzione passata come secondo argomento, il ciclo di scansione della
2630 directory è molto semplice; si legge una voce alla volta (\texttt{\small 26})
2631 all'interno di una istruzione di \code{while} e fintanto che si riceve una
2632 voce valida, cioè un puntatore diverso da \val{NULL}, si esegue
2633 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
2634 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
2635 28}) qualora questa presenti una anomalia, identificata da un codice di
2636 ritorno negativo. Una volta terminato il ciclo la funzione si conclude con la
2637 chiusura (\texttt{\small 31}) dello \textit{stream}\footnote{nel nostro caso,
2638 uscendo subito dopo la chiamata, questo non servirebbe, in generale però
2639 l'operazione è necessaria, dato che la funzione può essere invocata molte
2640 volte all'interno dello stesso processo, per cui non chiudere i
2641 \textit{directory stream} comporterebbe un consumo progressivo di risorse,
2642 con conseguente rischio di esaurimento delle stesse.} e la restituzione
2643 (\texttt{\small 32}) del codice di operazioni concluse con successo.
2647 \subsection{La directory di lavoro}
2648 \label{sec:file_work_dir}
2650 \index{directory~di~lavoro|(}
2652 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
2653 directory nell'albero dei file,\footnote{questa viene mantenuta all'interno
2654 dei dati della sua \kstruct{task\_struct} (vedi
2655 fig.~\ref{fig:proc_task_struct}), più precisamente nel campo \texttt{pwd}
2656 della sotto-struttura \kstruct{fs\_struct}.} che è chiamata
2657 \textsl{directory corrente} o \textsl{directory di lavoro} (in inglese
2658 \textit{current working directory}). La directory di lavoro è quella da cui
2659 si parte quando un \textit{pathname} è espresso in forma relativa, dove il
2660 ``\textsl{relativa}'' fa riferimento appunto a questa directory.
2662 Quando un utente effettua il login, questa directory viene impostata alla
2663 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
2664 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
2665 comando \cmd{pwd} la stampa sul terminale. Siccome la directory di lavoro
2666 resta la stessa quando viene creato un processo figlio (vedi
2667 sez.~\ref{sec:proc_fork}), la directory di lavoro della shell diventa anche la
2668 directory di lavoro di qualunque comando da essa lanciato.
2670 Dato che è il kernel che tiene traccia dell'\textit{inode} della directory di
2671 lavoro di ciascun processo, per ottenerne il \textit{pathname} occorre usare
2672 una apposita funzione, \funcd{getcwd},\footnote{con Linux \func{getcwd} è una
2673 \textit{system call} dalla versione 2.1.9, in precedenza il valore doveva
2674 essere ottenuto tramite il filesystem \texttt{/proc} da
2675 \procfile{/proc/self/cwd}.} il cui prototipo è:
2679 \fdecl{char *getcwd(char *buffer, size\_t size)}
2680 \fdesc{Legge il \textit{pathname} della directory di lavoro corrente.}
2682 {La funzione ritorna il puntatore a \param{buffer} in caso di successo e
2683 \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2685 \item[\errcode{EACCES}] manca il permesso di lettura o di attraversamento su
2686 uno dei componenti del \textit{pathname} (cioè su una delle directory
2687 superiori alla corrente).
2688 \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
2690 \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata.
2691 \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
2692 lunghezza del \textit{pathname}.
2694 ed inoltre \errcode{EFAULT} ed \errcode{ENOMEM} nel loro significato
2698 La funzione restituisce il \textit{pathname} completo della directory di
2699 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
2700 precedentemente allocata, per una dimensione massima di \param{size}. Il
2701 buffer deve essere sufficientemente largo da poter contenere il
2702 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
2703 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
2706 A partire dal kernel Linux 2.6.36 il nome può avere come prefisso la stringa
2707 \texttt{(unreachable)} se la directory di lavoro resta fuori dalla directory
2708 radice del processo dopo un \func{chroot} (torneremo su questi argomenti in
2709 sez.~\ref{sec:file_chroot}); pertanto è sempre opportuno controllare il primo
2710 carattere della stringa restituita dalla funzione per evitare di interpretare
2711 mare un \textit{pathname} irraggiungibile.
2713 Come estensione allo standard POSIX.1, supportata da Linux e dalla
2714 \acr{glibc}, si può anche specificare un puntatore nullo come \param{buffer}
2715 nel qual caso la stringa sarà allocata automaticamente per una dimensione pari
2716 a \param{size} qualora questa sia diversa da zero, o della lunghezza esatta
2717 del \textit{pathname} altrimenti. In questo caso ci si deve ricordare di
2718 disallocare la stringa con \func{free} una volta cessato il suo utilizzo.
2720 Un uso comune di \func{getcwd} è quello di salvarsi la directory di lavoro
2721 all'avvio del programma per poi potervi tornare in un tempo successivo, un
2722 metodo alternativo più veloce, se non si è a corto di file descriptor, è
2723 invece quello di aprire all'inizio la directory corrente (vale a dire
2724 ``\texttt{.}'') e tornarvi in seguito con \func{fchdir}.
2726 Di questa funzione esiste una versione alternativa per compatibilità
2727 all'indietro con BSD, \funcm{getwd}, che non prevede l'argomento \param{size}
2728 e quindi non consente di specificare la dimensione di \param{buffer} che
2729 dovrebbe essere allocato in precedenza ed avere una dimensione sufficiente
2730 (per BSD maggiore \const{PATH\_MAX}, che di solito 256 byte, vedi
2731 sez.~\ref{sec:sys_limits}). Il problema è che su Linux non esiste una
2732 dimensione superiore per la lunghezza di un \textit{pathname}, per cui non è
2733 detto che il buffer sia sufficiente a contenere il nome del file, e questa è
2734 la ragione principale per cui questa funzione è deprecata, e non la tratteremo.
2736 Una seconda funzione usata per ottenere la directory di lavoro è
2737 \funcm{get\_current\_dir\_name} (la funzione è una estensione GNU e presente
2738 solo nella \acr{glibc}) che non prende nessun argomento ed è sostanzialmente
2739 equivalente ad una \code{getcwd(NULL, 0)}, con la differenza che se
2740 disponibile essa ritorna il valore della variabile di ambiente \envvar{PWD},
2741 che essendo costruita dalla shell può contenere un \textit{pathname}
2742 comprendente anche dei collegamenti simbolici. Usando \func{getcwd} infatti,
2743 essendo il \textit{pathname} ricavato risalendo all'indietro l'albero della
2744 directory, si perderebbe traccia di ogni passaggio attraverso eventuali
2745 collegamenti simbolici.
2747 Per cambiare la directory di lavoro si può usare la funzione di sistema
2748 \funcd{chdir}, equivalente del comando di shell \cmd{cd}, il cui nome sta
2749 appunto per \textit{change directory}, il suo prototipo è:
2753 \fdecl{int chdir(const char *pathname)}
2754 \fdesc{Cambia la directory di lavoro per \textit{pathname}.}
2756 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2757 caso \var{errno} assumerà uno dei valori:
2759 \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
2760 di \param{pathname}.
2761 \item[\errcode{ENAMETOOLONG}] il nome indicato in \param{path} è troppo lungo.
2762 \item[\errcode{ENOTDIR}] non si è specificata una directory.
2764 ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP}, \errval{ENOENT} e
2765 \errval{ENOMEM} nel loro significato generico.}
2768 La funzione cambia la directory di lavoro in \param{pathname} ed
2769 ovviamente \param{pathname} deve indicare una directory per la quale si hanno
2770 i permessi di accesso.
2772 Dato che ci si può riferire ad una directory anche tramite un file descriptor,
2773 per cambiare directory di lavoro è disponibile anche la funzione di sistema
2774 \funcd{fchdir}, il cui prototipo è:
2778 \fdecl{int fchdir(int fd)}
2779 \fdesc{Cambia la directory di lavoro per file descriptor.}
2781 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2782 caso \var{errno} assumerà i valori \errval{EBADF} o \errval{EACCES} nel loro
2783 significato generico.}
2786 La funzione è identica a \func{chdir}, ma prende come argomento un file
2787 descriptor \param{fd} invece di un \textit{pathname}. Anche in questo
2788 caso \param{fd} deve essere un file descriptor valido che fa riferimento ad
2789 una directory. Inoltre l'unico errore di accesso possibile (tutti gli altri
2790 sarebbero occorsi all'apertura di \param{fd}), è quello in cui il processo non
2791 ha il permesso di attraversamento alla directory specificata da \param{fd}.
2793 \index{directory~di~lavoro|)}
2796 \subsection{La creazione dei \textsl{file speciali}}
2797 \label{sec:file_mknod}
2799 \index{file!di~dispositivo|(}
2800 \index{file!speciali|(}
2802 Finora abbiamo parlato esclusivamente di file, directory e collegamenti
2803 simbolici, ma in sez.~\ref{sec:file_file_types} abbiamo visto che il sistema
2804 prevede anche degli altri tipi di file, che in genere vanno sotto il nome
2805 generico di \textsl{file speciali}, come i file di dispositivo, le
2806 \textit{fifo} ed i socket.
2808 La manipolazione delle caratteristiche di questi file speciali, il cambiamento
2809 di nome o la loro cancellazione può essere effettuata con le stesse funzioni
2810 che operano sugli altri file, ma quando li si devono creare sono necessarie,
2811 come per le directory, delle funzioni apposite. La prima di queste è la
2812 funzione di sistema \funcd{mknod}, il cui prototipo è:
2819 \fdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)}
2820 \fdesc{Crea un file speciale sul filesystem.}
2822 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2823 caso \var{errno} assumerà uno dei valori:
2825 \item[\errcode{EEXIST}] \param{pathname} esiste già o è un collegamento
2827 \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
2828 \textit{fifo}, un socket o un dispositivo.
2829 \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
2830 l'\texttt{inode}, o il filesystem su cui si è cercato di
2831 creare \param{pathname} non supporta l'operazione.
2833 ed inoltre \errval{EACCES}, \errval{EFAULT}, \errval{ELOOP},
2834 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOSPC},
2835 \errval{ENOTDIR} e \errval{EROFS} nel loro significato generico.}
2838 La funzione permette di creare un \textit{inode} di tipo generico sul
2839 filesystem, e viene in genere utilizzata per creare i file di dispositivo, ma
2840 si può usare anche per creare qualunque tipo di file speciale ed anche file
2841 regolari. L'argomento \param{mode} specifica sia il tipo di file che si vuole
2842 creare che i relativi permessi, secondo i valori riportati in
2843 tab.~\ref{tab:file_mode_flags}, che vanno combinati con un OR aritmetico. I
2844 permessi sono comunque modificati nella maniera usuale dal valore di
2845 \textit{umask} (si veda sez.~\ref{sec:file_perm_management}).
2847 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
2848 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
2849 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
2850 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
2851 per una \textit{fifo};\footnote{con Linux la funzione non può essere usata per
2852 creare directory o collegamenti simbolici, si dovranno usare le funzioni
2853 \func{mkdir} e \func{symlink} a questo dedicate.} un valore diverso
2854 comporterà l'errore \errcode{EINVAL}. Inoltre \param{pathname} non deve
2855 esistere, neanche come collegamento simbolico.
2857 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
2858 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
2859 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
2860 valore verrà ignorato. Solo l'amministratore può creare un file di
2861 dispositivo usando questa funzione (il processo deve avere la capacità
2862 \const{CAP\_MKNOD}), ma in Linux\footnote{questo è un comportamento specifico
2863 di Linux, la funzione non è prevista dallo standard POSIX.1 originale,
2864 mentre è presente in SVr4 e 4.4BSD, ma esistono differenze nei comportamenti
2865 e nei codici di errore, tanto che questa è stata introdotta in POSIX.1-2001
2866 con una nota che la definisce portabile solo quando viene usata per creare
2867 delle \textit{fifo}, ma comunque deprecata essendo utilizzabile a tale scopo
2868 la specifica \func{mkfifo}.} l'uso per la creazione di un file ordinario, di
2869 una \textit{fifo} o di un socket è consentito anche agli utenti normali.
2871 Gli \textit{inode} creati con \func{mknod} apparterranno al proprietario e al
2872 gruppo del processo (usando \ids{UID} e \ids{GID} del gruppo effettivo) che li
2873 ha creati a meno non sia presente il bit \acr{sgid} per la directory o sia
2874 stata attivata la semantica BSD per il filesystem (si veda
2875 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
2876 l'\textit{inode}, nel qual caso per il gruppo verrà usato il \ids{GID} del
2877 proprietario della directory.
2879 \itindbeg{major~number}
2880 \itindbeg{minor~number}
2882 Nella creazione di un file di dispositivo occorre poi specificare
2883 correttamente il valore di \param{dev}; questo infatti è di tipo
2884 \type{dev\_t}, che è un tipo primitivo (vedi
2885 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
2886 \textsl{numero} di dispositivo. Il kernel infatti identifica ciascun
2887 dispositivo con un valore numerico, originariamente questo era un intero a 16
2888 bit diviso in due parti di 8 bit chiamate rispettivamente \textit{major
2889 number} e \textit{minor number}, che sono poi i due numeri mostrati dal
2890 comando \texttt{ls -l} al posto della dimensione quando lo si esegue su un
2891 file di dispositivo.
2893 Il \textit{major number} identifica una classe di dispositivi (ad esempio la
2894 seriale, o i dischi IDE) e serve in sostanza per indicare al kernel quale è il
2895 modulo che gestisce quella classe di dispositivi. Per identificare uno
2896 specifico dispositivo di quella classe (ad esempio una singola porta seriale,
2897 o uno dei dischi presenti) si usa invece il \textit{minor number}. L'elenco
2898 aggiornato di questi numeri con le relative corrispondenze ai vari dispositivi
2899 può essere trovato nel file \texttt{Documentation/devices.txt} allegato alla
2900 documentazione dei sorgenti del kernel.
2902 Data la crescita nel numero di dispositivi supportati, ben presto il limite
2903 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
2904 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
2905 \type{dev\_t}, con delle dimensioni passate a 12 bit per il \textit{major
2906 number} e 20 bit per il \textit{minor number}. La transizione però ha
2907 comportato il fatto che \type{dev\_t} è diventato un tipo opaco, e la
2908 necessità di specificare il numero tramite delle opportune macro, così da non
2909 avere problemi di compatibilità con eventuali ulteriori estensioni.
2911 Le macro sono definite nel file \headfiled{sys/sysmacros.h},\footnote{se si
2912 usa la \acr{glibc} dalla versione 2.3.3 queste macro sono degli alias alle
2913 versioni specifiche di questa libreria, \macrod{gnu\_dev\_major},
2914 \macrod{gnu\_dev\_minor} e \macrod{gnu\_dev\_makedev} che si possono usare
2915 direttamente, al costo di una minore portabilità.} che viene automaticamente
2916 incluso quando si include \headfile{sys/types.h}. Si possono pertanto ottenere
2917 i valori del \textit{major number} e \textit{minor number} di un dispositivo
2918 rispettivamente con le macro \macro{major} e \macro{minor}:
2924 \fdecl{int \macrod{major}(dev\_t dev)}
2925 \fdesc{Restituisce il \textit{major number} del dispositivo \param{dev}.}
2926 \fdecl{int \macrod{minor}(dev\_t dev)}
2927 \fdesc{Restituisce il \textit{minor number} del dispositivo \param{dev}.}
2932 \noindent mentre una volta che siano noti \textit{major number} e
2933 \textit{minor number} si potrà costruire il relativo identificativo con la
2934 macro \macro{makedev}:
2940 \fdecl{dev\_t \macrod{makedev}(int major, int minor)}
2941 \fdesc{Dati \textit{major number} e \textit{minor number} restituisce
2942 l'identificativo di un dispositivo.}
2948 \itindend{major~number}
2949 \itindend{minor~number}
2950 \index{file!di~dispositivo|)}
2952 Dato che la funzione di sistema \func{mknod} presenta diverse varianti nei
2953 vari sistemi unix-like, lo standard POSIX.1-2001 la dichiara portabile solo in
2954 caso di creazione delle \textit{fifo}, ma anche in questo caso alcune
2955 combinazioni degli argomenti restano non specificate, per cui nello stesso
2956 standard è stata introdotta una funzione specifica per creare una
2957 \textit{fifo} deprecando l'uso di \func{mknod} a tale riguardo. La funzione è
2958 \funcd{mkfifo} ed il suo prototipo è:
2963 \fdecl{int mkfifo(const char *pathname, mode\_t mode)}
2964 \fdesc{Crea una \textit{fifo}.}
2966 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2967 caso \var{errno} assumerà \errval{EACCES}, \errval{EEXIST},
2968 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC}, \errval{ENOTDIR} e
2969 \errval{EROFS} nel loro significato generico.}
2972 La funzione crea la \textit{fifo} \param{pathname} con i
2973 permessi \param{mode}. Come per \func{mknod} il file \param{pathname} non deve
2974 esistere (neanche come collegamento simbolico); al solito i permessi
2975 specificati da \param{mode} vengono modificati dal valore di \textit{umask}
2976 (vedi sez.~\ref{sec:file_perm_management}).
2978 \index{file!speciali|)}
2981 \subsection{I file temporanei}
2982 \label{sec:file_temp_file}
2984 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
2985 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
2986 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
2987 creare il file dopo aver controllato che questo non esista, nel momento fra il
2988 controllo e la creazione si ha giusto lo spazio per una possibile \textit{race
2989 condition} (si ricordi quanto visto in sez.~\ref{sec:proc_race_cond}).
2991 \itindbeg{symlink~attack}
2993 Molti problemi di sicurezza derivano proprio da una creazione non accorta di
2994 file temporanei che lascia aperta questa \textit{race condition}. Un
2995 attaccante allora potrà sfruttarla con quello che viene chiamato
2996 ``\textit{symlink attack}'' dove nell'intervallo fra la generazione di un nome
2997 e l'accesso allo stesso, viene creato un collegamento simbolico con quel nome
2998 verso un file diverso, ottenendo, se il programma sotto attacco ne ha la
2999 capacità, un accesso privilegiato.\footnote{dal kernel 3.6 sono state
3000 introdotte delle contromisure, illustrate in
3001 sez.~\ref{sec:procadv_security_misc}, che rendono impraticabili questo tipo
3002 di attacchi, ma questa non è una buona scusa per ignorare il problema.}
3004 \itindend{symlink~attack}
3006 La \acr{glibc} provvede varie funzioni per generare nomi di file temporanei,
3007 di cui si abbia certezza di unicità al momento della generazione; storicamente
3008 la prima di queste funzioni create a questo scopo era
3009 \funcd{tmpnam},\footnote{la funzione è stata deprecata nella revisione
3010 POSIX.1-2008 dello standard POSIX.} il cui prototipo è:
3014 \fdecl{char *tmpnam(char *string)}
3015 \fdesc{Genera un nome univoco per un file temporaneo.}
3017 {La funzione ritorna il puntatore alla stringa con il nome in caso di successo
3018 e \val{NULL} in caso di fallimento, non sono definiti errori.}
3021 La funzione restituisce il puntatore ad una stringa contente un nome di file
3022 valido e non esistente al momento dell'invocazione. Se si è passato come
3023 argomento \param{string} un puntatore non nullo ad un buffer di caratteri
3024 questo deve essere di dimensione \constd{L\_tmpnam} ed il nome generato vi
3025 verrà copiato automaticamente, altrimenti il nome sarà generato in un buffer
3026 statico interno che verrà sovrascritto ad una chiamata successiva. Successive
3027 invocazioni della funzione continueranno a restituire nomi unici fino ad un
3028 massimo di \constd{TMP\_MAX} volte, limite oltre il quale il comportamento è
3029 indefinito. Al nome viene automaticamente aggiunto come prefisso la directory
3030 specificata dalla costante \constd{P\_tmpdir}.\footnote{le costanti
3031 \const{L\_tmpnam}, \const{P\_tmpdir} e \const{TMP\_MAX} sono definite in
3032 \headfile{stdio.h}.}
3034 Di questa funzione esiste una versione rientrante, \funcm{tmpnam\_r}, che non
3035 fa nulla quando si passa \val{NULL} come argomento. Una funzione simile,
3036 \funcd{tempnam}, permette di specificare un prefisso per il file
3037 esplicitamente, il suo prototipo è:
3041 \fdecl{char *tempnam(const char *dir, const char *pfx)}
3042 \fdesc{Genera un nome univoco per un file temporaneo.}
3044 {La funzione ritorna il puntatore alla stringa con il nome in caso di successo
3045 e \val{NULL} per un errore, nel qual caso \var{errno} potrà assumere solo il
3046 valore \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
3049 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
3050 per cui è sempre rientrante, occorre però ricordarsi di disallocare con
3051 \code{free} il puntatore che restituisce. L'argomento \param{pfx} specifica
3052 un prefisso di massimo 5 caratteri per il nome provvisorio. La funzione
3053 assegna come directory per il file temporaneo, verificando che esista e sia
3054 accessibile, la prima valida fra le seguenti:
3056 \item la variabile di ambiente \envvar{TMPDIR} (non ha effetto se non è
3057 definita o se il programma chiamante è \acr{suid} o \acr{sgid}, vedi
3058 sez.~\ref{sec:file_special_perm}),
3059 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}),
3060 \item il valore della costante \const{P\_tmpdir},
3061 \item la directory \file{/tmp}.
3064 In ogni caso, anche se con queste funzioni la generazione del nome è casuale,
3065 ed è molto difficile ottenere un nome duplicato, nulla assicura che un altro
3066 processo non possa avere creato, fra l'ottenimento del nome e l'apertura del
3067 file, un altro file o un collegamento simbolico con lo stesso nome. Per questo
3068 motivo quando si usa il nome ottenuto da una di queste funzioni occorre sempre
3069 assicurarsi che non si stia usando un collegamento simbolico e aprire il nuovo
3070 file in modalità di esclusione (cioè con l'opzione \const{O\_EXCL} per i file
3071 descriptor o con il flag ``\texttt{x}'' per gli \textit{stream}) che fa
3072 fallire l'apertura in caso il file sia già esistente. Essendo disponibili
3073 alternative migliori l'uso di queste funzioni è deprecato.
3075 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
3076 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
3077 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
3081 \fdecl{FILE *tmpfile(void)}
3082 \fdesc{Apre un file temporaneo in lettura/scrittura.}
3084 {La funzione ritorna il puntatore allo \textit{stream} associato al file
3085 temporaneo in caso di successo e \val{NULL} per un errore, nel qual caso
3086 \var{errno} assumerà uno dei valori:
3088 \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
3089 \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
3091 ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
3092 \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES} nel loro significato
3097 La funzione restituisce direttamente uno \textit{stream} già aperto (in
3098 modalità \code{w+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso,
3099 che viene automaticamente cancellato alla sua chiusura o all'uscita dal
3100 programma. Lo standard non specifica in quale directory verrà aperto il file,
3101 ma la \acr{glibc} prima tenta con \const{P\_tmpdir} e poi con
3102 \file{/tmp}. Questa funzione è rientrante e non soffre di problemi di
3103 \textit{race condition}.
3105 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
3106 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
3107 modificano una stringa di input che serve da modello e che deve essere
3108 conclusa da 6 caratteri ``\texttt{X}'' che verranno sostituiti da un codice
3109 unico. La prima delle due è analoga a \func{tmpnam} e genera soltanto un nome
3110 casuale, il suo prototipo è:
3114 \fdecl{char *mktemp(char *template)}
3115 \fdesc{Genera un nome univoco per un file temporaneo.}
3117 {La funzione ritorna il puntatore a \param{template} in caso di successo e
3118 \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori:
3120 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3124 La funzione genera un nome univoco sostituendo le \code{XXXXXX} finali di
3125 \param{template}; dato che \param{template} deve poter essere modificata dalla
3126 funzione non si può usare una stringa costante. Tutte le avvertenze riguardo
3127 alle possibili \textit{race condition} date per \func{tmpnam} continuano a
3128 valere; inoltre in alcune vecchie implementazioni il valore usato per
3129 sostituire le \code{XXXXXX} viene formato con il \ids{PID} del processo più
3130 una lettera, il che mette a disposizione solo 26 possibilità diverse per il
3131 nome del file, e rende il nome temporaneo facile da indovinare. Per tutti
3132 questi motivi la funzione è deprecata e non dovrebbe mai essere usata.
3134 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
3135 \func{tmpfile}, ma restituisce un file descriptor invece di un nome; il suo
3140 \fdecl{int mkstemp(char *template)}
3141 \fdesc{Apre un file temporaneo.}
3144 {La funzione ritorna il file descriptor in caso di successo e $-1$ per un
3146 caso \var{errno} assumerà uno dei valori:
3148 \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
3149 contenuto di \param{template} è indefinito.
3150 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3154 Come per \func{mktemp} anche in questo caso \param{template} non può essere
3155 una stringa costante. La funzione apre un file in lettura/scrittura con la
3156 funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
3157 sez.~\ref{sec:file_open_close}), in questo modo al ritorno della funzione si
3158 ha la certezza di essere stati i creatori del file, i cui permessi (si veda
3159 sez.~\ref{sec:file_perm_overview}) sono impostati al valore \code{0600}
3160 (lettura e scrittura solo per il proprietario).\footnote{questo è vero a
3161 partire dalla \acr{glibc} 2.0.7, le versioni precedenti della \acr{glibc} e
3162 le vecchie \acr{libc5} e \acr{libc4} usavano il valore \code{0666} che
3163 permetteva a chiunque di leggere e scrivere i contenuti del file.} Di
3164 questa funzione esiste una variante \funcd{mkostemp}, introdotta
3165 specificamente dalla \acr{glibc},\footnote{la funzione è stata introdotta
3166 nella versione 2.7 delle librerie e richiede che sia definita la macro
3167 \macro{\_GNU\_SOURCE}.} il cui prototipo è:
3171 \fdecl{int mkostemp(char *template, int flags)}
3172 \fdesc{Apre un file temporaneo.}
3174 {La funzione ritorna un file descriptor in caso di successo e $-1$ per un
3175 errore, nel qual caso \var{errno} assumerà gli stessi valori di
3178 \noindent la cui sola differenza è la presenza dell'ulteriore argomento
3179 \var{flags} che consente di specificare alcuni ulteriori flag (come
3180 \const{O\_APPEND}, \const{O\_CLOEXEC}, \const{O\_SYNC}, il cui significato
3181 vedremo in sez.~\ref{sec:file_open_close}) da passare ad \func{open}
3182 nell'apertura del file.\footnote{si tenga presente che \func{mkostemp}
3183 utilizza già \const{O\_CREAT}, \const{O\_EXCL} e \const{O\_RDWR}, che non è
3184 il caso di riindicare, dato che ciò potrebbe portare ad errori in altri
3187 Di queste due funzioni sono state poi introdotte, a partire dalla \acr{glibc}
3188 2.11 due varianti, \funcd{mkstemps} e \funcd{mkostemps}, che consentono di
3189 indicare anche un suffisso, i loro prototipi sono:
3193 \fdecl{int mkstemps(char *template, int suffixlen)}
3194 \fdesc{Apre un file temporaneo.}
3195 \fdecl{int mkostemps(char *template, int suffixlen, int flags)}
3196 \fdesc{Apre un file temporaneo.}
3199 {Le funzioni hanno gli stessi valori di ritorno e gli stessi errori di
3200 \func{mkstemp} con lo stesso significato, tranne \errval{EINVAL} che viene
3201 restituito se \param{template} non è di lunghezza pari ad almeno
3202 $6+$\param{suffixlen} ed i 6 caratteri prima del suffisso non sono
3206 Le due funzioni, un'estensione non standard fornita dalla \acr{glibc}, sono
3207 identiche a \funcd{mkstemp} e \funcd{mkostemp}, ma consentono di avere un nome
3208 del file nella forma \texttt{prefissoXXXXXXsuffisso} dove la lunghezza del
3209 suffisso deve essere indicata con \param{suffixlen}.
3211 Infine con OpenBSD è stata introdotta un'altra funzione simile alle
3212 precedenti, \funcd{mkdtemp}, che crea invece una directory
3213 temporanea;\footnote{la funzione è stata introdotta nella \acr{glibc} a
3214 partire dalla versione 2.1.91 ed inserita nello standard POSIX.1-2008.} il
3219 \fdecl{char *mkdtemp(char *template)}
3220 \fdesc{Crea una directory temporanea.}
3222 {La funzione ritorna il puntatore al nome della directory in caso di successo
3223 e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei
3226 \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3228 più gli altri eventuali codici di errore di \func{mkdir}.}
3231 La funzione crea una directory temporanea il cui nome è ottenuto sostituendo
3232 le \code{XXXXXX} finali di \param{template} con permessi \code{0700} (si veda
3233 sez.~\ref{sec:file_perm_overview} per i dettagli). Dato che la creazione della
3234 directory è sempre atomica i precedenti problemi di \textit{race condition}
3238 \section{La manipolazione delle caratteristiche dei file}
3239 \label{sec:file_infos}
3241 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
3242 relative alle caratteristiche di ciascun file, a partire dalle informazioni
3243 relative al controllo di accesso, sono mantenute nell'\textit{inode}. Vedremo
3244 in questa sezione come sia possibile leggere tutte queste informazioni usando
3245 la funzione \func{stat}, che permette l'accesso a tutti i dati memorizzati
3246 nell'\textit{inode}; esamineremo poi le varie funzioni usate per manipolare
3247 tutte queste informazioni, eccetto quelle che riguardano la gestione del
3248 controllo di accesso, trattate in sez.~\ref{sec:file_access_control}.
3251 \subsection{La lettura delle caratteristiche dei file}
3252 \label{sec:file_stat}
3254 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
3255 delle funzioni \func{stat} che sono quelle che usa il comando \cmd{ls} per
3256 poter ottenere e mostrare tutti i dati relativi ad un file; ne fanno parte le
3257 funzioni di sistema \funcd{stat}, \funcd{fstat} e \funcd{lstat}, i cui
3264 \fdecl{int stat(const char *file\_name, struct stat *buf)}
3265 \fdecl{int lstat(const char *file\_name, struct stat *buf)}
3266 \fdecl{int fstat(int filedes, struct stat *buf)}
3267 \fdesc{Leggono le informazioni di un file.}
3269 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3270 caso \var{errno} assumerà uno dei valori:
3272 \item[\errcode{EOVERFLOW}] il file ha una dimensione che non può essere
3273 rappresentata nel tipo \type{off\_t} (può avvenire solo in caso di
3274 programmi compilati su piattaforme a 32 bit senza le estensioni
3275 (\texttt{-D \_FILE\_OFFSET\_BITS=64}) per file a 64 bit).
3277 ed inoltre \errval{EFAULT} ed \errval{ENOMEM}, per \func{stat} e
3278 \func{lstat} anche \errval{EACCES}, \errval{ELOOP}, \errval{ENAMETOOLONG},
3279 \errval{ENOENT}, \errval{ENOTDIR}, per \func{fstat} anche \errval{EBADF},
3280 nel loro significato generico.}
3283 La funzione \func{stat} legge le informazioni del file indicato
3284 da \param{file\_name} e le inserisce nel buffer puntato
3285 dall'argomento \param{buf}; la funzione \func{lstat} è identica a \func{stat}
3286 eccetto che se \param{file\_name} è un collegamento simbolico vengono lette le
3287 informazioni relative ad esso e non al file a cui fa riferimento. Infine
3288 \func{fstat} esegue la stessa operazione su un file già aperto, specificato
3289 tramite il suo file descriptor \param{filedes}.
3291 La struttura \struct{stat} usata da queste funzioni è definita nell'header
3292 \headfiled{sys/stat.h} e in generale dipende dall'implementazione; la versione
3293 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
3294 riportata dalla pagina di manuale di \func{stat}. In realtà la definizione
3295 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
3296 riservati per estensioni come tempi dei file più precisi (vedi
3297 sez.~\ref{sec:file_file_times}).
3299 \begin{figure}[!htb]
3302 \begin{minipage}[c]{0.8\textwidth}
3303 \includestruct{listati/stat.h}
3306 \caption{La struttura \structd{stat} per la lettura delle informazioni dei
3308 \label{fig:file_stat_struct}
3311 Si noti come i vari membri della struttura siano specificati come tipi
3312 primitivi del sistema, di quelli definiti in
3313 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \headfile{sys/types.h},
3314 con l'eccezione di \typed{blksize\_t} e \typed{blkcnt\_t} che sono nuovi tipi
3315 introdotti per rendersi indipendenti dalla piattaforma.
3317 Benché la descrizione dei commenti di fig.~\ref{fig:file_stat_struct} sia
3318 abbastanza chiara, vale la pena illustrare maggiormente il significato dei
3319 campi di \struct{stat} su cui non torneremo in maggior dettaglio nel resto di
3322 \item Il campo \var{st\_nlink} contiene il numero di \textit{hard link} che
3323 fanno riferimento al file (il cosiddetto \textit{link count}) di cui abbiamo
3324 già parlato in numerose occasioni.
3325 \item Il campo \var{st\_ino} contiene il numero di \textit{inode} del file,
3326 quello viene usato all'interno del filesystem per identificarlo e che può
3327 essere usato da un programma per determinare se due \textit{pathname} fanno
3328 riferimento allo stesso file.
3329 \item Il campo \var{st\_dev} contiene il numero del dispositivo su cui risiede
3330 il file (o meglio il suo filesystem). Si tratta dello stesso numero che si
3331 usa con \func{mknod} e che può essere decomposto in \textit{major number} e
3332 \textit{minor number} con le macro \macro{major} e \macro{minor} viste in
3333 sez.~\ref{sec:file_mknod}.
3334 \item Il campo \var{st\_rdev} contiene il numero di dispositivo associato al
3335 file stesso ed ovviamente ha un valore significativo soltanto quando il file
3336 è un dispositivo a caratteri o a blocchi.
3337 \item Il campo \var{st\_blksize} contiene la dimensione dei blocchi di dati
3338 usati nell'I/O su disco, che è anche la dimensione usata per la
3339 bufferizzazione dei dati dalle librerie del C per l'interfaccia degli
3340 \textit{stream}. Leggere o scrivere blocchi di dati in dimensioni inferiori
3341 a questo valore è inefficiente in quanto le operazioni su disco usano
3342 comunque trasferimenti di questa dimensione.
3345 Nell'evoluzione del kernel la \textit{system call} che fornisce \func{stat} è
3346 stata modificata più volte per tener conto dei cambiamenti fatti alla
3347 struttura \struct{stat},\footnote{questo ha significato l'utilizzo a basso
3348 livello di diverse \textit{system call} e diverse versioni della struttura.}
3349 in particolare a riguardo ai tempi dei file, di cui è stata aumentata la
3350 precisione (torneremo su questo in sez.~\ref{sec:file_file_times}) ma anche
3351 per gli aggiornamenti fatti ai campi \var{st\_ino}, \var{st\_uid} e
3354 Sulle piattaforme a 32 bit questi cambiamenti, che han visto un aumento delle
3355 dimensioni dei campi della struttura per adattarli alle nuove esigenze, sono
3356 mascherati dalla \acr{glibc} che attraverso \func{stat} invoca la versione più
3357 recente della \textit{system call} e rimpacchetta i dati se questo è
3358 necessario per eseguire dei vecchi programmi. Nelle piattaforme a 64 bit
3359 invece è presente un'unica versione della \textit{system call} e la struttura
3360 \struct{stat} ha campi di dimensione sufficiente.
3362 Infine a partire dal kernel 2.6.16 è stata introdotta una ulteriore funzione
3363 della famiglia, \func{fstatat} che consente di trattare con sicurezza i
3364 \textit{pathname} relativi, la tratteremo in sez.~\ref{sec:file_openat},
3365 insieme alla nuova \textit{system call} \func{statx}, introdotta dal kernel
3366 4.11 per estendere l'interfaccia di \func{stat} e le informazioni che essa può
3370 \subsection{I tipi di file}
3371 \label{sec:file_types}
3373 Abbiamo sottolineato fin dall'introduzione che Linux, come ogni sistema
3374 unix-like, supporta oltre ai file ordinari e alle directory una serie di altri
3375 ``\textsl{tipi}'' di file che possono stare su un filesystem (elencati in
3376 tab.~\ref{tab:file_file_types}). Il tipo di file viene ritornato dalle
3377 funzioni della famiglia \func{stat} all'interno del campo \var{st\_mode} di
3378 una struttura \struct{stat}.
3383 \begin{tabular}[c]{|l|l|}
3385 \textbf{Macro} & \textbf{Tipo del file} \\
3388 \macrod{S\_ISREG}\texttt{(m)} & File normale.\\
3389 \macrod{S\_ISDIR}\texttt{(m)} & Directory.\\
3390 \macrod{S\_ISCHR}\texttt{(m)} & Dispositivo a caratteri.\\
3391 \macrod{S\_ISBLK}\texttt{(m)} & Dispositivo a blocchi.\\
3392 \macrod{S\_ISFIFO}\texttt{(m)} & \textit{Fifo}.\\
3393 \macrod{S\_ISLNK}\texttt{(m)} & Collegamento simbolico.\\
3394 \macrod{S\_ISSOCK}\texttt{(m)} & Socket.\\
3397 \caption{Macro per i tipi di file (definite in \headfile{sys/stat.h}).}
3398 \label{tab:file_type_macro}
3401 Il campo \var{st\_mode} è una maschera binaria in cui l'informazione viene
3402 suddivisa nei vari bit che compongono, ed oltre a quelle sul tipo di file,
3403 contiene anche le informazioni relative ai permessi su cui torneremo in
3404 sez.~\ref{sec:file_perm_overview}. Dato che i valori numerici usati per
3405 definire il tipo di file possono variare a seconda delle implementazioni, lo
3406 standard POSIX definisce un insieme di macro che consentono di verificare il
3407 tipo di file in maniera standardizzata.
3409 Queste macro vengono usate anche da Linux che supporta pure le estensioni allo
3410 standard per i collegamenti simbolici e i socket definite da BSD.\footnote{le
3411 ultime due macro di tab.~\ref{tab:file_type_macro}, che non sono presenti
3412 nello standard POSIX fino alla revisione POSIX.1-1996.} L'elenco completo
3413 delle macro con cui è possibile estrarre da \var{st\_mode} l'informazione
3414 relativa al tipo di file è riportato in tab.~\ref{tab:file_type_macro}, tutte
3415 le macro restituiscono un valore intero da usare come valore logico e prendono
3416 come argomento il valore di \var{st\_mode}.
3421 \begin{tabular}[c]{|l|c|l|}
3423 \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
3426 \constd{S\_IFMT} & 0170000 & Maschera per i bit del tipo di file.\\
3427 \constd{S\_IFSOCK} & 0140000 & Socket.\\
3428 \constd{S\_IFLNK} & 0120000 & Collegamento simbolico.\\
3429 \constd{S\_IFREG} & 0100000 & File regolare.\\
3430 \constd{S\_IFBLK} & 0060000 & Dispositivo a blocchi.\\
3431 \constd{S\_IFDIR} & 0040000 & Directory.\\
3432 \constd{S\_IFCHR} & 0020000 & Dispositivo a caratteri.\\
3433 \constd{S\_IFIFO} & 0010000 & \textit{Fifo}.\\
3435 \constd{S\_ISUID} & 0004000 & Set user ID (\acr{suid}) bit, vedi
3436 sez.~\ref{sec:file_special_perm}).\\
3437 \constd{S\_ISGID} & 0002000 & Set group ID (\acr{sgid}) bit, vedi
3438 sez.~\ref{sec:file_special_perm}).\\
3439 \constd{S\_ISVTX} & 0001000 & \acr{Sticky} bit, vedi
3440 sez.~\ref{sec:file_special_perm}).\\
3442 \constd{S\_IRWXU} & 00700 & Maschera per i permessi del proprietario.\\
3443 \constd{S\_IRUSR} & 00400 & Il proprietario ha permesso di lettura.\\
3444 \constd{S\_IWUSR} & 00200 & Il proprietario ha permesso di scrittura.\\
3445 \constd{S\_IXUSR} & 00100 & Il proprietario ha permesso di esecuzione.\\
3447 \constd{S\_IRWXG} & 00070 & Maschera per i permessi del gruppo.\\
3448 \constd{S\_IRGRP} & 00040 & Il gruppo ha permesso di lettura.\\
3449 \constd{S\_IWGRP} & 00020 & Il gruppo ha permesso di scrittura.\\
3450 \constd{S\_IXGRP} & 00010 & Il gruppo ha permesso di esecuzione.\\
3452 \constd{S\_IRWXO} & 00007 & Maschera per i permessi di tutti gli altri\\
3453 \constd{S\_IROTH} & 00004 & Gli altri hanno permesso di lettura.\\
3454 \constd{S\_IWOTH} & 00002 & Gli altri hanno permesso di esecuzione.\\
3455 \constd{S\_IXOTH} & 00001 & Gli altri hanno permesso di esecuzione.\\
3458 \caption{Costanti per l'identificazione dei vari bit che compongono il campo
3459 \var{st\_mode} (definite in \headfile{sys/stat.h}).}
3460 \label{tab:file_mode_flags}
3463 Oltre alle macro di tab.~\ref{tab:file_type_macro}, che semplificano
3464 l'operazione, è possibile usare direttamente il valore di \var{st\_mode} per
3465 ricavare il tipo di file controllando direttamente i vari bit in esso
3466 memorizzati. Per questo sempre in \headfile{sys/stat.h} sono definite le varie
3467 costanti numeriche riportate in tab.~\ref{tab:file_mode_flags}, che
3468 definiscono le maschere che consentono di selezionare non solo i dati relativi
3469 al tipo di file, ma anche le informazioni relative ai permessi su cui
3470 torneremo in sez.~\ref{sec:file_access_control}, ed identificare i rispettivi
3473 Le costanti che servono per la identificazione del tipo di file sono riportate
3474 nella prima sezione di tab.~\ref{tab:file_mode_flags}, mentre le sezioni
3475 successive attengono alle costanti usate per i permessi. Il primo valore
3476 dell'elenco è la maschera binaria \const{S\_IFMT} che permette di estrarre da
3477 \var{st\_mode} (con un AND aritmetico) il blocco di bit nei quali viene
3478 memorizzato il tipo di file. I valori successivi sono le costanti
3479 corrispondenti ai vari tipi di file, e possono essere usate per verificare la
3480 presenza del tipo di file voluto ed anche, con opportune combinazioni,
3481 alternative fra più tipi di file.
3483 Si tenga presente però che a differenza dei permessi, l'informazione relativa
3484 al tipo di file non è una maschera binaria, per questo motivo se si volesse
3485 impostare una condizione che permetta di controllare se un file è una
3486 directory o un file ordinario non si possono controllare dei singoli bit, ma
3487 si dovrebbe usare una macro di preprocessore come:
3488 \includecodesnip{listati/is_regdir.h}
3489 in cui si estraggono ogni volta da \var{st\_mode} i bit relativi al tipo di
3490 file e poi si effettua il confronto con i due possibili tipi di file.
3493 \subsection{Le dimensioni dei file}
3494 \label{sec:file_file_size}
3496 Abbiamo visto in fig.~\ref{fig:file_stat_struct} che campo \var{st\_size} di
3497 una struttura \struct{stat} contiene la dimensione del file in byte. In realtà
3498 questo è vero solo se si tratta di un file regolare contenente dei dati; nel
3499 caso di un collegamento simbolico invece la dimensione è quella del
3500 \textit{pathname} che il collegamento stesso contiene, e per una directory
3501 quella dello spazio occupato per le voci della stessa (che dipende da come
3502 queste vengono mantenute dal filesystem), infine per le \textit{fifo}, i socket
3503 ed i file di dispositivo questo campo è sempre nullo.
3505 Il campo \var{st\_blocks} invece definisce la lunghezza del file espressa in
3506 numero di blocchi di 512 byte. La differenza con \var{st\_size} è che in
3507 questo caso si fa riferimento alla quantità di spazio disco allocata per il
3508 file, e non alla dimensione dello stesso che si otterrebbe leggendolo
3511 Si deve tener presente infatti che la lunghezza del file riportata in
3512 \var{st\_size} non è detto che corrisponda all'occupazione dello spazio su
3513 disco, e non solo perché la parte finale del file potrebbe riempire
3514 parzialmente un blocco. In un sistema unix-like infatti è possibile
3515 l'esistenza dei cosiddetti \textit{sparse file}, cioè file in cui sono
3516 presenti dei ``\textsl{buchi}'' (\textit{holes} nella nomenclatura inglese)
3517 che si formano tutte le volte che si va a scrivere su un file dopo aver
3518 eseguito uno spostamento oltre la sua fine (tratteremo in dettaglio
3519 l'argomento in sez.~\ref{sec:file_lseek}).
3521 In questo caso si avranno risultati differenti a seconda del modo in cui si
3522 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
3523 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
3524 legge il contenuto del file (ad esempio usando il comando \cmd{wc -c}), dato
3525 che in tal caso per i ``\textsl{buchi}'' vengono restituiti degli zeri, si
3526 avrà lo stesso risultato di \cmd{ls}.
3528 Se è sempre possibile allargare un file, scrivendoci sopra o usando la
3529 funzione \func{lseek} (vedi sez.~\ref{sec:file_lseek}) per spostarsi oltre la
3530 sua fine, esistono anche casi in cui si può avere bisogno di effettuare un
3531 troncamento, scartando i dati presenti al di là della dimensione scelta come
3532 nuova fine del file.
3534 Un file può sempre essere troncato a zero aprendolo con il flag
3535 \const{O\_TRUNC} (vedi sez.~\ref{sec:file_open_close}), ma questo è un caso
3536 particolare; per qualunque altra dimensione si possono usare le due funzioni
3537 di sistema \funcd{truncate} e \funcd{ftruncate}, i cui prototipi sono:
3541 \fdecl{int ftruncate(int fd, off\_t length))}
3542 \fdecl{int truncate(const char *file\_name, off\_t length)}
3543 \fdesc{Troncano un file.}
3545 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3546 caso \var{errno} assumerà uno dei valori:
3548 \item[\errcode{EINTR}] si è stati interrotti da un segnale.
3549 \item[\errcode{EINVAL}] \param{length} è negativa o maggiore delle
3550 dimensioni massime di un file.
3551 \item[\errcode{EPERM}] il filesystem non supporta il troncamento di un file.
3552 \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
3554 per entrambe, mentre per \func{ftruncate} si avranno anche:
3556 \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3557 \item[\errcode{EINVAL}] \param{fd} non è un riferimento a un file o non è
3558 aperto in scrittura.
3560 e per \func{truncate} si avranno anche:
3562 \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file o il
3563 permesso di attraversamento di una delle componenti del \textit{pathname}.
3564 \item[\errcode{EISDIR}] \param{file\_name} fa riferimento ad una directory.
3566 ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
3567 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR} e \errval{EROFS}
3568 nel loro significato generico.}
3571 Entrambe le funzioni fan sì che la dimensione del file sia troncata ad un
3572 valore massimo specificato da \param{length}, e si distinguono solo per il
3573 fatto che il file viene indicato con un \textit{pathname} per \func{truncate}
3574 e con un file descriptor per \funcd{ftruncate}. Si tenga presente che se il
3575 file è più lungo della lunghezza specificata i dati in eccesso saranno
3578 Il comportamento in caso di lunghezza del file inferiore a \param{length} non
3579 è specificato e dipende dall'implementazione: il file può essere lasciato
3580 invariato o esteso fino alla lunghezza scelta. Nel caso di Linux viene esteso
3581 con la creazione di un \textsl{buco} nel file e ad una lettura si otterranno
3582 degli zeri, si tenga presente però che questo comportamento è supportato solo
3583 per filesystem nativi, ad esempio su un filesystem non nativo come il VFAT di
3584 Windows questo non è possibile.
3587 \subsection{I tempi dei file}
3588 \label{sec:file_file_times}
3590 Il sistema mantiene per ciascun file tre tempi, che sono registrati
3591 nell'\textit{inode} insieme agli altri attributi del file. Questi possono
3592 essere letti tramite la funzione \func{stat}, che li restituisce attraverso
3593 tre campi della struttura \struct{stat} di fig.~\ref{fig:file_stat_struct}. Il
3594 significato di questi tempi e dei relativi campi della struttura \struct{stat}
3595 è illustrato nello schema di tab.~\ref{tab:file_file_times}, dove è anche
3596 riportato un esempio delle funzioni che effettuano cambiamenti su di essi. Il
3597 valore del tempo è espresso nel cosiddetto \textit{calendar time}, su cui
3598 torneremo in dettaglio in sez.~\ref{sec:sys_time}.
3603 \begin{tabular}[c]{|c|l|l|c|}
3605 \textbf{Membro} & \textbf{Significato} & \textbf{Funzione}
3606 & \textbf{Opzione di \cmd{ls}} \\
3609 \var{st\_atime}& ultimo accesso ai dati del file &
3610 \func{read}, \func{utime} & \cmd{-u}\\
3611 \var{st\_mtime}& ultima modifica ai dati del file &
3612 \func{write}, \func{utime} & default\\
3613 \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
3614 \func{chmod}, \func{utime} & \cmd{-c}\\
3617 \caption{I tre tempi associati a ciascun file.}
3618 \label{tab:file_file_times}
3621 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
3622 ultima modifica (il \textit{modification time}) riportato in \var{st\_mtime},
3623 ed il tempo di ultimo cambiamento di stato (il \textit{change status time})
3624 riportato in \var{st\_ctime}. Il primo infatti fa riferimento ad una modifica
3625 del contenuto di un file, mentre il secondo ad una modifica dei metadati
3626 dell'\textit{inode}. Dato che esistono molte operazioni, come la funzione
3627 \func{link} e altre che vedremo in seguito, che modificano solo le
3628 informazioni contenute nell'\textit{inode} senza toccare il contenuto del
3629 file, diventa necessario l'utilizzo di questo secondo tempo.
3631 Il tempo di ultima modifica viene usato ad esempio da programmi come
3632 \cmd{make} per decidere quali file necessitano di essere ricompilati perché
3633 più recenti dei loro sorgenti oppure dai programmi di backup, talvolta insieme
3634 anche al tempo di cambiamento di stato, per decidere quali file devono essere
3635 aggiornati nell'archiviazione. Il tempo di ultimo accesso viene di solito
3636 usato per identificare i file che non vengono più utilizzati per un certo
3637 lasso di tempo. Ad esempio un programma come \texttt{leafnode} lo usa per
3638 cancellare gli articoli letti più vecchi, mentre \texttt{mutt} lo usa per
3639 marcare i messaggi di posta che risultano letti.
3641 Il sistema non tiene mai conto dell'ultimo accesso all'\textit{inode},
3642 pertanto funzioni come \func{access} o \func{stat} non hanno alcuna influenza
3643 sui tre tempi. Il comando \cmd{ls} (quando usato con le opzioni \cmd{-l} o
3644 \cmd{-t}) mostra i tempi dei file secondo lo schema riportato nell'ultima
3645 colonna di tab.~\ref{tab:file_file_times}. Si noti anche come in
3646 tab.~\ref{tab:file_file_times} non venga riportato il \textsl{tempo di
3647 creazione} di un file; in un sistema unix-like infatti questo non esiste, e
3648 non è previsto dall'interfaccia classica, ma essendo usato da altri sistemi
3649 operativi (in particolare Windows) in tutti i filesystem più recenti ne viene
3650 supportata la registrazione, ed a partire dal kernel 4.11 è diventato
3651 possibile anche ottenerne la lettura con la nuova \textit{system call}
3652 \func{statx} (che tratteremo in sez.~\ref{sec:file_openat}).
3654 L'aggiornamento del tempo di ultimo accesso è stato a lungo considerato un
3655 difetto progettuale di Unix, questo infatti comporta la necessità di
3656 effettuare un accesso in scrittura sul disco anche in tutti i casi in cui
3657 questa informazione non interessa e sarebbe possibile avere un semplice
3658 accesso in lettura sui dati bufferizzati. Questo comporta un ovvio costo sia
3659 in termini di prestazioni, che di consumo di risorse come la batteria per i
3660 portatili, o i cicli di riscrittura per i dischi su memorie riscrivibili.
3662 Per questo motivo abbiamo visto in sez.~\ref{sec:filesystem_mounting} come nel
3663 corso dello sviluppo del kernel siano stati introdotti degli opportuni
3664 \textit{mount flag} che consentono di evitare di aggiornare continuamente una
3665 informazione che nella maggior parte dei casi non ha un interesse
3666 rilevante. Per questo motivo i valori dell'\textit{access time} possono
3667 dipendere dalle opzioni di montaggio, ed anche, essendo stato cambiato il
3668 comportamento di default a partire dalla versione 2.6.30, dal kernel che si
3671 In generale quello che avviene con i kernel più recenti è che il tempo di
3672 ultimo accesso viene aggiornato solo se è precedente al tempo di ultima
3673 modifica o cambiamento, o se è cambiato ed passato più di un giorno
3674 dall'ultimo aggiornamento. Così si può rendere evidente che vi è stato un
3675 accesso dopo una modifica, e che il file viene comunque osservato a cadenza
3676 regolare, conservando le informazioni veramente utili senza consumare
3677 inutilmente risorse in continue scritture per mantenere costantemente
3678 aggiornata una informazione che a questo punto non ha più nessuna rilevanza
3679 pratica.\footnote{qualora ce ne fosse la necessità è comunque possibile,
3680 tramite l'opzione di montaggio \texttt{strictatime}, richiedere in ogni caso
3681 il comportamento tradizionale.}
3686 \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
3688 \multicolumn{1}{|p{2.3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
3689 \multicolumn{3}{|p{3.2cm}|}{\centering{
3690 \textbf{File o directory del riferimento}}}&
3691 \multicolumn{3}{|p{3.2cm}|}{\centering{
3692 \textbf{Directory contenente il riferimento}}}
3693 &\multicolumn{1}{|p{3.cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
3696 \multicolumn{1}{|p{2.3cm}|}{}
3697 &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(a)}}}
3698 &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(m)}}}
3699 &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(c)}}}
3700 &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(a)}}}
3701 &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(m)}}}
3702 &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(c)}}}
3703 &\multicolumn{1}{|p{3cm}|}{} \\
3706 \func{chmod}, \func{fchmod}
3707 & -- & -- &$\bullet$& -- & -- & -- &\\
3708 \func{chown}, \func{fchown}
3709 & -- & -- &$\bullet$& -- & -- & -- &\\
3711 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
3712 con \const{O\_CREATE} \\
3714 & -- &$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
3715 con \const{O\_TRUNC} \\
3717 &$\bullet$& -- & -- & -- & -- & -- &\\
3719 & -- & -- &$\bullet$& -- & -- & -- &\\
3721 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&\\
3723 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&\\
3725 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&\\
3727 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&\\
3729 &$\bullet$&$\bullet$&$\bullet$& -- &$\bullet$&$\bullet$&
3730 con \const{O\_CREATE} \\
3732 & -- &$\bullet$&$\bullet$& -- & -- & -- &
3733 con \const{O\_TRUNC} \\
3735 &$\bullet$&$\bullet$&$\bullet$& -- & -- & -- &\\
3737 &$\bullet$& -- & -- & -- & -- & -- &\\
3739 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&
3740 se esegue \func{unlink}\\
3742 & -- & -- & -- & -- &$\bullet$&$\bullet$&
3743 se esegue \func{rmdir}\\
3745 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&
3746 per ambo gli argomenti\\
3748 & -- & -- & -- & -- &$\bullet$&$\bullet$&\\
3750 & -- &$\bullet$&$\bullet$& -- & -- & -- &\\
3752 & -- &$\bullet$&$\bullet$& -- & -- & -- &\\
3754 & -- & -- &$\bullet$& -- &$\bullet$&$\bullet$&\\
3756 &$\bullet$&$\bullet$&$\bullet$& -- & -- & -- &\\
3758 &$\bullet$&$\bullet$&$\bullet$& -- & -- & -- &\\
3760 & -- &$\bullet$&$\bullet$& -- & -- & -- &\\
3763 \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo
3764 accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento di
3765 stato \textsl{(c)} dalle varie funzioni operanti su file e directory.}
3766 \label{tab:file_times_effects}
3770 L'effetto delle varie funzioni di manipolazione dei file sui relativi tempi è
3771 illustrato in tab.~\ref{tab:file_times_effects}, facendo riferimento al
3772 comportamento classico per quanto riguarda \var{st\_atime}. Si sono riportati
3773 gli effetti sia per il file a cui si fa riferimento, sia per la directory che
3774 lo contiene. Questi ultimi possono essere capiti immediatamente se si tiene
3775 conto di quanto già detto e ripetuto a partire da
3776 sez.~\ref{sec:file_filesystem}, e cioè che anche le directory sono anch'esse
3777 file che contengono una lista di nomi, che il sistema tratta in maniera del
3778 tutto analoga a tutti gli altri.
3780 Per questo motivo tutte le volte che compiremo un'operazione su un file che
3781 comporta una modifica del nome contenuto nella directory, andremo anche a
3782 scrivere sulla directory che lo contiene cambiandone il tempo di ultima
3783 modifica. Un esempio di questo tipo di operazione può essere la cancellazione
3784 di un file, invece leggere o scrivere o cambiare i permessi di un file ha
3785 effetti solo sui tempi di quest'ultimo.
3787 Si ricordi infine come \var{st\_ctime} non è il tempo di creazione del file,
3788 che in Unix non esiste, anche se può corrispondervi per file che non sono mai
3789 stati modificati. Per questo motivo, a differenza di quanto avviene con altri
3790 sistemi operativi, quando si copia un file, a meno di preservare
3791 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
3792 avrà sempre il tempo corrente in cui si è effettuata la copia come data di
3795 I tempi di ultimo accesso ed ultima modifica possono essere modificati
3796 esplicitamente usando la funzione di sistema \funcd{utime}, il cui prototipo
3801 \fdecl{int utime(const char *filename, struct utimbuf *times)}
3802 \fdesc{Modifica i tempi di ultimo accesso ed ultima modifica di un file.}
3805 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3806 caso \var{errno} assumerà uno dei valori:
3808 \item[\errcode{EACCES}] non c'è il permesso di attraversamento per uno dei
3809 componenti di \param{filename} o \param{times} è \val{NULL} e non si ha il
3810 permesso di scrittura sul file, o non si è proprietari del file o non si
3811 hanno i privilegi di amministratore.
3812 \item[\errcode{EPERM}] \param{times} non è \val{NULL}, e non si è
3813 proprietari del file o non si hanno i privilegi di amministratore.
3815 ed inoltre \errval{ENOENT} e \errval{EROFS} nel loro significato generico.}
3818 La funzione cambia i tempi di ultimo accesso e di ultima modifica del file
3819 specificato dall'argomento \param{filename}, e richiede come secondo argomento
3820 il puntatore ad una struttura \struct{utimbuf}, la cui definizione è riportata
3821 in fig.~\ref{fig:struct_utimebuf}, con i nuovi valori di detti tempi
3822 (rispettivamente nei campi \var{actime} e \var{modtime}). Se si passa un
3823 puntatore nullo verrà impostato il tempo corrente.
3825 \begin{figure}[!htb]
3826 \footnotesize \centering
3827 \begin{minipage}[c]{0.8\textwidth}
3828 \includestruct{listati/utimbuf.h}
3831 \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
3833 \label{fig:struct_utimebuf}
3836 L'effetto della funzione ed i privilegi necessari per eseguirla dipendono dal
3837 valore dell'argomento \param{times}. Se è \val{NULL} la funzione imposta il
3838 tempo corrente ed è sufficiente avere accesso in scrittura al file o essere
3839 proprietari del file o avere i privilegi di amministratore. Se invece si è
3840 specificato un valore diverso la funzione avrà successo solo se si è
3841 proprietari del file o se si hanno i privilegi di amministratore.\footnote{per
3842 essere precisi la capacità \const{CAP\_FOWNER}, vedi
3843 sez.~\ref{sec:proc_capabilities}.} In entrambi i casi per verificare la
3844 proprietà del file viene utilizzato l'\ids{UID} effettivo del processo.
3846 Si tenga presente che non è possibile modificare manualmente il tempo di
3847 cambiamento di stato del file, che viene aggiornato direttamente dal kernel
3848 tutte le volte che si modifica l'\textit{inode}, e quindi anche alla chiamata
3849 di \func{utime}. Questo serve anche come misura di sicurezza per evitare che
3850 si possa modificare un file nascondendo completamente le proprie tracce. In
3851 realtà la cosa resta possibile se si è in grado di accedere al file di
3852 dispositivo, scrivendo direttamente sul disco senza passare attraverso il
3853 filesystem, ma ovviamente in questo modo la cosa è più complicata da
3854 realizzare.\footnote{esistono comunque molti programmi che consentono di farlo
3855 con relativa semplicità per cui non si dia per scontato che il valore sia
3856 credibile in caso di macchina compromessa.}
3858 A partire dal kernel 2.6 la risoluzione dei tempi dei file, che nei campi di
3859 tab.~\ref{tab:file_file_times} è espressa in secondi, è stata portata ai
3860 nanosecondi per la gran parte dei filesystem. L'ulteriore informazione può
3861 essere ottenuta attraverso altri campi appositamente aggiunti alla struttura
3862 \struct{stat}. Se si sono definite le macro \macro{\_BSD\_SOURCE} o
3863 \macro{\_SVID\_SOURCE} questi sono \var{st\_atim.tv\_nsec},
3864 \var{st\_mtim.tv\_nsec} e \var{st\_ctim.tv\_nsec} se queste non sono definite,
3865 \var{st\_atimensec}, \var{st\_mtimensec} e \var{st\_mtimensec}. Qualora il
3866 supporto per questa maggior precisione sia assente questi campi aggiuntivi
3869 Per la gestione di questi nuovi valori è stata definita una seconda funzione
3870 di sistema, \funcd{utimes}, che consente di specificare tempi con maggior
3871 precisione; il suo prototipo è:
3875 \fdecl{int utimes(const char *filename, struct timeval times[2])}
3876 \fdesc{Modifica i tempi di ultimo accesso e ultima modifica di un file.}
3878 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3879 caso \var{errno} assumerà gli stessi valori di \func{utime}.}
3882 La funzione è del tutto analoga alla precedente \func{utime} ma usa come
3883 secondo argomento un vettore di due strutture \struct{timeval}, la cui
3884 definizione è riportata in fig.~\ref{fig:sys_timeval_struct}, che consentono
3885 di indicare i tempi con una precisione del microsecondo. Il primo elemento
3886 di \param{times} indica il valore per il tempo di ultimo accesso, il secondo
3887 quello per il tempo di ultima modifica. Se si indica come secondo argomento un
3888 puntatore nullo di nuovo verrà utilizzato il tempo corrente.
3890 \begin{figure}[!htb]
3891 \footnotesize \centering
3892 \begin{minipage}[c]{0.8\textwidth}
3893 \includestruct{listati/timeval.h}
3896 \caption{La struttura \structd{timeval} usata per indicare valori di tempo
3897 con la precisione del microsecondo.}
3898 \label{fig:sys_timeval_struct}
3902 % Oltre ad \func{utimes} su Linux sono presenti altre due funzioni per la
3903 % manipolazione dei tempi dei file,\footnote{le due funzioni non sono definite
3904 % in nessuno standard, ma sono presenti, oltre che su Linux, anche su BSD;
3905 % sono accessibili definendo \macro{\_DEFAULT\_SOURCE} dalla \acr{glibc} 2.19
3906 % o \macro{\_GNU\_SOURCE} prima.} la prima è \funcd{futimes} e consente di
3907 % effettuare la modifica utilizzando un file già aperto, il suo prototipo è:
3909 % \begin{funcproto}{
3910 % \fhead{sys/time.h}
3911 % \fdecl{int futimes(int fd, const struct timeval tv[2])}
3912 % \fdesc{Cambia i tempi di un file già aperto.}
3915 % {La funzione ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3916 % caso \var{errno} assumerà uno gli stessi valori di \func{utimes} ed inoltre:
3918 % \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3919 % \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3923 % La seconda funzione, introdotta a partire dal kernel 2.6.22, è
3924 % \funcd{lutimes}, e consente rispettivamente di modificare i tempi di un
3925 % collegamento simbolico; il suo prototipo è:
3927 % \begin{funcproto}{
3928 % \fhead{sys/time.h}
3929 % \fdecl{int lutimes(const char *filename, const struct timeval tv[2])}
3930 % \fdesc{Cambia i tempi di un collegamento simbolico.}
3933 % {La funzione ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3934 % caso \var{errno} assumerà uno gli stessi valori di \func{utimes}, con in più:
3936 % \item[\errcode{ENOSYS}] la funzione non è supportata.
3940 % Le due funzioni hanno lo stesso comportamento di \texttt{utimes} e richiedono
3941 % gli stessi privilegi per poter operare, la differenza è che con \func{futimes}
3942 % si può indicare il file su cui operare se questo è già aperto facendo
3943 % riferimento al suo file descriptor, mentre con \func{lutimes}, nel caso in cui
3944 % \param{filename} sia un collegamento simbolico, saranno modificati i suoi
3945 % tempi invece di quelli del file a cui esso punta.
3947 Oltre ad \func{utimes} su Linux sono presenti altre due funzioni,\footnote{le
3948 due funzioni non sono definite in nessuno standard, ma sono presenti, oltre
3949 che su Linux, anche su BSD; sono accessibili definendo
3950 \macro{\_DEFAULT\_SOURCE} dalla \acr{glibc} 2.19 o \macro{\_GNU\_SOURCE}
3951 prima.} \funcd{futimes} e \funcd{lutimes}, che consentono rispettivamente
3952 di effettuare la modifica utilizzando un file già aperto o di eseguirla
3953 direttamente su un collegamento simbolico. I relativi prototipi sono:
3957 \fdecl{int futimes(int fd, const struct timeval tv[2])}
3958 \fdesc{Cambia i tempi di un file già aperto.}
3959 \fdecl{int lutimes(const char *filename, const struct timeval tv[2])}
3960 \fdesc{Cambia i tempi di un collegamento simbolico.}
3963 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3964 caso \var{errno} assumerà uno gli stessi valori di \func{utimes}, con in più
3967 \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3968 \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile per
3969 \func{futimes} o la funzione non è supportata per \func{lutimes}.
3973 Le due funzioni hanno lo stesso comportamento di \texttt{utimes} e richiedono
3974 gli stessi privilegi per poter operare, la differenza è che con \func{futimes}
3975 si può indicare il file su cui operare se questo è già aperto facendo
3976 riferimento al suo file descriptor, mentre con \func{lutimes} nel caso in
3977 cui \param{filename} sia un collegamento simbolico saranno modificati i suoi
3978 tempi invece di quelli del file a cui esso punta.
3980 Nonostante il kernel nelle versioni più recenti supporti, come accennato,
3981 risoluzioni dei tempi dei file fino al nanosecondo, le funzioni fin qui
3982 esaminate non consentono di impostare valori con questa precisione. Per questo
3983 sono state introdotte due nuove funzioni di sistema, \func{utimensat} (che
3984 vedremo in sez.~\ref{sec:file_openat} insieme alle altre
3985 \textit{at-functions}), e \funcd{futimens}, il cui prototipo è:
3989 \fdecl{int futimens(int fd, const struct timespec times[2])}
3990 \fdesc{Cambia i tempi di un file già aperto.}
3993 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3994 caso \var{errno} assumerà uno dei valori:
3996 \item[\errcode{EACCES}] si è richiesta l'impostazione del tempo corrente ma
3997 non si ha il permesso di scrittura sul file, o non si è proprietari del
3998 file o non si hanno i privilegi di amministratore; oppure il file è
3999 immutabile (vedi sez.~\ref{sec:file_perm_overview}).
4000 \item[\errcode{EBADF}] \param{fd} non è un file descriptor valido.
4001 \item[\errcode{EFAULT}] \param{times} non è un puntatore valido.
4002 \item[\errcode{EINVAL}] si sono usati dei valori non corretti per i tempi di
4004 \item[\errcode{EPERM}] si è richiesto un cambiamento nei tempi non al tempo
4005 corrente, ma non si è proprietari del file o non si hanno i privilegi di
4006 amministratore; oppure il file è immutabile o \textit{append-only} (vedi
4007 sez.~\ref{sec:file_perm_overview}).
4009 ed inoltre per entrambe \errval{EROFS} nel suo significato generico.}
4012 La funzione è sostanzialmente una estensione di \func{futimes} che consente di
4013 specificare i tempi con precisione maggiore. Per questo per indicare i valori
4014 dei tempi da impostare utilizza un vettore \param{times} di due strutture
4015 \struct{timespec} che permettono di indicare il valore del tempo con una
4016 precisione fino al nanosecondo (se ne è riportata la definizione in
4017 fig.~\ref{fig:sys_timespec_struct}).
4019 \begin{figure}[!htb]
4020 \footnotesize \centering
4021 \begin{minipage}[c]{0.8\textwidth}
4022 \includestruct{listati/timespec.h}
4025 \caption{La struttura \structd{timespec} usata per indicare valori di tempo
4026 con la precisione del nanosecondo.}
4027 \label{fig:sys_timespec_struct}
4030 Come per le precedenti funzioni il primo elemento di \param{times} indica il
4031 tempo di ultimo accesso ed il secondo quello di ultima modifica, e se si usa
4032 il valore \val{NULL} verrà impostato il tempo corrente sia per l'ultimo
4033 accesso che per l'ultima modifica.
4035 Nei singoli elementi di \param{times} si possono inoltre utilizzare due valori
4036 speciali per il campo \var{tv\_nsec}: con \constd{UTIME\_NOW} si richiede
4037 l'uso del tempo corrente, mentre con \constd{UTIME\_OMIT} si richiede di non
4038 impostare il tempo. Si può così aggiornare in maniera specifica soltanto uno
4039 fra il tempo di ultimo accesso e quello di ultima modifica. Quando si usa uno
4040 di questi valori speciali per \var{tv\_nsec} il corrispondente valore di
4041 \var{tv\_sec} viene ignorato.
4043 Questa funzione e \func{utimensat} sono una estensione definita nella
4044 revisione POSIX.1-2008 dello standard POSIX; in Linux sono state introdotte a
4045 partire dal kernel 2.6.22, e sono supportate dalla \acr{glibc} a partire dalla
4046 versione 2.6, si tenga presente però che per kernel precedenti il 2.6.26 le
4047 due funzioni sono difettose nel rispetto di alcuni requisiti minori dello
4048 standard e nel controllo della correttezza dei tempi, per i dettagli dei quali
4049 si rimanda alla pagina di manuale.
4052 \section{Il controllo di accesso ai file}
4053 \label{sec:file_access_control}
4055 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
4056 del controllo di accesso ai file, che viene implementato per qualunque
4057 filesystem standard.\footnote{per filesystem standard si intende un filesystem
4058 che implementi le caratteristiche previste dallo standard POSIX; in Linux
4059 sono utilizzabili anche filesystem di altri sistemi operativi, che non
4060 supportano queste caratteristiche.} In questa sezione ne esamineremo i
4061 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
4064 \subsection{I permessi per l'accesso ai file}
4065 \label{sec:file_perm_overview}
4067 Ad ogni file Linux associa sempre, oltre ad un insieme di permessi, l'utente
4068 che ne è proprietario (il cosiddetto \textit{owner}) ed un gruppo di
4069 appartenenza, indicati dagli identificatori di utente e gruppo (\ids{UID} e
4070 \ids{GID}) di cui abbiamo già parlato in
4071 sez.~\ref{sec:proc_access_id}.\footnote{questo è vero solo per filesystem di
4072 tipo Unix, ad esempio non è vero per il filesystem VFAT di Windows, che non
4073 fornisce nessun supporto per l'accesso multiutente, e per il quale queste
4074 proprietà vengono assegnate in maniera fissa con opportune opzioni di
4075 montaggio.} Anche questi sono mantenuti sull'\textit{inode} insieme alle
4076 altre proprietà e sono accessibili da programma tramite la funzione
4077 \func{stat} (trattata in sez.~\ref{sec:file_stat}), che restituisce l'utente
4078 proprietario nel campo \var{st\_uid} ed il gruppo proprietario nel campo
4079 \var{st\_gid} della omonima struttura \struct{stat}.
4081 Il controllo di accesso ai file segue un modello abbastanza semplice che
4082 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
4083 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
4084 Control List} che sono state aggiunte ai filesystem standard con opportune
4085 estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
4086 controllo ancora più sofisticati come il \textit{Mandatory Access Control}
4087 di \textit{SELinux} e delle altre estensioni come \textit{Smack} o
4088 \textit{AppArmor}.} ma nella maggior parte dei casi il meccanismo standard è
4089 più che sufficiente a soddisfare tutte le necessità più comuni. I tre
4090 permessi di base associati ad ogni file sono:
4092 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
4094 \item il permesso di scrittura (indicato con la lettera \texttt{w},
4095 dall'inglese \textit{write}).
4096 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
4097 dall'inglese \textit{execute}).
4099 mentre i tre livelli su cui sono divisi i privilegi sono:
4101 \item i privilegi per l'utente proprietario del file.
4102 \item i privilegi per un qualunque utente faccia parte del gruppo cui
4104 \item i privilegi per tutti gli altri utenti.
4107 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
4108 meno significativi sono usati a gruppi di tre per indicare i permessi base di
4109 lettura, scrittura ed esecuzione e sono applicati rispettivamente
4110 rispettivamente al proprietario, al gruppo, a tutti gli altri.
4114 \includegraphics[width=8cm]{img/fileperm}
4115 \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
4116 contenuti nel campo \var{st\_mode} di \struct{stat}.}
4117 \label{fig:file_perm_bit}
4120 I restanti tre bit (noti come \textit{suid bit}, \textit{sgid bit}, e
4121 \textit{sticky bit}) sono usati per indicare alcune caratteristiche più
4122 complesse del meccanismo del controllo di accesso su cui torneremo in seguito
4123 (in sez.~\ref{sec:file_special_perm}), lo schema di allocazione dei bit è
4124 riportato in fig.~\ref{fig:file_perm_bit}. Come tutte le altre proprietà di
4125 un file anche i permessi sono memorizzati nell'\textit{inode}, e come
4126 accennato in sez.~\ref{sec:file_types} essi vengono restituiti in una parte
4127 del campo \var{st\_mode} della struttura \struct{stat} (si veda di nuovo
4128 fig.~\ref{fig:file_stat_struct}).
4133 \begin{tabular}[c]{|c|l|}
4135 \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
4138 \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
4139 \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
4140 \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\
4142 \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
4143 \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
4144 \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
4146 \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
4147 \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
4148 \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
4151 \caption{I bit dei permessi di accesso ai file, come definiti in
4152 \texttt{<sys/stat.h>}}
4153 \label{tab:file_bit_perm}
4157 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
4158 \texttt{u} (per \textit{user}), \texttt{g} (per \textit{group}) e \texttt{o}
4159 (per \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti
4160 insieme si usa la lettera \texttt{a} (per \textit{all}). Si tenga ben presente
4161 questa distinzione dato che in certi casi, mutuando la terminologia in uso a
4162 suo tempo nel VMS, si parla dei permessi base come di permessi per
4163 \textit{owner}, \textit{group} ed \textit{all}, le cui iniziali possono dar
4164 luogo a confusione. Le costanti che permettono di accedere al valore numerico
4165 di questi bit nel campo \var{st\_mode}, già viste in
4166 tab.~\ref{tab:file_mode_flags}, sono riportate per chiarezza una seconda volta
4167 in tab.~\ref{tab:file_bit_perm}.
4169 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
4170 che si riferiscano a dei file, dei collegamenti simbolici o delle directory;
4171 qui ci limiteremo ad un riassunto delle regole generali, entrando nei dettagli
4174 La prima regola è che per poter accedere ad un file attraverso il suo
4175 \textit{pathname} occorre il permesso di esecuzione in ciascuna delle
4176 directory che compongono il \textit{pathname}; lo stesso vale per aprire un
4177 file nella directory corrente (per la quale appunto serve il diritto di
4178 esecuzione). Per una directory infatti il permesso di esecuzione significa che
4179 essa può essere attraversata nella risoluzione del \textit{pathname}, e per
4180 questo viene anche chiamato permesso di attraversamento. Esso è sempre
4181 distinto dal permesso di lettura che invece implica che si può leggere il
4182 contenuto della directory.
4184 Questo significa che se si ha il permesso di esecuzione senza permesso di
4185 lettura si potrà lo stesso aprire un file all'interno di una directory (se si
4186 hanno i permessi adeguati per il medesimo) ma non si potrà vederlo con
4187 \cmd{ls} mancando il permesso di leggere il contenuto della directory. Per
4188 crearlo o rinominarlo o cancellarlo invece occorrerà avere anche il permesso
4189 di scrittura per la directory.
4191 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
4192 (si veda quanto riportato in sez.~\ref{sec:file_open_close}) di sola lettura o
4193 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
4194 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
4195 il contenuto, lo stesso permesso è necessario per poter troncare il file o per
4196 aggiornare il suo tempo di ultima modifica al tempo corrente, ma non per
4197 modificare arbitrariamente quest'ultimo, operazione per la quale, come per
4198 buona parte delle modifiche effettuate sui metadati del file, occorre esserne
4201 Non si può creare un file fintanto che non si disponga del permesso di
4202 esecuzione e di quello di scrittura per la directory di destinazione. Gli
4203 stessi permessi occorrono per cancellare un file da una directory (si ricordi
4204 che questo non implica necessariamente la rimozione del contenuto del file dal
4207 Per la cancellazione non è necessario nessun tipo di permesso per il file
4208 stesso dato che, come illustrato in sez.~\ref{sec:link_symlink_rename} esso
4209 non viene toccato, nella cancellazione infatti viene solo modificato il
4210 contenuto della directory, rimuovendo la voce che ad esso fa riferimento. Lo
4211 stesso vale per poter rinominare o spostare il file in altra directory, in
4212 entrambi i casi occorrerà il permesso di scrittura sulle directory che si
4215 Per poter eseguire un file, che sia un programma compilato od uno script di
4216 shell, od un altro tipo di file eseguibile riconosciuto dal kernel, occorre
4217 oltre al permesso di lettura per accedere al contenuto avere anche il permesso
4218 di esecuzione. Inoltre solo i file regolari possono essere eseguiti. Per i
4219 file di dispositivo i permessi validi sono solo quelli di lettura e scrittura,
4220 che corrispondono al poter eseguire dette operazioni sulla periferica
4223 I permessi per un collegamento simbolico sono ignorati, contano quelli del
4224 file a cui fa riferimento; per questo in genere il comando \cmd{ls} riporta
4225 per un collegamento simbolico tutti i permessi come concessi. Utente e gruppo
4226 a cui esso appartiene vengono pure ignorati quando il collegamento viene
4227 risolto, vengono controllati solo quando viene richiesta la rimozione del
4228 collegamento e quest'ultimo è in una directory con lo \textit{sticky bit}
4229 impostato (si veda sez.~\ref{sec:file_special_perm}).
4231 La procedura con cui il kernel stabilisce se un processo possiede un certo
4232 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
4233 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
4234 \var{st\_gid} accennati in precedenza) e l'\ids{UID} effettivo, il \ids{GID}
4235 effettivo e gli eventuali \ids{GID} supplementari del processo.\footnote{in
4236 realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
4237 identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
4238 sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
4239 eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
4242 Per una spiegazione dettagliata degli identificatori associati ai processi si
4243 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
4244 sez.~\ref{sec:file_special_perm}, l'\ids{UID} effettivo e il \ids{GID} effettivo
4245 corrispondono ai valori dell'\ids{UID} e del \ids{GID} dell'utente che ha
4246 lanciato il processo, mentre i \ids{GID} supplementari sono quelli dei gruppi
4247 cui l'utente appartiene.
4249 I passi attraverso i quali viene stabilito se il processo possiede il diritto
4250 di accesso sono i seguenti:
4252 \item Se l'\ids{UID} effettivo del processo è zero (corrispondente
4253 all'amministratore) l'accesso è sempre garantito senza nessun controllo. Per
4254 questo motivo l'amministratore ha piena libertà di accesso a tutti i file.
4255 \item Se l'\ids{UID} effettivo del processo è uguale all'\ids{UID} del
4256 proprietario del file (nel qual caso si dice che il processo è proprietario
4259 \item se il relativo\footnote{per relativo si intende il bit di
4260 \textit{user-read} se il processo vuole accedere in lettura, quello di
4261 \textit{user-write} per l'accesso in scrittura, ecc.} bit dei permessi
4262 d'accesso dell'utente è impostato, l'accesso è consentito;
4263 \item altrimenti l'accesso è negato.
4265 \item Se il \ids{GID} effettivo del processo o uno dei \ids{GID} supplementari
4266 del processo corrispondono al \ids{GID} del file allora:
4268 \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
4270 \item altrimenti l'accesso è negato.
4272 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
4273 l'accesso è consentito, altrimenti l'accesso è negato.
4276 Si tenga presente che questi passi vengono eseguiti esattamente in
4277 quest'ordine. Questo vuol dire che se un processo è il proprietario di un
4278 file, l'accesso è consentito o negato solo sulla base dei permessi per
4279 l'utente; i permessi per il gruppo non vengono neanche controllati. Lo stesso
4280 vale se il processo appartiene ad un gruppo appropriato, in questo caso i
4281 permessi per tutti gli altri non vengono controllati.
4283 Questo significa che se si è proprietari di un file ma non si ha il permesso
4284 di scrittura, non vi si potrà scrivere anche se questo fosse scrivibile per
4285 tutti gli altri. Permessi di questo tipo sono ovviamente poco ortodossi, e
4286 comunque, come vedremo in sez.~\ref{sec:file_perm_management}, il proprietario
4287 di un file può sempre modificarne i permessi, e riassegnarsi un eventuale
4288 permesso di scrittura mancante.
4290 \itindbeg{file~attributes}
4292 A questi che sono i permessi ordinari si aggiungono, per i filesystem che
4293 supportano questa estensione, due permessi speciali mantenuti nei cosiddetti
4294 \textit{file attributes}, che si possono leggere ed impostare con i comandi
4295 \cmd{lsattr} e \cmd{chattr}.\footnote{per l'utilizzo di questi comandi e per
4296 le spiegazioni riguardo tutti gli altri \textit{file attributes} si rimanda
4297 alla sezione 1.4.4 di \cite{AGL}.}
4299 Il primo è il cosiddetto attributo di immutabilità (\textit{immutable},
4300 identificato dalla lettera \texttt{i}) che impedisce ogni modifica al file,
4301 \textit{inode} compreso. Questo significa non solo che non se ne può cambiare
4302 il contenuto, ma neanche nessuna delle sue proprietà, ed in particolare non si
4303 può modificare nei permessi o nei tempi o nel proprietario ed inoltre, visto
4304 che non se può modificare il \textit{link count}, non si può neanche
4305 cancellare, rinominare, o creare \textit{hard link} verso di esso.
4307 Il secondo è il cosiddetto attributo di \textit{append-only}, (identificato
4308 dalla lettera \texttt{a}) che consente soltanto la scrittura in coda al
4309 file. Il file cioè può essere soltanto esteso nel contenuto, ma i suoi
4310 metadati, a parte i tempi che però possono essere impostati al valore
4311 corrente, non possono essere modificati in alcun modo, quindi di nuovo non si
4312 potrà cancellare, rinominare, o modificare nei permessi o nelle altre
4315 Entrambi questi attributi attivano queste restrizioni a livello di filesystem,
4316 per cui a differenza dei permessi ordinari esse varranno per qualunque utente
4317 compreso l'amministratore. L'amministratore è l'unico che può attivare o
4318 disattivare questi attributi,\footnote{più precisamente un processo con la
4319 capacità \const{CAP\_LINUX\_IMMUTABLE}, vedi
4320 sez.~\ref{sec:proc_capabilities}.} e potendo rimuoverli è comunque capace di
4321 tornare in grado di eseguire qualunque operazione su un file immutabile o
4322 \textit{append-only}.
4324 \itindend{file~attributes}
4328 \subsection{I bit dei permessi speciali}
4329 \label{sec:file_special_perm}
4334 Come si è accennato (in sez.~\ref{sec:file_perm_overview}) nei dodici bit del
4335 campo \var{st\_mode} di \struct{stat} che vengono usati per il controllo di
4336 accesso oltre ai bit dei permessi veri e propri, ci sono altri tre bit che
4337 vengono usati per indicare alcune proprietà speciali dei file. Due di questi
4338 sono i bit detti \acr{suid} (da \textit{set-user-ID bit}) e \acr{sgid} (da
4339 \textit{set-group-ID bit}) che sono identificati dalle costanti
4340 \const{S\_ISUID} e \const{S\_ISGID}.
4342 Come spiegato in dettaglio in sez.~\ref{sec:proc_exec}, quando si lancia un
4343 programma il comportamento normale del kernel è quello di impostare gli
4344 identificatori del gruppo \textit{effective} del nuovo processo al valore dei
4345 corrispondenti del gruppo \textit{real} del processo corrente, che normalmente
4346 corrispondono a quelli dell'utente con cui si è entrati nel sistema.
4348 Se però il file del programma, che ovviamente deve essere
4349 eseguibile,\footnote{anzi più precisamente un binario eseguibile: per motivi
4350 di sicurezza il kernel ignora i bit \acr{suid} e \acr{sgid} per gli script
4351 eseguibili.} ha il bit \acr{suid} impostato, il kernel assegnerà come
4352 \ids{UID} effettivo al nuovo processo l'\ids{UID} del proprietario del file al
4353 posto dell'\ids{UID} del processo originario. Avere il bit \acr{sgid}
4354 impostato ha lo stesso effetto sul \ids{GID} effettivo del processo. É
4355 comunque possibile riconoscere questa situazione perché il cambiamento viene
4356 effettuato solo sugli identificativi del gruppo \textit{effective}, mentre
4357 quelli dei gruppi \textit{real} e \textit{saved} restano quelli dell'utente
4358 che ha eseguito il programma.
4360 I bit \acr{suid} e \acr{sgid} vengono usati per permettere agli utenti normali
4361 di usare programmi che richiedono privilegi speciali. L'esempio classico è il
4362 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
4363 quest'ultimo ovviamente può essere scritto solo dall'amministratore, ma non è
4364 necessario chiamare l'amministratore per cambiare la propria password. Infatti
4365 il comando \cmd{passwd} appartiene in genere all'utente \textit{root} ma ha il
4366 bit \acr{suid} impostato, per cui quando viene lanciato da un utente normale
4367 ottiene comunque i privilegi di amministratore.
4369 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
4370 normalmente l'utente che lo ha lanciato comporta vari rischi, e questo tipo di
4371 programmi devono essere scritti accuratamente per evitare che possano essere
4372 usati per guadagnare privilegi non consentiti (l'argomento è affrontato in
4373 dettaglio in sez.~\ref{sec:proc_perms}).
4375 La presenza dei bit \acr{suid} e \acr{sgid} su un file può essere rilevata con
4376 il comando \cmd{ls -l}, che visualizza una lettera ``\cmd{s}'' al posto della
4377 ``\cmd{x}'' in corrispondenza dei permessi di utente o gruppo. La stessa
4378 lettera ``\cmd{s}'' può essere usata nel comando \cmd{chmod} per impostare
4379 questi bit. Infine questi bit possono essere controllati all'interno di
4380 \var{st\_mode} con l'uso delle due costanti \const{S\_ISUID} e
4381 \const{S\_IGID}, i cui valori sono riportati in
4382 tab.~\ref{tab:file_mode_flags}.
4384 Gli stessi bit vengono ad assumere un significato completamente diverso per le
4385 directory, normalmente infatti Linux usa la convenzione di SVr4 per indicare
4386 con questi bit l'uso della semantica BSD nella creazione di nuovi file (si
4387 veda sez.~\ref{sec:file_ownership_management} per una spiegazione dettagliata
4390 Infine Linux utilizza il bit \acr{sgid} per un'ulteriore estensione mutuata da
4391 SVr4. Il caso in cui un file ha il bit \acr{sgid} impostato senza che lo sia
4392 anche il corrispondente bit di esecuzione viene utilizzato per attivare per
4393 quel file il \textit{mandatory locking} (affronteremo questo argomento in
4394 dettaglio più avanti, in sez.~\ref{sec:file_mand_locking}).
4399 \itindbeg{sticky~bit}
4401 L'ultimo dei bit rimanenti, identificato dalla costante \const{S\_ISVTX}, è in
4402 parte un rimasuglio delle origini dei sistemi Unix. A quell'epoca infatti la
4403 memoria virtuale e l'accesso ai file erano molto meno sofisticati e per
4404 ottenere la massima velocità possibile per i programmi usati più comunemente
4405 si poteva impostare questo bit.
4407 L'effetto di questo bit era che il segmento di testo del programma (si veda
4408 sez.~\ref{sec:proc_mem_layout} per i dettagli) veniva scritto nella swap la
4409 prima volta che questo veniva lanciato, e vi permaneva fino al riavvio della
4410 macchina (da questo il nome di \textsl{sticky bit}); essendo la swap un file
4411 continuo o una partizione indicizzata direttamente si poteva risparmiare in
4412 tempo di caricamento rispetto alla ricerca attraverso la struttura del
4413 filesystem. Lo \textsl{sticky bit} è indicato usando la lettera ``\texttt{t}''
4414 al posto della ``\texttt{x}'' nei permessi per gli altri.
4416 Ovviamente per evitare che gli utenti potessero intasare la swap solo
4417 l'amministratore era in grado di impostare questo bit, che venne chiamato
4418 anche con il nome di \textit{saved text bit}, da cui deriva quello della
4419 costante. Le attuali implementazioni di memoria virtuale e filesystem rendono
4420 sostanzialmente inutile questo procedimento.
4422 Benché ormai non venga più utilizzato per i file, lo \textit{sticky bit} ha
4423 invece assunto un uso importante per le directory;\footnote{lo \textit{sticky
4424 bit} per le directory è un'estensione non definita nello standard POSIX,
4425 Linux però la supporta, così come BSD e SVr4.} in questo caso se tale bit è
4426 impostato un file potrà essere rimosso dalla directory soltanto se l'utente ha
4427 il permesso di scrittura su di essa ed inoltre è vera una delle seguenti
4430 \item l'utente è proprietario del file,
4431 \item l'utente è proprietario della directory,
4432 \item l'utente è l'amministratore.
4435 Un classico esempio di directory che ha questo bit impostato è \file{/tmp}, i
4436 cui permessi infatti di solito sono i seguenti:
4438 piccardi@hain:~/gapil$ \textbf{ls -ld /tmp}
4439 drwxrwxrwt 6 root root 1024 Aug 10 01:03 /tmp
4442 quindi con lo \textit{sticky bit} bit impostato. In questo modo qualunque
4443 utente nel sistema può creare dei file in questa directory, che come
4444 suggerisce il nome è normalmente utilizzata per la creazione di file
4445 temporanei, ma solo l'utente che ha creato un certo file potrà cancellarlo o
4446 rinominarlo. In questo modo si evita che un utente possa, più o meno
4447 consapevolmente, cancellare i file temporanei creati degli altri utenti.
4449 \itindend{sticky~bit}
4453 \subsection{Le funzioni per la gestione dei permessi dei file}
4454 \label{sec:file_perm_management}
4456 Come visto in sez.~\ref{sec:file_perm_overview} il controllo di accesso ad un
4457 file viene fatto utilizzando l'\ids{UID} ed il \ids{GID} effettivo del
4458 processo; ci sono casi però in cui si può voler effettuare il controllo con
4459 l'\ids{UID} reale ed il \ids{GID} reale, vale a dire usando i valori di
4460 \ids{UID} e \ids{GID} relativi all'utente che ha lanciato il programma, e che,
4461 come accennato in sez.~\ref{sec:file_special_perm} e spiegato in dettaglio in
4462 sez.~\ref{sec:proc_perms}, non è detto siano uguali a quelli effettivi.
4464 Per far questo si può usare la funzione di sistema \funcd{access}, il cui
4469 \fdecl{int access(const char *pathname, int mode)}
4470 \fdesc{Verifica i permessi di accesso.}
4473 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4474 caso \var{errno} assumerà uno dei valori:
4476 \item[\errcode{EACCES}] l'accesso al file non è consentito, o non si ha il
4477 permesso di attraversare una delle directory di \param{pathname}.
4478 \item[\errcode{EINVAL}] il valore di \param{mode} non è valido.
4479 \item[\errcode{EROFS}] si è richiesto l'accesso in scrittura per un file su
4480 un filesystem montato in sola lettura.
4481 \item[\errcode{ETXTBSY}] si è richiesto l'accesso in scrittura per un
4482 eseguibile binario correntemente in esecuzione.
4484 ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
4485 \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR} nel loro
4486 significato generico.}
4489 La funzione verifica i permessi di accesso, indicati da \param{mode}, per il
4490 file indicato da \param{pathname}. I valori possibili per l'argomento
4491 \param{mode} sono esprimibili come combinazione delle costanti numeriche
4492 riportate in tab.~\ref{tab:file_access_mode_val} (attraverso un OR binario
4493 delle stesse). I primi tre valori implicano anche la verifica dell'esistenza
4494 del file, se si vuole verificare solo quest'ultima si può usare \const{F\_OK},
4495 o anche direttamente \func{stat}. Nel caso in cui \param{pathname} si
4496 riferisca ad un collegamento simbolico, questo viene seguito ed il controllo è
4497 fatto sul file a cui esso fa riferimento.
4499 La funzione controlla solo i bit dei permessi di accesso per \param{pathname},
4500 ma occorre poter risolvere quest'ultimo, e se non c'è il permesso di
4501 esecuzione per una qualunque delle sue componenti la funzione fallirà
4502 indipendentemente dai permessi del file. Si tenga presente poi che il fatto
4503 che una directory abbia permesso di scrittura non significa che vi si possa
4504 scrivere come fosse un file, e che se un file ha il permesso di esecuzione non
4505 è detto che sia eseguibile. La funzione ha successo solo se tutti i permessi
4506 controllati sono disponibili.
4511 \begin{tabular}{|c|l|}
4513 \textbf{\param{mode}} & \textbf{Significato} \\
4516 \constd{R\_OK} & Verifica il permesso di lettura. \\
4517 \constd{W\_OK} & Verifica il permesso di scrittura. \\
4518 \constd{X\_OK} & Verifica il permesso di esecuzione. \\
4519 \constd{F\_OK} & Verifica l'esistenza del file. \\
4522 \caption{Valori possibili per l'argomento \param{mode} della funzione
4524 \label{tab:file_access_mode_val}
4527 Un esempio tipico per l'uso di questa funzione è quello di un processo che sta
4528 eseguendo un programma coi privilegi di un altro utente (ad esempio attraverso
4529 l'uso del \textit{suid bit}) che vuole controllare se l'utente originale ha i
4530 permessi per accedere ad un certo file, ma eseguire questo controllo prima di
4531 aprire il file espone al rischio di una \textit{race condition} che apre ad un
4532 possibile \textit{symlink attack} fra il controllo e l'apertura del file. In
4533 questo caso è sempre opportuno usare invece la funzione \func{faccessat} che
4534 tratteremo insieme alle altre \textit{at-functions} in
4535 sez.~\ref{sec:file_openat}.
4538 Del tutto analoghe a \func{access} sono le due funzioni \funcm{euidaccess} e
4539 \funcm{eaccess} che ripetono lo stesso controllo usando però gli
4540 identificatori del gruppo effettivo, verificando quindi le effettive capacità
4541 di accesso ad un file. Le funzioni hanno entrambe lo stesso
4542 prototipo\footnote{in realtà \funcm{eaccess} è solo un sinonimo di
4543 \funcm{euidaccess} fornita per compatibilità con l'uso di questo nome in
4544 altri sistemi.} che è del tutto identico a quello di \func{access}. Prendono
4545 anche gli stessi valori e restituiscono gli stessi risultati e gli stessi
4548 Le due funzioni non sono previste da nessuno standard, ed utilizzabili solo
4549 avendo definito \macro{\_GNU\_SOURCE}; inoltre qualora le si vogliano
4550 utilizzare per verificare che un processo abbia i permessi per accedere ad un
4551 file prima di farlo effettivamente, ci si esporrebbe ad una \textit{race
4552 condition}, dato che i permessi potrebbero cambiare nell'intervallo fra il
4553 controllo e l'accesso effettivo. Per questo motivo in questo caso è molto più
4554 semplice e sicuro tentare direttamente l'accesso, e trattare opportunamente
4555 l'eventuale fallimento per mancanza di permessi.
4557 Per cambiare i permessi di un file sono invece disponibili due funzioni di
4558 sistema \funcd{chmod} e \funcd{fchmod}, che operano rispettivamente usando il
4559 \textit{pathname} di un file o se questo è già aperto sul relativo file
4560 descriptor; i loro prototipi sono:
4565 \fdecl{int chmod(const char *path, mode\_t mode)}
4566 \fdesc{Cambia i permessi del file indicato da \param{path} al valore indicato
4568 \fdecl{int fchmod(int fd, mode\_t mode)}
4569 \fdesc{Analoga alla precedente, ma usa il file descriptor \param{fd} per
4574 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4575 caso \var{errno} assumerà uno dei valori:
4577 \item[\errcode{EPERM}] l'\ids{UID} effettivo non corrisponde a quello del
4578 proprietario del file o non si hanno i privilegi di amministratore.
4579 \item[\errcode{EROFS}] il file è su un filesystem in sola lettura.
4581 ed inoltre per entrambe \errval{EIO}, per \func{chmod} \errval{EACCES},
4582 \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOENT},
4583 \errval{ENOMEM}, \errval{ENOTDIR}, per \func{fchmod} \errval{EBADF} nel loro
4584 significato generico.}
4588 Entrambe le funzioni utilizzano come secondo argomento \param{mode}, una
4589 variabile dell'apposito tipo primitivo \type{mode\_t} (vedi
4590 tab.~\ref{tab:intro_primitive_types}), che è una maschera binaria da
4591 utilizzare per specificare i permessi sui file.
4596 \begin{tabular}[c]{|c|c|l|}
4598 \textbf{\param{mode}} & \textbf{Valore} & \textbf{Significato} \\
4601 \const{S\_ISUID} & 04000 & Set user ID bit.\\
4602 \const{S\_ISGID} & 02000 & Set group ID bit.\\
4603 \const{S\_ISVTX} & 01000 & Sticky bit.\\
4605 \const{S\_IRWXU} & 00700 & L'utente ha tutti i permessi.\\
4606 \const{S\_IRUSR} & 00400 & L'utente ha il permesso di lettura.\\
4607 \const{S\_IWUSR} & 00200 & L'utente ha il permesso di scrittura.\\
4608 \const{S\_IXUSR} & 00100 & L'utente ha il permesso di esecuzione.\\
4610 \const{S\_IRWXG} & 00070 & Il gruppo ha tutti i permessi.\\
4611 \const{S\_IRGRP} & 00040 & Il gruppo ha il permesso di lettura.\\
4612 \const{S\_IWGRP} & 00020 & Il gruppo ha il permesso di scrittura.\\
4613 \const{S\_IXGRP} & 00010 & Il gruppo ha il permesso di esecuzione.\\
4615 \const{S\_IRWXO} & 00007 & Gli altri hanno tutti i permessi.\\
4616 \const{S\_IROTH} & 00004 & Gli altri hanno il permesso di lettura.\\
4617 \const{S\_IWOTH} & 00002 & Gli altri hanno il permesso di scrittura.\\
4618 \const{S\_IXOTH} & 00001 & Gli altri hanno il permesso di esecuzione.\\
4621 \caption{Valori delle costanti usate per indicare i vari bit di
4622 \param{mode} utilizzato per impostare i permessi dei file.}
4623 \label{tab:file_permission_const}
4626 Si sono riportate in tab.~\ref{tab:file_permission_const} le costanti con cui
4627 indicare i singoli bit di \param{mode}; si noti come corrispondano agli stessi
4628 valori usati per \var{st\_mode} già visti in tab.~\ref{tab:file_mode_flags}.
4629 Il valore di \param{mode} può essere ottenuto combinando fra loro con un OR
4630 binario le costanti simboliche relative ai vari bit, o specificato
4631 direttamente, come per l'omonimo comando di shell \texttt{chmod}, con un
4632 valore numerico (con la shell in genere lo si scrive in ottale, dato che i bit
4633 dei permessi sono divisibili in gruppi di tre), che si può calcolare
4634 direttamente usando lo schema di utilizzo dei bit illustrato in
4635 fig.~\ref{fig:file_perm_bit}.
4637 Ad esempio i permessi standard assegnati ai nuovi file (lettura e scrittura
4638 per il proprietario, sola lettura per il gruppo e gli altri) sono
4639 corrispondenti al valore ottale \texttt{0644}, un programma invece avrebbe
4640 anche il bit di esecuzione attivo, con un valore ottale di \texttt{0755}, se
4641 infine si volesse attivare anche il bit \acr{suid} il valore ottale da fornire
4642 sarebbe \texttt{4755}.
4644 Il cambiamento dei permessi di un file eseguito attraverso queste funzioni ha
4645 comunque alcune limitazioni, previste per motivi di sicurezza. L'uso delle
4646 funzioni infatti è possibile solo se l'\ids{UID} effettivo del processo
4647 chiamante corrisponde a quello del proprietario del file o se il processo ha i
4648 privilegi di amministratore,\footnote{per la precisione la capacità
4649 \const{CAP\_FOWNER}, vedi sez.~\ref{sec:proc_capabilities}.} in caso
4650 contrario esse falliranno con un errore di \errcode{EPERM}.
4652 Ma oltre a questa regola generale, di immediata comprensione, esistono delle
4653 limitazioni ulteriori. Per questo motivo, anche se si è proprietari del file,
4654 non tutti i valori possibili di \param{mode} sono permessi o hanno effetto;
4655 in particolare accade che:
4657 \item siccome solo l'amministratore può impostare lo \textit{sticky bit}, se
4658 l'\ids{UID} effettivo del processo non è zero esso viene automaticamente
4659 cancellato, senza notifica di errore, qualora sia stato indicato
4661 \item per quanto detto in sez.~\ref{sec:file_ownership_management} riguardo la
4662 creazione dei nuovi file, si può avere il caso in cui il file creato da un
4663 processo è assegnato ad un gruppo per il quale il processo non ha privilegi.
4664 Per evitare che si possa assegnare il bit \acr{sgid} ad un file appartenente
4665 ad un gruppo per cui non si hanno diritti, questo viene automaticamente
4666 cancellato da \param{mode}, senza notifica di errore, qualora il gruppo del
4667 file non corrisponda a quelli associati al processo; la cosa non avviene
4668 quando l'\ids{UID} effettivo del processo è zero.
4671 Per alcuni filesystem\footnote{i filesystem più comuni (\acr{ext2},
4672 \acr{ext3}, \acr{ext4}, \acr{XFS}, \acr{Btrfs}) supportano
4673 questa caratteristica, che è mutuata da BSD.} è inoltre prevista
4674 un'ulteriore misura di sicurezza, volta a scongiurare l'abuso dei bit
4675 \acr{suid} e \acr{sgid}; essa consiste nel cancellare automaticamente questi
4676 bit dai permessi di un file qualora un processo che non appartenga
4677 all'amministratore\footnote{per la precisione un processo che non dispone
4678 della capacità \const{CAP\_FSETID}, vedi sez.~\ref{sec:proc_capabilities}.}
4679 effettui una scrittura. In questo modo anche se un utente malizioso scopre un
4680 file \acr{suid} su cui può scrivere, un'eventuale modifica comporterà la
4681 perdita di questo privilegio.
4683 Le funzioni \func{chmod} e \func{fchmod} ci permettono di modificare i
4684 permessi di un file, resta però il problema di quali sono i permessi assegnati
4685 quando il file viene creato. Le funzioni dell'interfaccia nativa di Unix, come
4686 vedremo in sez.~\ref{sec:file_open_close}, permettono di indicare
4687 esplicitamente i permessi di creazione di un file, ma questo non è possibile
4688 per le funzioni dell'interfaccia standard ANSI C che non prevede l'esistenza
4689 di utenti e gruppi, ed inoltre il problema si pone anche per l'interfaccia
4690 nativa quando i permessi non vengono indicati esplicitamente.
4694 Per le funzioni dell'interfaccia standard ANSI C l'unico riferimento possibile
4695 è quello della modalità di apertura del nuovo file (lettura/scrittura o sola
4696 lettura), che però può fornire un valore che è lo stesso per tutti e tre i
4697 permessi di sez.~\ref{sec:file_perm_overview} (cioè $666$ nel primo caso e
4698 $222$ nel secondo). Per questo motivo il sistema associa ad ogni
4699 processo\footnote{è infatti contenuta nel campo \var{umask} della struttura
4700 \kstruct{fs\_struct}, vedi fig.~\ref{fig:proc_task_struct}.} una maschera
4701 di bit, la cosiddetta \textit{umask}, che viene utilizzata per impedire che
4702 alcuni permessi possano essere assegnati ai nuovi file in sede di creazione. I
4703 bit indicati nella maschera vengono infatti cancellati dai permessi quando un
4704 nuovo file viene creato.\footnote{l'operazione viene fatta sempre: anche
4705 qualora si indichi esplicitamente un valore dei permessi nelle funzioni di
4706 creazione che lo consentono, i permessi contenuti nella \textit{umask}
4709 La funzione di sistema che permette di impostare il valore di questa maschera
4710 di controllo è \funcd{umask}, ed il suo prototipo è:
4714 \fdecl{mode\_t umask(mode\_t mask)}
4715 \fdesc{Imposta la maschera dei permessi.}
4718 {La funzione ritorna il precedente valore della maschera, non sono previste
4719 condizioni di errore.}
4722 La funzione imposta la maschera dei permessi dei bit al valore specificato
4723 da \param{mask}, di cui vengono presi solo i 9 bit meno significativi. In
4724 genere si usa questa maschera per impostare un valore predefinito che escluda
4725 preventivamente alcuni permessi, il caso più comune è eliminare il permesso di
4726 scrittura per il gruppo e gli altri, corrispondente ad un valore
4727 per \param{mask} pari a $022$. In questo modo è possibile cancellare
4728 automaticamente i permessi non voluti. Di norma questo valore viene impostato
4729 una volta per tutte al login (a $022$ se non indicato altrimenti), e gli
4730 utenti non hanno motivi per modificarlo.
4735 \subsection{La gestione della titolarità dei file}
4736 \label{sec:file_ownership_management}
4738 Vedremo in sez.~\ref{sec:file_open_close} con quali funzioni si possono creare
4739 nuovi file, in tale occasione vedremo che è possibile specificare in sede di
4740 creazione quali permessi applicare ad un file, però non si può indicare a
4741 quale utente e gruppo esso deve appartenere. Lo stesso problema si presenta
4742 per la creazione di nuove directory (procedimento descritto in
4743 sez.~\ref{sec:file_dir_creat_rem}).
4745 Lo standard POSIX prescrive che l'\ids{UID} del nuovo file corrisponda
4746 all'\ids{UID} effettivo del processo che lo crea; per il \ids{GID} invece
4747 prevede due diverse possibilità:
4749 \item che il \ids{GID} del file corrisponda al \ids{GID} effettivo del
4751 \item che il \ids{GID} del file corrisponda al \ids{GID} della directory in
4755 In genere BSD usa sempre la seconda possibilità, che viene per questo chiamata
4756 semantica BSD. Linux invece segue normalmente quella che viene chiamata
4757 semantica SVr4: di norma un nuovo file viene creato, seguendo la prima
4758 opzione, con il \ids{GID} del processo, se però la directory in cui viene
4759 creato ha il bit \acr{sgid} dei permessi impostato allora viene usata la
4760 seconda opzione. L'adozione di questa semantica però può essere controllata,
4761 all'interno di alcuni filesystem,\footnote{con il kernel 2.6.25 questi erano
4762 \acr{ext2}, \acr{ext3}, \acr{ext4}, e \acr{XFS}.} con l'uso dell'opzione di
4763 montaggio \texttt{grpid}, che se attivata fa passare all'uso della semantica
4766 Usare la semantica BSD ha il vantaggio che il \ids{GID} viene sempre
4767 automaticamente propagato, restando coerente a quello della directory di
4768 partenza, in tutte le sotto-directory. La semantica SVr4 offre la possibilità
4769 di scegliere, ma per ottenere lo stesso risultato di coerenza che si ha con
4770 quella di BSD necessita che quando si creano nuove directory venga propagato
4771 il bit \acr{sgid}. Questo è il comportamento predefinito del comando
4772 \cmd{mkdir}, ed è in questo modo ad esempio che le varie distribuzioni
4773 assicurano che le sotto-directory create nella home di un utente restino
4774 sempre con il \ids{GID} del gruppo primario dello stesso.
4776 La presenza del bit \acr{sgid} è inoltre molto comoda quando si hanno
4777 directory contenenti file condivisi da un gruppo di utenti in cui possono
4778 scrivere tutti i membri dello stesso, dato che assicura che i file che gli
4779 utenti vi creano appartengano allo gruppo stesso. Questo non risolve però
4780 completamente i problemi di accesso da parte di altri utenti dello stesso
4781 gruppo, in quanto di default i permessi assegnati al gruppo non sono
4782 sufficienti per un accesso in scrittura; in questo caso si deve aver cura di
4783 usare prima della creazione dei file un valore per \textit{umask} lasci il
4784 permesso di scrittura per il gruppo.\footnote{in tal caso si può assegnare
4785 agli utenti del gruppo una \textit{umask} di $002$, anche se la soluzione
4786 migliore in questo caso è usare una ACL di default (vedi
4787 sez.~\ref{sec:file_ACL}).}
4789 Come avviene nel caso dei permessi esistono anche delle appropriate funzioni
4790 di sistema, \funcd{chown}, \funcd{fchown} e \funcd{lchown}, che permettono di
4791 cambiare sia l'utente che il gruppo a cui un file appartiene; i rispettivi
4797 \fdecl{int chown(const char *path, uid\_t owner, gid\_t group)}
4798 \fdecl{int fchown(int fd, uid\_t owner, gid\_t group)}
4799 \fdecl{int lchown(const char *path, uid\_t owner, gid\_t group)}
4800 \fdesc{Cambiano proprietario e gruppo proprietario di un file.}
4803 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
4804 caso \var{errno} assumerà uno dei valori:
4806 \item[\errcode{EPERM}] l'\ids{UID} effettivo non corrisponde a quello del
4807 proprietario del file o non è zero, o utente e gruppo non sono validi.
4809 ed inoltre per tutte \errval{EROFS} e \errval{EIO}, per \func{chown}
4810 \errval{EACCES}, \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
4811 \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, per \func{fchown}
4812 \errval{EBADF} nel loro significato generico.}
4815 Le funzioni cambiano utente e gruppo di appartenenza di un file ai valori
4816 specificati dalle variabili \param{owner} e \param{group}. Con Linux solo
4817 l'amministratore\footnote{o in generale un processo con la capacità
4818 \const{CAP\_CHOWN}, vedi sez.~\ref{sec:proc_capabilities}.} può cambiare il
4819 proprietario di un file; in questo viene seguita la semantica usata da BSD che
4820 non consente agli utenti di assegnare i loro file ad altri utenti evitando
4821 eventuali aggiramenti delle quote. L'amministratore può cambiare sempre il
4822 gruppo di un file, il proprietario può cambiare il gruppo solo dei file che
4823 gli appartengono e solo se il nuovo gruppo è il suo gruppo primario o uno dei
4824 gruppi di cui fa parte.
4826 La funzione \func{chown} segue i collegamenti simbolici, per operare
4827 direttamente su un collegamento simbolico si deve usare la funzione
4828 \func{lchown}.\footnote{fino alla versione 2.1.81 in Linux \func{chown} non
4829 seguiva i collegamenti simbolici, da allora questo comportamento è stato
4830 assegnato alla funzione \func{lchown}, introdotta per l'occasione, ed è
4831 stata creata una nuova \textit{system call} per \func{chown} che seguisse i
4832 collegamenti simbolici.} La funzione \func{fchown} opera su un file aperto,
4833 essa è mutuata da BSD, ma non è nello standard POSIX. Un'altra estensione
4834 rispetto allo standard POSIX è che specificando $-1$ come valore per
4835 \param{owner} e \param{group} i valori restano immutati.
4837 Quando queste funzioni sono chiamate con successo da un processo senza i
4838 privilegi di amministratore entrambi i bit \acr{suid} e \acr{sgid} vengono
4839 cancellati. Questo non avviene per il bit \acr{sgid} nel caso in cui esso sia
4840 usato (in assenza del corrispondente permesso di esecuzione) per indicare che
4841 per il file è attivo il \textit{mandatory locking} (vedi
4842 sez.~\ref{sec:file_mand_locking}).
4845 \subsection{Un quadro d'insieme sui permessi}
4846 \label{sec:file_riepilogo}
4848 Avendo affrontato in maniera separata il comportamento delle varie funzioni
4849 che operano sui permessi dei file ed avendo trattato in sezioni diverse il
4850 significato dei singoli bit dei permessi, vale la pena di fare un riepilogo in
4851 cui si riassumano le caratteristiche di ciascuno di essi, in modo da poter
4852 fornire un quadro d'insieme.
4857 \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
4859 \multicolumn{3}{|c|}{special}&
4860 \multicolumn{3}{|c|}{user}&
4861 \multicolumn{3}{|c|}{group}&
4862 \multicolumn{3}{|c|}{other}&
4863 \multirow{2}{*}{\textbf{Significato per i file}} \\
4865 \texttt{s}&\texttt{s}&\texttt{t}&
4866 \texttt{r}&\texttt{w}&\texttt{x}&
4867 \texttt{r}&\texttt{w}&\texttt{x}&
4868 \texttt{r}&\texttt{w}&\texttt{x}& \\
4871 1&-&-&-&-&1&-&-&-&-&-&-&Eseguito conferisce l'\ids{UID} effettivo dell'utente.\\
4872 -&1&-&-&-&1&-&-&-&-&-&-&Eseguito conferisce il \ids{GID} effettivo del gruppo.\\
4873 -&1&-&-&-&0&-&-&-&-&-&-&Il \textit{mandatory locking} è abilitato.\\
4874 -&-&1&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
4875 -&-&-&1&-&-&-&-&-&-&-&-&Permesso di lettura per l'utente.\\
4876 -&-&-&-&1&-&-&-&-&-&-&-&Permesso di scrittura per l'utente.\\
4877 -&-&-&-&-&1&-&-&-&-&-&-&Permesso di esecuzione per l'utente.\\
4878 -&-&-&-&-&-&1&-&-&-&-&-&Permesso di lettura per il gruppo.\\
4879 -&-&-&-&-&-&-&1&-&-&-&-&Permesso di scrittura per il gruppo.\\
4880 -&-&-&-&-&-&-&-&1&-&-&-&Permesso di esecuzione per il gruppo.\\
4881 -&-&-&-&-&-&-&-&-&1&-&-&Permesso di lettura per tutti gli altri.\\
4882 -&-&-&-&-&-&-&-&-&-&1&-&Permesso di scrittura per tutti gli altri.\\
4883 -&-&-&-&-&-&-&-&-&-&-&1&Permesso di esecuzione per tutti gli altri.\\
4886 \multicolumn{3}{|c|}{special}&
4887 \multicolumn{3}{|c|}{user}&
4888 \multicolumn{3}{|c|}{group}&
4889 \multicolumn{3}{|c|}{other}&
4890 \multirow{2}{*}{\textbf{Significato per le directory}} \\
4892 \texttt{s}&\texttt{s}&\texttt{t}&
4893 \texttt{r}&\texttt{w}&\texttt{x}&
4894 \texttt{r}&\texttt{w}&\texttt{x}&
4895 \texttt{r}&\texttt{w}&\texttt{x}& \\
4898 1&-&-&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
4899 -&1&-&-&-&-&-&-&-&-&-&-&Propaga il gruppo ai nuovi file creati.\\
4900 -&-&1&-&-&-&-&-&-&-&-&-&Solo il proprietario di un file può rimuoverlo.\\
4901 -&-&-&1&-&-&-&-&-&-&-&-&Permesso di visualizzazione per l'utente.\\
4902 -&-&-&-&1&-&-&-&-&-&-&-&Permesso di aggiornamento per l'utente.\\
4903 -&-&-&-&-&1&-&-&-&-&-&-&Permesso di attraversamento per l'utente.\\
4904 -&-&-&-&-&-&1&-&-&-&-&-&Permesso di visualizzazione per il gruppo.\\
4905 -&-&-&-&-&-&-&1&-&-&-&-&Permesso di aggiornamento per il gruppo.\\
4906 -&-&-&-&-&-&-&-&1&-&-&-&Permesso di attraversamento per il gruppo.\\
4907 -&-&-&-&-&-&-&-&-&1&-&-&Permesso di visualizzazione per tutti gli altri.\\
4908 -&-&-&-&-&-&-&-&-&-&1&-&Permesso di aggiornamento per tutti gli altri.\\
4909 -&-&-&-&-&-&-&-&-&-&-&1&Permesso di attraversamento per tutti gli altri.\\
4912 \caption{Tabella riassuntiva del significato dei bit dei permessi per un
4914 \label{tab:file_fileperm_bits}
4917 Nella parte superiore di tab.~\ref{tab:file_fileperm_bits} si è riassunto il
4918 significato dei vari bit dei permessi per un file ordinario; per quanto
4919 riguarda l'applicazione dei permessi per proprietario, gruppo ed altri si
4920 ricordi quanto illustrato in sez.~\ref{sec:file_perm_overview}. Per
4921 compattezza, nella tabella si sono specificati i bit di \textit{suid},
4922 \textit{sgid} e \textit{sticky} con la notazione illustrata anche in
4923 fig.~\ref{fig:file_perm_bit}. Nella parte inferiore si sono invece riassunti
4924 i significati dei vari bit dei permessi per una directory; anche in questo
4925 caso si è riapplicato ai bit di \textit{suid}, \textit{sgid} e \textit{sticky}
4926 la notazione illustrata in fig.~\ref{fig:file_perm_bit}.
4928 Si ricordi infine che i permessi non hanno alcun significato per i
4929 collegamenti simbolici, mentre per i file di dispositivo hanno senso soltanto
4930 i permessi di lettura e scrittura, che si riflettono sulla possibilità di
4931 compiere dette operazioni sul dispositivo stesso.
4933 Nella tabella si è indicato con il carattere ``-'' il fatto che il valore del
4934 bit in questione non è influente rispetto a quanto indicato nella riga della
4935 tabella; la descrizione del significato fa riferimento soltanto alla
4936 combinazione di bit per i quali è stato riportato esplicitamente un valore.
4937 Si rammenti infine che il valore dei bit dei permessi non ha alcun effetto
4938 qualora il processo possieda i privilegi di amministratore.
4941 \section{Caratteristiche e funzionalità avanzate}
4942 \label{sec:file_dir_advances}
4944 Tratteremo qui alcune caratteristiche e funzionalità avanzate della gestione
4945 di file e directory, affrontando anche una serie di estensioni
4946 dell'interfaccia classica dei sistemi unix-like, principalmente utilizzate a
4947 scopi di sicurezza, che sono state introdotte nelle versioni più recenti di
4950 \subsection{Gli attributi estesi}
4951 \label{sec:file_xattr}
4953 \itindbeg{Extended~Attributes}
4955 Nelle sezioni precedenti abbiamo trattato in dettaglio le varie informazioni
4956 che il sistema mantiene negli \textit{inode}, e le varie funzioni che
4957 permettono di modificarle. Si sarà notato come in realtà queste informazioni
4958 siano estremamente ridotte. Questo è dovuto al fatto che Unix origina negli
4959 anni '70, quando le risorse di calcolo e di spazio disco erano minime. Con il
4960 venir meno di queste restrizioni è incominciata ad emergere l'esigenza di
4961 poter associare ai file delle ulteriori informazioni astratte (quelli che
4962 abbiamo chiamato genericamente \textsl{metadati}) che però non potevano
4963 trovare spazio nei dati classici mantenuti negli \textit{inode}.
4965 Per risolvere questo problema alcuni sistemi unix-like (e fra questi anche
4966 Linux) hanno introdotto un meccanismo generico, detto \textit{Extended
4967 Attributes} che consente di associare delle informazioni ulteriori ai
4968 singoli file; ad esempio vengono usati per la gestione delle ACL, che
4969 tratteremo in sez.~\ref{sec:file_ACL} e per le \textit{file capabilities}, che
4970 vedremo in sez.~\ref{sec:proc_capabilities}. Gli \textsl{attributi estesi}
4971 (abbreviati in \textsl{xattr}) non sono altro che delle coppie nome/valore che
4972 sono associate permanentemente ad un oggetto sul filesystem, analoghi di
4973 quello che sono le variabili di ambiente (vedi sez.~\ref{sec:proc_environ})
4976 Altri sistemi (come Solaris, MacOS e Windows) hanno adottato un meccanismo
4977 diverso in cui ad un file sono associati diversi flussi di dati, su cui
4978 possono essere mantenute ulteriori informazioni, che possono essere accedute
4979 con le normali operazioni di lettura e scrittura. Questi non vanno confusi con
4980 gli \textit{Extended Attributes} (anche se su Solaris hanno lo stesso nome),
4981 che sono un meccanismo molto più semplice, che pur essendo limitato (potendo
4982 contenere solo una quantità limitata di informazione) hanno il grande
4983 vantaggio di essere molto più semplici da realizzare, più
4984 efficienti,\footnote{cosa molto importante, specie per le applicazioni che
4985 richiedono una gran numero di accessi, come le ACL.} e di garantire
4986 l'atomicità di tutte le operazioni.
4988 In Linux gli attributi estesi sono sempre associati al singolo \textit{inode}
4989 e l'accesso viene sempre eseguito in forma atomica, in lettura il valore
4990 corrente viene scritto su un buffer in memoria, mentre la scrittura prevede
4991 che ogni valore precedente sia sovrascritto.
4993 Si tenga presente che non tutti i filesystem supportano gli \textit{Extended
4994 Attributes}; al momento della scrittura di queste dispense essi sono
4995 presenti solo sui vari \acr{extN}, \acr{ReiserFS}, \acr{JFS},
4996 \acr{XFS}, \acr{Btrfs}, \acr{Lustre} e \acr{OCFS2}. Inoltre a
4997 seconda della implementazione ci possono essere dei limiti sulla quantità di
4998 attributi che si possono utilizzare.\footnote{ad esempio nel caso di
4999 \acr{ext2} ed \acr{ext3} è richiesto che essi siano contenuti
5000 all'interno di un singolo blocco, pertanto con dimensioni massime pari a
5001 1024, 2048 o 4096 byte a seconda delle dimensioni di quest'ultimo impostate
5002 in fase di creazione del filesystem, mentre con \textsl{XFS} e
5003 \textsl{Btrfs} non ci sono limiti ed i dati vengono memorizzati in maniera
5004 diversa (nell'\textit{inode} stesso, in un blocco a parte, o in una
5005 struttura ad albero dedicata) per mantenerne la scalabilità; lasciamo i
5006 dettagli dei vari filesystem alla documentazione accessibile con \texttt{man
5007 xattr}.} Infine lo spazio utilizzato per mantenere gli attributi estesi
5008 viene tenuto in conto per il calcolo delle quote di utente e gruppo
5009 proprietari del file.
5011 Come meccanismo per mantenere informazioni aggiuntive associate al singolo
5012 file, gli \textit{Extended Attributes} possono avere usi anche molto diversi
5013 fra loro. Per poterli distinguere allora sono stati suddivisi in
5014 \textsl{classi}, a cui poter applicare requisiti diversi per l'accesso e la
5015 gestione. Per questo motivo il nome di un attributo deve essere sempre
5016 specificato nella forma \texttt{namespace.attribute}, dove \texttt{namespace}
5017 fa riferimento alla classe a cui l'attributo appartiene, mentre
5018 \texttt{attribute} è il nome ad esso assegnato. In tale forma il nome di un
5019 attributo esteso deve essere univoco. Al momento sono state definite le
5020 quattro classi di attributi riportate in
5021 tab.~\ref{tab:extended_attribute_class}.
5026 \begin{tabular}{|l|p{8cm}|}
5028 \textbf{Nome} & \textbf{Descrizione} \\
5031 \texttt{security}&Gli \textit{extended security attributes}: vengono
5032 utilizzati dalle estensioni di sicurezza del kernel (i
5033 \textit{Linux Security Modules}), per le realizzazione
5034 di meccanismi evoluti di controllo di accesso come
5035 \textit{SELinux} o le \textit{capabilities} dei
5036 file di sez.~\ref{sec:proc_capabilities}.\\
5037 \texttt{system} & Gli \textit{extended system attributes}: sono usati
5038 dal kernel per memorizzare dati di sistema associati ai
5039 file come le ACL (vedi sez.~\ref{sec:file_ACL}) o le
5040 \textit{capabilities} (vedi
5041 sez.~\ref{sec:proc_capabilities}).\\
5042 \texttt{trusted}& I \textit{trusted extended attributes}: vengono
5043 utilizzati per poter realizzare in \textit{user space}
5044 meccanismi che consentano di mantenere delle
5045 informazioni sui file che non devono essere accessibili
5046 ai processi ordinari.\\
5047 \texttt{user} & Gli \textit{extended user attributes}: utilizzati per
5048 mantenere informazioni aggiuntive sui file (come il
5049 \textit{mime-type}, la codifica dei caratteri o del
5050 file) accessibili dagli utenti.\\
5053 \caption{I nomi utilizzati valore di \texttt{namespace} per distinguere le
5054 varie classi di \textit{Extended Attributes}.}
5055 \label{tab:extended_attribute_class}
5059 Dato che uno degli usi degli \textit{Extended Attributes} è di impiegarli per
5060 realizzare delle estensioni al tradizionale meccanismo dei controlli di
5061 accesso di Unix (come le ACL, \textit{SELinux}, ecc.), l'accesso ai loro
5062 valori viene regolato in maniera diversa a seconda sia della loro classe che
5063 di quali, fra le estensioni che li utilizzano, sono poste in uso. In
5064 particolare, per ciascuna delle classi riportate in
5065 tab.~\ref{tab:extended_attribute_class}, si hanno i seguenti casi:
5066 \begin{basedescript}{\desclabelwidth{1.7cm}\desclabelstyle{\nextlinelabel}}
5067 \item[\texttt{security}] L'accesso agli \textit{extended security attributes}
5068 dipende dalle politiche di sicurezza stabilite da loro stessi tramite
5069 l'utilizzo di un sistema di controllo basato sui \textit{Linux Security
5070 Modules} (ad esempio \textit{SELinux}). Pertanto l'accesso in lettura o
5071 scrittura dipende dalle politiche di sicurezza implementate all'interno dal
5072 modulo di sicurezza che si sta utilizzando al momento (ciascuno avrà le
5073 sue). Se non è stato caricato nessun modulo di sicurezza l'accesso in
5074 lettura sarà consentito a tutti i processi, mentre quello in scrittura solo
5075 ai processi con privilegi amministrativi (per la precisione dotati della
5076 capacità \const{CAP\_SYS\_ADMIN}, vedi sez.~\ref{sec:proc_capabilities}).
5078 \item[\texttt{system}] Anche l'accesso agli \textit{extended system
5079 attributes} dipende dalle politiche di accesso che il kernel realizza
5080 anche utilizzando gli stessi valori in essi contenuti. Ad esempio nel caso
5081 delle ACL (vedi sez.~\ref{sec:file_ACL}) l'accesso è consentito in lettura
5082 ai processi che hanno la capacità di eseguire una ricerca sul file (cioè
5083 hanno il permesso di lettura sulla directory che contiene il file) ed in
5084 scrittura al proprietario del file o ai processi dotati della capacità
5085 \const{CAP\_FOWNER}, vale a dire una politica di accesso analoga a quella
5086 impiegata per gli ordinari permessi dei file.
5088 \item[\texttt{trusted}] L'accesso ai \textit{trusted extended attributes}, sia
5089 per la lettura che per la scrittura, è consentito soltanto ai processi con
5090 privilegi amministrativi dotati della capacità \const{CAP\_SYS\_ADMIN}. In
5091 questo modo si possono utilizzare questi attributi per realizzare in
5092 \textit{user space} dei meccanismi di controllo che accedono ad informazioni
5093 non disponibili ai processi ordinari.
5095 \item[\texttt{user}] L'accesso agli \textit{extended user attributes} è
5096 regolato dai normali permessi dei file: occorre avere il permesso di lettura
5097 per leggerli e quello di scrittura per scriverli o modificarli. Dato l'uso
5098 di questi attributi si è scelto di applicare al loro accesso gli stessi
5099 criteri che si usano per l'accesso al contenuto dei file (o delle directory)
5100 cui essi fanno riferimento. Questa scelta vale però soltanto per i file e le
5101 directory ordinarie, se valesse in generale infatti si avrebbe un serio
5102 problema di sicurezza dato che esistono diversi oggetti sul filesystem per i
5103 quali è normale avere il permesso di scrittura consentito a tutti gli
5104 utenti, come i collegamenti simbolici, o alcuni file di dispositivo come
5105 \texttt{/dev/null}. Se fosse possibile usare su di essi gli \textit{extended
5106 user attributes} un utente qualunque potrebbe inserirvi dati a
5107 piacere.\footnote{la cosa è stata notata su XFS, dove questo comportamento
5108 permetteva, non essendovi limiti sullo spazio occupabile dagli
5109 \textit{Extended Attributes}, di bloccare il sistema riempiendo il disco.}
5111 La semantica del controllo di accesso indicata inoltre non avrebbe alcun
5112 senso al di fuori di file e directory: i permessi di lettura e scrittura per
5113 un file di dispositivo attengono alle capacità di accesso al dispositivo
5114 sottostante,\footnote{motivo per cui si può formattare un disco anche se
5115 \texttt{/dev} è su un filesystem in sola lettura.} mentre per i
5116 collegamenti simbolici questi vengono semplicemente ignorati: in nessuno dei
5117 due casi hanno a che fare con il contenuto del file, e nella discussione
5118 relativa all'uso degli \textit{extended user attributes} nessuno è mai stato
5119 capace di indicare una qualche forma sensata di utilizzo degli stessi per
5120 collegamenti simbolici o file di dispositivo, e neanche per le \textit{fifo}
5123 Per questo motivo essi sono stati completamente disabilitati per tutto ciò
5124 che non sia un file regolare o una directory.\footnote{si può verificare la
5125 semantica adottata consultando il file \texttt{fs/xattr.c} dei sorgenti
5126 del kernel.} Inoltre per le directory è stata introdotta una ulteriore
5127 restrizione, dovuta di nuovo alla presenza ordinaria di permessi di
5128 scrittura completi su directory come \texttt{/tmp}. Per questo motivo, per
5129 evitare eventuali abusi, se una directory ha lo \textit{sticky bit} attivo
5130 sarà consentito scrivere i suoi \textit{extended user attributes} soltanto
5131 se si è proprietari della stessa, o si hanno i privilegi amministrativi
5132 della capacità \const{CAP\_FOWNER}.
5135 Le funzioni per la gestione degli attributi estesi, come altre funzioni di
5136 gestione avanzate specifiche di Linux, non fanno parte della \acr{glibc}, e
5137 sono fornite da una apposita libreria, \texttt{libattr}, che deve essere
5138 installata a parte;\footnote{la versione corrente della libreria è
5139 \texttt{libattr1}.} pertanto se un programma le utilizza si dovrà indicare
5140 esplicitamente l'uso della suddetta libreria invocando il compilatore con
5141 l'opzione \texttt{-lattr}.
5143 Per leggere gli attributi estesi sono disponibili tre diverse funzioni di
5144 sistema, \funcd{getxattr}, \funcd{lgetxattr} e \funcd{fgetxattr}, che
5145 consentono rispettivamente di richiedere gli attributi relativi a un file, a
5146 un collegamento simbolico e ad un file descriptor; i rispettivi prototipi
5151 \fhead{attr/xattr.h}
5152 \fdecl{ssize\_t getxattr(const char *path, const char *name, void *value,
5154 \fdecl{ssize\_t lgetxattr(const char *path, const char *name, void *value,
5156 \fdecl{ssize\_t fgetxattr(int filedes, const char *name, void *value,
5158 \fdesc{Leggono il valore di un attributo esteso.}
5161 {Le funzioni ritornano un intero positivo che indica la dimensione
5162 dell'attributo richiesto in caso di successo e $-1$ per un errore, nel qual
5163 caso \var{errno} assumerà uno dei valori:
5165 \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
5166 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
5167 filesystem o sono disabilitati.
5168 \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
5169 non è sufficiente per contenere il risultato.
5171 ed inoltre tutti gli errori delle analoghe della famiglia \func{stat} con lo
5172 stesso significato, ed in particolare \errcode{EPERM} se non si hanno i
5173 permessi di accesso all'attributo.}
5176 Le funzioni \func{getxattr} e \func{lgetxattr} prendono come primo argomento
5177 un \textit{pathname} che indica il file di cui si vuole richiedere un
5178 attributo, la sola differenza è che la seconda, se il \textit{pathname} indica
5179 un collegamento simbolico, restituisce gli attributi di quest'ultimo e non
5180 quelli del file a cui esso fa riferimento. La funzione \func{fgetxattr} prende
5181 invece come primo argomento un numero di file descriptor, e richiede gli
5182 attributi del file ad esso associato.
5184 Tutte e tre le funzioni richiedono di specificare nell'argomento \param{name}
5185 il nome dell'attributo di cui si vuole ottenere il valore. Il nome deve essere
5186 indicato comprensivo di prefisso del \textit{namespace} cui appartiene (uno
5187 dei valori di tab.~\ref{tab:extended_attribute_class}) nella forma
5188 \texttt{namespace.attributename}, come stringa terminata da un carattere NUL.
5189 Il valore dell'attributo richiesto verrà restituito nel buffer puntato
5190 dall'argomento \param{value} per una dimensione massima di \param{size} byte
5191 (gli attributi estesi possono essere costituiti arbitrariamente da dati
5192 testuali o binari); se quest'ultima non è sufficiente si avrà un errore di
5195 Per evitare di dover indovinare la dimensione di un attributo per tentativi si
5196 può eseguire una interrogazione utilizzando un valore nullo per \param{size};
5197 in questo caso non verrà letto nessun dato, ma verrà restituito come valore di
5198 ritorno della funzione chiamata la dimensione totale dell'attributo esteso
5199 richiesto, che si potrà usare come stima per allocare un buffer di dimensioni
5202 Si tenga conto che questa è comunque una stima perché anche se le funzioni
5203 restituiscono la dimensione esatta dell'attributo al momento in cui sono
5204 eseguite, questa potrebbe essere modificata in qualunque momento da un
5205 successivo accesso eseguito da un altro processo, pertanto si verifichi sempre
5206 il valore di ritorno ed il codice di errore della funzione usata, senza dare
5207 per scontato che essa abbia sempre successo.
5209 Un secondo gruppo di funzioni sono quelle che consentono di impostare il
5210 valore di un attributo esteso, le funzioni sono \funcd{setxattr},
5211 \funcd{lsetxattr} e \funcd{fsetxattr} e consentono di operare rispettivamente
5212 su un file, su un collegamento simbolico o utilizzando un file descriptor; i
5213 rispettivi prototipi sono:
5217 \fhead{attr/xattr.h}
5218 \fdecl{int setxattr(const char *path, const char *name, const void *value,\\
5219 \phantom{int setxattr(}size\_t size, int flags)}
5220 \fdecl{int lsetxattr(const char *path, const char *name, const void *value,\\
5221 \phantom{int lsetxattr(}size\_t size, int flags)}
5222 \fdecl{int fsetxattr(int filedes, const char *name, const void *value,\\
5223 \phantom{int fsetxattr(}size\_t size, int flags)}
5224 \fdesc{Impostano il valore di un attributo esteso.}
5227 {Le funzioni ritornano un $0$ in caso di successo e $-1$ per un errore, nel qual
5228 caso \var{errno} assumerà uno dei valori:
5230 \item[\errcode{EEXIST}] si è usato il flag \const{XATTR\_CREATE} ma
5231 l'attributo esiste già.
5232 \item[\errcode{ENOATTR}] si è usato il flag \const{XATTR\_REPLACE} e
5233 l'attributo richiesto non esiste.
5234 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
5235 filesystem o sono disabilitati.
5237 ed inoltre tutti gli errori delle analoghe della famiglia \func{stat} con lo
5238 stesso significato ed in particolare \errcode{EPERM} se non si hanno i
5239 permessi di accesso all'attributo.}
5242 Le tre funzioni prendono come primo argomento un valore adeguato al loro scopo
5243 (un \textit{pathname} le prime due, un file descriptor la terza), usato in
5244 maniera del tutto identica a quanto visto in precedenza per le analoghe che
5245 leggono gli attributi estesi.
5247 Il secondo argomento, \param{name}, deve indicare, anche in questo caso con
5248 gli stessi criteri appena visti per le analoghe \func{getxattr},
5249 \func{lgetxattr} e \func{fgetxattr}, il nome (completo di suffisso)
5250 dell'attributo su cui si vuole operare. Il valore che verrà assegnato
5251 all'attributo dovrà essere preparato nel buffer puntato da \param{value}, e la
5252 sua dimensione totale (in byte) dovrà essere indicata dall'argomento
5255 Infine l'argomento \param{flag} consente di controllare le modalità di
5256 sovrascrittura dell'attributo esteso, esso può prendere due valori: con
5257 \constd{XATTR\_REPLACE} si richiede che l'attributo esista, nel qual caso
5258 verrà sovrascritto ed altrimenti si avrà errore; con \constd{XATTR\_CREATE} si
5259 richiede che l'attributo non esista, nel qual caso verrà creato, altrimenti si
5260 avrà errore ed il valore attuale non sarà modificato. Utilizzando per
5261 \param{flag} un valore nullo l'attributo verrà modificato se è già presente, o
5264 Le funzioni finora illustrate permettono di leggere o scrivere gli attributi
5265 estesi presenti su un file, ma sarebbe altrettanto utile poter sapere quali
5266 sono questi attributi; per questo sono disponibili le ulteriori tre funzioni
5267 di sistema \funcd{listxattr}, \funcd{llistxattr} e \funcd{flistxattr} i cui
5272 \fhead{attr/xattr.h}
5273 \fdecl{ssize\_t listxattr(const char *path, char *list, size\_t size)}
5274 \fdecl{ssize\_t llistxattr(const char *path, char *list, size\_t size)}
5275 \fdecl{ssize\_t flistxattr(int filedes, char *list, size\_t size)}
5276 \fdesc{Leggono la lista degli attributi estesi di un file.}
5279 {Le funzioni ritornano un intero positivo che indica la dimensione della lista
5280 in caso di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà
5283 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
5284 filesystem o sono disabilitati.
5285 \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
5286 non è sufficiente per contenere il risultato.
5288 ed inoltre tutti gli errori delle analoghe della famiglia \func{stat} con lo
5289 stesso significato ed in particolare \errcode{EPERM} se non si hanno i
5290 permessi di accesso all'attributo.}
5293 Come per le precedenti le tre funzioni leggono gli attributi rispettivamente
5294 di un file, un collegamento simbolico o specificando un file descriptor, da
5295 specificare con il loro primo argomento. Gli altri due argomenti, identici per
5296 tutte e tre, indicano rispettivamente il puntatore \param{list} al buffer dove
5297 deve essere letta la lista e la dimensione \param{size} di quest'ultimo.
5299 La lista viene fornita come sequenza non ordinata dei nomi dei singoli
5300 attributi estesi (sempre comprensivi del prefisso della loro classe) ciascuno
5301 dei quali è terminato da un carattere nullo. I nomi sono inseriti nel buffer
5302 uno di seguito all'altro. Il valore di ritorno della funzione indica la
5303 dimensione totale della lista in byte.
5305 Come per le funzioni di lettura dei singoli attributi se le dimensioni del
5306 buffer non sono sufficienti si avrà un errore, ma è possibile ottenere dal
5307 valore di ritorno della funzione una stima della dimensione totale della lista
5308 usando per \param{size} un valore nullo.
5310 Infine per rimuovere semplicemente un attributo esteso, si ha a disposizione
5311 un ultimo gruppo di funzioni di sistema: \funcd{removexattr},
5312 \funcd{lremovexattr} e \funcd{fremovexattr}; i rispettivi prototipi sono:
5316 \fhead{attr/xattr.h}
5317 \fdecl{int removexattr(const char *path, const char *name)}
5318 \fdecl{int lremovexattr(const char *path, const char *name)}
5319 \fdecl{int fremovexattr(int filedes, const char *name)}
5320 \fdesc{Rimuovono un attributo esteso di un file.}
5323 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
5324 caso \var{errno} assumerà uno dei valori:
5326 \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
5327 \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
5328 filesystem o sono disabilitati.
5330 ed inoltre tutti gli errori delle analoghe della famiglia \func{stat} con lo
5331 stesso significato ed in particolare \errcode{EPERM} se non si hanno i
5332 permessi di accesso all'attributo.}
5335 Le tre funzioni rimuovono un attributo esteso operando rispettivamente su di
5336 un file, su un collegamento simbolico o un file descriptor, che vengono
5337 specificati dal valore passato con il loro primo argomento. L'attributo da
5338 rimuovere deve essere anche in questo caso indicato con
5339 l'argomento \param{name} secondo le stesse modalità già illustrate in
5340 precedenza per le altre funzioni relative alla gestione degli attributi
5343 \itindend{Extended~Attributes}
5346 \subsection{Le \textit{Access Control List}}
5347 \label{sec:file_ACL}
5349 % la documentazione di sistema è nei pacchetti libacl1-dev e acl
5350 % vedi anche http://www.suse.de/~agruen/acl/linux-acls/online/
5352 \itindbeg{Access~Control~List~(ACL)}
5354 Il modello classico dei permessi di Unix, per quanto funzionale ed efficiente,
5355 è comunque piuttosto limitato e per quanto possa aver coperto per lunghi anni
5356 le esigenze più comuni con un meccanismo semplice e potente, non è in grado di
5357 rispondere in maniera adeguata a situazioni che richiedono una gestione più
5358 complessa dei permessi di accesso.\footnote{già un requisito come quello di
5359 dare accesso in scrittura ad alcune persone ed in sola lettura ad altre non
5360 si può soddisfare in maniera semplice.}
5362 Per questo motivo erano state progressivamente introdotte nelle varie versioni
5363 di Unix dei meccanismi di gestione dei permessi dei file più flessibili, nella
5364 forma delle cosiddette \textit{Access Control List} (indicate usualmente con
5365 la sigla ACL). Nello sforzo di standardizzare queste funzionalità era stato
5366 creato un gruppo di lavoro il cui scopo era estendere lo standard POSIX 1003
5367 attraverso due nuovi insiemi di specifiche, la POSIX 1003.1e per l'interfaccia
5368 di programmazione e la POSIX 1003.2c per i comandi di shell.
5370 Gli obiettivi del gruppo di lavoro erano però forse troppo ambizioni, e nel
5371 gennaio del 1998 i finanziamenti vennero ritirati senza che si fosse arrivati
5372 alla definizione dello standard richiesto. Dato però che una parte della
5373 documentazione prodotta era di alta qualità venne deciso di rilasciare al
5374 pubblico la diciassettesima bozza del documento, quella che va sotto il nome
5375 di \textit{POSIX 1003.1e Draft 17}, che è divenuta la base sulla quale si
5376 definiscono le cosiddette \textit{Posix ACL}.
5378 A differenza di altri sistemi, come ad esempio FreeBSD, nel caso di Linux si è
5379 scelto di realizzare le ACL attraverso l'uso degli \textit{Extended
5380 Attributes} (appena trattati in sez.~\ref{sec:file_xattr}), e fornire tutte
5381 le relative funzioni di gestione tramite una libreria, \texttt{libacl} che
5382 nasconde i dettagli implementativi delle ACL e presenta ai programmi una
5383 interfaccia che fa riferimento allo standard POSIX 1003.1e.
5385 Anche in questo caso le funzioni di questa libreria non fanno parte della
5386 \acr{glibc} e devono essere installate a parte;\footnote{la versione corrente
5387 della libreria è \texttt{libacl1}, e nel caso si usi Debian la si può
5388 installare con il pacchetto omonimo e con il collegato \texttt{libacl1-dev}
5389 per i file di sviluppo.} pertanto se un programma le utilizza si dovrà
5390 indicare esplicitamente l'uso della libreria \texttt{libacl} invocando il
5391 compilatore con l'opzione \texttt{-lacl}. Si tenga presente inoltre che le ACL
5392 devono essere attivate esplicitamente montando il filesystem\footnote{che deve
5393 supportarle, ma questo è ormai vero per praticamente tutti i filesystem più
5394 comuni, con l'eccezione di NFS per il quale esiste però il supporto per le
5395 versioni NFSv2 e NFSv3 del protocollo, con NFSv4 esistono invece delle ACL
5396 native che hanno una semantica diversa, su di esse possono mappare le ACL
5397 POSIX, ma l'inverso è possibile solo in forma incompleta.} su cui le si
5398 vogliono utilizzare con l'opzione \texttt{acl} attiva. Dato che si tratta di
5399 una estensione è infatti opportuno utilizzarle soltanto laddove siano
5402 Una ACL è composta da un insieme di voci, e ciascuna voce è a sua volta
5403 costituita da un \textsl{tipo}, da un eventuale \textsl{qualificatore} (deve
5404 essere presente soltanto per le voci di tipo \const{ACL\_USER} e
5405 \const{ACL\_GROUP}) e da un insieme di permessi. Ad ogni oggetto sul
5406 filesystem si può associare una ACL che ne governa i permessi di accesso,
5407 detta \textit{access ACL}. Inoltre per le directory si può impostare una ACL
5408 aggiuntiva, detta ``\textit{Default ACL}'', che serve ad indicare quale dovrà
5409 essere la ACL assegnata di default nella creazione di un file all'interno
5410 della directory stessa. Come avviene per i permessi le ACL possono essere
5411 impostate solo del proprietario del file, o da un processo con la capacità
5412 \const{CAP\_FOWNER}.
5417 \begin{tabular}{|l|p{8cm}|}
5419 \textbf{Tipo} & \textbf{Descrizione} \\
5422 \constd{ACL\_USER\_OBJ}& Voce che contiene i diritti di accesso del
5423 proprietario del file.\\
5424 \constd{ACL\_USER} & Voce che contiene i diritti di accesso per
5425 l'utente indicato dal rispettivo
5427 \constd{ACL\_GROUP\_OBJ}&Voce che contiene i diritti di accesso del
5428 gruppo proprietario del file.\\
5429 \constd{ACL\_GROUP} & Voce che contiene i diritti di accesso per
5430 il gruppo indicato dal rispettivo
5432 \constd{ACL\_MASK} & Voce che contiene la maschera dei massimi
5433 permessi di accesso che possono essere garantiti
5434 da voci del tipo \const{ACL\_USER},
5435 \const{ACL\_GROUP} e \const{ACL\_GROUP\_OBJ}.\\
5436 \constd{ACL\_OTHER} & Voce che contiene i diritti di accesso di chi
5437 non corrisponde a nessuna altra voce dell'ACL.\\
5440 \caption{Le costanti che identificano i tipi delle voci di una ACL.}
5441 \label{tab:acl_tag_types}
5444 L'elenco dei vari tipi di voci presenti in una ACL, con una breve descrizione
5445 del relativo significato, è riportato in tab.~\ref{tab:acl_tag_types}. Tre di
5446 questi tipi, \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e
5447 \const{ACL\_OTHER}, corrispondono direttamente ai tre permessi ordinari dei
5448 file (proprietario, gruppo proprietario e tutti gli altri) e per questo una
5449 ACL valida deve sempre contenere una ed una sola voce per ciascuno di questi
5452 Una ACL può poi contenere un numero arbitrario di voci di tipo
5453 \const{ACL\_USER} e \const{ACL\_GROUP}, ciascuna delle quali indicherà i
5454 permessi assegnati all'utente e al gruppo indicato dal relativo qualificatore.
5455 Ovviamente ciascuna di queste voci dovrà fare riferimento a un utente o a un
5456 gruppo diverso, e non corrispondenti a quelli proprietari del file. Inoltre se
5457 in una ACL esiste una voce di uno di questi due tipi, è obbligatoria anche la
5458 presenza di una ed una sola voce di tipo \const{ACL\_MASK}, che negli altri
5461 Una voce di tipo \const{ACL\_MASK} serve a mantenere la maschera dei permessi
5462 che possono essere assegnati tramite voci di tipo \const{ACL\_USER},
5463 \const{ACL\_GROUP} e \const{ACL\_GROUP\_OBJ}. Se in una di queste voci si
5464 fosse specificato un permesso non presente in \const{ACL\_MASK} questo
5465 verrebbe ignorato. L'uso di una ACL di tipo \const{ACL\_MASK} è di particolare
5466 utilità quando essa associata ad una \textit{Default ACL} su una directory, in
5467 quanto i permessi così specificati verranno ereditati da tutti i file creati
5468 nella stessa directory. Si ottiene così una sorta di \textit{umask} associata
5469 ad un oggetto sul filesystem piuttosto che a un processo.
5471 Dato che le ACL vengono a costituire una estensione dei permessi ordinari, uno
5472 dei problemi che si erano posti nella loro standardizzazione era appunto
5473 quello della corrispondenza fra questi e le ACL. Come accennato i permessi
5474 ordinari vengono mappati nelle tre voci di tipo \const{ACL\_USER\_OBJ},
5475 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} che devono essere presenti in
5476 qualunque ACL; un cambiamento ad una di queste voci viene automaticamente
5477 riflesso sui permessi ordinari dei file e viceversa.\footnote{per permessi
5478 ordinari si intende quelli mantenuti nell'\textit{inode}, che devono restare
5479 dato che un filesystem può essere montato senza abilitare le ACL.}
5481 In realtà la mappatura è diretta solo per le voci \const{ACL\_USER\_OBJ} e
5482 \const{ACL\_OTHER}, nel caso di \const{ACL\_GROUP\_OBJ} questo vale soltanto
5483 se non è presente una voce di tipo \const{ACL\_MASK}, che è quanto avviene
5484 normalmente se non sono presenti ACL aggiuntive rispetto ai permessi
5485 ordinari. Se invece questa è presente verranno tolti dai permessi di
5486 \const{ACL\_GROUP\_OBJ} (cioè dai permessi per il gruppo proprietario del
5487 file) tutti quelli non presenti in \const{ACL\_MASK}.\footnote{questo diverso
5488 comportamento a seconda delle condizioni è stato introdotto dalla
5489 standardizzazione \textit{POSIX 1003.1e Draft 17} per mantenere il
5490 comportamento invariato sui sistemi dotati di ACL per tutte quelle
5491 applicazioni che sono conformi soltanto all'ordinario standard \textit{POSIX
5494 Un secondo aspetto dell'incidenza delle ACL sul comportamento del sistema è
5495 quello relativo alla creazione di nuovi file,\footnote{o oggetti sul
5496 filesystem, il comportamento discusso vale per le funzioni \func{open} e
5497 \func{creat} (vedi sez.~\ref{sec:file_open_close}), \func{mkdir} (vedi
5498 sez.~\ref{sec:file_dir_creat_rem}), \func{mknod} e \func{mkfifo} (vedi
5499 sez.~\ref{sec:file_mknod}).} che come accennato può essere modificato dalla
5500 presenza di una \textit{Default ACL} sulla directory che andrà a contenerli.
5501 Se questa non c'è valgono le regole usuali illustrate in
5502 sez.~\ref{sec:file_perm_management}, per cui essi sono determinati dalla
5503 \textit{umask} del processo, e la sola differenza è che i permessi ordinari da
5504 esse risultanti vengono automaticamente rimappati anche su una ACL di accesso
5505 assegnata automaticamente al nuovo file, che contiene soltanto le tre
5506 corrispondenti voci di tipo \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e
5509 Se invece è presente una ACL di default sulla directory che contiene il nuovo
5510 file, essa diventerà automaticamente anche la ACL di accesso di quest'ultimo,
5511 a meno di non aver indicato, nelle funzioni di creazione che lo consentono,
5512 uno specifico valore per i permessi ordinari.\footnote{tutte le funzioni
5513 citate in precedenza supportano un argomento \var{mode} che indichi un
5514 insieme di permessi iniziale.} In tal caso saranno eliminati dalle voci
5515 corrispondenti che deriverebbero dalla ACL di default, tutti i permessi non
5516 presenti in tale indicazione.
5518 Dato che questa è la ragione che ha portato alla loro creazione, la principale
5519 modifica introdotta nel sistema con la presenza della ACL è quella alle regole
5520 del controllo di accesso ai file che si sono illustrate in
5521 sez.~\ref{sec:file_perm_overview}. Come nel caso ordinario per il controllo
5522 vengono sempre utilizzati gli identificatori del gruppo \textit{effective} del
5523 processo, ma in caso di presenza di una ACL sul file, i passi attraverso i
5524 quali viene stabilito se il processo ha il diritto di accesso sono i seguenti:
5526 \item Se l'\ids{UID} del processo è nullo (se cioè si è l'amministratore)
5527 l'accesso è sempre garantito senza nessun controllo.\footnote{più
5528 precisamente se si devono avere le capacità \const{CAP\_DAC\_OVERRIDE} per
5529 i file e \const{CAP\_DAC\_READ\_SEARCH} per le directory, vedi
5530 sez.~\ref{sec:proc_capabilities}.}
5531 \item Se l'\ids{UID} del processo corrisponde al proprietario del file allora:
5533 \item se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
5534 l'accesso è consentito;
5535 \item altrimenti l'accesso è negato.
5537 \item Se l'\ids{UID} del processo corrisponde ad un qualunque qualificatore
5538 presente in una voce \const{ACL\_USER} allora:
5540 \item se la voce \const{ACL\_USER} corrispondente e la voce
5541 \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
5543 \item altrimenti l'accesso è negato.
5545 \item Se è il \ids{GID} del processo o uno dei \ids{GID} supplementari
5546 corrisponde al gruppo proprietario del file allora:
5548 \item se la voce \const{ACL\_GROUP\_OBJ} e una eventuale voce
5549 \const{ACL\_MASK} (se non vi sono voci di tipo \const{ACL\_GROUP} questa
5550 può non essere presente) contengono entrambe il permesso richiesto,
5551 l'accesso è consentito;
5552 \item altrimenti l'accesso è negato.
5554 \item Se è il \ids{GID} del processo o uno dei \ids{GID} supplementari
5555 corrisponde ad un qualunque qualificatore presente in una voce
5556 \const{ACL\_GROUP} allora:
5558 \item se la voce \const{ACL\_GROUP} corrispondente e la voce
5559 \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
5561 \item altrimenti l'accesso è negato.
5563 \item Se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
5564 l'accesso è consentito, altrimenti l'accesso è negato.
5567 I passi di controllo vengono eseguiti esattamente in questa sequenza, e la
5568 decisione viene presa non appena viene trovata una corrispondenza con gli
5569 identificatori del processo. Questo significa che i permessi presenti in una
5570 voce di tipo \const{ACL\_USER} hanno la precedenza sui permessi ordinari
5571 associati al gruppo proprietario del file (vale a dire su
5572 \const{ACL\_GROUP\_OBJ}).
5574 Per la gestione delle ACL lo standard \textit{POSIX 1003.1e Draft 17} ha
5575 previsto delle apposite funzioni ed tutta una serie di tipi di dati dedicati,
5576 arrivando fino a definire un tipo di dato e delle costanti apposite per
5577 identificare i permessi standard di lettura, scrittura ed esecuzione. Tutte
5578 le operazioni devono essere effettuate attraverso tramite questi tipi di dati,
5579 che incapsulano tutte le informazioni contenute nelle ACL.
5581 La prima di queste funzioni che prendiamo in esame (si ricordi che come per
5582 tutte le altre per poterla usare occorre invocare il compilatore con l'opzione
5583 \texttt{-l acl}) è \funcd{acl\_init}, il cui prototipo è:
5588 \fdecl{acl\_t acl\_init(int count)}
5589 \fdesc{Inizializza un'area di lavoro per una ACL.}
5592 {La funzione ritorna un oggetto di tipo \type{acl\_t} in caso di successo e
5593 \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori:
5595 \item[\errcode{EINVAL}] il valore di \param{count} è negativo.
5596 \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile.
5601 La funzione alloca ed inizializza un'area di memoria che verrà usata per
5602 mantenere i dati di una ACL contenente fino ad un massimo di \param{count}
5603 voci. La funzione ritorna un valore di tipo \typed{acl\_t} da usare in tutte le
5604 altre funzioni che operano sulla ACL. La funzione si limita alla allocazione
5605 iniziale e non inserisce nessun valore nella ACL che resta vuota.
5607 Si tenga presente che pur essendo \typed{acl\_t} un tipo opaco che identifica
5608 ``\textsl{l'oggetto}'' ACL, il valore restituito dalla funzione non è altro
5609 che un puntatore all'area di memoria allocata per i dati richiesti. Pertanto
5610 in caso di fallimento verrà restituito un puntatore nullo di tipo
5611 ``\code{(acl\_t) NULL}'' e si dovrà, in questa come in tutte le funzioni
5612 seguenti che restituiscono un oggetto di tipo \type{acl\_t}, confrontare il
5613 valore di ritorno della funzione con \val{NULL} (anche se, a voler essere
5614 estremamente pignoli, si dovrebbe usare ``\code{(acl\_t) NULL}'', ma è
5615 sufficiente fare un confronto direttamente con \val{NULL} essendo cura del
5616 compilatore fare le conversioni necessarie).
5618 Una volta che si siano completate le operazioni sui dati di una ACL la memoria
5619 allocata per un oggetto \type{acl\_t} dovrà essere liberata esplicitamente
5620 attraverso una chiamata alla funzione \funcd{acl\_free}, il cui prototipo è:
5625 \fdecl{int acl\_free(void *obj\_p)}
5626 \fdesc{Disalloca la memoria riservata per una ACL.}
5629 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
5630 caso \var{errno} può assumere solo il valore:
5632 \item[\errcode{EINVAL}] \param{obj\_p} non è valido.
5637 Si noti come la funzione usi come argomento un puntatore di tipo ``\ctyp{void
5638 *}'', essa infatti può essere usata non solo per liberare la memoria
5639 allocata per i dati di una ACL, ma anche per quella usata per creare le
5640 stringhe di descrizione testuale delle ACL o per ottenere i valori dei
5641 qualificatori della una voce di una ACL. L'uso del tipo generico ``\ctyp{void
5642 *}'' consente di evitare di eseguire un \textit{cast} al tipo di dato di cui
5643 si vuole effettuare la disallocazione.
5645 Si tenga presente poi che oltre a \func{acl\_init} ci sono molte altre
5646 funzioni che possono allocare memoria per i dati delle ACL, è pertanto
5647 opportuno tenere traccia di tutte le chiamate a queste funzioni perché alla
5648 fine delle operazioni tutta la memoria allocata dovrà essere liberata con
5651 Una volta che si abbiano a disposizione i dati di una ACL tramite il
5652 riferimento ad oggetto di tipo \type{acl\_t} questi potranno essere copiati
5653 con la funzione \funcd{acl\_dup}, il cui prototipo è:
5658 \fdecl{acl\_t acl\_dup(acl\_t acl)}
5659 \fdesc{Crea una copia di una ACL.}
5662 {La funzione ritorna un oggetto di tipo \type{acl\_t} in caso di successo in
5663 caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
5664 assumerà uno dei valori:
5666 \item[\errcode{EINVAL}] l'argomento \param{acl} non è un puntatore valido
5668 \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile per eseguire
5674 La funzione crea una copia dei dati della ACL indicata tramite l'argomento
5675 \param{acl}, allocando autonomamente tutto spazio necessario alla copia e
5676 restituendo un secondo oggetto di tipo \type{acl\_t} come riferimento a
5677 quest'ultima. Valgono per questo le stesse considerazioni fatte per il valore
5678 di ritorno di \func{acl\_init}, ed in particolare il fatto che occorrerà
5679 prevedere una ulteriore chiamata esplicita a \func{acl\_free} per liberare la
5680 memoria occupata dalla copia.
5682 Se si deve creare una ACL manualmente l'uso di \func{acl\_init} è scomodo,
5683 dato che la funzione restituisce una ACL vuota, una alternativa allora è usare
5684 \funcd{acl\_from\_mode} che consente di creare una ACL a partire da un valore
5685 di permessi ordinari, il prototipo della funzione è:
5690 \fdecl{acl\_t acl\_from\_mode(mode\_t mode)}
5691 \fdesc{Crea una ACL inizializzata con i permessi ordinari.}
5694 {La funzione ritorna un oggetto di tipo \type{acl\_t} in caso di successo e
5695 \val{NULL} per un errore, nel qual caso \var{errno} può assumere solo
5696 il valore \errval{ENOMEM}.}
5700 La funzione restituisce una ACL inizializzata con le tre voci obbligatorie
5701 \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} già
5702 impostate secondo la corrispondenza ai valori dei permessi ordinari indicati
5703 dalla maschera passata nell'argomento \param{mode}. Questa funzione è una
5704 estensione usata dalle ACL di Linux e non è portabile, ma consente di
5705 semplificare l'inizializzazione in maniera molto comoda.
5707 Altre due funzioni che consentono di creare una ACL già inizializzata sono
5708 \funcd{acl\_get\_fd} e \funcd{acl\_get\_file}, che consentono di leggere la
5709 ACL di un file; i rispettivi prototipi sono:
5714 \fdecl{acl\_t acl\_get\_file(const char *path\_p, acl\_type\_t type)}
5715 \fdecl{acl\_t acl\_get\_fd(int fd)}
5716 \fdesc{Leggono i dati delle ACL di un file.}
5719 {Le funzioni ritornano un oggetto di tipo \type{acl\_t} in caso di successo e
5720 \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori:
5722 \item[\errcode{EACCESS}] non c'è accesso per una componente di
5723 \param{path\_p} o si è richiesta una ACL di default per un file (solo per
5724 \func{acl\_get\_file}).
5725 \item[\errcode{EINVAL}] \param{type} non ha un valore valido (solo per
5726 \func{acl\_get\_file}).
5727 \item[\errcode{ENOTSUP}] il filesystem cui fa riferimento il file non
5730 ed inoltre \errval{ENOMEM} per entrambe, \errval{EBADF} per
5731 \func{acl\_get\_fd}, e \errval{ENAMETOOLONG}, \errval{ENOENT},
5732 \errval{ENOTDIR}, per \func{acl\_get\_file} nel loro significato generico. }
5735 Le due funzioni ritornano, con un oggetto di tipo \type{acl\_t}, il valore
5736 della ACL correntemente associata ad un file, che può essere identificato
5737 tramite un file descriptor usando \func{acl\_get\_fd} o con un
5738 \textit{pathname} usando \func{acl\_get\_file}.
5740 Nel caso di quest'ultima funzione, che può richiedere anche la ACL relativa ad
5741 una directory, il secondo argomento \param{type} consente di specificare se si
5742 vuole ottenere la ACL di default o quella di accesso. Questo argomento deve
5743 essere di tipo \typed{acl\_type\_t} e può assumere solo i due valori riportati
5744 in tab.~\ref{tab:acl_type}.
5749 \begin{tabular}{|l|l|}
5751 \textbf{Tipo} & \textbf{Descrizione} \\
5754 \constd{ACL\_TYPE\_ACCESS} & Indica una ACL di accesso.\\
5755 \constd{ACL\_TYPE\_DEFAULT}& Indica una ACL di default.\\
5758 \caption{Le costanti che identificano il tipo di ACL.}
5759 \label{tab:acl_type}
5762 Si tenga presente che nel caso di \func{acl\_get\_file} occorrerà che il
5763 processo chiamante abbia privilegi di accesso sufficienti a poter leggere gli
5764 attributi estesi dei file (come illustrati in sez.~\ref{sec:file_xattr});
5765 inoltre una ACL di tipo \const{ACL\_TYPE\_DEFAULT} potrà essere richiesta
5766 soltanto per una directory, e verrà restituita solo se presente, altrimenti
5767 verrà restituita una ACL vuota.
5769 Infine si potrà creare una ACL direttamente dalla sua rappresentazione
5770 testuale con la funzione \funcd{acl\_from\_text}, il cui prototipo è:
5775 \fdecl{acl\_t acl\_from\_text(const char *buf\_p)}
5776 \fdesc{Crea una ACL a partire dalla sua rappresentazione testuale.}
5779 {La funzione ritorna un oggetto di tipo \type{acl\_t} in caso di successo e
5780 \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
5783 \item[\errcode{EINVAL}] la rappresentazione testuale all'indirizzo
5784 \param{buf\_p} non è valida.
5785 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
5790 La funzione prende come argomento il puntatore ad un buffer dove si è inserita
5791 la rappresentazione testuale della ACL che si vuole creare, la memoria
5792 necessaria viene automaticamente allocata ed in caso di successo viene
5793 restituito come valore di ritorno un oggetto di tipo \type{acl\_t} con il
5794 contenuto della stessa, che, come per le precedenti funzioni, dovrà essere
5795 disallocato esplicitamente al termine del suo utilizzo.
5797 La rappresentazione testuale di una ACL è quella usata anche dai comandi
5798 ordinari per la gestione delle ACL (\texttt{getfacl} e \texttt{setfacl}), che
5799 prevede due diverse forme, estesa e breve, entrambe supportate da
5800 \func{acl\_from\_text}. La forma estesa prevede che sia specificata una voce
5801 per riga, nella forma:
5803 tipo:qualificatore:permessi
5805 dove il tipo può essere uno fra \texttt{user}, \texttt{group}, \texttt{other}
5806 e \texttt{mask}. Il qualificatore è presente solo per \texttt{user} e
5807 \texttt{group} ed indica l'utente o il gruppo a cui la voce si riferisce,
5808 mentre i permessi sono espressi con una tripletta di lettere analoga a quella
5809 usata per i permessi dei file, vale a dire ``\texttt{r}'' per il permesso di
5810 lettura, ``\texttt{w}'' per il permesso di scrittura, ``\texttt{x}'' per il
5811 permesso di esecuzione (scritti in quest'ordine) e ``\texttt{-}'' per
5812 l'assenza del permesso.
5814 Un possibile esempio di rappresentazione della ACL di un file ordinario a cui,
5815 oltre ai permessi ordinari, si è aggiunto un altro utente con un accesso in
5816 lettura, è il seguente:
5825 Va precisato che i due tipi \texttt{user} e \texttt{group} sono usati
5826 rispettivamente per indicare delle voci relative ad utenti e gruppi (cioè per
5827 voci di tipo \const{ACL\_USER\_OBJ} e \const{ACL\_USER} per \texttt{user} e
5828 \const{ACL\_GROUP\_OBJ} e \const{ACL\_GROUP} per \texttt{group}) applicate sia
5829 a quelli proprietari del file che a quelli generici. Quelle dei proprietari si
5830 riconoscono per l'assenza di un qualificatore, ed in genere si scrivono per
5831 prima delle altre. Il significato delle voci di tipo \texttt{mask} e
5832 \texttt{mark} è evidente. Usando questa forma estesa si possono anche inserire
5833 dei commenti nel testo precedendoli con il carattere ``\texttt{\#}''.
5835 La forma breve prevede invece la scrittura delle singole voci su una riga,
5836 separate da virgole; come specificatori del tipo di voce si possono usare le
5837 iniziali dei valori usati nella forma estesa (cioè ``\texttt{u}'',
5838 ``\texttt{g}'', ``\texttt{o}'' e ``\texttt{m}''), mentre le altri parte della
5839 voce sono le stesse. In questo caso non sono consentiti permessi.
5841 Per la conversione inversa, che consente di ottenere la rappresentazione
5842 testuale di una ACL, sono invece disponibili due funzioni. La prima delle due,
5843 di uso più immediato, è \funcd{acl\_to\_text}, ed il suo prototipo è:
5848 \fdecl{char *acl\_to\_text(acl\_t acl, ssize\_t *len\_p)}
5849 \fdesc{Produce la rappresentazione testuale di una ACL.}
5852 {La funzione ritorna il puntatore ad una stringa con la rappresentazione
5853 testuale della ACL in caso di successo e \var{NULL} per un errore, nel qual
5854 caso \var{errno} assumerà uno dei valori:
5856 \item[\errcode{EINVAL}] o \param{acl} non è un puntatore ad una ACL o la ACL
5857 che esso indica non è valida o non può esser tradotta in forma testuale.
5858 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
5863 La funzione restituisce il puntatore ad una stringa, terminata da un NUL,
5864 contenente la rappresentazione testuale in forma estesa della ACL passata come
5865 argomento, ed alloca automaticamente la memoria necessaria. Questa dovrà poi
5866 essere liberata, quando non più necessaria, con \func{acl\_free}. Se
5867 nell'argomento \param{len\_p} si passa come valore il puntatore ad una
5868 variabile intera, in questa verrà restituita (come \textit{value result
5869 argument}) la dimensione della stringa con la rappresentazione testuale, non
5870 comprendente il carattere nullo finale.
5872 La seconda funzione, che permette di controllare con una gran dovizia di
5873 particolari la generazione della stringa contenente la rappresentazione
5874 testuale della ACL, è \funcd{acl\_to\_any\_text}, ed il suo prototipo è:
5879 \fdecl{char *acl\_to\_any\_text(acl\_t acl, const char *prefix, char
5880 separator, int options)}
5881 \fdesc{Produce la rappresentazione testuale di una ACL.}
5884 {La funzione ritorna il puntatore ad una stringa con la rappresentazione
5885 testuale della ACL in caso di successo e \val{NULL} per un errore, nel qual
5886 caso \var{errno} assumerà uno dei valori:
5888 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
5889 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
5894 La funzione converte in formato testo la ACL indicata dall'argomento
5895 \param{acl}, usando il carattere \param{separator} come separatore delle
5896 singole voci; se l'argomento \param{prefix} non è nullo la stringa da esso
5897 indicata viene utilizzata come prefisso per le singole voci.
5899 L'ultimo argomento, \param{options}, consente di controllare la modalità con
5900 cui viene generata la rappresentazione testuale. Un valore nullo fa sì che
5901 vengano usati gli identificatori standard \texttt{user}, \texttt{group},
5902 \texttt{other} e \texttt{mask} con i nomi di utenti e gruppi risolti rispetto
5903 ai loro valori numerici. Altrimenti si può specificare un valore in forma di
5904 maschera binaria, da ottenere con un OR aritmetico dei valori riportati in
5905 tab.~\ref{tab:acl_to_text_options}.
5910 \begin{tabular}{|l|p{8cm}|}
5912 \textbf{Tipo} & \textbf{Descrizione} \\
5915 \constd{TEXT\_ABBREVIATE} & Stampa le voci in forma abbreviata.\\
5916 \constd{TEXT\_NUMERIC\_IDS} & Non effettua la risoluzione di
5917 \ids{UID} e \ids{GID} lasciando i valori
5919 \constd{TEXT\_SOME\_EFFECTIVE}&Per ciascuna voce che contiene permessi che
5920 vengono eliminati dalla \const{ACL\_MASK}
5921 viene generato un commento con i permessi
5922 effettivamente risultanti; il commento è
5923 separato con un tabulatore.\\
5924 \constd{TEXT\_ALL\_EFFECTIVE}& Viene generato un commento con i permessi
5925 effettivi per ciascuna voce che contiene
5926 permessi citati nella \const{ACL\_MASK},
5927 anche quando questi non vengono modificati
5928 da essa; il commento è separato con un
5930 \constd{TEXT\_SMART\_INDENT} & Da usare in combinazione con le precedenti
5931 opzioni \const{TEXT\_SOME\_EFFECTIVE} e
5932 \const{TEXT\_ALL\_EFFECTIVE}, aumenta
5933 automaticamente il numero di spaziatori
5934 prima degli eventuali commenti in modo da
5935 mantenerli allineati.\\
5938 \caption{Possibili valori per l'argomento \param{options} di
5939 \func{acl\_to\_any\_text}.}
5940 \label{tab:acl_to_text_options}
5943 Come per \func{acl\_to\_text} anche in questo caso il buffer contenente la
5944 rappresentazione testuale dell'ACL, di cui la funzione restituisce
5945 l'indirizzo, viene allocato automaticamente, e dovrà essere esplicitamente
5946 disallocato con una chiamata ad \func{acl\_free}. Si tenga presente infine che
5947 questa funzione è una estensione specifica di Linux, e non è presente nella
5948 bozza dello standard POSIX.1e.
5950 Per quanto utile per la visualizzazione o l'impostazione da riga di comando
5951 delle ACL, la forma testuale non è la più efficiente per poter memorizzare i
5952 dati relativi ad una ACL, ad esempio quando si vuole eseguirne una copia a
5953 scopo di archiviazione. Per questo è stata prevista la possibilità di
5954 utilizzare una rappresentazione delle ACL in una apposita forma binaria
5955 contigua e persistente. È così possibile copiare il valore di una ACL in un
5956 buffer e da questa rappresentazione tornare indietro e generare una ACL.
5958 Lo standard POSIX.1e prevede a tale scopo tre funzioni, la prima e più
5959 semplice è \funcd{acl\_size}, che consente di ottenere la dimensione che avrà
5960 la citata rappresentazione binaria, in modo da poter allocare per essa un
5961 buffer di dimensione sufficiente, il suo prototipo è:
5966 \fdecl{ssize\_t acl\_size(acl\_t acl)}
5967 \fdesc{Determina la dimensione della rappresentazione binaria di una ACL.}
5970 {La funzione ritorna la dimensione in byte della rappresentazione binaria
5971 della ACL in caso di successo e $-1$ per un errore, nel qual caso
5972 \var{errno} può assumere solo il valore:
5974 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
5979 Ottenuta con \func{acl\_size} la dimensione del buffer necessaria per potervi
5980 memorizzare una ACL questo dovrà potrà essere allocato direttamente con
5981 \func{malloc}, ed a questo punto vi si potrà salvare la rappresentazione
5982 binaria della precedente ACL utilizzando la funzione \funcd{acl\_copy\_ext},
5988 \fdecl{ssize\_t acl\_copy\_ext(void *buf\_p, acl\_t acl, ssize\_t size)}
5989 \fdesc{Ottiene la rappresentazione binaria di una ACL.}
5992 {La funzione ritorna la dimensione in byte della rappresentazione binaria
5993 della ACL in caso di successo e $-1$ per un errore, nel qual caso
5994 \var{errno} assumerà uno dei valori:
5996 \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida, o
5997 \param{acl} non è un puntatore ad una ACL o \param{size} è negativo o
5999 \item[\errcode{ERANGE}] il valore di \param{size} è più piccolo della
6000 dimensione della rappresentazione binaria della ACL.
6005 La funzione scriverà la rappresentazione binaria della ACL indicata da
6006 \param{acl} sul buffer di dimensione \param{size} all'indirizzo
6007 \param{buf\_p}, restituendo la dimensione della stessa come valore di
6008 ritorno. Qualora la dimensione della rappresentazione ecceda il valore di
6009 \param{size} la funzione fallirà con un errore di \errcode{ERANGE}. La
6010 funzione non ha nessun effetto sulla ACL indicata da \param{acl}.
6012 Viceversa se si vuole ripristinare una ACL a partire da una rappresentazione
6013 binaria si potrà usare la funzione \funcd{acl\_copy\_int}, il cui prototipo è:
6018 \fdecl{acl\_t acl\_copy\_int(const void *buf\_p)}
6019 \fdesc{Ripristina la rappresentazione binaria di una ACL.}
6022 {La funzione ritorna un oggetto di tipo \type{acl\_t} in caso di successo e
6023 \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori:
6025 \item[\errcode{EINVAL}] il buffer all'indirizzo \param{buf\_p} non contiene
6026 una rappresentazione corretta di una ACL.
6027 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare un oggetto
6028 \type{acl\_t} per la ACL richiesta.
6033 La funzione alloca autonomamente un oggetto di tipo \type{acl\_t}, restituito
6034 come valore di ritorno, con il contenuto della ACL rappresentata dai dati del
6035 buffer puntato da \param{buf\_p}. Al solito l'oggetto \type{acl\_t} dovrà
6036 essere disallocato esplicitamente al termine del suo utilizzo.
6038 Una volta che si disponga della ACL desiderata, questa potrà essere impostata
6039 su un file o una directory. Per impostare una ACL sono disponibili due
6040 funzioni: \funcd{acl\_set\_file}, che opera sia su file che su directory
6041 usando un \textit{pathname}, e \funcd{acl\_set\_file} che opera solo su file
6042 usando un file descriptor; i rispettivi prototipi sono:
6047 \fdecl{int acl\_set\_file(const char *path, acl\_type\_t type, acl\_t acl)}
6048 \fdesc{Imposta una ACL su un file o una directory.}
6049 \fdecl{int acl\_set\_fd(int fd, acl\_t acl)}
6050 \fdesc{Imposta una ACL su un file descriptor.}
6053 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
6054 caso \var{errno} assumerà uno dei valori:
6056 \item[\errcode{EACCES}] o un generico errore di accesso a \param{path} o il
6057 valore di \param{type} specifica una ACL il cui tipo non può essere
6058 assegnato a \param{path}.
6059 \item[\errcode{EINVAL}] o \param{acl} non è una ACL valida, o \param{type}
6060 ha un valore non corretto per \func{acl\_set\_file} o o ha più voci di
6061 quante se ne possono assegnare al file per \func{acl\_set\_fd}.
6062 \item[\errcode{ENOSPC}] non c'è spazio disco sufficiente per contenere i
6063 dati aggiuntivi della ACL.
6064 \item[\errcode{ENOTSUP}] si è cercato di impostare una ACL su un file
6065 contenuto in un filesystem che non supporta le ACL.
6067 ed inoltre nel loro significato generico \errval{EPERM}, \errval{EROFS} per
6068 entrambe, \errval{EBADF} per \func{acl\_set\_fd}, \errval{ENAMETOOLONG},
6069 \errval{ENOENT}, \errval{ENOTDIR} per \func{acl\_set\_file}.}
6072 Con \func{acl\_set\_file} si assegna la ACL contenuta in \param{acl} al file o
6073 alla directory indicate da \param{path}, con \param{type} che indica il tipo
6074 di ACL con le costanti di tab.~\ref{tab:acl_type}; si tenga presente però che
6075 le ACL di default possono essere solo impostate qualora \param{path} indichi
6076 una directory. Inoltre perché la funzione abbia successo la ACL dovrà essere
6077 valida, e contenere tutti le voci necessarie, con l'eccezione si specifica una
6078 ACL vuota per cancellare la ACL di default associata a \param{path}, valida
6079 solo in caso di directory.\footnote{questo però è una estensione della
6080 implementazione delle ACL di Linux, la bozza di standard POSIX.1e prevedeva
6081 l'uso della apposita funzione \funcd{acl\_delete\_def\_file}, che prende
6082 come unico argomento il \textit{pathname} della directory di cui si vuole
6083 cancellare l'ACL di default, per i dettagli si ricorra alla pagina di
6086 La seconda funzione, \func{acl\_set\_fd}, è del tutto è analoga alla prima, ma
6087 non dovendo avere a che fare con directory (e la conseguente possibilità di
6088 avere una ACL di default) non necessita che si specifichi il tipo di ACL, che
6089 sarà sempre di accesso, e prende come unico argomento, a parte il file
6090 descriptor, la ACL da impostare.
6092 Le funzioni viste finora operano a livello di una intera ACL, eseguendo in una
6093 sola volta tutte le operazioni relative a tutte le voci in essa contenuta. In
6094 generale è possibile modificare un singolo valore all'interno di una singola
6095 voce direttamente con le funzioni previste dallo standard POSIX.1e. Queste
6096 funzioni però sono alquanto macchinose da utilizzare per cui è molto più
6097 semplice operare direttamente sulla rappresentazione testuale. Questo è il
6098 motivo per non tratteremo nei dettagli dette funzioni, fornendone solo una
6099 descrizione sommaria; chi fosse interessato può ricorrere alle pagine di
6102 Se si vuole operare direttamente sui contenuti di un oggetto di tipo
6103 \type{acl\_t} infatti occorre fare riferimento alle singole voci tramite gli
6104 opportuni puntatori di tipo \typed{acl\_entry\_t}, che possono essere ottenuti
6105 dalla funzione \funcm{acl\_get\_entry} (per una voce esistente) o dalla
6106 funzione \funcm{acl\_create\_entry} per una voce da aggiungere. Nel caso della
6107 prima funzione si potrà poi ripetere la lettura per ottenere i puntatori alle
6108 singole voci successive alla prima.
6110 \begin{figure}[!htb]
6111 \footnotesize \centering
6112 \begin{minipage}[c]{\codesamplewidth}
6113 \includecodesample{listati/mygetfacl.c}
6116 \caption{Corpo principale del programma \texttt{mygetfacl.c}.}
6117 \label{fig:proc_mygetfacl}
6120 Una volta ottenuti detti puntatori si potrà operare sui contenuti delle
6121 singole voci: con le funzioni \funcm{acl\_get\_tag\_type},
6122 \funcm{acl\_get\_qualifier}, \funcm{acl\_get\_permset} si potranno leggere
6123 rispettivamente tipo, qualificatore e permessi, mentre con le corrispondenti
6124 \funcm{acl\_set\_tag\_type}, \funcm{acl\_set\_qualifier},
6125 \funcm{acl\_set\_permset} si potranno impostare i valori; in entrambi i casi
6126 vengono utilizzati tipi di dato ad hoc, descritti nelle pagine di manuale. Si
6127 possono poi copiare i valori di una voce da una ACL ad un altra con
6128 \funcm{acl\_copy\_entry} o eliminare una voce da una ACL con
6129 \funcm{acl\_delete\_entry} e verificarne la validità prima di usarla con
6130 \funcm{acl\_valid} o \funcm{acl\_check}.
6132 \itindend{Access~Control~List~(ACL)}
6134 Come esempio di utilizzo di queste funzioni nei sorgenti allegati alla guida
6135 si è distribuito il programma \texttt{mygetfacl.c}, che consente di leggere le
6136 ACL di un file, passato come argomento.
6138 La sezione principale del programma, da cui si è rimossa la sezione sulla
6139 gestione delle opzioni, è riportata in fig.~\ref{fig:proc_mygetfacl}. Il
6140 programma richiede un unico argomento (\texttt{\small 16-20}) che indica il
6141 file di cui si vuole leggere la ACL. Se questo è presente si usa
6142 (\texttt{\small 22}) la funzione \func{get\_acl\_file} per leggerne la ACL, e
6143 si controlla (\texttt{\small 23-26}) se l'operazione ha successo, uscendo con
6144 un messaggio di errore in caso contrario.
6146 Ottenuta la ACL la si converte in formato testuale (\texttt{\small 27}) con la
6147 funzione \func{acl\_to\_text}, controllando di nuovo se l'operazione ha
6148 successo (\texttt{\small 28-31}) ed uscendo in caso contrario. Si provvede
6149 infine a stampare la rappresentazione testuale (\texttt{\small 32}) e dopo
6150 aver liberato (\texttt{\small 33-34}) le risorse allocate automaticamente, si
6151 conclude l'esecuzione.
6154 \subsection{La gestione delle quote disco}
6155 \label{sec:disk_quota}
6157 Quella delle quote disco è una funzionalità introdotta inizialmente da BSD e
6158 presente in Linux fino dai kernel dalla serie 2.0, che consente di porre dei
6159 tetti massimi al consumo delle risorse di un filesystem (spazio disco e
6160 \textit{inode}) da parte di utenti e gruppi.
6162 Dato che la funzionalità ha senso solo per i filesystem su cui si mantengono i
6163 dati degli utenti essa deve essere attivata esplicitamente.\footnote{in genere
6164 la si attiva sul filesystem che contiene le \textit{home} degli utenti, dato
6165 che non avrebbe senso per i file di sistema che in genere appartengono
6166 all'amministratore.} Questo si fa, per tutti i filesystem che le supportano,
6167 tramite due distinte opzioni di montaggio, \texttt{usrquota} e
6168 \texttt{grpquota}, che abilitano le quote rispettivamente per gli utenti e per
6169 i gruppi. Così è possibile usare le limitazioni delle quote o sugli utenti o
6170 sui gruppi o su entrambi.
6172 Dal kernel 4.1, ed inizialmente solo per il filesystem XFS, sono diventate
6173 disponibili un terzo tipo di quote, dette \textit{project quota}, che
6174 consentono di applicare delle quote ad un ``\textsl{progetto}'', identificato
6175 come ramo di albero sotto una directory, per il quale possono essere imposti
6176 dei limiti (di nuovo in termini di spazio disco o \textit{inode}) per i file
6177 che ne fanno parte. Si può così porre dei limiti sul contenuto di un ramo di
6180 Il meccanismo prevede che per ciascun filesystem che supporta le quote disco
6181 (i vari \acr{extN}, \acr{Btrfs}, \acr{XFS}, \acr{JFS}, \acr{ReiserFS}) il
6182 kernel provveda sia a mantenere aggiornati i dati relativi al consumo delle
6183 risorse da parte degli utenti e dei gruppi (e del progetto), che a far
6184 rispettare i limiti imposti dal sistema, con la generazione di un errore di
6185 \errcode{EDQUOT} per tutte le operazioni sui file che porterebbero ad un
6186 superamento degli stessi. Si tenga presente che questi due compiti sono
6187 separati, il primo si attiva al montaggio del filesystem con il supporto per
6188 le quote, il secondo deve essere abilitato esplicitamente.
6190 Per il mantenimento dei dati di consumo delle risorse vengono usati due file
6191 riservati nella directory radice del filesystem su cui si sono attivate le
6192 quote, uno per le quote utente e l'altro per le quote gruppo.\footnote{la cosa
6193 vale per tutti i filesystem tranne \textit{XFS} che mantiene i dati
6194 internamente, compresi quelli per le \textit{project quota}, che pertanto,
6195 essendo questo l'unico filesystem che le supporta, non hanno un file ad esse
6196 riservato.} Con la versione 2 del supporto delle quote, che da anni è
6197 l'unica rimasta in uso, questi file sono \texttt{aquota.user} e
6198 \texttt{aquota.group}, in precedenza erano \texttt{quota.user} e
6199 \texttt{quota.group}.
6201 Dato che questi file vengono aggiornati soltanto se il filesystem è stato
6202 montato attivando il supporto delle quote, se si abilita il supporto in un
6203 secondo tempo e nel frattempo sono state eseguite delle operazioni sul
6204 filesystem quando il supporto era disabilitato, i dati contenuti possono non
6205 corrispondere esattamente allo stato corrente del consumo delle risorse. Per
6206 questo motivo prima di montare in scrittura un filesystem su cui sono
6207 abilitate le quote viene richiesto di utilizzare il comando \cmd{quotacheck}
6208 per verificare e aggiornare i dati.
6210 Le restrizioni sul consumo delle risorse previste dal sistema delle quote
6211 prevedono sempre la presenza di due diversi limiti, il primo viene detto
6212 \textit{soft limit} e può essere superato per brevi periodi di tempo senza che
6213 causare errori per lo sforamento delle quote, il secondo viene detto
6214 \textit{hard limit} e non può mai essere superato.
6216 Il periodo di tempo per cui è possibile eccedere rispetto alle restrizioni
6217 indicate dal \textit{soft limit} è detto ``\textsl{periodo di grazia}''
6218 (\textit{grace period}), che si attiva non appena si supera la quota da esso
6219 indicata. Se si continua a restare al di sopra del \textit{soft limit} una
6220 volta scaduto il \textit{grace period} questo verrà trattato allo stesso modo
6221 dell'\textit{hard limit} e si avrà l'emissione immediata di un errore.
6223 Si tenga presente infine che entrambi i tipi di limiti (\textit{soft limit} e
6224 \textit{hard limit}) possono essere disposti separatamente su entrambe le
6225 risorse di un filesystem, essi cioè possono essere presenti in maniera
6226 indipendente sia sullo spazio disco, con un massimo per il numero di blocchi,
6227 che sui file, con un massimo per il numero di \textit{inode}.
6229 La funzione di sistema che consente di controllare tutti i vari aspetti della
6230 gestione delle quote è \funcd{quotactl}, ed il suo prototipo è:
6235 \fdecl{int quotactl(int cmd, const char *dev, int id, caddr\_t addr)}
6236 \fdesc{Esegue una operazione di controllo sulle quote disco.}
6239 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
6240 caso \var{errno} assumerà uno dei valori:
6242 \item[\errcode{EACCES}] si è richiesto \const{Q\_QUOTAON}, ma il file delle
6243 quote indicato da \param{addr} esiste ma non è un file ordinario o no sta
6245 \item[\errcode{EBUSY}] si è richiesto \const{Q\_QUOTAON}, ma le quote sono
6247 \item[\errcode{EFAULT}] \param{addr} o \param{dev} non sono un puntatori
6249 \item[\errcode{EINVAL}] o \param{cmd} non è un comando valido,
6250 o il dispositivo \param{dev} non esiste.
6251 \item[\errcode{EIO}] errore di lettura/scrittura sul file delle quote.
6252 \item[\errcode{EMFILE}] non si può aprire il file delle quote avendo
6253 superato il limite sul numero di file aperti nel sistema.
6254 \item[\errcode{ENODEV}] \param{dev} non corrisponde ad un \textit{mount
6256 \item[\errcode{ENOPKG}] il kernel è stato compilato senza supporto per le
6258 \item[\errcode{ENOTBLK}] \param{dev} non è un dispositivo a blocchi.
6259 \item[\errcode{EPERM}] non si hanno i permessi per l'operazione richiesta.
6260 \item[\errcode{ESRCH}] è stato richiesto uno fra \const{Q\_GETQUOTA},
6261 \const{Q\_SETQUOTA}, \const{Q\_SETUSE}, \const{Q\_SETQLIM} per un
6262 filesystem senza quote attivate.
6267 % TODO rivedere gli errori
6268 % TODO aggiungere quotactl_fd introdotta con il kernel 5.14, vedi
6269 % https://lwn.net/Articles/859679/
6271 La funzione richiede che il filesystem sul quale si vuole operare, che deve
6272 essere specificato con il nome del relativo file di dispositivo nell'argomento
6273 \param{dev}, sia montato con il supporto delle quote abilitato. Per le
6274 operazioni che lo richiedono inoltre si dovrà indicare con l'argomento
6275 \param{id} l'utente o il gruppo o il progetto (specificati rispettivamente per
6276 \ids{UID}, \ids{GID} o identificativo) su cui si vuole operare,\footnote{nel
6277 caso di \textit{project quota} gli identificativi vengono associati alla
6278 directory base del progetto nel file \file{/etc/projects}, ed impostati con
6279 \cmd{xfs\_quota}, l'argomento è di natura sistemistica e va al di là dello
6280 scopo di questo testo.} o altri dati relativi all'operazione. Alcune
6281 operazioni più complesse usano infine l'argomento \param{addr} per indicare un
6282 indirizzo ad un area di memoria il cui utilizzo dipende dall'operazione
6285 La funzione prevede la possibilità di eseguire una serie operazioni sulle
6286 quote molto diverse fra loro, la scelta viene effettuata tramite il primo
6287 argomento, \param{cmd}, che però oltre all'operazione indica anche a quale
6288 tipo di quota (utente o gruppo) l'operazione deve applicarsi. Per questo il
6289 valore di questo argomento viene costruito con l'ausilio della di una apposita
6296 \fdecl{int \macrod{QCMD}(subcmd,type)}
6297 \fdesc{Imposta il comando \param{subcmd} per il tipo di quote (utente o
6298 gruppo) \param{type}.}
6303 La macro consente di specificare, oltre al tipo di operazione, da indicare con
6304 l'argomento \param{subcmd}, se questa deve applicarsi alle quote utente o alle
6305 quote gruppo o alle quote progetto. Questo viene indicato dall'argomento
6306 \param{type} che deve essere sempre definito ed assegnato ad uno fra i valori
6307 \const{USRQUOTA}, \const{GRPQUOTA} e \const{PRJQUOTA}.
6312 \begin{tabular}{|l|p{10cm}|}
6314 \textbf{Comando} & \textbf{Descrizione} \\
6317 \constd{Q\_QUOTAON} & Attiva l'applicazione delle quote disco per il
6318 filesystem indicato da \param{dev}, si deve passare
6319 in \param{addr} il \textit{pathname} al file che
6320 mantiene le quote, che deve esistere, e \param{id}
6321 deve indicare la versione del formato con uno dei
6322 valori di tab.~\ref{tab:quotactl_id_format};
6323 l'operazione richiede i privilegi di
6325 \constd{Q\_QUOTAOFF}& Disattiva l'applicazione delle quote disco per il
6326 filesystem indicato da \param{dev}, \param{id}
6327 e \param{addr} vengono ignorati; l'operazione
6328 richiede i privilegi di amministratore.\\
6329 \constd{Q\_GETQUOTA}& Legge i limiti ed i valori correnti delle quote nel
6330 filesystem indicato da \param{dev} per l'utente o
6331 il gruppo specificato da \param{id}; si devono avere
6332 i privilegi di amministratore per leggere i dati
6333 relativi ad altri utenti o a gruppi di cui non si fa
6334 parte, il risultato viene restituito in una struttura
6335 \struct{dqblk} all'indirizzo indicato
6337 \constd{Q\_SETQUOTA}& Imposta i limiti per le quote nel filesystem
6338 indicato da \param{dev} per l'utente o il gruppo
6339 specificato da \param{id} secondo i valori ottenuti
6340 dalla struttura \struct{dqblk} puntata
6341 da \param{addr}; l'operazione richiede i privilegi
6342 di amministratore.\\
6343 \constd{Q\_GETINFO} & Legge le informazioni (in sostanza i \textit{grace
6344 time}) delle quote del filesystem indicato
6345 da \param{dev} sulla struttura \struct{dqinfo}
6346 puntata da \param{addr}, \param{id} viene ignorato.\\
6347 \constd{Q\_SETINFO} & Imposta le informazioni delle quote del filesystem
6348 indicato da \param{dev} come ottenuti dalla
6349 struttura \struct{dqinfo} puntata
6350 da \param{addr}, \param{id} viene ignorato;
6351 l'operazione richiede i privilegi di amministratore.\\
6352 \constd{Q\_GETFMT} & Richiede il valore identificativo (quello di
6353 tab.~\ref{tab:quotactl_id_format}) per il formato
6354 delle quote attualmente in uso sul filesystem
6355 indicato da \param{dev}, che sarà memorizzato
6356 sul buffer di 4 byte puntato da \param{addr}.\\
6357 \constd{Q\_SYNC} & Aggiorna la copia su disco dei dati delle quote del
6358 filesystem indicato da \param{dev}; in questo
6359 caso \param{dev} può anche essere \val{NULL} nel
6360 qual caso verranno aggiornati i dati per tutti i
6361 filesystem con quote attive, \param{id}
6362 e \param{addr} vengono comunque ignorati.\\
6363 \constd{Q\_GETSTATS}& Ottiene statistiche ed altre informazioni generali
6364 relative al sistema delle quote per il filesystem
6365 indicato da \param{dev}, richiede che si
6366 passi come argomento \param{addr} l'indirizzo di una
6367 struttura \struct{dqstats}, mentre i valori
6368 di \param{id} e \param{dev} vengono ignorati;
6369 l'operazione è obsoleta e non supportata nei kernel
6370 più recenti, che espongono la stessa informazione
6371 nei file sotto \procfile{/proc/self/fs/quota/}.\\
6375 \caption{Possibili valori per l'argomento \param{subcmd} di
6377 \label{tab:quotactl_commands}
6380 I possibili valori per l'argomento \param{subcmd} di \macro{QCMD} sono
6381 riportati in tab.~\ref{tab:quotactl_commands}, che illustra brevemente il
6382 significato delle operazioni associate a ciascuno di essi. In generale le
6383 operazioni di attivazione, disattivazione e di modifica dei limiti delle quote
6384 sono riservate e richiedono i privilegi di amministratore.\footnote{per essere
6385 precisi tutte le operazioni indicate come privilegiate in
6386 tab.~\ref{tab:quotactl_commands} richiedono la capacità
6387 \const{CAP\_SYS\_ADMIN}.} Inoltre gli utenti possono soltanto richiedere i
6388 dati relativi alle proprie quote, solo l'amministratore può ottenere i dati di
6392 Alcune delle operazioni di tab.~\ref{tab:quotactl_commands} sono alquanto
6393 complesse e richiedono un approfondimento maggiore. Le due più rilevanti sono
6394 probabilmente \const{Q\_GETQUOTA} e \const{Q\_SETQUOTA}, che consentono la
6395 gestione dei limiti delle quote. Entrambe fanno riferimento ad una specifica
6396 struttura \struct{dqblk}, la cui definizione è riportata in
6397 fig.~\ref{fig:dqblk_struct},\footnote{la definizione mostrata è quella usata
6398 fino dal kernel 2.4.22, non prenderemo in considerazione le versioni
6399 obsolete.} nella quale vengono inseriti i dati relativi alle quote di un
6400 singolo utente o gruppo.
6402 \begin{figure}[!htb]
6403 \footnotesize \centering
6404 \begin{minipage}[c]{0.95\textwidth}
6405 \includestruct{listati/dqblk.h}
6408 \caption{La struttura \structd{dqblk} per i dati delle quote disco.}
6409 \label{fig:dqblk_struct}
6412 La struttura \struct{dqblk} viene usata sia con \const{Q\_GETQUOTA} per
6413 ottenere i valori correnti dei limiti e dell'occupazione delle risorse, che
6414 con \const{Q\_SETQUOTA} per effettuare modifiche ai limiti. Come si può notare
6415 ci sono alcuni campi (in sostanza \val{dqb\_curspace}, \val{dqb\_curinodes},
6416 \val{dqb\_btime}, \val{dqb\_itime}) che hanno senso solo in lettura, in quanto
6417 riportano uno stato non modificabile da \func{quotactl} come l'uso corrente di
6418 spazio disco ed \textit{inode}, o il tempo che resta nel caso si sia superato
6419 un \textit{soft limit}.
6421 Inoltre in caso di modifica di un limite si può voler operare solo su una
6422 delle risorse (blocchi o \textit{inode}),\footnote{non è possibile modificare
6423 soltanto uno dei limiti (\textit{hard} o \textit{soft}) occorre sempre
6424 rispecificarli entrambi.} per questo la struttura prevede un campo apposito,
6425 \val{dqb\_valid}, il cui scopo è quello di indicare quali sono gli altri campi
6426 che devono essere considerati validi. Questo campo è una maschera binaria che
6427 deve essere espressa nei termini di OR aritmetico delle apposite costanti di
6428 tab.~\ref{tab:quotactl_qif_const}, dove si è riportato il significato di
6429 ciascuna di esse ed i campi a cui fanno riferimento.
6434 \begin{tabular}{|l|p{10cm}|}
6436 \textbf{Costante} & \textbf{Descrizione} \\
6439 \constd{QIF\_BLIMITS}& Limiti sui blocchi di spazio disco
6440 (\val{dqb\_bhardlimit} e \val{dqb\_bsoftlimit}).\\
6441 \constd{QIF\_SPACE} & Uso corrente dello spazio disco
6442 (\val{dqb\_curspace}).\\
6443 \constd{QIF\_ILIMITS}& Limiti sugli \textit{inode}
6444 (\val{dqb\_ihardlimit} e \val{dqb\_isoftlimit}).\\
6445 \constd{QIF\_INODES} & Uso corrente degli \textit{inode}
6446 (\val{dqb\_curinodes}).\\
6447 \constd{QIF\_BTIME} & Tempo di sforamento del \textit{soft limit} sul
6448 numero di blocchi (\val{dqb\_btime}).\\
6449 \constd{QIF\_ITIME} & Tempo di sforamento del \textit{soft limit} sul
6450 numero di \textit{inode} (\val{dqb\_itime}).\\
6451 \constd{QIF\_LIMITS} & L'insieme di \const{QIF\_BLIMITS} e
6452 \const{QIF\_ILIMITS}.\\
6453 \constd{QIF\_USAGE} & L'insieme di \const{QIF\_SPACE} e
6454 \const{QIF\_INODES}.\\
6455 \constd{QIF\_TIMES} & L'insieme di \const{QIF\_BTIME} e
6456 \const{QIF\_ITIME}.\\
6457 \constd{QIF\_ALL} & Tutti i precedenti.\\
6460 \caption{Costanti per il campo \val{dqb\_valid} di \struct{dqblk}.}
6461 \label{tab:quotactl_qif_const}
6464 In lettura con \const{Q\_SETQUOTA} eventuali valori presenti in \struct{dqblk}
6465 vengono comunque ignorati, al momento la funzione sovrascrive tutti i campi
6466 che restituisce e li marca come validi in \val{dqb\_valid}. Si possono invece
6467 usare \const{QIF\_BLIMITS} o \const{QIF\_ILIMITS} per richiedere di impostare
6468 solo la rispettiva tipologia di limiti con \const{Q\_SETQUOTA}. Si tenga
6469 presente che il sistema delle quote richiede che l'occupazione di spazio disco
6470 sia indicata in termini di blocchi e non di byte, dato che la dimensione dei
6471 blocchi dipende da come si è creato il filesystem potrà essere necessario
6472 effettuare qualche conversione per avere un valore in byte.\footnote{in genere
6473 viene usato un default di 1024 byte per blocco, ma quando si hanno file di
6474 dimensioni medie maggiori può convenire usare valori più alti per ottenere
6475 prestazioni migliori in conseguenza di un minore frazionamento dei dati e di
6478 Come accennato la realizzazione delle quote disco ha visto diverse revisioni,
6479 con modifiche sia del formato delle stesse che dei nomi dei file
6480 utilizzati. Per questo alcune operazioni di gestione (in particolare
6481 \const{Q\_QUOTAON} e \const{Q\_GETFMT}) e possono fare riferimento a queste
6482 versioni, che vengono identificate tramite le costanti di
6483 tab.~\ref{tab:quotactl_id_format}.
6488 \begin{tabular}{|l|p{10cm}|}
6490 \textbf{Identificatore} & \textbf{Descrizione} \\
6493 \constd{QFMT\_VFS\_OLD}& Il vecchio (ed obsoleto) formato delle quote.\\
6494 \constd{QFMT\_VFS\_V0} & La versione 0 usata dal VFS di Linux, supporta
6495 \ids{UID} e \ids{GID} a 32 bit e limiti fino a
6496 $2^{42}$ byte e $2^{32}$ file.\\
6497 \constd{QFMT\_VFS\_V1} & La versione 1 usata dal VFS di Linux, supporta
6498 \ids{UID} e \ids{GID} a 32 bit e limiti fino a
6499 $2^{64}$ byte e $2^{64}$ file.\\
6502 \caption{Valori di identificazione del formato delle quote.}
6503 \label{tab:quotactl_id_format}
6506 Altre due operazioni che necessitano di ulteriori spiegazioni sono
6507 \const{Q\_GETINFO} e \const{Q\_SETINFO}, che consentono di ottenere i dati
6508 relativi alle impostazioni delle altre proprietà delle quote, che al momento
6509 sono solo la durata del \textit{grace time} per i due tipi di limiti. Queste
6510 sono due proprietà generali identiche per tutti gli utenti (e i gruppi), per
6511 cui viene usata una operazione distinta dalle precedenti. Anche in questo caso
6512 le due operazioni richiedono l'uso di una apposita struttura \struct{dqinfo},
6513 la cui definizione è riportata in fig.~\ref{fig:dqinfo_struct}.
6515 \begin{figure}[!htb]
6516 \footnotesize \centering
6517 \begin{minipage}[c]{0.8\textwidth}
6518 \includestruct{listati/dqinfo.h}
6521 \caption{La struttura \structd{dqinfo} per i dati delle quote disco.}
6522 \label{fig:dqinfo_struct}
6525 Come per \struct{dqblk} anche in questo caso viene usato un campo della
6526 struttura, \val{dqi\_valid} come maschera binaria per dichiarare quale degli
6527 altri campi sono validi; le costanti usate per comporre questo valore sono
6528 riportate in tab.~\ref{tab:quotactl_iif_const} dove si è riportato il
6529 significato di ciascuna di esse ed i campi a cui fanno riferimento.
6534 \begin{tabular}{|l|l|}
6536 \textbf{Costante} & \textbf{Descrizione} \\
6539 \constd{IIF\_BGRACE}& Il \textit{grace period} per i blocchi
6540 (\val{dqi\_bgrace}).\\
6541 \constd{IIF\_IGRACE}& Il \textit{grace period} per gli \textit{inode}
6542 (\val{dqi\_igrace}).\\
6543 \constd{IIF\_FLAGS} & I flag delle quote (\val{dqi\_flags}) (inusato ?).\\
6544 \constd{IIF\_ALL} & Tutti i precedenti.\\
6547 \caption{Costanti per il campo \val{dqi\_valid} di \struct{dqinfo}.}
6548 \label{tab:quotactl_iif_const}
6551 Come in precedenza con \const{Q\_GETINFO} tutti i valori vengono letti
6552 sovrascrivendo il contenuto di \struct{dqinfo} e marcati come validi in
6553 \val{dqi\_valid}. In scrittura con \const{Q\_SETINFO} si può scegliere quali
6554 impostare, si tenga presente che i tempi dei campi \val{dqi\_bgrace} e
6555 \val{dqi\_igrace} devono essere specificati in secondi.
6557 Come esempi dell'uso di \func{quotactl} utilizzeremo estratti del codice di un
6558 modulo Python usato per fornire una interfaccia diretta a \func{quotactl}
6559 senza dover passare dalla scansione dei risultati di un comando. Il modulo si
6560 trova fra i pacchetti Debian messi a disposizione da Truelite Srl,
6561 all'indirizzo \url{http://labs.truelite.it/projects/packages}.\footnote{in
6562 particolare il codice C del modulo è nel file \texttt{quotamodule.c}
6563 visionabile a partire dall'indirizzo indicato nella sezione
6564 \textit{Repository}.}
6566 \begin{figure}[!htbp]
6567 \footnotesize \centering
6568 \begin{minipage}[c]{\codesamplewidth}
6569 \includecodesample{listati/get_quota.c}
6571 \caption{Esempio di codice per ottenere i dati delle quote.}
6572 \label{fig:get_quota}
6575 Il primo esempio, riportato in fig.~\ref{fig:get_quota}, riporta il codice
6576 della funzione che consente di leggere le quote. La funzione fa uso
6577 dell'interfaccia dal C verso Python, che definisce i vari simboli \texttt{Py*}
6578 (tipi di dato e funzioni). Non staremo ad approfondire i dettagli di questa
6579 interfaccia, per la quale esistono numerose trattazioni dettagliate, ci
6580 interessa solo esaminare l'uso di \func{quotactl}.
6582 In questo caso la funzione prende come argomenti (\texttt{\small 1}) l'intero
6583 \texttt{who} che indica se si vuole operare sulle quote utente o gruppo,
6584 l'identificatore \texttt{id} dell'utente o del gruppo scelto, ed il nome del
6585 file di dispositivo del filesystem su cui si sono attivate le
6586 quote.\footnote{questi vengono passati come argomenti dalle funzioni mappate
6587 come interfaccia pubblica del modulo (una per gruppi ed una per gli utenti)
6588 che si incaricano di decodificare i dati passati da una chiamata nel codice
6589 Python.} Questi argomenti vengono passati direttamente alla chiamata a
6590 \func{quotactl} (\texttt{\small 5}), a parte \texttt{who} che viene abbinato
6591 con \macro{QCMD} al comando \const{Q\_GETQUOTA} per ottenere i dati.
6593 La funzione viene eseguita all'interno di un condizionale (\texttt{\small
6594 5-16}) che in caso di successo provvede a costruire (\texttt{\small 6-12})
6595 opportunamente una risposta restituendo tramite la opportuna funzione di
6596 interfaccia un oggetto Python contenente i dati della struttura \struct{dqblk}
6597 relativi a uso corrente e limiti sia per i blocchi che per gli
6598 \textit{inode}. In caso di errore (\texttt{\small 13-15}) si usa un'altra
6599 funzione dell'interfaccia per passare il valore di \var{errno} come eccezione.
6601 \begin{figure}[!htbp]
6602 \footnotesize \centering
6603 \begin{minipage}[c]{\codesamplewidth}
6604 \includecodesample{listati/set_block_quota.c}
6606 \caption{Esempio di codice per impostare i limiti sullo spazio disco.}
6607 \label{fig:set_block_quota}
6610 Per impostare i limiti sullo spazio disco si potrà usare una seconda funzione,
6611 riportata in fig.~\ref{fig:set_block_quota}, che prende gli stessi argomenti
6612 della precedente, con lo stesso significato, a cui si aggiungono i valori per
6613 il \textit{soft limit} e l'\textit{hard limit}. In questo caso occorrerà,
6614 prima di chiamare \func{quotactl}, inizializzare opportunamente
6615 (\texttt{\small 5-7}) i campi della struttura \struct{dqblk} che si vogliono
6616 utilizzare (quelli relativi ai limiti sui blocchi) e specificare gli stessi
6617 con \const{QIF\_BLIMITS} in \var{dq.dqb\_valid}.
6619 Fatto questo la chiamata a \func{quotactl}, stavolta con il comando
6620 \const{Q\_SETQUOTA}, viene eseguita come in precedenza all'interno di un
6621 condizionale (\texttt{\small 9-14}). In questo caso non essendovi da
6622 restituire nessun dato in caso di successo si usa (\texttt{\small 10}) una
6623 apposita funzione di uscita, mentre si restituisce come prima una eccezione
6624 con il valore di \var{errno} in caso di errore (\texttt{\small 12-13}).
6627 \subsection{La gestione dei {chroot}}
6628 \label{sec:file_chroot}
6630 % TODO: valutare se introdurre una nuova sezione sulle funzionalità di
6631 % sicurezza avanzate, con dentro chroot SELinux e AppArmor, Tomoyo, Smack,
6634 % TODO: spostare chroot e le funzioni affini relative ai container da qualche
6635 % parte diversa se è il caso.
6637 % TODO Inheriting capabilities vedi http://lwn.net/Articles/632520/ eambient
6638 % capabilities introdotte con il kernel 4.3, vedi
6639 % http://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/commit/?id=58319057b7847667f0c9585b9de0e8932b0fdb08
6641 Benché non abbia niente a che fare con permessi, utenti e gruppi, la funzione
6642 \func{chroot} viene usata spesso per restringere le capacità di accesso di un
6643 programma ad una sezione limitata del filesystem, per cui ne parleremo in
6646 Come accennato in sez.~\ref{sec:proc_fork} ogni processo oltre ad una
6647 directory di lavoro, ha anche una directory \textsl{radice}\footnote{entrambe
6648 sono contenute in due campi (rispettivamente \var{pwd} e \var{root}) di
6649 \kstruct{fs\_struct}; vedi fig.~\ref{fig:proc_task_struct}.} che, pur
6650 essendo di norma corrispondente alla radice dell'albero dei file dell'intero
6651 sistema, ha per il processo il significato specifico di directory rispetto
6652 alla quale vengono risolti i \textit{pathname} assoluti.\footnote{cioè quando
6653 un processo chiede la risoluzione di un \textit{pathname}, il kernel usa
6654 sempre questa directory come punto di partenza.} Il fatto che questo valore
6655 sia specificato per ogni processo apre allora la possibilità di modificare le
6656 modalità di risoluzione dei \textit{pathname} assoluti da parte di un processo
6657 cambiando questa directory, così come si fa coi \textit{pathname} relativi
6658 cambiando la directory di lavoro.
6660 Normalmente la directory radice di un processo coincide con la radice generica
6661 dell'albero dei file, che è la directory che viene montata direttamente dal
6662 kernel all'avvio secondo quanto illustrato in sez.~\ref{sec:file_pathname}.
6663 Questo avviene perché, come visto in sez.~\ref{cha:process_handling} la
6664 directory radice di un processo viene ereditata dal padre attraverso una
6665 \func{fork} e mantenuta attraverso una \func{exec}, e siccome tutti i processi
6666 derivano da \cmd{init}, che ha come radice quella montata dal kernel, questa
6669 In certe situazioni però è utile poter impedire che un processo possa accedere
6670 a tutto l'albero dei file iniziale; per far questo si può cambiare la sua
6671 directory radice con la funzione di sistema \funcd{chroot}, il cui prototipo
6676 \fdecl{int chroot(const char *path)}
6677 \fdesc{Cambia la directory radice del processo.}
6680 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
6681 caso \var{errno} assumerà uno dei valori:
6683 \item[\errcode{EPERM}] non si hanno i privilegi di amministratore.
6685 ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
6686 \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EACCES}, \errval{ELOOP};
6687 \errval{EROFS} e \errval{EIO} nel loro significato generico.}
6690 La funzione imposta la directory radice del processo a quella specificata da
6691 \param{path} (che ovviamente deve esistere) ed ogni \textit{pathname} assoluto
6692 usato dalle funzioni chiamate nel processo sarà risolto a partire da essa,
6693 rendendo impossibile accedere alla parte di albero sovrastante. Si ha così
6694 quella che viene chiamata una \textit{chroot jail}, in quanto il processo non
6695 può più accedere a file al di fuori della sezione di albero in cui è stato
6696 \textsl{imprigionato}.
6698 Solo un processo con i privilegi di amministratore può usare questa
6699 funzione,\footnote{più precisamente se possiede la capacità
6700 \const{CAP\_SYS\_CHROOT}.} e la nuova radice, per quanto detto in
6701 sez.~\ref{sec:proc_fork}, sarà ereditata da tutti i suoi processi figli. Si
6702 tenga presente però che la funzione non cambia la directory di lavoro del
6703 processo, che potrebbe restare fuori dalla \textit{chroot jail}.
6705 Questo è il motivo per cui la funzione è efficace nel restringere un processo
6706 ad un ramo di albero solo se dopo averla eseguita si cedono i privilegi di
6707 amministratore. Infatti se per un qualunque motivo il processo resta con la
6708 sua directory di lavoro al di fuori dalla \textit{chroot jail}, potrà accedere
6709 a tutto il resto del filesystem usando dei \textit{pathname} relativi, dato
6710 che in tal caso è possibile, grazie all'uso di ``\texttt{..}'', risalire
6711 all'indietro fino alla radice effettiva dell'albero dei file.
6713 Potrebbe sembrare che per risolvere il problema sia sufficiente ricordarsi di
6714 eseguire preventivamente anche una \func{chdir} sulla directory su cui si
6715 andrà ad eseguire \func{chroot}, così da assicurarsi che le directory di
6716 lavoro sia all'interno della \textit{chroot jail}. Ma se ad un processo
6717 restano i privilegi di amministratore esso potrà comunque portare la sua
6718 directory di lavoro fuori dalla \textit{chroot jail} in cui si trova. Basterà
6719 infatti eseguire di nuovo \func{chroot} su una qualunque directory contenuta
6720 nell'attuale directory di lavoro perché quest'ultima risulti al di fuori della
6721 nuova \textit{chroot jail}. Per questo motivo l'uso di questa funzione non ha
6722 molto senso quando un processo di cui si vuole limitare l'accesso necessita
6723 comunque dei privilegi di amministratore per le sue normali operazioni.
6725 Nonostante queste limitazioni la funzione risulta utile qualora la si possa
6726 applicare correttamente cedendo completamente i privilegi di amministratore
6727 una volta eseguita. Ed esempio caso tipico di uso di \func{chroot} è quello
6728 di un server FTP anonimo in si vuole che il server veda solo i file che deve
6729 trasferire. In tal caso si esegue una \func{chroot} sulla directory che
6730 contiene i file, che il server dovrà in grado di leggere come utente
6731 ordinario, e poi si cedono tutti i privilegi di amministratore. Si tenga
6732 presente però che in casi come questo occorrerà fornire all'interno della
6733 \textit{chroot jail} un accesso anche a tutti i file (in genere programmi e
6734 librerie) di cui il server potrebbe avere bisogno.
6737 % LocalWords: sez like filesystem unlink MacOS Windows VMS inode kernel unistd
6738 % LocalWords: int const char oldpath newpath errno EXDEV EPERM st Smack SysV
6739 % LocalWords: EEXIST EMLINK EACCES ENAMETOOLONG ENOTDIR EFAULT ENOMEM EROFS ls
6740 % LocalWords: ELOOP ENOSPC EIO pathname nlink stat vfat fsck EISDIR ENOENT cap
6741 % LocalWords: POSIX socket fifo sticky root system call count crash init linux
6742 % LocalWords: descriptor remove rename rmdir stdio glibc libc NFS DT obj dup
6743 % LocalWords: ENOTEMPTY EBUSY mount point EINVAL soft symbolic tab symlink fig
6744 % LocalWords: dangling access chdir chmod chown creat exec lchown lstat mkdir
6745 % LocalWords: mkfifo mknod opendir pathconf readlink truncate path buff size
6746 % LocalWords: grub bootloader grep MAXSYMLINKS cat VFS sys dirname fcntl tv Py
6747 % LocalWords: dev umask IFREG IFBLK IFCHR IFIFO SVr sgid BSD SVID NULL from to
6748 % LocalWords: stream dirent EMFILE ENFILE dirfd SOURCE fchdir readdir struct
6749 % LocalWords: EBADF namlen HAVE thread entry result value argument fileno ext
6750 % LocalWords: name TYPE OFF RECLEN UNKNOWN REG SOCK CHR BLK type IFTODT DTTOIF
6751 % LocalWords: DTYPE off reclen seekdir telldir void rewinddir closedir select
6752 % LocalWords: namelist compar malloc qsort alphasort versionsort strcoll myls
6753 % LocalWords: strcmp direntry while current working home shell pwd get stddef
6754 % LocalWords: getcwd ERANGE getwd change fd race condition tmpnam getfacl mark
6755 % LocalWords: string tmpdir TMP tempnam pfx TMPNAME suid tmp EXCL tmpfile pid
6756 % LocalWords: EINTR mktemp mkstemp stlib template filename XXXXXX OpenBSD buf
6757 % LocalWords: mkdtemp fstat filedes nell'header padding ISREG ISDIR ISCHR IFMT
6758 % LocalWords: ISBLK ISFIFO ISLNK ISSOCK IFSOCK IFLNK IFDIR ISUID UID ISGID GID
6759 % LocalWords: ISVTX IRUSR IWUSR IXUSR IRGRP IWGRP IXGRP IROTH IWOTH IXOTH OLD
6760 % LocalWords: blocks blksize holes lseek TRUNC ftruncate ETXTBSY length QCMD
6761 % LocalWords: hole atime read utime mtime write ctime modification leafnode cp
6762 % LocalWords: make fchmod fchown utimbuf times actime modtime Mac owner uid fs
6763 % LocalWords: gid Control List patch mandatory control execute group other all
6764 % LocalWords: effective passwd IGID locking swap saved text IRWXU IRWXG subcmd
6765 % LocalWords: IRWXO capability FSETID mask capabilities chroot jail QUOTAOFF
6766 % LocalWords: FTP filter Attributes Solaris FreeBSD libacl hash at dqblk SYNC
6767 % LocalWords: XFS SELinux namespace attribute security trusted Draft Modules
6768 % LocalWords: attributes mime ADMIN FOWNER libattr lattr getxattr lgetxattr of
6769 % LocalWords: fgetxattr attr ssize ENOATTR ENOTSUP NUL setxattr lsetxattr list
6770 % LocalWords: fsetxattr flags XATTR REPLACE listxattr llistxattr flistxattr by
6771 % LocalWords: removexattr lremovexattr fremovexattr attributename acl GETINFO
6772 % LocalWords: OBJ setfacl len any prefix separator options NUMERIC IDS SMART
6773 % LocalWords: INDENT major number IDE Documentation makedev proc copy LNK long
6774 % LocalWords: euidaccess eaccess delete def tag qualifier permset calendar NOW
6775 % LocalWords: mutt noatime relatime strictatime atim nsec mtim ctim atimensec
6776 % LocalWords: mtimensec utimes timeval futimes lutimes ENOSYS futimens OMIT PR
6777 % LocalWords: utimensat timespec sec futimesat LIDS DAC OVERRIDE SEARCH chattr
6778 % LocalWords: Discrectionary KILL SETGID domain SETUID setuid setreuid SETPCAP
6779 % LocalWords: setresuid setfsuid IMMUTABLE immutable append only BIND SERVICE
6780 % LocalWords: BROADCAST broadcast multicast multicasting RAW PACKET IPC LOCK
6781 % LocalWords: memory mlock mlockall shmctl mmap MODULE RAWIO ioperm iopl PACCT
6782 % LocalWords: ptrace accounting NICE RESOURCE TTY CONFIG hangup vhangup
6783 % LocalWords: LEASE lease SETFCAP AUDIT permitted inherited inheritable AND nn
6784 % LocalWords: bounding execve fork capget capset header hdrp datap ESRCH undef
6785 % LocalWords: version libcap lcap clear ncap caps pag capgetp CapInh CapPrm RT
6786 % LocalWords: fffffeff CapEff getcap scheduling lookup dqinfo SETINFO GETFMT
6787 % LocalWords: NEWNS unshare nice NUMA ioctl journaling close XOPEN fdopendir
6788 % LocalWords: Btrfs mkostemp extN ReiserFS JFS Posix usrquota grpquota EDQUOT
6789 % LocalWords: aquota quotacheck limit grace period quotactl cmd caddr addr dqb
6790 % LocalWords: QUOTAON ENODEV ENOPKG ENOTBLK GETQUOTA SETQUOTA SETUSE SETQLIM
6791 % LocalWords: forced allowed sendmail SYSLOG WAKE ALARM CLOCK BOOTTIME dqstats
6792 % LocalWords: REALTIME securebits GETSTATS QFMT curspace curinodes btime itime
6793 % LocalWords: QIF BLIMITS bhardlimit bsoftlimit ILIMITS ihardlimit isoftlimit
6794 % LocalWords: INODES LIMITS USAGE valid dqi IIF BGRACE bgrace IGRACE igrace is
6795 % LocalWords: Python Truelite Srl quotamodule Repository who KEEP
6796 % LocalWords: SECURE KEEPCAPS prctl FIXUP NOROOT LOCKED dell'IPC IOPRIO
6797 % LocalWords: CAPBSET CLASS IDLE dcookie overflow DIFFERS Virtual everything
6798 % LocalWords: dentry register resolution cache dcache operation llseek poll ln
6799 % LocalWords: multiplexing fsync fasync seek block superblock gapil tex img du
6800 % LocalWords: second linked journaled source filesystemtype unsigned device
6801 % LocalWords: mountflags NODEV ENXIO dummy devfs magic MGC RDONLY NOSUID MOVE
6802 % LocalWords: NOEXEC SYNCHRONOUS REMOUNT MANDLOCK NODIRATIME umount MNT statfs
6803 % LocalWords: fstatfs fstab mntent ino bound orig new setpcap metadati sysfs
6804 % LocalWords: bind DIRSYNC lsattr Hierarchy FHS SHARED UNBINDABLE shared REC
6805 % LocalWords: subtree SILENT log unbindable BUSY EAGAIN EXPIRE DETACH NOFOLLOW
6806 % LocalWords: lazy encfs sshfs setfsent getfsent getfsfile getfsspec endfsent
6807 % LocalWords: setmntent getmntent addmntent endmntent hasmntopt such offsetof
6808 % LocalWords: member scan attack EOVERFLOW BITS blkcnt rdev FDCWD functions
6809 % LocalWords: faccessat grpid lacl AppArmor capsetp mygetfacl table Tb MSK
6810 % LocalWords: LAZYTIME submount peer protected hardlink symlinks silly RDWR
6811 % LocalWords: renames unreachable CLOEXEC mkstemps mkostemps suffixlen Aug
6812 % LocalWords: prefissoXXXXXXsuffisso fstatat statx drwxrwxrwt xattr
6813 % LocalWords: Disalloca project
6815 %%% Local Variables:
6817 %%% TeX-master: "gapil"