filedir.tex

   1 %% filedir.tex
   2 %%
   3 %% Copyright (C) 2000-2018 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11
  12 \chapter{La gestione di file e directory}
  13 \label{cha:files_and_dirs}
  14
  15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
  16 file e directory, iniziando da un approfondimento dell'architettura del
  17 sistema illustrata a grandi linee in sez.~\ref{sec:file_arch_overview} ed
  18 illustrando le principali caratteristiche di un filesystem e le interfacce
  19 che consentono di controllarne il montaggio e lo smontaggio.
  20
  21 Esamineremo poi le funzioni di libreria che si usano per copiare, spostare e
  22 cambiare i nomi di file e directory e l'interfaccia che permette la
  23 manipolazione dei loro attributi. Tratteremo inoltre la struttura di base del
  24 sistema delle protezioni e del controllo dell'accesso ai file e le successive
  25 estensioni (\textit{Extended Attributes}, ACL, quote disco). Tutto quello che
  26 riguarda invece la gestione dell'I/O sui file è lasciato al capitolo
  27 successivo.
  28
  29
  30
  31 \section{L'architettura della gestione dei file}
  32 \label{sec:file_arch_func}
  33
  34 In questa sezione tratteremo con maggiori dettagli rispetto a quanto visto in
  35 sez.~\ref{sec:file_arch_overview} il \textit{Virtual File System} di Linux e
  36 come il kernel può gestire diversi tipi di filesystem, descrivendo prima le
  37 caratteristiche generali di un filesystem di un sistema unix-like, per poi
  38 fare una panoramica sul filesystem tradizionalmente più usato con Linux,
  39 l'\acr{ext2} ed i suoi successori.
  40
  41
  42 \subsection{Il funzionamento del \textit{Virtual File System} di Linux}
  43 \label{sec:file_vfs_work}
  44
  45 % NOTE articolo interessante:
  46 % http://www.ibm.com/developerworks/linux/library/l-virtual-filesystem-switch/index.html?ca=dgr-lnxw97Linux-VFSdth-LXdW&S_TACT=105AGX59&S_CMP=GRlnxw97
  47
  48 \itindbeg{Virtual~File~System~(VFS)}
  49
  50 Come illustrato brevemente in sez.~\ref{sec:file_arch_overview} in Linux il
  51 concetto di \textit{everything is a file} è stato implementato attraverso il
  52 \textit{Virtual File System}, la cui struttura generale è illustrata in
  53 fig.~\ref{fig:file_VFS_scheme}.  Il VFS definisce un insieme di funzioni che
  54 tutti i filesystem devono implementare per l'accesso ai file che contengono e
  55 l'interfaccia che consente di eseguire l'I/O sui file, che questi siano di
  56 dati o dispositivi.
  57
  58 \itindbeg{inode}
  59
  60 L'interfaccia fornita dal VFS comprende in sostanza tutte le funzioni che
  61 riguardano i file, le operazioni implementate dal VFS sono realizzate con una
  62 astrazione che prevede quattro tipi di oggetti strettamente correlati: i
  63 filesystem, le \textit{dentry}, gli \textit{inode} ed i file. A questi oggetti
  64 corrispondono una serie di apposite strutture definite dal kernel che
  65 contengono come campi le funzioni di gestione e realizzano l'infrastruttura
  66 del VFS. L'interfaccia è molto complessa, ne faremo pertanto una trattazione
  67 estremamente semplificata che consenta di comprenderne i principi
  68 di funzionamento.
  69
  70 Il VFS usa una tabella mantenuta dal kernel che contiene il nome di ciascun
  71 filesystem supportato, quando si vuole inserire il supporto di un nuovo
  72 filesystem tutto quello che occorre è chiamare la funzione
  73 \code{register\_filesystem} passando come argomento la struttura
  74 \kstruct{file\_system\_type} (la cui definizione è riportata in
  75 fig.~\ref{fig:kstruct_file_system_type}) relativa a quel filesystem. Questa
  76 verrà inserita nella tabella, ed il nuovo filesystem comparirà in
  77 \procfile{/proc/filesystems}.
  78
  79 \begin{figure}[!htb]
  80   \footnotesize \centering
  81   \begin{minipage}[c]{0.80\textwidth}
  82     \includestruct{listati/file_system_type.h}
  83   \end{minipage}
  84   \normalsize
  85   \caption{Estratto della struttura \kstructd{file\_system\_type} usata dal
  86     VFS (da \texttt{include/linux/fs.h}).}
  87   \label{fig:kstruct_file_system_type}
  88 \end{figure}
  89
  90 La struttura \kstruct{file\_system\_type}, oltre ad una serie di dati interni,
  91 come il nome del tipo di filesystem nel campo \var{name},\footnote{quello che
  92   viene riportato in \procfile{/proc/filesystems} e che viene usato come
  93   valore del parametro dell'opzione \texttt{-t} del comando \texttt{mount} che
  94   indica il tipo di filesystem.}  contiene i riferimenti alle funzioni di base
  95 che consentono l'utilizzo di quel filesystem. In particolare la funzione
  96 \code{mount} del quarto campo è quella che verrà invocata tutte le volte che
  97 si dovrà effettuare il montaggio di un filesystem di quel tipo. Per ogni nuovo
  98 filesystem si dovrà allocare una di queste strutture ed inizializzare i
  99 relativi campi con i dati specifici di quel filesystem, ed in particolare si
 100 dovrà creare anche la relativa versione della funzione \code{mount}.
 101
 102 \itindbeg{pathname}
 103 \itindbeg{pathname~resolution}
 104
 105 Come illustrato in fig.~\ref{fig:kstruct_file_system_type} questa funzione
 106 restituisce una \textit{dentry}, abbreviazione che sta per \textit{directory
 107   entry}. Le \textit{dentry} sono gli oggetti che il kernel usa per eseguire
 108 la \textit{pathname resolution}, ciascuna di esse corrisponde ad un
 109 \textit{pathname} e contiene il riferimento ad un \textit{inode}, che come
 110 vedremo a breve è l'oggetto usato dal kernel per identificare un
 111 file.\footnote{in questo caso si parla di file come di un qualunque oggetto
 112   generico che sta sul filesystem e non dell'oggetto file del VFS cui
 113   accennavamo prima.} La \textit{dentry} ottenuta dalla chiamata alla funzione
 114 \code{mount} sarà inserita in corrispondenza al \textit{pathname} della
 115 directory in cui il filesystem è stato montato.
 116
 117 % NOTA: struct dentry è dichiarata in include/linux/dcache.h
 118
 119 Le \textit{dentry} sono oggetti del VFS che vivono esclusivamente in memoria,
 120 nella cosiddetta \textit{directory entry cache} (spesso chiamata in breve
 121 \textit{dcache}). Ogni volta che una \textit{system call} specifica un
 122 \textit{pathname} viene effettuata una ricerca nella \textit{dcache} per
 123 ottenere immediatamente la \textit{dentry} corrispondente,\footnote{il buon
 124   funzionamento della \textit{dcache} è in effetti di una delle parti più
 125   critiche per le prestazioni del sistema.} che a sua volta ci darà, tramite
 126 l'\textit{inode}, il riferimento al file.
 127
 128 Dato che normalmente non è possibile mantenere nella \textit{dcache} le
 129 informazioni relative a tutto l'albero dei file la procedura della
 130 \textit{pathname resolution} richiede un meccanismo con cui riempire gli
 131 eventuali vuoti. Il meccanismo prevede che tutte le volte che si arriva ad una
 132 \textit{dentry} mancante venga invocata la funzione \texttt{lookup}
 133 dell'\textit{inode} associato alla \textit{dentry} precedente nella
 134 risoluzione del \textit{pathname},\footnote{che a questo punto è una
 135   directory, per cui si può cercare al suo interno il nome di un file.} il cui
 136 scopo è risolvere il nome mancante e fornire la sua \textit{dentry} che a
 137 questo punto verrà inserita nella cache.
 138
 139 Dato che tutte le volte che si monta un filesystem la funzione \texttt{mount}
 140 (vedi sez.~\ref{sec:filesystem_mounting}) della corrispondente
 141 \kstruct{file\_system\_type} inserisce la \textit{dentry} iniziale nel
 142 \textit{mount point} dello stesso, si avrà comunque un punto di
 143 partenza. Inoltre essendo questa \textit{dentry} relativa a quel tipo di
 144 filesystem essa farà riferimento ad un \textit{inode} di quel filesystem, e
 145 come vedremo questo farà sì che venga eseguita una \texttt{lookup} adatta per
 146 effettuare la risoluzione dei nomi per quel filesystem.
 147
 148 \itindend{pathname}
 149 \itindend{pathname~resolution}
 150
 151 % Un secondo effetto della chiamata funzione \texttt{mount} di
 152 % \kstruct{file\_system\_type} è quello di allocare una struttura
 153 % \kstruct{super\_block} per ciascuna istanza montata, che contiene le
 154 % informazioni generali di un qualunque filesystem montato, come le opzioni di
 155 % montaggio, le dimensioni dei blocchi, quando il filesystem è stato montato
 156 % ecc. Fra queste però viene pure inserta, nel campo \var{s\_op}, una ulteriore
 157 % struttura \kstruct{super\_operations}, il cui contenuto sono i puntatori
 158 % alle funzioni di gestione di un filesystem, anche inizializzata in modo da
 159 % utilizzare le versioni specifiche di quel filesystem.
 160
 161 L'oggetto più importante per il funzionamento del VFS è probabilmente
 162 l'\textit{inode}, ma con questo nome si può fare riferimento a due cose
 163 diverse.  La prima è la struttura su disco (su cui torneremo anche in
 164 sez.~\ref{sec:file_filesystem}) che fa parte della organizzazione dei dati
 165 realizzata dal filesystem e che contiene le informazioni relative alle
 166 proprietà (i cosiddetti \textsl{metadati}) di ogni oggetto presente su di esso
 167 (si intende al solito uno qualunque dei tipi di file di
 168 tab.~\ref{tab:file_file_types}).
 169
 170 La seconda è la corrispondente struttura \kstruct{inode}, della cui
 171 definizione si è riportato un estratto in
 172 fig.~\ref{fig:kstruct_inode}.\footnote{l'estratto fa riferimento alla versione
 173   del kernel 2.6.37.} Questa struttura viene mantenuta in memoria ed è a
 174 questa che facevamo riferimento quando parlavamo dell'\textit{inode} associato
 175 a ciascuna \textit{dentry}. Nella struttura in memoria sono presenti gli
 176 stessi \textsl{metadati} memorizzati su disco, che vengono letti quando questa
 177 struttura viene allocata e trascritti all'indietro se modificati.
 178
 179 \begin{figure}[!htb]
 180   \footnotesize \centering
 181   \begin{minipage}[c]{0.8\textwidth}
 182     \includestruct{listati/inode.h}
 183   \end{minipage}
 184   \normalsize
 185   \caption{Estratto della struttura \kstructd{inode} del kernel (da
 186     \texttt{include/linux/fs.h}).}
 187   \label{fig:kstruct_inode}
 188 \end{figure}
 189
 190 Il fatto che la struttura \kstruct{inode} sia mantenuta in memoria,
 191 direttamente associata ad una \textit{dentry}, rende sostanzialmente immediate
 192 le operazioni che devono semplicemente effettuare un accesso ai dati in essa
 193 contenuti: è così ad esempio che viene realizzata la \textit{system call}
 194 \func{stat} che vedremo in sez.~\ref{sec:file_stat}. Rispetto ai dati salvati
 195 sul disco questa struttura contiene però anche quanto necessario alla
 196 implementazione del VFS, ed in particolare è importante il campo \var{i\_op}
 197 che, come illustrato in fig.~\ref{fig:kstruct_inode}, contiene il puntatore ad
 198 una struttura di tipo \kstruct{inode\_operation}, la cui definizione si può
 199 trovare nel file \texttt{include/kernel/fs.h} dei sorgenti del kernel.
 200
 201 Questa struttura non è altro che una tabella di funzioni, ogni suo membro cioè
 202 è un puntatore ad una funzione e, come suggerisce il nome della struttura
 203 stessa, queste funzioni sono quelle che definiscono le operazioni che il VFS
 204 può compiere su un \textit{inode}. Si sono riportate in
 205 tab.~\ref{tab:file_inode_operations} le più rilevanti.
 206
 207 \begin{table}[htb]
 208   \centering
 209   \footnotesize
 210   \begin{tabular}[c]{|l|l|}
 211     \hline
 212     \textbf{Funzione} & \textbf{Operazione} \\
 213     \hline
 214     \hline
 215     \textsl{\code{create}} & Chiamata per creare un nuovo file (vedi
 216                              sez.~\ref{sec:file_open_close}).\\
 217     \textsl{\code{link}}   & Crea un \textit{hard link} (vedi
 218                              sez.~\ref{sec:link_symlink_rename}).\\
 219     \textsl{\code{unlink}} & Cancella un \textit{hard link} (vedi
 220                              sez.~\ref{sec:link_symlink_rename}).\\
 221     \textsl{\code{symlink}}& Crea un collegamento simbolico (vedi
 222                              sez.~\ref{sec:link_symlink_rename}).\\
 223     \textsl{\code{mkdir}}  & Crea una directory (vedi
 224                              sez.~\ref{sec:file_dir_creat_rem}).\\
 225     \textsl{\code{rmdir}}  & Rimuove una directory (vedi
 226                              sez.~\ref{sec:file_dir_creat_rem}).\\
 227     \textsl{\code{mknod}}  & Crea un file speciale (vedi
 228                              sez.~\ref{sec:file_mknod}).\\
 229     \textsl{\code{rename}} & Cambia il nome di un file (vedi
 230                              sez.~\ref{sec:link_symlink_rename}).\\
 231     \textsl{\code{lookup}}&  Risolve il nome di un file.\\
 232     \hline
 233   \end{tabular}
 234   \caption{Le principali operazioni sugli \textit{inode} definite tramite
 235     \kstructd{inode\_operation}.}
 236   \label{tab:file_inode_operations}
 237 \end{table}
 238
 239 Possiamo notare come molte di queste funzioni abbiano nomi sostanzialmente
 240 identici alle varie \textit{system call} con le quali si gestiscono file e
 241 directory, che tratteremo nel resto del capitolo. Quello che succede è che
 242 tutte le volte che deve essere eseguita una \textit{system call}, o una
 243 qualunque altra operazione su un \textit{inode} (come \texttt{lookup}) il VFS
 244 andrà ad utilizzare la funzione corrispondente attraverso il puntatore
 245 \var{i\_op}.
 246
 247 Sarà allora sufficiente che nella realizzazione di un filesystem si crei una
 248 implementazione di queste funzioni per quel filesystem e si allochi una
 249 opportuna istanza di \kstruct{inode\_operation} contenente i puntatori a dette
 250 funzioni. A quel punto le strutture \kstruct{inode} usate per gli oggetti di
 251 quel filesystem otterranno il puntatore alla relativa istanza di
 252 \kstruct{inode\_operation} e verranno automaticamente usate le funzioni
 253 corrette.
 254
 255 Si noti però come in tab.~\ref{tab:file_inode_operations} non sia presente la
 256 funzione \texttt{open} che invece è citata in
 257 tab.~\ref{tab:file_file_operations}.\footnote{essa può essere comunque
 258   invocata dato che nella struttura \kstruct{inode} è presente anche il
 259   puntatore \var{i\_fop} alla struttura \kstruct{file\_operation} che fornisce
 260   detta funzione.} Questo avviene perché su Linux l'apertura di un file
 261 richiede comunque un'altra operazione che mette in gioco l'omonimo oggetto del
 262 VFS: l'allocazione di una struttura di tipo \kstruct{file} che viene associata
 263 ad ogni file aperto nel sistema.  I motivi per cui viene usata una struttura a
 264 parte sono diversi, anzitutto, come illustrato in sez.~\ref{sec:file_fd},
 265 questa è necessaria per le operazioni eseguite dai processi con l'interfaccia
 266 dei file descriptor. Ogni processo infatti mantiene il riferimento ad una
 267 struttura \kstruct{file} per ogni file che ha aperto, ed è tramite essa che
 268 esegue le operazioni di I/O. Inoltre il kernel mantiene un elenco di tutti i
 269 file aperti nella \textit{file table} (torneremo su questo in
 270 sez.~\ref{sec:file_fd}).
 271
 272 Inoltre se le operazioni relative agli \textit{inode} fanno riferimento ad
 273 oggetti posti all'interno di un filesystem e vi si applicano quindi le
 274 funzioni fornite nell'implementazione di quest'ultimo, quando si apre un file
 275 questo può essere anche un file di dispositivo, ed in questo caso il VFS
 276 invece di usare le operazioni fornite dal filesystem (come farebbe per un file
 277 di dati) dovrà invece ricorrere a quelle fornite dal driver del dispositivo.
 278
 279 \itindend{inode}
 280
 281 \begin{figure}[!htb]
 282   \footnotesize \centering
 283   \begin{minipage}[c]{0.8\textwidth}
 284     \includestruct{listati/file.h}
 285   \end{minipage}
 286   \normalsize
 287   \caption{Estratto della struttura \kstructd{file} del kernel (da
 288     \texttt{include/linux/fs.h}).}
 289   \label{fig:kstruct_file}
 290 \end{figure}
 291
 292 Come si può notare dall'estratto di fig.~\ref{fig:kstruct_file}, la struttura
 293 \kstruct{file} contiene, oltre ad alcune informazioni usate dall'interfaccia
 294 dei file descriptor il cui significato emergerà più avanti, il puntatore
 295 \var{f\_op} ad una struttura \kstruct{file\_operation}. Questa è l'analoga per
 296 i file di \kstruct{inode\_operation}, e definisce le operazioni generiche
 297 fornite dal VFS per i file. Si sono riportate in
 298 tab.~\ref{tab:file_file_operations} le più significative.
 299
 300 \begin{table}[htb]
 301   \centering
 302   \footnotesize
 303   \begin{tabular}[c]{|l|p{8cm}|}
 304     \hline
 305     \textbf{Funzione} & \textbf{Operazione} \\
 306     \hline
 307     \hline
 308     \textsl{\code{open}}   & Apre il file (vedi
 309                              sez.~\ref{sec:file_open_close}).\\
 310     \textsl{\code{read}}   & Legge dal file (vedi sez.~\ref{sec:file_read}).\\
 311     \textsl{\code{write}}  & Scrive sul file (vedi
 312                              sez.~\ref{sec:file_write}).\\
 313     \textsl{\code{llseek}} & Sposta la posizione corrente sul file (vedi
 314                              sez.~\ref{sec:file_lseek}).\\
 315     \textsl{\code{ioctl}}  & Accede alle operazioni di controllo
 316                              (vedi sez.~\ref{sec:file_fcntl_ioctl}).\\
 317     \textsl{\code{readdir}}& Legge il contenuto di una directory (vedi
 318                              sez.~\ref{sec:file_dir_read}).\\
 319     \textsl{\code{poll}}   & Usata nell'I/O multiplexing (vedi
 320                              sez.~\ref{sec:file_multiplexing}).\\
 321     \textsl{\code{mmap}}   & Mappa il file in memoria (vedi
 322                              sez.~\ref{sec:file_memory_map}).\\
 323     \textsl{\code{release}}& Chiamata quando l'ultimo riferimento a un file
 324                              aperto è chiuso.\\
 325     \textsl{\code{fsync}}  & Sincronizza il contenuto del file (vedi
 326                              sez.~\ref{sec:file_sync}).\\
 327     \textsl{\code{fasync}} & Abilita l'I/O asincrono (vedi
 328                              sez.~\ref{sec:file_asyncronous_io}) sul file.\\
 329     \hline
 330   \end{tabular}
 331   \caption{Operazioni sui file definite tramite \kstructd{file\_operation}.}
 332   \label{tab:file_file_operations}
 333 \end{table}
 334
 335 Anche in questo caso tutte le volte che deve essere eseguita una
 336 \textit{system call} o una qualunque altra operazione sul file il VFS andrà ad
 337 utilizzare la funzione corrispondente attraverso il puntatore
 338 \var{f\_op}. Dato che è cura del VFS quando crea la struttura all'apertura del
 339 file assegnare a \var{f\_op} il puntatore alla versione di
 340 \kstruct{file\_operation} corretta per quel file, sarà possibile scrivere allo
 341 stesso modo sulla porta seriale come su un normale file di dati, e lavorare
 342 sui file allo stesso modo indipendentemente dal filesystem.
 343
 344 Il VFS realizza la quasi totalità delle operazioni relative ai file grazie
 345 alle funzioni presenti nelle due strutture \kstruct{inode\_operation} e
 346 \kstruct{file\_operation}.  Ovviamente non è detto che tutte le operazioni
 347 possibili siano poi disponibili in tutti i casi, ad esempio \code{llseek} non
 348 sarà presente per un dispositivo come la porta seriale o per una
 349 \textit{fifo}, mentre sui file del filesystem \texttt{vfat} non saranno
 350 disponibili i permessi, ma resta il fatto che grazie al VFS le \textit{system
 351   call} per le operazioni sui file possono restare sempre le stesse nonostante
 352 le enormi differenze che possono esserci negli oggetti a cui si applicano.
 353
 354
 355 \itindend{Virtual~File~System~(VFS)}
 356
 357 % NOTE: documentazione interessante:
 358 %       * sorgenti del kernel: Documentation/filesystems/vfs.txt
 359 %       * http://thecoffeedesk.com/geocities/rkfs.html
 360 %       * http://www.linux.it/~rubini/docs/vfs/vfs.html
 361
 362
 363
 364 \subsection{Il funzionamento di un filesystem Unix}
 365 \label{sec:file_filesystem}
 366
 367 Come già accennato in sez.~\ref{sec:file_arch_overview} Linux (ed ogni sistema
 368 unix-like) organizza i dati che tiene su disco attraverso l'uso di un
 369 filesystem. Una delle caratteristiche di Linux rispetto agli altri Unix è
 370 quella di poter supportare, grazie al VFS, una enorme quantità di filesystem
 371 diversi, ognuno dei quali avrà una sua particolare struttura e funzionalità
 372 proprie.  Per questo non entreremo nei dettagli di un filesystem specifico, ma
 373 daremo una descrizione a grandi linee che si adatta alle caratteristiche
 374 comuni di qualunque filesystem di un sistema unix-like.
 375
 376 \itindbeg{superblock}
 377
 378 Una possibile strutturazione dell'informazione su un disco è riportata in
 379 fig.~\ref{fig:file_disk_filesys}, dove si hanno tre filesystem su tre
 380 partizioni. In essa per semplicità si è fatto riferimento alla struttura del
 381 filesystem \acr{ext2}, che prevede una suddivisione dei dati in \textit{block
 382   group}.  All'interno di ciascun \textit{block group} viene anzitutto
 383 replicato il cosiddetto \textit{superblock}, (la struttura che contiene
 384 l'indice iniziale del filesystem e che consente di accedere a tutti i dati
 385 sottostanti) e creata una opportuna suddivisione dei dati e delle informazioni
 386 per accedere agli stessi.  Sulle caratteristiche di \acr{ext2} e derivati
 387 torneremo in sez.~\ref{sec:file_ext2}.
 388
 389 \itindend{superblock}
 390 \itindbeg{inode}
 391
 392 È comunque caratteristica comune di tutti i filesystem per Unix,
 393 indipendentemente da come poi viene strutturata nei dettagli questa
 394 informazione, prevedere la presenza di due tipi di risorse: gli
 395 \textit{inode}, cui abbiamo già accennato in sez.~\ref{sec:file_vfs_work}, che
 396 sono le strutture che identificano i singoli oggetti sul filesystem, e i
 397 blocchi, che invece attengono allo spazio disco che viene messo a disposizione
 398 per i dati in essi contenuti.
 399
 400 \begin{figure}[!htb]
 401   \centering
 402   \includegraphics[width=11cm]{img/disk_struct}
 403   \caption{Organizzazione dello spazio su un disco in partizioni e
 404   filesystem.}
 405   \label{fig:file_disk_filesys}
 406 \end{figure}
 407
 408 Se si va ad esaminare con maggiore dettaglio la strutturazione
 409 dell'informazione all'interno del filesystem \textsl{ext2}, tralasciando i
 410 dettagli relativi al funzionamento del filesystem stesso come la
 411 strutturazione in gruppi dei blocchi, il \textit{superblock} e tutti i dati di
 412 gestione possiamo esemplificare la situazione con uno schema come quello
 413 esposto in fig.~\ref{fig:file_filesys_detail}.
 414
 415 \begin{figure}[!htb]
 416   \centering
 417   \includegraphics[width=11cm]{img/filesys_struct}
 418   \caption{Strutturazione dei dati all'interno di un filesystem.}
 419   \label{fig:file_filesys_detail}
 420 \end{figure}
 421
 422 Da fig.~\ref{fig:file_filesys_detail} si evidenziano alcune delle
 423 caratteristiche di base di un filesystem, che restano le stesse anche su
 424 filesystem la cui organizzazione dei dati è totalmente diversa da quella
 425 illustrata, e sulle quali è bene porre attenzione visto che sono fondamentali
 426 per capire il funzionamento delle funzioni che manipolano i file e le
 427 directory che tratteremo nel prosieguo del capitolo. In particolare è
 428 opportuno tenere sempre presente che:
 429
 430
 431 \begin{enumerate*}
 432
 433 \item L'\textit{inode} contiene i cosiddetti \textsl{metadati}, vale dire le
 434   informazioni riguardanti le proprietà del file come oggetto del filesystem:
 435   il tipo di file, i permessi di accesso, le dimensioni, i puntatori ai
 436   blocchi fisici che contengono i dati e così via. Le informazioni che la
 437   funzione \func{stat} (vedi sez.~\ref{sec:file_stat}) fornisce provengono
 438   dall'\textit{inode}.  Dentro una directory si troverà solo il nome del file
 439   e il numero dell'\textit{inode} ad esso associato; il nome non è una
 440   proprietà del file e non viene mantenuto nell'\textit{inode}. Da da qui in
 441   poi chiameremo il nome del file contenuto in una directory
 442   ``\textsl{voce}'', come traduzione della nomenclatura inglese
 443   \textit{directory entry} che non useremo per evitare confusione con le
 444   \textit{dentry} del kernel viste in sez.~\ref{sec:file_vfs_work}.
 445
 446 \item Come mostrato in fig.~\ref{fig:file_filesys_detail} per i file
 447   \texttt{macro.tex} e \texttt{gapil\_macro.tex}, ci possono avere più voci
 448   che fanno riferimento allo stesso \textit{inode}. Fra le proprietà di un
 449   file mantenute nell'\textit{inode} c'è anche il contatore con il numero di
 450   riferimenti che sono stati fatti ad esso, il cosiddetto \textit{link
 451     count}.\footnote{mantenuto anche nel campo \var{i\_nlink} della struttura
 452     \kstruct{inode} di fig.~\ref{fig:kstruct_inode}.}  Solo quando questo
 453   contatore si annulla i dati del file possono essere effettivamente rimossi
 454   dal disco. Per questo la funzione per cancellare un file si chiama
 455   \func{unlink} (vedi sez.~\ref{sec:link_symlink_rename}), ed in realtà non
 456   cancella affatto i dati del file, ma si limita ad eliminare la relativa voce
 457   da una directory e decrementare il numero di riferimenti
 458   nell'\textit{inode}.
 459
 460 \item All'interno di ogni filesystem ogni \textit{inode} è identificato da un
 461   numero univoco. Il numero di \textit{inode} associato ad una voce in una
 462   directory si riferisce ad questo numero e non ci può essere una directory
 463   che contiene riferimenti ad \textit{inode} relativi ad altri filesystem.
 464   Questa è la ragione che limita l'uso del comando \cmd{ln}, che crea una
 465   nuova voce per un file esistente con la funzione \func{link} (vedi
 466   sez.~\ref{sec:link_symlink_rename}), a operare su file nel filesystem
 467   corrente.
 468
 469 \item Quando si cambia nome ad un file senza cambiare filesystem il contenuto
 470   del file non viene spostato fisicamente, viene semplicemente creata una
 471   nuova voce per l'\textit{inode} in questione e rimossa la precedente, questa
 472   è la modalità in cui opera normalmente il comando \cmd{mv} attraverso la
 473   funzione \func{rename} (vedi sez.~\ref{sec:link_symlink_rename}). Questa
 474   operazione non modifica minimamente neanche l'\textit{inode} del file, dato
 475   che non si opera sul file ma sulla directory che lo contiene.
 476
 477 \item Gli \textit{inode} dei file, che contengono i \textsl{metadati}, ed i
 478   blocchi di spazio disco, che contengono i dati, sono risorse indipendenti ed
 479   in genere vengono gestite come tali anche dai diversi filesystem; è pertanto
 480   possibile esaurire sia lo spazio disco (il caso più comune) che lo spazio
 481   per gli \textit{inode}. Nel primo caso non sarà possibile allocare ulteriore
 482   spazio, ma si potranno creare file (vuoti), nel secondo non si potranno
 483   creare nuovi file, ma si potranno estendere quelli che ci
 484   sono.\footnote{questo comportamento non è generale, alcuni filesystem più
 485     sofisticati possono evitare il problema dell'esaurimento degli
 486     \textit{inode} riallocando lo spazio disco libero per i blocchi.}
 487
 488 \end{enumerate*}
 489
 490 \begin{figure}[!htb]
 491   \centering
 492   \includegraphics[width=12cm]{img/dir_links}
 493   \caption{Organizzazione dei \textit{link} per le directory.}
 494   \label{fig:file_dirs_link}
 495 \end{figure}
 496
 497 Infine tenga presente che, essendo file pure loro, il numero di riferimenti
 498 esiste anche per le directory. Per questo se a partire dalla situazione
 499 mostrata in fig.~\ref{fig:file_filesys_detail} creiamo una nuova directory
 500 \file{img} nella directory \file{gapil}, avremo una situazione come quella
 501 illustrata in fig.~\ref{fig:file_dirs_link}.
 502
 503 La nuova directory avrà un numero di riferimenti pari a due, in quanto è
 504 referenziata dalla directory da cui si era partiti (in cui è inserita la nuova
 505 voce che fa riferimento a \texttt{img}) e dalla voce interna ``\texttt{.}''
 506 che è presente in ogni directory.  Questo è il valore che si troverà sempre
 507 per ogni directory che non contenga a sua volta altre directory. Al contempo,
 508 la directory da cui si era partiti avrà un numero di riferimenti di almeno
 509 tre, in quanto adesso sarà referenziata anche dalla voce ``\texttt{..}'' di
 510 \texttt{img}. L'aggiunta di una sottodirectory fa cioè crescere di uno il
 511 \textit{link count} della directory genitrice.
 512
 513 \itindend{inode}
 514
 515
 516 \subsection{Alcuni dettagli sul filesystem \textsl{ext2} e successori}
 517 \label{sec:file_ext2}
 518
 519 Benché non esista ``il'' filesystem di Linux, dato che esiste un supporto
 520 nativo di diversi filesystem che sono in uso da anni, quello che gli avvicina
 521 di più è la famiglia di filesystem evolutasi a partire dal \textit{second
 522   extended filesystem}, o \acr{ext2}. Il filesystem \acr{ext2} ha subito un
 523 grande sviluppo e diverse evoluzioni, fra cui l'aggiunta del
 524 \textit{journaling} con il passaggio ad \acr{ext3}, che probabilmente è ancora
 525 il filesystem più diffuso, ed una serie di ulteriori miglioramenti con il
 526 successivo \acr{ext4}. In futuro è previsto che questo debba essere sostituito
 527 da un filesystem completamente diverso, \acr{btrfs}, che dovrebbe diventare il
 528 filesystem standard di Linux, ma questo al momento è ancora in fase di
 529 sviluppo.\footnote{si fa riferimento al momento dell'ultima revisione di
 530   questo paragrafo, l'inizio del 2012.}
 531
 532 Il filesystem \acr{ext2} nasce come filesystem nativo per Linux a partire
 533 dalle prime versioni del kernel e supporta tutte le caratteristiche di un
 534 filesystem standard Unix: è in grado di gestire nomi di file lunghi (256
 535 caratteri, estensibili a 1012) e supporta una dimensione massima dei file fino
 536 a 4~Tb. I successivi filesystem \acr{ext3} ed \acr{ext4} sono evoluzioni di
 537 questo filesystem, e sia pure con molti miglioramenti ed estensioni
 538 significative ne mantengono le caratteristiche fondamentali.
 539
 540 Oltre alle caratteristiche standard, \acr{ext2} fornisce alcune estensioni che
 541 non sono presenti su un classico filesystem di tipo Unix; le principali sono
 542 le seguenti:
 543 \begin{itemize*}
 544 \item gli attributi estesi (vedi sez.~\ref{sec:file_xattr}) che consentono di
 545   estendere le informazioni salvabili come metadati e le ACL (vedi
 546   sez.~\ref{sec:file_ACL}) che consentono di estendere il modello tradizionale
 547   dei permessi sui file.
 548 \item sono supportate entrambe le semantiche di BSD e SVr4 come opzioni di
 549   montaggio. La semantica BSD comporta che i file in una directory sono creati
 550   con lo stesso identificatore di gruppo della directory che li contiene. La
 551   semantica SVr4 comporta che i file vengono creati con l'identificatore del
 552   gruppo primario del processo, eccetto il caso in cui la directory ha il bit
 553   di \acr{sgid} impostato (per una descrizione dettagliata del significato di
 554   questi termini si veda sez.~\ref{sec:file_access_control}), nel qual caso
 555   file e subdirectory ereditano sia il \ids{GID} che lo \acr{sgid}.
 556 \item l'amministratore può scegliere la dimensione dei blocchi del filesystem
 557   in fase di creazione, a seconda delle sue esigenze: blocchi più grandi
 558   permettono un accesso più veloce, ma sprecano più spazio disco.
 559 \item il filesystem implementa collegamenti simbolici veloci, in cui il nome
 560   del file non è salvato su un blocco, ma tenuto all'interno
 561   dell'\textit{inode} (evitando letture multiple e spreco di spazio), non
 562   tutti i nomi però possono essere gestiti così per limiti di spazio (il
 563   limite è 60 caratteri).
 564 \item vengono supportati i cosiddetti \textit{file attributes} (vedi
 565   sez.~\ref{sec:file_perm_overview}) che attivano comportamenti specifici per
 566   i file su cui vengono attivati come marcarli come immutabili (che possono
 567   cioè essere soltanto letti) per la protezione di file di configurazione
 568   sensibili, o come \textit{append-only} (che possono essere aperti in
 569   scrittura solo per aggiungere dati) per la protezione dei file di log.
 570 \end{itemize*}
 571
 572 La struttura di \acr{ext2} è stata ispirata a quella del filesystem di BSD: un
 573 filesystem è composto da un insieme di blocchi, la struttura generale è quella
 574 riportata in fig.~\ref{fig:file_filesys_detail}, in cui la partizione è divisa
 575 in gruppi di blocchi.
 576
 577 Ciascun gruppo di blocchi contiene una copia delle informazioni essenziali del
 578 filesystem (i \textit{superblock} sono quindi ridondati) per una maggiore
 579 affidabilità e possibilità di recupero in caso di corruzione del
 580 \textit{superblock} principale. L'utilizzo di raggruppamenti di blocchi ha
 581 inoltre degli effetti positivi nelle prestazioni dato che viene ridotta la
 582 distanza fra i dati e la tabella degli \textit{inode}.
 583
 584 \begin{figure}[!htb]
 585   \centering
 586   \includegraphics[width=9cm]{img/dir_struct}
 587   \caption{Struttura delle directory nel \textit{second extended filesystem}.}
 588   \label{fig:file_ext2_dirs}
 589 \end{figure}
 590
 591
 592 Le directory sono implementate come una \textit{linked list} con voci di
 593 dimensione variabile. Ciascuna voce della lista contiene il numero di
 594 \textit{inode}, la sua lunghezza, il nome del file e la sua lunghezza, secondo
 595 lo schema in fig.~\ref{fig:file_ext2_dirs}; in questo modo è possibile
 596 implementare nomi per i file anche molto lunghi (fino a 1024 caratteri) senza
 597 sprecare spazio disco.
 598
 599 Con l'introduzione del filesystem \textit{ext3} sono state introdotte diverse
 600 modifiche strutturali, la principale di queste è quella che \textit{ext3} è un
 601 filesystem \textit{journaled}, è cioè in grado di eseguire una registrazione
 602 delle operazioni di scrittura su un giornale (uno speciale file interno) in
 603 modo da poter garantire il ripristino della coerenza dei dati del
 604 filesystem\footnote{si noti bene che si è parlato di dati \textsl{del}
 605   filesystem, non di dati \textsl{nel} filesystem, quello di cui viene
 606   garantito un veloce ripristino è relativo ai dati della struttura interna
 607   del filesystem, non di eventuali dati contenuti nei file che potrebbero
 608   essere stati persi.} in brevissimo tempo in caso di interruzione improvvisa
 609 della corrente o di crollo del sistema che abbia causato una interruzione
 610 della scrittura dei dati sul disco.
 611
 612 Oltre a questo \textit{ext3} introduce ulteriori modifiche volte a migliorare
 613 sia le prestazioni che la semplicità di gestione del filesystem, in
 614 particolare per le directory si è passato all'uso di alberi binari con
 615 indicizzazione tramite \textit{hash} al posto delle \textit{linked list} che
 616 abbiamo illustrato, ottenendo un forte guadagno di prestazioni in caso di
 617 directory contenenti un gran numero di file.
 618
 619 % TODO (bassa priorità) portare a ext3, ext4 e btrfs ed illustrare le
 620 % problematiche che si possono incontrare (in particolare quelle relative alla
 621 % perdita di contenuti in caso di crash del sistema)
 622 % TODO (media priorità) trattare btrfs quando sarà usato come stabile
 623
 624
 625 \subsection{La gestione dell'uso dei filesystem}
 626 \label{sec:filesystem_mounting}
 627
 628 Come accennato in sez.~\ref{sec:file_arch_overview} per poter accedere ai file
 629 occorre rendere disponibile al sistema il filesystem su cui essi sono
 630 memorizzati. L'operazione di attivazione del filesystem è chiamata
 631 \textsl{montaggio} e per far questo in Linux si usa la funzione di sistema
 632 \funcd{mount}, il cui prototipo è:\footnote{la funzione è una versione
 633   specifica di Linux che usa la omonima \textit{system call} e non è
 634   portabile.}
 635
 636 \begin{funcproto}{
 637 \fhead{sys/mount.h}
 638 \fdecl{mount(const char *source, const char *target, const char
 639   *filesystemtype, \\
 640 \phantom{mount(}unsigned long mountflags, const void *data)}
 641 \fdesc{Monta un filesystem.}
 642 }
 643 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
 644   caso \var{errno} assumerà uno dei valori:
 645   \begin{errlist}
 646   \item[\errcode{EACCES}] non si ha il permesso di accesso su uno dei
 647     componenti del \textit{pathname}, o si è cercato di montare un filesystem
 648     disponibile in sola lettura senza aver specificato \const{MS\_RDONLY} o il
 649     device \param{source} è su un filesystem montato con l'opzione
 650     \const{MS\_NODEV}.
 651   \item[\errcode{EBUSY}] \param{source} è già montato, o non può essere
 652     rimontato in sola lettura perché ci sono ancora file aperti in scrittura,
 653     o non può essere montato su \param{target} perché la directory è ancora in
 654     uso.
 655   \item[\errcode{EINVAL}] il dispositivo \param{source} presenta un
 656     \textit{superblock} non valido, o si è cercato di rimontare un filesystem
 657     non ancora montato, o di montarlo senza che \param{target} sia un
 658     \textit{mount point} o di spostarlo quando \param{target} non è un
 659     \textit{mount point} o è la radice o si è usato un valore di
 660     \param{mountflags} non valido.
 661   \item[\errcode{ELOOP}] si è cercato di spostare un \textit{mount point} su
 662     una sottodirectory di \param{source} o si sono incontrati troppi
 663     collegamenti simbolici nella risoluzione di un nome.
 664   \item[\errcode{EMFILE}] in caso di filesystem virtuale, la tabella dei
 665     dispositivi fittizi (chiamati \textit{dummy} nella documentazione inglese)
 666     è piena.
 667   \item[\errcode{ENODEV}] il tipo \param{filesystemtype} non esiste o non è
 668     configurato nel kernel.
 669   \item[\errcode{ENOTBLK}] non si è usato un \textit{block device} per
 670     \param{source} quando era richiesto.
 671   \item[\errcode{ENXIO}] il \textit{major number} del
 672     dispositivo \param{source} è sbagliato.
 673   \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
 674   \end{errlist}
 675   ed inoltre \errval{EFAULT}, \errval{ENOMEM}, \errval{ENAMETOOLONG},
 676   \errval{ENOENT}, \errval{ENOTDIR} nel loro significato generico.}
 677 \end{funcproto}
 678
 679 \itindbeg{mount~point}
 680
 681 L'uso più comune della funzione è quello di montare sulla directory indicata
 682 da \param{target}, detta \textit{mount point}, il filesystem contenuto nel
 683 file di dispositivo indicato da \param{source}. In entrambi i casi, come
 684 daremo per assunto da qui in avanti tutte le volte che si parla di directory o
 685 file nel passaggio di un argomento di una funzione, si intende che questi
 686 devono essere indicati con la stringa contenente il loro \textit{pathname}.
 687
 688 Normalmente un filesystem è contenuto su un disco o una partizione, ma come
 689 illustrato in sez.~\ref{sec:file_vfs_work} la struttura del \textit{Virtual
 690   File System} è estremamente flessibile e può essere usata anche per oggetti
 691 diversi da un disco. Ad esempio usando il \textit{loop device} si può montare
 692 un file qualunque (come l'immagine di un CD-ROM o di un floppy) che contiene
 693 l'immagine di un filesystem, inoltre alcuni tipi di filesystem, come
 694 \texttt{proc} o \texttt{sysfs} sono virtuali e non hanno un supporto che ne
 695 contenga i dati che sono generati al volo dal kernel ad ogni lettura, e
 696 inviati al kernel ad ogni scrittura (costituiscono quindi un meccanismo di
 697 comunicazione, attraverso l'ordinaria interfaccia dei file, con il kernel).
 698
 699 Il tipo di filesystem che si vuole montare è specificato
 700 dall'argomento \param{filesystemtype}, che deve essere una delle stringhe
 701 riportate nel file \procfilem{/proc/filesystems} che, come accennato in
 702 sez.~\ref{sec:file_vfs_work}, contiene l'elenco dei filesystem supportati dal
 703 kernel. Nel caso si sia indicato un filesystem virtuale, che non è associato a
 704 nessun file di dispositivo, il contenuto di \param{source} viene ignorato.
 705
 706 L'argomento \param{data} viene usato per passare le impostazioni relative alle
 707 caratteristiche specifiche di ciascun filesystem. Si tratta di una stringa di
 708 parole chiave (separate da virgole e senza spazi) che indicano le cosiddette
 709 ``\textsl{opzioni}'' del filesystem che devono essere impostate; in genere
 710 viene usato direttamente il contenuto del parametro dell'opzione \texttt{-o}
 711 del comando \texttt{mount}. I valori utilizzabili dipendono dal tipo di
 712 filesystem e ciascuno ha i suoi, pertanto si rimanda alla documentazione della
 713 pagina di manuale di questo comando e dei singoli filesystem.
 714
 715 Dopo l'esecuzione della funzione il contenuto del filesystem viene reso
 716 disponibile nella directory specificata come \textit{mount point} ed il
 717 precedente contenuto di detta directory viene mascherato dal contenuto della
 718 directory radice del filesystem montato. Fino ai kernel della serie 2.2.x non
 719 era possibile montare un filesystem se un \textit{mount point} era già in uso,
 720 coi kernel successivi è possibile montare più filesystem sullo stesso
 721 \textit{mount point} impilandoli l'uno sull'altro, anche in questo caso vale
 722 quanto appena detto, e solo il contenuto dell'ultimo filesystem montato sarà
 723 visibile, mascherando quelli sottostanti.
 724
 725 In realtà quella di montare un filesystem è solo una delle operazioni che si
 726 possono effettuare con \func{mount}, la funzione infatti è dedicata a tutte le
 727 operazioni relative alla gestione del montaggio dei filesystem e dei
 728 \textit{mount point}. Ad esempio fin dalle sue origini poteva essere
 729 utilizzata per effettuare il rimontaggio di un filesystem con opzioni diverse,
 730 ed a partire dal kernel 2.4.x è divenuto possibile usarla per spostare
 731 atomicamente un \textit{mount point} da una directory ad un'altra, per montare
 732 lo stesso filesystem in diversi \textit{mount point}, per montare una
 733 directory su un'altra (il cosiddetto \textit{bind mount}).
 734
 735 \itindend{mount~point}
 736
 737 Il tipo di operazione compiuto da \func{mount} viene stabilito in base al
 738 valore dell'argomento \param{mountflags}, che oltre alla selezione del tipo di
 739 operazione da compiere, consente anche di indicare alcune opzioni generiche
 740 valide per qualunque filesystem.\footnote{benché queste siano espresse nel
 741   comando \cmd{mount} con l'opzione \texttt{-o} esse non vengono impostate nei
 742   valori di \param{data}, che serve solo per le opzioni specifiche di ogni
 743   filesystem.}  Il valore dell'argomento deve essere espresso come maschera
 744 binaria e i vari bit che lo compongono, detti anche \textit{mount flags},
 745 devono essere impostati con un OR aritmetico dei valori dalle opportune
 746 costanti che illustreremo a breve.
 747
 748 In Linux \param{mountflags} deve essere un intero a 32 bit;
 749 fino ai kernel della serie 2.2.x i 16 più significativi avevano un valore
 750 riservato che doveva essere specificato obbligatoriamente,\footnote{il valore
 751   era il \textit{magic number} \code{0xC0ED}, si può usare la costante
 752   \constd{MS\_MGC\_MSK} per ottenere la parte di \param{mountflags} riservata
 753   al \textit{magic number}, mentre per specificarlo si può dare un OR
 754   aritmetico con la costante \constd{MS\_MGC\_VAL}.} e si potevano usare solo
 755 i 16 meno significativi. Oggi invece, con un numero di opzioni superiore, sono
 756 utilizzati tutti e 32 i bit, ma qualora nei 16 più significativi sia presente
 757 detto valore, che non esprime una combinazione valida, esso viene ignorato.
 758
 759 Come accennato il tipo di operazione eseguito da \func{mount} viene stabilito
 760 in base al contenuto di \param{mountflags}, la scelta viene effettuata
 761 controllando nell'ordine:
 762 \begin{enumerate*}
 763 \item se è presente il flag \const{MS\_REMOUNT}, nel qual caso verrà eseguito
 764   il rimontaggio del filesystem, con le nuove opzioni indicate da \param{data}
 765   e dagli altri flag di \param{mountflags};
 766 \item se è presente il flag \const{MS\_BIND}, nel qual caso verrà eseguito un
 767   \textit{bind mount} (argomento che tratteremo più avanti);
 768 \item se è presente uno fra \const{MS\_SHARED}, \const{MS\_PRIVATE},
 769   \const{MS\_SLAVE}, \const{MS\_UNBINDABLE}, nel qual caso verrà cambiata la
 770   modalità di propagazione del montaggio (detti valori sono mutualmente
 771   esclusivi).
 772 \item se è presente \const{MS\_MOVE}, nel qual caso verrà effettuato uno
 773   spostamento del \textit{mount point};
 774 \item se nessuno dei precedenti è presente si tratta di una ordinaria
 775   operazione di montaggio di un filesystem.
 776 \end{enumerate*}
 777
 778 Il fatto che questi valori vengano controllati in quest'ordine significa che
 779 l'effetto di alcuni di questi flag possono cambiare se usati in combinazione
 780 con gli altri che vengono prima nella sequenza (è quanto avviene ad esempio
 781 per \const{MS\_BIND} usato con \const{MS\_REMOUNT}). Tratteremo questi
 782 \textit{mount flags} speciali per primi, nell'ordine appena illustrato,
 783 tornando sugli altri più avanti.
 784
 785 Usando il flag \constd{MS\_REMOUNT} si richiede a \func{mount} di rimontare un
 786 filesystem già montato cambiandone le opzioni di montaggio in maniera atomica
 787 (non è cioè necessario smontare e rimontare il filesystem per effettuare il
 788 cambiamento). Questa operazione consente di modificare le opzioni del
 789 filesystem anche se questo è in uso. Gli argomenti \param{source} e
 790 \param{target} devono essere gli stessi usati per il montaggio originale,
 791 mentre sia \param{data} che \param{mountflags} conterranno le nuove opzioni,
 792 \param{filesystemtype} viene ignorato.  Perché l'operazione abbia successo
 793 occorre comunque che il cambiamento sia possibile (ad esempio non sarà
 794 possibile rimontare in sola lettura un filesystem su cui sono aperti file per
 795 la lettura/scrittura).
 796
 797 Qualunque opzione specifica del filesystem indicata con \param{data} può
 798 essere modificata (ma si dovranno rielencare tutte quelle volute), mentre con
 799 \param{mountflags} possono essere modificate solo alcune opzioni generiche:
 800 \const{MS\_LAZYTIME}, \const{MS\_MANDLOCK}, \const{MS\_NOATIME},
 801 \const{MS\_NODEV}, \const{MS\_NODIRATIME}, \const{MS\_NOEXEC},
 802 \const{MS\_NOSUID}, \const{MS\_RELATIME}, \const{MS\_RDONLY},
 803 \const{MS\_STRICTATIME} e \const{MS\_SYNCHRONOUS}. Inoltre dal kernel 3.17 il
 804 comportamento relativo alle opzioni che operano sui tempi di ultimo accesso
 805 dei file (vedi sez.~\ref{sec:file_file_times}) è cambiato e se non si è
 806 indicato nessuno dei vari \texttt{MS\_*ATIME} vengono mantenute le
 807 impostazioni esistenti anziché forzare l'uso di \const{MS\_RELATIME}.
 808
 809 \itindbeg{bind~mount}
 810
 811 Usando il flag \constd{MS\_BIND} si richiede a \func{mount} di effettuare un
 812 cosiddetto \textit{bind mount}, l'operazione che consente di montare una
 813 directory di un filesystem in un'altra directory. L'opzione è disponibile a
 814 partire dai kernel della serie 2.4. In questo caso verranno presi in
 815 considerazione solo gli argomenti \param{source}, che stavolta indicherà la
 816 directory che si vuole montare e non un file di dispositivo, e \param{target}
 817 che indicherà la directory su cui verrà effettuato il \textit{bind mount}. Gli
 818 argomenti \param{filesystemtype} e \param{data} vengono ignorati.
 819
 820 Quello che avviene con questa operazione è che in corrispondenza del
 821 \textit{pathname} indicato da \param{target} viene montato l'\textit{inode} di
 822 \param{source}, così che la porzione di albero dei file presente sotto
 823 \param{source} diventi visibile allo stesso modo sotto
 824 \param{target}. Trattandosi esattamente dei dati dello stesso filesystem, ogni
 825 modifica fatta in uno qualunque dei due rami di albero sarà visibile
 826 nell'altro, visto che entrambi faranno riferimento agli stessi \textit{inode}.
 827
 828 Dal punto di vista del VFS l'operazione è analoga al montaggio di un
 829 filesystem proprio nel fatto che anche in questo caso si inserisce in
 830 corrispondenza della \textit{dentry} di \texttt{target} un diverso
 831 \textit{inode}, che stavolta, invece di essere quello della radice del
 832 filesystem indicato da un file di dispositivo, è quello di una directory già
 833 montata.
 834
 835 Si tenga presente che proprio per questo sotto \param{target} comparirà il
 836 contenuto che è presente sotto \param{source} all'interno del filesystem in
 837 cui quest'ultima è contenuta. Questo potrebbe non corrispondere alla porzione
 838 di albero che sta sotto \param{source} qualora in una sottodirectory di
 839 quest'ultima si fosse effettuato un altro montaggio. In tal caso infatti nella
 840 porzione di albero sotto \param{source} si troverebbe il contenuto del nuovo
 841 filesystem (o di un altro \textit{bind mount}) mentre sotto \param{target} ci
 842 sarebbe il contenuto presente nel filesystem originale.
 843
 844 L'unico altro \textit{mount flag} usabile direttamente con \const{MS\_BIND} è
 845 \const{MS\_REC} che consente di eseguire una operazione di \textit{bind mount}
 846 ricorsiva, in cui sotto \param{target} vengono montati ricorsivamente anche
 847 tutti gli eventuali ulteriori \textit{bind mount} già presenti sotto
 848 \param{source}.
 849
 850 E' però possibile, a partire dal kernel 2.6.26, usare questo flag insieme a
 851 \const{MS\_REMOUNT}, nel qual caso consente di effettuare una modifica delle
 852 opzioni di montaggio del \textit{bind mount} ed in particolare effettuare il
 853 cosiddetto \textit{read-only bind mount} in cui viene onorata anche la
 854 presenza aggiuntiva del flag \const{MS\_RDONLY}. In questo modo si ottiene che
 855 l'accesso ai file sotto \param{target} sia effettuabile esclusivamente in sola
 856 lettura, mantenendo il normale accesso in lettura/scrittura sotto
 857 \param{source}.
 858
 859 Il supporto per il \textit{bind mount} consente di superare i limiti presenti
 860 per gli \textit{hard link} (di cui parleremo in
 861 sez.~\ref{sec:link_symlink_rename}) con la possibilità di fare riferimento
 862 alla porzione dell'albero dei file di un filesystem presente a partire da una
 863 certa directory utilizzando una qualunque altra directory, anche se questa sta
 864 su un filesystem diverso.\footnote{e non c'è neanche il problema di non esser
 865   più in grado di cancellare un \textit{hard link} ad una directory sullo
 866   stesso filesystem (vedi sez.~\ref{sec:link_symlink_rename}), per cui su
 867   Linux questi non sono possibili, dato che in questo caso per la rimozione
 868   del collegamento basta smontare \param{target}.} Si può così fornire una
 869 alternativa all'uso dei collegamenti simbolici (di cui parleremo in
 870 sez.~\ref{sec:link_symlink_rename}) che funziona correttamente anche
 871 all'intero di un \textit{chroot} (argomento su cui torneremo in
 872 sez.~\ref{sec:file_chroot}).
 873
 874 \itindend{bind~mount}
 875 \itindbeg{shared~subtree}
 876
 877 I quattro flag \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
 878 \const{MS\_UNBINDABLE} sono stati introdotti a partire dal kernel 2.6.15 per
 879 realizzare l'infrastruttura dei cosiddetti \textit{shared subtree}, che
 880 estendono le funzionalità dei \textit{bind mount}.  La funzionalità nasce
 881 dalle esigenze di poter utilizzare a pieno le funzionalità di isolamento
 882 fornite dal kernel per i processi (i \textit{namespace}, che tratteremo in
 883 sez.~\ref{sec:process_namespaces}) in particolare per quanto riguarda la
 884 possibilità di far avere ad un processo una visione ristretta dei filesystem
 885 montati (il \textit{mount namespace}), ma l'applicazione è comunque rilevante
 886 anche con un classico \textit{chroot} (vedi sez.~\ref{sec:file_chroot}).
 887
 888 \itindbeg{submount}
 889
 890 Abbiamo visto come nella modalità ordinaria in cui si esegue un
 891 \textit{bind mount} sotto \param{target} compaia lo stesso ramo di albero dei
 892 file presente sotto \param{source}, ma limitato a quanto presente nel
 893 filesystem di \param{source}; i risultati di un eventuale
 894 ``\textit{submount}'' effettuato all'interno di \param{source} non saranno
 895 visibili. Ed anche se quelli presenti al momento dell'uso di \const{MS\_BIND}
 896 possono essere riottenuti usando \const{MS\_REC}, ogni eventuale
 897 ``\textit{submount}'' successivo (che avvenga sotto \param{source} o sotto
 898 \param{target}) resterà ``\textsl{privato}'' al ramo di albero su cui è
 899 avvenuto.
 900
 901 \itindend{submount}
 902 \itindbeg{mount peer group}
 903
 904 Ci sono casi però in cui può risultare utile che eventuali
 905 ``\textit{submount}'' siano visibili sui rami di albero presenti al di sotto
 906 di tutte le directory coinvolte in un \textit{bind mount}, anche se effettuati
 907 in un secondo tempo. Per poter ottenere questa funzionalità i
 908 \textit{bind mount} sono stati estesi introducendo i \textit{mount peer
 909   group}, che consentono di raggrupparli in modo da poter inviare a ciascuno
 910 di essi tutti gli eventi relativi a montaggi o smontaggi effettuati al loro
 911 interno ed avere sempre una propagazione degli stessi che li renda coerenti.
 912
 913 Quando si effettua un montaggio ordinario, o si esegue un \textit{bind mount},
 914 di default non viene utilizzato nessun \textit{mount peer group} ed il
 915 \textit{mount point} viene classificato come ``\textsl{privato}'', nel senso
 916 che abbiamo appena visto.  Si può però marcare un \textit{mount point} come
 917 ``\textsl{condiviso}'', ed in questo modo esso verrà associato ad un
 918 \textit{mount peer group} insieme a tutti gli altri ulteriori \textit{mount
 919   point} per i quali sia stato eseguito un \textit{bind mount}. Questo fa sì
 920 che tutte le volte che si effettua un montaggio o uno smontaggio all'interno
 921 di uno qualunque dei \textit{mount point} del gruppo, questo venga propagato
 922 anche su tutti gli altri e sotto tutti sia visibile sempre lo stesso ramo di
 923 albero dei file.
 924
 925 A completare l'infrastruttura degli \textit{shared subtree} sono state
 926 previste due ulteriori funzionalità: la prima è quella di marcare un
 927 \textit{mount point} come ``\textit{slave}'', in tal caso le operazioni di
 928 montaggio e smontaggio effettuate al suo interno non verranno più propagate
 929 agli altri membri del \textit{mount peer group} di cui fa parte, ma continuerà
 930 a ricevere quelle eseguite negli altri membri.
 931
 932 La seconda funzionalità è quella di marcare un \textit{mount point} come
 933 ``\textit{unbindable}''; questo anzitutto impedirà che possa essere usato come
 934 sorgente di un \textit{bind mount} ed inoltre lo renderà privato, con la
 935 conseguenza che quando è presente all'interno di altri \textit{bind mount},
 936 all'interno di questi si vedrà solo il contenuto originale e non quello
 937 risultante da eventuali ulteriori montaggi effettuati al suo interno.
 938
 939 \itindend{mount peer group}
 940
 941 I \textit{mount flag} che controllano le operazioni relative agli
 942 \textit{shared subtree} sono descritti nella lista seguente. Si ricordi che
 943 sono mutuamente esclusivi, e compatibili solo con l'uso degli ulteriori flag
 944 \const{MS\_REC} (che applica ricorsivamente l'operazione a tutti gli eventuali
 945 \textit{mount point} sottostanti) e \const{MS\_SILENT}; in tutti gli altri
 946 casi \func{mount} fallirà con un errore di \errval{EINVAL}. L'unico altro
 947 argomento che deve essere specificato quando li si usano è \param{target};
 948 \param{source}, \param{data} e \param{filesystem} sono ignorati.
 949
 950 \begin{basedescript}{\desclabelwidth{1.9cm}\desclabelstyle{\nextlinelabel}}
 951
 952 \item[\constd{MS\_PRIVATE}] Marca un \textit{mount point} come \textit{private
 953     mount}.  Di default, finché non lo si marca altrimenti con una delle altre
 954   opzioni dell'interfaccia, ogni \textit{mount point} è privato. Ogni
 955   \textit{bind mount} ottenuto da un \textit{mount point} privato si comporta
 956   come descritto nella trattazione di \const{MS\_BIND}. Si usa questo flag
 957   principalmente per revocare gli effetti delle altre opzioni e riportare il
 958   comportamento a quello ordinario.
 959
 960 \item[\constd{MS\_SHARED}] Marca un \textit{mount point} come \textit{shared
 961     mount}.  Lo scopo dell'opzione è ottenere che tutti i successivi
 962   \textit{bind mount} ottenuti da un \textit{mount point} così marcato siano
 963   di tipo \textit{shared} e vengano inseriti nello stesso \textit{mount peer
 964     group} in modo da ``\textsl{condividere}'' ogni ulteriore operazione di
 965   montaggio o smontaggio. Con questa opzione le operazioni di montaggio e
 966   smontaggio effettuate al di sotto di uno \textit{shared mount} vengono
 967   automaticamente ``\textsl{propagate}'' a tutti gli altri membri del
 968   \textit{mount peer group} di cui fa parte, in modo che la sezione di albero
 969   dei file visibile al di sotto di ciascuno di essi sia sempre la stessa.
 970
 971 \item[\constd{MS\_SLAVE}] Marca un \textit{mount point} come \textit{slave
 972     mount}. Se il \textit{mount point} è parte di un \textit{mount peer group}
 973   esso diventerà di tipo \textit{slave}: le operazioni di montaggio e
 974   smontaggio al suo interno non verranno più propagate agli altri membri del
 975   gruppo, ma continuerà a ricevere quelle eseguite negli altri membri. Se non
 976   esistono altri membri nel gruppo il \textit{mount point} diventerà privato,
 977   negli altri casi non subirà nessun cambiamento.
 978
 979 \item[\constd{MS\_UNBINDABLE}] Marca un \textit{mount point} come
 980   \textit{unbindable mount}.  Un \textit{mount point} marcato in questo modo
 981   non può essere usato per un \textit{bind mount} del suo contenuto. Si
 982   comporta cioè come allo stesso modo di un \textit{mount point} ordinario di
 983   tipo \textit{private} con in più la restrizione che nessuna sua
 984   sottodirectory (anche se relativa ad un ulteriore montaggio) possa essere
 985   utilizzata come sorgente di un \textit{bind mount}.
 986
 987 \end{basedescript}
 988 \itindend{shared~subtree}
 989
 990 L'ultimo \textit{mount flag} che controlla una modalità operativa di
 991 \func{mount} è \constd{MS\_MOVE}, che consente di effettuare lo spostamento
 992 del \textit{mount point} di un filesystem. La directory del \textit{mount
 993   point} originale deve essere indicata nell'argomento \param{source}, e la
 994 sua nuova posizione nell'argomento \param{target}. Tutti gli altri argomenti
 995 della funzione vengono ignorati.
 996
 997 Lo spostamento avviene atomicamente, ed il ramo di albero presente sotto
 998 \param{source} sarà immediatamente visibile sotto \param{target}. Non esiste
 999 cioè nessun momento in cui il filesystem non risulti montato in una o
1000 nell'altra directory e pertanto è garantito che la risoluzione di
1001 \textit{pathname} relativi all'interno del filesystem non possa fallire.
1002
1003 Elenchiamo infine i restanti \textit{mount flag}, il cui utilizzo non attiene
1004 alle operazioni di \func{mount}, ma soltanto l'impostazione di opzioni
1005 generiche relative al funzionamento di un filesystem e che vengono per lo più
1006 utilizzati solo in fase di montaggio:
1007
1008 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
1009 \item[\constd{MS\_DIRSYNC}] Richiede che ogni modifica al contenuto di una
1010   directory venga immediatamente registrata su disco in maniera sincrona
1011   (introdotta a partire dai kernel della serie 2.6). L'opzione si applica a
1012   tutte le directory del filesystem, ma su alcuni filesystem è possibile
1013   impostarla a livello di singole directory o per i sotto-rami di una directory
1014   con il comando \cmd{chattr}.\footnote{questo avviene tramite delle opportune
1015     \texttt{ioctl} (vedi sez.~\ref{sec:file_fcntl_ioctl}).}
1016
1017   Questo consente di ridurre al minimo il rischio di perdita dei dati delle
1018   directory in caso di crollo improvviso del sistema, al costo di una certa
1019   perdita di prestazioni dato che le funzioni di scrittura relative ad
1020   operazioni sulle directory non saranno più bufferizzate e si bloccheranno
1021   fino all'arrivo dei dati sul disco prima che un programma possa proseguire.
1022
1023 \item[\constd{MS\_LAZYTIME}] Modifica la modalità di registrazione di tempi
1024   dei file (vedi sez.~\ref{sec:file_file_times}) per ridurre al massimo gli
1025   accessi a disco (particolarmente utile per i portatili). Attivandolo i tempi
1026   dei file vengono mantenuti in memoria e vengono salvati su disco solo in
1027   quattro casi: quando c'è da eseguire un aggiornamento dei dati
1028   dell'\textit{inode} per altri motivi, se viene usata una delle funzioni di
1029   sincronizzazione dei dati su disco (vedi sez.~\ref{sec:file_sync}), se
1030   l'\textit{inode} viene rimosso dalla memoria, o se è passato un giorno
1031   dall'ultima registrazione. Introdotto a partire dal kernel 4.0.
1032
1033   In questo modo si possono ridurre significativamente le scritture su disco
1034   mantenendo tutte le informazioni riguardo ai tempi dei file, riducendo anche
1035   l'impatto dell'uso di \const{MS\_STRICTATIME}. Il costo da pagare è il
1036   rischio, in caso di crash del sistema, di avere dati vecchi fino a 24 ore
1037   per quel che riguarda i tempi dei file.
1038
1039 \item[\constd{MS\_MANDLOCK}] Consente l'uso del \textit{mandatory locking}
1040   (vedi sez.~\ref{sec:file_mand_locking}) sui file del filesystem. Per poterlo
1041   utilizzare effettivamente però esso dovrà essere comunque attivato
1042   esplicitamente per i singoli file impostando i permessi come illustrato in
1043   sez.~\ref{sec:file_mand_locking}.
1044
1045 \item[\constd{MS\_NOATIME}] Viene disabilitato sul filesystem l'aggiornamento
1046   dell'\textit{access time} (vedi sez.~\ref{sec:file_file_times}) per
1047   qualunque tipo di file. Dato che l'aggiornamento dell'\textit{access time} è
1048   una funzionalità la cui utilità è spesso irrilevante ma comporta un costo
1049   elevato visto che una qualunque lettura comporta comunque una scrittura su
1050   disco, questa opzione consente di disabilitarla completamente. La soluzione
1051   può risultare troppo drastica dato che l'informazione viene comunque
1052   utilizzata da alcuni programmi, per cui nello sviluppo del kernel sono state
1053   introdotte altre opzioni che forniscono soluzioni più appropriate e meno
1054   radicali.
1055
1056 \item[\constd{MS\_NODEV}] Viene disabilitato sul filesystem l'accesso ai file
1057   di dispositivo eventualmente presenti su di esso. L'opzione viene usata come
1058   misura di precauzione per rendere inutile la presenza di eventuali file di
1059   dispositivo su filesystem che non dovrebbero contenerne.\footnote{si ricordi
1060     che le convenzioni del \textit{Linux Filesystem Hierarchy Standard}
1061     richiedono che questi siano mantenuti esclusivamente sotto \texttt{/dev}.}
1062
1063   Viene utilizzata, assieme a \const{MS\_NOEXEC} e \const{MS\_NOSUID}, per
1064   fornire un accesso più controllato a quei filesystem di cui gli utenti hanno
1065   il controllo dei contenuti, in particolar modo quelli posti su dispositivi
1066   rimuovibili. In questo modo si evitano alla radice possibili situazioni in
1067   cui un utente malizioso inserisce su uno di questi filesystem dei file di
1068   dispositivo con permessi ``opportunamente'' ampliati che gli consentirebbero
1069   di accedere anche a risorse cui non dovrebbe.
1070
1071 \item[\constd{MS\_NODIRATIME}] Viene disabilitato sul filesystem
1072   l'aggiornamento dell'\textit{access time} (vedi
1073   sez.~\ref{sec:file_file_times}) ma soltanto per le directory. Costituisce
1074   una alternativa per \const{MS\_NOATIME}, che elimina l'informazione per le
1075   directory, che in pratica che non viene mai utilizzata, mantenendola per i
1076   file in cui invece ha un impiego, sia pur limitato.
1077
1078 \item[\constd{MS\_NOEXEC}] Viene disabilitata sul filesystem l'esecuzione di un
1079   qualunque file eseguibile eventualmente presente su di esso. L'opzione viene
1080   usata come misura di precauzione per rendere impossibile l'uso di programmi
1081   posti su filesystem che non dovrebbero contenerne.
1082
1083   Anche in questo caso viene utilizzata per fornire un accesso più controllato
1084   a quei filesystem di cui gli utenti hanno il controllo dei contenuti. Da
1085   questo punto di vista l'opzione è meno importante delle analoghe
1086   \const{MS\_NODEV} e \const{MS\_NOSUID} in quanto l'esecuzione di un
1087   programma creato dall'utente pone un livello di rischio nettamente
1088   inferiore, ed è in genere consentita per i file contenuti nella sua home
1089   directory.\footnote{cosa che renderebbe superfluo l'attivazione di questa
1090     opzione, il cui uso ha senso solo per ambienti molto controllati in cui si
1091     vuole che gli utenti eseguano solo i programmi forniti
1092     dall'amministratore.}
1093
1094 \item[\constd{MS\_NOSUID}] Viene disabilitato sul filesystem l'effetto dei bit
1095   dei permessi \acr{suid} e \acr{sgid} (vedi sez.~\ref{sec:file_special_perm})
1096   eventualmente presenti sui file in esso contenuti. L'opzione viene usata
1097   come misura di precauzione per rendere inefficace l'effetto di questi bit
1098   per filesystem in cui non ci dovrebbero essere file dotati di questi
1099   permessi.
1100
1101   Di nuovo viene utilizzata, analogamente a \const{MS\_NOEXEC} e
1102   \const{MS\_NODEV}, per fornire un accesso più controllato a quei filesystem
1103   di cui gli utenti hanno il controllo dei contenuti. In questo caso si evita
1104   che un utente malizioso possa inserire su uno di questi filesystem un
1105   eseguibile con il bit \acr{suid} attivo e di proprietà dell'amministratore o
1106   di un altro utente, che gli consentirebbe di eseguirlo per conto di
1107   quest'ultimo.
1108
1109 \item[\constd{MS\_RDONLY}] Esegue il montaggio del filesystem in sola lettura,
1110   non sarà possibile nessuna modifica ai suoi contenuti. Viene usato tutte le
1111   volte che si deve accedere ai contenuti di un filesystem con la certezza che
1112   questo non venga modificato (ad esempio per ispezionare un filesystem
1113   corrotto). All'avvio di default il kernel monta la radice in questa
1114   modalità. Si tenga presente che se non viene indicato il filesystem verrà
1115   montato, o rimontato nel caso lo si usi con \const{MS\_REMOUNT}, in
1116   lettura/scrittura; questo significa in sostanza che non esiste una opzione
1117   separata per indicare il montaggio in lettura/scrittura.
1118
1119 \item[\constd{MS\_REC}] Applica ricorsivamente a tutti i \textit{mount point}
1120   presenti al di sotto del \textit{mount point} indicato gli effetti della
1121   opzione degli \textit{shared subtree} associata. In questo caso l'argomento
1122   \param{target} deve fare riferimento ad un \textit{mount point} e tutti gli
1123   altri argomenti sono ignorati, ed il flag deve essere indicato con uno fra
1124   \const{MS\_PRIVATE}, \const{MS\_SHARED}, \const{MS\_SLAVE} e
1125   \const{MS\_UNBINDABLE}. Può anche essere usato con \const{MS\_BIND} per
1126   richiedere il montaggio ricorsivo anche degli eventuali ulteriori
1127   \textit{bind mount} presenti sotto \param{target}.
1128
1129 \item[\constd{MS\_RELATIME}] Indica di effettuare l'aggiornamento
1130   dell'\textit{access time} sul filesystem soltanto quando questo risulti
1131   antecedente il valore corrente del \textit{modification time} o del
1132   \textit{change time} (per i tempi dei file si veda
1133   sez.~\ref{sec:file_file_times}). L'opzione è disponibile a partire dal
1134   kernel 2.6.20, mentre dal 2.6.30 questo è diventato il comportamento di
1135   default del sistema, che può essere riportato a quello tradizionale con
1136   l'uso di \const{MS\_STRICTATIME}. Sempre dal 2.6.30 il comportamento è stato
1137   anche modificato e l'\textit{access time} viene comunque aggiornato se è più
1138   vecchio di un giorno.
1139
1140   L'opzione consente di evitare i problemi di prestazioni relativi
1141   all'aggiornamento dell'\textit{access time} senza avere impatti negativi
1142   riguardo le funzionalità, il comportamento adottato infatti consente di
1143   rendere evidente che vi è stato un accesso dopo la scrittura, ed evitando al
1144   contempo ulteriori operazioni su disco negli accessi successivi. In questo
1145   modo l'informazione relativa al fatto che un file sia stato letto resta
1146   disponibile, ed i programmi che ne fanno uso continuano a funzionare. Con
1147   l'introduzione di questo comportamento l'uso delle alternative
1148   \const{MS\_NOATIME} e \const{MS\_NODIRATIME} è sostanzialmente inutile.
1149
1150 \item[\constd{MS\_SILENT}] Richiede la soppressione di alcuni messaggi di
1151   avvertimento nei log del kernel (vedi sez.~\ref{sec:sess_daemon}). L'opzione
1152   è presente a partire dal kernel 2.6.17 e sostituisce, utilizzando un nome
1153   non fuorviante, la precedente \const{MS\_VERBOSE}, introdotta nel kernel
1154   2.6.12, che aveva lo stesso effetto.
1155
1156 \item[\constd{MS\_STRICTATIME}] Ripristina il comportamento tradizionale per
1157   cui l'\textit{access time} viene aggiornato ad ogni accesso al
1158   file. L'opzione è disponibile solo a partire dal kernel 2.6.30 quando il
1159   comportamento di default del kernel è diventato quello fornito da
1160   \const{MS\_RELATIME}.
1161
1162 \item[\constd{MS\_SYNCHRONOUS}] Abilita la scrittura sincrona richiedendo che
1163   ogni modifica al contenuto del filesystem venga immediatamente registrata su
1164   disco. Lo stesso comportamento può essere ottenuto con il flag
1165   \const{O\_SYNC} di \func{open} (vedi sez.~\ref{sec:file_open_close}).
1166
1167   Questa opzione consente di ridurre al minimo il rischio di perdita dei dati
1168   in caso di crollo improvviso del sistema, al costo di una pesante perdita di
1169   prestazioni dato che tutte le funzioni di scrittura non saranno più
1170   bufferizzate e si bloccheranno fino all'arrivo dei dati sul disco. Per un
1171   compromesso in cui questo comportamento avviene solo per le directory, ed ha
1172   quindi una incidenza nettamente minore, si può usare \const{MS\_DIRSYNC}.
1173
1174 \end{basedescript}
1175
1176 % NOTE: per l'opzione \texttt{lazytime} introdotta con il kernel 4.0,
1177 % vedi http://lwn.net/Articles/621046/
1178
1179 % NOTE per \const{MS\_SLAVE},\const{MS\_SHARE}, \const{MS\_PRIVATE} e
1180 % \const{MS\_UNBINDABLE} dal 2.6.15 vedi shared subtrees, in particolare
1181 %  * http://lwn.net/Articles/159077/ e
1182 %  * Documentation/filesystems/sharedsubtree.txt
1183
1184 % TODO: (bassa priorità) non documentati ma presenti in sys/mount.h:
1185 %       * MS_POSIXACL
1186 %       * MS_KERNMOUNT
1187 %       * MS_I_VERSION
1188 %       * MS_ACTIVE
1189 %       * MS_NOUSER
1190
1191
1192 Una volta che non si voglia più utilizzare un certo filesystem è possibile
1193 ``\textsl{smontarlo}'' usando la funzione di sistema \funcd{umount}, il cui
1194 prototipo è:
1195
1196 \begin{funcproto}{
1197 \fhead{sys/mount.h}
1198 \fdecl{umount(const char *target)}
1199 \fdesc{Smonta un filesystem.}
1200 }
1201 {La funzione ritorna  $0$ in caso di successo e $-1$ per un errore,
1202   nel qual caso \var{errno} assumerà uno dei valori:
1203   \begin{errlist}
1204   \item[\errcode{EBUSY}] il filesystem è occupato.
1205   \item[\errcode{EINVAL}] \param{target} non è un \textit{mount point}.
1206   \item[\errcode{EPERM}] il processo non ha i privilegi di
1207     amministratore.\footnotemark
1208   \end{errlist}
1209   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
1210   \errval{ENOENT}, \errval{ENOMEM} nel loro significato generico.  }
1211 \end{funcproto}
1212
1213 \footnotetext{più precisamente la capacità \const{CAP\_SYS\_ADMIN}, vedi
1214   sez.~\ref{sec:proc_capabilities}.}
1215
1216 La funzione prende il nome della directory su cui il filesystem è montato e
1217 non il file o il dispositivo che è stato montato,\footnote{questo è vero a
1218   partire dal kernel 2.3.99-pre7, prima esistevano due chiamate separate e la
1219   funzione poteva essere usata anche specificando il file di dispositivo.} in
1220 quanto a partire dai kernel della serie 2.4.x è possibile montare lo stesso
1221 dispositivo in più punti. Nel caso più di un filesystem sia stato montato
1222 sullo stesso \textit{mount point} viene smontato quello che è stato montato
1223 per ultimo. Si tenga presente che la funzione fallisce se il filesystem è
1224 ``\textsl{occupato}'', cioè quando ci sono ancora dei file aperti sul
1225 filesystem, se questo contiene la directory di lavoro (vedi
1226 sez.~\ref{sec:file_work_dir}) di un qualunque processo o il \textit{mount
1227   point} di un altro filesystem.
1228
1229 Linux provvede inoltre una seconda funzione di sistema, \funcd{umount2}, che
1230 consente un maggior controllo delle operazioni, come forzare lo smontaggio di
1231 un filesystem anche quando questo risulti occupato; il suo prototipo è:
1232
1233 \begin{funcproto}{
1234 \fhead{sys/mount.h}
1235 \fdecl{umount2(const char *target, int flags)}
1236 \fdesc{Smonta un filesystem.}
1237 }
1238 {La funzione ritorna  $0$ in caso di successo e $-1$ per un errore,
1239   nel qual caso \var{errno} assumerà uno dei valori:
1240   \begin{errlist}
1241      \item[\errcode{EAGAIN}] si è chiamata la funzione con \const{MNT\_EXPIRE}
1242        ed il filesystem non era occupato.
1243      \item[\errcode{EBUSY}] \param{target} è la directory di lavoro di qualche
1244        processo, o contiene dei file aperti, o un altro \textit{mount point}.
1245      \item[\errcode{EINVAL}] \param{target} non è un \textit{mount point} o si
1246        è usato \const{MNT\_EXPIRE} con \const{MNT\_FORCE} o
1247        \const{MNT\_DETACH} o si è specificato un flag non esistente.
1248   \end{errlist}
1249   e tutti gli altri valori visti per \func{umount} con lo stesso significato.}
1250 \end{funcproto}
1251
1252 Il valore di \param{flags} è una maschera binaria dei flag che controllano le
1253 modalità di smontaggio, che deve essere specificato con un OR aritmetico delle
1254 costanti illustrate in tab.~\ref{tab:umount2_flags}.  Specificando
1255 \constd{MNT\_FORCE} la funzione cercherà di liberare il filesystem anche se è
1256 occupato per via di una delle condizioni descritte in precedenza. A seconda
1257 del tipo di filesystem alcune (o tutte) possono essere superate, evitando
1258 l'errore di \errcode{EBUSY}. In tutti i casi prima dello smontaggio viene
1259 eseguita una sincronizzazione dei dati.
1260
1261 \begin{table}[!htb]
1262   \centering
1263   \footnotesize
1264   \begin{tabular}[c]{|l|p{8cm}|}
1265     \hline
1266     \textbf{Costante} & \textbf{Descrizione}\\
1267     \hline
1268     \hline
1269     \const{MNT\_FORCE}  & Forza lo smontaggio del filesystem anche se questo è
1270                            occupato (presente dai kernel della serie 2.2).\\
1271     \const{MNT\_DETACH} & Esegue uno smontaggio ``\textsl{pigro}'', in cui si
1272                            blocca l'accesso ma si aspetta che il filesystem si
1273                            liberi (presente dal kernel 2.4.11 e dalla
1274                            \acr{glibc} 2.11).\\
1275     \const{MNT\_EXPIRE} & Se non occupato marca un \textit{mount point} come
1276                            ``\textsl{in scadenza}'' in modo che ad una
1277                            successiva chiamata senza utilizzo del filesystem
1278                            questo venga smontato (presente dal
1279                            kernel 2.6.8 e dalla \acr{glibc} 2.11).\\
1280     \const{UMOUNT\_NOFOLLOW}& Non dereferenzia \param{target} se questo è un
1281                                collegamento simbolico (vedi
1282                                sez.~\ref{sec:link_symlink_rename}) evitando
1283                                problemi di sicurezza (presente dal kernel
1284                                2.6.34).\\
1285     \hline
1286   \end{tabular}
1287   \caption{Costanti che identificano i bit dell'argomento \param{flags}
1288     della funzione \func{umount2}.}
1289   \label{tab:umount2_flags}
1290 \end{table}
1291
1292 Con l'opzione \constd{MNT\_DETACH} si richiede invece uno smontaggio
1293 ``\textsl{pigro}'' (o \textit{lazy umount}) in cui il filesystem diventa
1294 inaccessibile per i nuovi processi subito dopo la chiamata della funzione, ma
1295 resta accessibile per quelli che lo hanno ancora in uso e non viene smontato
1296 fintanto che resta occupato.
1297
1298 Con \constd{MNT\_EXPIRE}, che non può essere specificato insieme agli altri
1299 due, si marca il \textit{mount point} di un filesystem non occupato come
1300 ``\textsl{in scadenza}'', in tal caso \func{umount2} ritorna con un errore di
1301 \errcode{EAGAIN}, mentre in caso di filesystem occupato si sarebbe ricevuto
1302 \errcode{EBUSY}.  Una volta marcato, se nel frattempo non viene fatto nessun
1303 uso del filesystem, ad una successiva chiamata con \const{MNT\_EXPIRE} questo
1304 verrà smontato. Questo flag consente di realizzare un meccanismo che smonti
1305 automaticamente i filesystem che restano inutilizzati per un certo periodo di
1306 tempo.
1307
1308 Infine il flag \constd{UMOUNT\_NOFOLLOW} non dereferenzia \param{target} se
1309 questo è un collegamento simbolico (vedi
1310 sez.~\ref{sec:link_symlink_rename}). Questa è una misura di sicurezza
1311 introdotta per evitare, per quei filesystem per il quale è prevista una
1312 gestione diretta da parte degli utenti, come quelli basati su \itindex{FUSE}
1313 FUSE,\footnote{il \textit{Filesystem in USEr space} (FUSE) è una delle più
1314   interessanti applicazioni del VFS che consente, tramite un opportuno modulo,
1315   di implementarne le funzioni in \textit{user space}, così da rendere
1316   possibile l'implementazione di un qualunque filesystem (con applicazioni di
1317   grande interesse come il filesystem cifrato \textit{encfs} o il filesystem
1318   di rete \textit{sshfs}) che possa essere usato direttamente per conto degli
1319   utenti.}  che si possano passare ai programmi che effettuano lo smontaggio
1320 dei filesystem, che in genere sono privilegiati ma consentono di agire solo
1321 sui propri \textit{mount point}, dei collegamenti simbolici che puntano ad
1322 altri \textit{mount point}, ottenendo così la possibilità di smontare
1323 qualunque filesystem.
1324
1325
1326 Altre due funzioni di sistema specifiche di Linux,\footnote{esse si trovano
1327   anche su BSD, ma con una struttura diversa.} utili per ottenere in maniera
1328 diretta informazioni riguardo al filesystem su cui si trova un certo file,
1329 sono \funcd{statfs} e \funcd{fstatfs}, i cui prototipi sono:
1330
1331 \begin{funcproto}{
1332 \fhead{sys/vfs.h}
1333 \fdecl{int statfs(const char *path, struct statfs *buf)}
1334 \fdecl{int fstatfs(int fd, struct statfs *buf)}
1335 \fdesc{Restituiscono informazioni relative ad un filesystem.}
1336 }
1337 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
1338   nel qual caso \var{errno} assumerà uno dei valori:
1339   \begin{errlist}
1340   \item[\errcode{ENOSYS}] il filesystem su cui si trova il file specificato
1341     non supporta la funzione.
1342   \end{errlist} ed inoltre \errval{EFAULT} ed \errval{EIO} per entrambe,
1343   \errval{EBADF} per \func{fstatfs}, \errval{ENOTDIR}, \errval{ENAMETOOLONG},
1344   \errval{ENOENT}, \errval{EACCES}, \errval{ELOOP} per \func{statfs} nel loro
1345   significato generico.}
1346 \end{funcproto}
1347
1348 Queste funzioni permettono di ottenere una serie di informazioni generali
1349 riguardo al filesystem su cui si trova il file specificato con un
1350 \textit{pathname} per \func{statfs} e con un file descriptor (vedi
1351 sez.~\ref{sec:file_fd}) per \func{statfs}.  Le informazioni vengono restituite
1352 all'indirizzo \param{buf} di una struttura \struct{statfs} definita come in
1353 fig.~\ref{fig:sys_statfs}, ed i campi che sono indefiniti per il filesystem in
1354 esame sono impostati a zero.  I valori del campo \var{f\_type} sono definiti
1355 per i vari filesystem nei relativi file di header dei sorgenti del kernel da
1356 costanti del tipo \var{XXX\_SUPER\_MAGIC}, dove \var{XXX} in genere è il nome
1357 del filesystem stesso.
1358
1359 \begin{figure}[!htb]
1360   \footnotesize \centering
1361   \begin{minipage}[c]{0.8\textwidth}
1362     \includestruct{listati/statfs.h}
1363   \end{minipage}
1364   \normalsize
1365   \caption{La struttura \structd{statfs}.}
1366   \label{fig:sys_statfs}
1367 \end{figure}
1368
1369 \conffilebeg{/etc/mtab}
1370
1371 La \acr{glibc} provvede infine una serie di funzioni per la gestione dei due
1372 file \conffiled{/etc/fstab}\footnote{più precisamente \funcm{setfsent},
1373   \funcm{getfsent}, \funcm{getfsfile}, \funcm{getfsspec}, \funcm{endfsent}.}
1374 ed \conffile{/etc/mtab}\footnote{più precisamente \funcm{setmntent},
1375   \funcm{getmntent},\funcm{getmntent\_r}, \funcm{addmntent},\funcm{endmntent},
1376   \funcm{hasmntopt}.} che convenzionalmente sono usati in quasi tutti i
1377 sistemi unix-like per mantenere rispettivamente le informazioni riguardo ai
1378 filesystem da montare e a quelli correntemente montati. Le funzioni servono a
1379 leggere il contenuto di questi file in opportune strutture \structd{fstab} e
1380 \structd{mntent}, e, nel caso di \conffile{/etc/mtab}, per inserire e
1381 rimuovere le voci presenti nel file.
1382
1383 In generale si dovrebbero usare queste funzioni, in particolare quelle
1384 relative a \conffile{/etc/mtab}, quando si debba scrivere un programma che
1385 effettua il montaggio di un filesystem. In realtà in questi casi è molto più
1386 semplice invocare direttamente il programma \cmd{mount}. Inoltre l'uso stesso
1387 di \conffile{/etc/mtab} è considerato una pratica obsoleta, in quanto se non
1388 aggiornato correttamente (cosa che è impossibile se la radice è montata in
1389 sola lettura) il suo contenuto diventa fuorviante.
1390
1391 Per questo motivo il suo utilizzo viene deprecato ed in molti casi viene già
1392 oggi sostituito da un collegamento simbolico a \procfile{/proc/mounts}, che
1393 contiene una versione degli stessi contenuti (vale a dire l'elenco dei
1394 filesystem montati) generata direttamente dal kernel, e quindi sempre
1395 disponibile e sempre aggiornata. Per questo motivo tralasceremo la
1396 trattazione, di queste funzioni, rimandando al manuale della \acr{glibc}
1397 \cite{GlibcMan} per la documentazione completa.
1398
1399 \conffileend{/etc/mtab}
1400
1401 % TODO (bassa priorità) scrivere delle funzioni (getfsent e getmntent &C)
1402 % TODO (bassa priorità) documentare ? swapon e swapoff (man 2 ...)
1403
1404
1405
1406 \section{La gestione di file e directory}
1407 \label{sec:file_dir}
1408
1409 In questa sezione esamineremo le funzioni usate per la manipolazione dei nomi
1410 file e directory, per la creazione di collegamenti simbolici e diretti, per la
1411 gestione e la lettura delle directory.  In particolare ci soffermeremo sulle
1412 conseguenze che derivano dalla architettura di un filesystem unix-like
1413 illustrata in sez.~\ref{sec:file_filesystem} per quanto attiene il
1414 comportamento e gli effetti delle varie funzioni. Tratteremo infine la
1415 directory di lavoro e le funzioni per la gestione di file speciali e
1416 temporanei.
1417
1418
1419 \subsection{La gestione dei nomi dei file}
1420 \label{sec:link_symlink_rename}
1421
1422 % \subsection{Le funzioni \func{link} e \func{unlink}}
1423 % \label{sec:file_link}
1424
1425 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
1426 dei nomi alternativi, come gli alias del vecchio MacOS o i collegamenti di
1427 Windows o i nomi logici del VMS, che permettono di fare riferimento allo
1428 stesso file chiamandolo con nomi diversi o accedendovi da directory diverse.
1429 Questo è possibile anche in ambiente Unix, dove un nome alternativo viene
1430 usualmente chiamato ``\textsl{collegamento}'' (o \textit{link}).  Data
1431 l'architettura del sistema riguardo la gestione dei file vedremo però che ci
1432 sono due metodi sostanzialmente diversi per fare questa operazione.
1433
1434 \itindbeg{hard~link}
1435 \index{collegamento!diretto|(}
1436
1437 In sez.~\ref{sec:file_filesystem} abbiamo spiegato come la capacità di
1438 chiamare un file con nomi diversi sia connaturata con l'architettura di un
1439 filesystem per un sistema Unix, in quanto il nome del file che si trova in una
1440 directory è solo un'etichetta associata ad un puntatore che permette di
1441 ottenere il riferimento ad un \textit{inode}, e che è quest'ultimo che viene
1442 usato dal kernel per identificare univocamente gli oggetti sul filesystem.
1443
1444 Questo significa che fintanto che si resta sullo stesso filesystem la
1445 realizzazione di un \textit{link} è immediata: uno stesso file può avere tanti
1446 nomi diversi, dati da altrettante associazioni diverse allo stesso
1447 \textit{inode} effettuate tramite ``etichette'' diverse in directory
1448 diverse. Si noti anche come nessuno di questi nomi possa assumere una
1449 particolare preferenza o originalità rispetto agli altri, in quanto tutti
1450 fanno comunque riferimento allo stesso \textit{inode} e quindi tutti
1451 otterranno lo stesso file.
1452
1453 Quando si vuole aggiungere ad una directory una voce che faccia riferimento ad
1454 un file già esistente come appena descritto, per ottenere quello che viene
1455 denominato ``\textsl{collegamento diretto}'' (o \textit{hard link}), si deve
1456 usare la funzione di sistema \funcd{link}, il cui prototipo è:
1457
1458 \begin{funcproto}{
1459 \fhead{unistd.h}
1460 \fdecl{int link(const char *oldpath, const char *newpath)}
1461 \fdesc{Crea un nuovo collegamento diretto (\textit{hard link}).}
1462 }
1463 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1464   nel qual caso \var{errno} assumerà uno dei valori:
1465   \begin{errlist}
1466   \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
1467     esiste già.
1468   \item[\errcode{EMLINK}] ci sono troppi collegamenti al file \param{oldpath}
1469     (il numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
1470     sez.~\ref{sec:sys_limits}).
1471   \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
1472     \param{newpath} non supporta i collegamenti diretti, è una directory o per
1473     \param{oldpath} non si rispettano i criteri per i \textit{protected
1474       hardlink}.\footnotemark
1475   \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
1476     riferimento ad un filesystem montato sullo stesso
1477     \textit{mount point}.
1478   \end{errlist} ed inoltre \errval{EACCES}, \errval{EDQUOT}, \errval{EFAULT},
1479   \errval{EIO}, \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1480   \errval{ENOMEM}, \errval{ENOSPC}, \errval{ENOTDIR}, \errval{EROFS} nel loro
1481   significato generico.}
1482 \end{funcproto}
1483
1484 \footnotetext{i \textit{protected hardlink} sono una funzionalità di
1485   protezione introdotta con il kernel 3.16 (si veda
1486   sez.~\ref{sec:procadv_security_misc} per i dettagli) che limita la capacità
1487   di creare un \textit{hard link} ad un file qualunque.}
1488
1489 La funzione crea in \param{newpath} un collegamento diretto al file indicato
1490 da \param{oldpath}. Per quanto detto la creazione di un nuovo collegamento
1491 diretto non copia il contenuto del file, ma si limita a creare la voce
1492 specificata da \param{newpath} nella directory corrispondente e l'unica
1493 proprietà del file che verrà modificata sarà il numero di riferimenti al file
1494 (il campo \var{i\_nlink} della struttura \kstruct{inode}, vedi
1495 fig.~\ref{fig:kstruct_inode}) che verrà aumentato di uno. In questo modo lo
1496 stesso file potrà essere acceduto sia con \param{newpath} che
1497 con \param{oldpath}.
1498
1499 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
1500 collegamento diretto è possibile solo se entrambi i \textit{pathname} sono
1501 nello stesso filesystem ed inoltre esso deve supportare gli \textit{hard link}
1502 (il meccanismo non è disponibile ad esempio con il filesystem \acr{vfat} di
1503 Windows). In realtà la funzione ha un ulteriore requisito, e cioè che non solo
1504 che i due file siano sullo stesso filesystem, ma anche che si faccia
1505 riferimento ad essi all'interno dello stesso \textit{mount point}.\footnote{si
1506   tenga presente infatti, come detto in sez.~\ref{sec:filesystem_mounting},
1507   che a partire dal kernel 2.4 uno stesso filesystem può essere montato più
1508   volte su directory diverse.}
1509 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
1510 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
1511 l'amministratore è in grado di creare un collegamento diretto ad un'altra
1512 directory: questo viene fatto perché con una tale operazione è possibile
1513 creare dei \textit{loop} nel filesystem (vedi fig.~\ref{fig:file_link_loop})
1514 la cui rimozione diventerebbe piuttosto complicata.\footnote{occorrerebbe
1515   infatti eseguire il programma \cmd{fsck} per riparare il filesystem, perché
1516   in caso di \textit{loop} la directory non potrebbe essere più svuotata,
1517   contenendo comunque se stessa, e quindi non potrebbe essere rimossa.}
1518
1519 Data la pericolosità di questa operazione, e visto che i collegamenti
1520 simbolici (che tratteremo a breve) ed i \textit{bind mount} (già visti in
1521 sez.~\ref{sec:filesystem_mounting}) possono fornire la stessa funzionalità
1522 senza questi problemi, nel caso di Linux questa capacità è stata completamente
1523 disabilitata, e al tentativo di creare un collegamento diretto ad una
1524 directory la funzione \func{link} restituisce sempre l'errore \errcode{EPERM}.
1525
1526 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
1527 \textit{hard link} ad un collegamento simbolico. In questo caso lo standard
1528 POSIX.1-2001 prevederebbe che quest'ultimo venga risolto e che il collegamento
1529 sia effettuato rispetto al file cui esso punta, e che venga riportato un
1530 errore qualora questo non esista o non sia un file. Questo era anche il
1531 comportamento iniziale di Linux ma a partire dai kernel della serie
1532 2.0.x\footnote{per la precisione il comportamento era quello previsto dallo
1533   standard POSIX fino al kernel di sviluppo 1.3.56, ed è stato temporaneamente
1534   ripristinato anche durante lo sviluppo della serie 2.1.x, per poi tornare al
1535   comportamento attuale fino ad oggi (per riferimento si veda
1536   \url{http://lwn.net/Articles/293902}).} è stato adottato un comportamento
1537 che non segue più lo standard per cui l'\textit{hard link} viene creato nei
1538 confronti del collegamento simbolico, e non del file cui questo punta. La
1539 revisione POSIX.1-2008 lascia invece il comportamento dipendente
1540 dall'implementazione, cosa che rende Linux conforme a questa versione
1541 successiva dello standard.
1542
1543 \itindbeg{symbolic~link}
1544 \index{collegamento!simbolico|(}
1545
1546 La ragione di questa differenza rispetto al vecchio standard, presente anche
1547 in altri sistemi unix-like, è dovuta al fatto che un collegamento simbolico
1548 può fare riferimento anche ad un file non esistente o a una directory, per i
1549 quali l'\textit{hard link} non può essere creato, per cui la scelta di seguire
1550 il collegamento simbolico è stata ritenuta una scelta scorretta nella
1551 progettazione dell'interfaccia.  Infatti se non ci fosse il comportamento
1552 adottato da Linux sarebbe impossibile creare un \textit{hard link} ad un
1553 collegamento simbolico, perché la funzione lo risolverebbe e l'\textit{hard
1554   link} verrebbe creato verso la destinazione. Invece evitando di seguire lo
1555 standard l'operazione diventa possibile, ed anche il comportamento della
1556 funzione risulta molto più comprensibile. Tanto più che se proprio se si vuole
1557 creare un \textit{hard link} rispetto alla destinazione di un collegamento
1558 simbolico è sempre possibile farlo direttamente.\footnote{ciò non toglie che
1559   questo comportamento possa causare problemi, come nell'esempio descritto
1560   nell'articolo citato nella nota precedente, a programmi che non si aspettano
1561   questa differenza rispetto allo standard POSIX.}
1562
1563 Dato che \func{link} crea semplicemente dei nomi che fanno riferimenti agli
1564 \textit{inode}, essa può funzionare soltanto per file che risiedono sullo
1565 stesso filesystem e solo per un filesystem di tipo Unix.  Inoltre abbiamo
1566 visto che in Linux non è consentito eseguire un collegamento diretto ad una
1567 directory.
1568
1569 Per ovviare a queste limitazioni, come accennato all'inizio, i sistemi
1570 unix-like supportano un'altra forma di collegamento, detta
1571 ``\textsl{collegamento simbolico}'' (o anche \textit{soft link} o
1572 \textit{symbolic link}). In questo caso si tratta, come avviene in altri
1573 sistemi operativi, di file speciali che contengono semplicemente il
1574 riferimento ad un altro file (o directory). In questo modo è possibile
1575 effettuare \textit{link} anche attraverso filesystem diversi, a file posti in
1576 filesystem che non supportano i collegamenti diretti, a delle directory, ed
1577 anche a file che non esistono ancora.
1578
1579 \itindend{hard~link}
1580 \index{collegamento!diretto|)}
1581
1582 Il meccanismo funziona in quanto i \textit{symbolic link} sono riconosciuti
1583 come tali dal kernel\footnote{è uno dei diversi tipi di file visti in
1584   tab.~\ref{tab:file_file_types}, contrassegnato come tale nell'\textit{inode}
1585   e riconoscibile dal valore del campo \var{st\_mode} della struttura
1586   \struct{stat} (vedi sez.~\ref{sec:file_stat}).} e tutta una serie di
1587 funzioni di sistema (come \func{open} o \func{stat}) quando ricevono come
1588 argomento il \textit{pathname} di un collegamento simbolico vanno
1589 automaticamente ad operare sul file da esso specificato. La funzione di
1590 sistema che permette di creare un nuovo collegamento simbolico è
1591 \funcd{symlink}, ed il suo prototipo è:
1592
1593 \begin{funcproto}{
1594 \fhead{unistd.h}
1595 \fdecl{int symlink(const char *oldpath, const char *newpath)}
1596 \fdesc{Crea un nuovo collegamento simbolico (\textit{symbolic link}).}
1597 }
1598 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1599   nel qual caso \var{errno} assumerà uno dei valori:
1600   \begin{errlist}
1601   \item[\errcode{EACCES}]  o non si hanno i permessi sulla directory in cui
1602     creare il \textit{link}.
1603   \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
1604   \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
1605     \param{oldpath} è una stringa vuota.
1606   \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
1607     supporta i collegamenti simbolici.
1608   \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
1609     lettura.
1610   \end{errlist} ed inoltre \errval{EDQUOT}, \errval{EFAULT}, \errval{EIO},
1611   \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOMEM}, \errval{ENOSPC} e
1612   \errval{ENOTDIR} nel loro significato generico.}
1613 \end{funcproto}
1614
1615
1616 La funzione crea un nuovo collegamento simbolico \param{newpath} che fa
1617 riferimento ad \param{oldpath}.  Si tenga presente che la funzione non
1618 effettua nessun controllo sull'esistenza di un file di nome \param{oldpath},
1619 ma si limita ad inserire il \textit{pathname} nel collegamento
1620 simbolico. Pertanto un collegamento simbolico può anche riferirsi ad un file
1621 che non esiste ed in questo caso si ha quello che viene chiamato un
1622 \itindex{dangling~link} \textit{dangling link}, letteralmente un
1623 \index{collegamento!ciondolante} ``\textsl{collegamento ciondolante}''. Ad
1624 esempio possiamo usare il comando \cmd{ln} per creare un collegamento
1625 simbolico nella nostra directory con:
1626 \begin{Console}
1627 piccardi@hain:~/gapil$ \textbf{ln -s /tmp/tmp_file symlink}
1628 \end{Console}
1629 %$
1630 e questo avrà successo anche se \file{/tmp/tmp\_file} non esiste:
1631 \begin{Console}
1632 piccardi@hain:~/gapil$ \textbf{ls symlink}
1633 symlink
1634 \end{Console}
1635 %$
1636 ma questo può generare confusione, perché accedendo in lettura a
1637 \file{symlink}, ad esempio con \cmd{cat}, otterremmo:
1638 \begin{Console}
1639 piccardi@hain:~/gapil$ \textbf{cat symlink}
1640 cat: symlink: No such file or directory
1641 \end{Console}
1642 %$
1643 con un errore che può sembrare sbagliato, dato che \cmd{ls} ci ha mostrato in
1644 precedenza l'esistenza di \file{symlink}. Se invece andassimo a scrivere su
1645 \file{symlink}, l'effetto sarebbe quello di ottenere la creazione di
1646 \file{/tmp/tmp\_file} (che a quel punto verrebbe creato) senza errori.
1647
1648 Come accennato i collegamenti simbolici sono risolti automaticamente dal
1649 kernel all'invocazione delle varie \textit{system call}. In
1650 tab.~\ref{tab:file_symb_effect} si è riportato un elenco dei comportamenti
1651 delle varie funzioni di sistema che operano sui file nei confronti della
1652 risoluzione dei collegamenti simbolici, specificando quali li seguono e quali
1653 invece possono operare direttamente sui loro contenuti.
1654 \begin{table}[htb]
1655   \centering
1656   \footnotesize
1657   \begin{tabular}[c]{|l|c|c|}
1658     \hline
1659     \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
1660     \hline
1661     \hline
1662     \func{access}   & $\bullet$ & --        \\
1663     \func{chdir}    & $\bullet$ & --        \\
1664     \func{chmod}    & $\bullet$ & --        \\
1665     \func{chown}    & --        & $\bullet$ \\
1666     \func{creat}    & $\bullet$ & --        \\
1667     \func{exec}     & $\bullet$ & --        \\
1668     \func{lchown}   & $\bullet$ & --        \\
1669     \func{link}\footnotemark & --        & $\bullet$ \\
1670     \func{lstat}    & --        & $\bullet$ \\
1671     \func{mkdir}    & $\bullet$ & --        \\
1672     \func{mkfifo}   & $\bullet$ & --        \\
1673     \func{mknod}    & $\bullet$ & --        \\
1674     \func{open}     & $\bullet$ & --        \\
1675     \func{opendir}  & $\bullet$ & --        \\
1676     \func{pathconf} & $\bullet$ & --        \\
1677     \func{readlink} & --        & $\bullet$ \\
1678     \func{remove}   & --        & $\bullet$ \\
1679     \func{rename}   & --        & $\bullet$ \\
1680     \func{stat}     & $\bullet$ & --        \\
1681     \func{truncate} & $\bullet$ & --        \\
1682     \func{unlink}   & --        & $\bullet$ \\
1683     \hline
1684   \end{tabular}
1685   \caption{Uso dei collegamenti simbolici da parte di alcune funzioni.}
1686   \label{tab:file_symb_effect}
1687 \end{table}
1688
1689 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
1690   dallo standard POSIX.1-2001.}
1691
1692 Si noti che non si è specificato il comportamento delle funzioni che operano
1693 con i file descriptor (che tratteremo nel prossimo capitolo), in quanto la
1694 risoluzione del collegamento simbolico viene in genere effettuata dalla
1695 funzione che restituisce il file descriptor (normalmente la \func{open}, vedi
1696 sez.~\ref{sec:file_open_close}) e tutte le operazioni seguenti fanno
1697 riferimento solo a quest'ultimo.
1698
1699 Si tenga anche presente che a partire dal kernel 3.16, se si abilita la
1700 funzionalità dei \textit{protected symlinks} (attiva di default in tutte le
1701 distribuzioni più recenti) la risoluzione dei nomi attraverso un collegamento
1702 simbolico può fallire per una serie di restrizione di sicurezza aggiuntive
1703 imposte dal meccanismo (si consulti sez.~\ref{sec:procadv_security_misc} per i
1704 dettagli del meccanismo).
1705
1706 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
1707 \func{open} seguono i collegamenti simbolici, occorrono funzioni apposite per
1708 accedere alle informazioni del collegamento invece che a quelle del file a cui
1709 esso fa riferimento. Quando si vuole leggere il contenuto di un collegamento
1710 simbolico si usa la funzione di sistema \funcd{readlink}, il cui prototipo è:
1711
1712 \begin{funcproto}{
1713 \fhead{unistd.h}
1714 \fdecl{int readlink(const char *pathname, char *buff, size\_t size)}
1715 \fdesc{Legge il contenuto di un collegamento simbolico.}
1716 }
1717 {La funzione ritorna il numero di caratteri letti dentro \param{buff} in caso
1718   di successo e $-1$ per un errore,  nel qual caso \var{errno} assumerà uno
1719   dei valori:
1720   \begin{errlist}
1721   \item[\errcode{EACCES}] non si hanno i permessi di attraversamento di una
1722     delle directory del pathname
1723   \item[\errcode{EINVAL}] \param{pathname} non è un collegamento simbolico
1724     o \param{size} non è positiva.
1725   \end{errlist} ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
1726   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}
1727   nel loro significato generico.}
1728 \end{funcproto}
1729
1730 La funzione legge il \textit{pathname} a cui fa riferimento il collegamento
1731 simbolico indicato dall'argomento \param{pathname} scrivendolo sul buffer
1732 \param{buff} di dimensione \param{size}. Si tenga presente che la funzione non
1733 termina la stringa con un carattere nullo e che se questa è troppo lunga la
1734 tronca alla dimensione specificata da \param{size} per evitare di scrivere
1735 dati oltre le dimensioni del buffer.
1736
1737 \begin{figure}[htb]
1738   \centering
1739   \includegraphics[width=8cm]{img/link_loop}
1740   \caption{Esempio di loop nel filesystem creato con un collegamento
1741     simbolico.}
1742   \label{fig:file_link_loop}
1743 \end{figure}
1744
1745 Come accennato uno dei motivi per cui non sono consentiti \textit{hard link}
1746 alle directory è che questi possono creare dei \textit{loop} nella risoluzione
1747 dei nomi che non possono essere eliminati facilmente. Invece è sempre
1748 possibile, ed in genere anche molto utile, creare un collegamento simbolico ad
1749 una directory, anche se in questo caso si potranno ottenere anche dei
1750 \textit{loop}.
1751
1752 La situazione è illustrata in fig.~\ref{fig:file_link_loop}, che riporta la
1753 struttura della directory \file{/boot}. Come si vede si è creato al suo
1754 interno un collegamento simbolico che punta di nuovo a
1755 \file{/boot}.\footnote{il \textit{loop} mostrato in
1756   fig.~\ref{fig:file_link_loop} è stato usato per poter permettere a al
1757   \textit{bootloader} \cmd{grub} di vedere i file contenuti nella directory
1758   \file{/boot} con lo stesso \textit{pathname} con cui verrebbero visti dal
1759   sistema operativo, anche quando si trovano, come accade spesso, su una
1760   partizione separata (che \cmd{grub} all'avvio vedrebbe come \file{/}).} Un
1761 \textit{loop} di di questo tipo però può causare problemi per tutti i
1762 programmi che effettuano la scansione di una directory, e ad esempio se
1763 lanciassimo un comando come \code{grep -r linux *}, il \textit{loop} nella
1764 directory porterebbe ad esaminare \file{/boot}, \file{/boot/boot},
1765 \file{/boot/boot/boot} e così via.
1766
1767 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
1768 un \textit{pathname} possano essere seguiti fino ad un certo numero massimo di
1769 collegamenti simbolici, il cui valore limite è specificato dalla costante
1770 \constd{MAXSYMLINKS}. Se il limite viene superato si ha un errore ed
1771 \var{errno} viene impostata al valore \errcode{ELOOP}, che nella quasi
1772 totalità dei casi indica appunto che si è creato un collegamento simbolico che
1773 fa riferimento ad una directory del suo stesso \textit{pathname}.
1774
1775
1776 \itindend{symbolic~link}
1777 \index{collegamento!simbolico|)}
1778
1779 Un'altra funzione relativa alla gestione dei nomi dei file, anche se a prima
1780 vista parrebbe riguardare un argomento completamente diverso, è quella per la
1781 cancellazione di un file. In realtà una \textit{system call} che serva proprio
1782 a cancellare un file non esiste neanche perché, come accennato in
1783 sez.~\ref{sec:file_filesystem}, quando in un sistema unix-like si richiede la
1784 rimozione di un file, quello che si va a cancellare è soltanto la voce che
1785 referenzia il suo \textit{inode} all'interno di una directory.
1786
1787 La funzione di sistema che consente di effettuare questa operazione, il cui
1788 nome come si può notare ha poco a che fare con il concetto di rimozione, è
1789 \funcd{unlink}, ed il suo prototipo è:
1790
1791 \begin{funcproto}{
1792 \fhead{unistd.h}
1793 \fdecl{int unlink(const char *pathname)}
1794 \fdesc{Cancella un file.}
1795 }
1796 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1797   nel qual caso \var{errno} assumerà uno dei valori:\footnotemark
1798   \begin{errlist}
1799   \item[\errcode{EACCES}] non si ha il permesso di scrittura sulla directory
1800     che contiene \param{pathname} o quello di attraversamento per una delle
1801     directory superiori.
1802   \item[\errcode{EBUSY}] \param{pathname} non può essere rimosso perché è in
1803     uso da parte del sistema (in particolare per i cosiddetti \textit{silly
1804       renames} di NFS).
1805   \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una
1806     directory.
1807   \item[\errcode{EPERM}] il filesystem non consente l'operazione, o la
1808     directory che contiene \param{pathname} ha lo \textit{sticky bit} e non si
1809     è il proprietario del file o non si hanno privilegi amministrativi.
1810   \end{errlist} ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
1811   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EROFS} nel loro
1812   significato generico.}
1813 \end{funcproto}
1814
1815 \footnotetext{questa funzione su Linux ha alcune peculiarità nei codici di
1816   errore, in particolare riguardo la rimozione delle directory che non è mai
1817   permessa e che causa l'errore \errcode{EISDIR}; questo è un valore specifico
1818   di Linux non conforme allo standard POSIX che prescrive invece l'uso di
1819   \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
1820   abbia privilegi sufficienti, valore che invece Linux usa anche se il
1821   filesystem non supporta la funzione, inoltre il codice \errcode{EBUSY} nel
1822   caso la directory sia occupata su Linux non esiste.}
1823
1824 La funzione elimina il nome specificato dall'argomento \param{pathname} nella
1825 directory che lo contiene e decrementa il numero di riferimenti nel relativo
1826 \textit{inode}; come per \func{link} queste due operazioni sono effettuate
1827 all'interno della \textit{system call} in maniera atomica rispetto ai
1828 processi.
1829
1830 Si ricordi che, anche se se ne è rimosso il nome, un file viene realmente
1831 cancellato soltanto quando il numero di collegamenti mantenuto
1832 nell'\textit{inode} diventa nullo; solo allora l'\textit{inode} viene
1833 disallocato e lo spazio che il file occupava sul disco viene liberato.
1834
1835 Si tenga presente comunque che a questo si aggiunge sempre un'ulteriore
1836 condizione e cioè che non ci siano processi che stiano ancora lavorando sul il
1837 file. Come vedremo in sez.~\ref{sec:file_unix_interface} il kernel una tabella
1838 di tutti file aperti da ciascun processo, che a sua volta contiene i
1839 riferimenti agli \textit{inode} ad essi relativi. Prima di procedere alla
1840 cancellazione dello spazio occupato su disco dal contenuto di un file il
1841 kernel controlla anche questa tabella, per verificare che anche in essa non ci
1842 sia più nessun riferimento all'\textit{inode} in questione, assicurandosi con
1843 questo che nessun processo stia ancora usando il file.
1844
1845 Nel caso di socket, \textit{fifo} o file di dispositivo la funzione rimuove il
1846 nome, e come per i file normali i processi che hanno aperto uno di questi
1847 oggetti possono continuare ad utilizzarli.  Nel caso di cancellazione di un
1848 \textit{link} simbolico, che consiste solo nel rimando ad un altro file,
1849 questo viene immediatamente eliminato e non sarà più utilizzabile.
1850
1851 Per cancellare una voce in una directory è necessario avere il permesso di
1852 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
1853 il diritto di esecuzione/attraversamento sulla directory che la contiene
1854 (affronteremo in dettaglio l'argomento dei permessi di file e directory in
1855 sez.~\ref{sec:file_access_control}). Se inoltre per la directory è impostato
1856 lo \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}), occorrerà
1857 anche essere proprietari del file o proprietari della directory o avere i
1858 privilegi di amministratore.
1859
1860 Questa caratteristica del sistema, che consente di usare un file anche se lo
1861 si è ``cancellato'', può essere usata per essere sicuri di non lasciare file
1862 temporanei su disco in caso di uscita imprevista di un programma. La tecnica è
1863 quella di aprire un nuovo file e chiamare \func{unlink} su di esso subito
1864 dopo, in questo modo il contenuto del file sarà sempre disponibile all'interno
1865 del processo attraverso il suo file descriptor (vedi sez.~\ref{sec:file_fd}),
1866 ma non ne resterà traccia in nessuna directory, inoltre lo spazio occupato su
1867 disco verrà immediatamente rilasciato alla conclusione del processo, quando
1868 tutti i file vengono chiusi.
1869
1870 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
1871 la funzione \func{unlink} sulle directory, che in tal caso fallisce con un
1872 errore di \errcode{EISDIR}. Per cancellare una directory si deve usare la
1873 apposita funzione di sistema \func{rmdir} (che vedremo in
1874 sez.~\ref{sec:file_dir_creat_rem}), oppure la funzione \func{remove}.
1875
1876 Quest'ultima è la funzione prevista dallo standard ANSI C per effettuare una
1877 cancellazione generica di un file o di una directory e viene usata in generale
1878 anche per i sistemi operativi che non supportano gli \textit{hard link}. Nei
1879 sistemi unix-like \funcd{remove} è equivalente ad usare in maniera trasparente
1880 \func{unlink} per i file ed \func{rmdir} per le directory; il suo prototipo è:
1881
1882 \begin{funcproto}{
1883 \fhead{stdio.h}
1884 \fdecl{int remove(const char *pathname)}
1885 \fdesc{Cancella un file o una directory.}
1886 }
1887 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1888   caso \var{errno} assumerà uno dei valori relativi alla chiamata utilizzata,
1889   pertanto si può fare riferimento a quanto illustrato nelle descrizioni di
1890   \func{unlink} e \func{rmdir}.}
1891 \end{funcproto}
1892
1893 La funzione utilizza la funzione \func{unlink} per cancellare i file (e si
1894 applica anche a link simbolici, socket, \textit{fifo} e file di dispositivo) e
1895 la funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}) per
1896 cancellare le directory.\footnote{questo vale usando la \acr{glibc}; nella
1897   \acr{libc4} e nella \acr{libc5} la funzione \func{remove} era un semplice
1898   alias alla funzione \func{unlink} e quindi non poteva essere usata per le
1899   directory.}  Si tenga presente che, per alcune limitazioni del protocollo
1900 NFS, utilizzare questa funzione su file che usano questo filesystem di rete
1901 può comportare la scomparsa di file ancora in uso.
1902
1903 Infine per cambiare nome ad un file o a una directory si usa la funzione di
1904 sistema \funcd{rename},\footnote{la funzione è definita dallo standard ANSI C,
1905   ma si applica solo per i file, lo standard POSIX estende la funzione anche
1906   alle directory.} il cui prototipo è:
1907
1908 \begin{funcproto}{
1909 \fhead{stdio.h}
1910 \fdecl{int rename(const char *oldpath, const char *newpath)}
1911 \fdesc{Rinomina un file o una directory.}
1912 }
1913 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore,
1914   nel qual caso \var{errno} assumerà uno dei valori:
1915   \begin{errlist}
1916   \item[\errcode{EACCESS}] manca il permesso di scrittura sulle directory
1917     contenenti \param{oldpath} e \param{newpath} o di attraversare
1918     il loro \textit{pathname} o di scrivere su \param{newpath}
1919     se questa è una directory.
1920   \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
1921     parte di qualche processo (come directory di lavoro o come radice) o del
1922     sistema (come \textit{mount point}) ed il sistema non riesce a risolvere
1923     la situazione.
1924   \item[\errcode{EEXIST}] \param{newpath} è una directory già esistente e
1925     non è vuota (anche \errcode{ENOTEMPTY}).
1926   \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
1927     \param{oldpath} o più in generale si è cercato di creare una directory come
1928     sotto-directory di sé stessa.
1929   \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
1930     \param{oldpath} non è una directory.
1931   \item[\errcode{ENOTDIR}] uno dei componenti dei \textit{pathname} non è una
1932     directory o \param{oldpath} è una directory e
1933     \param{newpath} esiste e non è una directory.
1934   \item[\errval{EPERM}] la directory contenente \param{oldpath} o quella
1935     contenente un \param{newpath} esistente hanno lo \textit{sticky bit} e non
1936     si è i proprietari dei rispettivi file (o non si hanno privilegi
1937     amministrativi) oppure il filesystem non supporta l'operazione.
1938   \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
1939     stesso filesystem e sotto lo stesso \textit{mount point}.
1940   \end{errlist} ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{EMLINK},
1941   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOSPC} e
1942   \errval{EROFS} nel loro significato generico.}
1943 \end{funcproto}
1944
1945 La funzione rinomina in \param{newpath} il file o la directory indicati
1946 dall'argomento \param{oldpath}. Il nome viene eliminato nella directory
1947 originale e ricreato nella directory di destinazione mantenendo il riferimento
1948 allo stesso \textit{inode}. Non viene spostato nessun dato e l'\textit{inode}
1949 del file non subisce nessuna modifica in quanto le modifiche sono eseguite
1950 sulle directory che contengono \param{newpath} ed \param{oldpath}.
1951
1952 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
1953 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
1954 c'è modifica, per quanto temporanea, al \textit{link count} del file e non può
1955 esistere un istante in cui un altro processo possa trovare attivi entrambi i
1956 nomi per lo stesso file se la destinazione non esiste o in cui questa sparisca
1957 temporaneamente se già esiste.
1958
1959 Dato che opera in maniera analoga la funzione è soggetta alle stesse
1960 restrizioni di \func{link}, quindi è necessario che \param{oldpath}
1961 e \param{newpath} siano nello stesso filesystem e facciano riferimento allo
1962 stesso \textit{mount point}, e che il filesystem supporti questo tipo di
1963 operazione. Qualora questo non avvenga si dovrà effettuare l'operazione in
1964 maniera non atomica copiando il file a destinazione e poi cancellando
1965 l'originale.
1966
1967 Il comportamento della funzione è diverso a seconda che si voglia rinominare
1968 un file o una directory. Se ci riferisce ad un file allora \param{newpath}, se
1969 esiste, non deve essere una directory, altrimenti si avrà un errore di
1970 \errcode{EISDIR}. Se \param{newpath} indica un file già esistente questo verrà
1971 rimpiazzato atomicamente, ma nel caso in cui \func{rename} fallisca il kernel
1972 assicura che esso non sarà toccato. I caso di sovrascrittura però potrà
1973 esistere una breve finestra di tempo in cui sia \param{oldpath}
1974 che \param{newpath} potranno fare entrambi riferimento al file che viene
1975 rinominato.
1976
1977 Se \param{oldpath} è una directory allora \param{newpath}, se esistente, deve
1978 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
1979 (se non è una directory) o \errcode{ENOTEMPTY} o \errcode{EEXIST} (se non è
1980 vuota). Chiaramente \param{newpath} non potrà contenere \param{oldpath} nel
1981 suo \textit{pathname}, non essendo possibile rendere una directory una
1982 sottodirectory di sé stessa, se questo fosse il caso si otterrebbe un errore
1983 di \errcode{EINVAL}.
1984
1985 Se \param{oldpath} si riferisce ad un collegamento simbolico questo sarà
1986 rinominato restando tale senza nessun effetto sul file a cui fa riferimento.
1987 Se invece \param{newpath} esiste ed è un collegamento simbolico verrà
1988 cancellato come qualunque altro file.  Infine qualora \param{oldpath}
1989 e \param{newpath} siano due nomi che già fanno riferimento allo stesso file lo
1990 standard POSIX prevede che la funzione non ritorni un errore, e semplicemente
1991 non faccia nulla, lasciando entrambi i nomi.  Linux segue questo standard,
1992 anche se, come fatto notare dal manuale della \acr{glibc}, il comportamento
1993 più ragionevole sarebbe quello di cancellare \param{oldpath}.
1994
1995 In tutti i casi si dovranno avere i permessi di scrittura nelle directory
1996 contenenti \param{oldpath} e \param{newpath}, e nel caso \param{newpath} sia
1997 una directory vuota già esistente anche su di essa (perché dovrà essere
1998 aggiornata la voce ``\texttt{..}''). Se poi le directory
1999 contenenti \param{oldpath} o \param{newpath} hanno lo \textit{sticky bit}
2000 attivo (vedi sez.~\ref{sec:file_special_perm}) si dovrà essere i proprietari
2001 dei file (o delle directory) che si vogliono rinominare, o avere i permessi di
2002 amministratore.
2003
2004
2005 \subsection{La creazione e la cancellazione delle directory}
2006 \label{sec:file_dir_creat_rem}
2007
2008 Benché in sostanza le directory non siano altro che dei file contenenti
2009 elenchi di nomi con riferimenti ai rispettivi \textit{inode}, non è possibile
2010 trattarle come file ordinari e devono essere create direttamente dal kernel
2011 attraverso una opportuna \textit{system call}.\footnote{questo è quello che
2012   permette anche, attraverso l'uso del VFS, l'utilizzo di diversi formati per
2013   la gestione dei suddetti elenchi, dalle semplici liste a strutture complesse
2014   come alberi binari, hash, ecc. che consentono una ricerca veloce quando il
2015   numero di file è molto grande.}  La funzione di sistema usata per creare una
2016 directory è \funcd{mkdir}, ed il suo prototipo è:
2017
2018 \begin{funcproto}{
2019 \fhead{sys/stat.h}
2020 \fhead{sys/types.h}
2021 \fdecl{int mkdir(const char *dirname, mode\_t mode)}
2022 \fdesc{Crea una nuova directory.}
2023 }
2024 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2025   caso \var{errno} assumerà uno dei valori:
2026   \begin{errlist}
2027   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
2028     cui si vuole inserire la nuova directory o di attraversamento per le
2029     directory al di sopra di essa.
2030   \item[\errcode{EEXIST}] un file o una directory o un collegamento simbolico
2031     con quel nome esiste già.
2032   \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
2033     directory contiene troppi file; sotto Linux questo normalmente non avviene
2034     perché il filesystem standard consente la creazione di un numero di file
2035     maggiore di quelli che possono essere contenuti nel disco, ma potendo
2036     avere a che fare anche con filesystem di altri sistemi questo errore può
2037     presentarsi.
2038   \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
2039     la nuova directory o si è esaurita la quota disco dell'utente.
2040   \end{errlist}
2041   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
2042   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EPERM},
2043   \errval{EROFS} nel loro significato generico.}
2044 \end{funcproto}
2045
2046 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
2047 standard presenti in ogni directory (``\file{.}'' e ``\file{..}''), con il
2048 nome indicato dall'argomento \param{dirname}.
2049
2050 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
2051 directory viene creata sono specificati dall'argomento \param{mode}, i cui
2052 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
2053 tenga presente che questi sono modificati dalla maschera di creazione dei file
2054 (si veda sez.~\ref{sec:file_perm_management}).  La titolarità della nuova
2055 directory è impostata secondo quanto illustrato in
2056 sez.~\ref{sec:file_ownership_management}.
2057
2058 Come accennato in precedenza per eseguire la cancellazione di una directory è
2059 necessaria una specifica funzione di sistema, \funcd{rmdir}, il suo prototipo
2060 è:
2061
2062 \begin{funcproto}{
2063 \fhead{sys/stat.h}
2064 \fdecl{int rmdir(const char *dirname)}
2065 \fdesc{Cancella una directory.}
2066 }
2067 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2068   caso \var{errno} assumerà uno dei valori:
2069   \begin{errlist}
2070   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
2071     che contiene la directory che si vuole cancellare, o non c'è il permesso
2072     di attraversare (esecuzione) una delle directory specificate in
2073     \param{dirname}.
2074   \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o
2075     la radice di qualche processo o un \textit{mount point}.
2076   \item[\errcode{EINVAL}] si è usato ``\texttt{.}'' come ultimo componente
2077     di \param{dirname}.
2078   \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
2079     directory, oppure la directory che contiene \param{dirname} ha lo
2080     \textit{sticky bit} impostato e non si è i proprietari della directory o
2081     non si hanno privilegi amministrativi.
2082   \end{errlist}
2083   ed inoltre \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
2084   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, \errcode{ENOTEMPTY} e
2085   \errval{EROFS} nel loro significato generico.}
2086 \end{funcproto}
2087
2088
2089 La funzione cancella la directory \param{dirname}, che deve essere vuota, la
2090 directory deve cioè contenere le due voci standard ``\file{.}'' e
2091 ``\file{..}'' e niente altro.  Il nome può essere indicato con un
2092 \textit{pathname} assoluto o relativo, ma si deve fare riferimento al nome
2093 nella directory genitrice, questo significa che \textit{pathname} terminanti
2094 in ``\file{.}'' e ``\file{..}'' anche se validi in altri contesti, causeranno
2095 il fallimento della funzione.
2096
2097 Inoltre per eseguire la cancellazione, oltre ad essere vuota, occorre anche
2098 che la directory non sia utilizzata, questo vuol dire anche che non deve
2099 essere la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}) o la
2100 directory radice (vedi sez.~\ref{sec:file_chroot}) di nessun processo, od
2101 essere utilizzata come \textit{mount point}.
2102
2103 Se la directory cancellata risultasse aperta in qualche processo per una
2104 lettura dei suoi contenuti (vedi sez.~\ref{sec:file_dir_read}), pur
2105 scomparendo dal filesystem e non essendo più possibile accedervi o crearvi
2106 altri file, le risorse ad essa associate verrebbero disallocate solo alla
2107 chiusura di tutti questi ulteriori riferimenti.
2108
2109
2110 \subsection{Lettura e scansione delle directory}
2111 \label{sec:file_dir_read}
2112
2113 Benché le directory alla fine non siano altro che dei file che contengono
2114 delle liste di nomi associati ai relativi \textit{inode}, per il ruolo che
2115 rivestono nella struttura del sistema non possono essere trattate come dei
2116 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
2117 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
2118 può essere un processo a inserirvi direttamente delle voci con le usuali
2119 funzioni di scrittura.
2120
2121 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
2122 kernel, sono molte le situazioni in cui i processi necessitano di poterne
2123 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
2124 in sez.~\ref{sec:file_open_close} che è possibile aprire una directory come se
2125 fosse un file, anche se solo in sola lettura) in generale il formato con cui
2126 esse sono scritte può dipendere dal tipo di filesystem, tanto che, come
2127 riportato in tab.~\ref{tab:file_file_operations}, il VFS prevede una apposita
2128 funzione per la lettura delle directory.
2129
2130 \itindbeg{directory~stream}
2131
2132 Tutto questo si riflette nello standard POSIX\footnote{le funzioni erano
2133   presenti in SVr4 e 4.3BSD, la loro specifica è riportata in POSIX.1-2001.}
2134 che ha introdotto una apposita interfaccia per la lettura delle directory,
2135 basata sui cosiddetti \textit{directory stream}, chiamati così per l'analogia
2136 con i \textit{file stream} dell'interfaccia standard ANSI C che vedremo in
2137 sez.~\ref{sec:files_std_interface}. La prima funzione di questa interfaccia è
2138 \funcd{opendir}, il cui prototipo è:
2139
2140 \begin{funcproto}{
2141 \fhead{sys/types.h}
2142 \fhead{dirent.h}
2143 \fdecl{DIR *opendir(const char *dirname)}
2144 \fdesc{Apre un \textit{directory stream}.}
2145 }
2146 {La funzione ritorna un puntatore al \textit{directory stream} in caso di
2147   successo e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
2148   dei valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
2149   \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR} nel loro significato
2150   generico.}
2151 \end{funcproto}
2152
2153 La funzione apre un \textit{directory stream} per la directory
2154 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \typed{DIR} (che
2155 è il tipo opaco usato dalle librerie per gestire i \textit{directory stream})
2156 da usare per tutte le operazioni successive, la funzione inoltre posiziona lo
2157 \textit{stream} sulla prima voce contenuta nella directory.
2158
2159 Si tenga presente che comunque la funzione opera associando il
2160 \textit{directory stream} ad un opportuno file descriptor sottostante, sul
2161 quale vengono compiute le operazioni. Questo viene sempre aperto impostando il
2162 flag di \textit{close-on-exec} (si ricordi quanto detto in
2163 sez.~\ref{sec:proc_exec}), così da evitare che resti aperto in caso di
2164 esecuzione di un altro programma.
2165
2166 Nel caso in cui sia necessario conoscere il \textit{file descriptor} associato
2167 ad un \textit{directory stream} si può usare la funzione
2168 \funcd{dirfd},\footnote{questa funzione è una estensione introdotta con BSD
2169   4.3-Reno ed è presente in Linux con le libc5 (a partire dalla versione
2170   5.1.2) e con la \acr{glibc} ma non presente in POSIX fino alla revisione
2171   POSIX.1-2008, per questo per poterla utilizzare fino alla versione 2.10
2172   della \acr{glibc} era necessario definire le macro \macro{\_BSD\_SOURCE} o
2173   \macro{\_SVID\_SOURCE}, dalla versione 2.10 si possono usare anche
2174   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o
2175   \texttt{\macro{\_XOPEN\_SOURCE} >= 700}.}  il cui prototipo è:
2176
2177 \begin{funcproto}{
2178 \fhead{sys/types.h}
2179 \fhead{dirent.h}
2180 \fdecl{int dirfd(DIR *dir)}
2181 \fdesc{Legge il file descriptor associato ad un \textit{directory stream}.}
2182 }
2183 {La funzione ritorna un valore positivo corrispondente al file descriptor in
2184   caso di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà
2185   uno dei valori:
2186   \begin{errlist}
2187   \item[\errcode{EINVAL}] \param{dir} non è un puntatore ad un
2188     \textit{directory stream}.
2189   \item[\errcode{ENOTSUP}] l'implementazione non supporta l'uso di un file
2190     descriptor per la directory.
2191   \end{errlist}
2192 }
2193 \end{funcproto}
2194
2195 La funzione restituisce il file descriptor associato al \textit{directory
2196   stream} \param{dir}. Di solito si utilizza questa funzione in abbinamento a
2197 funzioni che operano sui file descriptor, ad esempio si potrà usare
2198 \func{fstat} per ottenere le proprietà della directory, o \func{fchdir} per
2199 spostare su di essa la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}).
2200
2201 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
2202 possibile associarvi un \textit{directory stream} con la funzione
2203 \funcd{fdopendir},\footnote{questa funzione è però disponibile solo a partire
2204   dalla versione 2.4 della \acr{glibc}, ed è stata introdotta nello standard
2205   POSIX solo a partire dalla revisione POSIX.1-2008, prima della versione 2.10
2206   della \acr{glibc} per poterla utilizzare era necessario definire la macro
2207   \macro{\_GNU\_SOURCE}, dalla versione 2.10 si possono usare anche
2208   \texttt{\macro{\_POSIX\_C\_SOURCE} >= 200809L} o \texttt{\_XOPEN\_SOURCE >=
2209     700} .}  il cui prototipo è:
2210
2211 \begin{funcproto}{
2212 \fhead{sys/types.h}
2213 \fhead{dirent.h}
2214 \fdecl{DIR *fdopendir(int fd)}
2215 \fdesc{Associa un \textit{directory stream} ad un file descriptor.}
2216 }
2217 {La funzione ritorna un puntatore al \textit{directory stream} in caso di
2218   successo e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
2219   dei valori \errval{EBADF} o \errval{ENOMEM} nel loro significato generico.}
2220 \end{funcproto}
2221
2222 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
2223   stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
2224 stato aperto in precedenza; la funzione darà un errore qualora questo non
2225 corrisponda ad una directory. L'uso di questa funzione permette di rispondere
2226 agli stessi requisiti delle funzioni ``\textit{at}'' che vedremo in
2227 sez.~\ref{sec:file_openat}.
2228
2229 Una volta utilizzata il file descriptor verrà usato internamente dalle
2230 funzioni che operano sul \textit{directory stream} e non dovrà essere più
2231 utilizzato all'interno del proprio programma. In particolare dovrà essere
2232 chiuso attraverso il \textit{directory stream} con \func{closedir} e non
2233 direttamente. Si tenga presente inoltre che \func{fdopendir} non modifica lo
2234 stato di un eventuale flag di \textit{close-on-exec}, che pertanto dovrà
2235 essere impostato esplicitamente in fase di apertura del file descriptor.
2236
2237 Una volta che si sia aperto un \textit{directory stream} la lettura del
2238 contenuto della directory viene effettuata attraverso la funzione
2239 \funcd{readdir}, il cui prototipo è:
2240
2241 \begin{funcproto}{
2242 \fhead{sys/types.h}
2243 \fhead{dirent.h}
2244 \fdecl{struct dirent *readdir(DIR *dir)}
2245 \fdesc{Legge una voce dal \textit{directory stream}.}
2246 }
2247 {La funzione ritorna il puntatore alla struttura contenente i dati in caso di
2248   successo e \val{NULL} per un errore o se si è raggiunta la fine dello
2249   \textit{stream}. Il solo codice di errore restituito in \var{errno} è
2250   \errval{EBADF} qualora \param{dir} non indichi un \textit{directory stream}
2251   valido.}
2252 \end{funcproto}
2253
2254 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
2255 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
2256 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
2257 esaurite tutte le voci in essa presenti, che viene segnalata dalla
2258 restituzione di \val{NULL} come valore di ritorno. Si può distinguere questa
2259 condizione da un errore in quanto in questo caso \var{errno} non verrebbe
2260 modificata.
2261
2262 I dati letti da \func{readdir} vengono memorizzati in una struttura
2263 \struct{dirent}, la cui definizione è riportata in
2264 fig.~\ref{fig:file_dirent_struct}.\footnote{la definizione è quella usata da
2265   Linux, che si trova nel file \file{/usr/include/bits/dirent.h}, essa non
2266   contempla la presenza del campo \var{d\_namlen} che indica la lunghezza del
2267   nome del file.} La funzione non è rientrante e restituisce il puntatore ad
2268 una struttura allocata staticamente, che viene sovrascritta tutte le volte che
2269 si ripete la lettura di una voce sullo stesso \textit{directory stream}.
2270
2271 Di questa funzione esiste anche una versione rientrante,
2272 \funcd{readdir\_r},\footnote{per usarla è necessario definire una qualunque
2273   delle macro \texttt{\macro{\_POSIX\_C\_SOURCE} >= 1},
2274   \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
2275   \macro{\_POSIX\_SOURCE}.} che non usa una struttura allocata staticamente, e
2276 può essere utilizzata anche con i \textit{thread}, il suo prototipo è:
2277
2278 \begin{funcproto}{
2279 \fhead{sys/types.h}
2280 \fhead{dirent.h}
2281 \fdecl{int readdir\_r(DIR *dir, struct dirent *entry, struct dirent **result)}
2282 \fdesc{Legge una voce dal \textit{directory stream}.}
2283 }
2284 {La funzione ritorna $0$ in caso di successo ed un numero positivo per un
2285   errore, nel qual caso \var{errno} assumerà gli stessi valori di
2286   \func{readdir}.}
2287 \end{funcproto}
2288
2289 La funzione restituisce in \param{result} come \textit{value result argument}
2290 l'indirizzo della struttura \struct{dirent} dove sono stati salvati i dati,
2291 che deve essere allocata dal chiamante, ed il cui indirizzo deve essere
2292 indicato con l'argomento \param{entry}.  Se si è raggiunta la fine del
2293 \textit{directory stream} invece in \param{result} viene restituito il valore
2294 \val{NULL}.
2295
2296 \begin{figure}[!htb]
2297   \footnotesize \centering
2298   \begin{minipage}[c]{0.8\textwidth}
2299     \includestruct{listati/dirent.c}
2300   \end{minipage}
2301   \normalsize
2302   \caption{La struttura \structd{dirent} per la lettura delle informazioni dei
2303     file.}
2304   \label{fig:file_dirent_struct}
2305 \end{figure}
2306
2307 % Lo spazio per la \struct{dirent} dove vengono restituiti i dati della
2308 % directory deve essere allocato a cura del chiamante, dato che la dimensione
2309
2310
2311 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
2312 presenti nella directory. Sia BSD che SVr4 che POSIX.1-2001\footnote{il
2313   vecchio standard POSIX prevedeva invece solo la presenza del campo
2314   \var{d\_fileno}, identico \var{d\_ino}, che in Linux era definito come alias
2315   di quest'ultimo, mentre il campo \var{d\_name} era considerato dipendente
2316   dall'implementazione.}  prevedono che siano sempre presenti il campo
2317 \var{d\_name}, che contiene il nome del file nella forma di una stringa
2318 terminata da uno zero, ed il campo \var{d\_ino}, che contiene il numero di
2319 \textit{inode} cui il file è associato e corrisponde al campo \var{st\_ino} di
2320 \struct{stat}.  La presenza di ulteriori campi opzionali oltre i due citati è
2321 segnalata dalla definizione di altrettante macro nella forma
2322 \code{\_DIRENT\_HAVE\_D\_XXX} dove \code{XXX} è il nome del relativo
2323 campo. Come si può evincere da fig.~\ref{fig:file_dirent_struct} nel caso di
2324 Linux sono pertanto definite le macro \macrod{\_DIRENT\_HAVE\_D\_TYPE},
2325 \macrod{\_DIRENT\_HAVE\_D\_OFF} e \macrod{\_DIRENT\_HAVE\_D\_RECLEN}, mentre non
2326 è definita la macro \macrod{\_DIRENT\_HAVE\_D\_NAMLEN}.
2327
2328 Dato che possono essere presenti campi opzionali e che lo standard
2329 POSIX.1-2001 non specifica una dimensione definita per il nome dei file (che
2330 può variare a seconda del filesystem), ma solo un limite superiore pari a
2331 \const{NAME\_MAX} (vedi tab.~\ref{tab:sys_file_macro}), in generale per
2332 allocare una struttura \struct{dirent} in maniera portabile occorre eseguire
2333 un calcolo per ottenere le dimensioni appropriate per il proprio
2334 sistema.\footnote{in SVr4 la lunghezza del campo è definita come
2335   \code{NAME\_MAX+1} che di norma porta al valore di 256 byte usato anche in
2336   fig.~\ref{fig:file_dirent_struct}.} Lo standard però richiede che il campo
2337 \var{d\_name} sia sempre l'ultimo della struttura, questo ci consente di
2338 ottenere la dimensione della prima parte con la macro di utilità generica
2339 \macro{offsetof}, che si può usare con il seguente prototipo:
2340
2341 {\centering
2342 \vspace{3pt}
2343 \begin{funcbox}{
2344 \fhead{stddef.h}
2345 \fdecl{size\_t \macrod{offsetof}(type, member)}
2346 \fdesc{Restituisce la posizione del campo \param{member} nella
2347   struttura \param{type}.}
2348 }
2349 \end{funcbox}
2350 }
2351
2352 Ottenuta allora con \code{offsetof(struct dirent, d\_name)} la dimensione
2353 della parte iniziale della struttura, basterà sommarci la dimensione massima
2354 dei nomi dei file nel filesystem che si sta usando, che si può ottenere
2355 attraverso la funzione \func{pathconf} (per la quale si rimanda a
2356 sez.~\ref{sec:sys_file_limits}) più un ulteriore carattere per la terminazione
2357 della stringa.
2358
2359 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
2360 indica il tipo di file (se \textit{fifo}, directory, collegamento simbolico,
2361 ecc.), e consente di evitare una successiva chiamata a \func{lstat} (vedi
2362 sez.~\ref{sec:file_stat}) per determinarlo. I suoi possibili valori sono
2363 riportati in tab.~\ref{tab:file_dtype_macro}. Si tenga presente che questo
2364 valore è disponibile solo per i filesystem che ne supportano la restituzione
2365 (fra questi i più noti sono \textsl{btrfs}, \textsl{ext2}, \textsl{ext3}, e
2366 \textsl{ext4}), per gli altri si otterrà sempre il valore
2367 \const{DT\_UNKNOWN}.\footnote{inoltre fino alla versione 2.1 della
2368   \acr{glibc}, pur essendo il campo \var{d\_type} presente, il suo uso non era
2369   implementato, e veniva restituito comunque il valore \const{DT\_UNKNOWN}.}
2370
2371 \begin{table}[htb]
2372   \centering
2373   \footnotesize
2374   \begin{tabular}[c]{|l|l|}
2375     \hline
2376     \textbf{Valore} & \textbf{Tipo di file} \\
2377     \hline
2378     \hline
2379     \constd{DT\_UNKNOWN} & Tipo sconosciuto.\\
2380     \constd{DT\_REG}     & File normale.\\
2381     \constd{DT\_DIR}     & Directory.\\
2382     \constd{DT\_LNK}     & Collegamento simbolico.\\
2383     \constd{DT\_FIFO}    & \textit{Fifo}.\\
2384     \constd{DT\_SOCK}    & Socket.\\
2385     \constd{DT\_CHR}     & Dispositivo a caratteri.\\
2386     \constd{DT\_BLK}     & Dispositivo a blocchi.\\
2387     \hline
2388   \end{tabular}
2389   \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
2390     della struttura \struct{dirent}.}
2391   \label{tab:file_dtype_macro}
2392 \end{table}
2393
2394 Per la conversione da e verso l'analogo valore mantenuto dentro il campo
2395 \var{st\_mode} di \struct{stat} (vedi fig.~\ref{fig:file_stat_struct}) sono
2396 definite anche due macro di conversione, \macro{IFTODT} e \macro{DTTOIF}:
2397
2398 {\centering
2399 \vspace{3pt}
2400 \begin{funcbox}{
2401 \fhead{dirent.h}
2402 \fdecl{int \macrod{IFTODT}(mode\_t MODE)}
2403 \fdesc{Converte il tipo di file dal formato di \var{st\_mode} a quello di
2404   \var{d\_type}.}
2405 \fdecl{mode\_t \macrod{DTTOIF}(int DTYPE)}
2406 \fdesc{Converte il tipo di file dal formato di \var{d\_type} a quello di
2407   \var{st\_mode}.}
2408 }
2409 \end{funcbox}
2410 }
2411
2412 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
2413 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
2414 letta. Con questi due campi diventa possibile, determinando la posizione delle
2415 varie voci, spostarsi all'interno dello \textit{stream} usando la funzione
2416 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
2417   estensioni prese da BSD, ed introdotte nello standard POSIX solo a partire
2418   dalla revisione POSIX.1-2001, per poterle utilizzare deve essere definita
2419   una delle macro \macro{\_XOPEN\_SOURCE}, \macro{\_BSD\_SOURCE} o
2420   \macro{\_SVID\_SOURCE}.} il cui prototipo è:
2421
2422 \begin{funcproto}{
2423 \fhead{dirent.h}
2424 \fdecl{void seekdir(DIR *dir, off\_t offset)}
2425 \fdesc{Cambia la posizione all'interno di un \textit{directory stream}.}
2426 }
2427 {La funzione non ritorna niente e non imposta errori.}
2428 \end{funcproto}
2429
2430 La funzione non ritorna nulla e non segnala errori, è però necessario che il
2431 valore dell'argomento \param{offset} sia valido per lo
2432 \textit{stream} \param{dir}; esso pertanto deve essere stato ottenuto o dal
2433 valore di \var{d\_off} di \struct{dirent} o dal valore restituito dalla
2434 funzione \funcd{telldir}, che legge la posizione corrente; il cui prototipo
2435 è:\footnote{prima della \acr{glibc} 2.1.1 la funzione restituiva un valore di
2436   tipo \type{off\_t}, sostituito a partire dalla versione 2.1.2 da \ctyp{long}
2437   per conformità a POSIX.1-2001.}
2438
2439 \begin{funcproto}{
2440 \fhead{dirent.h}
2441 \fdecl{long telldir(DIR *dir)}
2442 \fdesc{Ritorna la posizione corrente in un \textit{directory stream}.}
2443 }
2444 {La funzione ritorna la posizione corrente nello \textit{stream} (un numero
2445   positivo) in caso di successo e $-1$ per un errore, nel qual caso
2446   \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
2447   valore errato per \param{dir}.  }
2448 \end{funcproto}
2449
2450 La sola funzione di posizionamento per un \textit{directory stream} prevista
2451 originariamente dallo standard POSIX è \funcd{rewinddir}, che riporta la
2452 posizione a quella iniziale; il suo prototipo è:
2453
2454 \begin{funcproto}{
2455 \fhead{sys/types.h}
2456 \fhead{dirent.h}
2457 \fdecl{void rewinddir(DIR *dir)}
2458 \fdesc{Si posiziona all'inizio di un \textit{directory stream}.}
2459 }
2460 {La funzione non ritorna niente e non imposta errori.}
2461 \end{funcproto}
2462
2463 Una volta completate le operazioni si può chiudere il \textit{directory
2464   stream}, ed il file descriptor ad esso associato, con la funzione
2465 \funcd{closedir}, il cui prototipo è:
2466
2467 \begin{funcproto}{
2468 \fhead{sys/types.h}
2469 \fhead{dirent.h}
2470 \fdecl{int closedir(DIR *dir)}
2471 \fdesc{Chiude un \textit{directory stream}.}
2472 }
2473 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2474   caso \var{errno} assume solo il valore \errval{EBADF}.}
2475 \end{funcproto}
2476
2477 A parte queste funzioni di base in BSD 4.3 venne introdotta un'altra funzione
2478 che permette di eseguire una scansione completa, con tanto di ricerca ed
2479 ordinamento, del contenuto di una directory; la funzione è
2480 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
2481   \acr{libc4} e richiede siano definite le macro \macro{\_BSD\_SOURCE} o
2482   \macro{\_SVID\_SOURCE}.} ed il suo prototipo è:
2483
2484 \begin{funcproto}{
2485 \fhead{dirent.h}
2486 \fdecl{int scandir(const char *dir, struct dirent ***namelist, \\
2487 \phantom{int scandir(}int(*filter)(const struct dirent *), \\
2488 \phantom{int scandir(}int(*compar)(const struct dirent **, const struct dirent **))}
2489 \fdesc{Esegue una scansione di un \textit{directory stream}.}
2490 }
2491 {La funzione ritorna il numero di voci trovate in caso di successo e $-1$ per
2492   un errore, nel qual caso \var{errno} può assumere solo il valore
2493   \errval{ENOMEM}.}
2494 \end{funcproto}
2495
2496 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
2497 prototipo non è molto comprensibile; queste funzioni però sono quelle che
2498 controllano rispettivamente la selezione di una voce, passata con
2499 l'argomento \param{filter}, e l'ordinamento di tutte le voci selezionate,
2500 specificata dell'argomento \param{compar}.
2501
2502 La funzione legge tutte le voci della directory indicata dall'argomento
2503 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
2504 \struct{dirent}) come argomento della funzione di selezione specificata da
2505 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
2506 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
2507 Qualora si specifichi un valore \val{NULL} per l'argomento \param{filter} non
2508 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
2509
2510 Le voci selezionate possono essere riordinate tramite \funcm{qsort}, le
2511 modalità del riordinamento possono essere personalizzate usando la funzione
2512 \param{compar} come criterio di ordinamento di \funcm{qsort}, la funzione
2513 prende come argomenti le due strutture \struct{dirent} da confrontare
2514 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
2515 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
2516 \struct{dirent} viene restituito nell'argomento
2517 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
2518   restituisce, come \textit{value result argument}, l'indirizzo della stessa;
2519   questo significa che \param{namelist} deve essere dichiarato come
2520   \code{struct dirent **namelist} ed alla funzione si deve passare il suo
2521   indirizzo.}
2522
2523 \itindend{directory~stream}
2524
2525 Per l'ordinamento, vale a dire come valori possibili per l'argomento
2526 \param{compar}, sono disponibili due funzioni predefinite, \funcd{alphasort} e
2527 \funcd{versionsort}, i cui prototipi sono:
2528
2529 \begin{funcproto}{
2530 \fhead{dirent.h}
2531 \fdecl{int alphasort(const void *a, const void *b)}
2532 \fdecl{int versionsort(const void *a, const void *b)}
2533 \fdesc{Riordinano le voci di \textit{directory stream}.}
2534 }
2535 {Le funzioni restituiscono un valore minore, uguale o maggiore di zero qualora
2536   il primo argomento sia rispettivamente minore, uguale o maggiore del secondo
2537   e non forniscono errori.}
2538 \end{funcproto}
2539
2540 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
2541 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
2542   argomenti dei puntatori a delle strutture \struct{dirent}; la glibc usa il
2543   prototipo originario di BSD, mostrato anche nella definizione, che prevede
2544   puntatori a \ctyp{void}.} e deve essere specificata come argomento
2545 \param{compar} per ottenere un ordinamento alfabetico secondo il valore del
2546 campo \var{d\_name} delle varie voci. La \acr{glibc} prevede come
2547 estensione\footnote{la \acr{glibc}, a partire dalla versione 2.1, effettua
2548   anche l'ordinamento alfabetico tenendo conto delle varie localizzazioni,
2549   usando \funcm{strcoll} al posto di \funcm{strcmp}.} anche
2550 \func{versionsort}, che ordina i nomi tenendo conto del numero di versione,
2551 cioè qualcosa per cui \texttt{file10} viene comunque dopo \texttt{file4}.
2552
2553 \begin{figure}[!htb]
2554   \footnotesize \centering
2555   \begin{minipage}[c]{\codesamplewidth}
2556     \includecodesample{listati/my_ls.c}
2557   \end{minipage}
2558   \caption{Esempio di codice per eseguire la lista dei file contenuti in una
2559     directory.}
2560   \label{fig:file_my_ls}
2561 \end{figure}
2562
2563 Un semplice esempio dell'uso di queste funzioni è riportato in
2564 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
2565 programma che, usando la funzione di scansione illustrata in
2566 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
2567 e la relativa dimensione, in sostanza una versione semplificata del comando
2568 \cmd{ls}.
2569
2570 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
2571 la parte di gestione delle opzioni, che prevede solo l'uso di una funzione per
2572 la stampa della sintassi, anch'essa omessa, ma il codice completo può essere
2573 trovato coi sorgenti allegati alla guida nel file \file{myls.c}.
2574
2575 In sostanza tutto quello che fa il programma, dopo aver controllato
2576 (\texttt{\small 12-15}) di avere almeno un argomento, che indicherà la
2577 directory da esaminare, è chiamare (\texttt{\small 16}) la funzione
2578 \myfunc{dir\_scan} per eseguire la scansione, usando la funzione \code{do\_ls}
2579 (\texttt{\small 22-29}) per fare tutto il lavoro.
2580
2581 Quest'ultima si limita (\texttt{\small 26}) a chiamare \func{stat} sul file
2582 indicato dalla directory entry passata come argomento (il cui nome è appunto
2583 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
2584 dati ad esso relativi, per poi provvedere (\texttt{\small 27}) a stampare il
2585 nome del file e la dimensione riportata in \var{data}.
2586
2587 Dato che la funzione verrà chiamata all'interno di \myfunc{dir\_scan} per ogni
2588 voce presente, questo è sufficiente a stampare la lista completa dei file e
2589 delle relative dimensioni. Si noti infine come si restituisca sempre 0 come
2590 valore di ritorno per indicare una esecuzione senza errori.
2591
2592 \begin{figure}[!htb]
2593   \footnotesize \centering
2594   \begin{minipage}[c]{\codesamplewidth}
2595     \includecodesample{listati/dir_scan.c}
2596   \end{minipage}
2597   \caption{Codice della funzione di scansione di una directory contenuta nel
2598     file \file{dir\_scan.c}.}
2599   \label{fig:file_dirscan}
2600 \end{figure}
2601
2602 Tutto il grosso del lavoro è svolto dalla funzione \myfunc{dir\_scan},
2603 riportata in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e
2604 permette di eseguire una funzione, passata come secondo argomento, su tutte le
2605 voci di una directory.  La funzione inizia con l'aprire (\texttt{\small
2606   18-22}) uno \textit{stream} sulla directory passata come primo argomento,
2607 stampando un messaggio in caso di errore.
2608
2609 Il passo successivo (\texttt{\small 23-24}) è cambiare directory di lavoro
2610 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzioni
2611 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
2612 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
2613 (\texttt{\small 26-30}) sulle singole voci dello \textit{stream} ci si trovi
2614 all'interno della directory.\footnote{questo è essenziale al funzionamento
2615   della funzione \code{do\_ls}, e ad ogni funzione che debba usare il campo
2616   \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
2617   struttura \struct{dirent} sono sempre relativi alla directory in questione,
2618   e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
2619   ottenere le dimensioni.}
2620
2621 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
2622 alla funzione passata come secondo argomento, il ciclo di scansione della
2623 directory è molto semplice; si legge una voce alla volta (\texttt{\small 26})
2624 all'interno di una istruzione di \code{while} e fintanto che si riceve una
2625 voce valida, cioè un puntatore diverso da \val{NULL}, si esegue
2626 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
2627 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
2628   28}) qualora questa presenti una anomalia, identificata da un codice di
2629 ritorno negativo. Una volta terminato il ciclo la funzione si conclude con la
2630 chiusura (\texttt{\small 31}) dello \textit{stream}\footnote{nel nostro caso,
2631   uscendo subito dopo la chiamata, questo non servirebbe, in generale però
2632   l'operazione è necessaria, dato che la funzione può essere invocata molte
2633   volte all'interno dello stesso processo, per cui non chiudere i
2634   \textit{directory stream} comporterebbe un consumo progressivo di risorse,
2635   con conseguente rischio di esaurimento delle stesse.} e la restituzione
2636 (\texttt{\small 32}) del codice di operazioni concluse con successo.
2637
2638
2639
2640 \subsection{La directory di lavoro}
2641 \label{sec:file_work_dir}
2642
2643 \index{directory~di~lavoro|(}
2644
2645 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
2646 directory nell'albero dei file,\footnote{questa viene mantenuta all'interno
2647   dei dati della sua \kstruct{task\_struct} (vedi
2648   fig.~\ref{fig:proc_task_struct}), più precisamente nel campo \texttt{pwd}
2649   della sotto-struttura \kstruct{fs\_struct}.} che è chiamata
2650 \textsl{directory corrente} o \textsl{directory di lavoro} (in inglese
2651 \textit{current working directory}).  La directory di lavoro è quella da cui
2652 si parte quando un \textit{pathname} è espresso in forma relativa, dove il
2653 ``\textsl{relativa}'' fa riferimento appunto a questa directory.
2654
2655 Quando un utente effettua il login, questa directory viene impostata alla
2656 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
2657 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
2658 comando \cmd{pwd} la stampa sul terminale.  Siccome la directory di lavoro
2659 resta la stessa quando viene creato un processo figlio (vedi
2660 sez.~\ref{sec:proc_fork}), la directory di lavoro della shell diventa anche la
2661 directory di lavoro di qualunque comando da essa lanciato.
2662
2663 Dato che è il kernel che tiene traccia per ciascun processo
2664 dell'\textit{inode} della directory di lavoro, per ottenerne il
2665 \textit{pathname} occorre usare una apposita funzione,
2666 \funcd{getcwd},\footnote{con Linux \func{getcwd} è una \textit{system call}
2667   dalla versione 2.1.9, in precedenza il valore doveva essere ottenuto tramite
2668   il filesystem \texttt{/proc} da \procfile{/proc/self/cwd}.} il cui prototipo
2669 è:
2670
2671 \begin{funcproto}{
2672 \fhead{unistd.h}
2673 \fdecl{char *getcwd(char *buffer, size\_t size)}
2674 \fdesc{Legge il \textit{pathname} della directory di lavoro corrente.}
2675 }
2676 {La funzione ritorna il puntatore a \param{buffer} in caso di successo e
2677   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2678   \begin{errlist}
2679   \item[\errcode{EACCES}] manca il permesso di lettura o di attraversamento  su
2680     uno dei componenti del \textit{pathname} (cioè su una delle directory
2681     superiori alla corrente).
2682   \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
2683     è nullo.
2684   \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata.
2685   \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
2686     lunghezza del \textit{pathname}.
2687   \end{errlist}
2688   ed inoltre \errcode{EFAULT} nel suo significato generico.}
2689 \end{funcproto}
2690
2691 La funzione restituisce il \textit{pathname} completo della directory di
2692 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
2693 precedentemente allocata, per una dimensione massima di \param{size}.  Il
2694 buffer deve essere sufficientemente largo da poter contenere il
2695 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
2696 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
2697 un errore.
2698
2699 Si può anche specificare un puntatore nullo come
2700 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
2701   supportata da Linux e dalla \acr{glibc}.} nel qual caso la stringa sarà
2702 allocata automaticamente per una dimensione pari a \param{size} qualora questa
2703 sia diversa da zero, o della lunghezza esatta del \textit{pathname}
2704 altrimenti. In questo caso ci si deve ricordare di disallocare la stringa con
2705 \func{free} una volta cessato il suo utilizzo.
2706
2707 Un uso comune di \func{getcwd} è quello di salvarsi la directory di lavoro
2708 all'avvio del programma per poi potervi tornare in un tempo successivo, un
2709 metodo alternativo più veloce, se non si è a corto di file descriptor, è
2710 invece quello di aprire all'inizio la directory corrente (vale a dire
2711 ``\texttt{.}'') e tornarvi in seguito con \func{fchdir}.
2712
2713 Di questa funzione esiste una versione alternativa per compatibilità
2714 all'indietro con BSD, \funcm{getwd}, che non prevede l'argomento \param{size}
2715 e quindi non consente di specificare la dimensione di \param{buffer} che
2716 dovrebbe essere allocato in precedenza ed avere una dimensione sufficiente
2717 (per BSD maggiore \const{PATH\_MAX}, che di solito 256 byte, vedi
2718 sez.~\ref{sec:sys_limits}). Il problema è che su Linux non esiste una
2719 dimensione superiore per la lunghezza di un \textit{pathname}, per cui non è
2720 detto che il buffer sia sufficiente a contenere il nome del file, e questa è
2721 la ragione principale per cui questa funzione è deprecata, e non la tratteremo.
2722
2723 Una seconda funzione usata per ottenere la directory di lavoro è
2724 \funcm{get\_current\_dir\_name},\footnote{la funzione è una estensione GNU e
2725   presente solo nella \acr{glibc}.} che non prende nessun argomento ed è
2726 sostanzialmente equivalente ad una \code{getcwd(NULL, 0)}, con la differenza
2727 che se disponibile essa ritorna il valore della variabile di ambiente
2728 \envvar{PWD}, che essendo costruita dalla shell può contenere un
2729 \textit{pathname} comprendente anche dei collegamenti simbolici. Usando
2730 \func{getcwd} infatti, essendo il \textit{pathname} ricavato risalendo
2731 all'indietro l'albero della directory, si perderebbe traccia di ogni passaggio
2732 attraverso eventuali collegamenti simbolici.
2733
2734 Per cambiare la directory di lavoro si può usare la funzione di sistema
2735 \funcd{chdir}, equivalente del comando di shell \cmd{cd}, il cui nome sta
2736 appunto per \textit{change directory}, il suo prototipo è:
2737
2738 \begin{funcproto}{
2739 \fhead{unistd.h}
2740 \fdecl{int chdir(const char *pathname)}
2741 \fdesc{Cambia la directory di lavoro per \textit{pathname}.}
2742 }
2743 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2744   caso \var{errno} assumerà uno dei valori:
2745   \begin{errlist}
2746   \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
2747     di \param{pathname}.
2748   \item[\errcode{ENOTDIR}] non si è specificata una directory.
2749   \end{errlist}
2750   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
2751   \errval{ENAMETOOLONG}, \errval{ENOENT} e \errval{ENOMEM} nel loro
2752   significato generico.}
2753 \end{funcproto}
2754
2755 La funzione cambia la directory di lavoro in \param{pathname} ed
2756 ovviamente \param{pathname} deve indicare una directory per la quale si hanno
2757 i permessi di accesso.
2758
2759 Dato che ci si può riferire ad una directory anche tramite un file descriptor,
2760 per cambiare directory di lavoro è disponibile anche la funzione di sistema
2761 \funcd{fchdir}, il cui prototipo è:
2762
2763 \begin{funcproto}{
2764 \fhead{unistd.h}
2765 \fdecl{int fchdir(int fd)}
2766 \fdesc{Cambia la directory di lavoro per file descriptor.}
2767 }
2768 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2769   caso \var{errno} assumerà i valori \errval{EBADF} o \errval{EACCES} nel loro
2770   significato generico.}
2771 \end{funcproto}
2772
2773 La funzione è identica a \func{chdir}, ma prende come argomento un file
2774 descriptor \param{fd} invece di un \textit{pathname}. Anche in questo
2775 caso \param{fd} deve essere un file descriptor valido che fa riferimento ad
2776 una directory. Inoltre l'unico errore di accesso possibile (tutti gli altri
2777 sarebbero occorsi all'apertura di \param{fd}), è quello in cui il processo non
2778 ha il permesso di attraversamento alla directory specificata da \param{fd}.
2779
2780 \index{directory~di~lavoro|)}
2781
2782
2783 \subsection{La creazione dei \textsl{file speciali}}
2784 \label{sec:file_mknod}
2785
2786 \index{file!di~dispositivo|(}
2787 \index{file!speciali|(}
2788
2789 Finora abbiamo parlato esclusivamente di file, directory e collegamenti
2790 simbolici, ma in sez.~\ref{sec:file_file_types} abbiamo visto che il sistema
2791 prevede anche degli altri tipi di file, che in genere vanno sotto il nome
2792 generico di \textsl{file speciali}, come i file di dispositivo, le \textit{fifo} ed i
2793 socket.
2794
2795 La manipolazione delle caratteristiche di questi file speciali, il cambiamento
2796 di nome o la loro cancellazione può essere effettuata con le stesse funzioni
2797 che operano sugli altri file, ma quando li si devono creare sono necessarie,
2798 come per le directory, delle funzioni apposite. La prima di queste è la
2799 funzione di sistema \funcd{mknod}, il cui prototipo è:
2800
2801 \begin{funcproto}{
2802 \fhead{sys/types.h}
2803 \fhead{sys/stat.h}
2804 \fhead{fcntl.h}
2805 \fhead{unistd.h}
2806 \fdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)}
2807 \fdesc{Crea un file speciale sul filesystem.}
2808 }
2809 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2810   caso \var{errno} assumerà uno dei valori:
2811   \begin{errlist}
2812   \item[\errcode{EEXIST}] \param{pathname} esiste già o è un collegamento
2813     simbolico.
2814   \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
2815     \textit{fifo}, un socket o un dispositivo.
2816   \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
2817     l'\texttt{inode}, o il filesystem su cui si è cercato di
2818     creare \param{pathname} non supporta l'operazione.
2819   \end{errlist}
2820   ed inoltre \errval{EACCES}, \errval{EFAULT}, \errval{ELOOP},
2821   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOSPC},
2822   \errval{ENOTDIR} e \errval{EROFS} nel loro significato generico.}
2823 \end{funcproto}
2824
2825 La funzione permette di creare un \textit{inode} di tipo generico sul
2826 filesystem, e viene in genere utilizzata per creare i file di dispositivo, ma
2827 si può usare anche per creare qualunque tipo di file speciale ed anche file
2828 regolari. L'argomento \param{mode} specifica sia il tipo di file che si vuole
2829 creare che i relativi permessi, secondo i valori riportati in
2830 tab.~\ref{tab:file_mode_flags}, che vanno combinati con un OR aritmetico. I
2831 permessi sono comunque modificati nella maniera usuale dal valore di
2832 \textit{umask} (si veda sez.~\ref{sec:file_perm_management}).
2833
2834 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
2835 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
2836 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
2837 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
2838 per una \textit{fifo};\footnote{con Linux la funzione non può essere usata per
2839   creare directory o collegamenti simbolici, si dovranno usare le funzioni
2840   \func{mkdir} e \func{symlink} a questo dedicate.} un valore diverso
2841 comporterà l'errore \errcode{EINVAL}. Inoltre \param{pathname} non deve
2842 esistere, neanche come collegamento simbolico.
2843
2844 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
2845 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
2846 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
2847 valore verrà ignorato.  Solo l'amministratore può creare un file di
2848 dispositivo usando questa funzione (il processo deve avere la capacità
2849 \const{CAP\_MKNOD}), ma in Linux\footnote{questo è un comportamento specifico
2850   di Linux, la funzione non è prevista dallo standard POSIX.1 originale,
2851   mentre è presente in SVr4 e 4.4BSD, ma esistono differenze nei comportamenti
2852   e nei codici di errore, tanto che questa è stata introdotta in POSIX.1-2001
2853   con una nota che la definisce portabile solo quando viene usata per creare
2854   delle \textit{fifo}, ma comunque deprecata essendo utilizzabile a tale scopo
2855   la specifica \func{mkfifo}.} l'uso per la creazione di un file ordinario, di
2856 una \textit{fifo} o di un socket è consentito anche agli utenti normali.
2857
2858 I nuovi \textit{inode} creati con \func{mknod} apparterranno al proprietario e
2859 al gruppo del processo (usando \ids{UID} e \ids{GID} del gruppo effettivo) che
2860 li ha creati a meno non sia presente il bit \acr{sgid} per la directory o sia
2861 stata attivata la semantica BSD per il filesystem (si veda
2862 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
2863 l'\textit{inode}, nel qual caso per il gruppo verrà usato il \ids{GID} del
2864 proprietario della directory.
2865
2866 \itindbeg{major~number}
2867 \itindbeg{minor~number}
2868
2869 Nella creazione di un file di dispositivo occorre poi specificare
2870 correttamente il valore di \param{dev}; questo infatti è di tipo
2871 \type{dev\_t}, che è un tipo primitivo (vedi
2872 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
2873 \textsl{numero} di dispositivo. Il kernel infatti identifica ciascun
2874 dispositivo con un valore numerico, originariamente questo era un intero a 16
2875 bit diviso in due parti di 8 bit chiamate rispettivamente \textit{major
2876   number} e \textit{minor number}, che sono poi i due numeri mostrati dal
2877 comando \texttt{ls -l} al posto della dimensione quando lo si esegue su un
2878 file di dispositivo.
2879
2880 Il \textit{major number} identifica una classe di dispositivi (ad esempio la
2881 seriale, o i dischi IDE) e serve in sostanza per indicare al kernel quale è il
2882 modulo che gestisce quella classe di dispositivi. Per identificare uno
2883 specifico dispositivo di quella classe (ad esempio una singola porta seriale,
2884 o uno dei dischi presenti) si usa invece il \textit{minor number}. L'elenco
2885 aggiornato di questi numeri con le relative corrispondenze ai vari dispositivi
2886 può essere trovato nel file \texttt{Documentation/devices.txt} allegato alla
2887 documentazione dei sorgenti del kernel.
2888
2889 Data la crescita nel numero di dispositivi supportati, ben presto il limite
2890 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
2891 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
2892 \type{dev\_t}, con delle dimensioni passate a 12 bit per il \textit{major
2893   number} e 20 bit per il \textit{minor number}. La transizione però ha
2894 comportato il fatto che \type{dev\_t} è diventato un tipo opaco, e la
2895 necessità di specificare il numero tramite delle opportune macro, così da non
2896 avere problemi di compatibilità con eventuali ulteriori estensioni.
2897
2898 Le macro sono definite nel file \headfiled{sys/sysmacros.h},\footnote{se si
2899   usa la \acr{glibc} dalla versione 2.3.3 queste macro sono degli alias alle
2900   versioni specifiche di questa libreria, \macrod{gnu\_dev\_major},
2901   \macrod{gnu\_dev\_minor} e \macrod{gnu\_dev\_makedev} che si possono usare
2902   direttamente, al costo di una minore portabilità.} che viene automaticamente
2903 incluso quando si include \headfile{sys/types.h}. Si possono pertanto ottenere
2904 i valori del \textit{major number} e \textit{minor number} di un dispositivo
2905 rispettivamente con le macro \macro{major} e \macro{minor}:
2906
2907 {\centering
2908 \vspace{3pt}
2909 \begin{funcbox}{
2910 \fhead{sys/types.h}
2911 \fdecl{int \macrod{major}(dev\_t dev)}
2912 \fdesc{Restituisce il \textit{major number} del dispositivo \param{dev}.}
2913 \fdecl{int \macrod{minor}(dev\_t dev)}
2914 \fdesc{Restituisce il \textit{minor number} del dispositivo \param{dev}.}
2915 }
2916 \end{funcbox}
2917 }
2918
2919 \noindent mentre una volta che siano noti \textit{major number} e
2920 \textit{minor number} si potrà costruire il relativo identificativo con la
2921 macro \macro{makedev}:
2922
2923 {\centering
2924 \vspace{3pt}
2925 \begin{funcbox}{
2926 \fhead{sys/types.h}
2927 \fdecl{dev\_t \macrod{makedev}(int major, int minor)}
2928 \fdesc{Dati \textit{major number} e \textit{minor number} restituisce
2929   l'identificativo di un dispositivo.}
2930 }
2931 \end{funcbox}
2932 }
2933
2934
2935 \itindend{major~number}
2936 \itindend{minor~number}
2937 \index{file!di~dispositivo|)}
2938
2939 Dato che la funzione di sistema \func{mknod} presenta diverse varianti nei
2940 vari sistemi unix-like, lo standard POSIX.1-2001 la dichiara portabile solo in
2941 caso di creazione delle \textit{fifo}, ma anche in questo caso alcune
2942 combinazioni degli argomenti restano non specificate, per cui nello stesso
2943 standard è stata introdotta una funzione specifica per creare una
2944 \textit{fifo} deprecando l'uso di \func{mknod} a tale riguardo.  La funzione è
2945 \funcd{mkfifo} ed il suo prototipo è:
2946
2947 \begin{funcproto}{
2948 \fhead{sys/types.h}
2949 \fhead{sys/stat.h}
2950 \fdecl{int mkfifo(const char *pathname, mode\_t mode)}
2951 \fdesc{Crea una \textit{fifo}.}
2952 }
2953 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2954   caso \var{errno} assumerà \errval{EACCES}, \errval{EEXIST},
2955   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC}, \errval{ENOTDIR} e
2956   \errval{EROFS} nel loro significato generico.}
2957 \end{funcproto}
2958
2959 La funzione crea la \textit{fifo} \param{pathname} con i
2960 permessi \param{mode}. Come per \func{mknod} il file \param{pathname} non deve
2961 esistere (neanche come collegamento simbolico); al solito i permessi
2962 specificati da \param{mode} vengono modificati dal valore di \textit{umask}
2963 (vedi sez.~\ref{sec:file_perm_management}).
2964
2965 \index{file!speciali|)}
2966
2967
2968 \subsection{I file temporanei}
2969 \label{sec:file_temp_file}
2970
2971 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
2972 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
2973 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
2974 creare il file dopo aver controllato che questo non esista, nel momento fra il
2975 controllo e la creazione si ha giusto lo spazio per una possibile \textit{race
2976   condition} (si ricordi quanto visto in sez.~\ref{sec:proc_race_cond}).
2977
2978 \itindbeg{symlink~attack}
2979
2980 Molti problemi di sicurezza derivano proprio da una creazione non accorta di
2981 file temporanei che lascia aperta questa \textit{race condition}. Un
2982 attaccante allora potrà sfruttarla con quello che viene chiamato
2983 ``\textit{symlink attack}'' dove nell'intervallo fra la generazione di un nome
2984 e l'accesso allo stesso, viene creato un collegamento simbolico con quel nome
2985 verso un file diverso, ottenendo, se il programma sotto attacco ne ha la
2986 capacità, un accesso privilegiato.
2987
2988 \itindend{symlink~attack}
2989
2990 La \acr{glibc} provvede varie funzioni per generare nomi di file temporanei,
2991 di cui si abbia certezza di unicità al momento della generazione; storicamente
2992 la prima di queste funzioni create a questo scopo era
2993 \funcd{tmpnam},\footnote{la funzione è stata deprecata nella revisione
2994   POSIX.1-2008 dello standard POSIX.} il cui prototipo è:
2995
2996 \begin{funcproto}{
2997 \fhead{stdio.h}
2998 \fdecl{char *tmpnam(char *string)}
2999 \fdesc{Genera un nome univoco per un file temporaneo.}
3000 }
3001 {La funzione ritorna il puntatore alla stringa con il nome in caso di successo
3002   e \val{NULL} in caso di fallimento, non sono definiti errori.}
3003 \end{funcproto}
3004
3005 La funzione restituisce il puntatore ad una stringa contente un nome di file
3006 valido e non esistente al momento dell'invocazione. Se si è passato come
3007 argomento \param{string} un puntatore non nullo ad un buffer di caratteri
3008 questo deve essere di dimensione \constd{L\_tmpnam} ed il nome generato vi
3009 verrà copiato automaticamente, altrimenti il nome sarà generato in un buffer
3010 statico interno che verrà sovrascritto ad una chiamata successiva.  Successive
3011 invocazioni della funzione continueranno a restituire nomi unici fino ad un
3012 massimo di \constd{TMP\_MAX} volte, limite oltre il quale il comportamento è
3013 indefinito. Al nome viene automaticamente aggiunto come prefisso la directory
3014 specificata dalla costante \constd{P\_tmpdir}.\footnote{le costanti
3015   \const{L\_tmpnam}, \const{P\_tmpdir} e \const{TMP\_MAX} sono definite in
3016   \headfile{stdio.h}.}
3017
3018 Di questa funzione esiste una versione rientrante, \funcm{tmpnam\_r}, che non
3019 fa nulla quando si passa \val{NULL} come argomento.  Una funzione simile,
3020 \funcd{tempnam}, permette di specificare un prefisso per il file
3021 esplicitamente, il suo prototipo è:
3022
3023 \begin{funcproto}{
3024 \fhead{stdio.h}
3025 \fdecl{char *tempnam(const char *dir, const char *pfx)}
3026 \fdesc{Genera un nome univoco per un file temporaneo.}
3027 }
3028 {La funzione ritorna il puntatore alla stringa con il nome in caso di successo
3029   e \val{NULL} per un errore, nel qual caso \var{errno} potrà assumere solo il
3030   valore \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
3031 \end{funcproto}
3032
3033 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
3034 per cui è sempre rientrante, occorre però ricordarsi di disallocare con
3035 \code{free} il puntatore che restituisce.  L'argomento \param{pfx} specifica
3036 un prefisso di massimo 5 caratteri per il nome provvisorio. La funzione
3037 assegna come directory per il file temporaneo, verificando che esista e sia
3038 accessibile, la prima valida fra le seguenti:
3039 \begin{itemize*}
3040 \item la variabile di ambiente \envvar{TMPDIR} (non ha effetto se non è
3041   definita o se il programma chiamante è \acr{suid} o \acr{sgid}, vedi
3042   sez.~\ref{sec:file_special_perm}),
3043 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}),
3044 \item il valore della costante \const{P\_tmpdir},
3045 \item la directory \file{/tmp}.
3046 \end{itemize*}
3047
3048 In ogni caso, anche se con queste funzioni la generazione del nome è casuale,
3049 ed è molto difficile ottenere un nome duplicato, nulla assicura che un altro
3050 processo non possa avere creato, fra l'ottenimento del nome e l'apertura del
3051 file, un altro file o un collegamento simbolico con lo stesso nome. Per questo
3052 motivo quando si usa il nome ottenuto da una di queste funzioni occorre sempre
3053 assicurarsi che non si stia usando un collegamento simbolico e aprire il nuovo
3054 file in modalità di esclusione (cioè con l'opzione \const{O\_EXCL} per i file
3055 descriptor o con il flag ``\texttt{x}'' per gli \textit{stream}) che fa
3056 fallire l'apertura in caso il file sia già esistente. Essendo disponibili
3057 alternative migliori l'uso di queste funzioni è deprecato.
3058
3059 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
3060 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
3061 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
3062
3063 \begin{funcproto}{
3064 \fhead{stdio.h}
3065 \fdecl{FILE *tmpfile(void)}
3066 \fdesc{Apre un file temporaneo in lettura/scrittura.}
3067 }
3068 {La funzione ritorna il puntatore allo \textit{stream} associato al file
3069   temporaneo in caso di successo e \val{NULL} per un errore, nel qual caso
3070   \var{errno} assumerà uno dei valori:
3071   \begin{errlist}
3072     \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
3073     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
3074   \end{errlist}
3075   ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
3076   \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES} nel loro significato
3077   generico.}
3078 \end{funcproto}
3079
3080
3081 La funzione restituisce direttamente uno \textit{stream} già aperto (in
3082 modalità \code{w+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso,
3083 che viene automaticamente cancellato alla sua chiusura o all'uscita dal
3084 programma. Lo standard non specifica in quale directory verrà aperto il file,
3085 ma la \acr{glibc} prima tenta con \const{P\_tmpdir} e poi con
3086 \file{/tmp}. Questa funzione è rientrante e non soffre di problemi di
3087 \textit{race condition}.
3088
3089 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
3090 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
3091 modificano una stringa di input che serve da modello e che deve essere
3092 conclusa da 6 caratteri ``\texttt{X}'' che verranno sostituiti da un codice
3093 unico. La prima delle due è analoga a \func{tmpnam} e genera soltanto un nome
3094 casuale, il suo prototipo è:
3095
3096 \begin{funcproto}{
3097 \fhead{stlib.h}
3098 \fdecl{char *mktemp(char *template)}
3099 \fdesc{Genera un nome univoco per un file temporaneo.}
3100 }
3101 {La funzione ritorna  il puntatore a \param{template} in caso di successo e
3102   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori:
3103   \begin{errlist}
3104     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3105   \end{errlist}}
3106 \end{funcproto}
3107
3108 La funzione genera un nome univoco sostituendo le \code{XXXXXX} finali di
3109 \param{template}; dato che \param{template} deve poter essere modificata dalla
3110 funzione non si può usare una stringa costante.  Tutte le avvertenze riguardo
3111 alle possibili \textit{race condition} date per \func{tmpnam} continuano a
3112 valere; inoltre in alcune vecchie implementazioni il valore usato per
3113 sostituire le \code{XXXXXX} viene formato con il \ids{PID} del processo più
3114 una lettera, il che mette a disposizione solo 26 possibilità diverse per il
3115 nome del file, e rende il nome temporaneo facile da indovinare.  Per tutti
3116 questi motivi la funzione è deprecata e non dovrebbe mai essere usata.
3117
3118 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
3119 \func{tmpfile}, ma restituisce un file descriptor invece di un nome; il suo
3120 prototipo è:
3121
3122 \begin{funcproto}{
3123 \fhead{stlib.h}
3124 \fdecl{int mkstemp(char *template)}
3125 \fdesc{Apre un file temporaneo.}
3126 }
3127
3128 {La funzione ritorna il file descriptor in caso di successo e $-1$ per un
3129   errore, nel qual
3130   caso \var{errno} assumerà uno dei valori:
3131   \begin{errlist}
3132     \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
3133       contenuto di \param{template} è indefinito.
3134     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3135   \end{errlist}}
3136 \end{funcproto}
3137
3138
3139 Come per \func{mktemp} anche in questo caso \param{template} non può essere
3140 una stringa costante. La funzione apre un file in lettura/scrittura con la
3141 funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
3142 sez.~\ref{sec:file_open_close}), in questo modo al ritorno della funzione si
3143 ha la certezza di essere stati i creatori del file, i cui permessi (si veda
3144 sez.~\ref{sec:file_perm_overview}) sono impostati al valore \code{0600}
3145 (lettura e scrittura solo per il proprietario).\footnote{questo è vero a
3146   partire dalla \acr{glibc} 2.0.7, le versioni precedenti della \acr{glibc} e
3147   le vecchie \acr{libc5} e \acr{libc4} usavano il valore \code{0666} che
3148   permetteva a chiunque di leggere e scrivere i contenuti del file.}  Di
3149 questa funzione esiste una variante \funcd{mkostemp}, introdotta
3150 specificamente dalla \acr{glibc},\footnote{la funzione è stata introdotta
3151   nella versione 2.7 delle librerie e richiede che sia definita la macro
3152   \macro{\_GNU\_SOURCE}.} il cui prototipo è:
3153
3154 \begin{funcproto}{
3155 \fhead{stlib.h}
3156 \fdecl{int mkostemp(char *template, int flags)}
3157 \fdesc{Apre un file temporaneo.}
3158 }
3159 {La funzione ritorna un file descriptor in caso di successo e $-1$ per un
3160   errore, nel qual caso \var{errno} assumerà  gli stessi valori di
3161   \func{mkstemp}.}
3162 \end{funcproto}
3163 \noindent la cui sola differenza è la presenza dell'ulteriore argomento
3164 \var{flags} che consente di specificare i flag da passare ad \func{open}
3165 nell'apertura del file.
3166
3167
3168 In OpenBSD è stata introdotta un'altra funzione simile alle precedenti,
3169 \funcd{mkdtemp}, che crea invece una directory temporanea;\footnote{la
3170   funzione è stata introdotta nella \acr{glibc} a partire dalla versione
3171   2.1.91 ed inserita nello standard POSIX.1-2008.}  il suo prototipo è:
3172
3173 \begin{funcproto}{
3174 \fhead{stlib.h}
3175 \fdecl{char *mkdtemp(char *template)}
3176 \fdesc{Crea una directory temporanea.}
3177 }
3178 {La funzione ritorna il puntatore al nome della directory in caso di successo
3179   e \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei
3180   valori:
3181   \begin{errlist}
3182     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
3183   \end{errlist}
3184   più gli altri eventuali codici di errore di \func{mkdir}.}
3185 \end{funcproto}
3186
3187 La funzione crea una directory temporanea il cui nome è ottenuto sostituendo
3188 le \code{XXXXXX} finali di \param{template} con permessi \code{0700} (si veda
3189 sez.~\ref{sec:file_perm_overview} per i dettagli). Dato che la creazione della
3190 directory è sempre esclusiva i precedenti problemi di \textit{race condition}
3191 non si pongono.
3192
3193
3194
3195 \section{La manipolazione delle caratteristiche dei file}
3196 \label{sec:file_infos}
3197
3198 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
3199 relative alle caratteristiche di ciascun file, a partire dalle informazioni
3200 relative al controllo di accesso, sono mantenute nell'\textit{inode}. Vedremo
3201 in questa sezione come sia possibile leggere tutte queste informazioni usando
3202 la funzione \func{stat}, che permette l'accesso a tutti i dati memorizzati
3203 nell'\textit{inode}; esamineremo poi le varie funzioni usate per manipolare
3204 tutte queste informazioni, eccetto quelle che riguardano la gestione del
3205 controllo di accesso, trattate in sez.~\ref{sec:file_access_control}.
3206
3207
3208 \subsection{La lettura delle caratteristiche dei file}
3209 \label{sec:file_stat}
3210
3211 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
3212 delle funzioni \func{stat} che sono quelle che usa il comando \cmd{ls} per
3213 poter ottenere e mostrare tutti i dati relativi ad un file; ne fanno parte le
3214 funzioni di sistema \funcd{stat}, \funcd{fstat} e \funcd{lstat}, i cui
3215 prototipi sono:
3216
3217 \begin{funcproto}{
3218 \fhead{sys/types.h}
3219 \fhead{sys/stat.h}
3220 \fhead{unistd.h}
3221 \fdecl{int stat(const char *file\_name, struct stat *buf)}
3222 \fdecl{int lstat(const char *file\_name, struct stat *buf)}
3223 \fdecl{int fstat(int filedes, struct stat *buf)}
3224 \fdesc{Leggono le informazioni di un file.}
3225 }
3226 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3227   caso \var{errno} assumerà uno dei valori:
3228   \begin{errlist}
3229     \item[\errcode{EOVERFLOW}] il file ha una dimensione che non può essere
3230       rappresentata nel tipo \type{off\_t} (può avvenire solo in caso di
3231       programmi compilati su piattaforme a 32 bit senza le estensioni
3232       (\texttt{-D \_FILE\_OFFSET\_BITS=64}) per file a 64 bit).
3233   \end{errlist}
3234   ed inoltre \errval{EFAULT} ed \errval{ENOMEM}, per \func{stat} e
3235   \func{lstat} anche \errval{EACCES}, \errval{ELOOP}, \errval{ENAMETOOLONG},
3236   \errval{ENOENT}, \errval{ENOTDIR}, per \func{fstat} anche \errval{EBADF},
3237   nel loro significato generico.}
3238 \end{funcproto}
3239
3240 La funzione \func{stat} legge le informazioni del file indicato
3241 da \param{file\_name} e le inserisce nel buffer puntato
3242 dall'argomento \param{buf}; la funzione \func{lstat} è identica a \func{stat}
3243 eccetto che se \param{file\_name} è un collegamento simbolico vengono lette le
3244 informazioni relative ad esso e non al file a cui fa riferimento. Infine
3245 \func{fstat} esegue la stessa operazione su un file già aperto, specificato
3246 tramite il suo file descriptor \param{filedes}.
3247
3248 La struttura \struct{stat} usata da queste funzioni è definita nell'header
3249 \headfiled{sys/stat.h} e in generale dipende dall'implementazione; la versione
3250 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
3251 riportata dalla pagina di manuale di \func{stat}. In realtà la definizione
3252 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
3253 riservati per estensioni come tempi dei file più precisi (vedi
3254 sez.~\ref{sec:file_file_times}).
3255
3256 \begin{figure}[!htb]
3257   \footnotesize
3258   \centering
3259   \begin{minipage}[c]{0.8\textwidth}
3260     \includestruct{listati/stat.h}
3261   \end{minipage}
3262   \normalsize
3263   \caption{La struttura \structd{stat} per la lettura delle informazioni dei
3264     file.}
3265   \label{fig:file_stat_struct}
3266 \end{figure}
3267
3268 Si noti come i vari membri della struttura siano specificati come tipi
3269 primitivi del sistema, di quelli definiti in
3270 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \headfile{sys/types.h},
3271 con l'eccezione di \typed{blksize\_t} e \typed{blkcnt\_t} che sono nuovi tipi
3272 introdotti per rendersi indipendenti dalla piattaforma.
3273
3274 Benché la descrizione dei commenti di fig.~\ref{fig:file_stat_struct} sia
3275 abbastanza chiara, vale la pena illustrare maggiormente il significato dei
3276 campi di \struct{stat} su cui non torneremo in maggior dettaglio nel resto di
3277 questa sezione:
3278 \begin{itemize*}
3279
3280 \item Il campo \var{st\_nlink} contiene il numero di \textit{hard link} che
3281   fanno riferimento al file (il cosiddetto \textit{link count}) di cui abbiamo
3282   già parlato in numerose occasioni.
3283
3284 \item Il campo \var{st\_ino} contiene il numero di \textit{inode} del file,
3285   quello viene usato all'interno del filesystem per identificarlo e che può
3286   essere usato da un programma per determinare se due \textit{pathname} fanno
3287   riferimento allo stesso file.
3288
3289 \item Il campo \var{st\_dev} contiene il numero del dispositivo su cui risiede
3290   il file (o meglio il suo filesystem). Si tratta dello stesso numero che si
3291   usa con \func{mknod} e che può essere decomposto in \textit{major number} e
3292   \textit{minor number} con le macro \macro{major} e \macro{minor} viste in
3293   sez.~\ref{sec:file_mknod}.
3294
3295 \item Il campo \var{st\_rdev} contiene il numero di dispositivo associato al
3296   file stesso ed ovviamente ha un valore significativo soltanto quando il file
3297   è un dispositivo a caratteri o a blocchi.
3298
3299 \item Il campo \var{st\_blksize} contiene la dimensione dei blocchi di dati
3300   usati nell'I/O su disco, che è anche la dimensione usata per la
3301   bufferizzazione dei dati dalle librerie del C per l'interfaccia degli
3302   \textit{stream}.  Leggere o scrivere blocchi di dati in dimensioni inferiori
3303   a questo valore è inefficiente in quanto le operazioni su disco usano
3304   comunque trasferimenti di questa dimensione.
3305
3306 \end{itemize*}
3307
3308 % TODO trattare anche statx, aggiunta con il kernel 4.11 (vedi
3309 % https://lwn.net/Articles/707602/ e
3310 % https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=a528d35e8bfcc521d7cb70aaf03e1bd296c8493f)
3311
3312
3313 \subsection{I tipi di file}
3314 \label{sec:file_types}
3315
3316 Abbiamo sottolineato fin dall'introduzione che Linux, come ogni sistema
3317 unix-like, supporta oltre ai file ordinari e alle directory una serie di altri
3318 ``\textsl{tipi}'' di file che possono stare su un filesystem (elencati in
3319 tab.~\ref{tab:file_file_types}).  Il tipo di file viene ritornato dalle
3320 funzioni della famiglia \func{stat} all'interno del campo \var{st\_mode} di
3321 una struttura \struct{stat}.
3322
3323 Il campo \var{st\_mode} è una maschera binaria in cui l'informazione viene
3324 suddivisa nei vari bit che compongono, ed oltre a quelle sul tipo di file,
3325 contiene anche le informazioni relative ai permessi su cui torneremo in
3326 sez.~\ref{sec:file_perm_overview}. Dato che i valori numerici usati per
3327 definire il tipo di file possono variare a seconda delle implementazioni, lo
3328 standard POSIX definisce un insieme di macro che consentono di verificare il
3329 tipo di file in maniera standardizzata.
3330
3331 \begin{table}[htb]
3332   \centering
3333   \footnotesize
3334   \begin{tabular}[c]{|l|l|}
3335     \hline
3336     \textbf{Macro} & \textbf{Tipo del file} \\
3337     \hline
3338     \hline
3339     \macrod{S\_ISREG}\texttt{(m)}  & File normale.\\
3340     \macrod{S\_ISDIR}\texttt{(m)}  & Directory.\\
3341     \macrod{S\_ISCHR}\texttt{(m)}  & Dispositivo a caratteri.\\
3342     \macrod{S\_ISBLK}\texttt{(m)}  & Dispositivo a blocchi.\\
3343     \macrod{S\_ISFIFO}\texttt{(m)} & \textit{Fifo}.\\
3344     \macrod{S\_ISLNK}\texttt{(m)}  & Collegamento simbolico.\\
3345     \macrod{S\_ISSOCK}\texttt{(m)} & Socket.\\
3346     \hline
3347   \end{tabular}
3348   \caption{Macro per i tipi di file (definite in \headfile{sys/stat.h}).}
3349   \label{tab:file_type_macro}
3350 \end{table}
3351
3352 Queste macro vengono usate anche da Linux che supporta pure le estensioni allo
3353 standard per i collegamenti simbolici e i socket definite da BSD.\footnote{le
3354   ultime due macro di tab.~\ref{tab:file_type_macro}, che non sono presenti
3355   nello standard POSIX fino alla revisione POSIX.1-1996.}  L'elenco completo
3356 delle macro con cui è possibile estrarre da \var{st\_mode} l'informazione
3357 relativa al tipo di file è riportato in tab.~\ref{tab:file_type_macro}, tutte
3358 le macro restituiscono un valore intero da usare come valore logico e prendono
3359 come argomento il valore di \var{st\_mode}.
3360
3361 \begin{table}[htb]
3362   \centering
3363   \footnotesize
3364   \begin{tabular}[c]{|l|c|l|}
3365     \hline
3366     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
3367     \hline
3368     \hline
3369     \constd{S\_IFMT}   &  0170000 & Maschera per i bit del tipo di file.\\
3370     \constd{S\_IFSOCK} &  0140000 & Socket.\\
3371     \constd{S\_IFLNK}  &  0120000 & Collegamento simbolico.\\
3372     \constd{S\_IFREG}  &  0100000 & File regolare.\\
3373     \constd{S\_IFBLK}  &  0060000 & Dispositivo a blocchi.\\
3374     \constd{S\_IFDIR}  &  0040000 & Directory.\\
3375     \constd{S\_IFCHR}  &  0020000 & Dispositivo a caratteri.\\
3376     \constd{S\_IFIFO}  &  0010000 & \textit{Fifo}.\\
3377     \hline
3378     \constd{S\_ISUID}  &  0004000 & Set user ID (\acr{suid}) bit, vedi
3379                                    sez.~\ref{sec:file_special_perm}).\\
3380     \constd{S\_ISGID}  &  0002000 & Set group ID (\acr{sgid}) bit, vedi
3381                                    sez.~\ref{sec:file_special_perm}).\\
3382     \constd{S\_ISVTX}  &  0001000 & \acr{Sticky} bit, vedi
3383                                    sez.~\ref{sec:file_special_perm}).\\
3384     \hline
3385     \constd{S\_IRWXU}  &  00700   & Maschera per i permessi del proprietario.\\
3386     \constd{S\_IRUSR}  &  00400   & Il proprietario ha permesso di lettura.\\
3387     \constd{S\_IWUSR}  &  00200   & Il proprietario ha permesso di scrittura.\\
3388     \constd{S\_IXUSR}  &  00100   & Il proprietario ha permesso di esecuzione.\\
3389     \hline
3390     \constd{S\_IRWXG}  &  00070   & Maschera per i permessi del gruppo.\\
3391     \constd{S\_IRGRP}  &  00040   & Il gruppo ha permesso di lettura.\\
3392     \constd{S\_IWGRP}  &  00020   & Il gruppo ha permesso di scrittura.\\
3393     \constd{S\_IXGRP}  &  00010   & Il gruppo ha permesso di esecuzione.\\
3394     \hline
3395     \constd{S\_IRWXO}  &  00007   & Maschera per i permessi di tutti gli altri\\
3396     \constd{S\_IROTH}  &  00004   & Gli altri hanno permesso di lettura.\\
3397     \constd{S\_IWOTH}  &  00002   & Gli altri hanno permesso di esecuzione.\\
3398     \constd{S\_IXOTH}  &  00001   & Gli altri hanno permesso di esecuzione.\\
3399     \hline
3400   \end{tabular}
3401   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
3402     \var{st\_mode} (definite in \headfile{sys/stat.h}).}
3403   \label{tab:file_mode_flags}
3404 \end{table}
3405
3406 Oltre alle macro di tab.~\ref{tab:file_type_macro}, che semplificano
3407 l'operazione, è possibile usare direttamente il valore di \var{st\_mode} per
3408 ricavare il tipo di file controllando direttamente i vari bit in esso
3409 memorizzati. Per questo sempre in \headfile{sys/stat.h} sono definite le varie
3410 costanti numeriche riportate in tab.~\ref{tab:file_mode_flags}, che
3411 definiscono le maschere che consentono di selezionare non solo i dati relativi
3412 al tipo di file, ma anche le informazioni relative ai permessi su cui
3413 torneremo in sez.~\ref{sec:file_access_control}, ed identificare i rispettivi
3414 valori.
3415
3416 Le costanti che servono per la identificazione del tipo di file sono riportate
3417 nella prima sezione di tab.~\ref{tab:file_mode_flags}, mentre le sezioni
3418 successive attengono alle costanti usate per i permessi.  Il primo valore
3419 dell'elenco è la maschera binaria \const{S\_IFMT} che permette di estrarre da
3420 \var{st\_mode} (con un AND aritmetico) il blocco di bit nei quali viene
3421 memorizzato il tipo di file. I valori successivi sono le costanti
3422 corrispondenti ai vari tipi di file, e possono essere usate per verificare la
3423 presenza del tipo di file voluto ed anche, con opportune combinazioni,
3424 alternative fra più tipi di file.
3425
3426 Si tenga presente però che a differenza dei permessi, l'informazione relativa
3427 al tipo di file non è una maschera binaria, per questo motivo se si volesse
3428 impostare una condizione che permetta di controllare se un file è una
3429 directory o un file ordinario non si possono controllare dei singoli bit, ma
3430 si dovrebbe usare una macro di preprocessore come:
3431 \includecodesnip{listati/is_regdir.h}
3432 in cui si estraggono ogni volta da \var{st\_mode} i bit relativi al tipo di
3433 file e poi si effettua il confronto con i due possibili tipi di file.
3434
3435
3436 \subsection{Le dimensioni dei file}
3437 \label{sec:file_file_size}
3438
3439 Abbiamo visto in fig.~\ref{fig:file_stat_struct} che campo \var{st\_size} di
3440 una struttura \struct{stat} contiene la dimensione del file in byte. Questo
3441 però è vero solo se si tratta di un file regolare, mentre nel caso di un
3442 collegamento simbolico la dimensione è quella del \textit{pathname} che il
3443 collegamento stesso contiene, infine per le \textit{fifo} ed i file di dispositivo
3444 questo campo è sempre nullo.
3445
3446 Il campo \var{st\_blocks} invece definisce la lunghezza del file in blocchi di
3447 512 byte. La differenza con \var{st\_size} è che in questo caso si fa
3448 riferimento alla quantità di spazio disco allocata per il file, e non alla
3449 dimensione dello stesso che si otterrebbe leggendolo sequenzialmente.
3450
3451 Si deve tener presente infatti che la lunghezza del file riportata in
3452 \var{st\_size} non è detto che corrisponda all'occupazione dello spazio su
3453 disco, e non solo perché la parte finale del file potrebbe riempire
3454 parzialmente un blocco. In un sistema unix-like infatti è possibile
3455 l'esistenza dei cosiddetti \textit{sparse file}, cioè file in cui sono
3456 presenti dei ``\textsl{buchi}'' (\textit{holes} nella nomenclatura inglese)
3457 che si formano tutte le volte che si va a scrivere su un file dopo aver
3458 eseguito uno spostamento oltre la sua fine (tratteremo in dettaglio
3459 l'argomento in sez.~\ref{sec:file_lseek}).
3460
3461 In questo caso si avranno risultati differenti a seconda del modo in cui si
3462 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
3463 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
3464 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
3465 caso per i ``\textsl{buchi}'' vengono restituiti degli zeri, si avrà lo stesso
3466 risultato di \cmd{ls}.
3467
3468 Se è sempre possibile allargare un file, scrivendoci sopra o usando la
3469 funzione \func{lseek} (vedi sez.~\ref{sec:file_lseek}) per spostarsi oltre la
3470 sua fine, esistono anche casi in cui si può avere bisogno di effettuare un
3471 troncamento, scartando i dati presenti al di là della dimensione scelta come
3472 nuova fine del file.
3473
3474 Un file può sempre essere troncato a zero aprendolo con il flag
3475 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
3476 dimensione si possono usare le due funzioni di sistema \funcd{truncate} e
3477 \funcd{ftruncate}, i cui prototipi sono:
3478
3479 \begin{funcproto}{
3480 \fhead{unistd.h}
3481 \fdecl{int ftruncate(int fd, off\_t length))}
3482 \fdecl{int truncate(const char *file\_name, off\_t length)}
3483 \fdesc{Troncano un file.}
3484 }
3485 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3486   caso \var{errno} assumerà uno dei valori:
3487   \begin{errlist}
3488   \item[\errcode{EINTR}] si è stati interrotti da un segnale.
3489   \item[\errcode{EINVAL}] \param{length} è negativa o maggiore delle
3490     dimensioni massime di un file.
3491   \item[\errcode{EPERM}] il filesystem non supporta il troncamento di un file.
3492   \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
3493   \end{errlist}
3494   per entrambe, mentre per \func{ftruncate} si avranno anche:
3495   \begin{errlist}
3496   \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3497   \item[\errcode{EINVAL}] \param{fd} non è un riferimento a un file o non è
3498     aperto in scrittura.
3499   \end{errlist}
3500   e per \func{truncate} si avranno anche:
3501   \begin{errlist}
3502   \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file o il
3503     permesso di attraversamento di una delle componenti del \textit{pathname}.
3504   \item[\errcode{EISDIR}] \param{file\_name} fa riferimento ad una directory.
3505   \end{errlist}
3506   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
3507   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR} e \errval{EROFS}
3508   nel loro significato generico.}
3509 \end{funcproto}
3510
3511 Entrambe le funzioni fan sì che la dimensione del file sia troncata ad un
3512 valore massimo specificato da \param{length}, e si distinguono solo per il
3513 fatto che il file viene indicato con un \textit{pathname} per \func{truncate}
3514 e con un file descriptor per \funcd{ftruncate}. Si tenga presente che se il
3515 file è più lungo della lunghezza specificata i dati in eccesso saranno
3516 perduti.
3517
3518 Il comportamento in caso di lunghezza del file inferiore a \param{length} non
3519 è specificato e dipende dall'implementazione: il file può essere lasciato
3520 invariato o esteso fino alla lunghezza scelta. Nel caso di Linux viene esteso
3521 con la creazione di un \textsl{buco} nel file e ad una lettura si otterranno
3522 degli zeri, si tenga presente però che questo comportamento è supportato solo
3523 per filesystem nativi, ad esempio su un filesystem non nativo come il VFAT di
3524 Windows questo non è possibile.
3525
3526
3527 \subsection{I tempi dei file}
3528 \label{sec:file_file_times}
3529
3530 Il sistema mantiene per ciascun file tre tempi, che sono registrati
3531 nell'\textit{inode} insieme agli altri attributi del file. Questi possono
3532 essere letti tramite la funzione \func{stat}, che li restituisce attraverso
3533 tre campi della struttura \struct{stat} di fig.~\ref{fig:file_stat_struct}. Il
3534 significato di questi tempi e dei relativi campi della struttura \struct{stat}
3535 è illustrato nello schema di tab.~\ref{tab:file_file_times}, dove è anche
3536 riportato un esempio delle funzioni che effettuano cambiamenti su di essi. Il
3537 valore del tempo è espresso nel cosiddetto \textit{calendar time}, su cui
3538 torneremo in dettaglio in sez.~\ref{sec:sys_time}.
3539
3540 \begin{table}[htb]
3541   \centering
3542   \footnotesize
3543   \begin{tabular}[c]{|c|l|l|c|}
3544     \hline
3545     \textbf{Membro} & \textbf{Significato} & \textbf{Funzione}
3546     & \textbf{Opzione di \cmd{ls}} \\
3547     \hline
3548     \hline
3549     \var{st\_atime}& ultimo accesso ai dati del file    &
3550                      \func{read}, \func{utime}          & \cmd{-u}\\
3551     \var{st\_mtime}& ultima modifica ai dati del file   &
3552                      \func{write}, \func{utime}         & default\\
3553     \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
3554                      \func{chmod}, \func{utime}         & \cmd{-c}\\
3555     \hline
3556   \end{tabular}
3557   \caption{I tre tempi associati a ciascun file.}
3558   \label{tab:file_file_times}
3559 \end{table}
3560
3561 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
3562 ultima modifica (il \textit{modification time}) riportato in \var{st\_mtime},
3563 ed il tempo di ultimo cambiamento di stato (il \textit{change status time})
3564 riportato in \var{st\_ctime}. Il primo infatti fa riferimento ad una modifica
3565 del contenuto di un file, mentre il secondo ad una modifica dei metadati
3566 dell'\textit{inode}. Dato che esistono molte operazioni, come la funzione
3567 \func{link} e altre che vedremo in seguito, che modificano solo le
3568 informazioni contenute nell'\textit{inode} senza toccare il contenuto del
3569 file, diventa necessario l'utilizzo di questo secondo tempo.
3570
3571 Il tempo di ultima modifica viene usato ad esempio da programmi come
3572 \cmd{make} per decidere quali file necessitano di essere ricompilati perché
3573 più recenti dei loro sorgenti oppure dai programmi di backup, talvolta insieme
3574 anche al tempo di cambiamento di stato, per decidere quali file devono essere
3575 aggiornati nell'archiviazione.  Il tempo di ultimo accesso viene di solito
3576 usato per identificare i file che non vengono più utilizzati per un certo
3577 lasso di tempo. Ad esempio un programma come \texttt{leafnode} lo usa per
3578 cancellare gli articoli letti più vecchi, mentre \texttt{mutt} lo usa per
3579 marcare i messaggi di posta che risultano letti.
3580
3581 Il sistema non tiene mai conto dell'ultimo accesso all'\textit{inode},
3582 pertanto funzioni come \func{access} o \func{stat} non hanno alcuna influenza
3583 sui tre tempi. Il comando \cmd{ls} (quando usato con le opzioni \cmd{-l} o
3584 \cmd{-t}) mostra i tempi dei file secondo lo schema riportato nell'ultima
3585 colonna di tab.~\ref{tab:file_file_times}. Si noti anche come non esista, a
3586 differenza di altri sistemi operativi, un \textsl{tempo di creazione} di un
3587 file.
3588
3589 L'aggiornamento del tempo di ultimo accesso è stato a lungo considerato un
3590 difetto progettuale di Unix, questo infatti comporta la necessità di
3591 effettuare un accesso in scrittura sul disco anche in tutti i casi in cui
3592 questa informazione non interessa e sarebbe possibile avere un semplice
3593 accesso in lettura sui dati bufferizzati. Questo comporta un ovvio costo sia
3594 in termini di prestazioni, che di consumo di risorse come la batteria per i
3595 portatili, o i cicli di riscrittura per i dischi su memorie riscrivibili.
3596
3597
3598 Per questo motivo abbiamo visto in sez.~\ref{sec:filesystem_mounting} come
3599 nello sviluppo del kernel siano stati introdotti degli opportuni \textit{mount
3600   flag} che consentissero di evitare di aggiornare continuamente una
3601 informazione che nella maggior parte dei casi non interessa. Per questo i
3602 valori che si possono trovare per l'\textit{access time} dipendono dalle
3603 opzioni di montaggio, ed anche, essendo stato cambiato il comportamento di
3604 default a partire dalla versione 2.6.30, dal kernel che si sta usando.
3605
3606 In generale quello che si ha con i kernel più recenti è che il tempo di ultimo
3607 accesso viene aggiornato solo se è precedente al tempo di ultima modifica o
3608 cambiamento, o se è passato più di un giorno dall'ultimo accesso. Così si può
3609 rendere evidente che vi è stato un accesso dopo una modifica e che il file
3610 viene comunque osservato regolarmente, conservando tutte le informazioni
3611 veramente utili senza dover consumare risorse in scritture continue per
3612 mantenere costantemente aggiornata una informazione che a questo punto non ha
3613 più nessuna rilevanza pratica.\footnote{qualora ce ne fosse la necessità è
3614   comunque possibile, tramite l'opzione di montaggio \texttt{strictatime},
3615   richiedere in ogni caso il comportamento tradizionale.}
3616
3617 \begin{table}[htb]
3618   \centering
3619   \footnotesize
3620   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
3621     \hline
3622     \multicolumn{1}{|p{2.3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
3623     \multicolumn{3}{|p{3.2cm}|}{\centering{
3624         \textbf{File o directory del riferimento}}}&
3625     \multicolumn{3}{|p{3.2cm}|}{\centering{
3626         \textbf{Directory contenente il riferimento}}}
3627     &\multicolumn{1}{|p{3.cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
3628     \cline{2-7}
3629     \cline{2-7}
3630     \multicolumn{1}{|p{2.3cm}|}{}
3631     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(a)}}}
3632     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(m)}}}
3633     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(c)}}}
3634     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(a)}}}
3635     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(m)}}}
3636     &\multicolumn{1}{|p{.8cm}|}{\centering{\textsl{(c)}}}
3637     &\multicolumn{1}{|p{3cm}|}{} \\
3638     \hline
3639     \hline
3640     \func{chmod}, \func{fchmod}
3641              & --      & --      &$\bullet$& --      & --      & --      &\\
3642     \func{chown}, \func{fchown}
3643              & --      & --      &$\bullet$& --      & --      & --      &\\
3644     \func{creat}
3645              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&
3646              con \const{O\_CREATE} \\
3647     \func{creat}
3648              & --      &$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&
3649              con \const{O\_TRUNC} \\
3650     \func{exec}
3651              &$\bullet$& --      & --      & --      & --      & --      &\\
3652     \func{lchown}
3653              & --      & --      &$\bullet$& --      & --      & --      &\\
3654     \func{link}
3655              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
3656     \func{mkdir}
3657              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3658     \func{mknod}
3659              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3660     \func{mkfifo}
3661              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
3662     \func{open}
3663              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&
3664              con \const{O\_CREATE} \\
3665     \func{open}
3666              & --      &$\bullet$&$\bullet$& --      & --      & --      &
3667              con \const{O\_TRUNC}  \\
3668     \func{pipe}
3669              &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
3670     \func{read}
3671              &$\bullet$& --      & --      & --      & --      & --      &\\
3672     \func{remove}
3673              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&
3674              se esegue \func{unlink}\\
3675     \func{remove}
3676               & --      & --      & --      & --      &$\bullet$&$\bullet$&
3677               se esegue \func{rmdir}\\
3678     \func{rename}
3679               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&
3680               per ambo gli argomenti\\
3681     \func{rmdir}
3682               & --      & --      & --      & --      &$\bullet$&$\bullet$&\\
3683     \func{truncate}
3684               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\
3685     \func{ftruncate}
3686               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\
3687     \func{unlink}
3688               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
3689     \func{utime}
3690               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
3691     \func{utimes}
3692               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
3693     \func{write}
3694               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\
3695     \hline
3696   \end{tabular}
3697   \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo
3698     accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento di
3699     stato \textsl{(c)} dalle varie funzioni operanti su file e directory.}
3700   \label{tab:file_times_effects}
3701 \end{table}
3702
3703
3704 L'effetto delle varie funzioni di manipolazione dei file sui relativi tempi è
3705 illustrato in tab.~\ref{tab:file_times_effects}, facendo riferimento al
3706 comportamento classico per quanto riguarda \var{st\_atime}. Si sono riportati
3707 gli effetti sia per il file a cui si fa riferimento, sia per la directory che
3708 lo contiene. Questi ultimi possono essere capiti immediatamente se si tiene
3709 conto di quanto già detto e ripetuto a partire da
3710 sez.~\ref{sec:file_filesystem}, e cioè che anche le directory sono anch'esse
3711 file che contengono una lista di nomi, che il sistema tratta in maniera del
3712 tutto analoga a tutti gli altri.
3713
3714 Per questo motivo tutte le volte che compiremo un'operazione su un file che
3715 comporta una modifica del nome contenuto nella directory, andremo anche a
3716 scrivere sulla directory che lo contiene cambiandone il tempo di ultima
3717 modifica. Un esempio di questo tipo di operazione può essere la cancellazione
3718 di un file, invece leggere o scrivere o cambiare i permessi di un file ha
3719 effetti solo sui tempi di quest'ultimo.
3720
3721 Si ricordi infine come \var{st\_ctime} non è il tempo di creazione del file,
3722 che in Unix non esiste, anche se può corrispondervi per file che non sono mai
3723 stati modificati. Per questo motivo, a differenza di quanto avviene con altri
3724 sistemi operativi, quando si copia un file, a meno di preservare
3725 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
3726 avrà sempre il tempo corrente in cui si è effettuata la copia come data di
3727 ultima modifica.
3728
3729 I tempi di ultimo accesso ed ultima modifica possono essere modificati
3730 esplicitamente usando la funzione di sistema \funcd{utime}, il cui prototipo
3731 è:
3732
3733 \begin{funcproto}{
3734 \fhead{utime.h}
3735 \fdecl{int utime(const char *filename, struct utimbuf *times)}
3736 \fdesc{Modifica i tempi di ultimo accesso ed ultima modifica di un file.}
3737 }
3738
3739 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3740   caso \var{errno} assumerà uno dei valori:
3741   \begin{errlist}
3742   \item[\errcode{EACCES}] non c'è il permesso di attraversamento per uno dei
3743     componenti di \param{filename} o \param{times} è \val{NULL} e non si ha il
3744     permesso di scrittura sul file, o non si è proprietari del file o non si
3745     hanno i privilegi di amministratore.
3746   \item[\errcode{EPERM}] \param{times} non è \val{NULL}, e non si è
3747     proprietari del file o non si hanno i privilegi di amministratore.
3748   \end{errlist}
3749   ed inoltre \errval{ENOENT} e \errval{EROFS} nel loro significato generico.}
3750 \end{funcproto}
3751
3752 La funzione cambia i tempi di ultimo accesso e di ultima modifica del file
3753 specificato dall'argomento \param{filename}, e richiede come secondo argomento
3754 il puntatore ad una struttura \struct{utimbuf}, la cui definizione è riportata
3755 in fig.~\ref{fig:struct_utimebuf}, con i nuovi valori di detti tempi
3756 (rispettivamente nei campi \var{actime} e \var{modtime}). Se si passa un
3757 puntatore nullo verrà impostato il tempo corrente.
3758
3759 \begin{figure}[!htb]
3760   \footnotesize \centering
3761   \begin{minipage}[c]{0.8\textwidth}
3762     \includestruct{listati/utimbuf.h}
3763   \end{minipage}
3764   \normalsize
3765   \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
3766     i tempi dei file.}
3767   \label{fig:struct_utimebuf}
3768 \end{figure}
3769
3770 L'effetto della funzione ed i privilegi necessari per eseguirla dipendono dal
3771 valore dell'argomento \param{times}. Se è \val{NULL} la funzione imposta il
3772 tempo corrente ed è sufficiente avere accesso in scrittura al file o essere
3773 proprietari del file o avere i privilegi di amministratore. Se invece si è
3774 specificato un valore diverso la funzione avrà successo solo se si è
3775 proprietari del file o se si hanno i privilegi di amministratore.\footnote{per
3776   essere precisi la capacità \const{CAP\_FOWNER}, vedi
3777   sez.~\ref{sec:proc_capabilities}.} In entrambi i casi per verificare la
3778 proprietà del file viene utilizzato l'\ids{UID} effettivo del processo.
3779
3780 Si tenga presente che non è possibile modificare manualmente il tempo di
3781 cambiamento di stato del file, che viene aggiornato direttamente dal kernel
3782 tutte le volte che si modifica l'\textit{inode}, e quindi anche alla chiamata
3783 di \func{utime}.  Questo serve anche come misura di sicurezza per evitare che
3784 si possa modificare un file nascondendo completamente le proprie tracce. In
3785 realtà la cosa resta possibile se si è in grado di accedere al file di
3786 dispositivo, scrivendo direttamente sul disco senza passare attraverso il
3787 filesystem, ma ovviamente in questo modo la cosa è più complicata da
3788 realizzare.\footnote{esistono comunque molti programmi che consentono di farlo
3789   con relativa semplicità per cui non si dia per scontato che il valore sia
3790   credibile in caso di macchina compromessa.}
3791
3792 A partire dal kernel 2.6 la risoluzione dei tempi dei file, che nei campi di
3793 tab.~\ref{tab:file_file_times} è espressa in secondi, è stata portata ai
3794 nanosecondi per la gran parte dei filesystem. La ulteriore informazione può
3795 essere acceduta attraverso altri campi appositamente aggiunti alla struttura
3796 \struct{stat}. Se si sono definite le macro \macro{\_BSD\_SOURCE} o
3797 \macro{\_SVID\_SOURCE} questi sono \var{st\_atim.tv\_nsec},
3798 \var{st\_mtim.tv\_nsec} e \var{st\_ctim.tv\_nsec} se queste non sono definite,
3799 \var{st\_atimensec}, \var{st\_mtimensec} e \var{st\_mtimensec}. Qualora il
3800 supporto per questa maggior precisione sia assente questi campi aggiuntivi
3801 saranno nulli.
3802
3803 Per la gestione di questi nuovi valori è stata definita una seconda funzione
3804 di sistema, \funcd{utimes}, che consente di specificare tempi con maggior
3805 precisione; il suo prototipo è:
3806
3807 \begin{funcproto}{
3808 \fhead{sys/time.h}
3809 \fdecl{int utimes(const char *filename, struct timeval times[2])}
3810 \fdesc{Modifica i tempi di ultimo accesso e ultima modifica di un file.}
3811 }
3812 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3813   caso \var{errno} assumerà gli stessi valori di \func{utime}.}
3814 \end{funcproto}
3815
3816 La funzione è del tutto analoga alla precedente \func{utime} ma usa come
3817 secondo argomento un vettore di due strutture \struct{timeval}, la cui
3818 definizione è riportata in fig.~\ref{fig:sys_timeval_struct}, che consentono
3819 di indicare i tempi con una precisione del microsecondo. Il primo elemento
3820 di \param{times} indica il valore per il tempo di ultimo accesso, il secondo
3821 quello per il tempo di ultima modifica. Se si indica come secondo argomento un
3822 puntatore nullo di nuovo verrà utilizzato il tempo corrente.
3823
3824 \begin{figure}[!htb]
3825   \footnotesize \centering
3826   \begin{minipage}[c]{0.8\textwidth}
3827     \includestruct{listati/timeval.h}
3828   \end{minipage}
3829   \normalsize
3830   \caption{La struttura \structd{timeval} usata per indicare valori di tempo
3831     con la precisione del microsecondo.}
3832   \label{fig:sys_timeval_struct}
3833 \end{figure}
3834
3835 Oltre ad \func{utimes} su Linux sono presenti altre due funzioni,\footnote{le
3836   due funzioni non sono definite in nessuno standard, ma sono presenti, oltre
3837   che su Linux, anche su BSD.} \funcd{futimes} e \funcd{lutimes}, che
3838 consentono rispettivamente di effettuare la modifica utilizzando un file già
3839 aperto o di eseguirla direttamente su un collegamento simbolico. I relativi
3840 prototipi sono:
3841
3842 \begin{funcproto}{
3843 \fhead{sys/time.h}
3844 \fdecl{int futimes(int fd, const struct timeval tv[2])}
3845 \fdesc{Cambia i tempi di un file già aperto.}
3846 \fdecl{int lutimes(const char *filename, const struct timeval tv[2])}
3847 \fdesc{Cambia i tempi di un collegamento simbolico.}
3848 }
3849
3850 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3851   caso \var{errno} assumerà uno gli stessi valori di \func{utimes}, con in più
3852   per \func{futimes}:
3853   \begin{errlist}
3854   \item[\errcode{EBADF}] \param{fd} non è un file descriptor.
3855   \item[\errcode{ENOSYS}] il filesystem \texttt{/proc} non è accessibile.
3856   \end{errlist}}
3857 \end{funcproto}
3858
3859 Le due funzioni hanno lo stesso comportamento di \texttt{utimes} e richiedono
3860 gli stessi privilegi per poter operare, la differenza è che con \func{futimes}
3861 si può indicare il file su cui operare se questo è già aperto facendo
3862 riferimento al suo file descriptor, mentre con \func{lutimes} nel caso in
3863 cui \param{filename} sia un collegamento simbolico saranno modificati i suoi
3864 tempi invece di quelli del file a cui esso punta.
3865
3866 Nonostante il kernel nelle versioni più recenti supporti, come accennato,
3867 risoluzioni dei tempi dei file fino al nanosecondo, le funzioni fin qui
3868 esaminate non consentono di impostare valori con questa precisione. Per questo
3869 sono state introdotte due nuove funzioni di sistema, \funcd{futimens} e
3870 \funcd{utimensat}, in grado di eseguire questo compito; i rispettivi prototipi
3871 sono:
3872
3873 \begin{funcproto}{
3874 \fhead{sys/time.h}
3875 \fdecl{futimens(int fd, const struct timespec times[2])}
3876 \fdesc{Cambia i tempi di un file già aperto.}
3877 \fdecl{int utimensat(int dirfd, const char *pathname, const struct
3878     timespec times[2], int flags)}
3879 \fdesc{Cambia i tempi di un file.}
3880 }
3881
3882 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
3883   caso \var{errno} assumerà uno dei valori:
3884   \begin{errlist}
3885   \item[\errcode{EACCES}] si è richiesta l'impostazione del tempo corrente ma
3886     non si ha il permesso di scrittura sul file, o non si è proprietari del
3887     file o non si hanno i privilegi di amministratore; oppure il file è
3888     immutabile (vedi sez.~\ref{sec:file_perm_overview}).
3889   \item[\errcode{EBADF}] \param{fd} non è un file descriptor valido (solo
3890     \func{futimens}), oppure \param{dirfd} non è \const{AT\_FDCWD} o un file
3891     descriptor valido (solo \func{utimensat}).
3892   \item[\errcode{EFAULT}] \param{times} non è un puntatore valido (per
3893     entrambe), oppure \param{dirfd} è \const{AT\_FDCWD} ma \param{pathname} è
3894     \var{NULL} o non è un puntatore valido (solo \func{utimensat}).
3895   \item[\errcode{EINVAL}] si sono usati dei valori non corretti per i tempi
3896     di \param{times} (per entrambe), oppure è si usato un valore non valido
3897     per \param{flags}, oppure \param{pathname} è \var{NULL}, \param{dirfd} non
3898     è \const{AT\_FDCWD} e \param{flags} contiene \const{AT\_SYMLINK\_NOFOLLOW}
3899     (solo \func{utimensat}).
3900   \item[\errcode{EPERM}] si è richiesto un cambiamento nei tempi non al tempo
3901     corrente, ma non si è proprietari del file o non si hanno i privilegi di
3902     amministratore; oppure il file è immutabile o \textit{append-only} (vedi
3903     sez.~\ref{sec:file_perm_overview}).
3904   \item[\errcode{ESRCH}] non c'è il permesso di attraversamento per una delle
3905     componenti di \param{pathname} (solo \func{utimensat})
3906   \end{errlist}
3907   ed inoltre per entrambe \errval{EROFS} e per \func{utimensat}
3908   \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR} nel
3909   loro significato generico.}
3910 \end{funcproto}
3911
3912 Entrambe le funzioni utilizzano per indicare i valori dei tempi un
3913 vettore \param{times} di due strutture \struct{timespec}, la cui definizione è
3914 riportata in fig.~\ref{fig:sys_timespec_struct}, che permette di specificare
3915 un valore dei tempi con una precisione fino al nanosecondo.
3916
3917 \begin{figure}[!htb]
3918   \footnotesize \centering
3919   \begin{minipage}[c]{0.8\textwidth}
3920     \includestruct{listati/timespec.h}
3921   \end{minipage}
3922   \normalsize
3923   \caption{La struttura \structd{timespec} usata per indicare valori di tempo
3924     con la precisione del nanosecondo.}
3925   \label{fig:sys_timespec_struct}
3926 \end{figure}
3927
3928 Come per le precedenti funzioni il primo elemento di \param{times} indica il
3929 tempo di ultimo accesso ed il secondo quello di ultima modifica, e se si usa
3930 il valore \val{NULL} verrà impostato il tempo corrente sia per l'ultimo
3931 accesso che per l'ultima modifica. Nei singoli elementi di \param{times} si
3932 possono inoltre utilizzare due valori speciali per il campo \var{tv\_nsec}:
3933 con \constd{UTIME\_NOW} si richiede l'uso del tempo corrente, mentre con
3934 \constd{UTIME\_OMIT} si richiede di non impostare il tempo. Si può così
3935 aggiornare in maniera specifica soltanto uno fra il tempo di ultimo accesso e
3936 quello di ultima modifica. Quando si usa uno di questi valori speciali per
3937 \var{tv\_nsec} il corrispondente valore di \var{tv\_sec} viene ignorato.
3938
3939 Queste due funzioni sono una estensione definita nella revisione POSIX.1-2008
3940 dello standard POSIX, in Linux sono state introdotte a partire dal kernel
3941 2.6.22,\footnote{si tenga presente però che per kernel precedenti il 2.6.26 le
3942   due funzioni sono difettose nel rispetto di alcuni requisiti minori dello
3943   standard e nel controllo della correttezza dei tempi, per i dettagli dei
3944   quali si rimanda alla pagina di manuale.} e supportate dalla \acr{glibc} a
3945 partire dalla versione 2.6.\footnote{in precedenza, a partire dal kernel
3946   2.6.16, era stata introdotta una \textit{system call} \funcm{futimesat}
3947   seguendo una bozza della revisione dello standard poi modificata; questa
3948   funzione, sostituita da \func{utimensat}, è stata dichiarata obsoleta, non è
3949   supportata da nessuno standard e non deve essere più utilizzata: pertanto
3950   non ne parleremo.} La prima è sostanzialmente una estensione di
3951 \func{futimes} che consente di specificare i tempi con precisione maggiore, la
3952 seconda supporta invece, rispetto ad \func{utimes}, una sintassi più complessa
3953 che consente una indicazione sicura del file su cui operare specificando la
3954 directory su cui si trova tramite il file descriptor \param{dirfd} ed il suo
3955 nome come \textit{pathname relativo} in \param{pathname}.\footnote{su Linux
3956   solo \func{utimensat} è una \textit{system call} e \func{futimens} è una
3957   funzione di libreria, infatti se \param{pathname} è \var{NULL} \param{dirfd}
3958   viene considerato un file descriptor ordinario e il cambiamento del tempo
3959   applicato al file sottostante, qualunque esso sia, per cui
3960   \code{futimens(fd, times}) è del tutto equivalente a \code{utimensat(fd,
3961     NULL, times, 0)}.}
3962
3963 Torneremo su questa sintassi e sulla sua motivazione in
3964 sez.~\ref{sec:file_openat}, quando tratteremo tutte le altre funzioni (le
3965 cosiddette \textit{at-functions}) che la utilizzano; essa prevede comunque
3966 anche la presenza dell'argomento \param{flags} con cui attivare flag di
3967 controllo che modificano il comportamento della funzione, nel caso specifico
3968 l'unico valore consentito è \const{AT\_SYMLINK\_NOFOLLOW} che indica alla
3969 funzione di non dereferenziare i collegamenti simbolici, cosa che le permette
3970 di riprodurre le funzionalità di \func{lutimes}.
3971
3972
3973
3974
3975 \section{Il controllo di accesso ai file}
3976 \label{sec:file_access_control}
3977
3978 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
3979 del controllo di accesso ai file, che viene implementato per qualunque
3980 filesystem standard.\footnote{per standard si intende che implementa le
3981   caratteristiche previste dallo standard POSIX; in Linux sono utilizzabili
3982   anche filesystem di altri sistemi operativi, che non supportano queste
3983   caratteristiche.} In questa sezione ne esamineremo i concetti essenziali e
3984 le funzioni usate per gestirne i vari aspetti.
3985
3986
3987 \subsection{I permessi per l'accesso ai file}
3988 \label{sec:file_perm_overview}
3989
3990 Ad ogni file Linux associa sempre, oltre ad un insieme di permessi, l'utente
3991 che ne è proprietario (il cosiddetto \textit{owner}) ed un gruppo di
3992 appartenenza, indicati dagli identificatori di utente e gruppo (\ids{UID} e
3993 \ids{GID}) di cui abbiamo già parlato in
3994 sez.~\ref{sec:proc_access_id}.\footnote{questo è vero solo per filesystem di
3995   tipo Unix, ad esempio non è vero per il filesystem VFAT di Windows, che non
3996   fornisce nessun supporto per l'accesso multiutente, e per il quale queste
3997   proprietà vengono assegnate in maniera fissa con opportune opzioni di
3998   montaggio.}  Anche questi sono mantenuti sull'\textit{inode} insieme alle
3999 altre proprietà e sono accessibili da programma tramite la funzione
4000 \func{stat} (trattata in sez.~\ref{sec:file_stat}), che restituisce l'utente
4001 proprietario nel campo \var{st\_uid} ed il gruppo proprietario nel campo
4002 \var{st\_gid} della omonima struttura \struct{stat}.
4003
4004 Il controllo di accesso ai file segue un modello abbastanza semplice che
4005 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
4006 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
4007     Control List} che sono state aggiunte ai filesystem standard con opportune
4008   estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
4009   controllo ancora più sofisticati come il \textit{Mandatory Access Control}
4010   di \textit{SELinux} e delle altre estensioni come \textit{Smack} o
4011   \textit{AppArmor}.} ma nella maggior parte dei casi il meccanismo standard è
4012 più che sufficiente a soddisfare tutte le necessità più comuni.  I tre
4013 permessi di base associati ad ogni file sono:
4014 \begin{itemize*}
4015 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
4016   \textit{read}).
4017 \item il permesso di scrittura (indicato con la lettera \texttt{w},
4018   dall'inglese \textit{write}).
4019 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
4020   dall'inglese \textit{execute}).
4021 \end{itemize*}
4022 mentre i tre livelli su cui sono divisi i privilegi sono:
4023 \begin{itemize*}
4024 \item i privilegi per l'utente proprietario del file.
4025 \item i privilegi per un qualunque utente faccia parte del gruppo cui
4026   appartiene il file.
4027 \item i privilegi per tutti gli altri utenti.
4028 \end{itemize*}
4029
4030 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
4031 meno significativi sono usati a gruppi di tre per indicare i permessi base di
4032 lettura, scrittura ed esecuzione e sono applicati rispettivamente
4033 rispettivamente al proprietario, al gruppo, a tutti gli altri.
4034
4035 \begin{figure}[htb]
4036   \centering
4037   \includegraphics[width=6cm]{img/fileperm}
4038   \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
4039     contenuti nel campo \var{st\_mode} di \struct{stat}.}
4040   \label{fig:file_perm_bit}
4041 \end{figure}
4042
4043 I restanti tre bit (noti come \textit{suid bit}, \textit{sgid bit}, e
4044 \textit{sticky bit}) sono usati per indicare alcune caratteristiche più
4045 complesse del meccanismo del controllo di accesso su cui torneremo in seguito
4046 (in sez.~\ref{sec:file_special_perm}), lo schema di allocazione dei bit è
4047 riportato in fig.~\ref{fig:file_perm_bit}.  Come tutte le altre proprietà di
4048 un file anche i permessi sono memorizzati nell'\textit{inode}, e come
4049 accennato in sez.~\ref{sec:file_types} essi sono vengono restituiti in una
4050 parte del campo \var{st\_mode} della struttura \struct{stat} (si veda di nuovo
4051 fig.~\ref{fig:file_stat_struct}).
4052
4053 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
4054 \texttt{u} (per \textit{user}), \texttt{g} (per \textit{group}) e \texttt{o}
4055 (per \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti
4056 insieme si usa la lettera \texttt{a} (per \textit{all}). Si tenga ben presente
4057 questa distinzione dato che in certi casi, mutuando la terminologia in uso a
4058 suo tempo nel VMS, si parla dei permessi base come di permessi per
4059 \textit{owner}, \textit{group} ed \textit{all}, le cui iniziali possono dar
4060 luogo a confusione.  Le costanti che permettono di accedere al valore numerico
4061 di questi bit nel campo \var{st\_mode}, già viste in
4062 tab.~\ref{tab:file_mode_flags}, sono riportate per chiarezza una seconda volta
4063 in tab.~\ref{tab:file_bit_perm}.
4064
4065 \begin{table}[htb]
4066   \centering
4067     \footnotesize
4068   \begin{tabular}[c]{|c|l|}
4069     \hline
4070     \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
4071     \hline
4072     \hline
4073     \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
4074     \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
4075     \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\
4076     \hline
4077     \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
4078     \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
4079     \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
4080     \hline
4081     \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
4082     \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
4083     \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
4084     \hline
4085   \end{tabular}
4086   \caption{I bit dei permessi di accesso ai file, come definiti in
4087     \texttt{<sys/stat.h>}}
4088   \label{tab:file_bit_perm}
4089 \end{table}
4090
4091 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
4092 che si riferiscano a dei file, dei collegamenti simbolici o delle directory;
4093 qui ci limiteremo ad un riassunto delle regole generali, entrando nei dettagli
4094 più avanti.
4095
4096 La prima regola è che per poter accedere ad un file attraverso il suo
4097 \textit{pathname} occorre il permesso di esecuzione in ciascuna delle
4098 directory che compongono il \textit{pathname}; lo stesso vale per aprire un
4099 file nella directory corrente (per la quale appunto serve il diritto di
4100 esecuzione). Per una directory infatti il permesso di esecuzione significa che
4101 essa può essere attraversata nella risoluzione del \textit{pathname}, e per
4102 questo viene anche chiamato permesso di attraversamento. Esso è sempre
4103 distinto dal permesso di lettura che invece implica che si può leggere il
4104 contenuto della directory.
4105
4106 Questo significa che se si ha il permesso di esecuzione senza permesso di
4107 lettura si potrà lo stesso aprire un file all'interno di una directory (se si
4108 hanno i permessi adeguati per il medesimo) ma non si potrà vederlo con
4109 \cmd{ls} mancando il permesso di leggere il contenuto della directory. Per
4110 crearlo o rinominarlo o cancellarlo invece occorrerà avere anche il permesso
4111 di scrittura per la directory.
4112
4113 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
4114 (si veda quanto riportato in sez.~\ref{sec:file_open_close}) di sola lettura o
4115 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
4116 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
4117 il contenuto, lo stesso permesso è necessario per poter troncare il file o per
4118 aggiornare il suo tempo di ultima modifica al tempo corrente, ma non per
4119 modificare arbitrariamente quest'ultimo, operazione per la quale, come per
4120 buona parte delle modifiche effettuate sui metadati del file, occorre esserne
4121 i proprietari.
4122
4123 Non si può creare un file fintanto che non si disponga del permesso di
4124 esecuzione e di quello di scrittura per la directory di destinazione. Gli
4125 stessi permessi occorrono per cancellare un file da una directory (si ricordi
4126 che questo non implica necessariamente la rimozione del contenuto del file dal
4127 disco). Per la cancellazione non è necessario nessun tipo di permesso per il
4128 file stesso dato che, come illustrato in sez.~\ref{sec:link_symlink_rename}
4129 esso non viene toccato, nella cancellazione infatti viene solo modificato il
4130 contenuto della directory, rimuovendo la voce che ad esso fa riferimento. Lo
4131 stesso vale per poter rinominare o spostare il file in altra directory, in
4132 entrambi i casi occorrerà il permesso di scrittura sulle directory che si
4133 vanno a modificare.
4134
4135 Per poter eseguire un file, che sia un programma compilato od uno script di
4136 shell, od un altro tipo di file eseguibile riconosciuto dal kernel, occorre
4137 oltre al permesso di lettura per accedere al contenuto avere anche il permesso
4138 di esecuzione. Inoltre solo i file regolari possono essere eseguiti. Per i
4139 file di dispositivo i permessi validi sono solo quelli di lettura e scrittura,
4140 che corrispondono al poter eseguire dette operazioni sulla periferica
4141 sottostante.
4142
4143 I permessi per un collegamento simbolico sono ignorati, contano quelli del
4144 file a cui fa riferimento; per questo in genere il comando \cmd{ls} riporta
4145 per un collegamento simbolico tutti i permessi come concessi. Utente e gruppo
4146 a cui esso appartiene vengono pure ignorati quando il collegamento viene
4147 risolto, vengono controllati solo quando viene richiesta la rimozione del
4148 collegamento e quest'ultimo è in una directory con lo \textit{sticky bit}
4149 impostato (si veda sez.~\ref{sec:file_special_perm}).
4150
4151 La procedura con cui il kernel stabilisce se un processo possiede un certo
4152 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
4153 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
4154 \var{st\_gid} accennati in precedenza) e l'\ids{UID} effettivo, il \ids{GID}
4155 effettivo e gli eventuali \ids{GID} supplementari del processo.\footnote{in
4156   realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
4157   identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
4158   sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
4159   eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
4160   differenza.}
4161
4162 Per una spiegazione dettagliata degli identificatori associati ai processi si
4163 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
4164 sez.~\ref{sec:file_special_perm}, l'\ids{UID} effettivo e il \ids{GID} effettivo
4165 corrispondono ai valori dell'\ids{UID} e del \ids{GID} dell'utente che ha
4166 lanciato il processo, mentre i \ids{GID} supplementari sono quelli dei gruppi
4167 cui l'utente appartiene.
4168
4169 I passi attraverso i quali viene stabilito se il processo possiede il diritto
4170 di accesso sono i seguenti:
4171 \begin{enumerate*}
4172 \item Se l'\ids{UID} effettivo del processo è zero (corrispondente
4173   all'amministratore) l'accesso è sempre garantito senza nessun controllo. Per
4174   questo motivo l'amministratore ha piena libertà di accesso a tutti i file.
4175 \item Se l'\ids{UID} effettivo del processo è uguale all'\ids{UID} del
4176   proprietario del file (nel qual caso si dice che il processo è proprietario
4177   del file) allora:
4178   \begin{itemize*}
4179   \item se il relativo\footnote{per relativo si intende il bit di
4180       \textit{user-read} se il processo vuole accedere in lettura, quello di
4181       \textit{user-write} per l'accesso in scrittura, ecc.} bit dei permessi
4182     d'accesso dell'utente è impostato, l'accesso è consentito;
4183   \item altrimenti l'accesso è negato.
4184   \end{itemize*}
4185 \item Se il \ids{GID} effettivo del processo o uno dei \ids{GID} supplementari
4186   del processo corrispondono al \ids{GID} del file allora:
4187   \begin{itemize*}
4188   \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
4189     consentito;
4190   \item altrimenti l'accesso è negato.
4191   \end{itemize*}
4192 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
4193   l'accesso è consentito, altrimenti l'accesso è negato.
4194 \end{enumerate*}
4195
4196 Si tenga presente che questi passi vengono eseguiti esattamente in
4197 quest'ordine. Questo vuol dire che se un processo è il proprietario di un
4198 file, l'accesso è consentito o negato solo sulla base dei permessi per
4199 l'utente; i permessi per il gruppo non vengono neanche controllati. Lo stesso
4200 vale se il processo appartiene ad un gruppo appropriato, in questo caso i
4201 permessi per tutti gli altri non vengono controllati.
4202
4203 Questo significa che se si è proprietari di un file ma non si ha il permesso
4204 di scrittura, non vi si potrà scrivere anche se questo fosse scrivibile per
4205 tutti gli altri. Permessi di questo tipo sono ovviamente poco ortodossi, e
4206 comunque, come vedremo in sez.~\ref{sec:file_perm_management}, il proprietario
4207 di un file può sempre modificarne i permessi, e riassegnarsi un eventuale
4208 permesso di scrittura mancante.
4209
4210 \itindbeg{file~attributes}
4211
4212 A questi che sono i permessi ordinari si aggiungono, per i filesystem che
4213 supportano questa estensione, due permessi speciali mantenuti nei cosiddetti
4214 \textit{file attributes}, che si possono leggere ed impostare con i comandi
4215 \cmd{lsattr} e \cmd{chattr}.\footnote{per l'utilizzo di questi comandi e per
4216   le spiegazioni riguardo tutti gli altri \textit{file attributes} si rimanda
4217   alla sezione 1.4.4 di \cite{AGL}.}
4218
4219 Il primo è il cosiddetto attributo di immutabilità (\textit{immutable},
4220 identificato dalla lettera \texttt{i}) che impedisce ogni modifica al file,
4221 \textit{inode} compreso. Questo significa non solo che non se ne può cambiare
4222 il contenuto, ma neanche nessuna delle sue proprietà, ed in particolare non si
4223 può modificare nei permessi o nei tempi o nel proprietario ed inoltre, visto
4224 che non se può modificare il \textit{link count}, non si può neanche
4225 cancellare, rinominare, o creare \textit{hard link} verso di esso.
4226
4227 Il secondo è il cosiddetto attributo di \textit{append-only}, (identificato
4228 dalla lettera \texttt{a}) che consente soltanto la scrittura in coda al
4229 file. Il file cioè può essere soltanto esteso nel contenuto, ma i suoi
4230 metadati, a parte i tempi che però possono essere impostati al valore
4231 corrente, non possono essere modificati in alcun modo, quindi di nuovo non si
4232 potrà cancellare, rinominare, o modificare nei permessi o nelle altre
4233 proprietà.
4234
4235 Entrambi questi attributi attivano queste restrizioni a livello di filesystem,
4236 per cui a differenza dei permessi ordinari esse varranno per qualunque utente
4237 compreso l'amministratore. L'amministratore è l'unico che può attivare o
4238 disattivare questi attributi,\footnote{più precisamente un processo con la
4239   capacità \const{CAP\_LINUX\_IMMUTABLE}, vedi
4240   sez.~\ref{sec:proc_capabilities}.} e potendo rimuoverli è comunque capace di
4241 tornare in grado di eseguire qualunque operazione su un file immutabile o
4242 \textit{append-only}.
4243
4244 \itindend{file~attributes}
4245
4246
4247
4248 \subsection{I bit dei permessi speciali}
4249 \label{sec:file_special_perm}
4250
4251 \itindbeg{suid~bit}
4252 \itindbeg{sgid~bit}
4253
4254 Come si è accennato (in sez.~\ref{sec:file_perm_overview}) nei dodici bit del
4255 campo \var{st\_mode} di \struct{stat} che vengono usati per il controllo di
4256 accesso oltre ai bit dei permessi veri e propri, ci sono altri tre bit che
4257 vengono usati per indicare alcune proprietà speciali dei file.  Due di questi
4258 sono i bit detti \acr{suid} (da \textit{set-user-ID bit}) e \acr{sgid} (da
4259 \textit{set-group-ID bit}) che sono identificati dalle costanti
4260 \const{S\_ISUID} e \const{S\_ISGID}.
4261
4262 Come spiegato in dettaglio in sez.~\ref{sec:proc_exec}, quando si lancia un
4263 programma il comportamento normale del kernel è quello di impostare gli
4264 identificatori del gruppo \textit{effective} del nuovo processo al valore dei
4265 corrispondenti del gruppo \textit{real} del processo corrente, che normalmente
4266 corrispondono a quelli dell'utente con cui si è entrati nel sistema.
4267
4268 Se però il file del programma, che ovviamente deve essere
4269 eseguibile,\footnote{anzi più precisamente un binario eseguibile: per motivi
4270   di sicurezza il kernel ignora i bit \acr{suid} e \acr{sgid} per gli script
4271   eseguibili.} ha il bit \acr{suid} impostato, il kernel assegnerà come
4272 \ids{UID} effettivo al nuovo processo l'\ids{UID} del proprietario del file al
4273 posto dell'\ids{UID} del processo originario.  Avere il bit \acr{sgid}
4274 impostato ha lo stesso effetto sul \ids{GID} effettivo del processo. É
4275 comunque possibile riconoscere questa situazione perché il cambiamento viene
4276 effettuato solo sugli identificativi del gruppo \textit{effective}, mentre
4277 quelli dei gruppi \textit{real} e \textit{saved} restano quelli dell'utente
4278 che ha eseguito il programma.
4279
4280 I bit \acr{suid} e \acr{sgid} vengono usati per permettere agli utenti normali
4281 di usare programmi che richiedono privilegi speciali. L'esempio classico è il
4282 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
4283 quest'ultimo ovviamente può essere scritto solo dall'amministratore, ma non è
4284 necessario chiamare l'amministratore per cambiare la propria password. Infatti
4285 il comando \cmd{passwd} appartiene in genere all'utente \textit{root} ma ha il
4286 bit \acr{suid} impostato, per cui quando viene lanciato da un utente normale
4287 ottiene comunque  i privilegi di amministratore.
4288
4289 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
4290 normalmente l'utente che lo ha lanciato comporta vari rischi, e questo tipo di
4291 programmi devono essere scritti accuratamente per evitare che possano essere
4292 usati per guadagnare privilegi non consentiti (l'argomento è affrontato in
4293 dettaglio in sez.~\ref{sec:proc_perms}).
4294
4295 La presenza dei bit \acr{suid} e \acr{sgid} su un file può essere rilevata con
4296 il comando \cmd{ls -l}, che visualizza una lettera ``\cmd{s}'' al posto della
4297 ``\cmd{x}'' in corrispondenza dei permessi di utente o gruppo. La stessa
4298 lettera ``\cmd{s}'' può essere usata nel comando \cmd{chmod} per impostare
4299 questi bit.  Infine questi bit possono essere controllati all'interno di
4300 \var{st\_mode} con l'uso delle due costanti \const{S\_ISUID} e
4301 \const{S\_IGID}, i cui valori sono riportati in
4302 tab.~\ref{tab:file_mode_flags}.
4303
4304 Gli stessi bit vengono ad assumere un significato completamente diverso per le
4305 directory, normalmente infatti Linux usa la convenzione di SVr4 per indicare
4306 con questi bit l'uso della semantica BSD nella creazione di nuovi file (si
4307 veda sez.~\ref{sec:file_ownership_management} per una spiegazione dettagliata
4308 al proposito).
4309
4310 Infine Linux utilizza il bit \acr{sgid} per un'ulteriore estensione mutuata da
4311 SVr4. Il caso in cui un file ha il bit \acr{sgid} impostato senza che lo sia
4312 anche il corrispondente bit di esecuzione viene utilizzato per attivare per
4313 quel file il \textit{mandatory locking} (affronteremo questo argomento in
4314 dettaglio più avanti, in sez.~\ref{sec:file_mand_locking}).
4315
4316 \itindend{suid~bit}
4317 \itindend{sgid~bit}
4318
4319 \itindbeg{sticky~bit}
4320
4321 L'ultimo dei bit rimanenti, identificato dalla costante \const{S\_ISVTX}, è in
4322 parte un rimasuglio delle origini dei sistemi Unix. A quell'epoca infatti la
4323 memoria virtuale e l'accesso ai file erano molto meno sofisticati e per
4324 ottenere la massima velocità possibile per i programmi usati più comunemente
4325 si poteva impostare questo bit.
4326
4327 L'effetto di questo bit era che il segmento di testo del programma (si veda
4328 sez.~\ref{sec:proc_mem_layout} per i dettagli) veniva scritto nella swap la
4329 prima volta che questo veniva lanciato, e vi permaneva fino al riavvio della
4330 macchina (da questo il nome di \textsl{sticky bit}); essendo la swap un file
4331 continuo o una partizione indicizzata direttamente si poteva risparmiare in
4332 tempo di caricamento rispetto alla ricerca attraverso la struttura del
4333 filesystem. Lo \textsl{sticky bit} è indicato usando la lettera ``\texttt{t}''
4334 al posto della ``\texttt{x}'' nei permessi per gli altri.
4335
4336 Ovviamente per evitare che gli utenti potessero intasare la swap solo
4337 l'amministratore era in grado di impostare questo bit, che venne chiamato
4338 anche con il nome di \textit{saved text bit}, da cui deriva quello della
4339 costante.  Le attuali implementazioni di memoria virtuale e filesystem rendono
4340 sostanzialmente inutile questo procedimento.
4341
4342 Benché ormai non venga più utilizzato per i file, lo \textit{sticky bit} ha
4343 invece assunto un uso importante per le directory;\footnote{lo \textit{sticky
4344     bit} per le directory è un'estensione non definita nello standard POSIX,
4345   Linux però la supporta, così come BSD e SVr4.} in questo caso se tale bit è
4346 impostato un file potrà essere rimosso dalla directory soltanto se l'utente ha
4347 il permesso di scrittura su di essa ed inoltre è vera una delle seguenti
4348 condizioni:
4349 \begin{itemize*}
4350 \item l'utente è proprietario del file,
4351 \item l'utente è proprietario della directory,
4352 \item l'utente è l'amministratore.
4353 \end{itemize*}
4354
4355 Un classico esempio di directory che ha questo bit impostato è \file{/tmp}, i
4356 cui permessi infatti di solito sono i seguenti:
4357 \begin{Console}
4358 piccardi@hain:~/gapil$ \textbf{ls -ld /tmp}
4359 drwxrwxrwt    6 root     root         1024 Aug 10 01:03 /tmp
4360 \end{Console}
4361 %$
4362 quindi con lo \textit{sticky bit} bit impostato. In questo modo qualunque
4363 utente nel sistema può creare dei file in questa directory, che come
4364 suggerisce il nome è normalmente utilizzata per la creazione di file
4365 temporanei, ma solo l'utente che ha creato un certo file potrà cancellarlo o
4366 rinominarlo. In questo modo si evita che un utente possa, più o meno
4367 consapevolmente, cancellare i file temporanei creati degli altri utenti.
4368
4369 \itindend{sticky~bit}
4370
4371
4372
4373 \subsection{Le funzioni per la gestione dei permessi dei file}
4374 \label{sec:file_perm_management}
4375
4376 Come visto in sez.~\ref{sec:file_access_control} il controllo di accesso ad un
4377 file viene fatto utilizzando l'\ids{UID} ed il \ids{GID} effettivo del processo;
4378 ci sono casi però in cui si può voler effettuare il controllo con l'\ids{UID}
4379 reale ed il \ids{GID} reale, vale a dire usando i valori di \ids{UID} e
4380 \ids{GID} relativi all'utente che ha lanciato il programma, e che, come
4381 accennato in sez.~\ref{sec:file_special_perm} e spiegato in dettaglio in
4382 sez.~\ref{sec:proc_perms}, non è detto siano uguali a quelli effettivi.
4383
4384 Per far questo si può usare la funzione di sistema \funcd{access}, il cui
4385 prototipo è:
4386
4387 \begin{funcproto}{
4388 \fhead{unistd.h}
4389 \fdecl{int access(const char *pathname, int mode)}
4390 \fdesc{Verifica i permessi di accesso.}
4391 }
4392
4393 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4394   caso \var{errno} assumerà uno dei valori:
4395   \begin{errlist}
4396   \item[\errcode{EACCES}] l'accesso al file non è consentito, o non si ha il
4397     permesso di attraversare una delle directory di \param{pathname}.
4398   \item[\errcode{EINVAL}] il valore di \param{mode} non è valido.
4399   \item[\errcode{EROFS}] si è richiesto l'accesso in scrittura per un file su
4400     un filesystem montato in sola lettura.
4401   \item[\errcode{ETXTBSY}] si è richiesto l'accesso in scrittura per un
4402     eseguibile binario correntemente in esecuzione.
4403   \end{errlist}
4404   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP},
4405   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR} nel loro
4406   significato generico.}
4407 \end{funcproto}
4408
4409 La funzione verifica i permessi di accesso, indicati da \param{mode}, per il
4410 file indicato da \param{pathname}. I valori possibili per l'argomento
4411 \param{mode} sono esprimibili come combinazione delle costanti numeriche
4412 riportate in tab.~\ref{tab:file_access_mode_val} (attraverso un OR binario
4413 delle stesse). I primi tre valori implicano anche la verifica dell'esistenza
4414 del file, se si vuole verificare solo quest'ultima si può usare \const{F\_OK},
4415 o anche direttamente \func{stat}. Nel caso in cui \param{pathname} si
4416 riferisca ad un collegamento simbolico, questo viene seguito ed il controllo è
4417 fatto sul file a cui esso fa riferimento.
4418
4419 La funzione controlla solo i bit dei permessi di accesso per \param{pathname},
4420 ma occorre poter risolvere quest'ultimo, e se non c'è il permesso di
4421 esecuzione per una qualunque delle sue componenti la funzione fallirà
4422 indipendentemente dai permessi del file.  Si tenga presente poi che il fatto
4423 che una directory abbia permesso di scrittura non significa che vi si possa
4424 scrivere come fosse un file, e che se un file ha il permesso di esecuzione non
4425 è detto che sia eseguibile. La funzione ha successo solo se tutti i permessi
4426 controllati sono disponibili.
4427
4428 \begin{table}[htb]
4429   \centering
4430   \footnotesize
4431   \begin{tabular}{|c|l|}
4432     \hline
4433     \textbf{\param{mode}} & \textbf{Significato} \\
4434     \hline
4435     \hline
4436     \constd{R\_OK} & Verifica il permesso di lettura. \\
4437     \constd{W\_OK} & Verifica il permesso di scrittura. \\
4438     \constd{X\_OK} & Verifica il permesso di esecuzione. \\
4439     \constd{F\_OK} & Verifica l'esistenza del file. \\
4440     \hline
4441   \end{tabular}
4442   \caption{Valori possibili per l'argomento \param{mode} della funzione
4443     \func{access}.}
4444   \label{tab:file_access_mode_val}
4445 \end{table}
4446
4447 Un esempio tipico per l'uso di questa funzione è quello di un processo che sta
4448 eseguendo un programma coi privilegi di un altro utente (ad esempio attraverso
4449 l'uso del \textit{suid bit}) che vuole controllare se l'utente originale ha i
4450 permessi per accedere ad un certo file, ma eseguire questo controllo prima di
4451 aprire il file espone al rischio di una \textit{race condition} che apre ad un
4452 possibile \textit{symlink attack} fra il controllo e l'apertura del file. In
4453 questo caso è sempre opportuno usare invece la funzione \func{faccessat} che
4454 tratteremo insieme alle altre \textit{at-functions} in
4455 sez.~\ref{sec:file_openat}.
4456
4457 Del tutto analoghe a \func{access} sono le due funzioni \funcm{euidaccess} e
4458 \funcm{eaccess} che ripetono lo stesso controllo usando però gli
4459 identificatori del gruppo effettivo, verificando quindi le effettive capacità
4460 di accesso ad un file. Le funzioni hanno entrambe lo stesso
4461 prototipo\footnote{in realtà \funcm{eaccess} è solo un sinonimo di
4462   \funcm{euidaccess} fornita per compatibilità con l'uso di questo nome in
4463   altri sistemi.} che è del tutto identico a quello di \func{access}. Prendono
4464 anche gli stessi valori e restituiscono gli stessi risultati e gli stessi
4465 codici di errore.
4466
4467 Per cambiare i permessi di un file il sistema mette ad disposizione due
4468 funzioni \funcd{chmod} e \funcd{fchmod}, che operano rispettivamente su un
4469 filename e su un file descriptor, i loro prototipi sono:
4470
4471 \begin{funcproto}{
4472 \fhead{sys/types.h}
4473 \fhead{sys/stat.h}
4474 \fdecl{int chmod(const char *path, mode\_t mode)}
4475 \fdesc{Cambia i permessi del file indicato da \param{path} al valore indicato
4476   da \param{mode}.}
4477 \fdecl{int fchmod(int fd, mode\_t mode)}
4478 \fdesc{Analoga alla precedente, ma usa il file descriptor \param{fd} per
4479   indicare il file.}
4480
4481 }
4482
4483 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4484   caso \var{errno} assumerà uno dei valori:
4485   \begin{errlist}
4486   \item[\errcode{EPERM}] l'\ids{UID} effettivo non corrisponde a quello del
4487     proprietario del file o non si hanno i privilegi di amministratore.
4488   \item[\errcode{EROFS}] il file è su un filesystem in sola lettura.
4489   \end{errlist}
4490   ed inoltre per entrambe \errval{EIO}, per \func{chmod} \errval{EACCES},
4491   \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG}, \errval{ENOENT},
4492   \errval{ENOMEM}, \errval{ENOTDIR}, per \func{fchmod} \errval{EBADF} nel loro
4493   significato generico.}
4494 \end{funcproto}
4495
4496
4497 Entrambe le funzioni utilizzano come secondo argomento \param{mode}, una
4498 variabile dell'apposito tipo primitivo \type{mode\_t} (vedi
4499 tab.~\ref{tab:intro_primitive_types}) utilizzato per specificare i permessi
4500 sui file.
4501
4502 \begin{table}[!htb]
4503   \centering
4504   \footnotesize
4505   \begin{tabular}[c]{|c|c|l|}
4506     \hline
4507     \textbf{\param{mode}} & \textbf{Valore} & \textbf{Significato} \\
4508     \hline
4509     \hline
4510     \const{S\_ISUID} & 04000 & Set user ID  bit.\\
4511     \const{S\_ISGID} & 02000 & Set group ID bit.\\
4512     \const{S\_ISVTX} & 01000 & Sticky bit.\\
4513     \hline
4514     \const{S\_IRWXU} & 00700 & L'utente ha tutti i permessi.\\
4515     \const{S\_IRUSR} & 00400 & L'utente ha il permesso di lettura.\\
4516     \const{S\_IWUSR} & 00200 & L'utente ha il permesso di scrittura.\\
4517     \const{S\_IXUSR} & 00100 & L'utente ha il permesso di esecuzione.\\
4518     \hline
4519     \const{S\_IRWXG} & 00070 & Il gruppo ha tutti i permessi.\\
4520     \const{S\_IRGRP} & 00040 & Il gruppo ha il permesso di lettura.\\
4521     \const{S\_IWGRP} & 00020 & Il gruppo ha il permesso di scrittura.\\
4522     \const{S\_IXGRP} & 00010 & Il gruppo ha il permesso di esecuzione.\\
4523     \hline
4524     \const{S\_IRWXO} & 00007 & Gli altri hanno tutti i permessi.\\
4525     \const{S\_IROTH} & 00004 & Gli altri hanno il permesso di lettura.\\
4526     \const{S\_IWOTH} & 00002 & Gli altri hanno il permesso di scrittura.\\
4527     \const{S\_IXOTH} & 00001 & Gli altri hanno il permesso di esecuzione.\\
4528     \hline
4529   \end{tabular}
4530   \caption{Valori delle costanti usate per indicare i vari bit di
4531     \param{mode} utilizzato per impostare i permessi dei file.}
4532   \label{tab:file_permission_const}
4533 \end{table}
4534
4535 Le costanti con cui specificare i singoli bit di \param{mode} sono riportate
4536 in tab.~\ref{tab:file_permission_const}, e corrispondono agli stessi valori
4537 usati per \var{st\_mode} in tab.~\ref{tab:file_mode_flags}. Il valore
4538 di \param{mode} può essere ottenuto combinando fra loro con un OR binario le
4539 costanti simboliche relative ai vari bit, o specificato direttamente, come per
4540 l'omonimo comando di shell, con un valore numerico (la shell lo vuole in
4541 ottale, dato che i bit dei permessi sono divisibili in gruppi di tre), che si
4542 può calcolare direttamente usando lo schema di utilizzo dei bit illustrato in
4543 fig.~\ref{fig:file_perm_bit}.
4544
4545 Ad esempio i permessi standard assegnati ai nuovi file (lettura e scrittura
4546 per il proprietario, sola lettura per il gruppo e gli altri) sono
4547 corrispondenti al valore ottale $0644$, un programma invece avrebbe anche il
4548 bit di esecuzione attivo, con un valore di $0755$, se si volesse attivare il
4549 bit \acr{suid} il valore da fornire sarebbe $4755$.
4550
4551 Il cambiamento dei permessi di un file eseguito attraverso queste funzioni ha
4552 comunque alcune limitazioni, previste per motivi di sicurezza. L'uso delle
4553 funzioni infatti è possibile solo se l'\ids{UID} effettivo del processo
4554 corrisponde a quello del proprietario del file o dell'amministratore,
4555 altrimenti esse falliranno con un errore di \errcode{EPERM}.
4556
4557 Ma oltre a questa regola generale, di immediata comprensione, esistono delle
4558 limitazioni ulteriori. Per questo motivo, anche se si è proprietari del file,
4559 non tutti i valori possibili di \param{mode} sono permessi o hanno effetto;
4560 in particolare accade che:
4561 \begin{enumerate*}
4562 \item siccome solo l'amministratore può impostare lo \textit{sticky bit}, se
4563   l'\ids{UID} effettivo del processo non è zero esso viene automaticamente
4564   cancellato, senza notifica di errore, qualora sia stato indicato
4565   in \param{mode}.
4566 \item per quanto detto in sez.~\ref{sec:file_ownership_management} riguardo la
4567   creazione dei nuovi file, si può avere il caso in cui il file creato da un
4568   processo è assegnato ad un gruppo per il quale il processo non ha privilegi.
4569   Per evitare che si possa assegnare il bit \acr{sgid} ad un file appartenente
4570   ad un gruppo per cui non si hanno diritti, questo viene automaticamente
4571   cancellato da \param{mode}, senza notifica di errore, qualora il gruppo del
4572   file non corrisponda a quelli associati al processo; la cosa non avviene
4573   quando l'\ids{UID} effettivo del processo è zero.
4574 \end{enumerate*}
4575
4576 Per alcuni filesystem\footnote{i filesystem più comuni (\textsl{ext2},
4577   \textsl{ext3}, \textsl{ext4}, \textsl{ReiserFS}) supportano questa
4578   caratteristica, che è mutuata da BSD.} è inoltre prevista un'ulteriore
4579 misura di sicurezza, volta a scongiurare l'abuso dei bit \acr{suid} e
4580 \acr{sgid}; essa consiste nel cancellare automaticamente questi bit dai
4581 permessi di un file qualora un processo che non appartenga
4582 all'amministratore\footnote{per la precisione un processo che non dispone
4583   della capacità \const{CAP\_FSETID}, vedi sez.~\ref{sec:proc_capabilities}.}
4584 effettui una scrittura. In questo modo anche se un utente malizioso scopre un
4585 file \acr{suid} su cui può scrivere, un'eventuale modifica comporterà la
4586 perdita di questo privilegio.
4587
4588 Le funzioni \func{chmod} e \func{fchmod} ci permettono di modificare i
4589 permessi di un file, resta però il problema di quali sono i permessi assegnati
4590 quando il file viene creato. Le funzioni dell'interfaccia nativa di Unix, come
4591 vedremo in sez.~\ref{sec:file_open_close}, permettono di indicare
4592 esplicitamente i permessi di creazione di un file, ma questo non è possibile
4593 per le funzioni dell'interfaccia standard ANSI C che non prevede l'esistenza
4594 di utenti e gruppi, ed inoltre il problema si pone anche per l'interfaccia
4595 nativa quando i permessi non vengono indicati esplicitamente.
4596
4597 \itindbeg{umask}
4598
4599 Per le funzioni dell'interfaccia standard ANSI C l'unico riferimento possibile
4600 è quello della modalità di apertura del nuovo file (lettura/scrittura o sola
4601 lettura), che però può fornire un valore che è lo stesso per tutti e tre i
4602 permessi di sez.~\ref{sec:file_perm_overview} (cioè $666$ nel primo caso e
4603 $222$ nel secondo). Per questo motivo il sistema associa ad ogni
4604 processo\footnote{è infatti contenuta nel campo \var{umask} della struttura
4605   \kstruct{fs\_struct}, vedi fig.~\ref{fig:proc_task_struct}.}  una maschera
4606 di bit, la cosiddetta \textit{umask}, che viene utilizzata per impedire che
4607 alcuni permessi possano essere assegnati ai nuovi file in sede di creazione. I
4608 bit indicati nella maschera vengono infatti cancellati dai permessi quando un
4609 nuovo file viene creato.\footnote{l'operazione viene fatta sempre: anche
4610   qualora si indichi esplicitamente un valore dei permessi nelle funzioni di
4611   creazione che lo consentono, i permessi contenuti nella \textit{umask}
4612   verranno tolti.}
4613
4614 La funzione di sistema che permette di impostare il valore di questa maschera
4615 di controllo è \funcd{umask}, ed il suo prototipo è:
4616
4617 \begin{funcproto}{
4618 \fhead{stat.h}
4619 \fdecl{mode\_t umask(mode\_t mask)}
4620 \fdesc{Imposta la maschera dei permessi.}
4621 }
4622
4623 {La funzione ritorna il precedente valore della maschera, non sono previste
4624   condizioni di errore.}
4625 \end{funcproto}
4626
4627 La funzione imposta la maschera dei permessi dei bit al valore specificato
4628 da \param{mask}, di cui vengono presi solo i 9 bit meno significativi.  In
4629 genere si usa questa maschera per impostare un valore predefinito che escluda
4630 preventivamente alcuni permessi, il caso più comune è eliminare il permesso di
4631 scrittura per il gruppo e gli altri, corrispondente ad un valore
4632 per \param{mask} pari a $022$.  In questo modo è possibile cancellare
4633 automaticamente i permessi non voluti.  Di norma questo valore viene impostato
4634 una volta per tutte al login (a $022$ se non indicato altrimenti), e gli
4635 utenti non hanno motivi per modificarlo.
4636
4637 \itindend{umask}
4638
4639
4640 \subsection{La gestione della titolarità dei file}
4641 \label{sec:file_ownership_management}
4642
4643 Vedremo in sez.~\ref{sec:file_open_close} con quali funzioni si possono creare
4644 nuovi file, in tale occasione vedremo che è possibile specificare in sede di
4645 creazione quali permessi applicare ad un file, però non si può indicare a
4646 quale utente e gruppo esso deve appartenere.  Lo stesso problema si presenta
4647 per la creazione di nuove directory (procedimento descritto in
4648 sez.~\ref{sec:file_dir_creat_rem}).
4649
4650 Lo standard POSIX prescrive che l'\ids{UID} del nuovo file corrisponda
4651 all'\ids{UID} effettivo del processo che lo crea; per il \ids{GID} invece
4652 prevede due diverse possibilità:
4653 \begin{itemize*}
4654 \item che il \ids{GID} del file corrisponda al \ids{GID} effettivo del
4655   processo.
4656 \item che il \ids{GID} del file corrisponda al \ids{GID} della directory in
4657   cui esso è creato.
4658 \end{itemize*}
4659
4660 In genere BSD usa sempre la seconda possibilità, che viene per questo chiamata
4661 semantica BSD. Linux invece segue normalmente quella che viene chiamata
4662 semantica SVr4: di norma un nuovo file viene creato, seguendo la prima
4663 opzione, con il \ids{GID} del processo, se però la directory in cui viene
4664 creato ha il bit \acr{sgid} impostato allora viene usata la seconda
4665 opzione. L'adozione di questa semantica però può essere controllata,
4666 all'interno di alcuni filesystem,\footnote{con il kernel 2.6.25 questi erano
4667   \acr{ext2}, \acr{ext3}, \acr{ext4}, e XFS.}  con l'uso dell'opzione di
4668 montaggio \texttt{grpid}, che se attivata fa passare all'uso della semantica
4669 BSD.
4670
4671 Usare la semantica BSD ha il vantaggio che il \ids{GID} viene sempre
4672 automaticamente propagato, restando coerente a quello della directory di
4673 partenza, in tutte le sotto-directory. La semantica SVr4 offre la possibilità
4674 di scegliere, ma per ottenere lo stesso risultato di coerenza che si ha con
4675 quella di BSD necessita che quando si creano nuove directory venga propagato
4676 il bit \acr{sgid}. Questo è il comportamento predefinito del comando
4677 \cmd{mkdir}, ed è in questo modo ad esempio che le varie distribuzioni
4678 assicurano che le sotto-directory create nella home di un utente restino
4679 sempre con il \ids{GID} del gruppo primario dello stesso.
4680
4681 La presenza del bit \acr{sgid} è inoltre molto comoda quando si hanno
4682 directory contenenti file condivisi da un gruppo di utenti in cui possono
4683 scrivere tutti i membri dello stesso, dato che assicura che i file che gli
4684 utenti vi creano appartengano allo gruppo stesso. Questo non risolve però
4685 completamente i problemi di accesso da parte di altri utenti dello stesso
4686 gruppo, in quanto di default i permessi assegnati al gruppo non sono
4687 sufficienti per un accesso in scrittura; in questo caso si deve aver cura di
4688 usare prima della creazione dei file un valore per \textit{umask} lasci il
4689 permesso di scrittura.\footnote{in tal caso si può assegnare agli utenti del
4690   gruppo una \textit{umask} di $002$, anche se la soluzione migliore in questo
4691   caso è usare una ACL di default (vedi sez.~\ref{sec:file_ACL}).}
4692
4693 Come avviene nel caso dei permessi esistono anche delle appropriate funzioni
4694 di sistema, \funcd{chown} \funcd{fchown} e \funcd{lchown}, che permettono di
4695 cambiare sia l'utente che il gruppo a cui un file appartiene; i rispettivi
4696 prototipi sono:
4697
4698 \begin{funcproto}{
4699 \fhead{sys/types.h}
4700 \fhead{sys/stat.h}
4701 \fdecl{int chown(const char *path, uid\_t owner, gid\_t group)}
4702 \fdecl{int fchown(int fd, uid\_t owner, gid\_t group)}
4703 \fdecl{int lchown(const char *path, uid\_t owner, gid\_t group)}
4704 \fdesc{Cambiano proprietario e gruppo proprietario di un file.}
4705 }
4706
4707 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4708   caso \var{errno} assumerà uno dei valori:
4709   \begin{errlist}
4710   \item[\errcode{EPERM}] l'\ids{UID} effettivo non corrisponde a quello del
4711     proprietario del file o non è zero, o utente e gruppo non sono validi.
4712   \end{errlist}
4713   ed inoltre per tutte \errval{EROFS} e \errval{EIO}, per \func{chown}
4714   \errval{EACCES}, \errval{EFAULT}, \errval{ELOOP}, \errval{ENAMETOOLONG},
4715   \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR}, per \func{fchown}
4716   \errval{EBADF} nel loro significato generico.}
4717 \end{funcproto}
4718
4719 Le funzioni cambiano utente e gruppo di appartenenza di un file ai valori
4720 specificati dalle variabili \param{owner} e \param{group}. Con Linux solo
4721 l'amministratore\footnote{o in generale un processo con la capacità
4722   \const{CAP\_CHOWN}, vedi sez.~\ref{sec:proc_capabilities}.} può cambiare il
4723 proprietario di un file; in questo viene seguita la semantica usata da BSD che
4724 non consente agli utenti di assegnare i loro file ad altri utenti evitando
4725 eventuali aggiramenti delle quote.  L'amministratore può cambiare sempre il
4726 gruppo di un file, il proprietario può cambiare il gruppo solo dei file che
4727 gli appartengono e solo se il nuovo gruppo è il suo gruppo primario o uno dei
4728 gruppi di cui fa parte.
4729
4730 La funzione \func{chown} segue i collegamenti simbolici, per operare
4731 direttamente su un collegamento simbolico si deve usare la funzione
4732 \func{lchown}.\footnote{fino alla versione 2.1.81 in Linux \func{chown} non
4733   seguiva i collegamenti simbolici, da allora questo comportamento è stato
4734   assegnato alla funzione \func{lchown}, introdotta per l'occasione, ed è
4735   stata creata una nuova \textit{system call} per \func{chown} che seguisse i
4736   collegamenti simbolici.} La funzione \func{fchown} opera su un file aperto,
4737 essa è mutuata da BSD, ma non è nello standard POSIX.  Un'altra estensione
4738 rispetto allo standard POSIX è che specificando -1 come valore
4739 per \param{owner} e \param{group} i valori restano immutati.
4740
4741 Quando queste funzioni sono chiamate con successo da un processo senza i
4742 privilegi di amministratore entrambi i bit \acr{suid} e \acr{sgid} vengono
4743 cancellati. Questo non avviene per il bit \acr{sgid} nel caso in cui esso sia
4744 usato (in assenza del corrispondente permesso di esecuzione) per indicare che
4745 per il file è attivo il \textit{mandatory locking} (vedi
4746 sez.~\ref{sec:file_mand_locking}).
4747
4748
4749 \subsection{Un quadro d'insieme sui permessi}
4750 \label{sec:file_riepilogo}
4751
4752 Avendo affrontato in maniera separata il comportamento delle varie funzioni
4753 che operano sui permessi dei file ed avendo trattato in sezioni diverse il
4754 significato dei singoli bit dei permessi, vale la pena di fare un riepilogo in
4755 cui si riassumano le caratteristiche di ciascuno di essi, in modo da poter
4756 fornire un quadro d'insieme.
4757
4758 \begin{table}[!htb]
4759   \centering
4760   \footnotesize
4761   \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
4762     \hline
4763     \multicolumn{3}{|c|}{special}&
4764     \multicolumn{3}{|c|}{user}&
4765     \multicolumn{3}{|c|}{group}&
4766     \multicolumn{3}{|c|}{other}&
4767     \multirow{2}{*}{\textbf{Significato per i file}} \\
4768     \cline{1-12}
4769     \texttt{s}&\texttt{s}&\texttt{t}&
4770     \texttt{r}&\texttt{w}&\texttt{x}&
4771     \texttt{r}&\texttt{w}&\texttt{x}&
4772     \texttt{r}&\texttt{w}&\texttt{x}& \\
4773     \hline
4774     \hline
4775    1&-&-&-&-&1&-&-&-&-&-&-&Eseguito conferisce l'\ids{UID} effettivo dell'utente.\\
4776    -&1&-&-&-&1&-&-&-&-&-&-&Eseguito conferisce il \ids{GID} effettivo del gruppo.\\
4777    -&1&-&-&-&0&-&-&-&-&-&-&Il \textit{mandatory locking} è abilitato.\\
4778    -&-&1&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
4779    -&-&-&1&-&-&-&-&-&-&-&-&Permesso di lettura per l'utente.\\
4780    -&-&-&-&1&-&-&-&-&-&-&-&Permesso di scrittura per l'utente.\\
4781    -&-&-&-&-&1&-&-&-&-&-&-&Permesso di esecuzione per l'utente.\\
4782    -&-&-&-&-&-&1&-&-&-&-&-&Permesso di lettura per il gruppo.\\
4783    -&-&-&-&-&-&-&1&-&-&-&-&Permesso di scrittura per il gruppo.\\
4784    -&-&-&-&-&-&-&-&1&-&-&-&Permesso di esecuzione per il gruppo.\\
4785    -&-&-&-&-&-&-&-&-&1&-&-&Permesso di lettura per tutti gli altri.\\
4786    -&-&-&-&-&-&-&-&-&-&1&-&Permesso di scrittura per tutti gli altri.\\
4787    -&-&-&-&-&-&-&-&-&-&-&1&Permesso di esecuzione per tutti gli altri.\\
4788     \hline
4789     \hline
4790     \multicolumn{3}{|c|}{special}&
4791     \multicolumn{3}{|c|}{user}&
4792     \multicolumn{3}{|c|}{group}&
4793     \multicolumn{3}{|c|}{other}&
4794     \multirow{2}{*}{\textbf{Significato per le directory}} \\
4795     \cline{1-12}
4796     \texttt{s}&\texttt{s}&\texttt{t}&
4797     \texttt{r}&\texttt{w}&\texttt{x}&
4798     \texttt{r}&\texttt{w}&\texttt{x}&
4799     \texttt{r}&\texttt{w}&\texttt{x}& \\
4800     \hline
4801     \hline
4802     1&-&-&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
4803     -&1&-&-&-&-&-&-&-&-&-&-&Propaga il gruppo ai nuovi file creati.\\
4804     -&-&1&-&-&-&-&-&-&-&-&-&Solo il proprietario di un file può rimuoverlo.\\
4805     -&-&-&1&-&-&-&-&-&-&-&-&Permesso di visualizzazione per l'utente.\\
4806     -&-&-&-&1&-&-&-&-&-&-&-&Permesso di aggiornamento per l'utente.\\
4807     -&-&-&-&-&1&-&-&-&-&-&-&Permesso di attraversamento per l'utente.\\
4808     -&-&-&-&-&-&1&-&-&-&-&-&Permesso di visualizzazione per il gruppo.\\
4809     -&-&-&-&-&-&-&1&-&-&-&-&Permesso di aggiornamento per il gruppo.\\
4810     -&-&-&-&-&-&-&-&1&-&-&-&Permesso di attraversamento per il gruppo.\\
4811     -&-&-&-&-&-&-&-&-&1&-&-&Permesso di visualizzazione per tutti gli altri.\\
4812     -&-&-&-&-&-&-&-&-&-&1&-&Permesso di aggiornamento per tutti gli altri.\\
4813     -&-&-&-&-&-&-&-&-&-&-&1&Permesso di attraversamento per tutti gli altri.\\
4814     \hline
4815   \end{tabular}
4816   \caption{Tabella riassuntiva del significato dei bit dei permessi per un
4817     file e directory.}
4818   \label{tab:file_fileperm_bits}
4819 \end{table}
4820
4821 Nella parte superiore di tab.~\ref{tab:file_fileperm_bits} si è riassunto il
4822 significato dei vari bit dei permessi per un file ordinario; per quanto
4823 riguarda l'applicazione dei permessi per proprietario, gruppo ed altri si
4824 ricordi quanto illustrato in sez.~\ref{sec:file_perm_overview}.  Per
4825 compattezza, nella tabella si sono specificati i bit di \textit{suid},
4826 \textit{sgid} e \textit{sticky} con la notazione illustrata anche in
4827 fig.~\ref{fig:file_perm_bit}.  Nella parte inferiore si sono invece riassunti
4828 i significati dei vari bit dei permessi per una directory; anche in questo
4829 caso si è riapplicato ai bit di \textit{suid}, \textit{sgid} e \textit{sticky}
4830 la notazione illustrata in fig.~\ref{fig:file_perm_bit}.
4831
4832 Si ricordi infine che i permessi non hanno alcun significato per i
4833 collegamenti simbolici, mentre per i file di dispositivo hanno senso soltanto
4834 i permessi di lettura e scrittura, che si riflettono sulla possibilità di
4835 compiere dette operazioni sul dispositivo stesso.
4836
4837 Nella tabella si è indicato con il carattere ``-'' il fatto che il valore del
4838 bit in questione non è influente rispetto a quanto indicato nella riga della
4839 tabella; la descrizione del significato fa riferimento soltanto alla
4840 combinazione di bit per i quali è stato riportato esplicitamente un valore.
4841 Si rammenti infine che il valore dei bit dei permessi non ha alcun effetto
4842 qualora il processo possieda i privilegi di amministratore.
4843
4844
4845 \section{Caratteristiche e funzionalità avanzate}
4846 \label{sec:file_dir_advances}
4847
4848 Tratteremo qui alcune caratteristiche e funzionalità avanzate della gestione
4849 di file e directory, affrontando anche una serie di estensioni
4850 dell'interfaccia classica dei sistemi unix-like, principalmente utilizzate a
4851 scopi di sicurezza, che sono state introdotte nelle versioni più recenti di
4852 Linux.
4853
4854 \subsection{Gli attributi estesi}
4855 \label{sec:file_xattr}
4856
4857 \itindbeg{Extended~Attributes}
4858
4859 Nelle sezioni precedenti abbiamo trattato in dettaglio le varie informazioni
4860 che il sistema mantiene negli \textit{inode}, e le varie funzioni che
4861 permettono di modificarle.  Si sarà notato come in realtà queste informazioni
4862 siano estremamente ridotte.  Questo è dovuto al fatto che Unix origina negli
4863 anni '70, quando le risorse di calcolo e di spazio disco erano minime. Con il
4864 venir meno di queste restrizioni è incominciata ad emergere l'esigenza di
4865 poter associare ai file delle ulteriori informazioni astratte (quelli che
4866 abbiamo chiamato genericamente \textsl{metadati}) che però non potevano
4867 trovare spazio nei dati classici mantenuti negli \textit{inode}.
4868
4869 Per risolvere questo problema alcuni sistemi unix-like (e fra questi anche
4870 Linux) hanno introdotto un meccanismo generico, detto \textit{Extended
4871   Attributes} che consente di associare delle informazioni ulteriori ai
4872 singoli file.\footnote{essi ad esempio vengono usati per le ACL, che
4873   tratteremo in sez.~\ref{sec:file_ACL} e le \textit{file capabilities}, che
4874   vedremo in sez.~\ref{sec:proc_capabilities}.} Gli \textsl{attributi estesi}
4875 non sono altro che delle coppie nome/valore che sono associate permanentemente
4876 ad un oggetto sul filesystem, analoghi di quello che sono le variabili di
4877 ambiente (vedi sez.~\ref{sec:proc_environ}) per un processo.
4878
4879 Altri sistemi (come Solaris, MacOS e Windows) hanno adottato un meccanismo
4880 diverso in cui ad un file sono associati diversi flussi di dati, su cui
4881 possono essere mantenute ulteriori informazioni, che possono essere accedute
4882 con le normali operazioni di lettura e scrittura. Questi non vanno confusi con
4883 gli \textit{Extended Attributes} (anche se su Solaris hanno lo stesso nome),
4884 che sono un meccanismo molto più semplice, che pur essendo limitato (potendo
4885 contenere solo una quantità limitata di informazione) hanno il grande
4886 vantaggio di essere molto più semplici da realizzare, più
4887 efficienti,\footnote{cosa molto importante, specie per le applicazioni che
4888   richiedono una gran numero di accessi, come le ACL.} e di garantire
4889 l'atomicità di tutte le operazioni.
4890
4891 In Linux gli attributi estesi sono sempre associati al singolo \textit{inode}
4892 e l'accesso viene sempre eseguito in forma atomica, in lettura il valore
4893 corrente viene scritto su un buffer in memoria, mentre la scrittura prevede
4894 che ogni valore precedente sia sovrascritto.
4895
4896 Si tenga presente che non tutti i filesystem supportano gli \textit{Extended
4897   Attributes}; al momento della scrittura di queste dispense essi sono
4898 presenti solo sui vari \textsl{extN}, \textsl{ReiserFS}, \textsl{JFS},
4899 \textsl{XFS} e \textsl{Btrfs}.\footnote{l'elenco è aggiornato a Luglio 2011.}
4900 Inoltre a seconda della implementazione ci possono essere dei limiti sulla
4901 quantità di attributi che si possono utilizzare.\footnote{ad esempio nel caso
4902   di \textsl{ext2} ed \textsl{ext3} è richiesto che essi siano contenuti
4903   all'interno di un singolo blocco, pertanto con dimensioni massime pari a
4904   1024, 2048 o 4096 byte a seconda delle dimensioni di quest'ultimo impostate
4905   in fase di creazione del filesystem, mentre con \textsl{XFS} non ci sono
4906   limiti ed i dati vengono memorizzati in maniera diversa (nell'\textit{inode}
4907   stesso, in un blocco a parte, o in una struttura ad albero dedicata) per
4908   mantenerne la scalabilità.} Infine lo spazio utilizzato per mantenere gli
4909 attributi estesi viene tenuto in conto per il calcolo delle quote di utente e
4910 gruppo proprietari del file.
4911
4912 Come meccanismo per mantenere informazioni aggiuntive associate al singolo
4913 file, gli \textit{Extended Attributes} possono avere usi anche molto diversi
4914 fra loro.  Per poterli distinguere allora sono stati suddivisi in
4915 \textsl{classi}, a cui poter applicare requisiti diversi per l'accesso e la
4916 gestione. Per questo motivo il nome di un attributo deve essere sempre
4917 specificato nella forma \texttt{namespace.attribute}, dove \texttt{namespace}
4918 fa riferimento alla classe a cui l'attributo appartiene, mentre
4919 \texttt{attribute} è il nome ad esso assegnato. In tale forma il nome di un
4920 attributo esteso deve essere univoco. Al momento\footnote{della scrittura di
4921   questa sezione, kernel 2.6.23, ottobre 2007.} sono state definite le quattro
4922 classi di attributi riportate in tab.~\ref{tab:extended_attribute_class}.
4923
4924 \begin{table}[htb]
4925   \centering
4926   \footnotesize
4927   \begin{tabular}{|l|p{8cm}|}
4928     \hline
4929     \textbf{Nome} & \textbf{Descrizione} \\
4930     \hline
4931     \hline
4932     \texttt{security}&Gli \textit{extended security attributes}: vengono
4933                       utilizzati dalle estensioni di sicurezza del kernel (i
4934                       \textit{Linux Security Modules}), per le realizzazione
4935                       di meccanismi evoluti di controllo di accesso come
4936                       \textit{SELinux} o le \textit{capabilities} dei
4937                       file di sez.~\ref{sec:proc_capabilities}.\\
4938     \texttt{system} & Gli \textit{extended security attributes}: sono usati
4939                       dal kernel per memorizzare dati di sistema associati ai
4940                       file come le ACL (vedi sez.~\ref{sec:file_ACL}) o le
4941                       \textit{capabilities} (vedi
4942                       sez.~\ref{sec:proc_capabilities}).\\
4943     \texttt{trusted}& I \textit{trusted extended attributes}: vengono
4944                       utilizzati per poter realizzare in user space
4945                       meccanismi che consentano di mantenere delle
4946                       informazioni sui file che non devono essere accessibili
4947                       ai processi ordinari.\\
4948     \texttt{user}   & Gli \textit{extended user attributes}: utilizzati per
4949                       mantenere informazioni aggiuntive sui file (come il
4950                       \textit{mime-type}, la codifica dei caratteri o del
4951                       file) accessibili dagli utenti.\\
4952     \hline
4953   \end{tabular}
4954   \caption{I nomi utilizzati valore di \texttt{namespace} per distinguere le
4955     varie classi di \textit{Extended Attributes}.}
4956   \label{tab:extended_attribute_class}
4957 \end{table}
4958
4959
4960 Dato che uno degli usi degli \textit{Extended Attributes} è di impiegarli per
4961 realizzare delle estensioni (come le ACL, \textit{SELinux}, ecc.) al
4962 tradizionale meccanismo dei controlli di accesso di Unix, l'accesso ai loro
4963 valori viene regolato in maniera diversa a seconda sia della loro classe che
4964 di quali, fra le estensioni che li utilizzano, sono poste in uso. In
4965 particolare, per ciascuna delle classi riportate in
4966 tab.~\ref{tab:extended_attribute_class}, si hanno i seguenti casi:
4967 \begin{basedescript}{\desclabelwidth{1.7cm}\desclabelstyle{\nextlinelabel}}
4968 \item[\texttt{security}] L'accesso agli \textit{extended security attributes}
4969   dipende dalle politiche di sicurezza stabilite da loro stessi tramite
4970   l'utilizzo di un sistema di controllo basato sui \textit{Linux Security
4971     Modules} (ad esempio \textit{SELinux}). Pertanto l'accesso in lettura o
4972   scrittura dipende dalle politiche di sicurezza implementate all'interno dal
4973   modulo di sicurezza che si sta utilizzando al momento (ciascuno avrà le
4974   sue). Se non è stato caricato nessun modulo di sicurezza l'accesso in
4975   lettura sarà consentito a tutti i processi, mentre quello in scrittura solo
4976   ai processi con privilegi amministrativi dotati della capacità
4977   \const{CAP\_SYS\_ADMIN}.
4978
4979 \item[\texttt{system}] Anche l'accesso agli \textit{extended system
4980     attributes} dipende dalle politiche di accesso che il kernel realizza
4981   anche utilizzando gli stessi valori in essi contenuti. Ad esempio nel caso
4982   delle ACL (vedi sez.~\ref{sec:file_ACL}) l'accesso è consentito in lettura
4983   ai processi che hanno la capacità di eseguire una ricerca sul file (cioè
4984   hanno il permesso di lettura sulla directory che contiene il file) ed in
4985   scrittura al proprietario del file o ai processi dotati della capacità
4986   \const{CAP\_FOWNER}.\footnote{vale a dire una politica di accesso analoga a
4987     quella impiegata per gli ordinari permessi dei file.}
4988
4989 \item[\texttt{trusted}] L'accesso ai \textit{trusted extended attributes}, sia
4990   per la lettura che per la scrittura, è consentito soltanto ai processi con
4991   privilegi amministrativi dotati della capacità \const{CAP\_SYS\_ADMIN}. In
4992   questo modo si possono utilizzare questi attributi per realizzare in user
4993   space dei meccanismi di controllo che accedono ad informazioni non
4994   disponibili ai processi ordinari.
4995
4996 \item[\texttt{user}] L'accesso agli \textit{extended user attributes} è
4997   regolato dai normali permessi dei file: occorre avere il permesso di lettura
4998   per leggerli e quello di scrittura per scriverli o modificarli. Dato l'uso
4999   di questi attributi si è scelto di applicare al loro accesso gli stessi
5000   criteri che si usano per l'accesso al contenuto dei file (o delle directory)
5001   cui essi fanno riferimento. Questa scelta vale però soltanto per i file e le
5002   directory ordinarie, se valesse in generale infatti si avrebbe un serio
5003   problema di sicurezza dato che esistono diversi oggetti sul filesystem per i
5004   quali è normale avere il permesso di scrittura consentito a tutti gli
5005   utenti, come i collegamenti simbolici, o alcuni file di dispositivo come
5006   \texttt{/dev/null}. Se fosse possibile usare su di essi gli \textit{extended
5007     user attributes} un utente qualunque potrebbe inserirvi dati a
5008   piacere.\footnote{la cosa è stata notata su XFS, dove questo comportamento
5009     permetteva, non essendovi limiti sullo spazio occupabile dagli
5010     \textit{Extended Attributes}, di bloccare il sistema riempiendo il disco.}
5011
5012   La semantica del controllo di accesso indicata inoltre non avrebbe alcun
5013   senso al di fuori di file e directory: i permessi di lettura e scrittura per
5014   un file di dispositivo attengono alle capacità di accesso al dispositivo
5015   sottostante,\footnote{motivo per cui si può formattare un disco anche se
5016     \texttt{/dev} è su un filesystem in sola lettura.} mentre per i
5017   collegamenti simbolici questi vengono semplicemente ignorati: in nessuno dei
5018   due casi hanno a che fare con il contenuto del file, e nella discussione
5019   relativa all'uso degli \textit{extended user attributes} nessuno è mai stato
5020   capace di indicare una qualche forma sensata di utilizzo degli stessi per
5021   collegamenti simbolici o file di dispositivo, e neanche per le \textit{fifo} o i
5022   socket.  Per questo motivo essi sono stati completamente disabilitati per
5023   tutto ciò che non sia un file regolare o una directory.\footnote{si può
5024     verificare la semantica adottata consultando il file \texttt{fs/xattr.c}
5025     dei sorgenti del kernel.} Inoltre per le directory è stata introdotta una
5026   ulteriore restrizione, dovuta di nuovo alla presenza ordinaria di permessi
5027   di scrittura completi su directory come \texttt{/tmp}. Per questo motivo,
5028   per evitare eventuali abusi, se una directory ha lo \textit{sticky bit}
5029   attivo sarà consentito scrivere i suoi \textit{extended user attributes}
5030   soltanto se si è proprietari della stessa, o si hanno i privilegi
5031   amministrativi della capacità \const{CAP\_FOWNER}.
5032 \end{basedescript}
5033
5034 Le funzioni per la gestione degli attributi estesi, come altre funzioni di
5035 gestione avanzate specifiche di Linux, non fanno parte della \acr{glibc}, e
5036 sono fornite da una apposita libreria, \texttt{libattr}, che deve essere
5037 installata a parte;\footnote{la versione corrente della libreria è
5038   \texttt{libattr1}.}  pertanto se un programma le utilizza si dovrà indicare
5039 esplicitamente l'uso della suddetta libreria invocando il compilatore con
5040 l'opzione \texttt{-lattr}.
5041
5042 Per leggere gli attributi estesi sono disponibili tre diverse funzioni di
5043 sistema, \funcd{getxattr}, \funcd{lgetxattr} e \funcd{fgetxattr}, che
5044 consentono rispettivamente di richiedere gli attributi relativi a un file, a
5045 un collegamento simbolico e ad un file descriptor; i rispettivi prototipi
5046 sono:
5047
5048 \begin{funcproto}{
5049 \fhead{sys/types.h}
5050 \fhead{attr/xattr.h}
5051 \fdecl{ssize\_t getxattr(const char *path, const char *name, void *value,
5052   size\_t size)}
5053 \fdecl{ssize\_t lgetxattr(const char *path, const char *name, void *value,
5054   size\_t size)}
5055 \fdecl{ssize\_t fgetxattr(int filedes, const char *name, void *value,
5056   size\_t size)}
5057 \fdesc{Leggono il valore di un attributo esteso.}
5058 }
5059
5060 {Le funzioni ritornano un intero positivo che indica la dimensione
5061   dell'attributo richiesto in caso di successo e $-1$ per un errore, nel qual
5062   caso \var{errno} assumerà uno dei valori:
5063   \begin{errlist}
5064   \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
5065   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
5066     filesystem o sono disabilitati.
5067   \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
5068     non è sufficiente per contenere il risultato.
5069   \end{errlist}
5070   ed inoltre tutti gli errori delle analoghe della famiglia \func{stat} con lo
5071   stesso significato, ed in particolare \errcode{EPERM} se non si hanno i
5072   permessi di accesso all'attributo.}
5073 \end{funcproto}
5074
5075 Le funzioni \func{getxattr} e \func{lgetxattr} prendono come primo argomento
5076 un \textit{pathname} che indica il file di cui si vuole richiedere un
5077 attributo, la sola differenza è che la seconda, se il \textit{pathname} indica
5078 un collegamento simbolico, restituisce gli attributi di quest'ultimo e non
5079 quelli del file a cui esso fa riferimento. La funzione \func{fgetxattr} prende
5080 invece come primo argomento un numero di file descriptor, e richiede gli
5081 attributi del file ad esso associato.
5082
5083 Tutte e tre le funzioni richiedono di specificare nell'argomento \param{name}
5084 il nome dell'attributo di cui si vuole ottenere il valore. Il nome deve essere
5085 indicato comprensivo di prefisso del \textit{namespace} cui appartiene (uno
5086 dei valori di tab.~\ref{tab:extended_attribute_class}) nella forma
5087 \texttt{namespace.attributename}, come stringa terminata da un carattere NUL.
5088 Il suo valore verrà restituito nel buffer puntato dall'argomento \param{value}
5089 per una dimensione massima di \param{size} byte;\footnote{gli attributi estesi
5090   possono essere costituiti arbitrariamente da dati testuali o binari.}  se
5091 quest'ultima non è sufficiente si avrà un errore di \errcode{ERANGE}.
5092
5093 Per evitare di dover indovinare la dimensione di un attributo per tentativi si
5094 può eseguire una interrogazione utilizzando un valore nullo per \param{size};
5095 in questo caso non verrà letto nessun dato, ma verrà restituito come valore di
5096 ritorno della funzione chiamata la dimensione totale dell'attributo esteso
5097 richiesto, che si potrà usare come stima per allocare un buffer di dimensioni
5098 sufficienti.\footnote{si parla di stima perché anche se le funzioni
5099   restituiscono la dimensione esatta dell'attributo al momento in cui sono
5100   eseguite, questa potrebbe essere modificata in qualunque momento da un
5101   successivo accesso eseguito da un altro processo.}
5102
5103 Un secondo gruppo di funzioni è quello che consente di impostare il valore di
5104 un attributo esteso, queste sono \funcd{setxattr}, \funcd{lsetxattr} e
5105 \funcd{fsetxattr}, e consentono di operare rispettivamente su un file, su un
5106 collegamento simbolico o specificando un file descriptor; i loro prototipi sono:
5107
5108 \begin{funcproto}{
5109 \fhead{sys/types.h}
5110 \fhead{attr/xattr.h}
5111 \fdecl{int setxattr(const char *path, const char *name, const void *value,
5112   size\_t size, int flags)}
5113 \fdecl{int lsetxattr(const char *path, const char *name, const void *value,
5114   size\_t size, int flags)}
5115 \fdecl{int fsetxattr(int filedes, const char *name, const void *value, size\_t
5116   size, int flags)}
5117 \fdesc{Impostano il valore di un attributo esteso.}
5118 }
5119
5120 {Le funzioni ritornano un $0$ in caso di successo e $-1$ per un errore, nel qual
5121   caso \var{errno} assumerà uno dei valori:
5122   \begin{errlist}
5123   \item[\errcode{EEXIST}] si è usato il flag \const{XATTR\_CREATE} ma
5124     l'attributo esiste già.
5125   \item[\errcode{ENOATTR}] si è usato il flag \const{XATTR\_REPLACE} e
5126     l'attributo richiesto non esiste.
5127   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
5128     filesystem o sono disabilitati.
5129   \end{errlist}
5130   ed inoltre tutti gli errori delle analoghe della famiglia \func{stat} con lo
5131   stesso significato ed in particolare \errcode{EPERM} se non si hanno i
5132   permessi di accesso all'attributo.}
5133 \end{funcproto}
5134
5135 Le tre funzioni prendono come primo argomento un valore adeguato al loro
5136 scopo, usato in maniera del tutto identica a quanto visto in precedenza per le
5137 analoghe che leggono gli attributi estesi. Il secondo argomento \param{name}
5138 deve indicare, anche in questo caso con gli stessi criteri appena visti per le
5139 analoghe \func{getxattr}, \func{lgetxattr} e \func{fgetxattr}, il nome
5140 (completo di suffisso) dell'attributo su cui si vuole operare.
5141
5142 Il valore che verrà assegnato all'attributo dovrà essere preparato nel buffer
5143 puntato da \param{value}, e la sua dimensione totale (in byte) sarà indicata
5144 dall'argomento \param{size}. Infine l'argomento \param{flag} consente di
5145 controllare le modalità di sovrascrittura dell'attributo esteso, esso può
5146 prendere due valori: con \constd{XATTR\_REPLACE} si richiede che l'attributo
5147 esista, nel qual caso verrà sovrascritto, altrimenti si avrà errore, mentre
5148 con \constd{XATTR\_CREATE} si richiede che l'attributo non esista, nel qual
5149 caso verrà creato, altrimenti si avrà errore ed il valore attuale non sarà
5150 modificato.  Utilizzando per \param{flag} un valore nullo l'attributo verrà
5151 modificato se è già presente, o creato se non c'è.
5152
5153 Le funzioni finora illustrate permettono di leggere o scrivere gli attributi
5154 estesi, ma sarebbe altrettanto utile poter vedere quali sono gli attributi
5155 presenti; a questo provvedono le funzioni di sistema \funcd{listxattr},
5156 \funcd{llistxattr} e \funcd{flistxattr} i cui prototipi sono:
5157
5158 \begin{funcproto}{
5159 \fhead{sys/types.h}
5160 \fhead{attr/xattr.h}
5161 \fdecl{ssize\_t listxattr(const char *path, char *list, size\_t size)}
5162 \fdecl{ssize\_t llistxattr(const char *path, char *list, size\_t size)}
5163 \fdecl{ssize\_t flistxattr(int filedes, char *list, size\_t size)}
5164 \fdesc{Leggono la lista degli attributi estesi di un file.}
5165 }
5166
5167 {Le funzioni ritornano un intero positivo che indica la dimensione della lista
5168   in caso di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà
5169   uno dei valori:
5170   \begin{errlist}
5171   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
5172     filesystem o sono disabilitati.
5173   \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
5174     non è sufficiente per contenere il risultato.
5175   \end{errlist}
5176   ed inoltre tutti gli errori delle analoghe della famiglia \func{stat} con lo
5177   stesso significato ed in particolare \errcode{EPERM} se non si hanno i
5178   permessi di accesso all'attributo.}
5179 \end{funcproto}
5180
5181 Come per le precedenti le tre funzioni leggono gli attributi rispettivamente
5182 di un file, un collegamento simbolico o specificando un file descriptor, da
5183 specificare con il loro primo argomento. Gli altri due argomenti, identici per
5184 tutte e tre, indicano rispettivamente il puntatore \param{list} al buffer dove
5185 deve essere letta la lista e la dimensione \param{size} di quest'ultimo.
5186
5187 La lista viene fornita come sequenza non ordinata dei nomi dei singoli
5188 attributi estesi (sempre comprensivi del prefisso della loro classe) ciascuno
5189 dei quali è terminato da un carattere nullo. I nomi sono inseriti nel buffer
5190 uno di seguito all'altro. Il valore di ritorno della funzione indica la
5191 dimensione totale della lista in byte.
5192
5193 Come per le funzioni di lettura dei singoli attributi se le dimensioni del
5194 buffer non sono sufficienti si avrà un errore, ma è possibile ottenere dal
5195 valore di ritorno della funzione una stima della dimensione totale della lista
5196 usando per \param{size} un valore nullo.
5197
5198 Infine per rimuovere semplicemente un attributo esteso, si ha a disposizione
5199 un ultimo gruppo di funzioni di sistema: \funcd{removexattr},
5200 \funcd{lremovexattr} e \funcd{fremovexattr}; i rispettivi prototipi sono:
5201
5202 \begin{funcproto}{
5203 \fhead{sys/types.h}
5204 \fhead{attr/xattr.h}
5205 \fdecl{int removexattr(const char *path, const char *name)}
5206 \fdecl{int lremovexattr(const char *path, const char *name)}
5207 \fdecl{int fremovexattr(int filedes, const char *name)}
5208 \fdesc{Rimuovono un attributo esteso di un file.}
5209 }
5210
5211 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
5212   caso \var{errno} assumerà uno dei valori:
5213   \begin{errlist}
5214   \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
5215   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
5216     filesystem o sono disabilitati.
5217   \end{errlist}
5218   ed inoltre tutti gli errori delle analoghe della famiglia \func{stat} con lo
5219   stesso significato ed in particolare \errcode{EPERM} se non si hanno i
5220   permessi di accesso all'attributo.}
5221 \end{funcproto}
5222
5223 Le tre funzioni rimuovono un attributo esteso operando rispettivamente su di
5224 un file, su un collegamento simbolico o un file descriptor, che vengono
5225 specificati dal valore passato con il loro primo argomento.  L'attributo da
5226 rimuovere deve essere anche in questo caso indicato con
5227 l'argomento \param{name} secondo le stesse modalità già illustrate in
5228 precedenza per le altre funzioni relative alla gestione degli attributi
5229 estesi.
5230
5231 \itindend{Extended~Attributes}
5232
5233
5234 \subsection{Le \textit{Access  Control List}}
5235 \label{sec:file_ACL}
5236
5237 % la documentazione di sistema è nei pacchetti libacl1-dev e acl
5238 % vedi anche http://www.suse.de/~agruen/acl/linux-acls/online/
5239
5240 \itindbeg{Access~Control~List~(ACL)}
5241
5242 Il modello classico dei permessi di Unix, per quanto funzionale ed efficiente,
5243 è comunque piuttosto limitato e per quanto possa aver coperto per lunghi anni
5244 le esigenze più comuni con un meccanismo semplice e potente, non è in grado di
5245 rispondere in maniera adeguata a situazioni che richiedono una gestione
5246 complessa dei permessi di accesso.\footnote{già un requisito come quello di
5247   dare accesso in scrittura ad alcune persone ed in sola lettura ad altre non
5248   si può soddisfare in maniera semplice.}
5249
5250 Per questo motivo erano state progressivamente introdotte nelle varie versioni
5251 di Unix dei meccanismi di gestione dei permessi dei file più flessibili, nella
5252 forma delle cosiddette \textit{Access Control List} (indicate usualmente con
5253 la sigla ACL).  Nello sforzo di standardizzare queste funzionalità era stato
5254 creato un gruppo di lavoro il cui scopo era estendere lo standard POSIX 1003
5255 attraverso due nuovi insiemi di specifiche, la POSIX 1003.1e per l'interfaccia
5256 di programmazione e la POSIX 1003.2c per i comandi di shell.
5257
5258 Gli obiettivi del gruppo di lavoro erano però forse troppo ambizioni, e nel
5259 gennaio del 1998 i finanziamenti vennero ritirati senza che si fosse arrivati
5260 alla definizione dello standard richiesto. Dato però che una parte della
5261 documentazione prodotta era di alta qualità venne deciso di rilasciare al
5262 pubblico la diciassettesima bozza del documento, quella che va sotto il nome
5263 di \textit{POSIX 1003.1e Draft 17}, che è divenuta la base sulla quale si
5264 definiscono le cosiddette \textit{Posix ACL}.
5265
5266 A differenza di altri sistemi, come ad esempio FreeBSD, nel caso di Linux si è
5267 scelto di realizzare le ACL attraverso l'uso degli \textit{Extended
5268   Attributes} (appena trattati in sez.~\ref{sec:file_xattr}), e fornire tutte
5269 le relative funzioni di gestione tramite una libreria, \texttt{libacl} che
5270 nasconde i dettagli implementativi delle ACL e presenta ai programmi una
5271 interfaccia che fa riferimento allo standard POSIX 1003.1e.
5272
5273 Anche in questo caso le funzioni di questa libreria non fanno parte della
5274 \acr{glibc} e devono essere installate a parte;\footnote{la versione corrente
5275   della libreria è \texttt{libacl1}, e nel caso si usi Debian la si può
5276   installare con il pacchetto omonimo e con il collegato \texttt{libacl1-dev}
5277   per i file di sviluppo.}  pertanto se un programma le utilizza si dovrà
5278 indicare esplicitamente l'uso della libreria \texttt{libacl} invocando il
5279 compilatore con l'opzione \texttt{-lacl}. Si tenga presente inoltre che le ACL
5280 devono essere attivate esplicitamente montando il filesystem\footnote{che deve
5281   supportarle, ma questo è ormai vero per praticamente tutti i filesystem più
5282   comuni, con l'eccezione di NFS per il quale esiste però un supporto
5283   sperimentale.} su cui le si vogliono utilizzare con l'opzione \texttt{acl}
5284 attiva. Dato che si tratta di una estensione è infatti opportuno utilizzarle
5285 soltanto laddove siano necessarie.
5286
5287 Una ACL è composta da un insieme di voci, e ciascuna voce è a sua volta
5288 costituita da un \textsl{tipo}, da un eventuale
5289 \textsl{qualificatore},\footnote{deve essere presente soltanto per le voci di
5290   tipo \const{ACL\_USER} e \const{ACL\_GROUP}.} e da un insieme di permessi.
5291 Ad ogni oggetto sul filesystem si può associare una ACL che ne governa i
5292 permessi di accesso, detta \textit{access ACL}.  Inoltre per le directory si
5293 può impostare una ACL aggiuntiva, detta ``\textit{Default ACL}'', che serve ad
5294 indicare quale dovrà essere la ACL assegnata di default nella creazione di un
5295 file all'interno della directory stessa. Come avviene per i permessi le ACL
5296 possono essere impostate solo del proprietario del file, o da un processo con
5297 la capacità \const{CAP\_FOWNER}.
5298
5299 \begin{table}[htb]
5300   \centering
5301   \footnotesize
5302   \begin{tabular}{|l|p{8cm}|}
5303     \hline
5304     \textbf{Tipo} & \textbf{Descrizione} \\
5305     \hline
5306     \hline
5307     \constd{ACL\_USER\_OBJ}& Voce che contiene i diritti di accesso del
5308                              proprietario del file.\\
5309     \constd{ACL\_USER}     & Voce che contiene i diritti di accesso per
5310                              l'utente indicato dal rispettivo
5311                              qualificatore.\\
5312     \constd{ACL\_GROUP\_OBJ}&Voce che contiene i diritti di accesso del
5313                              gruppo proprietario del file.\\
5314     \constd{ACL\_GROUP}    & Voce che contiene i diritti di accesso per
5315                              il gruppo indicato dal rispettivo
5316                              qualificatore.\\
5317     \constd{ACL\_MASK}     & Voce che contiene la maschera dei massimi
5318                              permessi di accesso che possono essere garantiti
5319                              da voci del tipo \const{ACL\_USER},
5320                              \const{ACL\_GROUP} e \const{ACL\_GROUP\_OBJ}.\\
5321     \constd{ACL\_OTHER}    & Voce che contiene i diritti di accesso di chi
5322                              non corrisponde a nessuna altra voce dell'ACL.\\
5323     \hline
5324   \end{tabular}
5325   \caption{Le costanti che identificano i tipi delle voci di una ACL.}
5326   \label{tab:acl_tag_types}
5327 \end{table}
5328
5329 L'elenco dei vari tipi di voci presenti in una ACL, con una breve descrizione
5330 del relativo significato, è riportato in tab.~\ref{tab:acl_tag_types}. Tre di
5331 questi tipi, \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e
5332 \const{ACL\_OTHER}, corrispondono direttamente ai tre permessi ordinari dei
5333 file (proprietario, gruppo proprietario e tutti gli altri) e per questo una
5334 ACL valida deve sempre contenere una ed una sola voce per ciascuno di questi
5335 tipi.
5336
5337 Una ACL può poi contenere un numero arbitrario di voci di tipo
5338 \const{ACL\_USER} e \const{ACL\_GROUP}, ciascuna delle quali indicherà i
5339 permessi assegnati all'utente e al gruppo indicato dal relativo qualificatore.
5340 Ovviamente ciascuna di queste voci dovrà fare riferimento ad un utente o ad un
5341 gruppo diverso, e non corrispondenti a quelli proprietari del file. Inoltre se
5342 in una ACL esiste una voce di uno di questi due tipi, è obbligatoria anche la
5343 presenza di una ed una sola voce di tipo \const{ACL\_MASK}, che negli altri
5344 casi è opzionale.
5345
5346 Una voce di tipo \const{ACL\_MASK} serve a mantenere la maschera dei permessi
5347 che possono essere assegnati tramite voci di tipo \const{ACL\_USER},
5348 \const{ACL\_GROUP} e \const{ACL\_GROUP\_OBJ}. Se in una di queste voci si
5349 fosse specificato un permesso non presente in \const{ACL\_MASK} questo
5350 verrebbe ignorato. L'uso di una ACL di tipo \const{ACL\_MASK} è di particolare
5351 utilità quando essa associata ad una \textit{Default ACL} su una directory, in
5352 quanto i permessi così specificati verranno ereditati da tutti i file creati
5353 nella stessa directory. Si ottiene così una sorta di \textit{umask} associata
5354 ad un oggetto sul filesystem piuttosto che a un processo.
5355
5356 Dato che le ACL vengono a costituire una estensione dei permessi ordinari, uno
5357 dei problemi che si erano posti nella loro standardizzazione era appunto
5358 quello della corrispondenza fra questi e le ACL. Come accennato i permessi
5359 ordinari vengono mappati nelle tre voci di tipo \const{ACL\_USER\_OBJ},
5360 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} che devono essere presenti in
5361 qualunque ACL; un cambiamento ad una di queste voci viene automaticamente
5362 riflesso sui permessi ordinari dei file e viceversa.\footnote{per permessi
5363   ordinari si intende quelli mantenuti nell'\textit{inode}, che devono restare
5364   dato che un filesystem può essere montato senza abilitare le ACL.}
5365
5366 In realtà la mappatura è diretta solo per le voci \const{ACL\_USER\_OBJ} e
5367 \const{ACL\_OTHER}, nel caso di \const{ACL\_GROUP\_OBJ} questo vale soltanto
5368 se non è presente una voce di tipo \const{ACL\_MASK}, che è quanto avviene
5369 normalmente se non sono presenti ACL aggiuntive rispetto ai permessi
5370 ordinari. Se invece questa è presente verranno tolti dai permessi di
5371 \const{ACL\_GROUP\_OBJ} (cioè dai permessi per il gruppo proprietario del
5372 file) tutti quelli non presenti in \const{ACL\_MASK}.\footnote{questo diverso
5373   comportamento a seconda delle condizioni è stato introdotto dalla
5374   standardizzazione \textit{POSIX 1003.1e Draft 17} per mantenere il
5375   comportamento invariato sui sistemi dotati di ACL per tutte quelle
5376   applicazioni che sono conformi soltanto all'ordinario standard \textit{POSIX
5377     1003.1}.}
5378
5379 Un secondo aspetto dell'incidenza delle ACL sul comportamento del sistema è
5380 quello relativo alla creazione di nuovi file,\footnote{o oggetti sul
5381   filesystem, il comportamento discusso vale per le funzioni \func{open} e
5382   \func{creat} (vedi sez.~\ref{sec:file_open_close}), \func{mkdir} (vedi
5383   sez.~\ref{sec:file_dir_creat_rem}), \func{mknod} e \func{mkfifo} (vedi
5384   sez.~\ref{sec:file_mknod}).} che come accennato può essere modificato dalla
5385 presenza di una \textit{Default ACL} sulla directory che andrà a contenerli.
5386 Se questa non c'è valgono le regole usuali illustrate in
5387 sez.~\ref{sec:file_perm_management}, per cui essi sono determinati dalla
5388 \textit{umask} del processo, e la sola differenza è che i permessi ordinari da
5389 esse risultanti vengono automaticamente rimappati anche su una ACL di accesso
5390 assegnata automaticamente al nuovo file, che contiene soltanto le tre
5391 corrispondenti voci di tipo \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e
5392 \const{ACL\_OTHER}.
5393
5394 Se invece è presente una ACL di default sulla directory che contiene il nuovo
5395 file, essa diventerà automaticamente anche la ACL di accesso di quest'ultimo,
5396 a meno di non aver indicato, nelle funzioni di creazione che lo consentono,
5397 uno specifico valore per i permessi ordinari.\footnote{tutte le funzioni
5398   citate in precedenza supportano un argomento \var{mode} che indichi un
5399   insieme di permessi iniziale.} In tal caso saranno eliminati dalle voci
5400 corrispondenti che deriverebbero dalla ACL di default, tutti i permessi non
5401 presenti in tale indicazione.
5402
5403 Dato che questa è la ragione che ha portato alla loro creazione, la principale
5404 modifica introdotta nel sistema con la presenza della ACL è quella alle regole
5405 del controllo di accesso ai file che si sono illustrate in
5406 sez.~\ref{sec:file_perm_overview}.  Come nel caso ordinario per il controllo
5407 vengono sempre utilizzati gli identificatori del gruppo \textit{effective} del
5408 processo, ma in caso di presenza di una ACL sul file, i passi attraverso i
5409 quali viene stabilito se il processo ha il diritto di accesso sono i seguenti:
5410 \begin{enumerate}
5411 \item Se l'\ids{UID} del processo è nullo (se cioè si è l'amministratore)
5412   l'accesso è sempre garantito senza nessun controllo.\footnote{più
5413     precisamente se si devono avere le capacità \const{CAP\_DAC\_OVERRIDE} per
5414     i file e \const{CAP\_DAC\_READ\_SEARCH} per le directory, vedi
5415     sez.~\ref{sec:proc_capabilities}.}
5416 \item Se l'\ids{UID} del processo corrisponde al proprietario del file allora:
5417   \begin{itemize*}
5418   \item se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
5419     l'accesso è consentito;
5420   \item altrimenti l'accesso è negato.
5421   \end{itemize*}
5422 \item Se l'\ids{UID} del processo corrisponde ad un qualunque qualificatore
5423   presente in una voce \const{ACL\_USER} allora:
5424   \begin{itemize*}
5425   \item se la voce \const{ACL\_USER} corrispondente e la voce
5426     \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
5427     consentito;
5428   \item altrimenti l'accesso è negato.
5429   \end{itemize*}
5430 \item Se è il \ids{GID} del processo o uno dei \ids{GID} supplementari
5431   corrisponde al gruppo proprietario del file allora:
5432   \begin{itemize*}
5433   \item se la voce \const{ACL\_GROUP\_OBJ} e una eventuale voce
5434     \const{ACL\_MASK} (se non vi sono voci di tipo \const{ACL\_GROUP} questa
5435     può non essere presente) contengono entrambe il permesso richiesto,
5436     l'accesso è consentito;
5437   \item altrimenti l'accesso è negato.
5438   \end{itemize*}
5439 \item Se è il \ids{GID} del processo o uno dei \ids{GID} supplementari
5440   corrisponde ad un qualunque qualificatore presente in una voce
5441   \const{ACL\_GROUP} allora:
5442   \begin{itemize*}
5443   \item se la voce \const{ACL\_GROUP} corrispondente e la voce
5444     \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
5445     consentito;
5446   \item altrimenti l'accesso è negato.
5447   \end{itemize*}
5448 \item Se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
5449   l'accesso è consentito, altrimenti l'accesso è negato.
5450 \end{enumerate}
5451
5452 I passi di controllo vengono eseguiti esattamente in questa sequenza, e la
5453 decisione viene presa non appena viene trovata una corrispondenza con gli
5454 identificatori del processo. Questo significa che i permessi presenti in una
5455 voce di tipo \const{ACL\_USER} hanno la precedenza sui permessi ordinari
5456 associati al gruppo proprietario del file (vale a dire su
5457 \const{ACL\_GROUP\_OBJ}).
5458
5459 Per la gestione delle ACL lo standard \textit{POSIX 1003.1e Draft 17} ha
5460 previsto delle apposite funzioni ed tutta una serie di tipi di dati
5461 dedicati;\footnote{fino a definire un tipo di dato e delle costanti apposite
5462   per identificare i permessi standard di lettura, scrittura ed esecuzione.}
5463 tutte le operazioni devono essere effettuate attraverso tramite questi tipi di
5464 dati, che incapsulano tutte le informazioni contenute nelle ACL. La prima di
5465 queste funzioni che prendiamo in esame è \funcd{acl\_init}, il cui prototipo
5466 è:
5467
5468 \begin{funcproto}{
5469 \fhead{sys/types.h}
5470 \fhead{sys/acl.h}
5471 \fdecl{acl\_t acl\_init(int count)}
5472 \fdesc{Inizializza un'area di lavoro per una ACL.}
5473 }
5474
5475 {La funzione ritorna un oggetto di tipo \type{acl\_t} in caso di successo e
5476   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori:
5477   \begin{errlist}
5478   \item[\errcode{EINVAL}] il valore di \param{count} è negativo.
5479   \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile.
5480   \end{errlist}
5481 }
5482 \end{funcproto}
5483
5484 La funzione alloca ed inizializza un'area di memoria che verrà usata per
5485 mantenere i dati di una ACL contenente fino ad un massimo di \param{count}
5486 voci. La funzione ritorna un valore di tipo \typed{acl\_t} da usare in tutte le
5487 altre funzioni che operano sulla ACL. La funzione si limita alla allocazione
5488 iniziale e non inserisce nessun valore nella ACL che resta vuota.
5489
5490 Si tenga presente che pur essendo \typed{acl\_t} un tipo opaco che identifica
5491 ``\textsl{l'oggetto}'' ACL, il valore restituito dalla funzione non è altro
5492 che un puntatore all'area di memoria allocata per i dati richiesti. Pertanto
5493 in caso di fallimento verrà restituito un puntatore nullo di tipo
5494 ``\code{(acl\_t) NULL}'' e si dovrà, in questa come in tutte le funzioni
5495 seguenti che restituiscono un oggetto di tipo \type{acl\_t}, confrontare il
5496 valore di ritorno della funzione con \val{NULL}.\footnote{a voler essere
5497   estremamente pignoli si dovrebbe usare ``\code{(acl\_t) NULL}'', ma è
5498   sufficiente fare un confronto direttamente con \val{NULL} essendo cura del
5499   compilatore fare le conversioni necessarie.}
5500
5501 Una volta che si siano completate le operazioni sui dati di una ACL la memoria
5502 allocata per un oggetto \type{acl\_t} dovrà essere liberata esplicitamente
5503 attraverso una chiamata alla funzione \funcd{acl\_free}, il cui prototipo è:
5504
5505 \begin{funcproto}{
5506 \fhead{sys/types.h}
5507 \fhead{sys/acl.h}
5508 \fdecl{int acl\_free(void *obj\_p)}
5509 \fdesc{Disalloca la memoria riservata per una ACL.}
5510 }
5511
5512 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
5513   caso \var{errno} può assumere solo il valore:
5514   \begin{errlist}
5515   \item[\errcode{EINVAL}] \param{obj\_p} non è valido.
5516   \end{errlist}
5517 }
5518 \end{funcproto}
5519
5520 Si noti come la funzione usi come argomento un puntatore di tipo ``\ctyp{void
5521   *}'', essa infatti può essere usata non solo per liberare la memoria
5522 allocata per i dati di una ACL, ma anche per quella usata per creare le
5523 stringhe di descrizione testuale delle ACL o per ottenere i valori dei
5524 qualificatori della una voce di una ACL. L'uso del tipo generico ``\ctyp{void
5525   *}'' consente di evitare di eseguire un \textit{cast} al tipo di dato di cui
5526 si vuole effettuare la disallocazione.
5527
5528 Si tenga presente poi che oltre a \func{acl\_init} ci sono molte altre
5529 funzioni che possono allocare memoria per i dati delle ACL, è pertanto
5530 opportuno tenere traccia di tutte le chiamate a queste funzioni perché alla
5531 fine delle operazioni tutta la memoria allocata dovrà essere liberata con
5532 \func{acl\_free}.
5533
5534 Una volta che si abbiano a disposizione i dati di una ACL tramite il
5535 riferimento ad oggetto di tipo \type{acl\_t} questi potranno essere copiati
5536 con la funzione \funcd{acl\_dup}, il cui prototipo è:
5537
5538 \begin{funcproto}{
5539 \fhead{sys/types.h}
5540 \fhead{sys/acl.h}
5541 \fdecl{acl\_t acl\_dup(acl\_t acl)}
5542 \fdesc{Crea una copia di una ACL.}
5543 }
5544
5545 {La funzione ritorna un oggetto di tipo \type{acl\_t} in caso di successo in
5546   caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
5547   assumerà uno dei valori:
5548   \begin{errlist}
5549   \item[\errcode{EINVAL}] l'argomento \param{acl} non è un puntatore valido
5550     per una ACL.
5551   \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile per eseguire
5552     la copia.
5553   \end{errlist}
5554 }
5555 \end{funcproto}
5556
5557 La funzione crea una copia dei dati della ACL indicata tramite l'argomento
5558 \param{acl}, allocando autonomamente tutto spazio necessario alla copia e
5559 restituendo un secondo oggetto di tipo \type{acl\_t} come riferimento a
5560 quest'ultima.  Valgono per questo le stesse considerazioni fatte per il valore
5561 di ritorno di \func{acl\_init}, ed in particolare il fatto che occorrerà
5562 prevedere una ulteriore chiamata esplicita a \func{acl\_free} per liberare la
5563 memoria occupata dalla copia.
5564
5565 Se si deve creare una ACL manualmente l'uso di \func{acl\_init} è scomodo,
5566 dato che la funzione restituisce una ACL vuota, una alternativa allora è usare
5567 \funcd{acl\_from\_mode} che consente di creare una ACL a partire da un valore
5568 di permessi ordinari, il prototipo della funzione è:
5569
5570 \begin{funcproto}{
5571 \fhead{sys/types.h}
5572 \fhead{sys/acl.h}
5573 \fdecl{acl\_t acl\_from\_mode(mode\_t mode)}
5574 \fdesc{Crea una ACL inizializzata con i permessi ordinari.}
5575 }
5576
5577 {La funzione ritorna un oggetto di tipo \type{acl\_t} in caso di successo e
5578   \val{NULL} per un errore, nel qual caso \var{errno} può assumere solo
5579   il valore \errval{ENOMEM}.}
5580 \end{funcproto}
5581
5582
5583 La funzione restituisce una ACL inizializzata con le tre voci obbligatorie
5584 \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} già
5585 impostate secondo la corrispondenza ai valori dei permessi ordinari indicati
5586 dalla maschera passata nell'argomento \param{mode}. Questa funzione è una
5587 estensione usata dalle ACL di Linux e non è portabile, ma consente di
5588 semplificare l'inizializzazione in maniera molto comoda.
5589
5590 Altre due funzioni che consentono di creare una ACL già inizializzata sono
5591 \funcd{acl\_get\_fd} e \funcd{acl\_get\_file}, che consentono di leggere la
5592 ACL di un file; i rispettivi prototipi sono:
5593
5594 \begin{funcproto}{
5595 \fhead{sys/types.h}
5596 \fhead{sys/acl.h}
5597 \fdecl{acl\_t acl\_get\_file(const char *path\_p, acl\_type\_t type)}
5598 \fdecl{acl\_t acl\_get\_fd(int fd)}
5599 \fdesc{Leggono i dati delle ACL di un file.}
5600 }
5601
5602 {Le funzioni ritornano un oggetto di tipo \type{acl\_t} in caso di successo e
5603   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori:
5604   \begin{errlist}
5605   \item[\errcode{EACCESS}] non c'è accesso per una componente di
5606     \param{path\_p} o si è richiesta una ACL di default per un file (solo per
5607     \func{acl\_get\_file}).
5608   \item[\errcode{EINVAL}] \param{type} non ha un valore valido (solo per
5609     \func{acl\_get\_file}).
5610   \item[\errcode{ENOTSUP}] il filesystem cui fa riferimento il file non
5611     supporta le ACL.
5612   \end{errlist}
5613   ed inoltre \errval{ENOMEM} per entrambe, \errval{EBADF} per
5614   \func{acl\_get\_fd}, e \errval{ENAMETOOLONG}, \errval{ENOENT},
5615   \errval{ENOTDIR}, per \func{acl\_get\_file} nel loro significato generico. }
5616 \end{funcproto}
5617
5618 Le due funzioni ritornano, con un oggetto di tipo \type{acl\_t}, il valore
5619 della ACL correntemente associata ad un file, che può essere identificato
5620 tramite un file descriptor usando \func{acl\_get\_fd} o con un
5621 \textit{pathname} usando \func{acl\_get\_file}. Nel caso di quest'ultima
5622 funzione, che può richiedere anche la ACL relativa ad una directory, il
5623 secondo argomento \param{type} consente di specificare se si vuole ottenere la
5624 ACL di default o quella di accesso. Questo argomento deve essere di tipo
5625 \typed{acl\_type\_t} e può assumere solo i due valori riportati in
5626 tab.~\ref{tab:acl_type}.
5627
5628 \begin{table}[htb]
5629   \centering
5630   \footnotesize
5631   \begin{tabular}{|l|l|}
5632     \hline
5633     \textbf{Tipo} & \textbf{Descrizione} \\
5634     \hline
5635     \hline
5636     \constd{ACL\_TYPE\_ACCESS} & Indica una ACL di accesso.\\
5637     \constd{ACL\_TYPE\_DEFAULT}& Indica una ACL di default.\\
5638     \hline
5639   \end{tabular}
5640   \caption{Le costanti che identificano il tipo di ACL.}
5641   \label{tab:acl_type}
5642 \end{table}
5643
5644 Si tenga presente che nel caso di \func{acl\_get\_file} occorrerà che il
5645 processo chiamante abbia privilegi di accesso sufficienti a poter leggere gli
5646 attributi estesi dei file (come illustrati in sez.~\ref{sec:file_xattr});
5647 inoltre una ACL di tipo \const{ACL\_TYPE\_DEFAULT} potrà essere richiesta
5648 soltanto per una directory, e verrà restituita solo se presente, altrimenti
5649 verrà restituita una ACL vuota.
5650
5651 Infine si potrà creare una ACL direttamente dalla sua rappresentazione
5652 testuale con la funzione  \funcd{acl\_from\_text}, il cui prototipo è:
5653
5654 \begin{funcproto}{
5655 \fhead{sys/types.h}
5656 \fhead{sys/acl.h}
5657 \fdecl{acl\_t acl\_from\_text(const char *buf\_p)}
5658 \fdesc{Crea una ACL a partire dalla sua rappresentazione testuale.}
5659 }
5660
5661 {La funzione ritorna un oggetto di tipo \type{acl\_t} in caso di successo e
5662   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno
5663   dei valori:
5664   \begin{errlist}
5665   \item[\errcode{EINVAL}] la rappresentazione testuale all'indirizzo
5666     \param{buf\_p} non è valida.
5667   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
5668    \end{errlist}
5669 }
5670 \end{funcproto}
5671
5672 La funzione prende come argomento il puntatore ad un buffer dove si è inserita
5673 la rappresentazione testuale della ACL che si vuole creare, la memoria
5674 necessaria viene automaticamente allocata ed in caso di successo viene
5675 restituito come valore di ritorno un oggetto di tipo \type{acl\_t} con il
5676 contenuto della stessa, che come per le precedenti funzioni, dovrà essere
5677 disallocato esplicitamente al termine del suo utilizzo.
5678
5679 La rappresentazione testuale di una ACL è quella usata anche dai comandi
5680 ordinari per la gestione delle ACL (\texttt{getfacl} e \texttt{setfacl}), che
5681 prevede due diverse forme, estesa e breve, entrambe supportate da
5682 \func{acl\_from\_text}. La forma estesa prevede che sia specificata una voce
5683 per riga, nella forma:
5684 \begin{Example}
5685 tipo:qualificatore:permessi
5686 \end{Example}
5687 dove il tipo può essere uno fra \texttt{user}, \texttt{group}, \texttt{other}
5688 e \texttt{mask}. Il qualificatore è presente solo per \texttt{user} e
5689 \texttt{group} e indica l'utente o il gruppo a cui la voce si riferisce; i
5690 permessi sono espressi con una tripletta di lettere analoga a quella usata per
5691 i permessi dei file.\footnote{vale a dire ``\texttt{r}'' per il permesso di
5692   lettura, ``\texttt{w}'' per il permesso di scrittura, ``\texttt{x}'' per il
5693   permesso di esecuzione (scritti in quest'ordine) e ``\texttt{-}'' per
5694   l'assenza del permesso.}
5695
5696 Un possibile esempio di rappresentazione della ACL di un file ordinario a cui,
5697 oltre ai permessi ordinari, si è aggiunto un altro utente con un accesso in
5698 lettura, è il seguente:
5699 \begin{Example}
5700 user::rw-
5701 group::r--
5702 other::r--
5703 user:piccardi:r--
5704 \end{Example}
5705
5706 Va precisato che i due tipi \texttt{user} e \texttt{group} sono usati
5707 rispettivamente per indicare delle voci relative ad utenti e
5708 gruppi,\footnote{cioè per voci di tipo \const{ACL\_USER\_OBJ} e
5709   \const{ACL\_USER} per \texttt{user} e \const{ACL\_GROUP\_OBJ} e
5710   \const{ACL\_GROUP} per \texttt{group}.} applicate sia a quelli proprietari
5711 del file che a quelli generici; quelle dei proprietari si riconoscono per
5712 l'assenza di un qualificatore, ed in genere si scrivono per prima delle altre.
5713 Il significato delle voci di tipo \texttt{mask} e \texttt{mark} è evidente. In
5714 questa forma si possono anche inserire dei commenti precedendoli con il
5715 carattere ``\texttt{\#}''.
5716
5717 La forma breve prevede invece la scrittura delle singole voci su una riga,
5718 separate da virgole; come specificatori del tipo di voce si possono usare le
5719 iniziali dei valori usati nella forma estesa (cioè ``\texttt{u}'',
5720 ``\texttt{g}'', ``\texttt{o}'' e ``\texttt{m}''), mentre le altri parte della
5721 voce sono le stesse. In questo caso non sono consentiti permessi.
5722
5723 Per la conversione inversa, che consente di ottenere la rappresentazione
5724 testuale di una ACL, sono invece disponibili due funzioni. La prima delle due,
5725 di uso più immediato, è \funcd{acl\_to\_text}, ed il suo prototipo è:
5726
5727 \begin{funcproto}{
5728 \fhead{sys/types.h}
5729 \fhead{sys/acl.h}
5730 \fdecl{char *acl\_to\_text(acl\_t acl, ssize\_t *len\_p)}
5731 \fdesc{Produce la rappresentazione testuale di una ACL.}
5732 }
5733
5734 {La funzione ritorna il puntatore ad una stringa con la rappresentazione
5735   testuale della ACL in caso di successo e \var{NULL} per un errore, nel qual
5736   caso \var{errno} assumerà uno dei valori:
5737   \begin{errlist}
5738   \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
5739   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
5740   \end{errlist}
5741 }
5742 \end{funcproto}
5743
5744 La funzione restituisce il puntatore ad una stringa terminata da NUL
5745 contenente la rappresentazione in forma estesa della ACL passata come
5746 argomento, ed alloca automaticamente la memoria necessaria. Questa dovrà poi
5747 essere liberata, quando non più necessaria, con \func{acl\_free}. Se
5748 nell'argomento \param{len\_p} si passa un valore puntatore ad una variabile
5749 intera in questa verrà restituita (come \textit{value result argument}) la
5750 dimensione della stringa con la rappresentazione testuale, non comprendente il
5751 carattere nullo finale.
5752
5753 La seconda funzione, che permette di controllare con una gran dovizia di
5754 particolari la generazione della stringa contenente la rappresentazione
5755 testuale della ACL, è \funcd{acl\_to\_any\_text}, ed il suo prototipo è:
5756
5757 \begin{funcproto}{
5758 \fhead{sys/types.h}
5759 \fhead{sys/acl.h}
5760 \fdecl{char *acl\_to\_any\_text(acl\_t acl, const char *prefix, char
5761     separator, int options)}
5762 \fdesc{Produce la rappresentazione testuale di una ACL.}
5763 }
5764
5765 {La funzione ritorna il puntatore ad una stringa con la rappresentazione
5766   testuale della ACL in caso di successo e \val{NULL} per un errore, nel qual
5767   caso \var{errno} assumerà uno dei valori:
5768   \begin{errlist}
5769   \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
5770   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
5771   \end{errlist}
5772 }
5773 \end{funcproto}
5774
5775 La funzione converte in formato testo la ACL indicata dall'argomento
5776 \param{acl}, usando il carattere \param{separator} come separatore delle
5777 singole voci; se l'argomento \param{prefix} non è nullo la stringa da esso
5778 indicata viene utilizzata come prefisso per le singole voci.
5779
5780 L'ultimo argomento, \param{options}, consente di controllare la modalità con
5781 cui viene generata la rappresentazione testuale. Un valore nullo fa sì che
5782 vengano usati gli identificatori standard \texttt{user}, \texttt{group},
5783 \texttt{other} e \texttt{mask} con i nomi di utenti e gruppi risolti rispetto
5784 ai loro valori numerici. Altrimenti si può specificare un valore in forma di
5785 maschera binaria, da ottenere con un OR aritmetico dei valori riportati in
5786 tab.~\ref{tab:acl_to_text_options}.
5787
5788 \begin{table}[htb]
5789   \centering
5790   \footnotesize
5791   \begin{tabular}{|l|p{8cm}|}
5792     \hline
5793     \textbf{Tipo} & \textbf{Descrizione} \\
5794     \hline
5795     \hline
5796     \constd{TEXT\_ABBREVIATE}    & Stampa le voci in forma abbreviata.\\
5797     \constd{TEXT\_NUMERIC\_IDS}  & non effettua la risoluzione numerica di
5798                                    \ids{UID} e \ids{GID}.\\
5799     \constd{TEXT\_SOME\_EFFECTIVE}&Per ciascuna voce che contiene permessi che
5800                                    vengono eliminati dalla \const{ACL\_MASK}
5801                                    viene generato un commento con i permessi
5802                                    effettivamente risultanti; il commento è
5803                                    separato con un tabulatore.\\
5804     \constd{TEXT\_ALL\_EFFECTIVE}& Viene generato un commento con i permessi
5805                                    effettivi per ciascuna voce che contiene
5806                                    permessi citati nella \const{ACL\_MASK},
5807                                    anche quando questi non vengono modificati
5808                                    da essa; il commento è separato con un
5809                                    tabulatore.\\
5810     \constd{TEXT\_SMART\_INDENT} & Da usare in combinazione con le precedenti
5811                                    opzioni \const{TEXT\_SOME\_EFFECTIVE} e
5812                                    \const{TEXT\_ALL\_EFFECTIVE}, aumenta
5813                                    automaticamente il numero di spaziatori
5814                                    prima degli eventuali commenti in modo da
5815                                    mantenerli allineati.\\
5816     \hline
5817   \end{tabular}
5818   \caption{Possibili valori per l'argomento \param{options} di
5819     \func{acl\_to\_any\_text}.}
5820   \label{tab:acl_to_text_options}
5821 \end{table}
5822
5823 Come per \func{acl\_to\_text} anche in questo caso il buffer contenente la
5824 rappresentazione testuale dell'ACL, di cui la funzione restituisce
5825 l'indirizzo, viene allocato automaticamente, e dovrà essere esplicitamente
5826 disallocato con una chiamata ad \func{acl\_free}. Si tenga presente infine che
5827 questa funzione è una estensione specifica di Linux, e non è presente nella
5828 bozza dello standard POSIX.1e.
5829
5830 Per quanto utile per la visualizzazione o l'impostazione da riga di comando
5831 delle ACL, la forma testuale non è la più efficiente per poter memorizzare i
5832 dati relativi ad una ACL, ad esempio quando si vuole eseguirne una copia a
5833 scopo di archiviazione. Per questo è stata prevista la possibilità di
5834 utilizzare una rappresentazione delle ACL in una apposita forma binaria
5835 contigua e persistente. È così possibile copiare il valore di una ACL in un
5836 buffer e da questa rappresentazione tornare indietro e generare una ACL.
5837
5838 Lo standard POSIX.1e prevede a tale scopo tre funzioni, la prima e più
5839 semplice è \funcd{acl\_size}, che consente di ottenere la dimensione che avrà
5840 la citata rappresentazione binaria, in modo da poter allocare per essa un
5841 buffer di dimensione sufficiente, il suo prototipo è:
5842
5843 \begin{funcproto}{
5844 \fhead{sys/types.h}
5845 \fhead{sys/acl.h}
5846 \fdecl{ssize\_t acl\_size(acl\_t acl)}
5847 \fdesc{Determina la dimensione della rappresentazione binaria di una ACL.}
5848 }
5849
5850 {La funzione ritorna la dimensione in byte della rappresentazione binaria
5851   della ACL in caso di successo e $-1$ per un errore, nel qual caso
5852   \var{errno} può assumere solo il valore:
5853   \begin{errlist}
5854   \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
5855   \end{errlist}
5856 }
5857 \end{funcproto}
5858
5859 Ottenuta con \func{acl\_size} la dimensione per il buffer di una ACL lo si
5860 potrà allocare direttamente con \func{malloc}. La rappresentazione binaria di
5861 una ACL si potrà invece ottenere con la funzione \funcd{acl\_copy\_ext}, il
5862 cui prototipo è:
5863
5864 \begin{funcproto}{
5865 \fhead{sys/types.h}
5866 \fhead{sys/acl.h}
5867 \fdecl{ssize\_t acl\_copy\_ext(void *buf\_p, acl\_t acl, ssize\_t size)}
5868 \fdesc{Ottiene la rappresentazione binaria di una ACL.}
5869 }
5870
5871 {La funzione ritorna la dimensione in byte della rappresentazione binaria
5872   della ACL in caso di successo e $-1$ per un errore, nel qual caso
5873   \var{errno} assumerà uno dei valori:
5874   \begin{errlist}
5875   \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida o
5876     \param{size} è negativo o nullo.
5877   \item[\errcode{ERANGE}] il valore di \param{size} è più piccolo della
5878     dimensione della rappresentazione della ACL.
5879   \end{errlist}
5880 }
5881 \end{funcproto}
5882
5883 La funzione scriverà la rappresentazione binaria della ACL indicata da
5884 \param{acl} sul buffer di dimensione \param{size}
5885 all'indirizzo \param{buf\_p}, restituendo la dimensione della stessa come
5886 valore di ritorno. Qualora la dimensione della rappresentazione ecceda il
5887 valore di \param{size} la funzione fallirà con un errore di
5888 \errcode{ERANGE}. La funzione non ha nessun effetto sulla ACL indicata
5889 da \param{acl}.
5890
5891 Viceversa se si vuole ripristinare una ACL a partire da una rappresentazione
5892 binaria si potrà usare la funzione \funcd{acl\_copy\_int}, il cui prototipo è:
5893
5894 \begin{funcproto}{
5895 \fhead{sys/types.h}
5896 \fhead{sys/acl.h}
5897 \fdecl{acl\_t acl\_copy\_int(const void *buf\_p)}
5898 \fdesc{Ripristina la rappresentazione binaria di una ACL.}
5899 }
5900
5901 {La funzione ritorna un oggetto di tipo \type{acl\_t} in caso di successo e
5902   \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori:
5903   \begin{errlist}
5904   \item[\errcode{EINVAL}] il buffer all'indirizzo \param{buf\_p} non contiene
5905     una rappresentazione corretta di una ACL.
5906   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare un oggetto
5907     \type{acl\_t} per la ACL richiesta.
5908   \end{errlist}
5909 }
5910 \end{funcproto}
5911
5912 La funzione alloca autonomamente un oggetto di tipo \type{acl\_t}, restituito
5913 come valore di ritorno, con il contenuto della ACL rappresentata dai dati del
5914 buffer puntato da \param{buf\_p}. Al solito l'oggetto \type{acl\_t} dovrà
5915 essere disallocato esplicitamente al termine del suo utilizzo.
5916
5917 Una volta che si disponga della ACL desiderata, questa potrà essere impostata
5918 su un file o una directory. Per impostare una ACL sono disponibili due
5919 funzioni; la prima è \funcd{acl\_set\_file}, che opera sia su file che su
5920 directory, ed il cui prototipo è:
5921
5922 \begin{funcproto}{
5923 \fhead{sys/types.h}
5924 \fhead{sys/acl.h}
5925 \fdecl{int acl\_set\_file(const char *path, acl\_type\_t type, acl\_t acl)}
5926 \fdesc{Imposta una ACL su un file o una directory.}
5927 }
5928
5929 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
5930   caso \var{errno} assumerà uno dei valori:
5931   \begin{errlist}
5932   \item[\errcode{EACCES}] o un generico errore di accesso a \param{path} o il
5933     valore di \param{type} specifica una ACL il cui tipo non può essere
5934     assegnato a \param{path}.
5935   \item[\errcode{EINVAL}] o \param{acl} non è una ACL valida, o \param{type}
5936     ha un valore non corretto.
5937   \item[\errcode{ENOSPC}] non c'è spazio disco sufficiente per contenere i
5938     dati aggiuntivi della ACL.
5939   \item[\errcode{ENOTSUP}] si è cercato di impostare una ACL su un file
5940     contenuto in un filesystem che non supporta le ACL.
5941   \end{errlist}
5942   ed inoltre \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOTDIR},
5943   \errval{EPERM}, \errval{EROFS} nel loro significato generico.}
5944 \end{funcproto}
5945
5946 La funzione consente di assegnare la ACL contenuta in \param{acl} al file o
5947 alla directory indicate dal \textit{pathname} \param{path}, mentre
5948 con \param{type} si indica il tipo di ACL utilizzando le costanti di
5949 tab.~\ref{tab:acl_type}, ma si tenga presente che le ACL di default possono
5950 essere solo impostate qualora \param{path} indichi una directory. Inoltre
5951 perché la funzione abbia successo la ACL dovrà essere valida, e contenere
5952 tutti le voci necessarie, unica eccezione è quella in cui si specifica una ACL
5953 vuota per cancellare la ACL di default associata a
5954 \param{path}.\footnote{questo però è una estensione della implementazione delle
5955   ACL di Linux, la bozza di standard POSIX.1e prevedeva l'uso della apposita
5956   funzione \funcd{acl\_delete\_def\_file}, che prende come unico argomento il
5957   \textit{pathname} della directory di cui si vuole cancellare l'ACL di
5958   default, per i dettagli si ricorra alla pagina di manuale.}  La seconda
5959 funzione che consente di impostare una ACL è \funcd{acl\_set\_fd}, ed il suo
5960 prototipo è:
5961
5962 \begin{funcproto}{
5963 \fhead{sys/types.h}
5964 \fhead{sys/acl.h}
5965 \fdecl{int acl\_set\_fd(int fd, acl\_t acl)}
5966 \fdesc{Imposta una ACL su un file descriptor.}
5967 }
5968
5969 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
5970   caso \var{errno} assumerà uno dei valori:
5971   \begin{errlist}
5972   \item[\errcode{EINVAL}] o \param{acl} non è una ACL valida, o ha più voci di
5973     quante se ne possono assegnare al file indicato da \param{fd}.
5974   \item[\errcode{ENOSPC}] non c'è spazio disco sufficiente per contenere i
5975     dati aggiuntivi della ACL.
5976   \item[\errcode{ENOTSUP}] si è cercato di impostare una ACL su un file
5977     contenuto in un filesystem che non supporta le ACL.
5978   \end{errlist}
5979   ed inoltre \errval{EBADF}, \errval{EPERM}, \errval{EROFS} nel loro
5980   significato generico.
5981 }
5982 \end{funcproto}
5983
5984 La funzione è del tutto è analoga a \func{acl\_set\_file} ma opera
5985 esclusivamente sui file identificati tramite un file descriptor. Non dovendo
5986 avere a che fare con directory (e con la conseguente possibilità di avere una
5987 ACL di default) la funzione non necessita che si specifichi il tipo di ACL,
5988 che sarà sempre di accesso, e prende come unico argomento, a parte il file
5989 descriptor, la ACL da impostare.
5990
5991 Le funzioni viste finora operano a livello di una intera ACL, eseguendo in una
5992 sola volta tutte le operazioni relative a tutte le voci in essa contenuta. In
5993 generale è possibile modificare un singolo valore all'interno di una singola
5994 voce direttamente con le funzioni previste dallo standard POSIX.1e.  Queste
5995 funzioni però sono alquanto macchinose da utilizzare per cui è molto più
5996 semplice operare direttamente sulla rappresentazione testuale. Questo è il
5997 motivo per non tratteremo nei dettagli dette funzioni, fornendone solo una
5998 descrizione sommaria; chi fosse interessato potrà ricorrere alle pagine di
5999 manuale.
6000
6001 Se si vuole operare direttamente sui contenuti di un oggetto di tipo
6002 \type{acl\_t} infatti occorre fare riferimento alle singole voci tramite gli
6003 opportuni puntatori di tipo \typed{acl\_entry\_t}, che possono essere ottenuti
6004 dalla funzione \funcm{acl\_get\_entry} (per una voce esistente) o dalla
6005 funzione \funcm{acl\_create\_entry} per una voce da aggiungere. Nel caso della
6006 prima funzione si potrà poi ripetere la lettura per ottenere i puntatori alle
6007 singole voci successive alla prima.
6008
6009 Una volta ottenuti detti puntatori si potrà operare sui contenuti delle
6010 singole voci: con le funzioni \funcm{acl\_get\_tag\_type},
6011 \funcm{acl\_get\_qualifier}, \funcm{acl\_get\_permset} si potranno leggere
6012 rispettivamente tipo, qualificatore e permessi, mentre con le corrispondenti
6013 \funcm{acl\_set\_tag\_type}, \funcm{acl\_set\_qualifier},
6014 \funcm{acl\_set\_permset} si potranno impostare i valori; in entrambi i casi
6015 vengono utilizzati tipi di dato ad hoc, descritti nelle pagine di manuale. Si
6016 possono poi copiare i valori di una voce da una ACL ad un altra con
6017 \funcm{acl\_copy\_entry} o eliminare una voce da una ACL con
6018 \funcm{acl\_delete\_entry} e verificarne la validità prima di usarla con
6019 \funcm{acl\_valid} o \funcm{acl\_check}.
6020
6021 \itindend{Access~Control~List~(ACL)}
6022
6023 Come esempio di utilizzo di queste funzioni nei sorgenti allegati alla guida
6024 si è distribuito il programma \texttt{mygetfacl.c}, che consente di leggere le
6025 ACL di un file, passato come argomento.
6026
6027 \begin{figure}[!htb]
6028   \footnotesize \centering
6029   \begin{minipage}[c]{\codesamplewidth}
6030     \includecodesample{listati/mygetfacl.c}
6031   \end{minipage}
6032   \normalsize
6033   \caption{Corpo principale del programma \texttt{mygetfacl.c}.}
6034   \label{fig:proc_mygetfacl}
6035 \end{figure}
6036
6037 La sezione principale del programma, da cui si è rimossa la sezione sulla
6038 gestione delle opzioni, è riportata in fig.~\ref{fig:proc_mygetfacl}. Il
6039 programma richiede un unico argomento (\texttt{\small 16-20}) che indica il
6040 file di cui si vuole leggere la ACL. Se questo è presente si usa
6041 (\texttt{\small 22}) la funzione \func{get\_acl\_file} per leggerne la ACL, e
6042 si controlla (\texttt{\small 23-26}) se l'operazione ha successo, uscendo con
6043 un messaggio di errore in caso contrario.
6044
6045 Ottenuta la ACL la si converte in formato testuale (\texttt{\small 27}) con la
6046 funzione \func{acl\_to\_text}, controllando di nuovo se l'operazione ha
6047 successo (\texttt{\small 28-31}) ed uscendo in caso contrario.  Si provvede
6048 infine a stampare la rappresentazione testuale (\texttt{\small 32}) e dopo
6049 aver liberato (\texttt{\small 33-34}) le risorse allocate automaticamente, si
6050 conclude l'esecuzione.
6051
6052
6053 \subsection{La gestione delle quote disco}
6054 \label{sec:disk_quota}
6055
6056 Quella delle quote disco è una funzionalità introdotta inizialmente da BSD e
6057 presente in Linux fino dai kernel dalla serie 2.0, che consente di porre dei
6058 tetti massimi al consumo delle risorse di un filesystem (spazio disco e
6059 \textit{inode}) da parte di utenti e gruppi.
6060
6061 Dato che la funzionalità ha senso solo per i filesystem su cui si mantengono i
6062 dati degli utenti\footnote{in genere la si attiva sul filesystem che contiene
6063   le \textit{home} degli utenti, dato che non avrebbe senso per i file di
6064   sistema che in genere appartengono all'amministratore.} essa deve essere
6065 attivata esplicitamente. Questo si fa, per tutti i filesystem che le
6066 supportano, tramite due distinte opzioni di montaggio, \texttt{usrquota} e
6067 \texttt{grpquota} che abilitano le quote rispettivamente per gli utenti e per
6068 i gruppi. Così è possibile usare le limitazioni sulle quote o sugli utenti o
6069 sui gruppi o su entrambi.
6070
6071 Il meccanismo prevede che per ciascun filesystem che supporta le quote disco
6072 (i vari \textit{extN}, \textit{btrfs}, \textit{XFS}, \textit{JFS},
6073 \textit{ReiserFS}) il kernel provveda sia a mantenere aggiornati i dati
6074 relativi al consumo delle risorse da parte degli utenti e dei gruppi, che a
6075 far rispettare i limiti imposti dal sistema, con la generazione di un errore
6076 di \errcode{EDQUOT} per tutte le operazioni sui file che porterebbero ad un
6077 superamento degli stessi. Si tenga presente che questi due compiti sono
6078 separati, il primo si attiva al montaggio del filesystem con il supporto per
6079 le quote, il secondo deve essere abilitato esplicitamente.
6080
6081 Per il mantenimento dei dati di consumo delle risorse vengono usati due file
6082 riservati nella directory radice del filesystem su cui si sono attivate le
6083 quote, uno per le quote utente e l'altro per le quote gruppo.\footnote{la cosa
6084   vale per tutti i filesystem tranne \textit{XFS} che mantiene i dati
6085   internamente.} Con la versione 2 del supporto delle quote, che da anni è
6086 l'unica rimasta in uso, questi file sono \texttt{aquota.user} e
6087 \texttt{aquota.group}, in precedenza erano \texttt{quota.user} e
6088 \texttt{quota.group}.
6089
6090 Dato che questi file vengono aggiornati soltanto se il filesystem è stato
6091 montato attivando il supporto delle quote, se si abilita il supporto in un
6092 secondo tempo e nel frattempo sono state eseguite delle operazioni sul
6093 filesystem quando il supporto era disabilitato, i dati contenuti possono non
6094 corrispondere esattamente allo stato corrente del consumo delle risorse. Per
6095 questo motivo prima di montare in scrittura un filesystem su cui sono
6096 abilitate le quote viene richiesto di utilizzare il comando \cmd{quotacheck}
6097 per verificare e aggiornare i dati.
6098
6099 Le restrizioni sul consumo delle risorse previste dal sistema delle quote
6100 prevedono sempre la presenza di due diversi limiti, il primo viene detto
6101 \textit{soft limit} e può essere superato per brevi periodi di tempo senza che
6102 causare errori per lo sforamento delle quote, il secondo viene detto
6103 \textit{hard limit} e non può mai essere superato.
6104
6105 Il periodo di tempo per cui è possibile eccedere rispetto alle restrizioni
6106 indicate dal \textit{soft limit} è detto ``\textsl{periodo di grazia}''
6107 (\textit{grace period}), che si attiva non appena si supera la quota da esso
6108 indicata. Se si continua a restare al di sopra del \textit{soft limit} una
6109 volta scaduto il \textit{grace period} questo verrà trattato allo stesso modo
6110 dell'\textit{hard limit} e si avrà l'emissione immediata di un errore.
6111
6112 Si tenga presente infine che entrambi i tipi di limiti (\textit{soft limit} e
6113 \textit{hard limit}) possono essere disposti separatamente su entrambe le
6114 risorse di un filesystem, essi cioè possono essere presenti in maniera
6115 indipendente sia sullo spazio disco, con un massimo per il numero di blocchi,
6116 che sui file, con un massimo per il numero di \textit{inode}.
6117
6118 La funzione di sistema che consente di controllare tutti i vari aspetti della
6119 gestione delle quote è \funcd{quotactl}, ed il suo prototipo è:
6120
6121 \begin{funcproto}{
6122 \fhead{sys/types.h}
6123 \fhead{sys/quota.h}
6124 \fdecl{int quotactl(int cmd, const char *dev, int id, caddr\_t addr)}
6125 \fdesc{Esegue una operazione di controllo sulle quote disco.}
6126 }
6127
6128 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
6129   caso \var{errno} assumerà uno dei valori:
6130   \begin{errlist}
6131   \item[\errcode{EACCES}] si è richiesto \const{Q\_QUOTAON}, ma il file delle
6132     quote indicato da \param{addr} non esiste o non è un file ordinario.
6133   \item[\errcode{EBUSY}] si è richiesto \const{Q\_QUOTAON}, ma le quote sono
6134     già attive.
6135   \item[\errcode{EFAULT}] \param{addr} non è un puntatore valido.
6136   \item[\errcode{EINVAL}] o \param{cmd} non è un comando valido,
6137     o il dispositivo \param{dev} non esiste.
6138   \item[\errcode{EIO}] errore di lettura/scrittura sul file delle quote.
6139   \item[\errcode{EMFILE}] non si può aprire il file delle quote avendo
6140     superato il limite sul numero di file aperti nel sistema.
6141   \item[\errcode{ENODEV}] \param{dev} non corrisponde ad un \textit{mount
6142       point} attivo.
6143   \item[\errcode{ENOPKG}] il kernel è stato compilato senza supporto per le
6144     quote.
6145   \item[\errcode{ENOTBLK}] \param{dev} non è un dispositivo a blocchi.
6146   \item[\errcode{EPERM}] non si hanno i permessi per l'operazione richiesta.
6147   \item[\errcode{ESRCH}] è stato richiesto uno fra \const{Q\_GETQUOTA},
6148     \const{Q\_SETQUOTA}, \const{Q\_SETUSE}, \const{Q\_SETQLIM} per un
6149     filesystem senza quote attivate.
6150   \end{errlist}
6151 }
6152 \end{funcproto}
6153
6154 % TODO rivedere gli errori
6155
6156 La funzione richiede che il filesystem sul quale si vuole operare, che deve
6157 essere specificato con il nome del relativo file di dispositivo
6158 nell'argomento \param{dev}, sia montato con il supporto delle quote
6159 abilitato. Per le operazioni che lo richiedono inoltre si dovrà indicare con
6160 l'argomento \param{id} l'utente o il gruppo (specificati rispettivamente per
6161 \ids{UID} e \ids{GID}) su cui si vuole operare, o altri dati relativi
6162 all'operazione. Alcune operazioni più complesse usano infine
6163 l'argomento \param{addr} per indicare un indirizzo ad un area di memoria il
6164 cui utilizzo dipende dall'operazione stessa.
6165
6166 La funzione prevede la possibilità di eseguire una serie operazioni sulle
6167 quote molto diverse fra loro, la scelta viene effettuata tramite il primo
6168 argomento, \param{cmd}, che però oltre all'operazione indica anche a quale
6169 tipo di quota (utente o gruppo) l'operazione deve applicarsi. Per questo il
6170 valore di questo argomento viene costruito con l'ausilio della di una apposita
6171 macro \macro{QCMD}:
6172
6173 {\centering
6174 \vspace{3pt}
6175 \begin{funcbox}{
6176 \fhead{sys/quota.h}
6177 \fdecl{int \macrod{QCMD}(subcmd,type)}
6178 \fdesc{Imposta il comando \param{subcmd} per il tipo di quote (utente o
6179   gruppo) \param{type}.}
6180 }
6181 \end{funcbox}
6182 }
6183
6184 La macro consente di specificare, oltre al tipo di operazione, da indicare con
6185 l'argomento \param{subcmd} se questa deve applicarsi alle quote utente o alle
6186 quote gruppo. Questo viene indicato dall'argomento \param{type} che deve
6187 essere sempre definito ed assegnato ad uno fra i due valori \const{USRQUOTA} o
6188 \const{GRPQUOTA}.
6189
6190 \begin{table}[htb]
6191   \centering
6192   \footnotesize
6193   \begin{tabular}{|l|p{10cm}|}
6194     \hline
6195     \textbf{Comando} & \textbf{Descrizione} \\
6196     \hline
6197     \hline
6198     \constd{Q\_QUOTAON} & Attiva l'applicazione delle quote disco per il
6199                           filesystem indicato da \param{dev}, si deve passare
6200                           in \param{addr} il \textit{pathname} al file che
6201                           mantiene le quote, che deve esistere, e \param{id}
6202                           deve indicare la versione del formato con uno dei
6203                           valori di tab.~\ref{tab:quotactl_id_format};
6204                           l'operazione richiede i privilegi di
6205                           amministratore.\\
6206     \constd{Q\_QUOTAOFF}& Disattiva l'applicazione delle quote disco per il
6207                           filesystem indicato da \param{dev}, \param{id}
6208                           e \param{addr} vengono ignorati; l'operazione
6209                           richiede i privilegi di amministratore.\\
6210     \constd{Q\_GETQUOTA}& Legge i limiti ed i valori correnti delle quote nel
6211                           filesystem indicato da \param{dev} per l'utente o
6212                           il gruppo specificato da \param{id}; si devono avere
6213                           i privilegi di amministratore per leggere i dati
6214                           relativi ad altri utenti o a gruppi di cui non si fa
6215                           parte, il risultato viene restituito in una struttura
6216                           \struct{dqblk} all'indirizzo indicato
6217                           da \param{addr}.\\
6218     \constd{Q\_SETQUOTA}& Imposta i limiti per le quote nel filesystem
6219                           indicato da \param{dev} per l'utente o il gruppo
6220                           specificato da \param{id} secondo i valori ottenuti
6221                           dalla struttura \struct{dqblk} puntata
6222                           da \param{addr}; l'operazione richiede i privilegi
6223                           di amministratore.\\
6224     \constd{Q\_GETINFO} & Legge le informazioni (in sostanza i \textit{grace
6225                             time}) delle quote del filesystem indicato
6226                           da \param{dev} sulla struttura \struct{dqinfo}
6227                           puntata da \param{addr}, \param{id} viene ignorato.\\
6228     \constd{Q\_SETINFO} & Imposta le informazioni delle quote del filesystem
6229                           indicato da \param{dev} come ottenuti dalla
6230                           struttura \struct{dqinfo} puntata
6231                           da \param{addr}, \param{id} viene ignorato;
6232                           l'operazione richiede i privilegi di amministratore.\\
6233     \constd{Q\_GETFMT}  & Richiede il valore identificativo (quello di
6234                           tab.~\ref{tab:quotactl_id_format}) per il formato
6235                           delle quote attualmente in uso sul filesystem
6236                           indicato da \param{dev}, che sarà memorizzato
6237                           sul buffer di 4 byte puntato da \param{addr}.\\
6238     \constd{Q\_SYNC}    & Aggiorna la copia su disco dei dati delle quote del
6239                           filesystem indicato da \param{dev}; in questo
6240                           caso \param{dev} può anche essere \val{NULL} nel
6241                           qual caso verranno aggiornati i dati per tutti i
6242                           filesystem con quote attive, \param{id}
6243                           e \param{addr} vengono comunque ignorati.\\
6244     \constd{Q\_GETSTATS}& Ottiene statistiche ed altre informazioni generali
6245                           relative al sistema delle quote per il filesystem
6246                           indicato da \param{dev}, richiede che si
6247                           passi come argomento \param{addr} l'indirizzo di una
6248                           struttura \struct{dqstats}, mentre i valori
6249                           di \param{id} e \param{dev} vengono ignorati;
6250                           l'operazione è obsoleta e non supportata nei kernel
6251                           più recenti, che espongono la stessa informazione
6252                           nei file sotto \procfile{/proc/self/fs/quota/}.\\
6253 %    \const{} & .\\
6254     \hline
6255   \end{tabular}
6256   \caption{Possibili valori per l'argomento \param{subcmd} di
6257     \macro{QCMD}.}
6258   \label{tab:quotactl_commands}
6259 \end{table}
6260
6261 I possibili valori per l'argomento \param{subcmd} di \macro{QCMD} sono
6262 riportati in tab.~\ref{tab:quotactl_commands}, che illustra brevemente il
6263 significato delle operazioni associate a ciascuno di essi. In generale le
6264 operazioni di attivazione, disattivazione e di modifica dei limiti delle quote
6265 sono riservate e richiedono i privilegi di amministratore.\footnote{per essere
6266   precisi tutte le operazioni indicate come privilegiate in
6267   tab.~\ref{tab:quotactl_commands} richiedono la capacità
6268   \const{CAP\_SYS\_ADMIN}.} Inoltre gli utenti possono soltanto richiedere i
6269 dati relativi alle proprie quote, solo l'amministratore può ottenere i dati di
6270 tutti.
6271
6272
6273 Alcune delle operazioni di tab.~\ref{tab:quotactl_commands} sono alquanto
6274 complesse e richiedono un approfondimento maggiore. Le due più rilevanti sono
6275 probabilmente \const{Q\_GETQUOTA} e \const{Q\_SETQUOTA}, che consentono la
6276 gestione dei limiti delle quote. Entrambe fanno riferimento ad una specifica
6277 struttura \struct{dqblk}, la cui definizione è riportata in
6278 fig.~\ref{fig:dqblk_struct},\footnote{la definizione mostrata è quella usata
6279   fino dal kernel 2.4.22, non prenderemo in considerazione le versioni
6280   obsolete.} nella quale vengono inseriti i dati relativi alle quote di un
6281 singolo utente o gruppo.
6282
6283 \begin{figure}[!htb]
6284   \footnotesize \centering
6285   \begin{minipage}[c]{0.95\textwidth}
6286     \includestruct{listati/dqblk.h}
6287   \end{minipage}
6288   \normalsize
6289   \caption{La struttura \structd{dqblk} per i dati delle quote disco.}
6290   \label{fig:dqblk_struct}
6291 \end{figure}
6292
6293 La struttura \struct{dqblk} viene usata sia con \const{Q\_GETQUOTA} per
6294 ottenere i valori correnti dei limiti e dell'occupazione delle risorse, che
6295 con \const{Q\_SETQUOTA} per effettuare modifiche ai limiti. Come si può notare
6296 ci sono alcuni campi (in sostanza \val{dqb\_curspace}, \val{dqb\_curinodes},
6297 \val{dqb\_btime}, \val{dqb\_itime}) che hanno senso solo in lettura, in quanto
6298 riportano uno stato non modificabile da \func{quotactl} come l'uso corrente di
6299 spazio disco ed \textit{inode}, o il tempo che resta nel caso si sia superato
6300 un \textit{soft limit}.
6301
6302 Inoltre in caso di modifica di un limite si può voler operare solo su una
6303 delle risorse (blocchi o \textit{inode}),\footnote{non è possibile modificare
6304   soltanto uno dei limiti (\textit{hard} o \textit{soft}) occorre sempre
6305   rispecificarli entrambi.} per questo la struttura prevede un campo apposito,
6306 \val{dqb\_valid}, il cui scopo è quello di indicare quali sono gli altri campi
6307 che devono essere considerati validi. Questo campo è una maschera binaria che
6308 deve essere espressa nei termini di OR aritmetico delle apposite costanti di
6309 tab.~\ref{tab:quotactl_qif_const}, dove si è riportato il significato di
6310 ciascuna di esse ed i campi a cui fanno riferimento.
6311
6312 \begin{table}[!htb]
6313   \centering
6314   \footnotesize
6315   \begin{tabular}{|l|p{10cm}|}
6316     \hline
6317     \textbf{Costante} & \textbf{Descrizione} \\
6318     \hline
6319     \hline
6320     \constd{QIF\_BLIMITS}& Limiti sui blocchi di spazio disco
6321                            (\val{dqb\_bhardlimit} e \val{dqb\_bsoftlimit}).\\
6322     \constd{QIF\_SPACE}  & Uso corrente dello spazio disco
6323                            (\val{dqb\_curspace}).\\
6324     \constd{QIF\_ILIMITS}& Limiti sugli \textit{inode}
6325                            (\val{dqb\_ihardlimit} e \val{dqb\_isoftlimit}).\\
6326     \constd{QIF\_INODES} & Uso corrente degli \textit{inode}
6327                            (\val{dqb\_curinodes}).\\
6328     \constd{QIF\_BTIME}  & Tempo di sforamento del \textit{soft limit} sul
6329                            numero di blocchi (\val{dqb\_btime}).\\
6330     \constd{QIF\_ITIME}  & Tempo di sforamento del \textit{soft limit} sul
6331                            numero di \textit{inode} (\val{dqb\_itime}).\\
6332     \constd{QIF\_LIMITS} & L'insieme di \const{QIF\_BLIMITS} e
6333                            \const{QIF\_ILIMITS}.\\
6334     \constd{QIF\_USAGE}  & L'insieme di \const{QIF\_SPACE} e
6335                            \const{QIF\_INODES}.\\
6336     \constd{QIF\_TIMES}  & L'insieme di \const{QIF\_BTIME} e
6337                            \const{QIF\_ITIME}.\\
6338     \constd{QIF\_ALL}    & Tutti i precedenti.\\
6339     \hline
6340   \end{tabular}
6341   \caption{Costanti per il campo \val{dqb\_valid} di \struct{dqblk}.}
6342   \label{tab:quotactl_qif_const}
6343 \end{table}
6344
6345 In lettura con \const{Q\_SETQUOTA} eventuali valori presenti in \struct{dqblk}
6346 vengono comunque ignorati, al momento la funzione sovrascrive tutti i campi
6347 che restituisce e li marca come validi in \val{dqb\_valid}. Si possono invece
6348 usare \const{QIF\_BLIMITS} o \const{QIF\_ILIMITS} per richiedere di impostare
6349 solo la rispettiva tipologia di limiti con \const{Q\_SETQUOTA}. Si tenga
6350 presente che il sistema delle quote richiede che l'occupazione di spazio disco
6351 sia indicata in termini di blocchi e non di byte, dato che la dimensione dei
6352 blocchi dipende da come si è creato il filesystem potrà essere necessario
6353 effettuare qualche conversione per avere un valore in byte.\footnote{in genere
6354   viene usato un default di 1024 byte per blocco, ma quando si hanno file di
6355   dimensioni medie maggiori può convenire usare valori più alti per ottenere
6356   prestazioni migliori in conseguenza di un minore frazionamento dei dati e di
6357   indici più corti.}
6358
6359 Come accennato realizzazione delle quote disco ha visto diverse revisioni, con
6360 modifiche sia del formato delle stesse che dei nomi dei file utilizzate. Per
6361 questo alcune operazioni di gestione (in particolare \const{Q\_QUOTAON} e
6362 \const{Q\_GETFMT}) e possono fare riferimento a queste versioni, che vengono
6363 identificate tramite le costanti di tab.~\ref{tab:quotactl_id_format}.
6364
6365 \begin{table}[htb]
6366   \centering
6367   \footnotesize
6368   \begin{tabular}{|l|p{10cm}|}
6369     \hline
6370     \textbf{Identificatore} & \textbf{Descrizione} \\
6371     \hline
6372     \hline
6373     \constd{QFMT\_VFS\_OLD}& Il vecchio (ed obsoleto) formato delle quote.\\
6374     \constd{QFMT\_VFS\_V0} & La versione 0 usata dal VFS di Linux, supporta
6375                              \ids{UID} e \ids{GID} a 32 bit e limiti fino a
6376                              $2^{42}$ byte e $2^{32}$ file.\\
6377     \constd{QFMT\_VFS\_V1} & La versione 1 usata dal VFS di Linux, supporta
6378                              \ids{UID} e \ids{GID} a 32 bit e limiti fino a
6379                              $2^{64}$ byte e $2^{64}$ file.\\
6380     \hline
6381   \end{tabular}
6382   \caption{Valori di identificazione del formato delle quote.}
6383   \label{tab:quotactl_id_format}
6384 \end{table}
6385
6386 Altre due operazioni che necessitano di ulteriori spiegazioni sono
6387 \const{Q\_GETINFO} e \const{Q\_SETINFO}, che consentono di ottenere i dati
6388 relativi alle impostazioni delle altre proprietà delle quote, che al momento
6389 sono solo la durata del \textit{grace time} per i due tipi di limiti. Queste
6390 sono due proprietà generali identiche per tutti gli utenti (e i gruppi), per
6391 cui viene usata una operazione distinta dalle precedenti. Anche in questo caso
6392 le due operazioni richiedono l'uso di una apposita struttura \struct{dqinfo},
6393 la cui definizione è riportata in fig.~\ref{fig:dqinfo_struct}.
6394
6395 \begin{figure}[!htb]
6396   \footnotesize \centering
6397   \begin{minipage}[c]{0.8\textwidth}
6398     \includestruct{listati/dqinfo.h}
6399   \end{minipage}
6400   \normalsize
6401   \caption{La struttura \structd{dqinfo} per i dati delle quote disco.}
6402   \label{fig:dqinfo_struct}
6403 \end{figure}
6404
6405 Come per \struct{dqblk} anche in questo caso viene usato un campo della
6406 struttura, \val{dqi\_valid} come maschera binaria per dichiarare quale degli
6407 altri campi sono validi; le costanti usate per comporre questo valore sono
6408 riportate in tab.~\ref{tab:quotactl_iif_const} dove si è riportato il
6409 significato di ciascuna di esse ed i campi a cui fanno riferimento.
6410
6411 \begin{table}[htb]
6412   \centering
6413   \footnotesize
6414   \begin{tabular}{|l|l|}
6415     \hline
6416     \textbf{Costante} & \textbf{Descrizione} \\
6417     \hline
6418     \hline
6419     \constd{IIF\_BGRACE}& Il \textit{grace period} per i blocchi
6420                          (\val{dqi\_bgrace}).\\
6421     \constd{IIF\_IGRACE}& Il \textit{grace period} per gli \textit{inode}
6422                          (\val{dqi\_igrace}).\\
6423     \constd{IIF\_FLAGS} & I flag delle quote (\val{dqi\_flags}) (inusato ?).\\
6424     \constd{IIF\_ALL}   & Tutti i precedenti.\\
6425     \hline
6426   \end{tabular}
6427   \caption{Costanti per il campo \val{dqi\_valid} di \struct{dqinfo}.}
6428   \label{tab:quotactl_iif_const}
6429 \end{table}
6430
6431 Come in precedenza con \const{Q\_GETINFO} tutti i valori vengono letti
6432 sovrascrivendo il contenuto di \struct{dqinfo} e marcati come validi in
6433 \val{dqi\_valid}. In scrittura con \const{Q\_SETINFO} si può scegliere quali
6434 impostare, si tenga presente che i tempi dei campi \val{dqi\_bgrace} e
6435 \val{dqi\_igrace} devono essere specificati in secondi.
6436
6437 Come esempi dell'uso di \func{quotactl} utilizzeremo estratti del codice di un
6438 modulo Python usato per fornire una interfaccia diretta a \func{quotactl}
6439 senza dover passare dalla scansione dei risultati di un comando. Il modulo si
6440 trova fra i pacchetti Debian messi a disposizione da Truelite Srl,
6441 all'indirizzo \url{http://labs.truelite.it/projects/packages}.\footnote{in
6442   particolare il codice C del modulo è nel file \texttt{quotamodule.c}
6443   visionabile a partire dall'indirizzo indicato nella sezione
6444   \textit{Repository}.}
6445
6446 \begin{figure}[!htbp]
6447   \footnotesize \centering
6448   \begin{minipage}[c]{\codesamplewidth}
6449     \includecodesample{listati/get_quota.c}
6450   \end{minipage}
6451   \caption{Esempio di codice per ottenere i dati delle quote.}
6452   \label{fig:get_quota}
6453 \end{figure}
6454
6455 Il primo esempio, riportato in fig.~\ref{fig:get_quota}, riporta il codice
6456 della funzione che consente di leggere le quote. La funzione fa uso
6457 dell'interfaccia dal C verso Python, che definisce i vari simboli \texttt{Py*}
6458 (tipi di dato e funzioni). Non staremo ad approfondire i dettagli di questa
6459 interfaccia, per la quale esistono numerose trattazioni dettagliate, ci
6460 interessa solo esaminare l'uso di \func{quotactl}.
6461
6462 In questo caso la funzione prende come argomenti (\texttt{\small 1}) l'intero
6463 \texttt{who} che indica se si vuole operare sulle quote utente o gruppo,
6464 l'identificatore \texttt{id} dell'utente o del gruppo scelto, ed il nome del
6465 file di dispositivo del filesystem su cui si sono attivate le
6466 quote.\footnote{questi vengono passati come argomenti dalle funzioni mappate
6467   come interfaccia pubblica del modulo (una per gruppi ed una per gli utenti)
6468   che si incaricano di decodificare i dati passati da una chiamata nel codice
6469   Python.} Questi argomenti vengono passati direttamente alla chiamata a
6470 \func{quotactl} (\texttt{\small 5}), a parte \texttt{who} che viene abbinato
6471 con \macro{QCMD} al comando \const{Q\_GETQUOTA} per ottenere i dati.
6472
6473 La funzione viene eseguita all'interno di un condizionale (\texttt{\small
6474   5-16}) che in caso di successo provvede a costruire (\texttt{\small 6-12})
6475 opportunamente una risposta restituendo tramite la opportuna funzione di
6476 interfaccia un oggetto Python contenente i dati della struttura \struct{dqblk}
6477 relativi a uso corrente e limiti sia per i blocchi che per gli
6478 \textit{inode}. In caso di errore (\texttt{\small 13-15}) si usa un'altra
6479 funzione dell'interfaccia per passare il valore di \var{errno} come eccezione.
6480
6481 \begin{figure}[!htbp]
6482   \footnotesize \centering
6483   \begin{minipage}[c]{\codesamplewidth}
6484     \includecodesample{listati/set_block_quota.c}
6485   \end{minipage}
6486   \caption{Esempio di codice per impostare i limiti sullo spazio disco.}
6487   \label{fig:set_block_quota}
6488 \end{figure}
6489
6490 Per impostare i limiti sullo spazio disco si potrà usare una seconda funzione,
6491 riportata in fig.~\ref{fig:set_block_quota}, che prende gli stessi argomenti
6492 della precedente, con lo stesso significato, a cui si aggiungono i valori per
6493 il \textit{soft limit} e l'\textit{hard limit}. In questo caso occorrerà,
6494 prima di chiamare \func{quotactl}, inizializzare opportunamente
6495 (\texttt{\small 5-7}) i campi della struttura \struct{dqblk} che si vogliono
6496 utilizzare (quelli relativi ai limiti sui blocchi) e specificare gli stessi
6497 con \const{QIF\_BLIMITS} in \var{dq.dqb\_valid}.
6498
6499 Fatto questo la chiamata a \func{quotactl}, stavolta con il comando
6500 \const{Q\_SETQUOTA}, viene eseguita come in precedenza all'interno di un
6501 condizionale (\texttt{\small 9-14}). In questo caso non essendovi da
6502 restituire nessun dato in caso di successo si usa (\texttt{\small 10}) una
6503 apposita funzione di uscita, mentre si restituisce come prima una eccezione
6504 con il valore di \var{errno} in caso di errore (\texttt{\small 12-13}).
6505
6506 \subsection{La gestione dei {chroot}}
6507 \label{sec:file_chroot}
6508
6509 % TODO: valutare se introdurre una nuova sezione sulle funzionalità di
6510 % sicurezza avanzate, con dentro chroot SELinux e AppArmor, Tomoyo, Smack,
6511 % cgroup o altro
6512
6513 % TODO: spostare chroot e le funzioni affini relative ai container da qualche
6514 % parte diversa se è il caso.
6515
6516 % TODO Inheriting capabilities vedi http://lwn.net/Articles/632520/ eambient
6517 % capabilities introdotte con il kernel 4.3, vedi
6518 % http://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/commit/?id=58319057b7847667f0c9585b9de0e8932b0fdb08
6519
6520 Benché non abbia niente a che fare con permessi, utenti e gruppi, la funzione
6521 \func{chroot} viene usata spesso per restringere le capacità di accesso di un
6522 programma ad una sezione limitata del filesystem, per cui ne parleremo in
6523 questa sezione.
6524
6525 Come accennato in sez.~\ref{sec:proc_fork} ogni processo oltre ad una
6526 directory di lavoro, ha anche una directory \textsl{radice}\footnote{entrambe
6527   sono contenute in due campi (rispettivamente \var{pwd} e \var{root}) di
6528   \kstruct{fs\_struct}; vedi fig.~\ref{fig:proc_task_struct}.} che, pur
6529 essendo di norma corrispondente alla radice dell'albero dei file dell'intero
6530 sistema, ha per il processo il significato specifico di directory rispetto
6531 alla quale vengono risolti i \textit{pathname} assoluti.\footnote{cioè quando
6532   un processo chiede la risoluzione di un \textit{pathname}, il kernel usa
6533   sempre questa directory come punto di partenza.} Il fatto che questo valore
6534 sia specificato per ogni processo apre allora la possibilità di modificare le
6535 modalità di risoluzione dei \textit{pathname} assoluti da parte di un processo
6536 cambiando questa directory, così come si fa coi \textit{pathname} relativi
6537 cambiando la directory di lavoro.
6538
6539 Normalmente la directory radice di un processo coincide con la radice generica
6540 dell'albero dei file, che è la directory che viene montata direttamente dal
6541 kernel all'avvio secondo quanto illustrato in sez.~\ref{sec:file_pathname}.
6542 Questo avviene perché, come visto in sez.~\ref{cha:process_handling} la
6543 directory radice di un processo viene ereditata dal padre attraverso una
6544 \func{fork} e mantenuta attraverso una \func{exec}, e siccome tutti i processi
6545 derivano da \cmd{init}, che ha come radice quella montata dal kernel, questa
6546 verrà mantenuta.
6547
6548 In certe situazioni però è utile poter impedire che un processo possa accedere
6549 a tutto l'albero dei file iniziale; per far questo si può cambiare la sua
6550 directory radice con la funzione di sistema \funcd{chroot}, il cui prototipo
6551 è:
6552
6553 \begin{funcproto}{
6554 \fhead{unistd.h}
6555 \fdecl{int chroot(const char *path)}
6556 \fdesc{Cambia la directory radice del processo.}
6557 }
6558
6559 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
6560   caso \var{errno} assumerà uno dei valori:
6561   \begin{errlist}
6562   \item[\errcode{EPERM}] non si hanno i privilegi di amministratore.
6563   \end{errlist}
6564   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
6565   \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EACCES}, \errval{ELOOP};
6566   \errval{EROFS} e \errval{EIO} nel loro significato generico.}
6567 \end{funcproto}
6568
6569 La funzione imposta la directory radice del processo a quella specificata da
6570 \param{path} (che ovviamente deve esistere) ed ogni \textit{pathname} assoluto
6571 usato dalle funzioni chiamate nel processo sarà risolto a partire da essa,
6572 rendendo impossibile accedere alla parte di albero sovrastante. Si ha così
6573 quella che viene chiamata una \textit{chroot jail}, in quanto il processo non
6574 può più accedere a file al di fuori della sezione di albero in cui è stato
6575 \textsl{imprigionato}.
6576
6577 Solo un processo con i privilegi di amministratore può usare questa
6578 funzione,\footnote{più precisamente se possiede la capacità
6579   \const{CAP\_SYS\_CHROOT}.} e la nuova radice, per quanto detto in
6580 sez.~\ref{sec:proc_fork}, sarà ereditata da tutti i suoi processi figli. Si
6581 tenga presente però che la funzione non cambia la directory di lavoro del
6582 processo, che potrebbe restare fuori dalla \textit{chroot jail}.
6583
6584 Questo è il motivo per cui la funzione è efficace nel restringere un processo
6585 ad un ramo di albero solo se dopo averla eseguita si cedono i privilegi di
6586 amministratore. Infatti se per un qualunque motivo il processo resta con la
6587 sua directory di lavoro al di fuori dalla \textit{chroot jail}, potrà accedere
6588 a tutto il resto del filesystem usando dei \textit{pathname} relativi, dato
6589 che in tal caso è possibile, grazie all'uso di ``\texttt{..}'', risalire
6590 all'indietro fino alla radice effettiva dell'albero dei file.
6591
6592 Potrebbe sembrare che per risolvere il problema sia sufficiente ricordarsi di
6593 eseguire preventivamente anche una \func{chdir} sulla directory su cui si
6594 andrà ad eseguire \func{chroot}, così da assicurarsi che le directory di
6595 lavoro sia all'interno della \textit{chroot jail}.  Ma se ad un processo
6596 restano i privilegi di amministratore esso potrà comunque portare la sua
6597 directory di lavoro fuori dalla \textit{chroot jail} in cui si trova. Basterà
6598 infatti eseguire di nuovo \func{chroot} su una qualunque directory contenuta
6599 nell'attuale directory di lavoro perché quest'ultima risulti al di fuori della
6600 nuova \textit{chroot jail}.  Per questo motivo l'uso di questa funzione non ha
6601 molto senso quando un processo di cui si vuole limitare l'accesso necessita
6602 comunque dei privilegi di amministratore per le sue normali operazioni.
6603
6604 Nonostante queste limitazioni la funzione risulta utile qualora la si possa
6605 applicare correttamente cedendo completamente i privilegi di amministratore
6606 una volta eseguita.  Ed esempio caso tipico di uso di \func{chroot} è quello
6607 di un server FTP anonimo in si vuole che il server veda solo i file che deve
6608 trasferire. In tal caso si esegue una \func{chroot} sulla directory che
6609 contiene i file, che il server dovrà in grado di leggere come utente
6610 ordinario, e poi si cedono tutti i privilegi di amministratore.  Si tenga
6611 presente però che in casi come questo occorrerà fornire all'interno della
6612 \textit{chroot jail} un accesso anche a tutti i file (in genere programmi e
6613 librerie) di cui il server potrebbe avere bisogno.
6614
6615
6616 % LocalWords:  sez like filesystem unlink MacOS Windows VMS inode kernel unistd
6617 % LocalWords:  int const char oldpath newpath errno EXDEV EPERM st Smack SysV
6618 % LocalWords:  EEXIST EMLINK EACCES ENAMETOOLONG ENOTDIR EFAULT ENOMEM EROFS ls
6619 % LocalWords:  ELOOP ENOSPC EIO pathname nlink stat vfat fsck EISDIR ENOENT cap
6620 % LocalWords:  POSIX socket fifo sticky root system call count crash init linux
6621 % LocalWords:  descriptor remove rename rmdir stdio glibc libc NFS DT obj dup
6622 % LocalWords:  ENOTEMPTY EBUSY mount point EINVAL soft symbolic tab symlink fig
6623 % LocalWords:  dangling access chdir chmod chown creat exec lchown lstat mkdir
6624 % LocalWords:  mkfifo mknod opendir pathconf readlink truncate path buff size
6625 % LocalWords:  grub bootloader grep MAXSYMLINKS cat VFS sys dirname fcntl tv Py
6626 % LocalWords:  dev umask IFREG IFBLK IFCHR IFIFO SVr sgid BSD SVID NULL from to
6627 % LocalWords:  stream dirent EMFILE ENFILE dirfd SOURCE fchdir readdir struct
6628 % LocalWords:  EBADF namlen HAVE thread entry result value argument fileno ext
6629 % LocalWords:  name TYPE OFF RECLEN UNKNOWN REG SOCK CHR BLK type IFTODT DTTOIF
6630 % LocalWords:  DTYPE off reclen seekdir telldir void rewinddir closedir select
6631 % LocalWords:  namelist compar malloc qsort alphasort versionsort strcoll myls
6632 % LocalWords:  strcmp direntry while current working home shell pwd get stddef
6633 % LocalWords:  getcwd ERANGE getwd change fd race condition tmpnam getfacl mark
6634 % LocalWords:  string tmpdir TMP tempnam pfx TMPNAME suid tmp EXCL tmpfile pid
6635 % LocalWords:  EINTR mktemp mkstemp stlib template filename XXXXXX OpenBSD buf
6636 % LocalWords:  mkdtemp fstat filedes nell'header padding ISREG ISDIR ISCHR IFMT
6637 % LocalWords:  ISBLK ISFIFO ISLNK ISSOCK IFSOCK IFLNK IFDIR ISUID UID ISGID GID
6638 % LocalWords:  ISVTX IRUSR IWUSR IXUSR IRGRP IWGRP IXGRP IROTH IWOTH IXOTH  OLD
6639 % LocalWords:  blocks blksize holes lseek TRUNC ftruncate ETXTBSY length QCMD
6640 % LocalWords:  hole atime read utime mtime write ctime modification leafnode cp
6641 % LocalWords:  make fchmod fchown utimbuf times actime modtime Mac owner uid fs
6642 % LocalWords:  gid Control List patch mandatory control execute group other all
6643 % LocalWords:  effective passwd IGID locking swap saved text IRWXU IRWXG subcmd
6644 % LocalWords:  IRWXO capability FSETID mask capabilities chroot jail QUOTAOFF
6645 % LocalWords:  FTP filter Attributes Solaris FreeBSD libacl hash at dqblk SYNC
6646 % LocalWords:  XFS SELinux namespace attribute security trusted Draft Modules
6647 % LocalWords:  attributes mime ADMIN FOWNER libattr lattr getxattr lgetxattr of
6648 % LocalWords:  fgetxattr attr ssize ENOATTR ENOTSUP NUL setxattr lsetxattr list
6649 % LocalWords:  fsetxattr flags XATTR REPLACE listxattr llistxattr flistxattr by
6650 % LocalWords:  removexattr lremovexattr fremovexattr attributename acl GETINFO
6651 % LocalWords:  OBJ setfacl len any prefix separator options NUMERIC IDS SMART
6652 % LocalWords:  INDENT major number IDE Documentation makedev proc copy LNK long
6653 % LocalWords:  euidaccess eaccess delete def tag qualifier permset calendar NOW
6654 % LocalWords:  mutt noatime relatime strictatime atim nsec mtim ctim atimensec
6655 % LocalWords:  mtimensec utimes timeval futimes lutimes ENOSYS futimens OMIT PR
6656 % LocalWords:  utimensat timespec sec futimesat LIDS DAC OVERRIDE SEARCH chattr
6657 % LocalWords:  Discrectionary KILL SETGID domain SETUID setuid setreuid SETPCAP
6658 % LocalWords:  setresuid setfsuid IMMUTABLE immutable append only BIND SERVICE
6659 % LocalWords:  BROADCAST broadcast multicast multicasting RAW PACKET IPC LOCK
6660 % LocalWords:  memory mlock mlockall shmctl mmap MODULE RAWIO ioperm iopl PACCT
6661 % LocalWords:  ptrace accounting NICE RESOURCE TTY CONFIG hangup vhangup dell'
6662 % LocalWords:  LEASE lease SETFCAP AUDIT permitted inherited inheritable AND nn
6663 % LocalWords:  bounding execve fork capget capset header hdrp datap ESRCH undef
6664 % LocalWords:  version libcap lcap clear ncap caps pag capgetp CapInh CapPrm RT
6665 % LocalWords:  fffffeff CapEff getcap scheduling lookup  dqinfo SETINFO GETFMT
6666 % LocalWords:  NEWNS unshare nice NUMA ioctl journaling close XOPEN fdopendir
6667 % LocalWords:  btrfs mkostemp extN ReiserFS JFS Posix usrquota grpquota EDQUOT
6668 % LocalWords:  aquota quotacheck limit grace period quotactl cmd caddr addr dqb
6669 % LocalWords:  QUOTAON ENODEV ENOPKG ENOTBLK GETQUOTA SETQUOTA SETUSE SETQLIM
6670 % LocalWords:  forced allowed sendmail SYSLOG WAKE ALARM CLOCK BOOTTIME dqstats
6671 % LocalWords:  REALTIME securebits GETSTATS QFMT curspace curinodes btime itime
6672 % LocalWords:  QIF BLIMITS bhardlimit bsoftlimit ILIMITS ihardlimit isoftlimit
6673 % LocalWords:  INODES LIMITS USAGE valid dqi IIF BGRACE bgrace IGRACE igrace is
6674 % LocalWords:  Python Truelite Srl quotamodule Repository who nell' dall' KEEP
6675 % LocalWords:  SECURE KEEPCAPS prctl FIXUP NOROOT LOCKED dell'IPC dell'I IOPRIO
6676 % LocalWords:  CAPBSET CLASS IDLE dcookie overflow DIFFERS Virtual everything
6677 % LocalWords:  dentry register resolution cache dcache operation llseek poll ln
6678 % LocalWords:  multiplexing fsync fasync seek block superblock gapil tex img du
6679 % LocalWords:  second linked journaled source filesystemtype unsigned device
6680 % LocalWords:  mountflags NODEV ENXIO dummy devfs magic MGC RDONLY NOSUID MOVE
6681 % LocalWords:  NOEXEC SYNCHRONOUS REMOUNT MANDLOCK NODIRATIME umount MNT statfs
6682 % LocalWords:  fstatfs fstab mntent ino bound orig new setpcap metadati sysfs
6683 % LocalWords:  bind DIRSYNC lsattr Hierarchy FHS SHARED UNBINDABLE shared REC
6684 % LocalWords:  subtree SILENT log unbindable BUSY EAGAIN EXPIRE DETACH NOFOLLOW
6685 % LocalWords:  lazy encfs sshfs setfsent getfsent getfsfile getfsspec endfsent
6686 % LocalWords:  setmntent getmntent addmntent endmntent hasmntopt such offsetof
6687 % LocalWords:  member scan attack EOVERFLOW BITS blkcnt rdev FDCWD functions
6688 % LocalWords:  faccessat grpid lacl AppArmor capsetp mygetfacl table Tb MSK
6689 %  LocalWords:  LAZYTIME submount peer protected hardlink symlinks silly
6690
6691 %%% Local Variables:
6692 %%% mode: latex
6693 %%% TeX-master: "gapil"
6694 %%% End:
6695 %  LocalWords:  renames