filedir.tex

   1 %% filedir.tex
   2 %%
   3 %% Copyright (C) 2000-2007 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11
  12 \chapter{File e directory}
  13 \label{cha:files_and_dirs}
  14
  15 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
  16 file e directory, iniziando dalle funzioni di libreria che si usano per
  17 copiarli, spostarli e cambiarne i nomi. Esamineremo poi l'interfaccia che
  18 permette la manipolazione dei vari attributi di file e directory ed alla fine
  19 faremo una trattazione dettagliata su come è strutturato il sistema base di
  20 protezioni e controllo dell'accesso ai file e sulle funzioni che ne permettono
  21 la gestione. Tutto quello che riguarda invece la manipolazione del contenuto
  22 dei file è lasciato ai capitoli successivi.
  23
  24
  25
  26 \section{La gestione di file e directory}
  27 \label{sec:file_dir}
  28
  29 Come già accennato in sez.~\ref{sec:file_filesystem} in un sistema unix-like
  30 la gestione dei file ha delle caratteristiche specifiche che derivano
  31 direttamente dall'architettura del sistema.  In questa sezione esamineremo le
  32 funzioni usate per la manipolazione di file e directory, per la creazione di
  33 link simbolici e diretti, per la gestione e la lettura delle directory.
  34
  35 In particolare ci soffermeremo sulle conseguenze che derivano
  36 dall'architettura dei filesystem illustrata nel capitolo precedente per quanto
  37 riguarda il comportamento e gli effetti delle varie funzioni.
  38
  39
  40 \subsection{Le funzioni \func{link} e \func{unlink}}
  41 \label{sec:file_link}
  42
  43 Una caratteristica comune a diversi sistemi operativi è quella di poter creare
  44 dei nomi fittizi (come gli alias del MacOS o i collegamenti di Windows o i
  45 nomi logici del VMS) che permettono di fare riferimento allo stesso file
  46 chiamandolo con nomi diversi o accedendovi da directory diverse.
  47
  48 Questo è possibile anche in ambiente Unix, dove tali collegamenti sono
  49 usualmente chiamati \textit{link}; ma data l'architettura del sistema riguardo
  50 la gestione dei file (ed in particolare quanto trattato in
  51 sez.~\ref{sec:file_arch_func}) ci sono due metodi sostanzialmente diversi per
  52 fare questa operazione.
  53
  54 Come spiegato in sez.~\ref{sec:file_filesystem} l'accesso al contenuto di un
  55 file su disco avviene passando attraverso il suo \itindex{inode}
  56 \textit{inode}, che è la struttura usata dal kernel che lo identifica
  57 univocamente all'interno di un singolo filesystem. Il nome del file che si
  58 trova nella voce di una directory è solo un'etichetta, mantenuta all'interno
  59 della directory, che viene associata ad un puntatore che fa riferimento al
  60 suddetto \textit{inode}.
  61
  62 Questo significa che, fintanto che si resta sullo stesso filesystem, la
  63 realizzazione di un link è immediata, ed uno stesso file può avere tanti nomi
  64 diversi, dati da altrettante associazioni diverse allo stesso \itindex{inode}
  65 \textit{inode} effettuate tramite ``etichette'' diverse in directory
  66 diverse. Si noti anche che nessuno di questi nomi viene ad assumere una
  67 particolare preferenza o originalità rispetto agli altri, in quanto tutti
  68 fanno comunque riferimento allo stesso \itindex{inode} \textit{inode}.
  69
  70 Per aggiungere ad una directory una voce che faccia riferimento ad un
  71 \itindex{inode} \textit{inode} già esistente si utilizza la funzione
  72 \func{link}; si suole chiamare questo tipo di associazione un collegamento
  73 diretto, o \textit{hard link}.  Il prototipo della funzione è il seguente:
  74 \begin{prototype}{unistd.h}
  75 {int link(const char *oldpath, const char *newpath)}
  76   Crea un nuovo collegamento diretto.
  77
  78   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
  79     errore nel qual caso \var{errno} viene impostata ai valori:
  80   \begin{errlist}
  81   \item[\errcode{EXDEV}] i file \param{oldpath} e \param{newpath} non fanno
  82     riferimento ad un filesystem montato sullo stesso \textit{mount point}.
  83   \item[\errcode{EPERM}] il filesystem che contiene \param{oldpath} e
  84     \param{newpath} non supporta i link diretti o è una directory.
  85   \item[\errcode{EEXIST}] un file (o una directory) di nome \param{newpath}
  86     esiste già.
  87   \item[\errcode{EMLINK}] ci sono troppi link al file \param{oldpath} (il
  88     numero massimo è specificato dalla variabile \const{LINK\_MAX}, vedi
  89     sez.~\ref{sec:sys_limits}).
  90   \end{errlist}
  91   ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOTDIR},
  92   \errval{EFAULT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
  93   \errval{ENOSPC}, \errval{EIO}.}
  94 \end{prototype}
  95
  96 La funzione crea sul \itindex{pathname} \textit{pathname} \param{newpath} un
  97 collegamento diretto al file indicato da \param{oldpath}.  Per quanto detto la
  98 creazione di un nuovo collegamento diretto non copia il contenuto del file, ma
  99 si limita a creare una voce nella directory specificata da \param{newpath} e
 100 ad aumentare di uno il numero di riferimenti al file (riportato nel campo
 101 \var{st\_nlink} della struttura \struct{stat}, vedi sez.~\ref{sec:file_stat})
 102 aggiungendo il nuovo nome ai precedenti. Si noti che uno stesso file può
 103 essere così chiamato con vari nomi in diverse directory.
 104
 105 Per quanto dicevamo in sez.~\ref{sec:file_filesystem} la creazione di un
 106 collegamento diretto è possibile solo se entrambi i \itindex{pathname}
 107 \textit{pathname} sono nello stesso filesystem; inoltre il filesystem deve
 108 supportare i collegamenti diretti (il meccanismo non è disponibile ad esempio
 109 con il filesystem \acr{vfat} di Windows). In realtà la funzione ha un
 110 ulteriore requisito, e cioè che non solo che i due file siano sullo stesso
 111 filesystem, ma anche che si faccia riferimento ad essi sullo stesso
 112 \textit{mount point}.\footnote{si tenga presente infatti (vedi
 113   sez.~\ref{sec:sys_file_config}) che a partire dal kernel 2.4 uno stesso
 114   filesystem può essere montato più volte su directory diverse.}
 115
 116 La funzione inoltre opera sia sui file ordinari che sugli altri oggetti del
 117 filesystem, con l'eccezione delle directory. In alcune versioni di Unix solo
 118 l'amministratore è in grado di creare un collegamento diretto ad un'altra
 119 directory: questo viene fatto perché con una tale operazione è possibile
 120 creare dei \textit{loop} nel filesystem (vedi l'esempio mostrato in
 121 sez.~\ref{sec:file_symlink}, dove riprenderemo il discorso) che molti programmi
 122 non sono in grado di gestire e la cui rimozione diventerebbe estremamente
 123 complicata (in genere per questo tipo di errori occorre far girare il
 124 programma \cmd{fsck} per riparare il filesystem).
 125
 126 Data la pericolosità di questa operazione e la disponibilità dei link
 127 simbolici che possono fornire la stessa funzionalità senza questi problemi,
 128 nel caso di Linux questa capacità è stata completamente disabilitata, e al
 129 tentativo di creare un link diretto ad una directory la funzione \func{link}
 130 restituisce l'errore \errcode{EPERM}.
 131
 132 Un ulteriore comportamento peculiare di Linux è quello in cui si crea un
 133 \textit{hard link} ad un link simbolico. In questo caso lo standard POSIX
 134 prevederebbe che quest'ultimo venga risolto e che il collegamento sia
 135 effettuato rispetto al file cui esso punta, e che venga riportato un errore
 136 qualora questo non esista o non sia un file. Questo era anche il comportamento
 137 iniziale di Linux ma a partire dai kernel della serie 2.0.x\footnote{per la
 138   precisione il comportamento era quello previsto dallo standard POSIX fino al
 139   kernel di sviluppo 1.3.56, ed è stato temporaneamente ripristinato anche
 140   durante lo sviluppo della serie 2.1.x, per poi tornare al comportamento
 141   attuale fino ad oggi (per riferimento si veda
 142   \href{http://lwn.net/Articles/293902}
 143   {\texttt{http://lwn.net/Articles/293902}}).} è stato adottato un
 144 comportamento che non segue più lo standard per cui l'\textit{hard link} viene
 145 creato rispetto al link simbolico, e non al file cui questo punta.
 146
 147 La ragione di questa differenza rispetto allo standard, presente anche in
 148 altri sistemi unix-like, sono dovute al fatto che un link simbolico può fare
 149 riferimento anche ad un file non esistente o a una directory, per i quali
 150 l'\textit{hard link} non può essere creato, per cui la scelta di seguire il
 151 link simbolico è stata ritenuta una scelta scorretta nella progettazione
 152 dell'interfaccia.  Infatti se non ci fosse il comportamento adottato da Linux
 153 sarebbe impossibile creare un \textit{hard link} ad un link simbolico, perché
 154 la funzione lo risolverebbe e l'\textit{hard link} verrebbe creato verso la
 155 destinazione. Invece evitando di seguire lo standard l'operazione diventa
 156 possibile, ed anche il comportamento della funzione risulta molto più
 157 comprensibile. Tanto più che se proprio se si vuole creare un \textit{hard
 158   link} rispetto alla destinazione di un link simbolico è sempre possibile
 159 farlo direttamente.\footnote{ciò non toglie che questo comportamento fuori
 160   standard possa causare problemi, come nell'esempio descritto nell'articolo
 161   citato nella nota precedente, a programmi che non si aspettano questa
 162   differenza rispetto allo standard POSIX.}
 163
 164 La rimozione di un file (o più precisamente della voce che lo referenzia
 165 all'interno di una directory) si effettua con la funzione \funcd{unlink}; il
 166 suo prototipo è il seguente:
 167 \begin{prototype}{unistd.h}{int unlink(const char *pathname)}
 168
 169   Cancella un file.
 170
 171   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
 172     errore, nel qual caso il file non viene toccato. La variabile
 173     \var{errno} viene impostata secondo i seguenti codici di errore:
 174   \begin{errlist}
 175   \item[\errcode{EISDIR}] \param{pathname} si riferisce ad una directory.
 176     \footnotemark
 177   \item[\errcode{EROFS}] \param{pathname} è su un filesystem montato in sola
 178   lettura.
 179   \item[\errcode{EISDIR}] \param{pathname} fa riferimento a una directory.
 180   \end{errlist}
 181   ed inoltre: \errval{EACCES}, \errval{EFAULT}, \errval{ENOENT},
 182   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP},
 183   \errval{EIO}.}
 184 \end{prototype}
 185
 186 \footnotetext{questo è un valore specifico ritornato da Linux che non consente
 187   l'uso di \func{unlink} con le directory (vedi sez.~\ref{sec:file_remove}).
 188   Non è conforme allo standard POSIX, che prescrive invece l'uso di
 189   \errcode{EPERM} in caso l'operazione non sia consentita o il processo non
 190   abbia privilegi sufficienti.}
 191
 192 La funzione cancella il nome specificato da \param{pathname} nella relativa
 193 directory e decrementa il numero di riferimenti nel relativo \itindex{inode}
 194 \textit{inode}. Nel caso di link simbolico cancella il link simbolico; nel
 195 caso di socket, fifo o file di dispositivo \index{file!di~dispositivo} rimuove
 196 il nome, ma come per i file i processi che hanno aperto uno di questi oggetti
 197 possono continuare ad utilizzarlo.
 198
 199 Per cancellare una voce in una directory è necessario avere il permesso di
 200 scrittura su di essa, dato che si va a rimuovere una voce dal suo contenuto, e
 201 il diritto di esecuzione sulla directory che la contiene (affronteremo in
 202 dettaglio l'argomento dei permessi di file e directory in
 203 sez.~\ref{sec:file_access_control}). Se inoltre lo \itindex{sticky~bit}
 204 \textit{sticky bit} (vedi sez.~\ref{sec:file_special_perm}) è impostato
 205 occorrerà anche essere proprietari del file o proprietari della directory (o
 206 root, per cui nessuna delle restrizioni è applicata).
 207
 208 Una delle caratteristiche di queste funzioni è che la creazione/rimozione del
 209 nome dalla directory e l'incremento/decremento del numero di riferimenti
 210 \itindex{inode} nell'\textit{inode} devono essere effettuati in maniera
 211 atomica (si veda sez.~\ref{sec:proc_atom_oper}) senza possibili interruzioni
 212 fra le due operazioni. Per questo entrambe queste funzioni sono realizzate
 213 tramite una singola system call.
 214
 215 Si ricordi infine che un file non viene eliminato dal disco fintanto che tutti
 216 i riferimenti ad esso sono stati cancellati: solo quando il \textit{link
 217   count} mantenuto \itindex{inode} nell'\textit{inode} diventa zero lo spazio
 218 occupato su disco viene rimosso (si ricordi comunque che a questo si aggiunge
 219 sempre un'ulteriore condizione,\footnote{come vedremo in
 220   cap.~\ref{cha:file_unix_interface} il kernel mantiene anche una tabella dei
 221   file aperti nei vari processi, che a sua volta contiene i riferimenti agli
 222   \itindex{inode} \textit{inode} ad essi relativi. Prima di procedere alla
 223   cancellazione dello spazio occupato su disco dal contenuto di un file il
 224   kernel controlla anche questa tabella, per verificare che anche in essa non
 225   ci sia più nessun riferimento all'\textit{inode} in questione.} e cioè che
 226 non ci siano processi che abbiano il suddetto file aperto).
 227
 228 Questa proprietà viene spesso usata per essere sicuri di non lasciare file
 229 temporanei su disco in caso di crash dei programmi; la tecnica è quella di
 230 aprire il file e chiamare \func{unlink} subito dopo, in questo modo il
 231 contenuto del file è sempre disponibile all'interno del processo attraverso il
 232 suo file descriptor (vedi sez.~\ref{sec:file_fd}) fintanto che il processo non
 233 chiude il file, ma non ne resta traccia in nessuna directory, e lo spazio
 234 occupato su disco viene immediatamente rilasciato alla conclusione del
 235 processo (quando tutti i file vengono chiusi).
 236
 237
 238 \subsection{Le funzioni \func{remove} e \func{rename}}
 239 \label{sec:file_remove}
 240
 241 Al contrario di quanto avviene con altri Unix, in Linux non è possibile usare
 242 \func{unlink} sulle directory; per cancellare una directory si può usare la
 243 funzione \func{rmdir} (vedi sez.~\ref{sec:file_dir_creat_rem}), oppure la
 244 funzione \funcd{remove}.
 245
 246 Questa è la funzione prevista dallo standard ANSI C per cancellare un file o
 247 una directory (e funziona anche per i sistemi che non supportano i link
 248 diretti). Per i file è identica a \func{unlink} e per le directory è identica
 249 a \func{rmdir}; il suo prototipo è:
 250 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
 251   Cancella un nome dal filesystem.
 252
 253   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
 254     errore, nel qual caso il file non viene toccato.
 255
 256     I codici di errore riportati in \var{errno} sono quelli della chiamata
 257     utilizzata, pertanto si può fare riferimento a quanto illustrato nelle
 258     descrizioni di \func{unlink} e \func{rmdir}.}
 259 \end{prototype}
 260
 261 La funzione utilizza la funzione \func{unlink}\footnote{questo vale usando le
 262   \acr{glibc}; nelle libc4 e nelle libc5 la funzione \func{remove} è un
 263   semplice alias alla funzione \func{unlink} e quindi non può essere usata per
 264   le directory.} per cancellare i file e la funzione \func{rmdir} per
 265 cancellare le directory; si tenga presente che per alcune implementazioni del
 266 protocollo NFS utilizzare questa funzione può comportare la scomparsa di file
 267 ancora in uso.
 268
 269 Per cambiare nome ad un file o a una directory (che devono comunque essere
 270 nello stesso filesystem) si usa invece la funzione \funcd{rename},\footnote{la
 271   funzione è definita dallo standard ANSI C, ma si applica solo per i file, lo
 272   standard POSIX estende la funzione anche alle directory.} il cui prototipo
 273 è:
 274 \begin{prototype}{stdio.h}
 275   {int rename(const char *oldpath, const char *newpath)}
 276
 277   Rinomina un file.
 278
 279   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
 280     errore, nel qual caso il file non viene toccato. La variabile
 281     \var{errno} viene impostata secondo i seguenti codici di errore:
 282   \begin{errlist}
 283   \item[\errcode{EISDIR}] \param{newpath} è una directory mentre
 284     \param{oldpath} non è una directory.
 285   \item[\errcode{EXDEV}] \param{oldpath} e \param{newpath} non sono sullo
 286     stesso filesystem.
 287   \item[\errcode{ENOTEMPTY}] \param{newpath} è una directory già esistente e
 288     non vuota.
 289   \item[\errcode{EBUSY}] o \param{oldpath} o \param{newpath} sono in uso da
 290     parte di qualche processo (come directory di lavoro o come radice) o del
 291     sistema (come mount point).
 292   \item[\errcode{EINVAL}] \param{newpath} contiene un prefisso di
 293     \param{oldpath} o più in generale si è cercato di creare una directory come
 294     sotto-directory di se stessa.
 295   \item[\errcode{ENOTDIR}] uno dei componenti dei \itindex{pathname}
 296     \textit{pathname} non è una directory o \param{oldpath} è una directory e
 297     \param{newpath} esiste e non è una directory.
 298   \end{errlist}
 299   ed inoltre \errval{EACCES}, \errval{EPERM}, \errval{EMLINK},
 300   \errval{ENOENT}, \errval{ENOMEM}, \errval{EROFS}, \errval{ELOOP} e
 301   \errval{ENOSPC}.}
 302 \end{prototype}
 303
 304 La funzione rinomina il file \param{oldpath} in \param{newpath}, eseguendo se
 305 necessario lo spostamento di un file fra directory diverse. Eventuali altri
 306 link diretti allo stesso file non vengono influenzati.
 307
 308 Il comportamento della funzione è diverso a seconda che si voglia rinominare
 309 un file o una directory; se ci riferisce ad un file allora \param{newpath}, se
 310 esiste, non deve essere una directory (altrimenti si ha l'errore
 311 \errcode{EISDIR}). Nel caso \param{newpath} indichi un file esistente questo
 312 viene cancellato e rimpiazzato (atomicamente).
 313
 314 Se \param{oldpath} è una directory allora \param{newpath}, se esiste, deve
 315 essere una directory vuota, altrimenti si avranno gli errori \errcode{ENOTDIR}
 316 (se non è una directory) o \errcode{ENOTEMPTY} (se non è vuota). Chiaramente
 317 \param{newpath} non può contenere \param{oldpath} altrimenti si avrà un errore
 318 \errcode{EINVAL}.
 319
 320 Se \param{oldpath} si riferisce ad un link simbolico questo sarà rinominato; se
 321 \param{newpath} è un link simbolico verrà cancellato come qualunque altro
 322 file.  Infine qualora \param{oldpath} e \param{newpath} siano due nomi dello
 323 stesso file lo standard POSIX prevede che la funzione non dia errore, e non
 324 faccia nulla, lasciando entrambi i nomi; Linux segue questo standard, anche
 325 se, come fatto notare dal manuale delle \textit{glibc}, il comportamento più
 326 ragionevole sarebbe quello di cancellare \param{oldpath}.
 327
 328 Il vantaggio nell'uso di questa funzione al posto della chiamata successiva di
 329 \func{link} e \func{unlink} è che l'operazione è eseguita atomicamente, non
 330 può esistere cioè nessun istante in cui un altro processo può trovare attivi
 331 entrambi i nomi dello stesso file, o, in caso di sostituzione di un file
 332 esistente, non trovare quest'ultimo prima che la sostituzione sia stata
 333 eseguita.
 334
 335 In ogni caso se \param{newpath} esiste e l'operazione fallisce per un qualche
 336 motivo (come un crash del kernel), \func{rename} garantisce di lasciare
 337 presente un'istanza di \param{newpath}. Tuttavia nella sovrascrittura potrà
 338 esistere una finestra in cui sia \param{oldpath} che \param{newpath} fanno
 339 riferimento allo stesso file.
 340
 341
 342 \subsection{I link simbolici}
 343 \label{sec:file_symlink}
 344
 345 Come abbiamo visto in sez.~\ref{sec:file_link} la funzione \func{link} crea
 346 riferimenti agli \itindex{inode} \textit{inode}, pertanto può funzionare
 347 soltanto per file che risiedono sullo stesso filesystem e solo per un
 348 filesystem di tipo Unix.  Inoltre abbiamo visto che in Linux non è consentito
 349 eseguire un link diretto ad una directory.
 350
 351 Per ovviare a queste limitazioni i sistemi Unix supportano un'altra forma di
 352 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
 353 come avviene in altri sistemi operativi, dei file speciali che contengono
 354 semplicemente il riferimento ad un altro file (o directory). In questo modo è
 355 possibile effettuare link anche attraverso filesystem diversi, a file posti in
 356 filesystem che non supportano i link diretti, a delle directory, ed anche a
 357 file che non esistono ancora.
 358
 359 Il sistema funziona in quanto i link simbolici sono riconosciuti come tali dal
 360 kernel\footnote{è uno dei diversi tipi di file visti in
 361   tab.~\ref{tab:file_file_types}, contrassegnato come tale
 362   nell'\textit{inode}, e riconoscibile dal valore del campo \var{st\_mode}
 363   della struttura \struct{stat} (vedi sez.~\ref{sec:file_stat}).}  per cui
 364 alcune funzioni di libreria (come \func{open} o \func{stat}) quando ricevono
 365 come argomento un link simbolico vengono automaticamente applicate al file da
 366 esso specificato.  La funzione che permette di creare un nuovo link simbolico
 367 è \funcd{symlink}, ed il suo prototipo è:
 368 \begin{prototype}{unistd.h}
 369   {int symlink(const char *oldpath, const char *newpath)}
 370   Crea un nuovo link simbolico di nome \param{newpath} il cui contenuto è
 371   \param{oldpath}.
 372
 373   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
 374     errore, nel qual caso la variabile \var{errno} assumerà i valori:
 375   \begin{errlist}
 376   \item[\errcode{EPERM}] il filesystem che contiene \param{newpath} non
 377     supporta i link simbolici.
 378   \item[\errcode{ENOENT}] una componente di \param{newpath} non esiste o
 379     \param{oldpath} è una stringa vuota.
 380   \item[\errcode{EEXIST}] esiste già un file \param{newpath}.
 381   \item[\errcode{EROFS}] \param{newpath} è su un filesystem montato in sola
 382     lettura.
 383   \end{errlist}
 384   ed inoltre \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
 385   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{ENOSPC} e
 386   \errval{EIO}.}
 387 \end{prototype}
 388
 389 Si tenga presente che la funzione non effettua nessun controllo sull'esistenza
 390 di un file di nome \param{oldpath}, ma si limita ad inserire quella stringa
 391 nel link simbolico. Pertanto un link simbolico può anche riferirsi ad un file
 392 che non esiste: in questo caso si ha quello che viene chiamato un
 393 \textit{dangling link}, letteralmente un \textsl{link ciondolante}.
 394
 395 Come accennato i link simbolici sono risolti automaticamente dal kernel
 396 all'invocazione delle varie system call; in tab.~\ref{tab:file_symb_effect} si
 397 è riportato un elenco dei comportamenti delle varie funzioni di libreria che
 398 operano sui file nei confronti della risoluzione dei link simbolici,
 399 specificando quali seguono il link simbolico e quali invece possono operare
 400 direttamente sul suo contenuto.
 401 \begin{table}[htb]
 402   \centering
 403   \footnotesize
 404   \begin{tabular}[c]{|l|c|c|}
 405     \hline
 406     \textbf{Funzione} & \textbf{Segue il link} & \textbf{Non segue il link} \\
 407     \hline
 408     \hline
 409     \func{access}   & $\bullet$ & --        \\
 410     \func{chdir}    & $\bullet$ & --        \\
 411     \func{chmod}    & $\bullet$ & --        \\
 412     \func{chown}    & --        & $\bullet$ \\
 413     \func{creat}    & $\bullet$ & --        \\
 414     \func{exec}     & $\bullet$ & --        \\
 415     \func{lchown}   & $\bullet$ & --        \\
 416     \func{link}\footnotemark & --        & $\bullet$ \\
 417     \func{lstat}    & --        & $\bullet$ \\
 418     \func{mkdir}    & $\bullet$ & --        \\
 419     \func{mkfifo}   & $\bullet$ & --        \\
 420     \func{mknod}    & $\bullet$ & --        \\
 421     \func{open}     & $\bullet$ & --        \\
 422     \func{opendir}  & $\bullet$ & --        \\
 423     \func{pathconf} & $\bullet$ & --        \\
 424     \func{readlink} & --        & $\bullet$ \\
 425     \func{remove}   & --        & $\bullet$ \\
 426     \func{rename}   & --        & $\bullet$ \\
 427     \func{stat}     & $\bullet$ & --        \\
 428     \func{truncate} & $\bullet$ & --        \\
 429     \func{unlink}   & --        & $\bullet$ \\
 430     \hline
 431   \end{tabular}
 432   \caption{Uso dei link simbolici da parte di alcune funzioni.}
 433   \label{tab:file_symb_effect}
 434 \end{table}
 435
 436 \footnotetext{a partire dalla serie 2.0, e contrariamente a quanto indicato
 437   dallo standard POSIX, si veda quanto detto in sez.~\ref{sec:file_link}.}
 438
 439 Si noti che non si è specificato il comportamento delle funzioni che operano
 440 con i file descriptor, in quanto la risoluzione del link simbolico viene in
 441 genere effettuata dalla funzione che restituisce il file descriptor
 442 (normalmente la \func{open}, vedi sez.~\ref{sec:file_open}) e tutte le
 443 operazioni seguenti fanno riferimento solo a quest'ultimo.
 444
 445 Dato che, come indicato in tab.~\ref{tab:file_symb_effect}, funzioni come la
 446 \func{open} seguono i link simbolici, occorrono funzioni apposite per accedere
 447 alle informazioni del link invece che a quelle del file a cui esso fa
 448 riferimento. Quando si vuole leggere il contenuto di un link simbolico si usa
 449 la funzione \funcd{readlink}, il cui prototipo è:
 450 \begin{prototype}{unistd.h}
 451 {int readlink(const char *path, char *buff, size\_t size)}
 452   Legge il contenuto del link simbolico indicato da \param{path} nel buffer
 453   \param{buff} di dimensione \param{size}.
 454
 455   \bodydesc{La funzione restituisce il numero di caratteri letti dentro
 456     \param{buff} o -1 per un errore, nel qual caso la variabile
 457     \var{errno} assumerà i valori:
 458   \begin{errlist}
 459   \item[\errcode{EINVAL}] \param{path} non è un link simbolico o \param{size}
 460     non è positiva.
 461   \end{errlist}
 462   ed inoltre \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
 463   \errval{EACCES}, \errval{ELOOP}, \errval{EIO}, \errval{EFAULT} e
 464   \errval{ENOMEM}.}
 465 \end{prototype}
 466
 467 La funzione apre il link simbolico, ne legge il contenuto, lo scrive nel
 468 buffer, e lo richiude. Si tenga presente che la funzione non termina la
 469 stringa con un carattere nullo e la tronca alla dimensione specificata da
 470 \param{size} per evitare di sovrascrivere oltre le dimensioni del buffer.
 471
 472 \begin{figure}[htb]
 473   \centering
 474   \includegraphics[width=8.5cm]{img/link_loop}
 475   \caption{Esempio di loop nel filesystem creato con un link simbolico.}
 476   \label{fig:file_link_loop}
 477 \end{figure}
 478
 479 Un caso comune che si può avere con i link simbolici è la creazione dei
 480 cosiddetti \textit{loop}. La situazione è illustrata in
 481 fig.~\ref{fig:file_link_loop}, che riporta la struttura della directory
 482 \file{/boot}. Come si vede si è creato al suo interno un link simbolico che
 483 punta di nuovo a \file{/boot}.\footnote{il loop mostrato in
 484   fig.~\ref{fig:file_link_loop} è un usato per poter permettere a \cmd{grub}
 485   (un bootloader in grado di leggere direttamente da vari filesystem il file
 486   da lanciare come sistema operativo) di vedere i file contenuti nella
 487   directory \file{/boot} con lo stesso \textit{pathname} con cui verrebbero
 488   visti dal sistema operativo, anche se essi si trovano, come accade spesso,
 489   su una partizione separata (che \cmd{grub}, all'avvio, vede come radice).}
 490
 491 Questo può causare problemi per tutti quei programmi che effettuano la
 492 scansione di una directory senza tener conto dei link simbolici, ad esempio se
 493 lanciassimo un comando del tipo \code{grep -r linux *}, il loop nella
 494 directory porterebbe il comando ad esaminare \file{/boot}, \file{/boot/boot},
 495 \file{/boot/boot/boot} e così via.
 496
 497 Per questo motivo il kernel e le librerie prevedono che nella risoluzione di
 498 un \itindex{pathname} \textit{pathname} possano essere seguiti un numero
 499 limitato di link simbolici, il cui valore limite è specificato dalla costante
 500 \const{MAXSYMLINKS}. Qualora questo limite venga superato viene generato un
 501 errore ed \var{errno} viene impostata al valore \errcode{ELOOP}.
 502
 503 Un punto da tenere sempre presente è che, come abbiamo accennato, un link
 504 simbolico può fare riferimento anche ad un file che non esiste; ad esempio
 505 possiamo creare un file temporaneo nella nostra directory con un link del
 506 tipo:
 507 \begin{verbatim}
 508 $ ln -s /tmp/tmp_file temporaneo
 509 \end{verbatim}%$
 510 anche se \file{/tmp/tmp\_file} non esiste. Questo può generare confusione, in
 511 quanto aprendo in scrittura \file{temporaneo} verrà creato
 512 \file{/tmp/tmp\_file} e scritto; ma accedendo in sola lettura a
 513 \file{temporaneo}, ad esempio con \cmd{cat}, otterremmo:
 514 \begin{verbatim}
 515 $ cat temporaneo
 516 cat: temporaneo: No such file or directory
 517 \end{verbatim}%$
 518 con un errore che può sembrare sbagliato, dato che un'ispezione con \cmd{ls}
 519 ci mostrerebbe invece l'esistenza di \file{temporaneo}.
 520
 521
 522 \subsection{La creazione e la cancellazione delle directory}
 523 \label{sec:file_dir_creat_rem}
 524
 525 Benché in sostanza le directory non siano altro che dei file contenenti
 526 elenchi di nomi ed \itindex{inode} \textit{inode}, non è possibile trattarle
 527 come file ordinari e devono essere create direttamente dal kernel attraverso
 528 una opportuna system call.\footnote{questo è quello che permette anche,
 529   attraverso l'uso del VFS, l'utilizzo di diversi formati per la gestione dei
 530   suddetti elenchi.}  La funzione usata per creare una directory è
 531 \funcd{mkdir}, ed il suo prototipo è:
 532 \begin{functions}
 533   \headdecl{sys/stat.h}
 534   \headdecl{sys/types.h}
 535   \funcdecl{int mkdir(const char *dirname, mode\_t mode)}
 536
 537   Crea una nuova directory.
 538
 539   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
 540     errore, nel qual caso \var{errno} assumerà i valori:
 541   \begin{errlist}
 542   \item[\errcode{EEXIST}] un file (o una directory) con quel nome esiste di
 543     già.
 544   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory in
 545     cui si vuole inserire la nuova directory.
 546   \item[\errcode{EMLINK}] la directory in cui si vuole creare la nuova
 547     directory contiene troppi file; sotto Linux questo normalmente non avviene
 548     perché il filesystem standard consente la creazione di un numero di file
 549     maggiore di quelli che possono essere contenuti nel disco, ma potendo
 550     avere a che fare anche con filesystem di altri sistemi questo errore può
 551     presentarsi.
 552   \item[\errcode{ENOSPC}] non c'è abbastanza spazio sul file system per creare
 553     la nuova directory o si è esaurita la quota disco dell'utente.
 554   \end{errlist}
 555   ed inoltre anche \errval{EPERM}, \errval{EFAULT}, \errval{ENAMETOOLONG},
 556   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
 557   \errval{EROFS}.}
 558 \end{functions}
 559
 560 La funzione crea una nuova directory vuota, che contiene cioè solo le due voci
 561 standard presenti in ogni directory (cioè ``\file{.}'' e ``\file{..}''), con
 562 il nome indicato dall'argomento \param{dirname}. Il nome può essere indicato
 563 sia come \itindex{pathname} \textit{pathname} assoluto che come
 564 \itindex{pathname} \textit{pathname} relativo.
 565
 566 I permessi di accesso (vedi sez.~\ref{sec:file_access_control}) con cui la
 567 directory viene creata sono specificati dall'argomento \param{mode}, i cui
 568 possibili valori sono riportati in tab.~\ref{tab:file_permission_const}; si
 569 tenga presente che questi sono modificati dalla maschera di creazione dei file
 570 (si veda sez.~\ref{sec:file_perm_management}).  La titolarità della nuova
 571 directory è impostata secondo quanto riportato in
 572 sez.~\ref{sec:file_ownership_management}.
 573
 574 La funzione che permette la cancellazione di una directory è invece
 575 \funcd{rmdir}, ed il suo prototipo è:
 576 \begin{prototype}{sys/stat.h}{int rmdir(const char *dirname)}
 577   Cancella una directory.
 578
 579   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
 580     errore, nel qual caso \var{errno} assumerà i valori:
 581   \begin{errlist}
 582   \item[\errcode{EPERM}] il filesystem non supporta la cancellazione di
 583     directory, oppure la directory che contiene \param{dirname} ha lo
 584     \itindex{sticky~bit} \textit{sticky bit} impostato e l'user-ID effettivo
 585     del processo non corrisponde al proprietario della directory.
 586   \item[\errcode{EACCES}] non c'è il permesso di scrittura per la directory
 587     che contiene la directory che si vuole cancellare, o non c'è il permesso
 588     di attraversare (esecuzione) una delle directory specificate in
 589     \param{dirname}.
 590   \item[\errcode{EBUSY}] la directory specificata è la directory di lavoro o la
 591     radice di qualche processo.
 592   \item[\errcode{ENOTEMPTY}] la directory non è vuota.
 593   \end{errlist}
 594   ed inoltre anche \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
 595   \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP}, \errval{EROFS}.}
 596 \end{prototype}
 597
 598 La funzione cancella la directory \param{dirname}, che deve essere vuota (la
 599 directory deve cioè contenere soltanto le due voci standard ``\file{.}'' e
 600 ``\file{..}'').  Il nome può essere indicato con il \itindex{pathname}
 601 \textit{pathname} assoluto o relativo.
 602
 603 La modalità con cui avviene la cancellazione è analoga a quella di
 604 \func{unlink}: fintanto che il numero di link \itindex{inode}
 605 all'\textit{inode} della directory non diventa nullo e nessun processo ha la
 606 directory aperta lo spazio occupato su disco non viene rilasciato. Se un
 607 processo ha la directory aperta la funzione rimuove il link \itindex{inode}
 608 all'\textit{inode} e nel caso sia l'ultimo, pure le voci standard ``\file{.}''
 609 e ``\file{..}'', a questo punto il kernel non consentirà di creare più nuovi
 610 file nella directory.
 611
 612
 613 \subsection{La creazione di file speciali}
 614 \label{sec:file_mknod}
 615
 616 Finora abbiamo parlato esclusivamente di file, directory e link simbolici; in
 617 sez.~\ref{sec:file_file_types} abbiamo visto però che il sistema prevede pure
 618 degli altri tipi di file speciali, come i \index{file!di~dispositivo} file di
 619 dispositivo, le fifo ed i socket (questi ultimi sono un caso a parte, essendo
 620 associati anche alla comunicazione via rete, per cui ci saranno trattati in
 621 dettaglio a partire da cap.~\ref{cha:socket_intro}).
 622
 623 La manipolazione delle caratteristiche di questi diversi tipi di file e la
 624 loro cancellazione può essere effettuata con le stesse funzioni che operano
 625 sui file regolari; ma quando li si devono creare sono necessarie delle
 626 funzioni apposite. La prima di queste funzioni è \funcd{mknod}, il cui
 627 prototipo è:
 628 \begin{functions}
 629   \headdecl{sys/types.h}
 630   \headdecl{sys/stat.h}
 631   \headdecl{fcntl.h}
 632   \headdecl{unistd.h}
 633   \funcdecl{int mknod(const char *pathname, mode\_t mode, dev\_t dev)}
 634
 635   Crea un \textit{inode} del tipo specificato sul filesystem.
 636
 637   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
 638     errore, nel qual caso \var{errno} assumerà i valori:
 639   \begin{errlist}
 640   \item[\errcode{EPERM}] non si hanno privilegi sufficienti a creare
 641     l'\texttt{inode}, o il filesystem su cui si è cercato di
 642     creare \param{pathname} non supporta l'operazione.
 643   \item[\errcode{EINVAL}] il valore di \param{mode} non indica un file, una
 644     fifo, un socket o un dispositivo.
 645   \item[\errcode{EEXIST}] \param{pathname} esiste già o è un link simbolico.
 646   \end{errlist}
 647   ed inoltre anche \errval{EFAULT}, \errval{EACCES}, \errval{ENAMETOOLONG},
 648   \errval{ENOENT}, \errval{ENOTDIR}, \errval{ENOMEM}, \errval{ELOOP},
 649   \errval{ENOSPC}, \errval{EROFS}.}
 650 \end{functions}
 651
 652 La funzione, come suggerisce il nome, permette di creare un ``\textsl{nodo}''
 653 sul filesystem, e viene in genere utilizzata per creare i file di dispositivo,
 654 ma si può usare anche per creare file regolari. L'argomento
 655 \param{mode} specifica sia il tipo di file che si vuole creare che i relativi
 656 permessi, secondo i valori riportati in tab.~\ref{tab:file_mode_flags}, che
 657 vanno combinati con un OR binario. I permessi sono comunque modificati nella
 658 maniera usuale dal valore di \itindex{umask} \textit{umask} (si veda
 659 sez.~\ref{sec:file_perm_management}).
 660
 661 Per il tipo di file può essere specificato solo uno fra i seguenti valori:
 662 \const{S\_IFREG} per un file regolare (che sarà creato vuoto),
 663 \const{S\_IFBLK} per un dispositivo a blocchi, \const{S\_IFCHR} per un
 664 dispositivo a caratteri, \const{S\_IFSOCK} per un socket e \const{S\_IFIFO}
 665 per una fifo;\footnote{con Linux la funzione non può essere usata per creare
 666   directory o link simbolici, si dovranno usare le funzioni \func{mkdir} e
 667   \func{symlink} a questo dedicate.} un valore diverso comporterà l'errore
 668 \errcode{EINVAL}.
 669
 670 Qualora si sia specificato in \param{mode} un file di dispositivo (vale a dire
 671 o \const{S\_IFBLK} o \const{S\_IFCHR}), il valore di \param{dev} dovrà essere
 672 usato per indicare a quale dispositivo si fa riferimento, altrimenti il suo
 673 valore verrà ignorato.  Solo l'amministratore può creare un file di
 674 dispositivo usando questa funzione (il processo deve avere la
 675 \textit{capability} \const{CAP\_MKNOD}), ma in Linux\footnote{questo è un
 676   comportamento specifico di Linux, la funzione non è prevista dallo standard
 677   POSIX.1 originale, mentre è presente in SVr4 e 4.4BSD, ma esistono
 678   differenze nei comportamenti e nei codici di errore, tanto che questa è
 679   stata introdotta in POSIX.1-2001 con una nota che la definisce portabile
 680   solo quando viene usata per creare delle fifo, ma comunque deprecata essendo
 681   utilizzabile a tale scopo la specifica \func{mkfifo}.} l'uso per la
 682 creazione di un file ordinario, di una fifo o di un socket è consentito anche
 683 agli utenti normali.
 684
 685 I nuovi \itindex{inode} \textit{inode} creati con \func{mknod} apparterranno
 686 al proprietario e al gruppo del processo che li ha creati, a meno che non si
 687 sia attivato il bit \acr{sgid} per la directory o sia stata attivata la
 688 semantica BSD per il filesystem (si veda
 689 sez.~\ref{sec:file_ownership_management}) in cui si va a creare
 690 \itindex{inode} l'\textit{inode}.
 691
 692 Nella creazione di un file di dispositivo occorre poi specificare
 693 correttamente il valore di \param{dev}; questo infatti è di tipo
 694 \type{dev\_t}, che è un tipo primitivo (vedi
 695 tab.~\ref{tab:intro_primitive_types}) riservato per indicare un
 696 \textsl{numero} di dispositivo; il kernel infatti identifica ciascun
 697 dispositivo con un valore numerico. Originariamente questo era un intero a 16
 698 bit diviso in due parti di 8 bit chiamate rispettivamente
 699 \itindex{major~number} \textit{major number} e \itindex{minor~number}
 700 \textit{minor number}, che sono poi i due numeri mostrati dal comando
 701 \texttt{ls -l} al posto della dimensione quando lo si esegue su un file di
 702 dispositivo.
 703
 704 Il \itindex{major~number} \textit{major number} identifica una classe di
 705 dispositivi (ad esempio la seriale, o i dischi IDE) e serve in sostanza per
 706 indicare al kernel quale è il modulo che gestisce quella classe di
 707 dispositivi; per identificare uno specifico dispositivo di quella classe (ad
 708 esempio una singola porta seriale, o una partizione di un disco) si usa invece
 709 il \itindex{minor~number} \textit{minor number}. L'elenco aggiornato di questi
 710 numeri con le relative corrispondenze ai vari dispositivi può essere trovato
 711 nel file \texttt{Documentation/devices.txt} allegato alla documentazione dei
 712 sorgenti del kernel.
 713
 714 Data la crescita nel numero di dispositivi supportati, ben presto il limite
 715 massimo di 256 si è rivelato troppo basso, e nel passaggio dai kernel della
 716 serie 2.4 alla serie 2.6 è stata aumentata a 32 bit la dimensione del tipo
 717 \type{dev\_t}, con delle dimensioni passate a 12 bit per il
 718 \itindex{major~number} \textit{major number} e 20 bit per il
 719 \itindex{minor~number} \textit{minor number}. La transizione però ha anche
 720 comportato il passaggio di \type{dev\_t} a tipo opaco, e la necessità di
 721 specificare il numero tramite delle opportune macro, così da non avere
 722 problemi di compatibilità con eventuali ulteriori estensioni.
 723
 724 Le macro sono definite nel file \file{sys/sysmacros.h}, che viene
 725 automaticamente incluso quando si include \file{sys/types.h}; si possono
 726 pertanto ottenere i valori del \itindex{major~number} \textit{major number} e
 727 \itindex{minor~number} \textit{minor number} di un dispositivo rispettivamente
 728 con le macro \macro{major} e \macro{minor}:
 729 \begin{functions}
 730   \headdecl{sys/types.h}
 731   \funcdecl{int \macro{major}(dev\_t dev)}
 732   Restituisce il \itindex{major~number} \textit{major number} del dispositivo
 733   \param{dev}.
 734
 735   \funcdecl{int \macro{minor}(dev\_t dev)}
 736   Restituisce il \itindex{minor~number} \textit{minor number} del dispositivo
 737   \param{dev}.
 738 \end{functions}
 739 \noindent mentre una volta che siano noti \itindex{major~number} \textit{major
 740   number} e \itindex{minor~number} \textit{minor number} si potrà costruire il
 741 relativo identificativo con la macro \macro{makedev}:
 742 \begin{functions}
 743   \headdecl{sys/types.h}
 744   \funcdecl{dev\_t \macro{minor}(int major, int minor)}
 745
 746   Restituisce l'identificativo di un dispositivo dati \itindex{major~number}
 747   \textit{major number} e \itindex{minor~number} \textit{minor number}.
 748 \end{functions}
 749
 750 Infine con lo standard POSIX.1-2001 è stata introdotta una funzione specifica
 751 per creare una fifo (tratteremo le fifo in in sez.~\ref{sec:ipc_named_pipe});
 752 la funzione è \funcd{mkfifo} ed il suo prototipo è:
 753 \begin{functions}
 754   \headdecl{sys/types.h} \headdecl{sys/stat.h}
 755
 756   \funcdecl{int mkfifo(const char *pathname, mode\_t mode)}
 757
 758   Crea una fifo.
 759
 760   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
 761     errore, nel qual caso \var{errno} assumerà i valori \errval{EACCES},
 762     \errval{EEXIST}, \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOSPC},
 763     \errval{ENOTDIR} e \errval{EROFS}.}
 764 \end{functions}
 765
 766 La funzione crea la fifo \param{pathname} con i permessi \param{mode}. Come
 767 per \func{mknod} il file \param{pathname} non deve esistere (neanche come link
 768 simbolico); al solito i permessi specificati da \param{mode} vengono
 769 modificati dal valore di \itindex{umask} \textit{umask}.
 770
 771
 772
 773 \subsection{Accesso alle directory}
 774 \label{sec:file_dir_read}
 775
 776 Benché le directory alla fine non siano altro che dei file che contengono
 777 delle liste di nomi ed \itindex{inode} \textit{inode}, per il ruolo che
 778 rivestono nella struttura del sistema, non possono essere trattate come dei
 779 normali file di dati. Ad esempio, onde evitare inconsistenze all'interno del
 780 filesystem, solo il kernel può scrivere il contenuto di una directory, e non
 781 può essere un processo a inserirvi direttamente delle voci con le usuali
 782 funzioni di scrittura.
 783
 784 Ma se la scrittura e l'aggiornamento dei dati delle directory è compito del
 785 kernel, sono molte le situazioni in cui i processi necessitano di poterne
 786 leggere il contenuto. Benché questo possa essere fatto direttamente (vedremo
 787 in sez.~\ref{sec:file_open} che è possibile aprire una directory come se fosse
 788 un file, anche se solo in sola lettura) in generale il formato con cui esse
 789 sono scritte può dipendere dal tipo di filesystem, tanto che, come riportato
 790 in tab.~\ref{tab:file_file_operations}, il VFS del kernel prevede una apposita
 791 funzione per la lettura delle directory.
 792
 793 Tutto questo si riflette nello standard POSIX\footnote{le funzioni sono
 794   previste pure in BSD e SVID.} che ha introdotto una apposita interfaccia per
 795 la lettura delle directory, basata sui cosiddetti \textit{directory stream}
 796 (chiamati così per l'analogia con i file stream dell'interfaccia standard ANSI
 797 C di cap.~\ref{cha:files_std_interface}). La prima funzione di questa
 798 interfaccia è \funcd{opendir}, il cui prototipo è:
 799 \begin{functions}
 800   \headdecl{sys/types.h} \headdecl{dirent.h}
 801
 802   \funcdecl{DIR * opendir(const char *dirname)}
 803
 804   Apre un \textit{directory stream}.
 805
 806   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
 807     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
 808     assumerà i valori \errval{EACCES}, \errval{EMFILE}, \errval{ENFILE},
 809     \errval{ENOENT}, \errval{ENOMEM} e \errval{ENOTDIR}.}
 810 \end{functions}
 811
 812 La funzione apre un \textit{directory stream} per la directory
 813 \param{dirname}, ritornando il puntatore ad un oggetto di tipo \type{DIR} (che
 814 è il \index{tipo!opaco} tipo opaco usato dalle librerie per gestire i
 815 \textit{directory stream}) da usare per tutte le operazioni successive, la
 816 funzione inoltre posiziona lo stream sulla prima voce contenuta nella
 817 directory.
 818
 819 Dato che le directory sono comunque dei file, in alcuni casi può servire
 820 conoscere il \textit{file descriptor} associato ad un \textit{directory
 821   stream}, a questo scopo si può usare la funzione \funcd{dirfd}, il cui
 822 prototipo è:
 823 \begin{functions}
 824   \headdecl{sys/types.h} \headdecl{dirent.h}
 825
 826   \funcdecl{int dirfd(DIR * dir)}
 827
 828   Restituisce il file descriptor associato ad un \textit{directory stream}.
 829
 830   \bodydesc{La funzione restituisce il file descriptor (un valore positivo) in
 831     caso di successo e -1 in caso di errore.}
 832 \end{functions}
 833
 834 La funzione\footnote{questa funzione è una estensione di BSD non presente in
 835   POSIX, introdotta con BSD 4.3-Reno; è presente in Linux con le libc5 (a
 836   partire dalla versione 5.1.2) e con le \acr{glibc}.} restituisce il file
 837 descriptor associato al \textit{directory stream} \param{dir}, essa è
 838 disponibile solo definendo \macro{\_BSD\_SOURCE} o \macro{\_SVID\_SOURCE}. Di
 839 solito si utilizza questa funzione in abbinamento alla funzione \func{fchdir}
 840 per cambiare la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}) a
 841 quella relativa allo stream che si sta esaminando.
 842
 843 Viceversa se si è aperto un file descriptor corrispondente ad una directory è
 844 possibile associarvi un \textit{directory stream} con la funzione
 845 \funcd{fopendir},\footnote{questa funzione è però disponibile solo a partire
 846   dalla versione 2.4 delle \acr{glibc}, e pur essendo candidata per
 847   l'inclusione nella successiva revisione dello standard POSIX.1-2001, non è
 848   ancora presente in nessuna specifica formale.} il cui prototipo è:
 849 \begin{functions}
 850   \headdecl{sys/types.h}
 851   \headdecl{dirent.h}
 852
 853   \funcdecl{DIR * fopendir(int fd)}
 854
 855   Associa un \textit{directory stream} al file descriptor \param{fd}.
 856
 857   \bodydesc{La funzione restituisce un puntatore al \textit{directory stream}
 858     in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
 859     assumerà il valore \errval{EBADF}.}
 860 \end{functions}
 861
 862 La funzione è identica a \func{opendir}, ma ritorna un \textit{directory
 863   stream} facendo riferimento ad un file descriptor \param{fd} che deve essere
 864 stato aperto in precedenza e la funzione darà un errore qualora questo non
 865 corrisponda ad una directory. Una volta utilizzata il file descriptor verrà
 866 usato dalle funzioni che operano sul \textit{directory stream} e non deve
 867 essere più utilizzato direttamente all'interno del proprio programma.
 868
 869 Una volta che si sia aperto un \textit{directory stream} la lettura del
 870 contenuto della directory viene effettuata attraverso la funzione
 871 \funcd{readdir}, il suo prototipo è:
 872 \begin{functions}
 873   \headdecl{sys/types.h} \headdecl{dirent.h}
 874
 875   \funcdecl{struct dirent *readdir(DIR *dir)}
 876
 877   Legge una voce dal \textit{directory stream}.
 878
 879   \bodydesc{La funzione restituisce il puntatore alla struttura contenente i
 880     dati in caso di successo e \val{NULL} altrimenti, in caso di descrittore
 881     non valido \var{errno} assumerà il valore \errval{EBADF}, il valore
 882     \val{NULL} viene restituito anche quando si raggiunge la fine dello
 883     stream.}
 884 \end{functions}
 885
 886 La funzione legge la voce corrente nella directory, posizionandosi sulla voce
 887 successiva. Pertanto se si vuole leggere l'intero contenuto di una directory
 888 occorrerà ripetere l'esecuzione della funzione fintanto che non si siano
 889 esaurite tutte le voci in essa presenti.
 890
 891 I dati vengono memorizzati in una struttura \struct{dirent} (la cui
 892 definizione\footnote{la definizione è quella usata a Linux, che si trova nel
 893   file \file{/usr/include/bits/dirent.h}, essa non contempla la presenza del
 894   campo \var{d\_namlen} che indica la lunghezza del nome del file (ed infatti
 895   la macro \macro{\_DIRENT\_HAVE\_D\_NAMLEN} non è definita).}  è riportata in
 896 fig.~\ref{fig:file_dirent_struct}). La funzione restituisce il puntatore alla
 897 struttura; si tenga presente però che quest'ultima è allocata staticamente,
 898 per cui viene sovrascritta tutte le volte che si ripete la lettura di una voce
 899 sullo stesso \textit{directory stream}.
 900
 901 Di questa funzione esiste anche una versione \index{funzioni!rientranti}
 902 rientrante, \func{readdir\_r}, che non usa una struttura allocata
 903 staticamente, e può essere utilizzata anche con i \itindex{thread}
 904 \textit{thread}, il suo prototipo è:
 905 \begin{functions}
 906   \headdecl{sys/types.h} \headdecl{dirent.h}
 907
 908   \funcdecl{int readdir\_r(DIR *dir, struct dirent *entry,
 909           struct dirent **result)}
 910
 911   Legge una voce dal \textit{directory stream}.
 912
 913   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
 914     errore, gli errori sono gli stessi di \func{readdir}.}
 915 \end{functions}
 916
 917 La funzione restituisce in \param{result} (come
 918 \itindex{value~result~argument} \textit{value result argument}) l'indirizzo
 919 dove sono stati salvati i dati, che di norma corrisponde a quello della
 920 struttura precedentemente allocata e specificata dall'argomento \param{entry}
 921 (anche se non è assicurato che la funzione usi lo spazio fornito dall'utente).
 922
 923 \begin{figure}[!htb]
 924   \footnotesize \centering
 925   \begin{minipage}[c]{15cm}
 926     \includestruct{listati/dirent.c}
 927   \end{minipage}
 928   \normalsize
 929   \caption{La struttura \structd{dirent} per la lettura delle informazioni dei
 930     file.}
 931   \label{fig:file_dirent_struct}
 932 \end{figure}
 933
 934 I vari campi di \struct{dirent} contengono le informazioni relative alle voci
 935 presenti nella directory; sia BSD che SVr4\footnote{lo standard POSIX prevede
 936   invece solo la presenza del campo \var{d\_fileno}, identico \var{d\_ino},
 937   che in Linux è definito come alias di quest'ultimo. Il campo \var{d\_name} è
 938   considerato dipendente dall'implementazione.} prevedono che siano sempre
 939 presenti il campo \var{d\_name}, che contiene il nome del file nella forma di
 940 una stringa terminata da uno zero,\footnote{lo standard POSIX non specifica
 941   una lunghezza, ma solo un limite \const{NAME\_MAX}; in SVr4 la lunghezza del
 942   campo è definita come \code{NAME\_MAX+1} che di norma porta al valore di 256
 943   byte usato anche in Linux.} ed il campo \var{d\_ino}, che contiene il numero
 944 di \itindex{inode} \textit{inode} cui il file è associato (di solito
 945 corrisponde al campo \var{st\_ino} di \struct{stat}).
 946
 947 La presenza di ulteriori campi opzionali è segnalata dalla definizione di
 948 altrettante macro nella forma \code{\_DIRENT\_HAVE\_D\_XXX} dove \code{XXX} è
 949 il nome del relativo campo; nel nostro caso sono definite le macro
 950 \macro{\_DIRENT\_HAVE\_D\_TYPE}, \macro{\_DIRENT\_HAVE\_D\_OFF} e
 951 \macro{\_DIRENT\_HAVE\_D\_RECLEN}.
 952
 953 \begin{table}[htb]
 954   \centering
 955   \footnotesize
 956   \begin{tabular}[c]{|l|l|}
 957     \hline
 958     \textbf{Valore} & \textbf{Tipo di file} \\
 959     \hline
 960     \hline
 961     \const{DT\_UNKNOWN} & Tipo sconosciuto.\\
 962     \const{DT\_REG}     & File normale.\\
 963     \const{DT\_DIR}     & Directory.\\
 964     \const{DT\_FIFO}    & Fifo.\\
 965     \const{DT\_SOCK}    & Socket.\\
 966     \const{DT\_CHR}     & Dispositivo a caratteri.\\
 967     \const{DT\_BLK}     & Dispositivo a blocchi.\\
 968     \hline
 969   \end{tabular}
 970   \caption{Costanti che indicano i vari tipi di file nel campo \var{d\_type}
 971     della struttura \struct{dirent}.}
 972   \label{tab:file_dtype_macro}
 973 \end{table}
 974
 975 Per quanto riguarda il significato dei campi opzionali, il campo \var{d\_type}
 976 indica il tipo di file (fifo, directory, link simbolico, ecc.). I suoi
 977 possibili valori\footnote{fino alla versione 2.1 delle \acr{glibc} questo
 978   campo, pur presente nella struttura, non era implementato, e resta sempre al
 979   valore \const{DT\_UNKNOWN}.}  sono riportati in
 980 tab.~\ref{tab:file_dtype_macro}; per la conversione da e verso l'analogo
 981 valore mantenuto dentro il campo \var{st\_mode} di \struct{stat} sono definite
 982 anche due macro di conversione \macro{IFTODT} e \macro{DTTOIF}:
 983 \begin{functions}
 984   \funcdecl{int IFTODT(mode\_t MODE)} Converte il tipo di file dal formato di
 985   \var{st\_mode} a quello di \var{d\_type}.
 986
 987   \funcdecl{mode\_t DTTOIF(int DTYPE)} Converte il tipo di file dal formato di
 988   \var{d\_type} a quello di \var{st\_mode}.
 989 \end{functions}
 990
 991 Il campo \var{d\_off} contiene invece la posizione della voce successiva della
 992 directory, mentre il campo \var{d\_reclen} la lunghezza totale della voce
 993 letta. Con questi due campi diventa possibile, determinando la posizione delle
 994 varie voci, spostarsi all'interno dello stream usando la funzione
 995 \funcd{seekdir},\footnote{sia questa funzione che \func{telldir}, sono
 996   estensioni prese da BSD, non previste dallo standard POSIX.} il cui
 997 prototipo è:
 998 \begin{prototype}{dirent.h}{void seekdir(DIR *dir, off\_t offset)}
 999   Cambia la posizione all'interno di un \textit{directory stream}.
1000 \end{prototype}
1001
1002 La funzione non ritorna nulla e non segnala errori, è però necessario che il
1003 valore dell'argomento \param{offset} sia valido per lo stream \param{dir};
1004 esso pertanto deve essere stato ottenuto o dal valore di \var{d\_off} di
1005 \struct{dirent} o dal valore restituito dalla funzione \funcd{telldir}, che
1006 legge la posizione corrente; il prototipo di quest'ultima è:
1007 \begin{prototype}{dirent.h}{off\_t telldir(DIR *dir)}
1008   Ritorna la posizione corrente in un \textit{directory stream}.
1009
1010   \bodydesc{La funzione restituisce la posizione corrente nello stream (un
1011     numero positivo) in caso di successo, e -1 altrimenti, nel qual caso
1012     \var{errno} assume solo il valore di \errval{EBADF}, corrispondente ad un
1013     valore errato per \param{dir}.}
1014 \end{prototype}
1015
1016 La sola funzione di posizionamento nello stream prevista dallo standard POSIX
1017 è \funcd{rewinddir}, che riporta la posizione a quella iniziale; il suo
1018 prototipo è:
1019 \begin{functions}
1020   \headdecl{sys/types.h} \headdecl{dirent.h}
1021
1022   \funcdecl{void rewinddir(DIR *dir)}
1023
1024   Si posiziona all'inizio di un \textit{directory stream}.
1025 \end{functions}
1026
1027
1028 Una volta completate le operazioni si può chiudere il \textit{directory
1029   stream} con la funzione \funcd{closedir}, il cui prototipo è:
1030 \begin{functions}
1031   \headdecl{sys/types.h} \headdecl{dirent.h}
1032
1033   \funcdecl{int closedir(DIR * dir)}
1034
1035   Chiude un \textit{directory stream}.
1036
1037   \bodydesc{La funzione restituisce 0 in caso di successo e -1 altrimenti, nel
1038     qual caso \var{errno} assume il valore \errval{EBADF}.}
1039 \end{functions}
1040
1041 A parte queste funzioni di base in BSD 4.3 è stata introdotta un'altra
1042 funzione che permette di eseguire una scansione completa (con tanto di ricerca
1043 ed ordinamento) del contenuto di una directory; la funzione è
1044 \funcd{scandir}\footnote{in Linux questa funzione è stata introdotta fin dalle
1045   \acr{libc4}.} ed il suo prototipo è:
1046 \begin{prototype}{dirent.h}{int scandir(const char *dir,
1047     struct dirent ***namelist, int(*filter)(const struct dirent *),
1048     int(*compar)(const struct dirent **, const struct dirent **))}
1049
1050   Esegue una scansione di un \textit{directory stream}.
1051
1052   \bodydesc{La funzione restituisce in caso di successo il numero di voci
1053     trovate, e -1 altrimenti.}
1054 \end{prototype}
1055
1056 Al solito, per la presenza fra gli argomenti di due puntatori a funzione, il
1057 prototipo non è molto comprensibile; queste funzioni però sono quelle che
1058 controllano rispettivamente la selezione di una voce (quella passata con
1059 l'argomento \param{filter}) e l'ordinamento di tutte le voci selezionate
1060 (quella specificata dell'argomento \param{compar}).
1061
1062 La funzione legge tutte le voci della directory indicata dall'argomento
1063 \param{dir}, passando un puntatore a ciascuna di esse (una struttura
1064 \struct{dirent}) come argomento della funzione di selezione specificata da
1065 \param{filter}; se questa ritorna un valore diverso da zero il puntatore viene
1066 inserito in un vettore che viene allocato dinamicamente con \func{malloc}.
1067 Qualora si specifichi un valore \val{NULL} per l'argomento \func{filter} non
1068 viene fatta nessuna selezione e si ottengono tutte le voci presenti.
1069
1070 Le voci selezionate possono essere riordinate tramite \func{qsort}, le modalità
1071 del riordinamento possono essere personalizzate usando la funzione
1072 \param{compar} come criterio di ordinamento di \func{qsort}, la funzione
1073 prende come argomenti le due strutture \struct{dirent} da confrontare
1074 restituendo un valore positivo, nullo o negativo per indicarne l'ordinamento;
1075 alla fine l'indirizzo della lista ordinata dei puntatori alle strutture
1076 \struct{dirent} viene restituito nell'argomento
1077 \param{namelist}.\footnote{la funzione alloca automaticamente la lista, e
1078   restituisce, come \itindex{value~result~argument} \textit{value result
1079     argument}, l'indirizzo della stessa; questo significa che \param{namelist}
1080   deve essere dichiarato come \code{struct dirent **namelist} ed alla funzione
1081   si deve passare il suo indirizzo.}
1082
1083 Per l'ordinamento, vale a dire come valori possibili per l'argomento
1084 \param{compar} sono disponibili due funzioni predefinite, \funcd{alphasort} e
1085 \funcd{versionsort}, i cui prototipi sono:
1086 \begin{functions}
1087   \headdecl{dirent.h}
1088
1089   \funcdecl{int alphasort(const void *a, const void *b)}
1090
1091   \funcdecl{int versionsort(const void *a, const void *b)}
1092
1093   Funzioni per l'ordinamento delle voci di \textit{directory stream}.
1094
1095   \bodydesc{Le funzioni restituiscono un valore minore, uguale o maggiore di
1096     zero qualora il primo argomento sia rispettivamente minore, uguale o
1097     maggiore del secondo.}
1098 \end{functions}
1099
1100 La funzione \func{alphasort} deriva da BSD ed è presente in Linux fin dalle
1101 \acr{libc4}\footnote{la versione delle \acr{libc4} e \acr{libc5} usa però come
1102   argomenti dei puntatori a delle strutture \struct{dirent}; le glibc usano il
1103   prototipo originario di BSD, mostrato anche nella definizione, che prevede
1104   puntatori a \ctyp{void}.} e deve essere specificata come argomento
1105 \param{compar} per ottenere un ordinamento alfabetico (secondo il valore del
1106 campo \var{d\_name} delle varie voci). Le \acr{glibc} prevedono come
1107 estensione\footnote{le glibc, a partire dalla versione 2.1, effettuano anche
1108   l'ordinamento alfabetico tenendo conto delle varie localizzazioni, usando
1109   \func{strcoll} al posto di \func{strcmp}.} anche \func{versionsort}, che
1110 ordina i nomi tenendo conto del numero di versione (cioè qualcosa per cui
1111 \texttt{file10} viene comunque dopo \texttt{file4}.)
1112
1113 Un semplice esempio dell'uso di queste funzioni è riportato in
1114 fig.~\ref{fig:file_my_ls}, dove si è riportata la sezione principale di un
1115 programma che, usando la funzione di scansione illustrata in
1116 fig.~\ref{fig:file_dirscan}, stampa i nomi dei file contenuti in una directory
1117 e la relativa dimensione (in sostanza una versione semplificata del comando
1118 \cmd{ls}).
1119
1120 \begin{figure}[!htb]
1121   \footnotesize \centering
1122   \begin{minipage}[c]{15.6cm}
1123     \includecodesample{listati/my_ls.c}
1124   \end{minipage}
1125   \caption{Esempio di codice per eseguire la lista dei file contenuti in una
1126     directory.}
1127   \label{fig:file_my_ls}
1128 \end{figure}
1129
1130 Il programma è estremamente semplice; in fig.~\ref{fig:file_my_ls} si è omessa
1131 la parte di gestione delle opzioni (che prevede solo l'uso di una funzione per
1132 la stampa della sintassi, anch'essa omessa) ma il codice completo potrà essere
1133 trovato coi sorgenti allegati nel file \file{myls.c}.
1134
1135 In sostanza tutto quello che fa il programma, dopo aver controllato
1136 (\texttt{\small 10--13}) di avere almeno un argomento (che indicherà la
1137 directory da esaminare) è chiamare (\texttt{\small 14}) la funzione
1138 \func{DirScan} per eseguire la scansione, usando la funzione \code{do\_ls}
1139 (\texttt{\small 20--26}) per fare tutto il lavoro.
1140
1141 Quest'ultima si limita (\texttt{\small 23}) a chiamare \func{stat} sul file
1142 indicato dalla directory entry passata come argomento (il cui nome è appunto
1143 \var{direntry->d\_name}), memorizzando in una opportuna struttura \var{data} i
1144 dati ad esso relativi, per poi provvedere (\texttt{\small 24}) a stampare il
1145 nome del file e la dimensione riportata in \var{data}.
1146
1147 Dato che la funzione verrà chiamata all'interno di \func{DirScan} per ogni
1148 voce presente questo è sufficiente a stampare la lista completa dei file e
1149 delle relative dimensioni.  Si noti infine come si restituisca sempre 0 come
1150 valore di ritorno per indicare una esecuzione senza errori.
1151
1152 \begin{figure}[!htb]
1153   \footnotesize \centering
1154   \begin{minipage}[c]{15.6cm}
1155     \includecodesample{listati/DirScan.c}
1156   \end{minipage}
1157   \caption{Codice della funzione di scansione di una directory contenuta nel
1158     file \file{DirScan.c}.}
1159   \label{fig:file_dirscan}
1160 \end{figure}
1161
1162 Tutto il grosso del lavoro è svolto dalla funzione \func{DirScan}, riportata
1163 in fig.~\ref{fig:file_dirscan}. La funzione è volutamente generica e permette
1164 di eseguire una funzione, passata come secondo argomento, su tutte le voci di
1165 una directory.  La funzione inizia con l'aprire (\texttt{\small 19--23}) uno
1166 stream sulla directory passata come primo argomento, stampando un messaggio in
1167 caso di errore.
1168
1169 Il passo successivo (\texttt{\small 24--25}) è cambiare directory di lavoro
1170 (vedi sez.~\ref{sec:file_work_dir}), usando in sequenza le funzione
1171 \func{dirfd} e \func{fchdir} (in realtà si sarebbe potuto usare direttamente
1172 \func{chdir} su \var{dirname}), in modo che durante il successivo ciclo
1173 (\texttt{\small 27--31}) sulle singole voci dello stream ci si trovi
1174 all'interno della directory.\footnote{questo è essenziale al funzionamento
1175   della funzione \code{do\_ls} (e ad ogni funzione che debba usare il campo
1176   \var{d\_name}, in quanto i nomi dei file memorizzati all'interno di una
1177   struttura \struct{dirent} sono sempre relativi alla directory in questione,
1178   e senza questo posizionamento non si sarebbe potuto usare \func{stat} per
1179   ottenere le dimensioni.}
1180
1181 Avendo usato lo stratagemma di fare eseguire tutte le manipolazioni necessarie
1182 alla funzione passata come secondo argomento, il ciclo di scansione della
1183 directory è molto semplice; si legge una voce alla volta (\texttt{\small 27})
1184 all'interno di una istruzione di \code{while} e fintanto che si riceve una
1185 voce valida (cioè un puntatore diverso da \val{NULL}) si esegue
1186 (\texttt{\small 27}) la funzione di elaborazione \var{compare} (che nel nostro
1187 caso sarà \code{do\_ls}), ritornando con un codice di errore (\texttt{\small
1188   28}) qualora questa presenti una anomalia (identificata da un codice di
1189 ritorno negativo). Una volta terminato il ciclo la funzione si conclude con la
1190 chiusura (\texttt{\small 32}) dello stream\footnote{nel nostro caso, uscendo
1191   subito dopo la chiamata, questo non servirebbe, in generale però
1192   l'operazione è necessaria, dato che la funzione può essere invocata molte
1193   volte all'interno dello stesso processo, per cui non chiudere i
1194   \textit{directory stream} comporterebbe un consumo progressivo di risorse,
1195   con conseguente rischio di esaurimento delle stesse.} e la restituzione
1196 (\texttt{\small 33}) del codice di operazioni concluse con successo.
1197
1198
1199 \subsection{La directory di lavoro}
1200 \label{sec:file_work_dir}
1201
1202 \itindbeg{pathname}
1203
1204 Come accennato in sez.~\ref{sec:proc_fork} a ciascun processo è associata una
1205 directory nel filesystem,\footnote{questa viene mantenuta all'interno dei dati
1206   della sua \struct{task\_struct} (vedi fig.~\ref{fig:proc_task_struct}), più
1207   precisamente nel campo \texttt{pwd} della sotto-struttura
1208   \struct{fs\_struct}.} che è chiamata \textsl{directory corrente} o
1209 \textsl{directory di lavoro} (in inglese \textit{current working directory}).
1210 La directory di lavoro è quella da cui si parte quando un
1211 \itindsub{pathname}{relativo} \textit{pathname} è espresso in forma relativa,
1212 dove il ``\textsl{relativa}'' fa riferimento appunto a questa directory.
1213
1214 Quando un utente effettua il login, questa directory viene impostata alla
1215 \textit{home directory} del suo account. Il comando \cmd{cd} della shell
1216 consente di cambiarla a piacere, spostandosi da una directory ad un'altra, il
1217 comando \cmd{pwd} la stampa sul terminale.  Siccome la directory corrente
1218 resta la stessa quando viene creato un processo figlio (vedi
1219 sez.~\ref{sec:proc_fork}), la directory corrente della shell diventa anche la
1220 directory corrente di qualunque comando da essa lanciato.
1221
1222 Dato che è il kernel che tiene traccia per ciascun processo \itindex{inode}
1223 dell'\textit{inode} della directory di lavoro, per ottenerne il
1224 \textit{pathname} occorre usare una apposita funzione di libreria,
1225 \funcd{getcwd},\footnote{con Linux \func{getcwd} è una \textit{system call}
1226   dalla versione 2.1.9, in precedenza il valore doveva essere ottenuto tramite
1227   il filesystem \texttt{/proc} da \procfile{/proc/self/cwd}.} il cui prototipo
1228 è:
1229 \begin{prototype}{unistd.h}{char *getcwd(char *buffer, size\_t size)}
1230   Legge il \textit{pathname} della directory di lavoro corrente.
1231
1232   \bodydesc{La funzione restituisce il puntatore \param{buffer} se riesce,
1233     \val{NULL} se fallisce, in quest'ultimo caso la variabile
1234     \var{errno} è impostata con i seguenti codici di errore:
1235   \begin{errlist}
1236   \item[\errcode{EINVAL}] l'argomento \param{size} è zero e \param{buffer} non
1237     è nullo.
1238   \item[\errcode{ERANGE}] l'argomento \param{size} è più piccolo della
1239     lunghezza del \textit{pathname}.
1240   \item[\errcode{EACCES}] manca il permesso di lettura o di ricerca su uno dei
1241     componenti del \textit{pathname} (cioè su una delle directory superiori
1242     alla corrente).
1243   \item[\errcode{ENOENT}] la directory di lavoro è stata eliminata.
1244   \end{errlist}}
1245 \end{prototype}
1246
1247 La funzione restituisce il \textit{pathname} completo della directory di
1248 lavoro corrente nella stringa puntata da \param{buffer}, che deve essere
1249 precedentemente allocata, per una dimensione massima di \param{size}.  Il
1250 buffer deve essere sufficientemente largo da poter contenere il
1251 \textit{pathname} completo più lo zero di terminazione della stringa. Qualora
1252 esso ecceda le dimensioni specificate con \param{size} la funzione restituisce
1253 un errore.
1254
1255 Si può anche specificare un puntatore nullo come
1256 \param{buffer},\footnote{questa è un'estensione allo standard POSIX.1,
1257   supportata da Linux e dalla \acr{glibc}.} nel qual caso la stringa sarà
1258 allocata automaticamente per una dimensione pari a \param{size} qualora questa
1259 sia diversa da zero, o della lunghezza esatta del \textit{pathname}
1260 altrimenti. In questo caso ci si deve ricordare di disallocare la stringa una
1261 volta cessato il suo utilizzo.
1262
1263 Di questa funzione esiste una versione \code{char *getwd(char *buffer)} fatta
1264 per compatibilità all'indietro con BSD, che non consente di specificare la
1265 dimensione del buffer; esso deve essere allocato in precedenza ed avere una
1266 dimensione superiore a \const{PATH\_MAX} (di solito 256 byte, vedi
1267 sez.~\ref{sec:sys_limits}); il problema è che in Linux non esiste una
1268 dimensione superiore per un \textit{pathname}, per cui non è detto che il
1269 buffer sia sufficiente a contenere il nome del file, e questa è la ragione
1270 principale per cui questa funzione è deprecata.
1271
1272 Un uso comune di \func{getcwd} è quello di salvare la directory di lavoro
1273 iniziale per poi potervi tornare in un tempo successivo, un metodo alternativo
1274 più veloce, se non si è a corto di file descriptor, è invece quello di aprire
1275 la directory corrente (vale a dire ``\texttt{.}'') e tornarvi in seguito con
1276 \func{fchdir}.
1277
1278 Una seconda usata per ottenere la directory di lavoro è \code{char
1279   *get\_current\_dir\_name(void)} che è sostanzialmente equivalente ad una
1280 \code{getcwd(NULL, 0)}, con la sola differenza che essa ritorna il valore
1281 della variabile di ambiente \val{PWD}, che essendo costruita dalla shell può
1282 contenere un \textit{pathname} comprendente anche dei link simbolici. Usando
1283 \func{getcwd} infatti, essendo il \textit{pathname} ricavato risalendo
1284 all'indietro l'albero della directory, si perderebbe traccia di ogni passaggio
1285 attraverso eventuali link simbolici.
1286
1287 Per cambiare la directory di lavoro si può usare la funzione \funcd{chdir}
1288 (equivalente del comando di shell \cmd{cd}) il cui nome sta appunto per
1289 \textit{change directory}, il suo prototipo è:
1290 \begin{prototype}{unistd.h}{int chdir(const char *pathname)}
1291   Cambia la directory di lavoro in \param{pathname}.
1292
1293   \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
1294     nel qual caso \var{errno} assumerà i valori:
1295   \begin{errlist}
1296   \item[\errcode{ENOTDIR}] non si è specificata una directory.
1297   \item[\errcode{EACCES}] manca il permesso di ricerca su uno dei componenti
1298     di \param{path}.
1299   \end{errlist}
1300   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1301   \errval{ENOMEM}, \errval{ELOOP} e \errval{EIO}.}
1302 \end{prototype}
1303 \noindent ed ovviamente \param{pathname} deve indicare una directory per la
1304 quale si hanno i permessi di accesso.
1305
1306 Dato che anche le directory sono file, è possibile riferirsi ad esse anche
1307 tramite il file descriptor, e non solo tramite il \textit{pathname}, per fare
1308 questo si usa \funcd{fchdir}, il cui prototipo è:
1309 \begin{prototype}{unistd.h}{int fchdir(int fd)}
1310   Identica a \func{chdir}, ma usa il file descriptor \param{fd} invece del
1311   \textit{pathname}.
1312
1313   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
1314     errore, in caso di errore \var{errno} assumerà i valori \errval{EBADF} o
1315     \errval{EACCES}.}
1316 \end{prototype}
1317 \noindent anche in questo caso \param{fd} deve essere un file descriptor
1318 valido che fa riferimento ad una directory. Inoltre l'unico errore di accesso
1319 possibile (tutti gli altri sarebbero occorsi all'apertura di \param{fd}), è
1320 quello in cui il processo non ha il permesso di accesso alla directory
1321 specificata da \param{fd}.
1322
1323 \itindend{pathname}
1324
1325
1326
1327 \subsection{I file temporanei}
1328 \label{sec:file_temp_file}
1329
1330 In molte occasioni è utile poter creare dei file temporanei; benché la cosa
1331 sembri semplice, in realtà il problema è più sottile di quanto non appaia a
1332 prima vista. Infatti anche se sembrerebbe banale generare un nome a caso e
1333 creare il file dopo aver controllato che questo non esista, nel momento fra il
1334 controllo e la creazione si ha giusto lo spazio per una possibile
1335 \itindex{race~condition} \textit{race condition} (si ricordi quanto visto in
1336 sez.~\ref{sec:proc_race_cond}).
1337
1338 Le \acr{glibc} provvedono varie funzioni per generare nomi di file temporanei,
1339 di cui si abbia certezza di unicità (al momento della generazione); la prima
1340 di queste funzioni è \funcd{tmpnam} il cui prototipo è:
1341 \begin{prototype}{stdio.h}{char *tmpnam(char *string)}
1342   Restituisce il puntatore ad una stringa contente un nome di file valido e
1343   non esistente al momento dell'invocazione.
1344
1345   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1346   \val{NULL} in caso di fallimento. Non sono definiti errori.}
1347 \end{prototype}
1348 \noindent se si è passato un puntatore \param{string} non nullo questo deve
1349 essere di dimensione \const{L\_tmpnam} (costante definita in \file{stdio.h},
1350 come \const{P\_tmpdir} e \const{TMP\_MAX}) ed il nome generato vi verrà
1351 copiato automaticamente; altrimenti il nome sarà generato in un buffer statico
1352 interno che verrà sovrascritto ad una chiamata successiva.  Successive
1353 invocazioni della funzione continueranno a restituire nomi unici fino ad un
1354 massimo di \const{TMP\_MAX} volte. Al nome viene automaticamente aggiunto come
1355 prefisso la directory specificata da \const{P\_tmpdir}.
1356
1357 Di questa funzione esiste una versione \index{funzioni!rientranti} rientrante,
1358 \func{tmpnam\_r}, che non fa nulla quando si passa \val{NULL} come argomento.
1359 Una funzione simile, \funcd{tempnam}, permette di specificare un prefisso per
1360 il file esplicitamente, il suo prototipo è:
1361 \begin{prototype}{stdio.h}{char *tempnam(const char *dir, const char *pfx)}
1362   Restituisce il puntatore ad una stringa contente un nome di file valido e
1363   non esistente al momento dell'invocazione.
1364
1365   \bodydesc{La funzione ritorna il puntatore alla stringa con il nome o
1366   \val{NULL} in caso di fallimento, \var{errno} viene impostata a
1367   \errval{ENOMEM} qualora fallisca l'allocazione della stringa.}
1368 \end{prototype}
1369
1370 La funzione alloca con \code{malloc} la stringa in cui restituisce il nome,
1371 per cui è sempre \index{funzioni!rientranti} rientrante, occorre però
1372 ricordarsi di disallocare con \code{free} il puntatore che restituisce.
1373 L'argomento \param{pfx} specifica un prefisso di massimo 5 caratteri per il
1374 nome provvisorio. La funzione assegna come directory per il file temporaneo
1375 (verificando che esista e sia accessibili), la prima valida delle seguenti:
1376 \begin{itemize}
1377 \item La variabile di ambiente \const{TMPDIR} (non ha effetto se non è
1378   definita o se il programma chiamante è \itindex{suid~bit} \acr{suid} o
1379   \itindex{sgid~bit} \acr{sgid}, vedi sez.~\ref{sec:file_special_perm}).
1380 \item il valore dell'argomento \param{dir} (se diverso da \val{NULL}).
1381 \item Il valore della costante \const{P\_tmpdir}.
1382 \item la directory \file{/tmp}.
1383 \end{itemize}
1384
1385 In ogni caso, anche se la generazione del nome è casuale, ed è molto difficile
1386 ottenere un nome duplicato, nulla assicura che un altro processo non possa
1387 avere creato, fra l'ottenimento del nome e l'apertura del file, un altro file
1388 con lo stesso nome; per questo motivo quando si usa il nome ottenuto da una di
1389 queste funzioni occorre sempre aprire il nuovo file in modalità di esclusione
1390 (cioè con l'opzione \const{O\_EXCL} per i file descriptor o con il flag
1391 \code{x} per gli stream) che fa fallire l'apertura in caso il file sia già
1392 esistente.
1393
1394 Per evitare di dovere effettuare a mano tutti questi controlli, lo standard
1395 POSIX definisce la funzione \funcd{tmpfile}, che permette di ottenere in
1396 maniera sicura l'accesso ad un file temporaneo, il suo prototipo è:
1397 \begin{prototype}{stdio.h}{FILE *tmpfile (void)}
1398   Restituisce un file temporaneo aperto in lettura/scrittura.
1399
1400   \bodydesc{La funzione ritorna il puntatore allo stream associato al file
1401     temporaneo in caso di successo e \val{NULL} in caso di errore, nel qual
1402     caso \var{errno} assumerà i valori:
1403     \begin{errlist}
1404     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
1405     \item[\errcode{EEXIST}] non è stato possibile generare un nome univoco.
1406     \end{errlist}
1407     ed inoltre \errval{EFAULT}, \errval{EMFILE}, \errval{ENFILE},
1408     \errval{ENOSPC}, \errval{EROFS} e \errval{EACCES}.}
1409 \end{prototype}
1410
1411 La funzione restituisce direttamente uno stream già aperto (in modalità
1412 \code{r+b}, si veda sez.~\ref{sec:file_fopen}) e pronto per l'uso, che viene
1413 automaticamente cancellato alla sua chiusura o all'uscita dal programma. Lo
1414 standard non specifica in quale directory verrà aperto il file, ma le
1415 \acr{glibc} prima tentano con \const{P\_tmpdir} e poi con \file{/tmp}. Questa
1416 funzione è \index{funzioni!rientranti} rientrante e non soffre di problemi di
1417 \itindex{race~condition} \textit{race condition}.
1418
1419 Alcune versioni meno recenti di Unix non supportano queste funzioni; in questo
1420 caso si possono usare le vecchie funzioni \funcd{mktemp} e \func{mkstemp} che
1421 modificano una stringa di input che serve da modello e che deve essere
1422 conclusa da 6 caratteri \code{X} che verranno sostituiti da un codice
1423 unico. La prima delle due è analoga a \func{tmpnam} e genera un nome casuale,
1424 il suo prototipo è:
1425 \begin{prototype}{stlib.h}{char *mktemp(char *template)}
1426   Genera un filename univoco sostituendo le \code{XXXXXX} finali di
1427   \param{template}.
1428
1429   \bodydesc{La funzione ritorna il puntatore \param{template} in caso di
1430     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1431     assumerà i valori:
1432     \begin{errlist}
1433     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1434     \end{errlist}}
1435 \end{prototype}
1436 \noindent dato che \param{template} deve poter essere modificata dalla
1437 funzione non si può usare una stringa costante.  Tutte le avvertenze riguardo
1438 alle possibili \itindex{race~condition} \textit{race condition} date per
1439 \func{tmpnam} continuano a valere; inoltre in alcune vecchie implementazioni
1440 il valore usato per sostituire le \code{XXXXXX} viene formato con il \acr{pid}
1441 del processo più una lettera, il che mette a disposizione solo 26 possibilità
1442 diverse per il nome del file, e rende il nome temporaneo facile da indovinare.
1443 Per tutti questi motivi la funzione è deprecata e non dovrebbe mai essere
1444 usata.
1445
1446 La seconda funzione, \funcd{mkstemp} è sostanzialmente equivalente a
1447 \func{tmpfile}, ma restituisce un file descriptor invece di uno stream; il suo
1448 prototipo è:
1449 \begin{prototype}{stlib.h}{int mkstemp(char *template)}
1450   Genera un file temporaneo con un nome ottenuto sostituendo le \code{XXXXXX}
1451   finali di \param{template}.
1452
1453   \bodydesc{La funzione ritorna il file descriptor in caso successo e
1454     -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
1455     \begin{errlist}
1456     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1457     \item[\errcode{EEXIST}] non è riuscita a creare un file temporaneo, il
1458       contenuto di \param{template} è indefinito.
1459     \end{errlist}}
1460 \end{prototype}
1461 \noindent come per \func{mktemp} anche in questo caso \param{template} non può
1462 essere una stringa costante. La funzione apre un file in lettura/scrittura con
1463 la funzione \func{open}, usando l'opzione \const{O\_EXCL} (si veda
1464 sez.~\ref{sec:file_open}), in questo modo al ritorno della funzione si ha la
1465 certezza di essere i soli utenti del file. I permessi sono impostati al valore
1466 \code{0600}\footnote{questo è vero a partire dalle \acr{glibc} 2.0.7, le
1467   versioni precedenti delle \acr{glibc} e le vecchie \acr{libc5} e \acr{libc4}
1468   usavano il valore \code{0666} che permetteva a chiunque di leggere i
1469   contenuti del file.} (si veda sez.~\ref{sec:file_perm_overview}).
1470
1471 In OpenBSD è stata introdotta un'altra funzione\footnote{introdotta anche in
1472   Linux a partire dalle \acr{glibc} 2.1.91.} simile alle precedenti,
1473 \funcd{mkdtemp}, che crea una directory temporanea; il suo prototipo è:
1474 \begin{prototype}{stlib.h}{char *mkdtemp(char *template)}
1475   Genera una directory temporaneo il cui nome è ottenuto sostituendo le
1476   \code{XXXXXX} finali di \param{template}.
1477
1478   \bodydesc{La funzione ritorna il puntatore al nome della directory in caso
1479     successo e \val{NULL} in caso di errore, nel qual caso \var{errno}
1480     assumerà i valori:
1481     \begin{errlist}
1482     \item[\errcode{EINVAL}] \param{template} non termina con \code{XXXXXX}.
1483     \end{errlist}
1484     più gli altri eventuali codici di errore di \func{mkdir}.}
1485 \end{prototype}
1486 \noindent la directory è creata con permessi \code{0700} (al solito si veda
1487 cap.~\ref{cha:file_unix_interface} per i dettagli); dato che la creazione
1488 della directory è sempre esclusiva i precedenti problemi di
1489 \itindex{race~condition} \textit{race condition} non si pongono.
1490
1491
1492 \section{La manipolazione delle caratteristiche dei file}
1493 \label{sec:file_infos}
1494
1495 Come spiegato in sez.~\ref{sec:file_filesystem} tutte le informazioni generali
1496 relative alle caratteristiche di ciascun file, a partire dalle informazioni
1497 relative al controllo di accesso, sono mantenute \itindex{inode}
1498 nell'\textit{inode}.
1499
1500 Vedremo in questa sezione come sia possibile leggere tutte queste informazioni
1501 usando la funzione \func{stat}, che permette l'accesso a tutti i dati
1502 memorizzati \itindex{inode} nell'\textit{inode}; esamineremo poi le varie
1503 funzioni usate per manipolare tutte queste informazioni (eccetto quelle che
1504 riguardano la gestione del controllo di accesso, trattate in in
1505 sez.~\ref{sec:file_access_control}).
1506
1507
1508 \subsection{La lettura delle caratteristiche dei file}
1509 \label{sec:file_stat}
1510
1511 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
1512 delle funzioni \func{stat} (\funcd{stat}, \funcd{fstat} e \funcd{lstat});
1513 questa è la funzione che ad esempio usa il comando \cmd{ls} per poter ottenere
1514 e mostrare tutti i dati relativi ad un file. I prototipi di queste funzioni
1515 sono i seguenti:
1516 \begin{functions}
1517   \headdecl{sys/types.h}
1518   \headdecl{sys/stat.h}
1519   \headdecl{unistd.h}
1520
1521   \funcdecl{int stat(const char *file\_name, struct stat *buf)} Legge le
1522   informazione del file specificato da \param{file\_name} e le inserisce in
1523   \param{buf}.
1524
1525   \funcdecl{int lstat(const char *file\_name, struct stat *buf)} Identica a
1526   \func{stat} eccetto che se il \param{file\_name} è un link simbolico vengono
1527   lette le informazioni relative ad esso e non al file a cui fa riferimento.
1528
1529   \funcdecl{int fstat(int filedes, struct stat *buf)} Identica a \func{stat}
1530   eccetto che si usa con un file aperto, specificato tramite il suo file
1531   descriptor \param{filedes}.
1532
1533   \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 per un
1534     errore, nel qual caso \var{errno} assumerà uno dei valori: \errval{EBADF},
1535     \errval{ENOENT}, \errval{ENOTDIR}, \errval{ELOOP}, \errval{EFAULT},
1536     \errval{EACCES}, \errval{ENOMEM}, \errval{ENAMETOOLONG}.}
1537 \end{functions}
1538 \noindent il loro comportamento è identico, solo che operano rispettivamente
1539 su un file, su un link simbolico e su un file descriptor.
1540
1541 La struttura \struct{stat} usata da queste funzioni è definita nell'header
1542 \file{sys/stat.h} e in generale dipende dall'implementazione; la versione
1543 usata da Linux è mostrata in fig.~\ref{fig:file_stat_struct}, così come
1544 riportata dalla pagina di manuale di \func{stat} (in realtà la definizione
1545 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
1546 riservati per estensioni come tempi più precisi, o per il padding dei campi).
1547
1548 \begin{figure}[!htb]
1549   \footnotesize
1550   \centering
1551   \begin{minipage}[c]{15cm}
1552     \includestruct{listati/stat.h}
1553   \end{minipage}
1554   \normalsize
1555   \caption{La struttura \structd{stat} per la lettura delle informazioni dei
1556     file.}
1557   \label{fig:file_stat_struct}
1558 \end{figure}
1559
1560 Si noti come i vari membri della struttura siano specificati come tipi
1561 primitivi del sistema (di quelli definiti in
1562 tab.~\ref{tab:intro_primitive_types}, e dichiarati in \file{sys/types.h}).
1563
1564 % TODO: aggiornare con i cambiamenti ai tempi fatti con il 2.6
1565
1566 \subsection{I tipi di file}
1567 \label{sec:file_types}
1568
1569 Come riportato in tab.~\ref{tab:file_file_types} in Linux oltre ai file e alle
1570 directory esistono altri oggetti che possono stare su un filesystem.  Il tipo
1571 di file è ritornato dalla funzione \func{stat} come maschera binaria nel campo
1572 \var{st\_mode} (che contiene anche le informazioni relative ai permessi) di
1573 una struttura \struct{stat}.
1574
1575 Dato che il valore numerico può variare a seconda delle implementazioni, lo
1576 standard POSIX definisce un insieme di macro per verificare il tipo di file,
1577 queste vengono usate anche da Linux che supporta pure le estensioni allo
1578 standard per i link simbolici e i socket definite da BSD; l'elenco completo
1579 delle macro con cui è possibile estrarre l'informazione da \var{st\_mode} è
1580 riportato in tab.~\ref{tab:file_type_macro}.
1581 \begin{table}[htb]
1582   \centering
1583   \footnotesize
1584   \begin{tabular}[c]{|l|l|}
1585     \hline
1586     \textbf{Macro} & \textbf{Tipo del file} \\
1587     \hline
1588     \hline
1589     \macro{S\_ISREG(m)}  & file normale.\\
1590     \macro{S\_ISDIR(m)}  & directory.\\
1591     \macro{S\_ISCHR(m)}  & dispositivo a caratteri.\\
1592     \macro{S\_ISBLK(m)}  & dispositivo a blocchi.\\
1593     \macro{S\_ISFIFO(m)} & fifo.\\
1594     \macro{S\_ISLNK(m)}  & link simbolico.\\
1595     \macro{S\_ISSOCK(m)} & socket.\\
1596     \hline
1597   \end{tabular}
1598   \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h}).}
1599   \label{tab:file_type_macro}
1600 \end{table}
1601
1602 Oltre alle macro di tab.~\ref{tab:file_type_macro} è possibile usare
1603 direttamente il valore di \var{st\_mode} per ricavare il tipo di file
1604 controllando direttamente i vari bit in esso memorizzati. Per questo sempre in
1605 \file{sys/stat.h} sono definite le costanti numeriche riportate in
1606 tab.~\ref{tab:file_mode_flags}.
1607
1608 Il primo valore dell'elenco di tab.~\ref{tab:file_mode_flags} è la maschera
1609 binaria che permette di estrarre i bit nei quali viene memorizzato il tipo di
1610 file, i valori successivi sono le costanti corrispondenti ai singoli bit, e
1611 possono essere usati per effettuare la selezione sul tipo di file voluto, con
1612 un'opportuna combinazione.
1613
1614 \begin{table}[htb]
1615   \centering
1616   \footnotesize
1617   \begin{tabular}[c]{|l|c|l|}
1618     \hline
1619     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
1620     \hline
1621     \hline
1622     \const{S\_IFMT}   &  0170000 & Maschera per i bit del tipo di file.\\
1623     \const{S\_IFSOCK} &  0140000 & Socket.\\
1624     \const{S\_IFLNK}  &  0120000 & Link simbolico.\\
1625     \const{S\_IFREG}  &  0100000 & File regolare.\\
1626     \const{S\_IFBLK}  &  0060000 & Dispositivo a blocchi.\\
1627     \const{S\_IFDIR}  &  0040000 & Directory.\\
1628     \const{S\_IFCHR}  &  0020000 & Dispositivo a caratteri.\\
1629     \const{S\_IFIFO}  &  0010000 & Fifo.\\
1630     \hline
1631     \const{S\_ISUID}  &  0004000 & Set UID bit \itindex{suid~bit}.\\
1632     \const{S\_ISGID}  &  0002000 & Set GID bit \itindex{sgid~bit}.\\
1633     \const{S\_ISVTX}  &  0001000 & Sticky bit \itindex{sticky~bit}.\\
1634     \hline
1635 %    \const{S\_IRWXU}  &  00700   & Bitmask per i permessi del proprietario.\\
1636     \const{S\_IRUSR}  &  00400   & Il proprietario ha permesso di lettura.\\
1637     \const{S\_IWUSR}  &  00200   & Il proprietario ha permesso di scrittura.\\
1638     \const{S\_IXUSR}  &  00100   & Il proprietario ha permesso di esecuzione.\\
1639     \hline
1640 %    \const{S\_IRWXG}  &  00070   & Bitmask per i permessi del gruppo.\\
1641     \const{S\_IRGRP}  &  00040   & Il gruppo ha permesso di lettura.\\
1642     \const{S\_IWGRP}  &  00020   & Il gruppo ha permesso di scrittura.\\
1643     \const{S\_IXGRP}  &  00010   & Il gruppo ha permesso di esecuzione.\\
1644     \hline
1645 %    \const{S\_IRWXO}  &  00007   & Bitmask per i permessi di tutti gli altri\\
1646     \const{S\_IROTH}  &  00004   & Gli altri hanno permesso di lettura.\\
1647     \const{S\_IWOTH}  &  00002   & Gli altri hanno permesso di esecuzione.\\
1648     \const{S\_IXOTH}  &  00001   & Gli altri hanno permesso di esecuzione.\\
1649     \hline
1650   \end{tabular}
1651   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
1652     \var{st\_mode} (definite in \file{sys/stat.h}).}
1653   \label{tab:file_mode_flags}
1654 \end{table}
1655
1656 Ad esempio se si volesse impostare una condizione che permetta di controllare
1657 se un file è una directory o un file ordinario si potrebbe definire la macro
1658 di preprocessore:
1659 \includecodesnip{listati/is_file_dir.h}
1660 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
1661 poi si effettua il confronto con la combinazione di tipi scelta.
1662
1663
1664 \subsection{Le dimensioni dei file}
1665 \label{sec:file_file_size}
1666
1667 Il campo \var{st\_size} di una struttura \struct{stat} contiene la dimensione
1668 del file in byte, se si tratta di un file regolare. Nel caso di un link
1669 simbolico la dimensione è quella del \itindex{pathname} \textit{pathname} che
1670 il link stesso contiene; per le fifo questo campo è sempre nullo.
1671
1672 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
1673 byte. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
1674 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
1675 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
1676 dimensione inferiore sarebbe inefficiente.
1677
1678 Si tenga conto che la lunghezza del file riportata in \var{st\_size} non è
1679 detto che corrisponda all'occupazione dello spazio su disco per via della
1680 possibile esistenza dei cosiddetti \textit{holes} (letteralmente
1681 \textsl{buchi}) che si formano tutte le volte che si va a scrivere su un file
1682 dopo aver eseguito una \func{lseek} (vedi sez.~\ref{sec:file_lseek}) oltre la
1683 sua fine.
1684
1685 In questo caso si avranno risultati differenti a seconda del modo in cui si
1686 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
1687 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
1688 legge dal file (ad esempio usando il comando \cmd{wc -c}), dato che in tal
1689 caso per le parti non scritte vengono restituiti degli zeri, si avrà lo stesso
1690 risultato di \cmd{ls}.
1691
1692 Se è sempre possibile allargare un file, scrivendoci sopra od usando la
1693 funzione \func{lseek} per spostarsi oltre la sua fine, esistono anche casi in
1694 cui si può avere bisogno di effettuare un troncamento, scartando i dati
1695 presenti al di là della dimensione scelta come nuova fine del file.
1696
1697 Un file può sempre essere troncato a zero aprendolo con il flag
1698 \const{O\_TRUNC}, ma questo è un caso particolare; per qualunque altra
1699 dimensione si possono usare le due funzioni \funcd{truncate} e
1700 \funcd{ftruncate}, i cui prototipi sono:
1701 \begin{functions}
1702   \headdecl{unistd.h} \funcdecl{int truncate(const char *file\_name, off\_t
1703     length)} Fa si che la dimensione del file \param{file\_name} sia troncata
1704   ad un valore massimo specificato da \param{lenght}.
1705
1706   \funcdecl{int ftruncate(int fd, off\_t length))} Identica a \func{truncate}
1707   eccetto che si usa con un file aperto, specificato tramite il suo file
1708   descriptor \param{fd}.
1709
1710   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per un
1711     errore, nel qual caso \var{errno} viene impostata opportunamente; per
1712     \func{ftruncate} si hanno i valori:
1713   \begin{errlist}
1714   \item[\errcode{EBADF}] \param{fd}  non è un file descriptor.
1715   \item[\errcode{EINVAL}] \param{fd} è un riferimento ad un socket, non a un
1716     file o non è aperto in scrittura.
1717   \end{errlist}
1718   per \func{truncate} si hanno:
1719   \begin{errlist}
1720   \item[\errcode{EACCES}] il file non ha permesso di scrittura o non si ha il
1721     permesso di esecuzione una delle directory del \itindex{pathname}
1722     \textit{pathname}.
1723   \item[\errcode{ETXTBSY}] il file è un programma in esecuzione.
1724   \end{errlist}
1725   ed anche \errval{ENOTDIR}, \errval{ENAMETOOLONG}, \errval{ENOENT},
1726   \errval{EROFS}, \errval{EIO}, \errval{EFAULT}, \errval{ELOOP}.}
1727 \end{functions}
1728
1729 Se il file è più lungo della lunghezza specificata i dati in eccesso saranno
1730 perduti; il comportamento in caso di lunghezza inferiore non è specificato e
1731 dipende dall'implementazione: il file può essere lasciato invariato o esteso
1732 fino alla lunghezza scelta; in quest'ultimo caso lo spazio viene riempito con
1733 zeri (e in genere si ha la creazione di un \textit{hole} nel file).
1734
1735
1736 \subsection{I tempi dei file}
1737 \label{sec:file_file_times}
1738
1739 Il sistema mantiene per ciascun file tre tempi. Questi sono registrati
1740 \itindex{inode} nell'\textit{inode} insieme agli altri attributi del file e
1741 possono essere letti tramite la funzione \func{stat}, che li restituisce
1742 attraverso tre campi della struttura \struct{stat} di
1743 fig.~\ref{fig:file_stat_struct}. Il significato di detti tempi e dei relativi
1744 campi è riportato nello schema in tab.~\ref{tab:file_file_times}, dove è anche
1745 riportato un esempio delle funzioni che effettuano cambiamenti su di essi.
1746
1747 \begin{table}[htb]
1748   \centering
1749   \footnotesize
1750   \begin{tabular}[c]{|c|l|l|c|}
1751     \hline
1752     \textbf{Membro} & \textbf{Significato} & \textbf{Funzione}
1753     & \textbf{Opzione di \cmd{ls}} \\
1754     \hline
1755     \hline
1756     \var{st\_atime}& ultimo accesso ai dati del file    &
1757                      \func{read}, \func{utime}          & \cmd{-u}\\
1758     \var{st\_mtime}& ultima modifica ai dati del file   &
1759                      \func{write}, \func{utime}         & default\\
1760     \var{st\_ctime}& ultima modifica ai dati dell'\textit{inode} &
1761                      \func{chmod}, \func{utime}         & \cmd{-c}\\
1762     \hline
1763   \end{tabular}
1764   \caption{I tre tempi associati a ciascun file.}
1765   \label{tab:file_file_times}
1766 \end{table}
1767
1768 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
1769 modifica (il \textit{modification time} \var{st\_mtime}) e il tempo di
1770 cambiamento di stato (il \textit{change time} \var{st\_ctime}). Il primo
1771 infatti fa riferimento ad una modifica del contenuto di un file, mentre il
1772 secondo ad una modifica \itindex{inode} dell'\textit{inode}; siccome esistono
1773 molte operazioni (come la funzione \func{link} e molte altre che vedremo in
1774 seguito) che modificano solo le informazioni contenute \itindex{inode}
1775 nell'\textit{inode} senza toccare il contenuto del file, diventa necessario
1776 l'utilizzo di un altro tempo.
1777
1778 Il sistema non tiene conto dell'ultimo accesso \itindex{inode}
1779 all'\textit{inode}, pertanto funzioni come \func{access} o \func{stat} non
1780 hanno alcuna influenza sui tre tempi. Il tempo di ultimo accesso (ai dati)
1781 viene di solito usato per cancellare i file che non servono più dopo un certo
1782 lasso di tempo (ad esempio il programma \cmd{leafnode} cancella i vecchi
1783 articoli sulla base di questo tempo).
1784
1785 \begin{table}[htb]
1786   \centering
1787   \footnotesize
1788   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
1789     \hline
1790     \multicolumn{1}{|p{3cm}|}{\centering{\vspace{6pt}\textbf{Funzione}}} &
1791     \multicolumn{3}{|p{3.6cm}|}{\centering{
1792         \textbf{File o directory del riferimento}}}&
1793     \multicolumn{3}{|p{3.6cm}|}{\centering{
1794         \textbf{Directory contenente il riferimento}}}
1795     &\multicolumn{1}{|p{3.6cm}|}{\centering{\vspace{6pt}\textbf{Note}}} \\
1796     \cline{2-7}
1797     \cline{2-7}
1798     \multicolumn{1}{|p{3cm}|}{}
1799     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1800     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1801     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1802     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(a)}}}
1803     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(m)}}}
1804     &\multicolumn{1}{|p{.9cm}|}{\centering{\textsl{(c)}}}
1805     &\multicolumn{1}{|p{3cm}|}{} \\
1806     \hline
1807     \hline
1808     \func{chmod}, \func{fchmod}
1809              & --      & --      &$\bullet$& --      & --      & --      &\\
1810     \func{chown}, \func{fchown}
1811              & --      & --      &$\bullet$& --      & --      & --      &\\
1812     \func{creat}
1813              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&
1814              con \const{O\_CREATE} \\
1815     \func{creat}
1816              & --      &$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&
1817              con \const{O\_TRUNC} \\
1818     \func{exec}
1819              &$\bullet$& --      & --      & --      & --      & --      &\\
1820     \func{lchown}
1821              & --      & --      &$\bullet$& --      & --      & --      &\\
1822     \func{link}
1823              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
1824     \func{mkdir}
1825              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
1826     \func{mkfifo}
1827              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&\\
1828     \func{open}
1829              &$\bullet$&$\bullet$&$\bullet$& --      &$\bullet$&$\bullet$&
1830              con \const{O\_CREATE} \\
1831     \func{open}
1832              & --      &$\bullet$&$\bullet$& --      & --      & --      &
1833              con \const{O\_TRUNC}  \\
1834     \func{pipe}
1835              &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
1836     \func{read}
1837              &$\bullet$& --      & --      & --      & --      & --      &\\
1838     \func{remove}
1839              & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&
1840              se esegue \func{unlink}\\
1841     \func{remove}
1842               & --      & --      & --      & --      &$\bullet$&$\bullet$&
1843               se esegue \func{rmdir}\\
1844     \func{rename}
1845               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&
1846               per entrambi gli argomenti\\
1847     \func{rmdir}
1848               & --      & --      & --      & --      &$\bullet$&$\bullet$&\\
1849     \func{truncate}, \func{ftruncate}
1850               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\
1851     \func{unlink}
1852               & --      & --      &$\bullet$& --      &$\bullet$&$\bullet$&\\
1853     \func{utime}
1854               &$\bullet$&$\bullet$&$\bullet$& --      & --      & --      &\\
1855     \func{write}
1856               & --      &$\bullet$&$\bullet$& --      & --      & --      &\\
1857     \hline
1858   \end{tabular}
1859   \caption{Prospetto dei cambiamenti effettuati sui tempi di ultimo
1860     accesso \textsl{(a)}, ultima modifica \textsl{(m)} e ultimo cambiamento
1861     \textsl{(c)} dalle varie funzioni operanti su file e directory.}
1862   \label{tab:file_times_effects}
1863 \end{table}
1864
1865
1866 Il tempo di ultima modifica invece viene usato da \cmd{make} per decidere
1867 quali file necessitano di essere ricompilati o (talvolta insieme anche al
1868 tempo di cambiamento di stato) per decidere quali file devono essere
1869 archiviati per il backup. Il comando \cmd{ls} (quando usato con le opzioni
1870 \cmd{-l} o \cmd{-t}) mostra i tempi dei file secondo lo schema riportato
1871 nell'ultima colonna di tab.~\ref{tab:file_file_times}.
1872
1873 L'effetto delle varie funzioni di manipolazione dei file sui tempi è
1874 illustrato in tab.~\ref{tab:file_times_effects}. Si sono riportati gli effetti
1875 sia per il file a cui si fa riferimento, sia per la directory che lo contiene;
1876 questi ultimi possono essere capiti se si tiene conto di quanto già detto, e
1877 cioè che anche le directory sono file (che contengono una lista di nomi) che
1878 il sistema tratta in maniera del tutto analoga a tutti gli altri.
1879
1880 Per questo motivo tutte le volte che compiremo un'operazione su un file che
1881 comporta una modifica del nome contenuto nella directory, andremo anche a
1882 scrivere sulla directory che lo contiene cambiandone il tempo di modifica. Un
1883 esempio di questo può essere la cancellazione di un file, invece leggere o
1884 scrivere o cambiare i permessi di un file ha effetti solo sui tempi di
1885 quest'ultimo.
1886
1887 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
1888 creazione del file, usato in molti altri sistemi operativi, ma che in Unix non
1889 esiste. Per questo motivo quando si copia un file, a meno di preservare
1890 esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso
1891 avrà sempre il tempo corrente come data di ultima modifica.
1892
1893 I tempi di ultimo accesso e modifica possono essere cambiati usando la
1894 funzione \funcd{utime}, il cui prototipo è:
1895 \begin{prototype}{utime.h}
1896 {int utime(const char *filename, struct utimbuf *times)}
1897
1898 Cambia i tempi di ultimo accesso e modifica \itindex{inode}
1899 dell'\textit{inode} specificato da \param{filename} secondo i campi
1900 \var{actime} e \var{modtime} di \param{times}. Se questa è \val{NULL} allora
1901 viene usato il tempo corrente.
1902
1903 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1904   errore, nel qual caso \var{errno} assumerà uno dei valori:
1905   \begin{errlist}
1906   \item[\errcode{EACCES}] non si ha il permesso di scrittura sul file.
1907   \item[\errcode{ENOENT}] \param{filename} non esiste.
1908   \end{errlist}}
1909 \end{prototype}
1910
1911 La funzione prende come argomento \param{times} una struttura
1912 \struct{utimbuf}, la cui definizione è riportata in
1913 fig.~\ref{fig:struct_utimebuf}, con la quale si possono specificare i nuovi
1914 valori che si vogliono impostare per tempi.
1915
1916 \begin{figure}[!htb]
1917   \footnotesize \centering
1918   \begin{minipage}[c]{15cm}
1919     \includestruct{listati/utimbuf.h}
1920   \end{minipage}
1921   \normalsize
1922   \caption{La struttura \structd{utimbuf}, usata da \func{utime} per modificare
1923     i tempi dei file.}
1924   \label{fig:struct_utimebuf}
1925 \end{figure}
1926
1927 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
1928 cosa è l'argomento \param{times}; se è \val{NULL} la funzione imposta il
1929 tempo corrente ed è sufficiente avere accesso in scrittura al file; se invece
1930 si è specificato un valore la funzione avrà successo solo se si è proprietari
1931 del file (o si hanno i privilegi di amministratore).
1932
1933 Si tenga presente che non è comunque possibile specificare il tempo di
1934 cambiamento di stato del file, che viene comunque cambiato dal kernel tutte le
1935 volte che si modifica \itindex{inode} l'\textit{inode} (quindi anche alla
1936 chiamata di \func{utime}).  Questo serve anche come misura di sicurezza per
1937 evitare che si possa modificare un file nascondendo completamente le proprie
1938 tracce.  In realtà la cosa resta possibile, se si è in grado di accedere al
1939 file di dispositivo, scrivendo direttamente sul disco senza passare attraverso
1940 il filesystem, ma ovviamente in questo modo la cosa è molto più complicata da
1941 realizzare.
1942
1943
1944
1945 \section{Il controllo di accesso ai file}
1946 \label{sec:file_access_control}
1947
1948 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
1949 del controllo di accesso ai file, che viene implementato per qualunque
1950 filesystem standard.\footnote{per standard si intende che implementa le
1951   caratteristiche previste dallo standard POSIX; in Linux sono disponibili
1952   anche una serie di altri filesystem, come quelli di Windows e del Mac, che
1953   non supportano queste caratteristiche.} In questa sezione ne esamineremo i
1954 concetti essenziali e le funzioni usate per gestirne i vari aspetti.
1955
1956
1957 \subsection{I permessi per l'accesso ai file}
1958 \label{sec:file_perm_overview}
1959
1960 Ad ogni file Linux associa sempre l'utente che ne è proprietario (il
1961 cosiddetto \textit{owner}) ed un gruppo di appartenenza, secondo il meccanismo
1962 degli identificatori di utente e gruppo (\acr{uid} e \acr{gid}). Questi valori
1963 sono accessibili da programma tramite la funzione \func{stat}, e sono
1964 mantenuti nei campi \var{st\_uid} e \var{st\_gid} della struttura
1965 \struct{stat} (si veda sez.~\ref{sec:file_stat}).\footnote{questo è vero solo
1966   per filesystem di tipo Unix, ad esempio non è vero per il filesystem vfat di
1967   Windows, che non fornisce nessun supporto per l'accesso multiutente, e per
1968   il quale i permessi vengono assegnati in maniera fissa con un opzione in
1969   fase di montaggio.}
1970
1971 Il controllo di accesso ai file segue un modello abbastanza semplice che
1972 prevede tre permessi fondamentali strutturati su tre livelli di accesso.
1973 Esistono varie estensioni a questo modello,\footnote{come le \textit{Access
1974     Control List} che sono state aggiunte ai filesystem standard con opportune
1975   estensioni (vedi sez.~\ref{sec:file_ACL}) per arrivare a meccanismi di
1976   controllo ancora più sofisticati come il \textit{mandatory access control}
1977   di SE-Linux.} ma nella maggior parte dei casi il meccanismo standard è più
1978 che sufficiente a soddisfare tutte le necessità più comuni.  I tre permessi di
1979 base associati ad ogni file sono:
1980 \begin{itemize*}
1981 \item il permesso di lettura (indicato con la lettera \texttt{r}, dall'inglese
1982   \textit{read}).
1983 \item il permesso di scrittura (indicato con la lettera \texttt{w},
1984   dall'inglese \textit{write}).
1985 \item il permesso di esecuzione (indicato con la lettera \texttt{x},
1986   dall'inglese \textit{execute}).
1987 \end{itemize*}
1988 mentre i tre livelli su cui sono divisi i privilegi sono:
1989 \begin{itemize*}
1990 \item i privilegi per l'utente proprietario del file.
1991 \item i privilegi per un qualunque utente faccia parte del gruppo cui
1992   appartiene il file.
1993 \item i privilegi per tutti gli altri utenti.
1994 \end{itemize*}
1995
1996 L'insieme dei permessi viene espresso con un numero a 12 bit; di questi i nove
1997 meno significativi sono usati a gruppi di tre per indicare i permessi base di
1998 lettura, scrittura ed esecuzione e sono applicati rispettivamente
1999 rispettivamente al proprietario, al gruppo, a tutti gli altri.
2000
2001 \begin{figure}[htb]
2002   \centering
2003   \includegraphics[width=6cm]{img/fileperm}
2004   \caption{Lo schema dei bit utilizzati per specificare i permessi di un file
2005     contenuti nel campo \var{st\_mode} di \struct{stat}.}
2006   \label{fig:file_perm_bit}
2007 \end{figure}
2008
2009 I restanti tre bit (noti come \itindex{suid~bit} \textit{suid bit},
2010 \itindex{sgid~bit} \textit{sgid bit}, e \itindex{sticky~bit} \textit{sticky
2011   bit}) sono usati per indicare alcune caratteristiche più complesse del
2012 meccanismo del controllo di accesso su cui torneremo in seguito (in
2013 sez.~\ref{sec:file_special_perm}); lo schema di allocazione dei bit è
2014 riportato in fig.~\ref{fig:file_perm_bit}.
2015
2016 Anche i permessi, come tutte le altre informazioni pertinenti al file, sono
2017 memorizzati \itindex{inode} nell'\textit{inode}; in particolare essi sono
2018 contenuti in alcuni bit del campo \var{st\_mode} della struttura \struct{stat}
2019 (si veda di nuovo fig.~\ref{fig:file_stat_struct}).
2020
2021 In genere ci si riferisce ai tre livelli dei privilegi usando le lettere
2022 \cmd{u} (per \textit{user}), \cmd{g} (per \textit{group}) e \cmd{o} (per
2023 \textit{other}), inoltre se si vuole indicare tutti i raggruppamenti insieme
2024 si usa la lettera \cmd{a} (per \textit{all}). Si tenga ben presente questa
2025 distinzione dato che in certi casi, mutuando la terminologia in uso nel VMS,
2026 si parla dei permessi base come di permessi per \textit{owner}, \textit{group}
2027 ed \textit{all}, le cui iniziali possono dar luogo a confusione.  Le costanti
2028 che permettono di accedere al valore numerico di questi bit nel campo
2029 \var{st\_mode} sono riportate in tab.~\ref{tab:file_bit_perm}.
2030
2031 \begin{table}[htb]
2032   \centering
2033     \footnotesize
2034   \begin{tabular}[c]{|c|l|}
2035     \hline
2036     \textbf{\var{st\_mode}} bit & \textbf{Significato} \\
2037     \hline
2038     \hline
2039     \const{S\_IRUSR} & \textit{user-read}, l'utente può leggere.\\
2040     \const{S\_IWUSR} & \textit{user-write}, l'utente può scrivere.\\
2041     \const{S\_IXUSR} & \textit{user-execute}, l'utente può eseguire.\\
2042     \hline
2043     \const{S\_IRGRP} & \textit{group-read}, il gruppo può leggere.\\
2044     \const{S\_IWGRP} & \textit{group-write}, il gruppo può scrivere.\\
2045     \const{S\_IXGRP} & \textit{group-execute}, il gruppo può eseguire.\\
2046     \hline
2047     \const{S\_IROTH} & \textit{other-read}, tutti possono leggere.\\
2048     \const{S\_IWOTH} & \textit{other-write}, tutti possono scrivere.\\
2049     \const{S\_IXOTH} & \textit{other-execute}, tutti possono eseguire.\\
2050     \hline
2051   \end{tabular}
2052   \caption{I bit dei permessi di accesso ai file, come definiti in
2053     \texttt{<sys/stat.h>}}
2054   \label{tab:file_bit_perm}
2055 \end{table}
2056
2057 I permessi vengono usati in maniera diversa dalle varie funzioni, e a seconda
2058 che si riferiscano a dei file, dei link simbolici o delle directory; qui ci
2059 limiteremo ad un riassunto delle regole generali, entrando nei dettagli più
2060 avanti.
2061
2062 La prima regola è che per poter accedere ad un file attraverso il suo
2063 \itindex{pathname} \textit{pathname} occorre il permesso di esecuzione in
2064 ciascuna delle directory che compongono il \textit{pathname}; lo stesso vale
2065 per aprire un file nella directory corrente (per la quale appunto serve il
2066 diritto di esecuzione).
2067
2068 Per una directory infatti il permesso di esecuzione significa che essa può
2069 essere attraversata nella risoluzione del \itindex{pathname}
2070 \textit{pathname}, ed è distinto dal permesso di lettura che invece implica
2071 che si può leggere il contenuto della directory.
2072
2073 Questo significa che se si ha il permesso di esecuzione senza permesso di
2074 lettura si potrà lo stesso aprire un file in una directory (se si hanno i
2075 permessi opportuni per il medesimo) ma non si potrà vederlo con \cmd{ls}
2076 (mentre per crearlo occorrerà anche il permesso di scrittura per la
2077 directory).
2078
2079 Avere il permesso di lettura per un file consente di aprirlo con le opzioni
2080 (si veda quanto riportato in tab.~\ref{tab:file_open_flags}) di sola lettura o
2081 di lettura/scrittura e leggerne il contenuto. Avere il permesso di scrittura
2082 consente di aprire un file in sola scrittura o lettura/scrittura e modificarne
2083 il contenuto, lo stesso permesso è necessario per poter troncare il file.
2084
2085 Non si può creare un file fintanto che non si disponga del permesso di
2086 esecuzione e di quello di scrittura per la directory di destinazione; gli
2087 stessi permessi occorrono per cancellare un file da una directory (si ricordi
2088 che questo non implica necessariamente la rimozione del contenuto del file dal
2089 disco), non è necessario nessun tipo di permesso per il file stesso (infatti
2090 esso non viene toccato, viene solo modificato il contenuto della directory,
2091 rimuovendo la voce che ad esso fa riferimento).
2092
2093 Per poter eseguire un file (che sia un programma compilato od uno script di
2094 shell, od un altro tipo di file eseguibile riconosciuto dal kernel), occorre
2095 avere il permesso di esecuzione, inoltre solo i file regolari possono essere
2096 eseguiti.
2097
2098 I permessi per un link simbolico sono ignorati, contano quelli del file a cui
2099 fa riferimento; per questo in genere il comando \cmd{ls} riporta per un link
2100 simbolico tutti i permessi come concessi; utente e gruppo a cui esso
2101 appartiene vengono pure ignorati quando il link viene risolto, vengono
2102 controllati solo quando viene richiesta la rimozione del link e quest'ultimo è
2103 in una directory con lo \itindex{sticky~bit} \textit{sticky bit} impostato (si
2104 veda sez.~\ref{sec:file_special_perm}).
2105
2106 La procedura con cui il kernel stabilisce se un processo possiede un certo
2107 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
2108 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
2109 \var{st\_gid} accennati in precedenza) e l'user-ID effettivo, il group-ID
2110 effettivo e gli eventuali group-ID supplementari del processo.\footnote{in
2111   realtà Linux, per quanto riguarda l'accesso ai file, utilizza gli
2112   identificatori del gruppo \textit{filesystem} (si ricordi quanto esposto in
2113   sez.~\ref{sec:proc_perms}), ma essendo questi del tutto equivalenti ai primi,
2114   eccetto il caso in cui si voglia scrivere un server NFS, ignoreremo questa
2115   differenza.}
2116
2117 Per una spiegazione dettagliata degli identificatori associati ai processi si
2118 veda sez.~\ref{sec:proc_perms}; normalmente, a parte quanto vedremo in
2119 sez.~\ref{sec:file_special_perm}, l'user-ID effettivo e il group-ID effettivo
2120 corrispondono ai valori dell'\acr{uid} e del \acr{gid} dell'utente che ha
2121 lanciato il processo, mentre i group-ID supplementari sono quelli dei gruppi
2122 cui l'utente appartiene.
2123
2124 I passi attraverso i quali viene stabilito se il processo possiede il diritto
2125 di accesso sono i seguenti:
2126 \begin{enumerate}
2127 \item Se l'user-ID effettivo del processo è zero (corrispondente
2128   all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
2129   controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
2130   tutti i file.
2131 \item Se l'user-ID effettivo del processo è uguale all'\acr{uid} del
2132   proprietario del file (nel qual caso si dice che il processo è proprietario
2133   del file) allora:
2134   \begin{itemize*}
2135   \item se il relativo\footnote{per relativo si intende il bit di user-read se
2136       il processo vuole accedere in lettura, quello di user-write per
2137       l'accesso in scrittura, ecc.} bit dei permessi d'accesso dell'utente è
2138     impostato, l'accesso è consentito
2139   \item altrimenti l'accesso è negato
2140   \end{itemize*}
2141 \item Se il group-ID effettivo del processo o uno dei group-ID supplementari
2142   dei processi corrispondono al \acr{gid} del file allora:
2143   \begin{itemize*}
2144   \item se il bit dei permessi d'accesso del gruppo è impostato, l'accesso è
2145     consentito,
2146   \item altrimenti l'accesso è negato
2147   \end{itemize*}
2148 \item Se il bit dei permessi d'accesso per tutti gli altri è impostato,
2149   l'accesso è consentito, altrimenti l'accesso è negato.
2150 \end{enumerate}
2151
2152 Si tenga presente che questi passi vengono eseguiti esattamente in
2153 quest'ordine. Questo vuol dire che se un processo è il proprietario di un file,
2154 l'accesso è consentito o negato solo sulla base dei permessi per l'utente; i
2155 permessi per il gruppo non vengono neanche controllati. Lo stesso vale se il
2156 processo appartiene ad un gruppo appropriato, in questo caso i permessi per
2157 tutti gli altri non vengono controllati.
2158
2159
2160 \subsection{I bit dei permessi speciali}
2161 \label{sec:file_special_perm}
2162
2163 \itindbeg{suid~bit}
2164 \itindbeg{sgid~bit}
2165
2166 Come si è accennato (in sez.~\ref{sec:file_perm_overview}) nei dodici bit del
2167 campo \var{st\_mode} di \struct{stat} che vengono usati per il controllo di
2168 accesso oltre ai bit dei permessi veri e propri, ci sono altri tre bit che
2169 vengono usati per indicare alcune proprietà speciali dei file.  Due di questi
2170 sono i bit detti \acr{suid} (da \textit{set-user-ID bit}) e \acr{sgid} (da
2171 \textit{set-group-ID bit}) che sono identificati dalle costanti
2172 \const{S\_ISUID} e \const{S\_ISGID}.
2173
2174 Come spiegato in dettaglio in sez.~\ref{sec:proc_exec}, quando si lancia un
2175 programma il comportamento normale del kernel è quello di impostare gli
2176 identificatori del gruppo \textit{effective} del nuovo processo al valore dei
2177 corrispondenti del gruppo \textit{real} del processo corrente, che normalmente
2178 corrispondono a quelli dell'utente con cui si è entrati nel sistema.
2179
2180 Se però il file del programma (che ovviamente deve essere
2181 eseguibile\footnote{per motivi di sicurezza il kernel ignora i bit \acr{suid}
2182   e \acr{sgid} per gli script eseguibili.}) ha il bit \acr{suid} impostato, il
2183 kernel assegnerà come user-ID effettivo al nuovo processo l'\acr{uid} del
2184 proprietario del file al posto dell'\acr{uid} del processo originario.  Avere
2185 il bit \acr{sgid} impostato ha lo stesso effetto sul group-ID effettivo del
2186 processo.
2187
2188 I bit \acr{suid} e \acr{sgid} vengono usati per permettere agli utenti normali
2189 di usare programmi che richiedono privilegi speciali; l'esempio classico è il
2190 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
2191 quest'ultimo ovviamente può essere scritto solo dall'amministratore, ma non è
2192 necessario chiamare l'amministratore per cambiare la propria password. Infatti
2193 il comando \cmd{passwd} appartiene a root ma ha il bit \acr{suid} impostato
2194 per cui quando viene lanciato da un utente normale parte con i privilegi di
2195 root.
2196
2197 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
2198 normalmente l'utente che lo ha lanciato comporta vari rischi, e questo tipo di
2199 programmi devono essere scritti accuratamente per evitare che possano essere
2200 usati per guadagnare privilegi non consentiti (l'argomento è affrontato in
2201 dettaglio in sez.~\ref{sec:proc_perms}).
2202
2203 La presenza dei bit \acr{suid} e \acr{sgid} su un file può essere rilevata con
2204 il comando \cmd{ls -l}, che visualizza una lettera \cmd{s} al posto della
2205 \cmd{x} in corrispondenza dei permessi di utente o gruppo. La stessa lettera
2206 \cmd{s} può essere usata nel comando \cmd{chmod} per impostare questi bit.
2207 Infine questi bit possono essere controllati all'interno di \var{st\_mode} con
2208 l'uso delle due costanti \const{S\_ISUID} e \const{S\_IGID}, i cui valori sono
2209 riportati in tab.~\ref{tab:file_mode_flags}.
2210
2211 Gli stessi bit vengono ad assumere in significato completamente diverso per le
2212 directory, normalmente infatti Linux usa la convenzione di SVr4 per indicare
2213 con questi bit l'uso della semantica BSD nella creazione di nuovi file (si
2214 veda sez.~\ref{sec:file_ownership_management} per una spiegazione dettagliata
2215 al proposito).
2216
2217 Infine Linux utilizza il bit \acr{sgid} per un'ulteriore estensione mutuata
2218 da SVr4. Il caso in cui un file ha il bit \acr{sgid} impostato senza che lo
2219 sia anche il corrispondente bit di esecuzione viene utilizzato per attivare
2220 per quel file il \itindex{mandatory~locking} \textit{mandatory locking}
2221 (affronteremo questo argomento in dettaglio più avanti, in
2222 sez.~\ref{sec:file_mand_locking}).
2223
2224 \itindend{suid~bit}
2225 \itindend{sgid~bit}
2226
2227
2228 \itindbeg{sticky~bit}
2229
2230 L'ultimo dei bit rimanenti, identificato dalla costante \const{S\_ISVTX}, è in
2231 parte un rimasuglio delle origini dei sistemi Unix. A quell'epoca infatti la
2232 memoria virtuale e l'accesso ai file erano molto meno sofisticati e per
2233 ottenere la massima velocità possibile per i programmi usati più comunemente
2234 si poteva impostare questo bit.
2235
2236 L'effetto di questo bit era che il \index{segmento!testo} segmento di testo
2237 del programma (si veda sez.~\ref{sec:proc_mem_layout} per i dettagli) veniva
2238 scritto nella swap la prima volta che questo veniva lanciato, e vi permaneva
2239 fino al riavvio della macchina (da questo il nome di \textsl{sticky bit});
2240 essendo la swap un file continuo o una partizione indicizzata direttamente si
2241 poteva risparmiare in tempo di caricamento rispetto alla ricerca attraverso la
2242 struttura del filesystem. Lo \textsl{sticky bit} è indicato usando la lettera
2243 \texttt{t} al posto della \texttt{x} nei permessi per gli altri.
2244
2245 Ovviamente per evitare che gli utenti potessero intasare la swap solo
2246 l'amministratore era in grado di impostare questo bit, che venne chiamato
2247 anche con il nome di \textit{saved text bit}, da cui deriva quello della
2248 costante.  Le attuali implementazioni di memoria virtuale e filesystem rendono
2249 sostanzialmente inutile questo procedimento.
2250
2251 Benché ormai non venga più utilizzato per i file, lo \textit{sticky bit} ha
2252 invece assunto un uso importante per le directory;\footnote{lo \textit{sticky
2253     bit} per le directory è un'estensione non definita nello standard POSIX,
2254   Linux però la supporta, così come BSD e SVr4.} in questo caso se tale bit è
2255 impostato un file potrà essere rimosso dalla directory soltanto se l'utente ha
2256 il permesso di scrittura su di essa ed inoltre è vera una delle seguenti
2257 condizioni:
2258 \begin{itemize*}
2259 \item l'utente è proprietario del file
2260 \item l'utente è proprietario della directory
2261 \item l'utente è l'amministratore
2262 \end{itemize*}
2263 un classico esempio di directory che ha questo bit impostato è \file{/tmp}, i
2264 permessi infatti di solito sono i seguenti:
2265 \begin{verbatim}
2266 $ ls -ld /tmp
2267 drwxrwxrwt    6 root     root         1024 Aug 10 01:03 /tmp
2268 \end{verbatim}%$
2269 quindi con lo \textit{sticky bit} bit impostato. In questo modo qualunque
2270 utente nel sistema può creare dei file in questa directory (che, come
2271 suggerisce il nome, è normalmente utilizzata per la creazione di file
2272 temporanei), ma solo l'utente che ha creato un certo file potrà cancellarlo o
2273 rinominarlo. In questo modo si evita che un utente possa, più o meno
2274 consapevolmente, cancellare i file temporanei creati degli altri utenti.
2275
2276 \itindend{sticky~bit}
2277
2278 \subsection{Le funzioni per la gestione dei permessi dei file}
2279 \label{sec:file_perm_management}
2280
2281 Come visto in sez.~\ref{sec:file_access_control} il controllo di accesso ad un
2282 file viene fatto utilizzando l'user-ID ed il group-ID effettivo del processo;
2283 ci sono casi però in cui si può voler effettuare il controllo con l'user-ID
2284 reale ed il group-ID reale, vale a dire usando i valori di \acr{uid} e
2285 \acr{gid} relativi all'utente che ha lanciato il programma, e che, come
2286 accennato in sez.~\ref{sec:file_special_perm} e spiegato in dettaglio in
2287 sez.~\ref{sec:proc_perms}, non è detto siano uguali a quelli effettivi.
2288
2289 Per far questo si può usare la funzione \funcd{access}, il cui prototipo è:
2290 \begin{prototype}{unistd.h}
2291 {int access(const char *pathname, int mode)}
2292
2293 Verifica i permessi di accesso.
2294
2295 \bodydesc{La funzione ritorna 0 se l'accesso è consentito, -1 se l'accesso non
2296   è consentito ed in caso di errore; nel qual caso la variabile \var{errno}
2297   assumerà i valori:
2298   \begin{errlist}
2299   \item[\errcode{EINVAL}] il valore di \param{mode} non è valido.
2300   \item[\errcode{EACCES}] l'accesso al file non è consentito, o non si ha il
2301     permesso di attraversare una delle directory di \param{pathname}.
2302   \item[\errcode{EROFS}] si è richiesto l'accesso in scrittura per un file su
2303     un filesystem montato in sola lettura.
2304   \end{errlist}
2305   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
2306   \errval{ENOTDIR}, \errval{ELOOP}, \errval{EIO}.}
2307 \end{prototype}
2308
2309 La funzione verifica i permessi di accesso, indicati da \param{mode}, per il
2310 file indicato da \param{pathname}. I valori possibili per l'argomento
2311 \param{mode} sono esprimibili come combinazione delle costanti numeriche
2312 riportate in tab.~\ref{tab:file_access_mode_val} (attraverso un OR binario
2313 delle stesse). I primi tre valori implicano anche la verifica dell'esistenza
2314 del file, se si vuole verificare solo quest'ultima si può usare \const{F\_OK},
2315 o anche direttamente \func{stat}. Nel caso in cui \param{pathname} si
2316 riferisca ad un link simbolico, questo viene seguito ed il controllo è fatto
2317 sul file a cui esso fa riferimento.
2318
2319 La funzione controlla solo i bit dei permessi di accesso, si ricordi che il
2320 fatto che una directory abbia permesso di scrittura non significa che ci si
2321 possa scrivere come in un file, e il fatto che un file abbia permesso di
2322 esecuzione non comporta che contenga un programma eseguibile. La funzione
2323 ritorna zero solo se tutte i permessi controllati sono disponibili, in caso
2324 contrario (o di errore) ritorna -1.
2325 \begin{table}[htb]
2326   \centering
2327   \footnotesize
2328   \begin{tabular}{|c|l|}
2329     \hline
2330     \textbf{\param{mode}} & \textbf{Significato} \\
2331     \hline
2332     \hline
2333     \const{R\_OK} & Verifica il permesso di lettura. \\
2334     \const{W\_OK} & Verifica il permesso di scrittura. \\
2335     \const{X\_OK} & Verifica il permesso di esecuzione. \\
2336     \const{F\_OK} & Verifica l'esistenza del file. \\
2337     \hline
2338   \end{tabular}
2339   \caption{Valori possibile per l'argomento \param{mode} della funzione
2340     \func{access}.}
2341   \label{tab:file_access_mode_val}
2342 \end{table}
2343
2344 Un esempio tipico per l'uso di questa funzione è quello di un processo che sta
2345 eseguendo un programma coi privilegi di un altro utente (ad esempio attraverso
2346 l'uso del \itindex{suid~bit} \textit{suid bit}) che vuole controllare se
2347 l'utente originale ha i permessi per accedere ad un certo file.
2348
2349 % TODO documentare euidaccess (e eaccess)
2350
2351 Per cambiare i permessi di un file il sistema mette ad disposizione due
2352 funzioni \funcd{chmod} e \funcd{fchmod}, che operano rispettivamente su un
2353 filename e su un file descriptor, i loro prototipi sono:
2354 \begin{functions}
2355   \headdecl{sys/types.h}
2356   \headdecl{sys/stat.h}
2357
2358   \funcdecl{int chmod(const char *path, mode\_t mode)} Cambia i permessi del
2359   file indicato da \param{path} al valore indicato da \param{mode}.
2360
2361   \funcdecl{int fchmod(int fd, mode\_t mode)} Analoga alla precedente, ma usa
2362   il file descriptor \param{fd} per indicare il file.
2363
2364   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
2365     un errore, in caso di errore \var{errno} può assumere i valori:
2366   \begin{errlist}
2367   \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2368     proprietario del file o non è zero.
2369     \item[\errcode{EROFS}] il file è su un filesystem in sola lettura.
2370   \end{errlist}
2371   ed inoltre \errval{EIO}; \func{chmod} restituisce anche \errval{EFAULT},
2372   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2373   \errval{EACCES}, \errval{ELOOP}; \func{fchmod} anche \errval{EBADF}.}
2374 \end{functions}
2375
2376 Entrambe le funzioni utilizzano come secondo argomento \param{mode}, una
2377 variabile dell'apposito tipo primitivo \type{mode\_t} (vedi
2378 tab.~\ref{tab:intro_primitive_types}) utilizzato per specificare i permessi sui
2379 file.
2380
2381 \begin{table}[!htb]
2382   \centering
2383   \footnotesize
2384   \begin{tabular}[c]{|c|c|l|}
2385     \hline
2386     \textbf{\param{mode}} & \textbf{Valore} & \textbf{Significato} \\
2387     \hline
2388     \hline
2389     \const{S\_ISUID} & 04000 & Set user ID \itindex{suid~bit}.\\
2390     \const{S\_ISGID} & 02000 & Set group ID \itindex{sgid~bit}.\\
2391     \const{S\_ISVTX} & 01000 & Sticky bit \itindex{sticky~bit}.\\
2392     \hline
2393     \const{S\_IRWXU} & 00700 & L'utente ha tutti i permessi.\\
2394     \const{S\_IRUSR} & 00400 & L'utente ha il permesso di lettura.\\
2395     \const{S\_IWUSR} & 00200 & L'utente ha il permesso di scrittura.\\
2396     \const{S\_IXUSR} & 00100 & L'utente ha il permesso di esecuzione.\\
2397     \hline
2398     \const{S\_IRWXG} & 00070 & Il gruppo ha tutti i permessi.\\
2399     \const{S\_IRGRP} & 00040 & Il gruppo ha il permesso di lettura.\\
2400     \const{S\_IWGRP} & 00020 & Il gruppo ha il permesso di scrittura.\\
2401     \const{S\_IXGRP} & 00010 & Il gruppo ha il permesso di esecuzione.\\
2402     \hline
2403     \const{S\_IRWXO} & 00007 & Gli altri hanno tutti i permessi.\\
2404     \const{S\_IROTH} & 00004 & Gli altri hanno il permesso di lettura.\\
2405     \const{S\_IWOTH} & 00002 & Gli altri hanno il permesso di scrittura.\\
2406     \const{S\_IXOTH} & 00001 & Gli altri hanno il permesso di esecuzione.\\
2407     \hline
2408   \end{tabular}
2409   \caption{Valori delle costanti usate per indicare i vari bit di
2410     \param{mode} utilizzato per impostare i permessi dei file.}
2411   \label{tab:file_permission_const}
2412 \end{table}
2413
2414 Le costanti con cui specificare i singoli bit di \param{mode} sono riportate
2415 in tab.~\ref{tab:file_permission_const}. Il valore di \param{mode} può essere
2416 ottenuto combinando fra loro con un OR binario le costanti simboliche relative
2417 ai vari bit, o specificato direttamente, come per l'omonimo comando di shell,
2418 con un valore numerico (la shell lo vuole in ottale, dato che i bit dei
2419 permessi sono divisibili in gruppi di tre), che si può calcolare direttamente
2420 usando lo schema si utilizzo dei bit illustrato in
2421 fig.~\ref{fig:file_perm_bit}.
2422
2423 Ad esempio i permessi standard assegnati ai nuovi file (lettura e scrittura
2424 per il proprietario, sola lettura per il gruppo e gli altri) sono
2425 corrispondenti al valore ottale $0644$, un programma invece avrebbe anche il
2426 bit di esecuzione attivo, con un valore di $0755$, se si volesse attivare il
2427 bit \itindex{suid~bit} \acr{suid} il valore da fornire sarebbe $4755$.
2428
2429 Il cambiamento dei permessi di un file eseguito attraverso queste funzioni ha
2430 comunque alcune limitazioni, previste per motivi di sicurezza. L'uso delle
2431 funzioni infatti è possibile solo se l'user-ID effettivo del processo
2432 corrisponde a quello del proprietario del file o dell'amministratore,
2433 altrimenti esse falliranno con un errore di \errcode{EPERM}.
2434
2435 Ma oltre a questa regola generale, di immediata comprensione, esistono delle
2436 limitazioni ulteriori. Per questo motivo, anche se si è proprietari del file,
2437 non tutti i valori possibili di \param{mode} sono permessi o hanno effetto;
2438 in particolare accade che:
2439 \begin{enumerate}
2440 \item siccome solo l'amministratore può impostare lo \itindex{sticky~bit}
2441   \textit{sticky bit}, se l'user-ID effettivo del processo non è zero esso
2442   viene automaticamente cancellato (senza notifica di errore) qualora sia
2443   stato indicato in \param{mode}.
2444 \item per quanto detto in sez.~\ref{sec:file_ownership_management} riguardo la
2445   creazione dei nuovi file, si può avere il caso in cui il file creato da un
2446   processo è assegnato ad un gruppo per il quale il processo non ha privilegi.
2447   Per evitare che si possa assegnare il bit \itindex{sgid~bit} \acr{sgid} ad
2448   un file appartenente ad un gruppo per cui non si hanno diritti, questo viene
2449   automaticamente cancellato da \param{mode} (senza notifica di errore)
2450   qualora il gruppo del file non corrisponda a quelli associati al processo
2451   (la cosa non avviene quando l'user-ID effettivo del processo è zero).
2452 \end{enumerate}
2453
2454 Per alcuni filesystem\footnote{i filesystem più comuni (\textsl{ext2},
2455   \textsl{ext3}, \textsl{reiserfs}) supportano questa caratteristica, che è
2456   mutuata da BSD.} è inoltre prevista un'ulteriore misura di sicurezza, volta
2457 a scongiurare l'abuso dei \itindex{suid~bit} bit \acr{suid} e \acr{sgid}; essa
2458 consiste nel cancellare automaticamente questi bit dai permessi di un file
2459 qualora un processo che non appartenga all'amministratore\footnote{per la
2460   precisione un processo che non dispone della capability
2461   \const{CAP\_FSETID}.} effettui una scrittura. In questo modo anche se un
2462 utente malizioso scopre un file \acr{suid} su cui può scrivere, un'eventuale
2463 modifica comporterà la perdita di questo privilegio.
2464
2465 Le funzioni \func{chmod} e \func{fchmod} ci permettono di modificare i
2466 permessi di un file, resta però il problema di quali sono i permessi assegnati
2467 quando il file viene creato. Le funzioni dell'interfaccia nativa di Unix, come
2468 vedremo in sez.~\ref{sec:file_open}, permettono di indicare esplicitamente i
2469 permessi di creazione di un file, ma questo non è possibile per le funzioni
2470 dell'interfaccia standard ANSI C che non prevede l'esistenza di utenti e
2471 gruppi, ed inoltre il problema si pone anche per l'interfaccia nativa quando i
2472 permessi non vengono indicati esplicitamente.
2473
2474 \itindbeg{umask}
2475
2476 Per le funzioni dell'interfaccia standard ANSI C l'unico riferimento possibile
2477 è quello della modalità di apertura del nuovo file (lettura/scrittura o sola
2478 lettura), che però può fornire un valore che è lo stesso per tutti e tre i
2479 permessi di sez.~\ref{sec:file_perm_overview} (cioè $666$ nel primo caso e
2480 $222$ nel secondo). Per questo motivo il sistema associa ad ogni
2481 processo\footnote{è infatti contenuta nel campo \var{umask} della struttura
2482   \struct{fs\_struct}, vedi fig.~\ref{fig:proc_task_struct}.}  una maschera di
2483 bit, la cosiddetta \textit{umask}, che viene utilizzata per impedire che
2484 alcuni permessi possano essere assegnati ai nuovi file in sede di creazione. I
2485 bit indicati nella maschera vengono infatti cancellati dai permessi quando un
2486 nuovo file viene creato.\footnote{l'operazione viene fatta sempre: anche
2487   qualora si indichi esplicitamente un valore dei permessi nelle funzioni di
2488   creazione che lo consentono, i permessi contenuti nella \textit{umask}
2489   verranno tolti.}
2490
2491 La funzione che permette di impostare il valore di questa maschera di
2492 controllo è \funcd{umask}, ed il suo prototipo è:
2493 \begin{prototype}{stat.h}
2494 {mode\_t umask(mode\_t mask)}
2495
2496 Imposta la maschera dei permessi dei bit al valore specificato da \param{mask}
2497 (di cui vengono presi solo i 9 bit meno significativi).
2498
2499   \bodydesc{La funzione ritorna il precedente valore della maschera. È una
2500     delle poche funzioni che non restituisce codici di errore.}
2501 \end{prototype}
2502
2503 In genere si usa questa maschera per impostare un valore predefinito che
2504 escluda preventivamente alcuni permessi (usualmente quello di scrittura per il
2505 gruppo e gli altri, corrispondente ad un valore per \param{mask} pari a
2506 $022$).  In questo modo è possibile cancellare automaticamente i permessi non
2507 voluti.  Di norma questo valore viene impostato una volta per tutte al login a
2508 $022$, e gli utenti non hanno motivi per modificarlo.
2509
2510 \itindend{umask}
2511
2512
2513 \subsection{La gestione della titolarità dei file}
2514 \label{sec:file_ownership_management}
2515
2516 Vedremo in sez.~\ref{sec:file_base_func} con quali funzioni si possono creare
2517 nuovi file, in tale occasione vedremo che è possibile specificare in sede di
2518 creazione quali permessi applicare ad un file, però non si può indicare a
2519 quale utente e gruppo esso deve appartenere.  Lo stesso problema si presenta
2520 per la creazione di nuove directory (procedimento descritto in
2521 sez.~\ref{sec:file_dir_creat_rem}).
2522
2523 Lo standard POSIX prescrive che l'\acr{uid} del nuovo file corrisponda
2524 all'user-ID effettivo del processo che lo crea; per il \acr{gid} invece prevede
2525 due diverse possibilità:
2526 \begin{itemize*}
2527 \item il \acr{gid} del file corrisponde al group-ID effettivo del processo.
2528 \item il \acr{gid} del file corrisponde al \acr{gid} della directory in cui
2529   esso è creato.
2530 \end{itemize*}
2531 in genere BSD usa sempre la seconda possibilità, che viene per questo chiamata
2532 semantica BSD. Linux invece segue quella che viene chiamata semantica SVr4; di
2533 norma cioè il nuovo file viene creato, seguendo la prima opzione, con il
2534 \acr{gid} del processo, se però la directory in cui viene creato il file ha il
2535 bit \acr{sgid} impostato allora viene usata la seconda opzione.
2536
2537 Usare la semantica BSD ha il vantaggio che il \acr{gid} viene sempre
2538 automaticamente propagato, restando coerente a quello della directory di
2539 partenza, in tutte le sotto-directory.
2540
2541 La semantica SVr4 offre la possibilità di scegliere, ma per ottenere lo stesso
2542 risultato di coerenza che si ha con BSD necessita che per le nuove directory
2543 venga anche propagato anche il bit \acr{sgid}. Questo è il comportamento
2544 predefinito del comando \cmd{mkdir}, ed è in questo modo ad esempio che Debian
2545 assicura che le sotto-directory create nella home di un utente restino sempre
2546 con il \acr{gid} del gruppo primario dello stesso.
2547
2548 Come per i permessi, il sistema fornisce anche delle funzioni che permettano
2549 di cambiare utente e gruppo cui il file appartiene; le funzioni in questione
2550 sono tre: \funcd{chown}, \funcd{fchown} e \funcd{lchown}, ed i loro prototipi
2551 sono:
2552 \begin{functions}
2553   \headdecl{sys/types.h}
2554   \headdecl{sys/stat.h}
2555
2556   \funcdecl{int chown(const char *path, uid\_t owner, gid\_t group)}
2557   \funcdecl{int fchown(int fd, uid\_t owner, gid\_t group)}
2558   \funcdecl{int lchown(const char *path, uid\_t owner, gid\_t group)}
2559
2560   Le funzioni cambiano utente e gruppo di appartenenza di un file ai valori
2561   specificati dalle variabili \param{owner} e \param{group}.
2562
2563   \bodydesc{Le funzioni restituiscono zero in caso di successo e -1 per
2564     un errore, in caso di errore \var{errno} può assumere i valori:
2565   \begin{errlist}
2566   \item[\errcode{EPERM}] l'user-ID effettivo non corrisponde a quello del
2567     proprietario del file o non è zero, o utente e gruppo non sono validi
2568   \end{errlist}
2569   Oltre a questi entrambe restituiscono gli errori \errval{EROFS} e
2570   \errval{EIO}; \func{chown} restituisce anche \errval{EFAULT},
2571   \errval{ENAMETOOLONG}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ENOTDIR},
2572   \errval{EACCES}, \errval{ELOOP}; \func{fchown} anche \errval{EBADF}.}
2573 \end{functions}
2574
2575 In Linux soltanto l'amministratore (in sostanza un processo con la
2576 \itindex{capabilities} capability \const{CAP\_CHOWN}) può cambiare il
2577 proprietario di un file, seguendo la semantica di BSD che non consente agli
2578 utenti di assegnare i loro file ad altri (per evitare eventuali aggiramenti
2579 delle quote).  L'amministratore può cambiare il gruppo di un file, il
2580 proprietario può cambiare il gruppo dei file che gli appartengono solo se il
2581 nuovo gruppo è il suo gruppo primario o uno dei gruppi di cui fa parte.
2582
2583 La funzione \func{chown} segue i link simbolici, per operare direttamente su
2584 un link simbolico si deve usare la funzione \func{lchown}.\footnote{fino alla
2585   versione 2.1.81 in Linux \func{chown} non seguiva i link simbolici, da
2586   allora questo comportamento è stato assegnato alla funzione \func{lchown},
2587   introdotta per l'occasione, ed è stata creata una nuova system call per
2588   \func{chown} che seguisse i link simbolici.} La funzione \func{fchown} opera
2589 su un file aperto, essa è mutuata da BSD, ma non è nello standard POSIX.
2590 Un'altra estensione rispetto allo standard POSIX è che specificando -1 come
2591 valore per \param{owner} e \param{group} i valori restano immutati.
2592
2593 Quando queste funzioni sono chiamate con successo da un processo senza i
2594 privilegi di root entrambi i bit \itindex{suid~bit} \acr{suid} e
2595 \itindex{sgid~bit} \acr{sgid} vengono cancellati. Questo non avviene per il
2596 bit \acr{sgid} nel caso in cui esso sia usato (in assenza del corrispondente
2597 permesso di esecuzione) per indicare che per il file è attivo il
2598 \itindex{mandatory~locking} \textit{mandatory locking}.
2599
2600
2601 \subsection{Un quadro d'insieme sui permessi}
2602 \label{sec:file_riepilogo}
2603
2604 Avendo affrontato in maniera separata il comportamento delle varie funzioni ed
2605 il significato dei singoli bit dei permessi sui file, vale la pena fare un
2606 riepilogo in cui si riassumono le caratteristiche di ciascuno di essi, in modo
2607 da poter fornire un quadro d'insieme.
2608
2609 In tab.~\ref{tab:file_fileperm_bits} si sono riassunti gli effetti dei vari
2610 bit dei permessi per un file; per quanto riguarda l'applicazione dei permessi
2611 per proprietario, gruppo ed altri si ricordi quanto illustrato in
2612 sez.~\ref{sec:file_perm_overview}.  Per compattezza, nella tabelle si sono
2613 specificati i bit di \itindex{suid~bit} \textit{suid}, \itindex{sgid~bit}
2614 \textit{sgid} e \textit{sticky} \itindex{sticky~bit} con la notazione
2615 illustrata anche in fig.~\ref{fig:file_perm_bit}.
2616
2617 \begin{table}[!htb]
2618   \centering
2619   \footnotesize
2620   \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
2621     \hline
2622     \multicolumn{3}{|c|}{special}&
2623     \multicolumn{3}{|c|}{user}&
2624     \multicolumn{3}{|c|}{group}&
2625     \multicolumn{3}{|c|}{other}&
2626     \multirow{2}{*}{\textbf{Operazioni possibili}} \\
2627     \cline{1-12}
2628     \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2629     \hline
2630     \hline
2631    1&-&-&-&-&-&-&-&-&-&-&-&Se eseguito ha i permessi del proprietario.\\
2632    -&1&-&-&-&1&-&-&-&-&-&-&Se eseguito ha i permessi del gruppo proprietario.\\
2633    -&1&-&-&-&0&-&-&-&-&-&-&Il \itindex{mandatory~locking}
2634                            \textit{mandatory locking} è abilitato.\\
2635    -&-&1&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2636    -&-&-&1&-&-&-&-&-&-&-&-&Permesso di lettura per il proprietario.\\
2637    -&-&-&-&1&-&-&-&-&-&-&-&Permesso di scrittura per il proprietario.\\
2638    -&-&-&-&-&1&-&-&-&-&-&-&Permesso di esecuzione per il proprietario.\\
2639    -&-&-&-&-&-&1&-&-&-&-&-&Permesso di lettura per il gruppo proprietario.\\
2640    -&-&-&-&-&-&-&1&-&-&-&-&Permesso di scrittura per il gruppo proprietario.\\
2641    -&-&-&-&-&-&-&-&1&-&-&-&Permesso di esecuzione per il gruppo proprietario.\\
2642    -&-&-&-&-&-&-&-&-&1&-&-&Permesso di lettura per tutti gli altri.\\
2643    -&-&-&-&-&-&-&-&-&-&1&-&Permesso di scrittura per tutti gli altri.\\
2644    -&-&-&-&-&-&-&-&-&-&-&1&Permesso di esecuzione per tutti gli altri.\\
2645     \hline
2646   \end{tabular}
2647   \caption{Tabella riassuntiva del significato dei bit dei permessi per un
2648     file.}
2649   \label{tab:file_fileperm_bits}
2650 \end{table}
2651
2652 In tab.~\ref{tab:file_dirperm_bits} si sono invece riassunti gli effetti dei
2653 vari bit dei permessi per una directory; anche in questo caso si sono
2654 specificati i bit di \itindex{suid~bit} \textit{suid}, \itindex{sgid~bit}
2655 \textit{sgid} e \textit{sticky} \itindex{sticky~bit} con la notazione compatta
2656 illustrata in fig.~\ref{fig:file_perm_bit}.
2657
2658 \begin{table}[!htb]
2659   \centering
2660   \footnotesize
2661   \begin{tabular}[c]{|c|c|c|c|c|c|c|c|c|c|c|c|l|}
2662     \hline
2663     \multicolumn{3}{|c|}{special}&
2664     \multicolumn{3}{|c|}{user}&
2665     \multicolumn{3}{|c|}{group}&
2666     \multicolumn{3}{|c|}{other}&
2667     \multirow{2}{*}{\textbf{Operazioni possibili}} \\
2668     \cline{1-12}
2669     \acr{s}&\acr{s}&\acr{t}&r&w&x&r&w&x&r&w&x& \\
2670     \hline
2671     \hline
2672     1&-&-&-&-&-&-&-&-&-&-&-&Non utilizzato.\\
2673     -&1&-&-&-&-&-&-&-&-&-&-&Propaga il gruppo proprietario ai nuovi file
2674                             creati.\\
2675     -&-&1&-&-&-&-&-&-&-&-&-&Limita l'accesso in scrittura dei file nella
2676                             directory.\\
2677     -&-&-&1&-&-&-&-&-&-&-&-&Permesso di visualizzazione per il proprietario.\\
2678     -&-&-&-&1&-&-&-&-&-&-&-&Permesso di aggiornamento per il proprietario.\\
2679     -&-&-&-&-&1&-&-&-&-&-&-&Permesso di attraversamento per il proprietario.\\
2680     -&-&-&-&-&-&1&-&-&-&-&-&Permesso di visualizzazione per il gruppo
2681                             proprietario.\\
2682     -&-&-&-&-&-&-&1&-&-&-&-&Permesso di aggiornamento per il gruppo
2683                             proprietario.\\
2684     -&-&-&-&-&-&-&-&1&-&-&-&Permesso di attraversamento per il gruppo
2685                             proprietario.\\
2686     -&-&-&-&-&-&-&-&-&1&-&-&Permesso di visualizzazione per tutti gli altri.\\
2687     -&-&-&-&-&-&-&-&-&-&1&-&Permesso di aggiornamento per tutti gli altri.\\
2688     -&-&-&-&-&-&-&-&-&-&-&1&Permesso di attraversamento per tutti gli altri.\\
2689     \hline
2690   \end{tabular}
2691   \caption{Tabella riassuntiva del significato dei bit dei permessi per una
2692     directory.}
2693   \label{tab:file_dirperm_bits}
2694 \end{table}
2695
2696 Nelle tabelle si è indicato con il carattere ``-'' il fatto che il valore del
2697 bit in questione non è influente rispetto a quanto indicato nella riga della
2698 tabella; la descrizione dell'operazione fa riferimento soltanto alla
2699 combinazione di bit per i quali è stato riportato esplicitamente un valore.
2700 Si rammenti infine che il valore dei bit dei permessi non ha alcun effetto
2701 qualora il processo possieda i privilegi di amministratore.
2702
2703
2704
2705 \section{Caratteristiche e funzionalità avanzate}
2706 \label{sec:file_dir_advances}
2707
2708 Tratteremo qui alcune caratteristiche e funzionalità avanzate della gestione
2709 di file e directory, affrontando anche una serie di estensioni
2710 dell'interfaccia classica dei sistemi unix-like, principalmente utilizzate a
2711 scopi di sicurezza, che sono state introdotte nelle versioni più recenti di
2712 Linux.
2713
2714
2715 \subsection{Gli attributi estesi}
2716 \label{sec:file_xattr}
2717
2718 \itindbeg{Extended~Attributes}
2719
2720 Nelle sezioni precedenti abbiamo trattato in dettaglio le varie informazioni
2721 che il sistema mantiene negli \itindex{inode} \textit{inode}, e le varie
2722 funzioni che permettono di modificarle.  Si sarà notato come in realtà queste
2723 informazioni siano estremamente ridotte.  Questo è dovuto al fatto che Unix
2724 origina negli anni '70, quando le risorse di calcolo e di spazio disco erano
2725 minime. Con il venir meno di queste restrizioni è incominciata ad emergere
2726 l'esigenza di poter associare ai file delle ulteriori informazioni astratte
2727 (quelli che vengono chiamati i \textsl{meta-dati}) che però non potevano
2728 trovare spazio nei dati classici mantenuti negli \itindex{inode}
2729 \textit{inode}.
2730
2731 Per risolvere questo problema alcuni sistemi unix-like (e fra questi anche
2732 Linux) hanno introdotto un meccanismo generico che consenta di associare delle
2733 informazioni ai singoli file,\footnote{l'uso più comune è quello della ACL,
2734   che tratteremo nella prossima sezione, ma si possono inserire anche altre
2735   informazioni.}  detto \textit{Extended Attributes}. Gli \textsl{attributi
2736   estesi} non sono altro che delle coppie nome/valore che sono associate
2737 permanentemente ad un oggetto sul filesystem, analoghi di quello che sono le
2738 variabili di ambiente (vedi sez.~\ref{sec:proc_environ}) per un processo.
2739
2740 Altri sistemi (come Solaris, MacOS e Windows) hanno adottato un meccanismo
2741 diverso in cui ad un file sono associati diversi flussi di dati, su cui
2742 possono essere mantenute ulteriori informazioni, che possono essere accedute
2743 con le normali operazioni di lettura e scrittura. Questi non vanno confusi con
2744 gli \textit{Extended Attributes} (anche se su Solaris hanno lo stesso nome),
2745 che sono un meccanismo molto più semplice, che pur essendo limitato (potendo
2746 contenere solo una quantità limitata di informazione) hanno il grande
2747 vantaggio di essere molto più semplici da realizzare, più
2748 efficienti,\footnote{cosa molto importante, specie per le applicazioni che
2749   richiedono una gran numero di accessi, come le ACL.} e di garantire
2750 l'atomicità di tutte le operazioni.
2751
2752 In Linux gli attributi estesi sono sempre associati al singolo \itindex{inode}
2753 \textit{inode} e l'accesso viene sempre eseguito in forma atomica, in lettura
2754 il valore corrente viene scritto su un buffer in memoria, mentre la scrittura
2755 prevede che ogni valore precedente sia sovrascritto.
2756
2757 Si tenga presente che non tutti i filesystem supportano gli \textit{Extended
2758   Attributes}, in particolare al momento della scrittura di queste dispense
2759 essi sono presenti solo su \textsl{ext2}, \textsl{ext3} e \textsl{XFS}.
2760 Inoltre a seconda della implementazione ci possono essere dei limiti sulla
2761 quantità di attributi che si possono utilizzare.\footnote{ad esempio nel caso
2762   di \textsl{ext2} ed \textsl{ext3} è richiesto che essi siano contenuti
2763   all'interno di un singolo blocco (pertanto con dimensioni massime pari a
2764   1024, 2048 o 4096 byte a seconda delle dimensioni di quest'ultimo impostate
2765   in fase di creazione del filesystem), mentre con \textsl{XFS} non ci sono
2766   limiti ed i dati vengono memorizzati in maniera diversa (nell'\textit{inode}
2767   stesso, in un blocco a parte, o in una struttura ad albero dedicata) per
2768   mantenerne la scalabilità.} Infine lo spazio utilizzato per mantenere gli
2769 attributi estesi viene tenuto in conto per il calcolo delle quote di utente e
2770 gruppo proprietari del file.
2771
2772 Come meccanismo per mantenere informazioni aggiuntive associate al singolo
2773 file, gli \textit{Extended Attributes} possono avere usi anche molto diversi
2774 fra loro.  Per poterli distinguere allora sono stati suddivisi in
2775 \textsl{classi}, a cui poter applicare requisiti diversi per l'accesso e la
2776 gestione. Per questo motivo il nome di un attributo deve essere sempre
2777 specificato nella forma \texttt{namespace.attribute}, dove \texttt{namespace}
2778 fa riferimento alla classe a cui l'attributo appartiene, mentre
2779 \texttt{attribute} è il nome ad esso assegnato. In tale forma il nome di un
2780 attributo esteso deve essere univoco. Al momento\footnote{della scrittura di
2781   questa sezione, kernel 2.6.23, ottobre 2007.} sono state definite le quattro
2782 classi di attributi riportate in tab.~\ref{tab:extended_attribute_class}.
2783
2784 \begin{table}[htb]
2785   \centering
2786   \footnotesize
2787   \begin{tabular}{|c|p{10cm}|}
2788     \hline
2789     \textbf{Nome} & \textbf{Descrizione} \\
2790     \hline
2791     \hline
2792     \const{security}& Gli \textit{extended security attributes}: vengono
2793                       utilizzati dalle estensioni di sicurezza del kernel (i
2794                       \itindex{Linux~Security~Modules} \textit{Linux
2795                         Security Modules}), per le realizzazione di meccanismi
2796                       evoluti di controllo di accesso come \index{SELinux}
2797                       SELinux.\\
2798     \const{system}  & Gli \textit{extended security attributes}: sono usati
2799                       dal kernel per memorizzare dati di sistema associati ai
2800                       file come le \itindex{Access~Control~List} ACL (vedi
2801                       sez.~\ref{sec:file_ACL}) o le \itindex{capabilities}
2802                       \textit{capabilities} (vedi
2803                       sez.~\ref{sec:proc_capabilities}).\\
2804     \const{trusted} & I \textit{trusted extended attributes}: vengono
2805                       utilizzati per poter realizzare in user space
2806                       meccanismi che consentano di mantenere delle
2807                       informazioni sui file che non devono essere accessibili
2808                       ai processi ordinari.\\
2809     \const{user}    & Gli \textit{extended user attributes}: utilizzati per
2810                       mantenere informazioni aggiuntive sui file (come il
2811                       \textit{mime-type}, la codifica dei caratteri o del
2812                       file) accessibili dagli utenti.\\
2813     \hline
2814   \end{tabular}
2815   \caption{I nomi utilizzati valore di \texttt{namespace} per distinguere le
2816     varie classi di \textit{Extended Attributes}.}
2817   \label{tab:extended_attribute_class}
2818 \end{table}
2819
2820
2821 Dato che uno degli usi degli \textit{Extended Attributes} è quello che li
2822 impiega per realizzare delle estensioni (come le ACL, \index{SELinux} SELinux,
2823 ecc.) al tradizionale meccanismo dei controlli di accesso di Unix, l'accesso
2824 ai loro valori viene regolato in maniera diversa a seconda sia della loro
2825 classe sia di quali, fra le estensioni che li utilizzano, sono poste in uso.
2826 In particolare, per ciascuna delle classi riportate in
2827 tab.~\ref{tab:extended_attribute_class}, si hanno i seguenti casi:
2828 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
2829 \item[\texttt{security}] L'accesso agli \textit{extended security attributes}
2830   dipende dalle politiche di sicurezza stabilite da loro stessi tramite
2831   l'utilizzo di un sistema di controllo basato sui
2832   \itindex{Linux~Security~Modules} \textit{Linux Security Modules} (ad esempio
2833   \index{SELinux} SELinux). Pertanto l'accesso in lettura o scrittura dipende
2834   dalle politiche di sicurezza implementate all'interno dal modulo di
2835   sicurezza che si sta utilizzando al momento (ciascuno avrà le sue). Se non è
2836   stato caricato nessun modulo di sicurezza l'accesso in lettura sarà
2837   consentito a tutti i processi, mentre quello in scrittura solo ai processi
2838   con privilegi amministrativi dotati della \index{capabilities}
2839   \textit{capability} \const{CAP\_SYS\_ADMIN}.
2840
2841 \item[\texttt{system}] Anche l'accesso agli \textit{extended system
2842     attributes} dipende dalle politiche di accesso che il kernel realizza
2843   anche utilizzando gli stessi valori in essi contenuti. Ad esempio nel caso
2844   delle ACL l'accesso è consentito in lettura ai processi che hanno la
2845   capacità di eseguire una ricerca sul file (cioè hanno il permesso di lettura
2846   sulla directory che contiene il file) ed in scrittura al proprietario del
2847   file o ai processi dotati della \textit{capability} \index{capabilities}
2848   \const{CAP\_FOWNER}.\footnote{vale a dire una politica di accesso analoga a
2849     quella impiegata per gli ordinari permessi dei file.}
2850
2851 \item[\texttt{trusted}] L'accesso ai \textit{trusted extended attributes}, sia
2852   per la lettura che per la scrittura, è consentito soltanto ai processi con
2853   privilegi amministrativi dotati della \index{capabilities}
2854   \textit{capability} \const{CAP\_SYS\_ADMIN}. In questo modo si possono
2855   utilizzare questi attributi per realizzare in user space dei meccanismi di
2856   controllo che accedono ad informazioni non disponibili ai processi ordinari.
2857
2858 \item[\texttt{user}] L'accesso agli \textit{extended user attributes} è
2859   regolato dagli ordinari permessi dei file a cui essi fanno riferimento:
2860   occorre avere il permesso di lettura per leggerli e quello di scrittura per
2861   scriverli o modificarli. Dato l'uso di questi attributi, si è scelto cioè di
2862   applicare per il loro accesso gli stessi criteri che si usano per l'accesso
2863   al contenuto dei file (o delle directory) cui essi fanno riferimento.
2864
2865   Questa scelta vale però soltanto per i file e le directory ordinarie, se
2866   valesse in generale infatti si avrebbe un serio problema di sicurezza dato
2867   che esistono diversi oggetti sul filesystem per i quali è normale avere
2868   avere il permesso di scrittura consentito a tutti gli utenti, come i link
2869   simbolici, o alcuni file di dispositivo come \texttt{/dev/null}. Se fosse
2870   possibile usare su di essi gli \textit{extended user attributes} un utente
2871   qualunque potrebbe inserirvi dati a piacere.\footnote{la cosa è stata notata
2872     su XFS, dove questo comportamento permetteva, non essendovi limiti sullo
2873     spazio occupabile dagli \textit{Extended Attributes}, di bloccare il
2874     sistema riempiendo il disco.}
2875
2876   La semantica del controllo di accesso che abbiamo indicato inoltre non
2877   avrebbe alcun senso al di fuori di file e directory: i permessi di lettura e
2878   scrittura per un file di dispositivo attengono alle capacità di accesso al
2879   dispositivo sottostante,\footnote{motivo per cui si può formattare un disco
2880     anche se \texttt{/dev} è su un filesystem in sola lettura.} mentre per i
2881   link simbolici questi vengono semplicemente ignorati: in nessuno dei due
2882   casi hanno a che fare con il contenuto del file, e nella discussione
2883   relativa all'uso degli \textit{extended user attributes} nessuno è mai stato
2884   capace di indicare una qualche forma sensata di utilizzo degli stessi per
2885   link simbolici o file di dispositivo, e neanche per le fifo o i socket.
2886
2887   Per questo motivo gli \textit{extended user attributes} sono stati
2888   completamente disabilitati per tutto ciò che non sia un file regolare o una
2889   directory.\footnote{si può verificare la semantica adottata consultando il
2890     file \texttt{fs/xattr.c} dei sorgenti del kernel.} Inoltre per le
2891   directory è stata introdotta una ulteriore restrizione, dovuta di nuovo alla
2892   presenza ordinaria di permessi di scrittura completi su directory come
2893   \texttt{/tmp}.  Questo è un altro caso particolare, in cui il premesso di
2894   scrittura viene usato, unito alla presenza dello \itindex{sticky~bit}
2895   \textit{sticky bit}, per garantire il permesso di creazione di nuovi file.
2896   Per questo motivo, per evitare eventuali abusi, se una directory ha lo
2897   \itindex{sticky~bit} \textit{sticky bit} attivo sarà consentito scrivere i
2898   suoi \textit{extended user attributes} soltanto se si è proprietari della
2899   stessa, o si hanno i privilegi amministrativi della capability
2900   \index{capabilities} \const{CAP\_FOWNER}.
2901 \end{basedescript}
2902
2903 Le funzioni per la gestione degli attributi estesi, come altre funzioni di
2904 gestione avanzate specifiche di Linux, non fanno parte delle \acr{glibc}, e
2905 sono fornite da una apposita libreria, \texttt{libattr}, che deve essere
2906 installata a parte;\footnote{la versione corrente della libreria è
2907   \texttt{libattr1}, e nel caso si usi Debian la si può installare con il
2908   pacchetto omonimo ed il collegato \texttt{libattr1-dev}.}  pertanto se un
2909 programma le utilizza si dovrà indicare esplicitamente l'uso della suddetta
2910 libreria invocando il compilatore con l'opzione \texttt{-lattr}.
2911
2912 Per poter leggere gli attributi estesi sono disponibili tre diverse funzioni,
2913 \funcd{getxattr}, \funcd{lgetxattr} e \funcd{fgetxattr}, che consentono
2914 rispettivamente di richiedere gli attributi relativi a un file, a un link
2915 simbolico e ad un file descriptor; i rispettivi prototipi sono:
2916 \begin{functions}
2917   \headdecl{sys/types.h}
2918   \headdecl{attr/xattr.h}
2919
2920   \funcdecl{ssize\_t getxattr(const char *path, const char *name, void
2921     *value, size\_t size)}
2922
2923   \funcdecl{ssize\_t lgetxattr(const char *path, const char *name, void
2924     *value, size\_t size)}
2925
2926   \funcdecl{ssize\_t fgetxattr(int filedes, const char *name, void *value,
2927     size\_t size)}
2928
2929   Le funzioni leggono il valore di un attributo esteso.
2930
2931   \bodydesc{Le funzioni restituiscono un intero positivo che indica la
2932     dimensione dell'attributo richiesto in caso di successo, e $-1$ in caso di
2933     errore, nel qual caso \var{errno} assumerà i valori:
2934   \begin{errlist}
2935   \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
2936   \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
2937     non è sufficiente per contenere il risultato.
2938   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
2939     filesystem o sono disabilitati.
2940   \end{errlist}
2941   Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
2942   ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
2943   all'attributo.  }
2944 \end{functions}
2945
2946 Le funzioni \func{getxattr} e \func{lgetxattr} prendono come primo argomento
2947 un pathname che indica il file di cui si vuole richiedere un attributo, la
2948 sola differenza è che la seconda, se il pathname indica un link simbolico,
2949 restituisce gli attributi di quest'ultimo e non quelli del file a cui esso fa
2950 riferimento. La funzione \func{fgetxattr} prende invece come primo argomento
2951 un numero di file descriptor, e richiede gli attributi del file ad esso
2952 associato.
2953
2954 Tutte e tre le funzioni richiedono di specificare nell'argomento \param{name}
2955 il nome dell'attributo di cui si vuole ottenere il valore. Il nome deve essere
2956 indicato comprensivo di prefisso del \textit{namespace} cui appartiene (uno
2957 dei valori di tab.~\ref{tab:extended_attribute_class}) nella forma
2958 \texttt{namespace.attributename}, come stringa terminata da un carattere NUL.
2959 Il suo valore verrà restituito nel buffer puntato dall'argomento \param{value}
2960 per una dimensione massima di \param{size} byte;\footnote{gli attributi estesi
2961   possono essere costituiti arbitrariamente da dati testuali o binari.}  se
2962 quest'ultima non è sufficiente si avrà un errore di \errcode{ERANGE}.
2963
2964 Per evitare di dover indovinare la dimensione di un attributo per tentativi si
2965 può eseguire una interrogazione utilizzando un valore nullo per \param{size};
2966 in questo caso non verrà letto nessun dato, ma verrà restituito come valore di
2967 ritorno della funzione chiamata la dimensione totale dell'attributo esteso
2968 richiesto, che si potrà usare come stima per allocare un buffer di dimensioni
2969 sufficienti.\footnote{si parla di stima perché anche se le funzioni
2970   restituiscono la dimensione esatta dell'attributo al momento in cui sono
2971   eseguite, questa potrebbe essere modificata in qualunque momento da un
2972   successivo accesso eseguito da un altro processo.}
2973
2974 Un secondo gruppo di funzioni è quello che consente di impostare il valore di
2975 un attributo esteso, queste sono \funcd{setxattr}, \funcd{lsetxattr} e
2976 \funcd{fsetxattr}, e consentono di operare rispettivamente su un file, su un
2977 link simbolico o specificando un file descriptor; i loro prototipi sono:
2978 \begin{functions}
2979   \headdecl{sys/types.h}
2980   \headdecl{attr/xattr.h}
2981
2982   \funcdecl{int setxattr(const char *path, const char *name, const void
2983     *value, size\_t size, int flags)}
2984
2985   \funcdecl{int lsetxattr(const char *path, const char *name, const void
2986     *value, size\_t size, int flags)}
2987
2988   \funcdecl{int fsetxattr(int filedes, const char *name, const void *value,
2989     size\_t size, int flags)}
2990
2991   Impostano il valore di un attributo esteso.
2992
2993   \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
2994     errore, nel qual caso \var{errno} assumerà i valori:
2995   \begin{errlist}
2996   \item[\errcode{ENOATTR}] si è usato il flag \const{XATTR\_REPLACE} e
2997     l'attributo richiesto non esiste.
2998   \item[\errcode{EEXIST}] si è usato il flag \const{XATTR\_CREATE} ma
2999     l'attributo esiste già.
3000   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
3001     filesystem o sono disabilitati.
3002   \end{errlist}
3003   Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
3004   ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
3005   all'attributo.
3006 }
3007 \end{functions}
3008
3009 Le tre funzioni prendono come primo argomento un valore adeguato al loro
3010 scopo, usato in maniera del tutto identica a quanto visto in precedenza per le
3011 analoghe che leggono gli attributi estesi. Il secondo argomento \param{name}
3012 deve indicare, anche in questo caso con gli stessi criteri appena visti per le
3013 analoghe \func{getxattr}, \func{lgetxattr} e \func{fgetxattr}, il nome
3014 (completo di suffisso) dell'attributo su cui si vuole operare.
3015
3016 Il valore che verrà assegnato all'attributo dovrà essere preparato nel buffer
3017 puntato da \param{value}, e la sua dimensione totale (in byte) sarà indicata
3018 dall'argomento \param{size}. Infine l'argomento \param{flag} consente di
3019 controllare le modalità di sovrascrittura dell'attributo esteso, esso può
3020 prendere due valori: con \const{XATTR\_REPLACE} si richiede che l'attributo
3021 esista, nel qual caso verrà sovrascritto, altrimenti si avrà errore, mentre
3022 con \const{XATTR\_CREATE} si richiede che l'attributo non esista, nel qual
3023 caso verrà creato, altrimenti si avrà errore ed il valore attuale non sarà
3024 modificato.  Utilizzando per \param{flag} un valore nullo l'attributo verrà
3025 modificato se è già presente, o creato se non c'è.
3026
3027 Le funzioni finora illustrate permettono di leggere o scrivere gli attributi
3028 estesi, ma sarebbe altrettanto utile poter vedere quali sono gli attributi
3029 presenti; a questo provvedono le funzioni \funcd{listxattr},
3030 \funcd{llistxattr} e \funcd{flistxattr} i cui prototipi sono:
3031 \begin{functions}
3032   \headdecl{sys/types.h}
3033   \headdecl{attr/xattr.h}
3034
3035   \funcdecl{ssize\_t listxattr(const char *path, char *list, size\_t size)}
3036
3037   \funcdecl{ssize\_t llistxattr(const char *path, char *list, size\_t size)}
3038
3039   \funcdecl{ssize\_t flistxattr(int filedes, char *list, size\_t size)}
3040
3041   Leggono la lista degli attributi estesi di un file.
3042
3043   \bodydesc{Le funzioni restituiscono un intero positivo che indica la
3044     dimensione della lista in caso di successo, e $-1$ in caso di errore, nel
3045     qual caso \var{errno} assumerà i valori:
3046   \begin{errlist}
3047   \item[\errcode{ERANGE}] la dimensione \param{size} del buffer \param{value}
3048     non è sufficiente per contenere il risultato.
3049   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
3050     filesystem o sono disabilitati.
3051   \end{errlist}
3052   Oltre a questi potranno essere restituiti tutti gli errori di \func{stat},
3053   ed in particolare \errcode{EPERM} se non si hanno i permessi di accesso
3054   all'attributo.
3055 }
3056 \end{functions}
3057
3058 Come per le precedenti le tre funzioni leggono gli attributi rispettivamente
3059 di un file, un link simbolico o specificando un file descriptor, da
3060 specificare con il loro primo argomento. Gli altri due argomenti, identici per
3061 tutte e tre, indicano rispettivamente il puntatore \param{list} al buffer dove
3062 deve essere letta la lista e la dimensione \param{size} di quest'ultimo.
3063
3064 La lista viene fornita come sequenza non ordinata dei nomi dei singoli
3065 attributi estesi (sempre comprensivi del prefisso della loro classe) ciascuno
3066 dei quali è terminato da un carattere nullo. I nomi sono inseriti nel buffer
3067 uno di seguito all'altro. Il valore di ritorno della funzione indica la
3068 dimensione totale della lista in byte.
3069
3070 Come per le funzioni di lettura dei singoli attributi se le dimensioni del
3071 buffer non sono sufficienti si avrà un errore, ma è possibile ottenere dal
3072 valore di ritorno della funzione una stima della dimensione totale della lista
3073 usando per \param{size} un valore nullo.
3074
3075 Infine per rimuovere semplicemente un attributo esteso, si ha a disposizione
3076 un ultimo gruppo di funzioni: \funcd{removexattr}, \funcd{lremovexattr} e
3077 \funcd{fremovexattr}; i rispettivi prototipi sono:
3078 \begin{functions}
3079   \headdecl{sys/types.h}
3080   \headdecl{attr/xattr.h}
3081
3082   \funcdecl{int removexattr(const char *path, const char *name)}
3083
3084   \funcdecl{int lremovexattr(const char *path, const char *name)}
3085
3086   \funcdecl{int fremovexattr(int filedes, const char *name)}
3087
3088
3089   Rimuovono un attributo esteso di un file.
3090
3091   \bodydesc{Le funzioni restituiscono 0 in caso di successo, e $-1$ in caso di
3092     errore, nel qual caso \var{errno} assumerà i valori:
3093   \begin{errlist}
3094   \item[\errcode{ENOATTR}] l'attributo richiesto non esiste.
3095   \item[\errcode{ENOTSUP}] gli attributi estesi non sono supportati dal
3096     filesystem o sono disabilitati.
3097   \end{errlist}
3098   ed inoltre tutti gli errori di \func{stat}.
3099 }
3100 \end{functions}
3101
3102 Le tre funzioni rimuovono l'attributo esteso indicato dall'argomento
3103 \param{name} rispettivamente di un file, un link simbolico o specificando un
3104 file descriptor, da specificare con il loro primo argomento.  Anche in questo
3105 caso l'argomento \param{name} deve essere specificato con le modalità già
3106 illustrate in precedenza per le altre funzioni relative agli attributi estesi.
3107
3108
3109 \itindend{Extended~Attributes}
3110
3111 % TODO trattare gli attributi estesi e le funzioni la documentazione di
3112 % sistema è nei pacchetti libxattr1-dev e attr
3113
3114
3115 \subsection{Le \textit{Access  Control List}}
3116 \label{sec:file_ACL}
3117
3118
3119 \itindbeg{Access~Control~List}
3120
3121 Il modello classico dei permessi di Unix, per quanto funzionale ed efficiente,
3122 è comunque piuttosto limitato e per quanto possa aver coperto per lunghi anni
3123 le esigenze più comuni con un meccanismo semplice e potente, non è in grado di
3124 rispondere in maniera adeguata a situazioni che richiedono una gestione
3125 complessa dei permessi di accesso.\footnote{già un requisito come quello di
3126   dare accesso in scrittura ad alcune persone ed in sola lettura ad altre non
3127   si può soddisfare in maniera semplice.}
3128
3129 Per questo motivo erano state progressivamente introdotte nelle varie versioni
3130 di Unix dei meccanismi di gestione dei permessi dei file più flessibili, nella
3131 forma delle cosiddette \textit{Access Control List} (indicate usualmente con
3132 la sigla ACL).  Nello sforzo di standardizzare queste funzionalità era stato
3133 creato un gruppo di lavoro il cui scopo era estendere lo standard POSIX 1003
3134 attraverso due nuovi insiemi di specifiche, la POSIX 1003.1e per l'interfaccia
3135 di programmazione e la POSIX 1003.2c per i comandi di shell.
3136
3137 Gli obiettivi erano però forse troppo ambizioni, e nel gennaio del 1998 i
3138 finanziamenti vennero ritirati senza che si fosse arrivati alla definizione di
3139 uno standard, dato però che una parte della documentazione prodotta era di
3140 alta qualità venne deciso di rilasciare al pubblico la diciassettesima bozza
3141 del documento, quella che va sotto il nome di \textit{POSIX 1003.1e Draft 17},
3142 che è divenuta la base sulla quale si definiscono le cosiddette \textit{Posix
3143   ACL}.
3144
3145 A differenza di altri sistemi (ad esempio FreeBSD) nel caso di Linux si è
3146 scelto di realizzare le ACL attraverso l'uso degli
3147 \itindex{Extended~Attributes} \textit{Extended Attributes} (appena trattati in
3148 sez.~\ref{sec:file_xattr}), e fornire tutte le relative funzioni di gestione
3149 tramite una libreria, \texttt{libacl} che nasconde i dettagli implementativi
3150 delle ACL e presenta ai programmi una interfaccia che fa riferimento allo
3151 standard POSIX 1003.1e.
3152
3153 Anche in questo caso le funzioni di questa libreria non fanno parte delle
3154 \acr{glibc} e devono essere installate a parte;\footnote{la versione corrente
3155   della libreria è \texttt{libacl1}, e nel caso si usi Debian la si può
3156   installare con il pacchetto omonimo e con il collegato \texttt{libacl1-dev}
3157   per i file di sviluppo.}  pertanto se un programma le utilizza si dovrà
3158 indicare esplicitamente l'uso della libreria \texttt{libacl} invocando il
3159 compilatore con l'opzione \texttt{-lacl}. Si tenga presente inoltre che per
3160 poterle utilizzare le ACL devono essere attivate esplicitamente montando il
3161 filesystem\footnote{che deve supportarle, ma questo è ormai vero per
3162   praticamente tutti i filesystem più comuni, con l'eccezione di NFS per il
3163   quale esiste però un supporto sperimentale.} su cui le si vogliono
3164 utilizzare con l'opzione \texttt{acl} attiva. Dato che si tratta di una
3165 estensione è infatti opportuno utilizzarle soltanto laddove siano necessarie.
3166
3167 Una ACL è composta da un insieme di voci, e ciascuna voce è a sua volta
3168 costituita da un \textsl{tipo}, da un eventuale
3169 \textsl{qualificatore},\footnote{deve essere presente soltanto per le voci di
3170   tipo \const{ACL\_USER} e \const{ACL\_GROUP}.} e da un insieme di permessi.
3171 Ad ogni oggetto sul filesystem si può associare una ACL che ne governa i
3172 permessi di accesso, detta \textit{access ACL}.  Inoltre per le directory si
3173 può impostare una ACL aggiuntiva, detta \textit{default ACL}, che serve ad
3174 indicare quale dovrà essere la ACL assegnata di default nella creazione di un
3175 file all'interno della directory stessa. Come avviene per i permessi le ACL
3176 possono essere impostate solo del proprietario del file, o da un processo con
3177 la capability \index{capabilities} \const{CAP\_FOWNER}.
3178
3179 \begin{table}[htb]
3180   \centering
3181   \footnotesize
3182   \begin{tabular}{|l|p{8cm}|}
3183     \hline
3184     \textbf{Tipo} & \textbf{Descrizione} \\
3185     \hline
3186     \hline
3187     \const{ACL\_USER\_OBJ} & voce che contiene i diritti di accesso del
3188                              proprietario del file.\\
3189     \const{ACL\_USER}      & voce che contiene i diritti di accesso per
3190                              l'utente indicato dal rispettivo
3191                              qualificatore.\\
3192     \const{ACL\_GROUP\_OBJ}& voce che contiene i diritti di accesso del
3193                              gruppo proprietario del file.\\
3194     \const{ACL\_GROUP}     & voce che contiene i diritti di accesso per
3195                              il gruppo indicato dal rispettivo
3196                              qualificatore.\\
3197     \const{ACL\_MASK}      & voce che contiene la maschera dei massimi
3198                              permessi di accesso che possono essere garantiti
3199                              da voci del tipo \const{ACL\_USER},
3200                              \const{ACL\_GROUP} e \const{ACL\_GROUP\_OBJ}.\\
3201     \const{ACL\_OTHER}     & voce che contiene i diritti di accesso di chi
3202                              non corrisponde a nessuna altra voce dell'ACL.\\
3203     \hline
3204   \end{tabular}
3205   \caption{Le costanti che identificano i tipi delle voci di una ACL.}
3206   \label{tab:acl_tag_types}
3207 \end{table}
3208
3209 L'elenco dei vari tipi di voci presenti in una ACL, con una breve descrizione
3210 del relativo significato, è riportato in tab.~\ref{tab:acl_tag_types}. Tre di
3211 questi tipi, \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e
3212 \const{ACL\_OTHER}, corrispondono direttamente ai tre permessi ordinari dei
3213 file (proprietario, gruppo proprietario e tutti gli altri) e per questo una
3214 ACL valida deve sempre contenere una ed una sola voce per ciascuno di questi
3215 tipi.
3216
3217 Una ACL può poi contenere un numero arbitrario di voci di tipo
3218 \const{ACL\_USER} e \const{ACL\_GROUP}, ciascuna delle quali indicherà i
3219 permessi assegnati all'utente e al gruppo indicato dal relativo qualificatore;
3220 ovviamente ciascuna di queste voci dovrà fare riferimento ad un utente o ad un
3221 gruppo diverso, e non corrispondenti a quelli proprietari del file. Inoltre se
3222 in una ACL esiste una voce di uno di questi due tipi è obbligatoria anche la
3223 presenza di una ed una sola voce di tipo \const{ACL\_MASK}, che negli altri
3224 casi è opzionale.
3225
3226 Quest'ultimo tipo di voce contiene la maschera dei permessi che possono essere
3227 assegnati tramite voci di tipo \const{ACL\_USER}, \const{ACL\_GROUP} e
3228 \const{ACL\_GROUP\_OBJ}; se in una di queste voci si fosse specificato un
3229 permesso non presente in \const{ACL\_MASK} questo verrebbe ignorato. L'uso di
3230 una ACL di tipo \const{ACL\_MASK} è di particolare utilità quando essa
3231 associata ad una \textit{default ACL} su una directory, in quanto i permessi
3232 così specificati verranno ereditati da tutti i file creati nella stessa
3233 directory. Si ottiene così una sorta di \itindex{umask} \textit{umask}
3234 associata ad un oggetto sul filesystem piuttosto che a un processo.
3235
3236 Dato che le ACL vengono a costituire una estensione dei permessi ordinari, uno
3237 dei problemi che si erano posti nella loro standardizzazione era appunto
3238 quello della corrispondenza fra questi e le ACL. Come accennato i permessi
3239 ordinari vengono mappati le tre voci di tipo \const{ACL\_USER\_OBJ},
3240 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} che devono essere presenti in
3241 qualunque ACL; un cambiamento ad una di queste voci viene automaticamente
3242 riflesso sui permessi ordinari dei file\footnote{per permessi ordinari si
3243   intende quelli mantenuti nell'\textit{inode}, che devono restare dato che un
3244   filesystem può essere montato senza abilitare le ACL.} e viceversa. In
3245 realtà la mappatura è diretta solo per le voci \const{ACL\_USER\_OBJ} e
3246 \const{ACL\_OTHER}, nel caso di \const{ACL\_GROUP\_OBJ} questo vale soltanto
3247 se non è presente una voce di tipo \const{ACL\_MASK}, se invece questa è
3248 presente verranno tolti dai permessi di \const{ACL\_GROUP\_OBJ} tutti quelli
3249 non presenti in \const{ACL\_MASK}.\footnote{questo diverso comportamento a
3250   seconda delle condizioni è stato introdotto dalla standardizzazione
3251   \textit{POSIX 1003.1e Draft 17} per mantenere il comportamento invariato sui
3252   sistemi dotati di ACL per tutte quelle applicazioni che sono conformi
3253   soltanto all'ordinario standard \textit{POSIX 1003.1}.}
3254
3255 Un secondo aspetto dell'incidenza delle ACL sul comportamento del sistema è
3256 quello relativo alla creazione di nuovi file,\footnote{o oggetti sul
3257   filesystem, il comportamento discusso vale per le funzioni \func{open} e
3258   \func{creat} (vedi sez.~\ref{sec:file_open}), \func{mkdir} (vedi
3259   sez.~\ref{sec:file_dir_creat_rem}), \func{mknod} e \func{mkfifo} (vedi
3260   sez.~\ref{sec:file_mknod}).} che come accennato può essere modificato dalla
3261 presenza di una \textit{default ACL} sulla directory che contiene quel file.
3262 Se questa non c'è valgono le regole usuali illustrate in
3263 sez.~\ref{sec:file_perm_management}, per cui essi sono determinati dalla
3264 \itindex{umask} \textit{umask} del processo, e la sola differenza è che i
3265 permessi ordinari da esse risultanti vengono automaticamente rimappati anche
3266 su una ACL di accesso assegnata automaticamente al nuovo file, che contiene
3267 soltanto le tre corrispondenti voci di tipo \const{ACL\_USER\_OBJ},
3268 \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER}.
3269
3270 Se invece è presente una ACL di default sulla directory che contiene il nuovo
3271 file questa diventerà automaticamente la sua ACL di accesso, a meno di non
3272 aver indicato, nelle funzioni di creazione che lo consentono, uno specifico
3273 valore per i permessi ordinari;\footnote{tutte le funzioni citate in
3274   precedenza supportano un argomento \var{mode} che indichi un insieme di
3275   permessi iniziale.} in tal caso saranno eliminati dalle voci corrispondenti
3276 nella ACL tutti quelli non presenti in tale indicazione.
3277
3278 Dato che questa è la ragione che ha portato alla loro creazione, la principale
3279 modifica introdotta con la presenza della ACL è quella alle regole del
3280 controllo di accesso ai file illustrate in sez.~\ref{sec:file_perm_overview}.
3281 Come nel caso ordinario per il controllo vengono sempre utilizzati gli
3282 identificatori del gruppo \textit{effective} del processo, ma in presenza di
3283 ACL i passi attraverso i quali viene stabilito se esso ha diritto di accesso
3284 sono i seguenti:
3285 \begin{enumerate*}
3286 \item Se l'user-ID del processo è nullo l'accesso è sempre garantito senza
3287   nessun controllo.
3288 \item Se l'user-ID del processo corrisponde al proprietario del file allora:
3289   \begin{itemize*}
3290   \item se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
3291     l'accesso è consentito;
3292   \item altrimenti l'accesso è negato.
3293   \end{itemize*}
3294 \item Se l'user-ID del processo corrisponde ad un qualunque qualificatore
3295   presente in una voce \const{ACL\_USER} allora:
3296   \begin{itemize*}
3297   \item se la voce \const{ACL\_USER} corrispondente e la voce
3298     \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
3299     consentito;
3300   \item altrimenti l'accesso è negato.
3301   \end{itemize*}
3302 \item Se è il group-ID del processo o uno dei group-ID supplementari
3303   corrisponde al gruppo proprietario del file allora:
3304   \begin{itemize*}
3305   \item se la voce \const{ACL\_GROUP\_OBJ} e una eventuale voce
3306     \const{ACL\_MASK} (se non vi sono voci di tipo \const{ACL\_GROUP} questa
3307     può non essere presente) contengono entrambe il permesso richiesto,
3308     l'accesso è consentito;
3309   \item altrimenti l'accesso è negato.
3310   \end{itemize*}
3311 \item Se è il group-ID del processo o uno dei group-ID supplementari
3312   corrisponde ad un qualunque qualificatore presente in una voce
3313   \const{ACL\_GROUP} allora:
3314   \begin{itemize*}
3315   \item se la voce \const{ACL\_GROUP} corrispondente e la voce
3316     \const{ACL\_MASK} contengono entrambe il permesso richiesto, l'accesso è
3317     consentito;
3318   \item altrimenti l'accesso è negato.
3319   \end{itemize*}
3320 \item Se la voce \const{ACL\_USER\_OBJ} contiene il permesso richiesto,
3321   l'accesso è consentito, altrimenti l'accesso è negato.
3322 \end{enumerate*}
3323
3324 I passi di controllo vengono eseguiti esattamente in questa sequenza, e la
3325 decisione viene presa non appena viene trovata una corrispondenza con gli
3326 identificatori del processo. Questo significa che i permessi presenti in una
3327 voce di tipo \const{ACL\_USER} hanno la precedenza sui permessi ordinari
3328 associati al gruppo proprietario del file (vale a dire su
3329 \const{ACL\_GROUP\_OBJ}).
3330
3331 Per la gestione delle ACL lo standard \textit{POSIX 1003.1e Draft 17} ha
3332 previsto delle apposite funzioni ed tutta una serie di tipi di dati
3333 dedicati;\footnote{fino a definire un tipo di dato e delle costanti apposite
3334   per identificare i permessi standard di lettura, scrittura ed esecuzione.}
3335 tutte le operazioni devono essere effettuate attraverso tramite questi tipi di
3336 dati, che incapsulano tutte le informazioni contenute nelle ACL. La prima di
3337 queste funzioni che prendiamo in esame è \funcd{acl\_init}, il cui prototipo
3338 è:
3339 \begin{functions}
3340   \headdecl{sys/types.h}
3341   \headdecl{sys/acl.h}
3342
3343   \funcdecl{acl\_t acl\_init(int count)}
3344
3345   Inizializza un'area di lavoro per una ACL di \param{count} voci.
3346
3347   \bodydesc{La funzione restituisce un puntatore all'area di lavoro in caso di
3348     successo e \const{NULL} in caso di errore, nel qual caso \var{errno}
3349     assumerà uno dei valori:
3350   \begin{errlist}
3351   \item[\errcode{EINVAL}] il valore di \param{count} è negativo.
3352   \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile.
3353   \end{errlist}
3354 }
3355 \end{functions}
3356
3357 La funzione alloca ed inizializza un'area di memoria che verrà usata per
3358 mantenere i dati di una ACL contenente fino ad un massimo di \const{count}
3359 voci. La funzione ritorna un valore di tipo \type{acl\_t}, da usare in tutte
3360 le altre funzioni che operano sulla ACL. La funzione si limita alla
3361 allocazione iniziale e non inserisce nessun valore nella ACL che resta vuota.
3362 Si tenga presente che pur essendo \type{acl\_t} un tipo opaco che identifica
3363 ``\textsl{l'oggetto}'' ACL, il valore restituito dalla funzione non è altro
3364 che un puntatore all'area di memoria allocata per i dati richiesti; pertanto
3365 in caso di fallimento verrà restituito un puntatore nullo e si dovrà
3366 confrontare il valore di ritorno della funzione con ``\code{(acl\_t) NULL}''.
3367
3368 Una volta che si siano completate le operazioni sui dati di una ACL la memoria
3369 allocata dovrà essere liberata esplicitamente attraverso una chiamata alla
3370 funzione \funcd{acl\_free}, il cui prototipo è:
3371 \begin{functions}
3372   \headdecl{sys/types.h}
3373   \headdecl{sys/acl.h}
3374
3375   \funcdecl{int acl\_free(void * obj\_p)}
3376
3377   Disalloca la memoria riservata per i dati di una ACL.
3378
3379   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ se
3380     \param{obj\_p} non è un puntatore valido, nel qual caso \var{errno}
3381     assumerà il valore \errcode{EINVAL}
3382 }
3383 \end{functions}
3384
3385 Si noti come la funzione richieda come argomento un puntatore di tipo
3386 ``\ctyp{void *}'', essa infatti può essere usata non solo per liberare la
3387 memoria allocata per i dati di una ACL, ma anche per quella usata per creare
3388 le stringhe di descrizione testuale delle ACL o per ottenere i valori dei
3389 qualificatori di una voce; pertanto a seconda dei casi occorrerà eseguire un
3390 \textit{cast} a ``\ctyp{void *}'' del tipo di dato di cui si vuole eseguire la
3391 disallocazione.  Si tenga presente poi che oltre a \func{acl\_init} esistono
3392 molte altre funzioni che possono allocare memoria per i dati delle ACL, è
3393 pertanto opportuno tenere traccia di tutte queste funzioni perché alla fine
3394 delle operazioni tutta la memoria allocata dovrà essere liberata con
3395 \func{acl\_free}.
3396
3397 Una volta che si abbiano a disposizione i dati di una ACL tramite il
3398 riferimento ad oggetto di tipo \type{acl\_t} questi potranno essere copiati
3399 con la funzione \funcd{acl\_dup}, il cui prototipo è:
3400 \begin{functions}
3401   \headdecl{sys/types.h}
3402   \headdecl{sys/acl.h}
3403
3404   \funcdecl{acl\_t acl\_dup(acl\_t acl)}
3405
3406   Crea una copia della ACL \param{acl}.
3407
3408   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3409     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3410     \var{errno} assumerà uno dei valori:
3411   \begin{errlist}
3412   \item[\errcode{EINVAL}] l'argomento \param{acl} non è un puntatore valido
3413     per una ACL.
3414   \item[\errcode{ENOMEM}] non c'è sufficiente memoria disponibile per eseguire
3415     la copia.
3416   \end{errlist}
3417 }
3418 \end{functions}
3419
3420 La funzione crea una copia dei dati della ACL indicata tramite l'argomento
3421 \param{acl}, allocando autonomamente tutto spazio necessario alla copia e
3422 restituendo un secondo oggetto di tipo \type{acl\_t} come riferimento a
3423 quest'ultima.  Valgono per questo le stesse considerazioni fatte per il valore
3424 di ritorno di \func{acl\_init}, ed in particolare il fatto che occorrerà
3425 prevedere una ulteriore chiamata esplicita a \func{acl\_free} per liberare la
3426 memoria occupata dalla copia.
3427
3428 Se si deve creare una ACL manualmente l'uso di \func{acl\_init} è scomodo,
3429 dato che la funzione restituisce una ACL vuota, una alternativa allora è usare
3430 \funcd{acl\_from\_mode} che consente di creare una ACL a partire da un valore
3431 di permessi ordinari, il prototipo della funzione è:
3432 \begin{functions}
3433   \headdecl{sys/types.h}
3434   \headdecl{sys/acl.h}
3435
3436   \funcdecl{acl\_t acl\_from\_mode(mode\_t mode)}
3437
3438   Crea una ACL inizializzata con i permessi di \param{mode}.
3439
3440   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3441     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3442     \var{errno} assumerà il valore \errval{ENOMEM}.
3443
3444 }
3445 \end{functions}
3446
3447 La funzione restituisce una ACL inizializzata con le tre voci obbligatorie
3448 \const{ACL\_USER\_OBJ}, \const{ACL\_GROUP\_OBJ} e \const{ACL\_OTHER} già
3449 impostate secondo la corrispondenza ai valori dei permessi ordinari indicati
3450 dalla maschera passata nell'argomento \param{mode}. Questa funzione è una
3451 estensione usata dalle ACL di Linux e non è portabile, ma consente di
3452 semplificare l'inizializzazione in maniera molto comoda.
3453
3454 Altre due funzioni che consentono di creare una ACL già inizializzata sono
3455 \funcd{acl\_get\_fd} e \funcd{acl\_get\_file}, che però sono per lo più
3456 utilizzate per leggere la ACL corrente di un file; i rispettivi prototipi
3457 sono:
3458 \begin{functions}
3459   \headdecl{sys/types.h}
3460   \headdecl{sys/acl.h}
3461
3462   \funcdecl{acl\_t acl\_get\_file(const char *path\_p, acl\_type\_t type)}
3463   \funcdecl{acl\_t acl\_get\_fd(int fd)}
3464
3465   Ottiene i dati delle ACL di un file.
3466
3467   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3468     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3469     \var{errno} assumerà uno dei valori:
3470   \begin{errlist}
3471   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3472   \item[\errcode{ENOTSUP}] il filesystem cui fa riferimento il file non
3473     supporta le ACL.
3474   \end{errlist}
3475   ed inoltre \errval{EBADF} per \func{acl\_get\_fd}, ed \errval{EINVAL} per
3476   valori scorretti di \param{type} e tutti i possibili errori per l'accesso ad
3477   un file per \func{acl\_get\_file}.
3478
3479 }
3480 \end{functions}
3481
3482 Le due funzioni ritornano, con un oggetto di tipo \type{acl\_t}, il valore
3483 della ACL correntemente associata ad un file, che può essere identificato
3484 tramite un file descriptor usando \func{acl\_get\_fd} o con un pathname usando
3485 \func{acl\_get\_file}. Nel caso di quest'ultima funzione, che può richiedere
3486 anche la ACL relativa ad una directory, il secondo argomento \param{type}
3487 consente di specificare se si vuole ottenere la ACL di default o quella di
3488 accesso. Questo argomento deve essere di tipo \type{acl\_type\_t} e può
3489 assumere solo i due valori riportati in tab.~\ref{tab:acl_type}.
3490
3491 \begin{table}[htb]
3492   \centering
3493   \footnotesize
3494   \begin{tabular}{|l|l|}
3495     \hline
3496     \textbf{Tipo} & \textbf{Descrizione} \\
3497     \hline
3498     \hline
3499     \const{ACL\_TYPE\_ACCESS} & indica una ACL di accesso.\\
3500     \const{ACL\_TYPE\_DEFAULT}& indica una ACL di default.\\
3501     \hline
3502   \end{tabular}
3503   \caption{Le costanti che identificano il tipo di ACL.}
3504   \label{tab:acl_type}
3505 \end{table}
3506
3507 Si tenga presente che nel caso di \func{acl\_get\_file} occorrerà che il
3508 processo chiamante abbia privilegi di accesso sufficienti a poter leggere gli
3509 attributi estesi dei file (come illustrati in sez.~\ref{sec:file_xattr});
3510 inoltre una ACL di tipo \const{ACL\_TYPE\_DEFAULT} potrà essere richiesta
3511 soltanto per una directory, e verrà restituita solo se presente, altrimenti
3512 verrà restituita una ACL vuota.
3513
3514 Infine si potrà creare una ACL direttamente dalla sua rappresentazione
3515 testuale con la funzione  \funcd{acl\_from\_text}, il cui prototipo è:
3516 \begin{functions}
3517   \headdecl{sys/types.h}
3518   \headdecl{sys/acl.h}
3519
3520   \funcdecl{acl\_t acl\_from\_text(const char *buf\_p)}
3521
3522   Crea una ACL a partire dalla sua rappresentazione testuale.
3523
3524   \bodydesc{La funzione restituisce un oggetto di tipo \type{acl\_t} in caso
3525     di successo e \code{(acl\_t)NULL} in caso di errore, nel qual caso
3526     \var{errno} assumerà uno dei valori:
3527   \begin{errlist}
3528   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3529   \item[\errcode{EINVAL}] la rappresentazione testuale all'indirizzo
3530     \param{buf\_p} non è valida.
3531   \end{errlist}
3532
3533 }
3534 \end{functions}
3535
3536 La funzione prende come argomento il puntatore ad un buffer dove si è inserita
3537 la rappresentazione testuale della ACL che si vuole creare, la memoria
3538 necessaria viene automaticamente allocata ed in caso di successo viene
3539 restituito come valore di ritorno un oggetto di tipo \type{acl\_t} con il
3540 contenuto della stessa, che come per le precedenti funzioni, dovrà essere
3541 disallocato esplicitamente al termine del suo utilizzo.
3542
3543 La rappresentazione testuale di una ACL è quella usata anche dai comandi
3544 ordinari per la gestione delle ACL (\texttt{getfacl} e \texttt{setfacl}), che
3545 prevede due diverse forme, estesa e breve, entrambe supportate da
3546 \func{acl\_from\_text}. La forma estesa prevede che sia specificata una voce
3547 per riga, nella forma:
3548 \begin{Verbatim}
3549   tipo:qualificatore:permessi
3550 \end{Verbatim}
3551 dove il tipo può essere uno fra \texttt{user}, \texttt{group}, \texttt{other}
3552 e \texttt{mask}. Il qualificatore è presente solo per \texttt{user} e
3553 \texttt{group} e indica l'utente o il gruppo a cui la voce si riferisce; i
3554 permessi sono espressi con una tripletta di lettere analoga a quella usata per
3555 i permessi dei file.\footnote{vale a dire \texttt{r} per il permesso di
3556   lettura, \texttt{w} per il permesso di scrittura, \texttt{x} per il permesso
3557   di esecuzione (scritti in quest'ordine) e \texttt{-} per l'assenza del
3558   permesso.}
3559
3560 Va precisato che i due tipi \texttt{user} e \texttt{group} sono usati
3561 rispettivamente per indicare delle voci relative ad utenti e
3562 gruppi,\footnote{cioè per voci di tipo \const{ACL\_USER\_OBJ} e
3563   \const{ACL\_USER} per \texttt{user} e \const{ACL\_GROUP\_OBJ} e
3564   \const{ACL\_GROUP} per \texttt{group}.} applicate sia a quelli proprietari
3565 del file che a quelli generici; quelle dei proprietari si riconoscono per
3566 l'assenza di un qualificatore, ed in genere si scrivono per prima delle altre.
3567 Il significato delle voci di tipo \texttt{mask} e \texttt{mark} è evidente. In
3568 questa forma si possono anche inserire dei commenti precedendoli con il
3569 carattere ``\texttt{\#}''.
3570
3571 La forma breve prevede invece la scrittura delle singole voci su una riga,
3572 separate da virgole; come specificatori del tipo di voce si possono usare le
3573 iniziali dei valori usati nella forma estesa (cioè ``\texttt{u}'',
3574 ``\texttt{g}'', ``\texttt{o}'' e ``\texttt{m}''), mentre le altri parte della
3575 voce sono le stesse. In questo caso non sono consentiti permessi.
3576
3577 Per la conversione inversa, che consente di ottenere la rappresentazione
3578 testuale di una ACL, sono invece disponibili due funzioni, la prima delle due,
3579 di uso più immediato, è \funcd{acl\_to\_text}, il cui prototipo è:
3580 \begin{functions}
3581   \headdecl{sys/types.h}
3582   \headdecl{sys/acl.h}
3583
3584   \funcdecl{char * acl\_to\_text(acl\_t acl, ssize\_t *len\_p)}
3585
3586   Produce la rappresentazione testuale di una ACL.
3587
3588   \bodydesc{La funzione restituisce il puntatore ad una stringa con la
3589     rappresentazione testuale della ACL in caso di successo e
3590     \code(acl\_t){NULL} in caso di errore, nel qual caso \var{errno} assumerà
3591     uno dei valori:
3592   \begin{errlist}
3593   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3594   \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
3595   \end{errlist}
3596
3597 }
3598 \end{functions}
3599
3600 La funzione restituisce il puntatore ad una stringa terminata da NUL
3601 contenente la rappresentazione in forma estesa della ACL passata come
3602 argomento, ed alloca automaticamente la memoria necessaria. Questa dovrà poi
3603 essere liberata, quando non più necessaria, con \func{acl\_free}. Se
3604 nell'argomento \param{len\_p} si passa un valore puntatore ad una variabile
3605 intera in questa verrà restituita la dimensione della stringa con la
3606 rappresentazione testuale (non comprendente il carattere nullo finale).
3607
3608 La seconda funzione, \funcd{acl\_to\_any\_text}, permette di controllare con
3609 dovizia di dettagli la generazione della stringa contenente la
3610 rappresentazione testuale della ACL, il suo prototipo è:
3611 \begin{functions}
3612   \headdecl{sys/types.h}
3613   \headdecl{sys/acl.h}
3614
3615   \funcdecl{char * acl\_to\_any\_text(acl\_t acl, const char *prefix, char
3616     separator, int options)}
3617
3618   Produce la rappresentazione testuale di una ACL.
3619
3620   \bodydesc{La funzione restituisce il puntatore ad una stringa con la
3621     rappresentazione testuale della ACL in caso di successo e \code{NULL} in
3622     caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
3623   \begin{errlist}
3624   \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare i dati.
3625   \item[\errcode{EINVAL}] la ACL indicata da \param{acl} non è valida.
3626   \end{errlist}
3627
3628 }
3629 \end{functions}
3630
3631 La funzione converte in formato testo la ACL indicata dall'argomento
3632 \param{acl}, usando il carattere \param{separator} come separatore delle
3633 singole voci; se l'argomento \param{prefix} non è nullo la stringa da esso
3634 indicata viene utilizzata come prefisso per le singole voci.
3635
3636 L'ultimo argomento, \param{options}, consente di controllare la modalità con
3637 cui viene generata la rappresentazione testuale. Un valore nullo fa si che
3638 vengano usati gli identificatori standard \texttt{user}, \texttt{group},
3639 \texttt{other} e \texttt{mask} con i nomi di utenti e gruppi risolti rispetto
3640 ai loro valori numerici. Altrimenti si può specificare un valore in forma di
3641 maschera binaria, da ottenere con un OR aritmetico dei valori riportati in
3642 tab.~\ref{tab:acl_to_text_options}.
3643
3644 \begin{table}[htb]
3645   \centering
3646   \footnotesize
3647   \begin{tabular}{|l|p{8cm}|}
3648     \hline
3649     \textbf{Tipo} & \textbf{Descrizione} \\
3650     \hline
3651     \hline
3652     \const{TEXT\_ABBREVIATE}     & stampa le voci in forma abbreviata.\\
3653     \const{TEXT\_NUMERIC\_IDS}   & non effettua la risoluzione numerica di
3654                                    user-ID e group-ID.\\
3655     \const{TEXT\_SOME\_EFFECTIVE}& per ciascuna voce che contiene permessi che
3656                                    vengono eliminati dalla \const{ACL\_MASK}
3657                                    viene generato un commento con i permessi
3658                                    effettivamente risultanti; il commento è
3659                                    separato con un tabulatore.\\
3660     \const{TEXT\_ALL\_EFFECTIVE} & viene generato un commento con i permessi
3661                                    effettivi per ciascuna voce che contiene
3662                                    permessi citati nella \const{ACL\_MASK},
3663                                    anche quando questi non vengono modificati
3664                                    da essa; il commento è separato con un
3665                                    tabulatore.\\
3666     \const{TEXT\_SMART\_INDENT}  & da usare in combinazione con le precedenti
3667                                    \const{TEXT\_SOME\_EFFECTIVE} e
3668                                    \const{TEXT\_ALL\_EFFECTIVE} aumenta
3669                                    automaticamente il numero di spaziatori
3670                                    prima degli eventuali commenti in modo da
3671                                    mantenerli allineati.\\
3672     \hline
3673   \end{tabular}
3674   \caption{Possibili valori per l'argomento \param{options} di
3675     \func{acl\_to\_any\_text}.}
3676   \label{tab:acl_to_text_options}
3677 \end{table}
3678
3679 Come per \func{acl\_to\_text} anche in questo caso il buffer contenente la
3680 rappresentazione testuale dell'ACL, di cui la funzione restituisce
3681 l'indirizzo, viene allocato automaticamente, e dovrà essere esplicitamente
3682 disallocato con una chiamata ad \func{acl\_free}. Si tenga presente infine che
3683 questa funzione è una estensione specifica di Linux, e non è presente nella
3684 bozza dello standard POSIX.1e.
3685
3686
3687 \itindend{Access~Control~List}
3688
3689
3690 % TODO trattare le ACL, la documentazione di sistema è nei pacchetti
3691 % libacl1-dev e acl
3692 % vedi anche http://www.suse.de/~agruen/acl/linux-acls/online/
3693
3694
3695
3696 \subsection{La funzione \func{chroot}}
3697 \label{sec:file_chroot}
3698
3699 % TODO introdurre nuova sezione sulle funzionalità di sicurezza avanzate, con
3700 % dentro chroot SELinux e AppArmor ???
3701
3702 Benché non abbia niente a che fare con permessi, utenti e gruppi, la funzione
3703 \func{chroot} viene usata spesso per restringere le capacità di accesso di un
3704 programma ad una sezione limitata del filesystem, per cui ne parleremo in
3705 questa sezione.
3706
3707 Come accennato in sez.~\ref{sec:proc_fork} ogni processo oltre ad una
3708 directory di lavoro, ha anche una directory \textsl{radice}\footnote{entrambe
3709   sono contenute in due campi (rispettivamente \var{pwd} e \var{root}) di
3710   \struct{fs\_struct}; vedi fig.~\ref{fig:proc_task_struct}.} che, pur essendo
3711 di norma corrispondente alla radice dell'albero di file e directory come visto
3712 dal kernel (ed illustrato in sez.~\ref{sec:file_organization}), ha per il
3713 processo il significato specifico di directory rispetto alla quale vengono
3714 risolti i \itindsub{pathname}{assoluto}\textit{pathname}
3715 assoluti.\footnote{cioè quando un processo chiede la risoluzione di un
3716   \textit{pathname}, il kernel usa sempre questa directory come punto di
3717   partenza.} Il fatto che questo valore sia specificato per ogni processo apre
3718 allora la possibilità di modificare le modalità di risoluzione dei
3719 \textit{pathname} assoluti da parte di un processo cambiando questa directory,
3720 così come si fa coi \itindsub{pathname}{relativo}\textit{pathname} relativi
3721 cambiando la directory di lavoro.
3722
3723 Normalmente la directory radice di un processo coincide anche con la radice
3724 del filesystem usata dal kernel, e dato che il suo valore viene ereditato dal
3725 padre da ogni processo figlio, in generale i processi risolvono i
3726 \itindsub{pathname}{assoluto} \textit{pathname} assoluti a partire sempre
3727 dalla stessa directory, che corrisponde alla radice del sistema.
3728
3729 In certe situazioni però è utile poter impedire che un processo possa accedere
3730 a tutto il filesystem; per far questo si può cambiare la sua directory radice
3731 con la funzione \funcd{chroot}, il cui prototipo è:
3732 \begin{prototype}{unistd.h}{int chroot(const char *path)}
3733   Cambia la directory radice del processo a quella specificata da
3734   \param{path}.
3735
3736 \bodydesc{La funzione restituisce zero in caso di successo e -1 per
3737     un errore, in caso di errore \var{errno} può assumere i valori:
3738   \begin{errlist}
3739   \item[\errcode{EPERM}] l'user-ID effettivo del processo non è zero.
3740   \end{errlist}
3741   ed inoltre \errval{EFAULT}, \errval{ENAMETOOLONG}, \errval{ENOENT},
3742   \errval{ENOMEM}, \errval{ENOTDIR}, \errval{EACCES}, \errval{ELOOP};
3743   \errval{EROFS} e \errval{EIO}.}
3744 \end{prototype}
3745 \noindent in questo modo la directory radice del processo diventerà
3746 \param{path} (che ovviamente deve esistere) ed ogni
3747 \itindsub{pathname}{assoluto}\textit{pathname} assoluto usato dalle funzioni
3748 chiamate nel processo sarà risolto a partire da essa, rendendo impossibile
3749 accedere alla parte di albero sovrastante.  Si ha così quella che viene
3750 chiamata una \textit{chroot jail}, in quanto il processo non può più accedere
3751 a file al di fuori della sezione di albero in cui è stato
3752 \textsl{imprigionato}.
3753
3754 Solo un processo con i privilegi di amministratore può usare questa funzione,
3755 e la nuova radice, per quanto detto in sez.~\ref{sec:proc_fork}, sarà ereditata
3756 da tutti i suoi processi figli. Si tenga presente però che la funzione non
3757 cambia la directory di lavoro, che potrebbe restare fuori dalla \textit{chroot
3758   jail}.
3759
3760 Questo è il motivo per cui la funzione è efficace solo se dopo averla eseguita
3761 si cedono i privilegi di root. Infatti se per un qualche motivo il processo
3762 resta con la directory di lavoro fuori dalla \textit{chroot jail}, potrà
3763 comunque accedere a tutto il resto del filesystem usando
3764 \itindsub{pathname}{relativo}\textit{pathname} relativi, i quali, partendo
3765 dalla directory di lavoro che è fuori della \textit{chroot jail}, potranno
3766 (con l'uso di ``\texttt{..}'') risalire fino alla radice effettiva del
3767 filesystem.
3768
3769 Ma se ad un processo restano i privilegi di amministratore esso potrà comunque
3770 portare la sua directory di lavoro fuori dalla \textit{chroot jail} in cui si
3771 trova. Basta infatti creare una nuova \textit{chroot jail} con l'uso di
3772 \func{chroot} su una qualunque directory contenuta nell'attuale directory di
3773 lavoro.  Per questo motivo l'uso di questa funzione non ha molto senso quando
3774 un processo necessita dei privilegi di root per le sue normali operazioni.
3775
3776 Un caso tipico di uso di \func{chroot} è quello di un server FTP anonimo, in
3777 questo caso infatti si vuole che il server veda solo i file che deve
3778 trasferire, per cui in genere si esegue una \func{chroot} sulla directory che
3779 contiene i file.  Si tenga presente però che in questo caso occorrerà
3780 replicare all'interno della \textit{chroot jail} tutti i file (in genere
3781 programmi e librerie) di cui il server potrebbe avere bisogno.
3782
3783
3784
3785 % LocalWords:  sez like filesystem unlink MacOS Windows VMS inode kernel unistd
3786 % LocalWords:  un'etichetta int const char oldpath newpath errno EXDEV EPERM st
3787 % LocalWords:  EEXIST EMLINK EACCES ENAMETOOLONG ENOTDIR EFAULT ENOMEM EROFS ls
3788 % LocalWords:  ELOOP ENOSPC EIO pathname nlink stat vfat fsck EISDIR ENOENT cap
3789 % LocalWords:  POSIX socket fifo sticky root system call count crash nell' init
3790 % LocalWords:  descriptor remove rename rmdir stdio glibc libc NFS DT obj dup
3791 % LocalWords:  ENOTEMPTY EBUSY mount point EINVAL soft symbolic tab symlink fig
3792 % LocalWords:  dangling access chdir chmod chown creat exec lchown lstat mkdir
3793 % LocalWords:  mkfifo mknod opendir pathconf readlink truncate path buff size
3794 % LocalWords:  grub bootloader grep linux MAXSYMLINKS cat VFS sys dirname fcntl
3795 % LocalWords:  dev umask IFREG IFBLK IFCHR IFIFO SVr sgid BSD SVID NULL from to
3796 % LocalWords:  stream dirent EMFILE ENFILE dirfd SOURCE fchdir readdir struct
3797 % LocalWords:  EBADF namlen HAVE thread entry result value argument fileno ino
3798 % LocalWords:  name TYPE OFF RECLEN UNKNOWN REG SOCK CHR BLK type IFTODT DTTOIF
3799 % LocalWords:  DTYPE off reclen seekdir telldir void rewinddir closedir select
3800 % LocalWords:  namelist compar malloc qsort alphasort versionsort strcoll myls
3801 % LocalWords:  strcmp DirScan direntry while current working home shell pwd get
3802 % LocalWords:  getcwd ERANGE getwd change fd race condition tmpnam getfacl mark
3803 % LocalWords:  string tmpdir TMP tempnam pfx TMPNAME suid tmp EXCL tmpfile pid
3804 % LocalWords:  EINTR mktemp mkstemp stlib template filename XXXXXX OpenBSD buf
3805 % LocalWords:  mkdtemp fstat filedes nell'header padding ISREG ISDIR ISCHR IFMT
3806 % LocalWords:  ISBLK ISFIFO ISLNK ISSOCK IFSOCK IFLNK IFDIR ISUID UID ISGID GID
3807 % LocalWords:  ISVTX IRUSR IWUSR IXUSR IRGRP IWGRP IXGRP IROTH IWOTH IXOTH du
3808 % LocalWords:  blocks blksize holes lseek TRUNC ftruncate length lenght ETXTBSY
3809 % LocalWords:  hole atime read utime mtime write ctime modification leafnode cp
3810 % LocalWords:  make fchmod fchown utimbuf times actime modtime Mac owner uid fs
3811 % LocalWords:  gid Control List patch mandatory control execute group other all
3812 % LocalWords:  dell' effective passwd IGID locking swap saved text IRWXU IRWXG
3813 % LocalWords:  IRWXO ext reiser capability FSETID mask capabilities chroot jail
3814 % LocalWords:  FTP Di filter reiserfs Attributes Solaris Posix FreeBSD libacl
3815 % LocalWords:  XFS SELinux namespace attribute security trusted Draft Modules
3816 % LocalWords:  attributes mime ADMIN FOWNER libattr lattr getxattr lgetxattr of
3817 % LocalWords:  fgetxattr attr ssize ENOATTR ENOTSUP NUL setxattr lsetxattr list
3818 % LocalWords:  fsetxattr flags XATTR REPLACE listxattr llistxattr flistxattr by
3819 % LocalWords:  removexattr lremovexattr fremovexattr attributename  lacl acl
3820 % LocalWords:  OBJ setfacl len any prefix separator options NUMERIC IDS SMART
3821 % LocalWords:  INDENT major number IDE Documentation makedev fopendir proc
3822
3823 %%% Local Variables:
3824 %%% mode: latex
3825 %%% TeX-master: "gapil"
3826 %%% End: