filedir.tex

   1 \chapter{Files e directories}
   2 \label{cha:files_and_dirs}
   3
   4 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
   5 files e directories, ed in particolare esamineremo come è strutturato il
   6 sistema base di protezioni e controllo di accesso ai files, e tutta
   7 l'interfaccia che permette la manipolazione dei vari attributi di files e
   8 directories. Tutto quello che riguarda invece la manipolazione del contenuto
   9 dei file è lasciato ai capitoli successivi.
  10
  11
  12 \section{La gestione di file e directory}
  13
  14 Le prime funzioni che considereremo sono quelle relative alla gestione di file
  15 e directory, secondo le caratteristiche standard che essi presentano in un
  16 filesystem unix, già esaminate in precedenza (vedi
  17 \secref{sec:fileintr_filesystem}).
  18
  19 \subsection{Le funzioni \texttt{link} e \texttt{unlink}}
  20 \label{sec:fileintr_link}
  21
  22 Una delle caratteristiche usate quando si opera con i file è quella di poter
  23 creare dei nomi fittizi (alias o collegamenti) per potersi riferire allo
  24 stesso file accedendovi da directory diverse. Questo è possibile anche in
  25 ambiente unix, dove tali collegamenti sono usualmente chiamati \textit{link},
  26 ma data la struttura del sistema ci sono due metodi sostanzialmente diversi
  27 per fare questa operazione.
  28
  29 Come si è appena detto l'accesso al contenuto di un file su disco avviene
  30 attraverso il suo inode, e il nome che si trova in una directory è solo una
  31 etichetta associata ad un puntatore a detto inode.  Questo significa che la
  32 realizzazione di un link è immediata in quanto uno stesso file può avere tanti
  33 nomi diversi allo stesso tempo, dati da altrettante diverse associazioni allo
  34 stesso inode; si noti poi che nessuno di questi nomi viene ad assumere una
  35 particolare preferenza rispetto agli altri.
  36
  37 Per aggiungere un nome ad un inode si utilizza la funzione \texttt{link}; si
  38 suole chiamare questo tipo di associazione un collegamento diretto (o
  39 \textit{hard link}).  Il prototipo della funzione e le sue caratteristiche
  40 principali, come risultano dalla man page, sono le seguenti:
  41 \begin{prototype}{unistd.h}
  42 {int link(const char * oldpath, const char * newpath)}
  43   Crea un nuovo collegamento diretto al file indicato da \texttt{oldpath}
  44   dandogli nome \texttt{newpath}.
  45
  46   La funzione restituisce zero in caso di successo e -1 per un errore, in caso
  47   di errore. La variabile \texttt{errno} viene settata secondo i seguenti
  48   codici di errore:
  49   \begin{errlist}
  50   \item \texttt{EXDEV} \texttt{oldpath} e \texttt{newpath} non sono sullo
  51     stesso filesystem.
  52   \item \texttt{EPERM} il filesystem che contiene \texttt{oldpath} e
  53     \texttt{newpath} non supporta i link diretti o è una directory.
  54   \item \texttt{EFAULT} una delle stringhe passate come parametri è fuori
  55     dello spazio di indirizzi del processo.
  56   \item \texttt{EACCESS} errore di accesso (mancano i permessi per scrivere o
  57     per attraversare le directories), vedi \secref{sec:filedir_access_control}
  58     per i dettagli.
  59   \item \texttt{ENAMETOOLONG} una dei due pathname è troppo lungo.
  60   \item \texttt{ENOENT} un componente di \texttt{oldpath} o \texttt{newpath}
  61     non esiste o è un link simbolico spezzato.
  62   \item \texttt{ENOTDIR} un componente di \texttt{oldpath} o \texttt{newpath}
  63     non è una directory.
  64   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
  65     completare l'operazione.
  66   \item \texttt{EROFS} la directory su cui si vuole inserire il nuovo link è
  67     su un filesystem montato readonly.
  68   \item \texttt{EEXIST} un file (o una directory) con quel nome esiste di
  69     già.
  70   \item \texttt{EMLINK} ci sono troppi link al file \texttt{oldpath} (il
  71     numero massimo è specificato dalla variabile \texttt{LINK\_MAX}, vedi
  72     \secref{sec:xxx_limits}).
  73   \item \texttt{ELOOP} si incontrati troppi link simbolici nella risoluzione
  74     di \texttt{oldpath} o \texttt{newpath}.
  75   \item \texttt{ENOSPC} la directory in cui si vuole creare il link non ha
  76     spazio per ulteriori voci.
  77   \item \texttt{EIO} c'è stato un errore di input/output.
  78   \end{errlist}
  79 \end{prototype}
  80
  81 La creazione di un nuovo collegamento diretto non copia il contenuto del file,
  82 ma si limita ad aumentare di uno il numero di referenze al file aggiungendo il
  83 nuovo nome ai precedenti. Si noti che uno stesso file può essere così
  84 richiamato in diverse directory.
  85
  86 Per quanto dicevamo in \secref{sec:fileintr_filesystem} la creazione del
  87 collegamento diretto è possibile solo se entrambi i pathname sono nello stesso
  88 filesystem; inoltre il filesystem deve supportare i collegamenti diretti (non è
  89 il caso ad esempio del filesystem \texttt{vfat} di windows).
  90
  91 La funzione opera sui file ordinari, come sugli altri oggetti del filesystem,
  92 ma solo l'amministratore è in grado di creare un collegamento diretto ad
  93 un'altra directory, questo lo si fa perché in questo caso è possibile creare
  94 dei circoli nel filesystem (vedi \secref{sec:fileintr_symlink}) che molti
  95 programmi non sono in grado di gestire e la cui rimozione diventa estremamente
  96 complicata (in genere occorre far girare il programma \texttt{fsck} per
  97 riparare il filesystem); data la sua pericolosità in Linux questa
  98 caratteristica è stata disabilitata, e la funzione restituisce l'errore
  99 \texttt{EPERM}.
 100
 101 La rimozione di un file (o più precisamente della voce che lo referenzia) si
 102 effettua con la funzione \texttt{unlink}; il suo prototipo è il seguente:
 103
 104 \begin{prototype}{unistd.h}{int unlink(const char * pathname)}
 105   Cancella il nome specificato dal pathname nella relativa directory e
 106   decrementa il numero di riferimenti nel relativo inode. Nel caso di link
 107   simbolico cancella il link simbolico; nel caso di socket, fifo o file di
 108   dispositivo rimuove il nome, ma come per i file i processi che hanno aperto
 109   uno di questi oggetti possono continuare ad utilizzarlo.
 110
 111   La funzione restituisce zero in caso di successo e -1 per un errore, nel
 112   qual caso il file non viene toccato. La variabile \texttt{errno} viene
 113   settata secondo i seguenti codici di errore:
 114   \begin{errlist}
 115   \item \texttt{EACCESS} errore di accesso (mancano i permessi per scrivere o
 116     per attraversare le directories), vedi \secref{sec:filedir_access_control}
 117     per i dettagli.
 118   \item \texttt{EISDIR} \texttt{pathname} si riferisce ad una directory
 119     (valore specifico ritornato da linux che non consente l'uso di
 120     \texttt{unlink} con le directory, e non conforme allo standard POSIX, che
 121     prescrive invece l'uso di \texttt{EPERM} in caso l'operazione non sia
 122     consnetita o il processo non abbia privilegi sufficienti).
 123   \item \texttt{EFAULT} la stringa
 124     passata come parametro è fuori dello spazio di indirizzi del processo.
 125   \item \texttt{ENAMETOOLONG} il pathname troppo lungo.
 126   \item \texttt{ENOENT} uno dei componenti del pathname non esiste o è un link
 127     simbolico spezzato.
 128   \item \texttt{ENOTDIR} uno dei componenti del pathname non è una directory.
 129   \item \texttt{EISDIR} \texttt{pathname} fa riferimento a una directory.
 130   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
 131     completare l'operazione.
 132   \item \texttt{EROFS} \texttt{pathname} è su un filesystem montato in sola
 133     lettura.
 134   \item \texttt{ELOOP} ci sono troppi link simbolici nella risoluzione del
 135     pathname.
 136   \item \texttt{EIO} errore di input/output.
 137   \end{errlist}
 138 \end{prototype}
 139
 140 Per cancellare una voce in una directory è necessario avere il permesso di
 141 scrittura su di essa (dato che si va a rimuovere una voce dal suo contenuto) e
 142 il diritto di esecuzione sulla directory che la contiene (torneremo in
 143 dettaglio sui permessi e gli attributi fra poco), se inoltre lo
 144 \textit{sticky} bit è settato occorrerà anche essere proprietari del file o
 145 proprietari della directory (o root, per cui nessuna delle restrizioni è
 146 applicata).
 147
 148 Una delle caratteristiche di queste funzioni è che la creazione/rimozione
 149 della nome dalla directory e l'incremento/decremento del numero di riferimenti
 150 nell'inode deve essere una operazione atomica (cioè non interrompibile da
 151 altri) processi, per questo entrambe queste funzioni sono realizzate tramite
 152 una singola system call.
 153
 154 Si ricordi infine che il file non viene eliminato dal disco fintanto che tutti
 155 i riferimenti ad esso sono stati cancellati, solo quando il \textit{link
 156   count} mantenuto nell'inode diventa zero lo spazio occupato viene rimosso. A
 157 questo però si aggiunge una altra condizione, e cioè che non ci siano processi
 158 che abbiano detto file aperto. Come accennato questa proprietà viene spesso
 159 usata per essere sicuri di non lasciare file temporanei su disco in caso di
 160 crash dei programmi; la tecnica è quella di aprire il file e chiamare
 161 \texttt{unlink} subito dopo.
 162
 163 \subsection{Le funzioni \texttt{remove} e \texttt{rename}}
 164 \label{sec:fileintr_remove}
 165
 166 Al contrario di quanto avviene con altri unix in Linux non è possibile usare
 167 \texttt{unlink} sulle directory, per cancellare una directory si può usare la
 168 funzione \texttt{rmdir} (vedi \secref{sec:filedir_dir_creat_rem}), oppure la
 169 funzione \texttt{remove}. Questa è la funzione prevista dallo standard ANSI C
 170 per cancellare un file o una directory (e funziona anche per i sistemi che non
 171 supportano i link diretti), che per i file è identica alla \texttt{unlink} e
 172 per le directory è identica alla \texttt{rmdir}:
 173
 174 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
 175   Cancella un nome dal filesystem. Usa \texttt{unlink} per i file e
 176   \texttt{rmdir} per le directory.
 177
 178   La funzione restituisce zero in caso di successo e -1 per un errore, nel
 179   qual caso il file non viene toccato. Per i codici di errori vedi quanto
 180   riportato nella descrizione di \texttt{unlink} e \texttt{rmdir}.
 181 \end{prototype}
 182
 183 Per cambiare nome ad un file si usa invece la funzione \texttt{rename}, il
 184 vantaggio nell'uso di questa funzione al posto della chiamata successiva di
 185 \texttt{unlink} e \texttt{link} è che l'operazione è eseguita atomicamente, in
 186 questo modo non c'è la possibilità che un processo che cerchi di accedere al
 187 nuovo nome dopo che il vecchio è stato cambiato lo trovi mancante.
 188
 189 \begin{prototype}{stdio.h}
 190 {int rename(const char *oldpath, const char *newpath)}
 191   Rinomina un file, spostandolo fra directory diverse quando richiesto.
 192
 193   La funzione restituisce zero in caso di successo e -1 per un errore, nel
 194   qual caso il file non viene toccato. La variabile \texttt{errno} viene
 195   settata secondo i seguenti codici di errore:
 196   \begin{errlist}
 197   \item \texttt{EISDIR} \texttt{newpath} è una directory già esistente mentre
 198     \texttt{oldpath} non è una directory.
 199   \item \texttt{EXDEV} \texttt{oldpath} e \texttt{newpath} non sono sullo
 200     stesso filesystem.
 201   \item \texttt{ENOTEMPTY} \texttt{newpath} è una directory già esistente e
 202     non vuota.
 203   \item \texttt{EBUSY} o \texttt{oldpath} o \texttt{newpath} sono in uso da
 204     parte di qualche processo (come directory di lavoro o come root) o del
 205     sistema (come mount point).
 206   \item \texttt{EINVAL} \texttt{newpath} contiene un prefisso di
 207     \texttt{oldpath} o più in generale si è cercato di creare una directory
 208     come sottodirectory di se stessa.
 209   \item \texttt{EMLINK} \texttt{oldpath} ha già il massimo numero di link
 210     consentiti o è una directory e la directory che contiene \texttt{newpath}
 211     ha già il massimo numero di link.
 212   \item \texttt{ENOTDIR} Uno dei componenti dei pathname non è una directory
 213     o\texttt{oldpath} è una directory e \texttt{newpath} esiste e non è una
 214     directory.
 215   \item \texttt{EFAULT} o \texttt{oldpath} o \texttt{newpath} è fuori dello
 216     spazio di indirizzi del processo.
 217   \item \texttt{EACCESS} Non c'è il permesso di scrittura per la directory in
 218     cui si vuole creare il nuovo link o una delle directory del pathname non
 219     consente la ricerca (permesso di esecuzione).
 220   \item \texttt{EPERM} le directory contenenti \texttt{oldpath} o
 221     \texttt{newpath} hanno lo sticky bit attivo e i permessi del processo non
 222     consentono rispettivamente la cancellazione e la creazione del file, o il
 223     filesystem non supporta i link.
 224   \item \texttt{ENAMETOOLONG} uno dei pathname è troppo lungo.
 225   \item \texttt{ENOENT} Uno dei componenti del pathname non esiste o è un link
 226     simbolico spezzato.
 227   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
 228     completare l'operazione.
 229   \item \texttt{EROFS} I file sono su un filesystem montato in sola lettura.
 230   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione del
 231     pathname.
 232   \item \texttt{ENOSPC} Il device di destinazione non ha più spazio per la
 233     nuova voce.
 234   \end{errlist}
 235 \end{prototype}
 236
 237 \subsection{I link simbolici}
 238 \label{sec:fileintr_symlink}
 239
 240 Siccome la funzione \texttt{link} crea riferimenti agli inodes, essa può
 241 funzionare soltanto per file che risiedono sullo stesso filesystem, dato che
 242 in questo caso è garantita l'unicità dell'inode, e solo per un filesystem di
 243 tipo unix.  Inoltre in Linux non è consentito eseguire un link diretto ad una
 244 directory.
 245
 246 Per ovviare a queste limitazioni i sistemi unix supportano un'altra forma di
 247 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
 248 come avviene in altri sistemi operativi, dei file che contengono il
 249 semplicemente il riferimento ad un altro file (o directory). In questo modo è
 250 possibile effettuare link anche attraverso filesystem diversi e a directory, e
 251 pure a file che non esistono ancora.
 252
 253 Il sistema funziona in quanto i link simbolici sono contrassegnati come tali
 254 al kernel (analogamente a quanto avviene per le directory) per cui la chiamata
 255 ad una \texttt{open} o una \texttt{stat} su un link simbolico comporta la
 256 lettura del contenuto del medesimo e l'applicazione della funzione al file
 257 specificato da quest'ultimo. Invece altre funzioni come quelle per cancellare
 258 o rinominare i file operano direttamente sul link simbolico. Inoltre esistono
 259 funzioni apposite, come la \texttt{readlink} e la \texttt{lstat} per accedere
 260 alle informazioni del link invece che a quelle del file a cui esso fa
 261 riferimento.
 262
 263 Le funzioni per operare sui link simbolici sono le seguenti, esse sono tutte
 264 dichiarate nell'header file \texttt{unistd.h}.
 265
 266 \begin{prototype}{unistd.h}
 267 {int symlink(const char * oldname, const char * newname)}
 268   Crea un nuovo link simbolico al file indicato da \texttt{oldname} dandogli
 269   nome \texttt{newname}.
 270
 271   La funzione restituisce zero in caso di successo e -1 per un errore, in caso
 272   di errore. La variabile \texttt{errno} viene settata secondo i codici di
 273   errore standard di accesso ai files (trattati in dettaglio in
 274   \secref{sec:filedir_access_control}) ai quali si aggiungono i seguenti:
 275   \begin{errlist}
 276   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di
 277     già.
 278   \item \texttt{EROFS} La directory su cui si vuole inserire il nuovo link è
 279     su un filesystem montato readonly.
 280   \item \texttt{ENOSPC} La directory o il filesystem in cui si vuole creare il
 281     link è piena e non c'è ulteriore spazio disponibile.
 282   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione di
 283     \texttt{oldname} o di \texttt{newname}.
 284   \end{errlist}
 285 \end{prototype}
 286
 287 Dato che la funzione \texttt{open} segue i link simbolici, è necessaria usare
 288 un'altra funzione quando si vuole leggere il contenuto di un link simbolico,
 289 questa funzione è la:
 290
 291 \begin{prototype}{unistd.h}
 292 {int readlink(const char * path, char * buff, size\_t size)}
 293   Legge il contenuto del link simbolico indicato da \texttt{path} nel buffer
 294   \texttt{buff} di dimensione \texttt{size}. Non chiude la stringa con un
 295   carattere nullo e la tronca a \texttt{size} nel caso il buffer sia troppo
 296   piccolo per contenerla.
 297
 298   La funzione restituisce il numero di caratteri letti dentro \texttt{buff} o
 299   -1 per un errore, in caso di errore. La variabile \texttt{errno} viene
 300   settata secondo i codici di errore:
 301   \begin{errlist}
 302   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di
 303     già.
 304   \item \texttt{EROFS} La directory su cui si vuole inserire il nuovo link è
 305     su un filesystem montato readonly.
 306   \item \texttt{ENOSPC} La directory o il filesystem in cui si vuole creare il
 307     link è piena e non c'è ulteriore spazio disponibile.
 308   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione di
 309     \texttt{oldname} o di \texttt{newname}.
 310   \end{errlist}
 311 \end{prototype}
 312
 313 \section{La manipolazione delle directories}
 314 \label{sec:filedir_dir_handling}
 315
 316 \subsection{Le funzioni \texttt{mkdir} e \texttt{rmdir}}
 317 \label{sec:filedir_dir_creat_rem}
 318
 319 Per creare una nuova directory si può usare la seguente funzione, omonima
 320 dell'analogo comando di shell \texttt{mkdir}; per accedere ai tipi usati
 321 programma deve includere il file \texttt{sys/types.h}.
 322
 323 \begin{prototype}{sys/stat.h}
 324 {int mkdir (const char * dirname, mode\_t mode)}
 325   Questa funzione crea una nuova directory vuota con il nome indicato da
 326   \texttt{dirname}, assegnandole i permessi indicati da \texttt{mode}. Il nome
 327   può essere indicato con il pathname assoluto o relativo.
 328
 329   La funzione restituisce zero in caso di successo e -1 per un errore, in caso
 330   di errore \texttt{errno} viene settata secondo i codici di errore standard
 331   di accesso ai files (trattati in dettaglio in
 332   \secref{sec:filedir_access_control}) ai quali si aggiungono i seguenti:
 333   \begin{errlist}
 334   \item \texttt{EACCESS}
 335     Non c'è il permesso di scrittura per la directory in cui si vuole inserire
 336     la nuova directory.
 337   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di già.
 338   \item \texttt{EMLINK} La directory in cui si vuole creare la nuova directory
 339     contiene troppi file. Sotto Linux questo normalmente non avviene perché il
 340     filesystem standard consente la creazione di un numero di file maggiore di
 341     quelli che possono essere contenuti nell'hard-disk, ma potendo avere a che
 342     fare anche con filesystem di altri sistemi questo errore può presentarsi.
 343   \item \texttt{ENOSPC} Non c'è abbastanza spazio sul file system per creare
 344     la nuova directory.
 345   \item \texttt{EROFS} La directory su cui si vuole inserire la nuova
 346     directory è su un filesystem montato readonly.
 347   \end{errlist}
 348 \end{prototype}
 349
 350
 351 \subsection{Accesso alle directory}
 352 \label{sec:filedir_dir_read}
 353
 354 Benché le directory siano oggetti del filesystem come tutti gli altri non ha
 355 ovviamente senso aprirle come fossero dei file di dati. Può però essere utile
 356 poterne leggere il contenuto ad esempio per fare la lista dei file che esse
 357 contengono o ricerche sui medesimi.
 358
 359 Per accedere al contenuto delle directory si usano i cosiddetti
 360 \textit{directory streams} (chiamati così per l'analogia con i file stream);
 361 la funzione \texttt{opendir} apre uno di questi stream e la funzione
 362 \texttt{readdir} legge il contenuto della directory, i cui elementi sono le
 363 \textit{directory entries} (da distinguersi da quelle della cache di cui
 364 parlavamo in \secref{sec:fileintr_vfs}) in una opportuna struttura
 365 \texttt{struct dirent}.
 366
 367
 368 \subsection{La directory di lavoro}
 369 \label{sec:filedir_work_dir}
 370
 371 A ciascun processo è associato ad una directory nel filesystem che è chiamata
 372 directory corrente o directory di lavoro (\textit{current working directory})
 373 che è quella a cui si fa riferimento quando un filename è espresso in forma
 374 relativa (relativa appunto a questa directory).
 375
 376 Quando un utente effettua il login questa directory viene settata alla
 377 cosiddetta \textit{home directory} del suo account, il comando \texttt{cd}
 378 della shell consente di cambiarla a piacere, spostandosi da una directory ad
 379 un'altra.  Siccome la directory corrente resta la stessa quando viene creato
 380 un processo figlio, la directory corrente della shell diventa anche la
 381 directory corrente di qualunque comando da essa lanciato.
 382
 383 Le funzioni qui descritte servono esaminare e cambiare la directory di lavoro
 384 corrente.
 385
 386 \begin{prototype}{unistd.h}{char * getcwd (char * buffer, size\_t size)}
 387   Restituisce il filename completo della directory di lavoro corrente nella
 388   stringa puntata da \texttt{buffer}, che deve essere precedentemente
 389   allocata, per una dimensione massima di \texttt{size}. Si può anche
 390   specificare un puntatore nullo come \textit{buffer}, nel qual caso la
 391   stringa sarà allocata automaticamente per una dimensione pari a
 392   \texttt{size} qualora questa sia diversa da zero, o della lunghezza esatta
 393   del pathname altrimenti. In questo caso si deve ricordare di disallocare la
 394   stringa una volta cessato il suo utilizzo.
 395
 396   La funzione restituisce il puntatore \texttt{buffer} se riesce,
 397   \texttt{NULL} se fallisce, in quest'ultimo caso la variabile
 398   \texttt{errno} è settata con i seguenti codici di errore:
 399   \begin{errlist}
 400   \item \texttt{EINVAL} L'argomento \texttt{size} è zero e \texttt{buffer} non
 401     è nullo.
 402   \item \texttt{ERANGE} L'argomento \texttt{size} è più piccolo della
 403     lunghezza del pathname.
 404   \item \texttt{EACCESS} Manca il permesso di lettura o di ricerca su uno dei
 405     componenti del pathname (cioè su una delle directory superiori alla
 406     corrente).
 407   \end{errlist}
 408 \end{prototype}
 409
 410 Di questa funzione esiste una versione \texttt{char * getwd(char * buffer)}
 411 fatta per compatibilità all'indietro con BSD, che non consente di specificare
 412 la dimensione del buffer; esso deve essere allocato in precedenza ed avere una
 413 dimensione superiore a \texttt{PATH\_MAX} (di solito 256 bytes, vedi
 414 \secref{sec:xxx_limits}; il problema è che in Linux non esiste una dimensione
 415 superiore per un pathname, per cui non è detto che il buffer sia sufficiente a
 416 contenere il nome del file, e questa è la ragione principale per cui questa
 417 funzione è deprecata.
 418
 419 Una seconda funzione simile è \texttt{char * get\_current\_dir\_name(void)}
 420 che è sostanzialmente equivalente ad una \texttt{getcwd(NULL, 0)}, con la sola
 421 differenza che essa ritorna il valore della variabile di ambiente
 422 \texttt{PWD}, che essendo costruita dalla shell può contenere anche dei
 423 riferimenti simbolici.
 424
 425 Come già detto in unix anche le directory sono file, è possibile pertanto
 426 riferirsi ad esse tramite il file descriptor dell'interfaccia a basso livello,
 427 e non solo tramite il filename; per questo motivo ci sono due diverse funzioni
 428 per cambiare directory di lavoro.
 429
 430 \begin{prototype}{unistd.h}{int chdir (const char * pathname)}
 431   Come dice il nome (che significa \textit{change directory}) questa funzione
 432   serve a cambiare la directory di lavoro a quella specificata dal pathname
 433   contenuto nella stringa \texttt{pathname}.
 434 \end{prototype}
 435
 436 \begin{prototype}{unistd.h}{int fchdir (int filedes)}
 437   Analoga alla precedente, ma usa un file descriptor invece del pathname.
 438
 439   Entrambe le funzioni restituiscono zero in caso di successo e -1 per un
 440   errore, in caso di errore \texttt{errno} viene settata secondo i codici di
 441   errore standard di accesso ai files (trattati in dettaglio in
 442   \secref{sec:filedir_access_control}) ai quali si aggiunge il codice
 443   \texttt{ENOTDIR} nel caso il \texttt{filename} indichi un file che non sia
 444   una directory.
 445 \end{prototype}
 446
 447
 448 \section{La manipolazione delle caratteristiche dei files}
 449 \label{sec:filedir_infos}
 450
 451 Come spiegato in \secref{sec:fileintr_filesystem} tutte le informazioni
 452 generali relative alle caratteristiche di ciascun file sono mantenute
 453 nell'inode. Vedremo in questa sezione come sia possibile accedervi usando la
 454 funzione \texttt{stat} ed esamineremo alcune funzioni utilizzabili per
 455 manipolare una parte di questa informazione. Tutto quello che invece riguarda
 456 il meccanismo di controllo di accesso ad i file e le relative funzioni di
 457 manipolazione sarà invece esaminanto in \secref{sec:filedir_access_control}.
 458
 459
 460 \subsection{Le funzioni \texttt{stat}, \texttt{fstat} e \texttt{lstat}}
 461 \label{sec:filedir_stat}
 462
 463 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
 464 delle funzioni \texttt{stat}, che è la funzione che il comando \texttt{ls} usa
 465 per poter stampare tutti i dati dei files. I prototipi di queste funzioni sono
 466 i seguenti:
 467 \begin{functions}
 468   \headdecl{sys/types.h}
 469   \headdecl{sys/stat.h}
 470   \headdecl{unistd.h}
 471
 472   \funcdecl{int stat(const char *file\_name, struct stat *buf)} Legge le
 473   informazione del file specificato da \var{file\_name} e le inserisce in
 474   \var{buf}.
 475
 476   \funcdecl{int lstat(const char *file\_name, struct stat *buf)} Identica a
 477   \func{stat} eccetto che se il \var{file\_name} è un link simbolico vengono
 478   lette le informazioni relativa ad esso e non al file a cui punta.
 479
 480   \funcdecl{int fstat(int filedes, struct stat *buf)} Identica a \func{stat}
 481   eccetto che funziona con un file aperto, specificato tramite il suo file
 482   descriptor \var{filedes}.
 483
 484   Le funzioni restituiscono zero in caso di successo e -1 per un errore, in
 485   caso di errore \texttt{errno} viene settato ai valori:
 486   \begin{errlist}
 487   \item \texttt{EACCESS} Non c'è il permesso di accedere al file.
 488   \item \texttt{ENOTDIR} Una componente del pathname non è una directory.
 489   \item \texttt{EMLOOP} Ci sono troppi link simbolici nel pathname.
 490   \item \texttt{EFAULT} I puntatori usati sono fuori dallo spazio di indirizzi
 491     del processo.
 492   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
 493     completare l'operazione.
 494   \item \texttt{ENAMETOOLONG} Il filename è troppo lungo.
 495   \end{errlist}
 496 \end{functions}
 497
 498 La struttura \texttt{stat} è definita nell'header \texttt{sys/stat.h} e in
 499 generale dipende dall'implementazione, la versione usata da Linux è mostrata
 500 in \nfig, così come riportata dalla man page (in realtà la definizione
 501 effettivamente usata nel kernel dipende dall'archietettura e ha altri campi
 502 riservati per estensioni come tempo più precisi, o per il padding dei campi).
 503
 504 \begin{figure}[!htb]
 505   \footnotesize
 506   \centering
 507   \begin{minipage}[c]{15cm}
 508     \begin{lstlisting}[]{}
 509 struct stat {
 510     dev_t         st_dev;      /* device */
 511     ino_t         st_ino;      /* inode */
 512     mode_t        st_mode;     /* protection */
 513     nlink_t       st_nlink;    /* number of hard links */
 514     uid_t         st_uid;      /* user ID of owner */
 515     gid_t         st_gid;      /* group ID of owner */
 516     dev_t         st_rdev;     /* device type (if inode device) */
 517     off_t         st_size;     /* total size, in bytes */
 518     unsigned long st_blksize;  /* blocksize for filesystem I/O */
 519     unsigned long st_blocks;   /* number of blocks allocated */
 520     time_t        st_atime;    /* time of last access */
 521     time_t        st_mtime;    /* time of last modification */
 522     time_t        st_ctime;    /* time of last change */
 523 };
 524     \end{lstlisting}
 525   \end{minipage}
 526   \normalsize
 527   \caption{La struttura \texttt{stat} per la lettura delle informazioni dei
 528     file}
 529   \label{fig:filedir_stat_struct}
 530 \end{figure}
 531
 532 Si noti come i vari membri della struttura siano specificati come tipi nativi
 533 del sistema (di quelli definiti in \tabref{tab:xxx_sys_types}, e dichiarati in
 534 \texttt{sys/types.h}).
 535
 536
 537 \subsection{I tipi di file}
 538 \label{sec:filedir_file_types}
 539
 540 Come riportato in \tabref{tab:fileintr_file_types} in Linux oltre ai file e
 541 alle directory esistono vari altri oggetti che possono stare su un filesystem;
 542 il tipo di file è ritornato dalla \texttt{stat} nel campo \texttt{st\_mode}.
 543
 544 Dato che il valore numerico può variare a seconda delle implementazioni lo
 545 standard POSIX definisce un insieme di macro per verificare il tipo di files,
 546 queste venfono usate anche da Linux che supporta pure le estensioni per link
 547 simbolici e socket definite da BDS, l'elenco è riportato in \ntab:
 548 \begin{table}[htb]
 549   \centering
 550   \footnotesize
 551   \begin{tabular}[c]{|l|l|}
 552     \hline
 553     Macro & Tipo del file \\
 554     \hline
 555     \hline
 556     \macro{S\_ISREG(m)}  & file normale \\
 557     \macro{S\_ISDIR(m)}  & directory \\
 558     \macro{S\_ISCHR(m)}  & device a caraetteri \\
 559     \macro{S\_ISBLK(m)}  & device a blocchi\\
 560     \macro{S\_ISFIFO(m)} & fifo \\
 561     \macro{S\_ISLNK(m)}  & link simbolico \\
 562     \macro{S\_ISSOCK(m)} & socket \\
 563     \hline
 564   \end{tabular}
 565   \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h})}
 566   \label{tab:filedir_file_type_macro}
 567 \end{table}
 568
 569 Oltre a queste macro è possibile usare direttamente il valore di
 570 \var{st\_mode} per ricavare il significato dei vari bit del campo attraverso
 571 l'uso dei flag riportati in \ntab:
 572 \begin{table}[htb]
 573   \centering
 574   \footnotesize
 575   \begin{tabular}[c]{|l|c|l|}
 576     \hline
 577     Flag & Valore & Significato \\
 578     \hline
 579     \hline
 580     \macro{S\_IFMT}   &  0170000 & bitmask for the file type bitfields \\
 581     \macro{S\_IFSOCK} &  0140000 & socket        \\
 582     \macro{S\_IFLNK}  &  0120000 & symbolic link \\
 583     \macro{S\_IFREG}  &  0100000 & regular file  \\
 584     \macro{S\_IFBLK}  &  0060000 & block device  \\
 585     \macro{S\_IFDIR}  &  0040000 & directory     \\
 586     \macro{S\_IFCHR}  &  0020000 & character device         \\
 587     \macro{S\_IFIFO}  &  0010000 & fifo                     \\
 588     \macro{S\_ISUID}  &  0004000 & set UID bit              \\
 589     \macro{S\_ISGID}  &  0002000 & set GID bit (see below)  \\
 590     \macro{S\_ISVTX}  &  0001000 & sticky bit (see below)   \\
 591     \macro{S\_IRWXU}  &  00700   & mask for file owner permissions \\
 592     \macro{S\_IRUSR}  &  00400   & owner has read permission       \\
 593     \macro{S\_IWUSR}  &  00200   & owner has write permission      \\
 594     \macro{S\_IXUSR}  &  00100   & owner has execute permission    \\
 595     \macro{S\_IRWXG}  &  00070   & mask for group permissions      \\
 596     \macro{S\_IRGRP}  &  00040   & group has read permission       \\
 597     \macro{S\_IWGRP}  &  00020   & group has write permission      \\
 598     \macro{S\_IXGRP}  &  00010   & group has execute permission    \\
 599     \macro{S\_IRWXO}  &  00007   & mask for permissions for others (not in
 600     group) \\
 601     \macro{S\_IROTH}  &  00004   & others have read permission     \\
 602     \macro{S\_IWOTH}  &  00002   & others have write permisson     \\
 603     \macro{S\_IXOTH}  &  00001   & others have execute permission  \\
 604     \hline
 605   \end{tabular}
 606   \caption{Flag per il campo \var{st\_mode} (definite in
 607     \texttt{sys/stat.h})}
 608   \label{tab:filedir_file_mode_flags}
 609 \end{table}
 610
 611 \subsection{La dimensione dei file}
 612 \label{sec:filedir_file_size}
 613
 614 Il membro \var{st\_size} contiene la dimensione del
 615
 616 \subsection{I tempi dei file}
 617 \label{sec:filedir_file_times}
 618
 619 \subsection{La funzione \texttt{utime}}
 620 \label{sec:filedir_utime}
 621
 622
 623
 624
 625 \section{Il controllo di accesso ai file}
 626 \label{sec:filedir_access_control}
 627
 628
 629 In unix è implementata da qualunque filesystem standard una forma elementare
 630 (ma adatta alla maggior parte delle esigenze) di controllo di accesso ai
 631 files. Torneremo sull'argomento in dettaglio più avanti (vedi
 632 \secref{sec:filedir_access_control}), qui ci limitiamo ad una introduzione dei
 633 concetti essenziali.
 634
 635 Si tenga conto poi che quanto diremo è vero solo per filesystem di tipo Unix,
 636 e non è detto che sia applicabile (ed infatti non è vero per il filesystem di
 637 Windows) a un filesystem qualunque. Esistono inoltre estensioni che permettono
 638 di implementare le ACL (\textit{Access Control List}) che sono un meccanismo
 639 di controllo di accesso molto più sofisticato.
 640
 641 Ad ogni file Unix associa sempre l'utente che ne è proprietario (il cosiddetto
 642 \textit{owner}) e il gruppo di appartenenza, secondo il meccanismo degli uid e
 643 gid accennato in \secref{sec:intro_multiuser}, e un insieme di permessi che
 644 sono divisi in tre classi, e cioè attribuiti rispettivamente al proprietario,
 645 a qualunque utente faccia parte del gruppo cui appartiene il file, e a tutti
 646 gli altri utenti.
 647
 648 I permessi sono espressi da un insieme di 12 bit: di questi i nove meno
 649 significativi sono usati a gruppi di tre per indicare i permessi base di
 650 lettura, scrittura ed esecuzione (indicati rispettivamente con le lettere
 651 \textit{w}, \textit{r} \textit{x}) applicabili rispettivamente al
 652 proprietario, al gruppo, a tutti (una descrizione più dettagliata dei vari
 653 permessi associati ai file è riportata in \secref{sec:filedir_suid_sgid}).  I
 654 restanti tre bit sono usati per indicare alcune caratteristiche più complesse
 655 (\textit{suid}, \textit{sgid}, e \textit{sticky}) su cui pure torneremo in
 656 seguito (vedi \secref{sec:filedir_suid_sgid} e \secref{sec:filedir_sticky}).
 657
 658 Tutte queste informazioni sono tenute per ciascun file nell'inode. Quando un
 659 processo cerca l'accesso al file esso controlla i propri uid e gid
 660 confrontandoli con quelli del file e se l'operazione richiesta è compatibile
 661 con i permessi associati al file essa viene eseguita, altrimenti viene
 662 bloccata ed è restituito un errore di \texttt{EPERM}. Questo procedimento non
 663 viene eseguito per l'amministratore di sistema (il cui uid è zero) il quale ha
 664 pertanto accesso senza restrizione a qualunque file del sistema.
 665
 666 % In realtà il procedimento è più complesso di quanto descritto in maniera
 667 % elementare qui; inoltre ad un processo sono associati diversi identificatori,
 668 % torneremo su questo in maggiori dettagli in seguito in \secref{sec:proc_perms}.
 669
 670
 671
 672 \subsection{I flag \texttt{suid} e \texttt{sgid}}
 673 \label{sec:filedir_suid_sgid}
 674
 675 \subsection{La titolarità di nuovi files e directory}
 676 \label{sec:filedir_ownership}
 677
 678 \subsection{La funzione \texttt{access}}
 679 \label{sec:filedir_access}
 680
 681 \subsection{La funzione \texttt{umask}}
 682 \label{sec:filedir_umask}
 683
 684 \subsection{Le funzioni \texttt{chmod} e \texttt{fchmod}}
 685 \label{sec:filedir_chmod}
 686
 687 \subsection{Il flag \texttt{sticky}}
 688 \label{sec:filedir_sticky}
 689
 690 \subsection{Le funzioni \texttt{chown}, \texttt{fchown} e \texttt{lchown}}
 691 \label{sec:filedir_chown}
 692
 693
 694
 695
 696 %La struttura fondamentale che contiene i dati essenziali relativi ai file è il
 697 %cosiddetto \textit{inode}; questo conterrà informazioni come il
 698 %tipo di file (file di dispositivo, directory, file di dati, per un elenco
 699 %completo vedi \ntab), i permessi (vedi \secref{sec:file_perms}), le date (vedi
 700 %\secref{sec:file_times}).
 701