filedir.tex

   1 \chapter{Files e directories}
   2 \label{cha:files_and_dirs}
   3
   4 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
   5 file e directory, ed in particolare esamineremo come è strutturato il sistema
   6 base di protezioni e controllo di accesso ai file, e tutta l'interfaccia che
   7 permette la manipolazione dei vari attributi di file e directory. Tutto quello
   8 che riguarda invece la manipolazione del contenuto dei file è lasciato ai
   9 capitoli successivi.
  10
  11
  12
  13 \section{Il controllo di accesso ai file}
  14 \label{sec:filedir_access_control}
  15
  16 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
  17 del controllo di accesso ai file, che viene implementato per qualunque
  18 filesystem standard. In questa sezione ne esamineremo i concetti essenziali e
  19 le funzioni usate per gestirne i vari aspetti.
  20
  21
  22 \subsection{I permessi per l'accesso ai file}
  23 \label{sec:filedir_perm_overview}
  24
  25 Il controllo di accesso ai file in unix segue un modello abbastanza semplice,
  26 ma adatto alla gran parte delle esigenze, in cui si dividono i permessi su tre
  27 livelli. Si tenga conto poi che quanto diremo è vero solo per filesystem di
  28 tipo unix, e non è detto che sia applicabile a un filesystem
  29 qualunque\footnote{ed infatti non è vero per il filesystem vfat di Windows,
  30   per il quale vengono assegnati in maniera fissa con un opzione in fase di
  31   montaggio}.  Esistono inoltre estensioni che permettono di implementare le
  32 ACL (\textit{Access Control List}) che sono un meccanismo di controllo di
  33 accesso molto più sofisticato.
  34
  35 Ad ogni file unix associa sempre l'utente che ne è proprietario (il cosiddetto
  36 \textit{owner}) e il gruppo di appartenenza, secondo il meccanismo degli
  37 identificatori di utenti e gruppi (\textsl{uid} e \textsl{gid}), e accessibili
  38 da programm tramite i campi \var{st\_uid} e \var{st\_gid} della struttura
  39 \var{stat} (si veda \secref{sec:filedir_stat}). Ad ogni file viene inoltre
  40 associato un insieme di permessi che sono divisi in tre classi, e cioè
  41 attribuiti rispettivamente all'utente proprietario del file, a un qualunque
  42 utente faccia parte del gruppo cui appartiene il file, e a tutti gli altri
  43 utenti.
  44
  45 I permessi sono espressi da un insieme di 12 bit: di questi i nove meno
  46 significativi sono usati a gruppi di tre per indicare i permessi base di
  47 lettura, scrittura ed esecuzione (indicati rispettivamente con le lettere
  48 \textsl{w}, \textit{r} \textsl{x} nei comandi di sistema) applicabili
  49 rispettivamente al proprietario, al gruppo, a tutti.  I restanti tre bit
  50 (\textsl{suid}, \textsl{sgid}, e \textsl{sticky}) sono usati per indicare
  51 alcune caratteristiche più complesse su cui torneremo in seguito (vedi
  52 \secref{sec:filedir_suid_sgid} e \secref{sec:filedir_sticky}).
  53
  54 Anche i permessi sono tenuti per ciascun file (di qualunque tipo, quindi anche
  55 per le fifo, i socket e i file di dispositivo) nell'inode, in opportuni bit
  56 del campo \var{st\_mode} della struttura letta da \func{stat} (vedi
  57 \figref{fig:filedir_stat_struct}).
  58
  59
  60 In genere ci si riferisce a questi permessi usando le lettere \textsl{u} (per
  61 \textit{user}), \textsl{g} (per \textit{group}) e \textsl{o} (per
  62 \textit{other}), inoltre se si vuole indicare tutti questi gruppi insieme si
  63 usa la lettera \textsl{a} (per \textit{all}). Si tenga ben presente questa
  64 distinzione, dato che in certi casi, mutuando la termimologia in uso nel VMS,
  65 si parla dei permessi base come di permessi di owner, group ed all, le cui
  66 iniziali possono da luogo a confuzione. Le costanti che permettono di accedere
  67 al valore numerico di questi bit sono riportate in \ntab.
  68
  69 \begin{table}[htb]
  70   \centering
  71     \footnotesize
  72   \begin{tabular}[c]{|c|l|}
  73     \hline
  74     \var{st\_mode} bit & Significato \\
  75     \hline
  76     \hline
  77     \macro{S\_IRUSR}  &  \textit{user-read}, l'utente può leggere     \\
  78     \macro{S\_IWUSR}  &  \textit{user-write}, l'utente può scrivere   \\
  79     \macro{S\_IXUSR}  &  \textit{user-execute}, l'utente può eseguire \\
  80     \hline
  81     \macro{S\_IRGRP}  &  \textit{group-read}, il gruppo può leggere    \\
  82     \macro{S\_IWGRP}  &  \textit{group-write}, il gruppo può scrivere  \\
  83     \macro{S\_IXGRP}  &  \textit{group-execute}, il gruppo può eseguire\\
  84     \hline
  85     \macro{S\_IROTH}  &  \textit{other-read}, tutti possono leggere    \\
  86     \macro{S\_IWOTH}  &  \textit{other-write}, tutti possono scrivere  \\
  87     \macro{S\_IXOTH}  &  \textit{other-execute}, tutti possono eseguire\\
  88     \hline
  89   \end{tabular}
  90   \caption{I bit dei permessi di accesso ai file, come definiti in
  91     \texttt{<sys/stat.h>}}
  92   \label{tab:file_bit_perm}
  93 \end{table}
  94
  95 Questi permessi vengono usati in maniera diversa dalle varie funzioni, e a
  96 seconda che si riferiscano a file, link simbolici o directory, qui ci
  97 limiteremo ad un riassunto delle regole generali, entrando nei
  98 dettagli più avanti.
  99
 100 La prima regola è che per poter accedere ad un file attraverso il suo pathname
 101 occorre il permesso di esecuzione in ciascuna delle directory che compongono
 102 il pathname, e lo stesso vale per aprire un file nella directory corrente (per
 103 la quale appunto serve il diritto di esecuzione).
 104
 105 Per una directory infatti il permesso di esecuzione ha il significato
 106 specifico che essa può essere attraversata nella risoluzione del pathname, ed
 107 è distinto dal permesso di lettura che invece implica che si può leggere il
 108 contenuto della directory. Questo significa che se si ha il permesso di
 109 esecuzione senza permesso di lettura si potrà lo stesso aprire un file in una
 110 directory (se si hanno i permessi opportuni per il medesimo) ma non si potrà
 111 vederlo con \cmd{ls} (per crearlo occorrerà anche il permesso di scrittura per
 112 la directory).
 113
 114 Il permesso di lettura per un file consente di aprirlo con le opzioni di sola
 115 lettura (\macro{O\_RDONLY}) o di lettura-scrittura (\macro{O\_RDWR}) e
 116 leggerne il contenuto. Il permesso di scrittura consente di aprire un file in
 117 sola scrittura (\macro{O\_WRONLY}) o lettura-scrittura (\macro{O\_RDWR}) e
 118 modificarne il contenuto, lo stesso permesso è necessario per poter troncare
 119 il file con l'opzione \macro{O\_TRUNC}.
 120
 121 Non si può creare un file fintanto che non si disponga del permesso di
 122 esecuzione e di quello di scrittura per la directory di destinazione; gli
 123 stessi permessi occorrono per cancellare un file da una directory (si ricordi
 124 che questo non implica necessariamente la rimozione fisica del file), non è
 125 necessario nessun tipo di permesso per il file stesso (infatti esso non viene
 126 toccato, viene solo modificato il contenute della directory).
 127
 128 Per poter eseguire un file (che sia un programma compilato od uno script di
 129 shell), occorre il permesso di esecuzione per il medesimo, inoltre solo i file
 130 regolari possono essere eseguiti.
 131
 132 La procedura con cui il kernel stabilisce se un processo possiede un certo
 133 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
 134 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
 135 \var{st\_gid} accennati in precedenza) e l'\textit{effective user id},
 136 l'\textit{effective group id} e gli eventuali \textit{supplementary group id}
 137 del processo.
 138
 139 Per una spiegazione dettagliata degli identificatori associati ai processi si
 140 veda \secref{sec:prochand_perms}; normalmente, a parte quanto vedremo in
 141 \secref{sec:filedir_suid_sgid}, l'\textit{effective user id} e
 142 l'\textit{effective group id} corrispondono a uid e gid dell'utente che ha
 143 lanciato il processo, mentre i \textit{supplementary group id} sono quelli dei
 144 gruppi cui l'utente appartiene.
 145
 146 % Quando un processo cerca l'accesso al file esso controlla i propri uid e gid
 147 % confrontandoli con quelli del file e se l'operazione richiesta è compatibile
 148 % con i permessi associati al file essa viene eseguita, altrimenti viene
 149 % bloccata ed è restituito un errore di \texttt{EPERM}. Questo procedimento non
 150 % viene eseguito per l'amministratore di sistema (il cui uid è zero) il quale
 151 % a
 152 % pertanto accesso senza restrizione a qualunque file del sistema.
 153
 154 % In realtà il procedimento è più complesso di quanto descritto in maniera
 155 % elementare qui; inoltre ad un processo sono associati diversi identificatori,
 156 % torneremo su questo in maggiori dettagli in seguito in
 157 % \secref{sec:proc_perms}.
 158
 159 I passi attraverso i quali viene stabilito se il processo possiede il diritto
 160 di accesso sono i seguenti:
 161 \begin{itemize}
 162 \item Se l'\textit{effective user id} del processo è zero (corrispondente
 163   all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
 164   controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
 165   tutti i file.
 166 \item Se l'\textit{effective user id} del processo è uguale all'uid del
 167   proprietario del file (nel qual caso si dice che il processo è proprietario
 168   del file) allora:
 169   \begin{itemize}
 170   \item se il relativo\footnote{per relativo si intende il bit di user-read se
 171       il processo, vuole accedere in scrittura, quello di user-write per
 172       l'accesso in scrittura, etc.} bit dei permessi d'accesso dell'utente è
 173     settato, l'accesso è consentito
 174   \item altrimenti l'accesso è negato
 175   \end{itemize}
 176 \item Se l'\textit{effective group id} del processo o uno dei
 177   \textit{supplementary group id} dei processi corrispondono al gid del file
 178   allora:
 179   \begin{itemize}
 180   \item se il bit dei permessi d'accesso del gruppo è settato, l'accesso è
 181     consentito, altrimenti l'accesso è negato
 182   \end{itemize}
 183 \item se il bit dei permessi d'accesso per tutti gli altri è settato,
 184   l'accesso è consentito,  altrimenti l'accesso è negato.
 185 \end{itemize}
 186
 187 Si tenga presente che questi passi vengono eseguiti esattamente in
 188 quest'ordine. Questo vuol dire che se un processo è il proprietario di un file
 189 l'accesso è consentito o negato solo sulla base dei permessi per l'utente; i
 190 permessi per il gruppo non vengono neanche controllati; lo stesso vale se il
 191 processo appartiene ad un gruppo appropriato, in questo caso i permessi per
 192 tutti gli altri non vengono controllati.
 193
 194 \subsection{I flag \texttt{suid} e \texttt{sgid}}
 195 \label{sec:filedir_suid_sgid}
 196
 197 Quandi si lancia un programma in genere l'\textit{effective user id} e
 198 l'\textit{effective group id} sono settati rispettivamente all'uid e al gid
 199 dell'utente che ha lanciato il programma.
 200
 201
 202 Ma nei dodici bit del campo \var{st\_mode} relativi ai permessi esiste un bit
 203 speciale, il \textit{set-user-ID bit} o suid, che se settato fa si che quando
 204 un programma viene lanciato invece di avere assegnato come \textit{effective
 205   user id} l'uid di chi lo lancia, assume quello del proprietario del file.
 206 Analogamente il \textit{set-group-ID bit} o sgid settato per un file ha lo
 207 stesso effetto sull'\textit{effective group id}.
 208
 209 Questa caratteristica viene usata per permettere agli utenti normali di usare
 210 programmi che abbisognano di privilegi speciali; l'esempio classico è il
 211 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
 212 che può essere scritto solo dall'amministratore. Per questo il comando
 213 \cmd{passwd} appartiene a root e ha il suid bit settato per cui quando viene
 214 lanciato da un utente normale ha comunque i privilegi di root.
 215
 216 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
 217 normalmente un utente comporta vari rischi, e questo tipo di programmi devono
 218 essere scritti accuratamente (torneremo sull'argomento in
 219 \secref{sec:prochand_perms}).
 220
 221 I due bit suid e sgid possono essere controllati all'interno di \var{st\_mode}
 222 con l'uso delle due costanti \macro{S\_ISUID} e \macro{S\_ISGID}, definite in
 223 \tabref{tab:filedir_file_mode_flags}.
 224
 225
 226 \subsection{Il flag \texttt{sticky}}
 227 \label{sec:filedir_sticky}
 228
 229 L'ultimo
 230
 231 \subsection{La titolarità di nuovi files e directory}
 232 \label{sec:filedir_ownership}
 233
 234
 235 \subsection{La funzione \texttt{access}}
 236 \label{sec:filedir_access}
 237
 238
 239 \subsection{La funzione \texttt{umask}}
 240 \label{sec:filedir_umask}
 241
 242
 243 \subsection{Le funzioni \texttt{chmod} e \texttt{fchmod}}
 244 \label{sec:filedir_chmod}
 245
 246 \subsection{Le funzioni \texttt{chown}, \texttt{fchown} e \texttt{lchown}}
 247 \label{sec:filedir_chown}
 248
 249
 250
 251
 252 %La struttura fondamentale che contiene i dati essenziali relativi ai file è il
 253 %cosiddetto \textit{inode}; questo conterrà informazioni come il
 254 %tipo di file (file di dispositivo, directory, file di dati, per un elenco
 255 %completo vedi \ntab), i permessi (vedi \secref{sec:file_perms}), le date (vedi
 256 %\secref{sec:file_times}).
 257
 258
 259
 260 \section{La manipolazione delle caratteristiche dei files}
 261 \label{sec:filedir_infos}
 262
 263 Come spiegato in \secref{sec:fileintr_filesystem} tutte le informazioni
 264 generali relative alle caratteristiche di ciascun file sono mantenute
 265 nell'inode. Vedremo in questa sezione come sia possibile accedervi usando la
 266 funzione \texttt{stat} ed esamineremo alcune funzioni utilizzabili per
 267 manipolare una parte di questa informazione. Tutto quello che invece riguarda
 268 il meccanismo di controllo di accesso ad i file e le relative funzioni di
 269 manipolazione sarà invece esaminanto in \secref{sec:filedir_access_control}.
 270
 271
 272 \subsection{Le funzioni \texttt{stat}, \texttt{fstat} e \texttt{lstat}}
 273 \label{sec:filedir_stat}
 274
 275 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
 276 delle funzioni \func{stat}, che è la funzione che il comando \cmd{ls} usa
 277 per poter stampare tutti i dati dei files. I prototipi di queste funzioni sono
 278 i seguenti:
 279 \begin{functions}
 280   \headdecl{sys/types.h}
 281   \headdecl{sys/stat.h}
 282   \headdecl{unistd.h}
 283
 284   \funcdecl{int stat(const char *file\_name, struct stat *buf)} Legge le
 285   informazione del file specificato da \var{file\_name} e le inserisce in
 286   \var{buf}.
 287
 288   \funcdecl{int lstat(const char *file\_name, struct stat *buf)} Identica a
 289   \func{stat} eccetto che se il \var{file\_name} è un link simbolico vengono
 290   lette le informazioni relativa ad esso e non al file a cui fa riferimento.
 291
 292   \funcdecl{int fstat(int filedes, struct stat *buf)} Identica a \func{stat}
 293   eccetto che si usa con un file aperto, specificato tramite il suo file
 294   descriptor \var{filedes}.
 295
 296   Le funzioni restituiscono zero in caso di successo e -1 per un errore, in
 297   caso di errore \texttt{errno} viene settato ai valori:
 298   \begin{errlist}
 299   \item \texttt{EACCESS} non c'è il permesso di accedere al file.
 300   \item \texttt{ENOTDIR} una componente del pathname non è una directory.
 301   \item \texttt{EMLOOP} ci sono troppi link simbolici nel pathname.
 302   \item \texttt{EFAULT} i puntatori usati sono fuori dallo spazio di indirizzi
 303     del processo.
 304   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
 305     completare l'operazione.
 306   \item \texttt{ENAMETOOLONG} il filename è troppo lungo.
 307   \end{errlist}
 308 \end{functions}
 309
 310 La struttura \texttt{stat} è definita nell'header \texttt{sys/stat.h} e in
 311 generale dipende dall'implementazione, la versione usata da Linux è mostrata
 312 in \nfig, così come riportata dalla man page (in realtà la definizione
 313 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
 314 riservati per estensioni come tempi più precisi, o per il padding dei campi).
 315
 316 \begin{figure}[!htb]
 317   \footnotesize
 318   \centering
 319   \begin{minipage}[c]{15cm}
 320     \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
 321 struct stat {
 322     dev_t         st_dev;      /* device */
 323     ino_t         st_ino;      /* inode */
 324     mode_t        st_mode;     /* protection */
 325     nlink_t       st_nlink;    /* number of hard links */
 326     uid_t         st_uid;      /* user ID of owner */
 327     gid_t         st_gid;      /* group ID of owner */
 328     dev_t         st_rdev;     /* device type (if inode device) */
 329     off_t         st_size;     /* total size, in bytes */
 330     unsigned long st_blksize;  /* blocksize for filesystem I/O */
 331     unsigned long st_blocks;   /* number of blocks allocated */
 332     time_t        st_atime;    /* time of last access */
 333     time_t        st_mtime;    /* time of last modification */
 334     time_t        st_ctime;    /* time of last change */
 335 };
 336     \end{lstlisting}
 337   \end{minipage}
 338   \normalsize
 339   \caption{La struttura \texttt{stat} per la lettura delle informazioni dei
 340     file}
 341   \label{fig:filedir_stat_struct}
 342 \end{figure}
 343
 344 Si noti come i vari membri della struttura siano specificati come tipi nativi
 345 del sistema (di quelli definiti in \tabref{tab:xxx_sys_types}, e dichiarati in
 346 \texttt{sys/types.h}).
 347
 348
 349 \subsection{I tipi di file}
 350 \label{sec:filedir_file_types}
 351
 352 Come riportato in \tabref{tab:fileintr_file_types} in Linux oltre ai file e
 353 alle directory esistono vari altri oggetti che possono stare su un filesystem;
 354 il tipo di file è ritornato dalla \texttt{stat} nel campo \texttt{st\_mode}.
 355
 356 Dato che il valore numerico può variare a seconda delle implementazioni, lo
 357 standard POSIX definisce un insieme di macro per verificare il tipo di files,
 358 queste vengono usate anche da Linux che supporta pure le estensioni per link
 359 simbolici e socket definite da BSD, l'elenco completo di tutte le macro
 360 definite in GNU/Linux è riportato in \ntab:
 361 \begin{table}[htb]
 362   \centering
 363   \footnotesize
 364   \begin{tabular}[c]{|l|l|}
 365     \hline
 366     Macro & Tipo del file \\
 367     \hline
 368     \hline
 369     \macro{S\_ISREG(m)}  & file regolare \\
 370     \macro{S\_ISDIR(m)}  & directory \\
 371     \macro{S\_ISCHR(m)}  & device a caraetteri \\
 372     \macro{S\_ISBLK(m)}  & device a blocchi\\
 373     \macro{S\_ISFIFO(m)} & fifo \\
 374     \macro{S\_ISLNK(m)}  & link simbolico \\
 375     \macro{S\_ISSOCK(m)} & socket \\
 376     \hline
 377   \end{tabular}
 378   \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h})}
 379   \label{tab:filedir_file_type_macro}
 380 \end{table}
 381
 382 Oltre a queste macro è possibile usare direttamente il valore di
 383 \var{st\_mode} per ricavare il significato dei vari bit in esso memorizzati,
 384 per questo sempre in \texttt{sys/stat.h} sono definiti i flag riportati in
 385 \ntab:
 386 \begin{table}[htb]
 387   \centering
 388   \footnotesize
 389   \begin{tabular}[c]{|l|c|l|}
 390     \hline
 391     Flag & Valore & Significato \\
 392     \hline
 393     \hline
 394     \macro{S\_IFMT}   &  0170000 & bitmask per i bit del tipo di file \\
 395     \macro{S\_IFSOCK} &  0140000 & socket             \\
 396     \macro{S\_IFLNK}  &  0120000 & link simbolico     \\
 397     \macro{S\_IFREG}  &  0100000 & file regolare      \\
 398     \macro{S\_IFBLK}  &  0060000 & device a blocchi   \\
 399     \macro{S\_IFDIR}  &  0040000 & directory          \\
 400     \macro{S\_IFCHR}  &  0020000 & device a caratteri \\
 401     \macro{S\_IFIFO}  &  0010000 & fifo               \\
 402     \hline
 403     \macro{S\_ISUID}  &  0004000 & set UID bit   \\
 404     \macro{S\_ISGID}  &  0002000 & set GID bit   \\
 405     \macro{S\_ISVTX}  &  0001000 & sticky bit    \\
 406     \hline
 407     \macro{S\_IRWXU}  &  00700   & bitmask per i permessi del proprietario  \\
 408     \macro{S\_IRUSR}  &  00400   & il proprietario ha permesso di lettura   \\
 409     \macro{S\_IWUSR}  &  00200   & il proprietario ha permesso di scrittura \\
 410     \macro{S\_IXUSR}  &  00100   & il proprietario ha permesso di esecuzione\\
 411     \hline
 412     \macro{S\_IRWXG}  &  00070   & bitmask per i permessi del gruppo        \\
 413     \macro{S\_IRGRP}  &  00040   & il gruppo ha permesso di lettura         \\
 414     \macro{S\_IWGRP}  &  00020   & il gruppo ha permesso di scrittura       \\
 415     \macro{S\_IXGRP}  &  00010   & il gruppo ha permesso di esecuzione      \\
 416     \hline
 417     \macro{S\_IRWXO}  &  00007   & bitmask per i permessi di tutti gli altri\\
 418     \macro{S\_IROTH}  &  00004   & gli altri hanno permesso di lettura      \\
 419     \macro{S\_IWOTH}  &  00002   & gli altri hanno permesso di esecuzione   \\
 420     \macro{S\_IXOTH}  &  00001   & gli altri hanno permesso di esecuzione   \\
 421     \hline
 422   \end{tabular}
 423   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
 424     \var{st\_mode} (definite in \texttt{sys/stat.h})}
 425   \label{tab:filedir_file_mode_flags}
 426 \end{table}
 427
 428 Il primo valore definisce la maschera dei bit usati nei quali viene
 429 memorizzato il tipo di files, mentre gli altri possono essere usati per
 430 effettuare delle selezioni sul tipo di file voluto, combinando opportunamente
 431 i vari flag; ad esempio se si volesse controllare se un file è una directory o
 432 un file ordinario si potrebbe definire la condizione:
 433 \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
 434 #define IS_FILE_DIR(x) (((x) & S_IFMT) & (S_IFDIR | S_IFREG))
 435 \end{lstlisting}
 436 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
 437 poi si effettua il confronto con la combinazione di tipi scelta.
 438
 439 \subsection{La dimensione dei file}
 440 \label{sec:filedir_file_size}
 441
 442 Il membro \var{st\_size} contiene la dimensione del file in bytes (se il file
 443 è un file normale, nel caso di un link simbolico al dimensione è quella del
 444 pathname che contiene).
 445
 446 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
 447 bytes. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
 448 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
 449 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
 450 dimensione inferiore sarebbe inefficiente.
 451
 452 Si tenga conto che lunghezza del file riportata in \var{st\_size} non è detto
 453 che corrisponda all'occupazione dello spazio su disco per via della possibile
 454 esistenza dei cosiddetti \textsl{buchi} (detti normalmente \textit{holes}) che
 455 si formano tutte le volte che si va a scrivere su un file dopo aver eseguito
 456 una \func{seek} (vedi \secref{sec:fileunix_lseek}) oltre la sua conclusione
 457 corrente.
 458
 459 In tal caso si avranno differenti risultati a seconda del modi in cui si
 460 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
 461 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
 462 legge dal file (ad esempio usando \cmd{wc -c}), dato che in tal caso per le
 463 parti non scritte vengono restituiti degli zeri, si avrà lo stesso risultato
 464 di \cmd{ls}.
 465
 466 Se è sempre possibile allargare un file scrivendoci sopra od usando la
 467 funzione \func{seek} per spostarsi oltre la sua fine. Esistono però anche casi
 468 in cui si può avere bisogno di effettuare un troncamento scartando i dati al
 469 di là della dimensione scelta come nuova fine del file.
 470
 471 Un file può essere troncato a zero aprendolo con il flag \macro{O\_TRUNC}, ma
 472 questo è un caso particolare; per qualunque altra dimensione si possono usare
 473 le due funzioni:
 474 \begin{functions}
 475   \headdecl{unistd.h} \funcdecl{int truncate(const char *file\_name, off\_t
 476     length)} Fa si che la dimensione del file \var{file\_name} sia troncata ad
 477     un valore massimo specificato da \var{lenght}.
 478
 479   \funcdecl{int ftruncate(int fd, off\_t length))} Identica a \func{truncate}
 480   eccetto che si usa con un file aperto, specificato tramite il suo file
 481   descriptor \var{fd},
 482
 483   Le funzioni restituiscono zero in caso di successo e -1 per un errore, in
 484   caso di errore \texttt{errno} viene settato ai valori:
 485   \begin{errlist}
 486   \item \texttt{EACCESS} non c'è il permesso di accedere al file.
 487   \item \texttt{ENOTDIR} una componente del pathname non è una directory.
 488   \item \texttt{EMLOOP} ci sono troppi link simbolici nel pathname.
 489   \item \texttt{EFAULT} i puntatori usati sono fuori dallo spazio di indirizzi
 490     del processo.
 491   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
 492     completare l'operazione.
 493   \item \texttt{ENOENT} il file non esiste.
 494   \item \texttt{ENAMETOOLONG} il filename è troppo lungo.
 495   \end{errlist}
 496 \end{functions}
 497
 498 Se il file è più lungo della lunghezza specificata i dati in eccesso saranno
 499 perduti; il comportamento in caso di lunghezza inferiore non è specificato e
 500 dipende dall'implementazione: il file può essere lasciato invariato o esteso
 501 fino alla lunghezza scelta; in quest'ultimo caso lo spazio viene riempito con
 502 zeri (e in genere si ha la creazione di un hole nel file).
 503
 504
 505 \subsection{I tempi dei file}
 506 \label{sec:filedir_file_times}
 507
 508 Il sistema mantiene per ciascun file tre tempi. Questi sono registrati
 509 nell'inode insieme agli altri attibuti del file e possono essere letti tramite
 510 la funzione \func{stat}, che li restituisce attraverso tre campi della
 511 struttura in \figref{fig:filedir_stat_struct}. Il significato di detti tempi e
 512 dei relativi campi è riportato nello schema in \ntab:
 513
 514 \begin{table}[htb]
 515   \centering
 516   \begin{tabular}[c]{|c|l|l|c|}
 517     \hline
 518     Membro & Significato & Funzione&opzione \\
 519     \hline
 520     \hline
 521     \var{st\_atime}& ultimo accesso ai dati del file &\func{read}& \cmd{-u}\\
 522     \var{st\_mtime}& ultima modifica ai dati del file &\func{write}& default\\
 523     \var{st\_ctime}& ultima modifica ai dati dell'inode&\func{chmod},
 524     \func{utime} & \cmd{-c} \\
 525     \hline
 526   \end{tabular}
 527   \caption{I tre tempi associati a ciascun file}
 528   \label{tab:filedir_file_times}
 529 \end{table}
 530
 531 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
 532 modifica (il \textit{modification time} \var{st\_mtime}) e il tempo di
 533 cambiamento di stato (il \textit{chage time} \var{st\_ctime}). Il primo
 534 infatti fa riferimento ad una modifica del contenuto di un file, mentre il
 535 secondo ad una modifica dell'inode; siccome esistono molte operazioni (come la
 536 funzione \func{link} e molte altre che vedremo in seguito) che modificano solo
 537 le informazioni contenute nell'inode senza toccare il file, diventa necessario
 538 l'utilizzo di un altro tempo.
 539
 540 Il sistema non tiene conto dell'ultimo accesso all'inode, pertanto funzioni
 541 come \func{access} o \func{stat} non hanno alcuna influenza sui tre tempi. Il
 542 tempo di ultimo accesso viene di solito usato per cancellare i file che non
 543 servono più dopo un certo lasso di tempo (ad esempio \cmd{leafnode} cancella i
 544 vecchi articoli sulla base di questo tempo).
 545
 546 Il tempo di ultima modifica invece viene usato da \cmd{make} per decidere
 547 quali file necessitano di essere ricompilati o (talvolta insieme anche al
 548 tempo di cambiamento di stato) per decidere quali file devono essere
 549 archiviati per il backup. Il comando \cmd{ls} (quando usato con le opzioni
 550 \cmd{-l} o \cmd{-t}) mostra i tempi dei file secondo lo schema riportato
 551 nell'ultima colonna di \curtab.
 552
 553 L'effetto delle varie funzioni di manipolazione dei file sui tempi è
 554 illustrato in \ntab. Si sono riportati gli effetti sia per il file a cui si fa
 555 riferimento, sia per la directory che lo contiene; questi ultimi possono
 556 essere capiti se si tiene conto di quanto già detto, e cioè che anche le
 557 directory sono files, che il sistema tratta in maniera del tutto analoga agli
 558 altri.
 559
 560 Per questo motivo tutte le volte che compiremo una operazione su un file che
 561 comporta una modifica della sua directory entry, andremo anche a scrivere
 562 sulla directory che lo contiene cambiandone il tempo di modifica. Un esempio
 563 di questo può essere la cancellazione di un file, mentre leggere o scrivere o
 564 cambiarne i permessi ha effetti solo sui tempi del file.
 565
 566 \begin{table}[htb]
 567   \centering
 568   \footnotesize
 569   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
 570     \hline
 571     \multicolumn{1}{|c|}{Funzione}
 572     &\multicolumn{3}{p{2cm}}{File o directory di riferimento}
 573     &\multicolumn{3}{p{2cm}}{Directory genitrice del riferimento}
 574     &\multicolumn{1}{|c|}{Note} \\
 575     \cline{2-7}
 576     &  \textsl{(a)} &  \textsl{(m)}&  \textsl{(c)}
 577     &  \textsl{(a)} &  \textsl{(m)}&  \textsl{(c)}& \\
 578     \hline
 579     \hline
 580     \func{chmod}, \func{fchmod}
 581     &         &         &$\bullet$&         &         &         & \\
 582     \func{chown}, \func{fchown}
 583     &         &         &$\bullet$&         &         &         & \\
 584     \func{creat}
 585     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$&  con
 586     \macro{O\_CREATE} \\    \func{creat}
 587     &         &$\bullet$&$\bullet$&         &$\bullet$&$\bullet$&
 588     con \macro{O\_TRUNC} \\    \func{exec}
 589     &$\bullet$&         &         &         &         &         & \\
 590     \func{lchown}
 591     &         &         &$\bullet$&         &         &         & \\
 592     \func{link}
 593     &         &         &$\bullet$&         &$\bullet$&$\bullet$& \\
 594     \func{mkdir}
 595     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$& \\
 596     \func{mkfifo}
 597     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$& \\
 598     \func{open}
 599     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$& con
 600     \macro{O\_CREATE} \\    \func{open}
 601     &         &$\bullet$&$\bullet$&         &         &         & con
 602     \macro{O\_TRUNC}  \\    \func{pipe}
 603     &$\bullet$&$\bullet$&$\bullet$&         &         &         & \\
 604     \func{read}
 605     &$\bullet$&         &         &         &         &         & \\
 606     \func{remove}
 607     &         &         &$\bullet$&         &$\bullet$&$\bullet$& using
 608     \func{unlink}\\    \func{remove}
 609     &         &         &         &         &$\bullet$&$\bullet$& using
 610     \func{rmdir}\\ \func{rename}
 611     &         &         &$\bullet$&         &$\bullet$&$\bullet$& per entrambi
 612     gli argomenti\\ \func{rmdir}
 613     &         &         &         &         &$\bullet$&$\bullet$& \\
 614     \func{truncate}, \func{ftruncate}
 615     &         &$\bullet$&$\bullet$&         &         &         & \\
 616     \func{unlink}
 617     &         &         &$\bullet$&         &$\bullet$&$\bullet$& \\
 618     \func{utime}
 619     &$\bullet$&$\bullet$&$\bullet$&         &         &         & \\
 620     \func{write}
 621     &         &$\bullet$&$\bullet$&         &         &         & \\
 622     \hline
 623   \end{tabular}
 624   \caption{Effetti delle varie funzioni su tempi di ultimo accesso
 625     \textsl{(a)}, ultima modifica \textsl{(m)}  e ultimo cambiamento
 626     \textsl{(c)}}
 627   \label{tab:filedir_times_effects}
 628 \end{table}
 629
 630 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
 631 creazione del file, usato da molti altri sistemi operativi, che in unix non
 632 esiste.
 633
 634
 635 \subsection{La funzione \texttt{utime}}
 636 \label{sec:filedir_utime}
 637
 638 I tempi di ultimo accesso e modifica possono essere cambiati usando la
 639 funzione \func{utime}, il cui prototipo è:
 640
 641 \begin{prototype}{utime.h}
 642 {int utime(const char * filename, struct utimbuf *times)}
 643
 644 Cambia i tempi di ultimo accesso e modifica dell'inode specificato da
 645 \var{filename} secondo i campi \var{actime} e \var{modtime} di \var{times}. Se
 646 questa è \macro{NULL} allora viene usato il tempo corrente.
 647
 648 La funzione restituisce zero in caso di successo e -1 in caso di errore, nel
 649 qual caso \var{errno} è settata opportunamente.
 650 \begin{errlist}
 651 \item \texttt{EACCESS} non si ha il permesso di scrittura sul file.
 652 \item \texttt{ENOENT} \var{filename} non esiste.
 653 \end{errlist}
 654 \end{prototype}
 655
 656 La struttura \var{utimebuf} usata da \func{utime} è definita come:
 657 \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
 658 struct utimbuf {
 659         time_t actime;  /* access time */
 660         time_t modtime; /* modification time */
 661 };
 662 \end{lstlisting}
 663
 664 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
 665 cosa è l'argomento \var{times}; se è \textit{NULL} la funzione setta il tempo
 666 corrente ed è sufficiente avere accesso in scrittura al file; se invece si è
 667 specificato un valore la funzione avrà successo solo se si è proprietari del
 668 file (o si hanno i privilegi di amministratore).
 669
 670 Si tenga presente che non è comunque possibile specificare il tempo di
 671 cambiamento di stato del file, che viene comunque cambiato dal kernel tutte le
 672 volte che si modifica l'inode (quindi anche alla chiamata di \func{utime}).
 673 Questo serve anche come misura di sicurezza per evitare che si possa
 674 modificare un file nascondendo completamente le proprie tracce.  In realtà la
 675 cosa resta possibile, se si è in grado di accedere al device, scrivendo
 676 direttamente sul disco senza passare attraverso il filesystem, ma ovviamente è
 677 molto più complicato da realizzare.
 678
 679
 680
 681
 682
 683
 684 \section{La manipolazione di file e directory}
 685
 686 Come già accennato in \secref{sec:fileintr_filesystem} in un sistema unix-like
 687 i file hanno delle caratteristiche specifiche dipendenti dall'architettura del
 688 sistema, esamineremo qui allora le funzioni usate per la creazione di link
 689 simbolici e diretti  e per la gestione delle directory, approfondendo quanto
 690 già accennato in precedenza.
 691
 692
 693 \subsection{Le funzioni \texttt{link} e \texttt{unlink}}
 694 \label{sec:fileintr_link}
 695
 696 Una delle caratteristiche comuni a vari sistemi operativi è quella di poter
 697 creare dei nomi fittizi (alias o collegamenti) per potersi riferire allo
 698 stesso file accedendovi da directory diverse. Questo è possibile anche in
 699 ambiente unix, dove tali collegamenti sono usualmente chiamati \textit{link},
 700 ma data la struttura del sistema ci sono due metodi sostanzialmente diversi
 701 per fare questa operazione.
 702
 703 Come spiegato in \secref{sec:fileintr_architecture} l'accesso al contenuto di
 704 un file su disco avviene attraverso il suo inode, e il nome che si trova in
 705 una directory è solo una etichetta associata ad un puntatore a detto inode.
 706 Questo significa che la realizzazione di un link è immediata in quanto uno
 707 stesso file può avere tanti nomi diversi allo stesso tempo, dati da
 708 altrettante diverse associazioni allo stesso inode; si noti poi che nessuno di
 709 questi nomi viene ad assumere una particolare preferenza rispetto agli altri.
 710
 711 Per aggiungere un nome ad un inode si utilizza la funzione \texttt{link}; si
 712 suole chiamare questo tipo di associazione un collegamento diretto (o
 713 \textit{hard link}).  Il prototipo della funzione e le sue caratteristiche
 714 principali, come risultano dalla man page, sono le seguenti:
 715 \begin{prototype}{unistd.h}
 716 {int link(const char * oldpath, const char * newpath)}
 717   Crea un nuovo collegamento diretto al file indicato da \texttt{oldpath}
 718   dandogli nome \texttt{newpath}.
 719
 720   La funzione restituisce zero in caso di successo e -1 in caso di errore. La
 721   variabile \texttt{errno} viene settata opportunamente, i principali codici
 722   di errore sono:
 723   \begin{errlist}
 724   \item \texttt{EXDEV} \texttt{oldpath} e \texttt{newpath} non sono sullo
 725     stesso filesystem.
 726   \item \texttt{EPERM} il filesystem che contiene \texttt{oldpath} e
 727     \texttt{newpath} non supporta i link diretti o è una directory.
 728   \item \texttt{EEXIST} un file (o una directory) con quel nome esiste di
 729     già.
 730   \item \texttt{EMLINK} ci sono troppi link al file \texttt{oldpath} (il
 731     numero massimo è specificato dalla variabile \texttt{LINK\_MAX}, vedi
 732     \secref{sec:xxx_limits}).
 733   \end{errlist}
 734
 735 \end{prototype}
 736
 737 La creazione di un nuovo collegamento diretto non copia il contenuto del file,
 738 ma si limita ad aumentare di uno il numero di referenze al file (come si può
 739 controllare con il campo \var{st\_nlink} di \var{stat}) aggiungendo il nuovo
 740 nome ai precedenti. Si noti che uno stesso file può essere così richiamato in
 741 diverse directory.
 742
 743 Per quanto dicevamo in \secref{sec:fileintr_filesystem} la creazione del
 744 collegamento diretto è possibile solo se entrambi i pathname sono nello stesso
 745 filesystem; inoltre il filesystem deve supportare i collegamenti diretti (non è
 746 il caso ad esempio del filesystem \texttt{vfat} di windows).
 747
 748 La funzione opera sui file ordinari, come sugli altri oggetti del filesystem,
 749 in alcuni filesystem solo l'amministratore è in grado di creare un
 750 collegamento diretto ad un'altra directory, questo lo si fa perché in questo
 751 caso è possibile creare dei circoli nel filesystem (vedi
 752 \secref{sec:fileintr_symlink}) che molti programmi non sono in grado di
 753 gestire e la cui rimozione diventa estremamente complicata (in genere occorre
 754 far girare il programma \texttt{fsck} per riparare il filesystem); data la sua
 755 pericolosità in generale nei filesystem usati in Linux questa caratteristica è
 756 stata disabilitata, e la funzione restituisce l'errore \texttt{EPERM}.
 757
 758 La rimozione di un file (o più precisamente della voce che lo referenzia) si
 759 effettua con la funzione \texttt{unlink}; il suo prototipo è il seguente:
 760
 761 \begin{prototype}{unistd.h}{int unlink(const char * pathname)}
 762   Cancella il nome specificato dal pathname nella relativa directory e
 763   decrementa il numero di riferimenti nel relativo inode. Nel caso di link
 764   simbolico cancella il link simbolico; nel caso di socket, fifo o file di
 765   dispositivo rimuove il nome, ma come per i file i processi che hanno aperto
 766   uno di questi oggetti possono continuare ad utilizzarlo.
 767
 768   La funzione restituisce zero in caso di successo e -1 per un errore, nel
 769   qual caso il file non viene toccato. La variabile \texttt{errno} viene
 770   settata secondo i seguenti codici di errore:
 771   \begin{errlist}
 772   \item \texttt{EISDIR} \var{pathname} si riferisce ad una directory
 773     (valore specifico ritornato da linux che non consente l'uso di
 774     \texttt{unlink} con le directory, e non conforme allo standard POSIX, che
 775     prescrive invece l'uso di \texttt{EPERM} in caso l'operazione non sia
 776     consnetita o il processo non abbia privilegi sufficienti).
 777   \item \texttt{EROFS} \var{pathname} è su un filesystem montato in sola
 778   lettura.
 779   \item \texttt{EISDIR} \var{pathname} fa riferimento a una directory.
 780   \end{errlist}
 781 \end{prototype}
 782
 783 Per cancellare una voce in una directory è necessario avere il permesso di
 784 scrittura su di essa (dato che si va a rimuovere una voce dal suo contenuto) e
 785 il diritto di esecuzione sulla directory che la contiene (torneremo in
 786 dettaglio sui permessi e gli attributi fra poco), se inoltre lo
 787 \textit{sticky} bit è settato occorrerà anche essere proprietari del file o
 788 proprietari della directory (o root, per cui nessuna delle restrizioni è
 789 applicata).
 790
 791 Una delle caratteristiche di queste funzioni è che la creazione/rimozione
 792 della nome dalla directory e l'incremento/decremento del numero di riferimenti
 793 nell'inode deve essere una operazione atomica (cioè non interrompibile da
 794 altri) processi, per questo entrambe queste funzioni sono realizzate tramite
 795 una singola system call.
 796
 797 Si ricordi infine che il file non viene eliminato dal disco fintanto che tutti
 798 i riferimenti ad esso sono stati cancellati, solo quando il \textit{link
 799   count} mantenuto nell'inode diventa zero lo spazio occupato viene rimosso. A
 800 questo però si aggiunge una altra condizione, e cioè che non ci siano processi
 801 che abbiano detto file aperto. Come accennato questa proprietà viene spesso
 802 usata per essere sicuri di non lasciare file temporanei su disco in caso di
 803 crash dei programmi; la tecnica è quella di aprire il file e chiamare
 804 \texttt{unlink} subito dopo.
 805
 806 \subsection{Le funzioni \texttt{remove} e \texttt{rename}}
 807 \label{sec:fileintr_remove}
 808
 809 Al contrario di quanto avviene con altri unix in Linux non è possibile usare
 810 \texttt{unlink} sulle directory, per cancellare una directory si può usare la
 811 funzione \texttt{rmdir} (vedi \secref{sec:filedir_dir_creat_rem}), oppure la
 812 funzione \texttt{remove}. Questa è la funzione prevista dallo standard ANSI C
 813 per cancellare un file o una directory (e funziona anche per i sistemi che non
 814 supportano i link diretti), che per i file è identica alla \texttt{unlink} e
 815 per le directory è identica alla \texttt{rmdir}:
 816
 817 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
 818   Cancella un nome dal filesystem. Usa \texttt{unlink} per i file e
 819   \texttt{rmdir} per le directory.
 820
 821   La funzione restituisce zero in caso di successo e -1 per un errore, nel
 822   qual caso il file non viene toccato. Per i codici di errori vedi quanto
 823   riportato nella descrizione di \texttt{unlink} e \texttt{rmdir}.
 824 \end{prototype}
 825
 826 Per cambiare nome ad un file si usa invece la funzione \texttt{rename}, il
 827 vantaggio nell'uso di questa funzione al posto della chiamata successiva di
 828 \texttt{unlink} e \texttt{link} è che l'operazione è eseguita atomicamente, in
 829 questo modo non c'è la possibilità che un processo che cerchi di accedere al
 830 nuovo nome dopo che il vecchio è stato cambiato lo trovi mancante.
 831
 832 \begin{prototype}{stdio.h}
 833 {int rename(const char *oldpath, const char *newpath)}
 834   Rinomina un file, spostandolo fra directory diverse quando richiesto.
 835
 836   La funzione restituisce zero in caso di successo e -1 per un errore, nel
 837   qual caso il file non viene toccato. La variabile \texttt{errno} viene
 838   settata secondo i seguenti codici di errore:
 839   \begin{errlist}
 840   \item \texttt{EISDIR} \texttt{newpath} è una directory già esistente mentre
 841     \texttt{oldpath} non è una directory.
 842   \item \texttt{EXDEV} \texttt{oldpath} e \texttt{newpath} non sono sullo
 843     stesso filesystem.
 844   \item \texttt{ENOTEMPTY} \texttt{newpath} è una directory già esistente e
 845     non vuota.
 846   \item \texttt{EBUSY} o \texttt{oldpath} o \texttt{newpath} sono in uso da
 847     parte di qualche processo (come directory di lavoro o come root) o del
 848     sistema (come mount point).
 849   \item \texttt{EINVAL} \texttt{newpath} contiene un prefisso di
 850     \texttt{oldpath} o più in generale si è cercato di creare una directory
 851     come sottodirectory di se stessa.
 852   \item \texttt{EMLINK} \texttt{oldpath} ha già il massimo numero di link
 853     consentiti o è una directory e la directory che contiene \texttt{newpath}
 854     ha già il massimo numero di link.
 855   \item \texttt{ENOTDIR} Uno dei componenti dei pathname non è una directory
 856     o\texttt{oldpath} è una directory e \texttt{newpath} esiste e non è una
 857     directory.
 858   \item \texttt{EFAULT} o \texttt{oldpath} o \texttt{newpath} è fuori dello
 859     spazio di indirizzi del processo.
 860   \item \texttt{EACCESS} Non c'è il permesso di scrittura per la directory in
 861     cui si vuole creare il nuovo link o una delle directory del pathname non
 862     consente la ricerca (permesso di esecuzione).
 863   \item \texttt{EPERM} le directory contenenti \texttt{oldpath} o
 864     \texttt{newpath} hanno lo sticky bit attivo e i permessi del processo non
 865     consentono rispettivamente la cancellazione e la creazione del file, o il
 866     filesystem non supporta i link.
 867   \item \texttt{ENAMETOOLONG} uno dei pathname è troppo lungo.
 868   \item \texttt{ENOENT} Uno dei componenti del pathname non esiste o è un link
 869     simbolico spezzato.
 870   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
 871     completare l'operazione.
 872   \item \texttt{EROFS} I file sono su un filesystem montato in sola lettura.
 873   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione del
 874     pathname.
 875   \item \texttt{ENOSPC} Il device di destinazione non ha più spazio per la
 876     nuova voce.
 877   \end{errlist}
 878 \end{prototype}
 879
 880 \subsection{I link simbolici}
 881 \label{sec:fileintr_symlink}
 882
 883 Siccome la funzione \texttt{link} crea riferimenti agli inodes, essa può
 884 funzionare soltanto per file che risiedono sullo stesso filesystem, dato che
 885 in questo caso è garantita l'unicità dell'inode, e solo per un filesystem di
 886 tipo unix.  Inoltre in Linux non è consentito eseguire un link diretto ad una
 887 directory.
 888
 889 Per ovviare a queste limitazioni i sistemi unix supportano un'altra forma di
 890 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
 891 come avviene in altri sistemi operativi, dei file che contengono il
 892 semplicemente il riferimento ad un altro file (o directory). In questo modo è
 893 possibile effettuare link anche attraverso filesystem diversi e a directory, e
 894 pure a file che non esistono ancora.
 895
 896 Il sistema funziona in quanto i link simbolici sono contrassegnati come tali
 897 al kernel (analogamente a quanto avviene per le directory) per cui la chiamata
 898 ad una \texttt{open} o una \texttt{stat} su un link simbolico comporta la
 899 lettura del contenuto del medesimo e l'applicazione della funzione al file
 900 specificato da quest'ultimo. Invece altre funzioni come quelle per cancellare
 901 o rinominare i file operano direttamente sul link simbolico (per l'elenco vedi
 902 \ntab). Inoltre esistono funzioni apposite, come la \texttt{readlink} e la
 903 \texttt{lstat} per accedere alle informazioni del link invece che a quelle del
 904 file a cui esso fa riferimento.
 905
 906 Le funzioni per operare sui link simbolici sono le seguenti, esse sono tutte
 907 dichiarate nell'header file \texttt{unistd.h}.
 908
 909 \begin{prototype}{unistd.h}
 910 {int symlink(const char * oldname, const char * newname)}
 911   Crea un nuovo link simbolico al file indicato da \texttt{oldname} dandogli
 912   nome \texttt{newname}.
 913
 914   La funzione restituisce zero in caso di successo e -1 per un errore, in caso
 915   di errore. La variabile \texttt{errno} viene settata secondo i codici di
 916   errore standard di accesso ai files (trattati in dettaglio in
 917   \secref{sec:filedir_access_control}) ai quali si aggiungono i seguenti:
 918   \begin{errlist}
 919   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di
 920     già.
 921   \item \texttt{EROFS} La directory su cui si vuole inserire il nuovo link è
 922     su un filesystem montato readonly.
 923   \item \texttt{ENOSPC} La directory o il filesystem in cui si vuole creare il
 924     link è piena e non c'è ulteriore spazio disponibile.
 925   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione di
 926     \texttt{oldname} o di \texttt{newname}.
 927   \end{errlist}
 928 \end{prototype}
 929
 930 Dato che la funzione \texttt{open} segue i link simbolici, è necessaria usare
 931 un'altra funzione quando si vuole leggere il contenuto di un link simbolico,
 932 questa funzione è la:
 933
 934 \begin{prototype}{unistd.h}
 935 {int readlink(const char * path, char * buff, size\_t size)}
 936   Legge il contenuto del link simbolico indicato da \texttt{path} nel buffer
 937   \texttt{buff} di dimensione \texttt{size}. Non chiude la stringa con un
 938   carattere nullo e la tronca a \texttt{size} nel caso il buffer sia troppo
 939   piccolo per contenerla.
 940
 941   La funzione restituisce il numero di caratteri letti dentro \texttt{buff} o
 942   -1 per un errore, in caso di errore. La variabile \texttt{errno} viene
 943   settata secondo i codici di errore:
 944   \begin{errlist}
 945   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di
 946     già.
 947   \item \texttt{EROFS} La directory su cui si vuole inserire il nuovo link è
 948     su un filesystem montato readonly.
 949   \item \texttt{ENOSPC} La directory o il filesystem in cui si vuole creare il
 950     link è piena e non c'è ulteriore spazio disponibile.
 951   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione di
 952     \texttt{oldname} o di \texttt{newname}.
 953   \end{errlist}
 954 \end{prototype}
 955
 956 In \ntab\ si è riportato un elenco dei comportamenti delle varie funzioni che
 957 operano sui file rispetto ai link simbolici; specificando quali seguono il
 958 link simbolico e quali possono operare direttamente sul suo contenuto.
 959 \begin{table}[htb]
 960   \centering
 961   \footnotesize
 962   \begin{tabular}[c]{|l|c|c|}
 963     \hline
 964     Funzione & Segue il link & Non segue il link \\
 965     \hline
 966     \hline
 967     \func{access}   & $\bullet$ &           \\
 968     \func{chdir}    & $\bullet$ &           \\
 969     \func{chmod}    & $\bullet$ &           \\
 970     \func{chown}    &           & $\bullet$ \\
 971     \func{creat}    & $\bullet$ &           \\
 972     \func{exec}     & $\bullet$ &           \\
 973     \func{lchown}   & $\bullet$ & $\bullet$ \\
 974     \func{link}     &           &           \\
 975     \func{lstat}    &           & $\bullet$ \\
 976     \func{mkdir}    & $\bullet$ &           \\
 977     \func{mkfifo}   & $\bullet$ &           \\
 978     \func{mknod}    & $\bullet$ &           \\
 979     \func{open}     & $\bullet$ &           \\
 980     \func{opendir}  & $\bullet$ &           \\
 981     \func{pathconf} & $\bullet$ &           \\
 982     \func{readlink} &           & $\bullet$ \\
 983     \func{remove}   &           & $\bullet$ \\
 984     \func{rename}   &           & $\bullet$ \\
 985     \func{stat}     & $\bullet$ &           \\
 986     \func{truncate} & $\bullet$ &           \\
 987     \func{unlink}   &           & $\bullet$ \\
 988     \hline
 989   \end{tabular}
 990   \caption{Uso dei link simbolici da parte di alcune funzioni.}
 991   \label{tab:filedir_symb_effect}
 992 \end{table}
 993 si noti che non si è specificato il comportamento delle funzioni che operano
 994 con i file descriptor, in quanto la gestione del link simbolico viene in
 995 genere effttuata dalla funzione che restituisce il file descriptor
 996 (normalmente la \func{open}).
 997
 998 \begin{figure}[htb]
 999   \centering
1000   \includegraphics[width=5cm]{img/link_loop.eps}
1001   \caption{Esempio di loop nel filesystem creato con un link simbolico.}
1002   \label{fig:filedir_link_loop}
1003 \end{figure}
1004
1005 Un caso comune che si può avere con i link simbolici è la creazione dei
1006 cosiddetti \textit{loop}. La situazione è illustrata in \curfig, che riporta
1007 la struttura della directory \file{/boot}. Come si vede si è creato al suo
1008 interno un link simbolico che punta di nuovo a \file{/boot}\footnote{Questo
1009   tipo di loop è stato effettuato per poter permettere a \cmd{grub} (un
1010   bootloader estremamente avanzato in grado di accedere direttamente
1011   attraverso vari filesystem al file da lanciare come sistema operativo) di
1012   vedere i file in questa directory, che è montata su una partizione separata
1013   (e che grub vedrebbe come radice), con lo stesso path con cui verrebbero
1014   visti dal sistema operativo.}.
1015
1016 Questo può causare problemi per tutti quei programmi che effettuassero uno
1017 scan di una directory senza tener conto dei link simbolici, in quel caso
1018 infatti il loop nella directory
1019
1020 Un secondo punto da tenere presente è che un link simbolico può essere fatto
1021 anche ad un file che non esiste; ad esempio possiamo creare un file temporaneo
1022 nella nostra directory con un link del tipo:
1023 \begin{verbatim}
1024 $ln -s /tmp/tmp_file temporaneo
1025 \end{verbatim}%$
1026 ma anche se \file{/tmp/tmp\_file} non esiste. Aprendo in scrittura
1027 \file{temporaneo} questo verrà scritto; ma se cercassimo di accederlo in sola
1028 lettura (ad esempio con \cmd{cat}) otterremmo:
1029 \begin{verbatim}
1030 $ cat prova
1031 cat: prova: No such file or directory
1032 \end{verbatim}%$
1033 con un errore che sembra sbagliato, dato \cmd{ls} ci mostrerebbe l'esistenza
1034 di \file{temporaneo}.
1035
1036
1037 \subsection{Le funzioni \texttt{mkdir} e \texttt{rmdir}}
1038 \label{sec:filedir_dir_creat_rem}
1039
1040 Per creare una nuova directory si può usare la seguente funzione, omonima
1041 dell'analogo comando di shell \texttt{mkdir}; per accedere ai tipi usati
1042 programma deve includere il file \texttt{sys/types.h}.
1043
1044 \begin{prototype}{sys/stat.h}
1045 {int mkdir (const char * dirname, mode\_t mode)}
1046   Questa funzione crea una nuova directory vuota con il nome indicato da
1047   \texttt{dirname}, assegnandole i permessi indicati da \texttt{mode}. Il nome
1048   può essere indicato con il pathname assoluto o relativo.
1049
1050   La funzione restituisce zero in caso di successo e -1 per un errore, in caso
1051   di errore \texttt{errno} viene settata secondo i codici di errore standard
1052   di accesso ai files (trattati in dettaglio in
1053   \secref{sec:filedir_access_control}) ai quali si aggiungono i seguenti:
1054   \begin{errlist}
1055   \item \texttt{EACCESS}
1056     Non c'è il permesso di scrittura per la directory in cui si vuole inserire
1057     la nuova directory.
1058   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di già.
1059   \item \texttt{EMLINK} La directory in cui si vuole creare la nuova directory
1060     contiene troppi file. Sotto Linux questo normalmente non avviene perché il
1061     filesystem standard consente la creazione di un numero di file maggiore di
1062     quelli che possono essere contenuti nell'hard-disk, ma potendo avere a che
1063     fare anche con filesystem di altri sistemi questo errore può presentarsi.
1064   \item \texttt{ENOSPC} Non c'è abbastanza spazio sul file system per creare
1065     la nuova directory.
1066   \item \texttt{EROFS} La directory su cui si vuole inserire la nuova
1067     directory è su un filesystem montato readonly.
1068   \end{errlist}
1069 \end{prototype}
1070
1071
1072 \subsection{Accesso alle directory}
1073 \label{sec:filedir_dir_read}
1074
1075 Benché le directory siano oggetti del filesystem come tutti gli altri non ha
1076 ovviamente senso aprirle come fossero dei file di dati. Può però essere utile
1077 poterne leggere il contenuto ad esempio per fare la lista dei file che esse
1078 contengono o ricerche sui medesimi.
1079
1080 Per accedere al contenuto delle directory si usano i cosiddetti
1081 \textit{directory streams} (chiamati così per l'analogia con i file stream);
1082 la funzione \texttt{opendir} apre uno di questi stream e la funzione
1083 \texttt{readdir} legge il contenuto della directory, i cui elementi sono le
1084 \textit{directory entries} (da distinguersi da quelle della cache di cui
1085 parlavamo in \secref{sec:fileintr_vfs}) in una opportuna struttura
1086 \texttt{struct dirent}.
1087
1088
1089 \subsection{La directory di lavoro}
1090 \label{sec:filedir_work_dir}
1091
1092 A ciascun processo è associato ad una directory nel filesystem che è chiamata
1093 directory corrente o directory di lavoro (\textit{current working directory})
1094 che è quella a cui si fa riferimento quando un filename è espresso in forma
1095 relativa (relativa appunto a questa directory).
1096
1097 Quando un utente effettua il login questa directory viene settata alla
1098 cosiddetta \textit{home directory} del suo account, il comando \texttt{cd}
1099 della shell consente di cambiarla a piacere, spostandosi da una directory ad
1100 un'altra.  Siccome la directory corrente resta la stessa quando viene creato
1101 un processo figlio, la directory corrente della shell diventa anche la
1102 directory corrente di qualunque comando da essa lanciato.
1103
1104 Le funzioni qui descritte servono esaminare e cambiare la directory di lavoro
1105 corrente.
1106
1107 \begin{prototype}{unistd.h}{char * getcwd (char * buffer, size\_t size)}
1108   Restituisce il filename completo della directory di lavoro corrente nella
1109   stringa puntata da \texttt{buffer}, che deve essere precedentemente
1110   allocata, per una dimensione massima di \texttt{size}. Si può anche
1111   specificare un puntatore nullo come \textit{buffer}, nel qual caso la
1112   stringa sarà allocata automaticamente per una dimensione pari a
1113   \texttt{size} qualora questa sia diversa da zero, o della lunghezza esatta
1114   del pathname altrimenti. In questo caso si deve ricordare di disallocare la
1115   stringa una volta cessato il suo utilizzo.
1116
1117   La funzione restituisce il puntatore \texttt{buffer} se riesce,
1118   \texttt{NULL} se fallisce, in quest'ultimo caso la variabile
1119   \texttt{errno} è settata con i seguenti codici di errore:
1120   \begin{errlist}
1121   \item \texttt{EINVAL} L'argomento \texttt{size} è zero e \texttt{buffer} non
1122     è nullo.
1123   \item \texttt{ERANGE} L'argomento \texttt{size} è più piccolo della
1124     lunghezza del pathname.
1125   \item \texttt{EACCESS} Manca il permesso di lettura o di ricerca su uno dei
1126     componenti del pathname (cioè su una delle directory superiori alla
1127     corrente).
1128   \end{errlist}
1129 \end{prototype}
1130
1131 Di questa funzione esiste una versione \texttt{char * getwd(char * buffer)}
1132 fatta per compatibilità all'indietro con BSD, che non consente di specificare
1133 la dimensione del buffer; esso deve essere allocato in precedenza ed avere una
1134 dimensione superiore a \texttt{PATH\_MAX} (di solito 256 bytes, vedi
1135 \secref{sec:xxx_limits}; il problema è che in Linux non esiste una dimensione
1136 superiore per un pathname, per cui non è detto che il buffer sia sufficiente a
1137 contenere il nome del file, e questa è la ragione principale per cui questa
1138 funzione è deprecata.
1139
1140 Una seconda funzione simile è \texttt{char * get\_current\_dir\_name(void)}
1141 che è sostanzialmente equivalente ad una \texttt{getcwd(NULL, 0)}, con la sola
1142 differenza che essa ritorna il valore della variabile di ambiente
1143 \texttt{PWD}, che essendo costruita dalla shell può contenere anche dei
1144 riferimenti simbolici.
1145
1146 Come già detto in unix anche le directory sono file, è possibile pertanto
1147 riferirsi ad esse tramite il file descriptor dell'interfaccia a basso livello,
1148 e non solo tramite il filename; per questo motivo ci sono due diverse funzioni
1149 per cambiare directory di lavoro.
1150
1151 \begin{prototype}{unistd.h}{int chdir (const char * pathname)}
1152   Come dice il nome (che significa \textit{change directory}) questa funzione
1153   serve a cambiare la directory di lavoro a quella specificata dal pathname
1154   contenuto nella stringa \texttt{pathname}.
1155 \end{prototype}
1156
1157 \begin{prototype}{unistd.h}{int fchdir (int filedes)}
1158   Analoga alla precedente, ma usa un file descriptor invece del pathname.
1159
1160   Entrambe le funzioni restituiscono zero in caso di successo e -1 per un
1161   errore, in caso di errore \texttt{errno} viene settata secondo i codici di
1162   errore standard di accesso ai files (trattati in dettaglio in
1163   \secref{sec:filedir_access_control}) ai quali si aggiunge il codice
1164   \texttt{ENOTDIR} nel caso il \texttt{filename} indichi un file che non sia
1165   una directory.
1166 \end{prototype}
1167
1168