Aggiunto materiale sui processi e i file
[gapil.git] / filedir.tex
1 \chapter{Files e directories}
2 \label{cha:files_and_dirs}
3
4 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
5 file e directory, ed in particolare esamineremo come è strutturato il sistema
6 base di protezioni e controllo di accesso ai file, e tutta l'interfaccia che
7 permette la manipolazione dei vari attributi di file e directory. Tutto quello
8 che riguarda invece la manipolazione del contenuto dei file è lasciato ai
9 capitoli successivi.
10
11
12
13 \section{Il controllo di accesso ai file}
14 \label{sec:filedir_access_control}
15
16 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
17 del controllo di accesso ai file, che viene implementato per qualunque
18 filesystem standard. In questa sezione ne esamineremo i concetti essenziali e
19 le funzioni usate per gestirne i vari aspetti.
20
21
22 \subsection{I permessi per l'accesso ai file}
23 \label{sec:filedir_perm_overview}
24
25 Il controllo di accesso ai file in unix segue un modello abbastanza semplice,
26 ma adatto alla gran parte delle esigenze, in cui si dividono i permessi su tre
27 livelli. Si tenga conto poi che quanto diremo è vero solo per filesystem di
28 tipo unix, e non è detto che sia applicabile a un filesystem
29 qualunque\footnote{ed infatti non è vero per il filesystem vfat di Windows,
30   per il quale vengono assegnati in maniera fissa con un opzione in fase di
31   montaggio}.  Esistono inoltre estensioni che permettono di implementare le
32 ACL (\textit{Access Control List}) che sono un meccanismo di controllo di
33 accesso molto più sofisticato.
34
35 Ad ogni file unix associa sempre l'utente che ne è proprietario (il cosiddetto
36 \textit{owner}) e il gruppo di appartenenza, secondo il meccanismo degli
37 identificatori di utenti e gruppi (\textsl{uid} e \textsl{gid}), e accessibili
38 da programm tramite i campi \var{st\_uid} e \var{st\_gid} della struttura
39 \var{stat} (si veda \secref{sec:filedir_stat}). Ad ogni file viene inoltre
40 associato un insieme di permessi che sono divisi in tre classi, e cioè
41 attribuiti rispettivamente all'utente proprietario del file, a un qualunque
42 utente faccia parte del gruppo cui appartiene il file, e a tutti gli altri
43 utenti.
44
45 I permessi sono espressi da un insieme di 12 bit: di questi i nove meno
46 significativi sono usati a gruppi di tre per indicare i permessi base di
47 lettura, scrittura ed esecuzione (indicati rispettivamente con le lettere
48 \textsl{w}, \textit{r} \textsl{x} nei comandi di sistema) applicabili
49 rispettivamente al proprietario, al gruppo, a tutti.  I restanti tre bit
50 (\textsl{suid}, \textsl{sgid}, e \textsl{sticky}) sono usati per indicare
51 alcune caratteristiche più complesse su cui torneremo in seguito (vedi
52 \secref{sec:filedir_suid_sgid} e \secref{sec:filedir_sticky}).
53
54 Anche i permessi sono tenuti per ciascun file (di qualunque tipo, quindi anche
55 per le fifo, i socket e i file di dispositivo) nell'inode, in opportuni bit
56 del campo \var{st\_mode} della struttura letta da \func{stat} (vedi
57 \figref{fig:filedir_stat_struct}). 
58
59
60 In genere ci si riferisce a questi permessi usando le lettere \textsl{u} (per
61 \textit{user}), \textsl{g} (per \textit{group}) e \textsl{o} (per
62 \textit{other}), inoltre se si vuole indicare tutti questi gruppi insieme si
63 usa la lettera \textsl{a} (per \textit{all}). Si tenga ben presente questa
64 distinzione, dato che in certi casi, mutuando la termimologia in uso nel VMS,
65 si parla dei permessi base come di permessi di owner, group ed all, le cui
66 iniziali possono da luogo a confuzione. Le costanti che permettono di accedere
67 al valore numerico di questi bit sono riportate in \ntab.
68
69 \begin{table}[htb]
70   \centering
71     \footnotesize
72   \begin{tabular}[c]{|c|l|}
73     \hline
74     \var{st\_mode} bit & Significato \\
75     \hline 
76     \hline 
77     \macro{S\_IRUSR}  &  \textit{user-read}, l'utente può leggere     \\
78     \macro{S\_IWUSR}  &  \textit{user-write}, l'utente può scrivere   \\
79     \macro{S\_IXUSR}  &  \textit{user-execute}, l'utente può eseguire \\ 
80     \hline              
81     \macro{S\_IRGRP}  &  \textit{group-read}, il gruppo può leggere    \\
82     \macro{S\_IWGRP}  &  \textit{group-write}, il gruppo può scrivere  \\
83     \macro{S\_IXGRP}  &  \textit{group-execute}, il gruppo può eseguire\\
84     \hline              
85     \macro{S\_IROTH}  &  \textit{other-read}, tutti possono leggere    \\
86     \macro{S\_IWOTH}  &  \textit{other-write}, tutti possono scrivere  \\
87     \macro{S\_IXOTH}  &  \textit{other-execute}, tutti possono eseguire\\
88     \hline              
89   \end{tabular}
90   \caption{I bit dei permessi di accesso ai file, come definiti in 
91     \texttt{<sys/stat.h>}}
92   \label{tab:file_bit_perm}
93 \end{table}
94
95 Questi permessi vengono usati in maniera diversa dalle varie funzioni, e a
96 seconda che si riferiscano a file, link simbolici o directory, qui ci
97 limiteremo ad un riassunto delle regole generali, entrando nei
98 dettagli più avanti.
99
100 La prima regola è che per poter accedere ad un file attraverso il suo pathname
101 occorre il permesso di esecuzione in ciascuna delle directory che compongono
102 il pathname, e lo stesso vale per aprire un file nella directory corrente (per
103 la quale appunto serve il diritto di esecuzione).
104
105 Per una directory infatti il permesso di esecuzione ha il significato
106 specifico che essa può essere attraversata nella risoluzione del pathname, ed
107 è distinto dal permesso di lettura che invece implica che si può leggere il
108 contenuto della directory. Questo significa che se si ha il permesso di
109 esecuzione senza permesso di lettura si potrà lo stesso aprire un file in una
110 directory (se si hanno i permessi opportuni per il medesimo) ma non si potrà
111 vederlo con \cmd{ls} (per crearlo occorrerà anche il permesso di scrittura per
112 la directory).
113
114 Il permesso di lettura per un file consente di aprirlo con le opzioni di sola
115 lettura (\macro{O\_RDONLY}) o di lettura-scrittura (\macro{O\_RDWR}) e
116 leggerne il contenuto. Il permesso di scrittura consente di aprire un file in
117 sola scrittura (\macro{O\_WRONLY}) o lettura-scrittura (\macro{O\_RDWR}) e
118 modificarne il contenuto, lo stesso permesso è necessario per poter troncare
119 il file con l'opzione \macro{O\_TRUNC}.
120
121 Non si può creare un file fintanto che non si disponga del permesso di
122 esecuzione e di quello di scrittura per la directory di destinazione; gli
123 stessi permessi occorrono per cancellare un file da una directory (si ricordi
124 che questo non implica necessariamente la rimozione fisica del file), non è
125 necessario nessun tipo di permesso per il file stesso (infatti esso non viene
126 toccato, viene solo modificato il contenute della directory).
127
128 Per poter eseguire un file (che sia un programma compilato od uno script di
129 shell), occorre il permesso di esecuzione per il medesimo, inoltre solo i file
130 regolari possono essere eseguiti.
131
132
133 Per stabilire se un processo possiede un certo permesso ogni volta che si
134 apre, crea o cancella un file il kernel esegue una serie di controlli
135 guardando utente e gruppo a cui il file appartiene (i valori di \var{st\_uid}
136 e \var{st\_gid}) che confronta con l'\textit{effective user id},
137 \textit{effective group id} e gli eventuali \textit{supplementary group id}
138 del processo (per una spiegazione dettagliata degli ID dei processi si veda
139 \secref{sec:prochand_perms}; normalmente, a parte quanto spiegato in
140 \secref{sec:filedir_suid_sgid}, essi corrispondo all'uid e al gid dell'utente
141 che ha lanciato il processo).
142
143
144
145
146
147 % Quando un processo cerca l'accesso al file esso controlla i propri uid e gid
148 % confrontandoli con quelli del file e se l'operazione richiesta è compatibile
149 % con i permessi associati al file essa viene eseguita, altrimenti viene
150 % bloccata ed è restituito un errore di \texttt{EPERM}. Questo procedimento non
151 % viene eseguito per l'amministratore di sistema (il cui uid è zero) il quale
152 % a
153 % pertanto accesso senza restrizione a qualunque file del sistema.
154
155 % In realtà il procedimento è più complesso di quanto descritto in maniera
156 % elementare qui; inoltre ad un processo sono associati diversi identificatori,
157 % torneremo su questo in maggiori dettagli in seguito in \secref{sec:proc_perms}.
158
159
160
161
162 \subsection{I flag \texttt{suid} e \texttt{sgid}}
163 \label{sec:filedir_suid_sgid}
164
165 \subsection{La titolarità di nuovi files e directory}
166 \label{sec:filedir_ownership}
167
168
169 \subsection{La funzione \texttt{access}}
170 \label{sec:filedir_access}
171
172
173 \subsection{La funzione \texttt{umask}}
174 \label{sec:filedir_umask}
175
176
177 \subsection{Le funzioni \texttt{chmod} e \texttt{fchmod}}
178 \label{sec:filedir_chmod}
179
180 \subsection{Il flag \texttt{sticky}}
181 \label{sec:filedir_sticky}
182
183 \subsection{Le funzioni \texttt{chown}, \texttt{fchown} e \texttt{lchown}}
184 \label{sec:filedir_chown}
185
186
187
188
189 %La struttura fondamentale che contiene i dati essenziali relativi ai file è il
190 %cosiddetto \textit{inode}; questo conterrà informazioni come il
191 %tipo di file (file di dispositivo, directory, file di dati, per un elenco
192 %completo vedi \ntab), i permessi (vedi \secref{sec:file_perms}), le date (vedi
193 %\secref{sec:file_times}).
194
195
196
197 \section{La manipolazione delle caratteristiche dei files}
198 \label{sec:filedir_infos}
199
200 Come spiegato in \secref{sec:fileintr_filesystem} tutte le informazioni
201 generali relative alle caratteristiche di ciascun file sono mantenute
202 nell'inode. Vedremo in questa sezione come sia possibile accedervi usando la
203 funzione \texttt{stat} ed esamineremo alcune funzioni utilizzabili per
204 manipolare una parte di questa informazione. Tutto quello che invece riguarda
205 il meccanismo di controllo di accesso ad i file e le relative funzioni di
206 manipolazione sarà invece esaminanto in \secref{sec:filedir_access_control}.
207
208
209 \subsection{Le funzioni \texttt{stat}, \texttt{fstat} e \texttt{lstat}}
210 \label{sec:filedir_stat}
211
212 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
213 delle funzioni \func{stat}, che è la funzione che il comando \cmd{ls} usa
214 per poter stampare tutti i dati dei files. I prototipi di queste funzioni sono
215 i seguenti:
216 \begin{functions}
217   \headdecl{sys/types.h} 
218   \headdecl{sys/stat.h} 
219   \headdecl{unistd.h}
220
221   \funcdecl{int stat(const char *file\_name, struct stat *buf)} Legge le
222   informazione del file specificato da \var{file\_name} e le inserisce in
223   \var{buf}.
224   
225   \funcdecl{int lstat(const char *file\_name, struct stat *buf)} Identica a
226   \func{stat} eccetto che se il \var{file\_name} è un link simbolico vengono
227   lette le informazioni relativa ad esso e non al file a cui fa riferimento.
228   
229   \funcdecl{int fstat(int filedes, struct stat *buf)} Identica a \func{stat}
230   eccetto che si usa con un file aperto, specificato tramite il suo file
231   descriptor \var{filedes}.
232   
233   Le funzioni restituiscono zero in caso di successo e -1 per un errore, in
234   caso di errore \texttt{errno} viene settato ai valori:
235   \begin{errlist}
236   \item \texttt{EACCESS} non c'è il permesso di accedere al file.
237   \item \texttt{ENOTDIR} una componente del pathname non è una directory.
238   \item \texttt{EMLOOP} ci sono troppi link simbolici nel pathname.
239   \item \texttt{EFAULT} i puntatori usati sono fuori dallo spazio di indirizzi
240     del processo.
241   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
242     completare l'operazione. 
243   \item \texttt{ENAMETOOLONG} il filename è troppo lungo.
244   \end{errlist}
245 \end{functions}
246
247 La struttura \texttt{stat} è definita nell'header \texttt{sys/stat.h} e in
248 generale dipende dall'implementazione, la versione usata da Linux è mostrata
249 in \nfig, così come riportata dalla man page (in realtà la definizione
250 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
251 riservati per estensioni come tempi più precisi, o per il padding dei campi).
252
253 \begin{figure}[!htb]
254   \footnotesize
255   \centering
256   \begin{minipage}[c]{15cm}
257     \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
258 struct stat {
259     dev_t         st_dev;      /* device */
260     ino_t         st_ino;      /* inode */
261     mode_t        st_mode;     /* protection */
262     nlink_t       st_nlink;    /* number of hard links */
263     uid_t         st_uid;      /* user ID of owner */
264     gid_t         st_gid;      /* group ID of owner */
265     dev_t         st_rdev;     /* device type (if inode device) */
266     off_t         st_size;     /* total size, in bytes */
267     unsigned long st_blksize;  /* blocksize for filesystem I/O */
268     unsigned long st_blocks;   /* number of blocks allocated */
269     time_t        st_atime;    /* time of last access */
270     time_t        st_mtime;    /* time of last modification */
271     time_t        st_ctime;    /* time of last change */
272 };
273     \end{lstlisting}
274   \end{minipage} 
275   \normalsize 
276   \caption{La struttura \texttt{stat} per la lettura delle informazioni dei 
277     file}
278   \label{fig:filedir_stat_struct}
279 \end{figure}
280
281 Si noti come i vari membri della struttura siano specificati come tipi nativi
282 del sistema (di quelli definiti in \tabref{tab:xxx_sys_types}, e dichiarati in
283 \texttt{sys/types.h}). 
284
285
286 \subsection{I tipi di file}
287 \label{sec:filedir_file_types}
288
289 Come riportato in \tabref{tab:fileintr_file_types} in Linux oltre ai file e
290 alle directory esistono vari altri oggetti che possono stare su un filesystem;
291 il tipo di file è ritornato dalla \texttt{stat} nel campo \texttt{st\_mode}.
292
293 Dato che il valore numerico può variare a seconda delle implementazioni lo
294 standard POSIX definisce un insieme di macro per verificare il tipo di files,
295 queste venfono usate anche da Linux che supporta pure le estensioni per link
296 simbolici e socket definite da BDS, l'elenco è riportato in \ntab:
297 \begin{table}[htb]
298   \centering
299   \footnotesize
300   \begin{tabular}[c]{|l|l|}
301     \hline
302     Macro & Tipo del file \\
303     \hline
304     \hline
305     \macro{S\_ISREG(m)}  & file normale \\
306     \macro{S\_ISDIR(m)}  & directory \\
307     \macro{S\_ISCHR(m)}  & device a caraetteri \\
308     \macro{S\_ISBLK(m)}  & device a blocchi\\
309     \macro{S\_ISFIFO(m)} & fifo \\
310     \macro{S\_ISLNK(m)}  & link simbolico \\
311     \macro{S\_ISSOCK(m)} & socket \\
312     \hline    
313   \end{tabular}
314   \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h})}
315   \label{tab:filedir_file_type_macro}
316 \end{table}
317
318 Oltre a queste macro è possibile usare direttamente il valore di
319 \var{st\_mode} per ricavare il significato dei vari bit in esso memorizzati,
320 per questo sempre in \texttt{sys/stat.h} sono definiti i flag riportati in
321 \ntab:
322 \begin{table}[htb]
323   \centering
324   \footnotesize
325   \begin{tabular}[c]{|l|c|l|}
326     \hline
327     Flag & Valore & Significato \\
328     \hline
329     \hline
330     \macro{S\_IFMT}   &  0170000 & bitmask for the file type bitfields \\
331     \macro{S\_IFSOCK} &  0140000 & socket        \\
332     \macro{S\_IFLNK}  &  0120000 & symbolic link \\
333     \macro{S\_IFREG}  &  0100000 & regular file  \\ 
334     \macro{S\_IFBLK}  &  0060000 & block device  \\
335     \macro{S\_IFDIR}  &  0040000 & directory     \\ 
336     \macro{S\_IFCHR}  &  0020000 & character device         \\
337     \macro{S\_IFIFO}  &  0010000 & fifo                     \\
338     \macro{S\_ISUID}  &  0004000 & set UID bit              \\
339     \macro{S\_ISGID}  &  0002000 & set GID bit (see below)  \\
340     \macro{S\_ISVTX}  &  0001000 & sticky bit (see below)   \\
341     \macro{S\_IRWXU}  &  00700   & mask for file owner permissions \\
342     \macro{S\_IRUSR}  &  00400   & owner has read permission       \\
343     \macro{S\_IWUSR}  &  00200   & owner has write permission      \\
344     \macro{S\_IXUSR}  &  00100   & owner has execute permission    \\
345     \macro{S\_IRWXG}  &  00070   & mask for group permissions      \\
346     \macro{S\_IRGRP}  &  00040   & group has read permission       \\
347     \macro{S\_IWGRP}  &  00020   & group has write permission      \\
348     \macro{S\_IXGRP}  &  00010   & group has execute permission    \\
349     \macro{S\_IRWXO}  &  00007   & mask for permissions for others (not in
350     group) \\         
351     \macro{S\_IROTH}  &  00004   & others have read permission     \\
352     \macro{S\_IWOTH}  &  00002   & others have write permisson     \\
353     \macro{S\_IXOTH}  &  00001   & others have execute permission  \\
354     \hline    
355   \end{tabular}
356   \caption{Flag per il campo \var{st\_mode} (definite in 
357     \texttt{sys/stat.h})}
358   \label{tab:filedir_file_mode_flags}
359 \end{table}
360
361 Il primo valore definisce la maschera dei bit usati nei quali viene
362 memorizzato il tipo di files, mentre gli altri possono essere usati per
363 effettuare delle selezioni sul tipo di file voluto, combinando opportunamente
364 i vari flag; ad esempio se si volesse controllare se un file è una directory o
365 un file ordinario si potrebbe definire la condizione:
366 \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
367 #define IS_FILE_DIR(x) (((x) & S_IFMT) & (S_IFDIR | S_IFREG))
368 \end{lstlisting}
369 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
370 poi si effettua il confronto con la combinazione di tipi scelta.
371
372 \subsection{La dimensione dei file}
373 \label{sec:filedir_file_size}
374
375 Il membro \var{st\_size} contiene la dimensione del file in bytes (se il file
376 è un file normale, nel caso di un link simbolico al dimensione è quella del
377 pathname che contiene). 
378
379 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
380 bytes. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
381 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
382 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
383 dimensione inferiore sarebbe inefficiente.
384
385 Si tenga conto che lunghezza del file riportata in \var{st\_size} non è detto
386 che corrisponda all'occupazione dello spazio su disco per via della possibile
387 esistenza dei cosiddetti \textsl{buchi} (detti normalmente \textit{holes}) che
388 si formano tutte le volte che si va a scrivere su un file dopo aver eseguito
389 una \func{seek} (vedi \secref{sec:fileunix_lseek}) oltre la sua conclusione
390 corrente.
391
392 In tal caso si avranno differenti risultati a seconda del modi in cui si
393 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
394 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
395 legge dal file (ad esempio usando \cmd{wc -c}), dato che in tal caso per le
396 parti non scritte vengono restituiti degli zeri, si avrà lo stesso risultato
397 di \cmd{ls}.
398
399 Se è sempre possibile allargare un file scrivendoci sopra od usando la
400 funzione \func{seek} per spostarsi oltre la sua fine. Esistono però anche casi
401 in cui si può avere bisogno di effettuare un troncamento scartando i dati al
402 di là della dimensione scelta come nuova fine del file.
403
404 Un file può essere troncato a zero aprendolo con il flag \macro{O\_TRUNC}, ma
405 questo è un caso particolare; per qualunque altra dimensione si possono usare
406 le due funzioni:
407 \begin{functions}
408   \headdecl{unistd.h} \funcdecl{int truncate(const char *file\_name, off\_t
409     length)} Fa si che la dimensione del file \var{file\_name} sia troncata ad
410     un valore massimo specificato da \var{lenght}. 
411   
412   \funcdecl{int ftruncate(int fd, off\_t length))} Identica a \func{truncate}
413   eccetto che si usa con un file aperto, specificato tramite il suo file
414   descriptor \var{fd}, 
415   
416   Le funzioni restituiscono zero in caso di successo e -1 per un errore, in
417   caso di errore \texttt{errno} viene settato ai valori:
418   \begin{errlist}
419   \item \texttt{EACCESS} non c'è il permesso di accedere al file.
420   \item \texttt{ENOTDIR} una componente del pathname non è una directory.
421   \item \texttt{EMLOOP} ci sono troppi link simbolici nel pathname.
422   \item \texttt{EFAULT} i puntatori usati sono fuori dallo spazio di indirizzi
423     del processo.
424   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
425     completare l'operazione. 
426   \item \texttt{ENOENT} il file non esiste. 
427   \item \texttt{ENAMETOOLONG} il filename è troppo lungo.
428   \end{errlist}
429 \end{functions}
430
431 Se il file è più lungo della lunghezza specificata i dati in eccesso saranno
432 perduti; il comportamento in caso di lunghezza inferiore non è specificato e
433 dipende dall'implementazione: il file può essere lasciato invariato o esteso
434 fino alla lunghezza scelta; in quest'ultimo caso lo spazio viene riempito con
435 zeri (e in genere si ha la creazione di un hole nel file).
436
437
438 \subsection{I tempi dei file}
439 \label{sec:filedir_file_times}
440
441 Il sistema mantiene per ciascun file tre tempi. Questi sono registrati
442 nell'inode insieme agli altri attibuti del file e possono essere letti tramite
443 la funzione \func{stat}, che li restituisce attraverso tre campi della
444 struttura in \figref{fig:filedir_stat_struct}. Il significato di detti tempi e
445 dei relativi campi è riportato nello schema in \ntab:
446
447 \begin{table}[htb]
448   \centering
449   \begin{tabular}[c]{|c|l|l|c|}
450     \hline
451     Membro & Significato & Funzione&opzione \\
452     \hline
453     \hline
454     \var{st\_atime}& ultimo accesso ai dati del file &\func{read}& \cmd{-u}\\ 
455     \var{st\_mtime}& ultima modifica ai dati del file &\func{write}& default\\ 
456     \var{st\_ctime}& ultima modifica ai dati dell'inode&\func{chmod}, 
457     \func{utime} & \cmd{-c} \\ 
458     \hline
459   \end{tabular}
460   \caption{I tre tempi associati a ciascun file}
461   \label{tab:filedir_file_times}
462 \end{table}
463
464 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
465 modifica (il \textit{modification time} \var{st\_mtime}) e il tempo di
466 cambiamento di stato (il \textit{chage time} \var{st\_ctime}). Il primo
467 infatti fa riferimento ad una modifica del contenuto di un file, mentre il
468 secondo ad una modifica dell'inode; siccome esistono molte operazioni (come la
469 funzione \func{link} e molte altre che vedremo in seguito) che modificano solo
470 le informazioni contenute nell'inode senza toccare il file, diventa necessario
471 l'utilizzo di un altro tempo.
472
473 Il sistema non tiene conto dell'ultimo accesso all'inode, pertanto funzioni
474 come \func{access} o \func{stat} non hanno alcuna influenza sui tre tempi. Il
475 tempo di ultimo accesso viene di solito usato per cancellare i file che non
476 servono più dopo un certo lasso di tempo (ad esempio \cmd{leafnode} cancella i
477 vecchi articoli sulla base di questo tempo).  
478
479 Il tempo di ultima modifica invece viene usato da \cmd{make} per decidere
480 quali file necessitano di essere ricompilati o (talvolta insieme anche al
481 tempo di cambiamento di stato) per decidere quali file devono essere
482 archiviati per il backup. Il comando \cmd{ls} (quando usato con le opzioni
483 \cmd{-l} o \cmd{-t}) mostra i tempi dei file secondo lo schema riportato
484 nell'ultima colonna di \curtab.
485
486 L'effetto delle varie funzioni di manipolazione dei file sui tempi è
487 illustrato in \ntab. Si sono riportati gli effetti sia per il file a cui si fa
488 riferimento, sia per la directory che lo contiene; questi ultimi possono
489 essere capiti se si tiene conto di quanto già detto, e cioè che anche le
490 directory sono files, che il sistema tratta in maniera del tutto analoga agli
491 altri. 
492
493 Per questo motivo tutte le volte che compiremo una operazione su un file che
494 comporta una modifica della sua directory entry, andremo anche a scrivere
495 sulla directory che lo contiene cambiandone il tempo di modifica. Un esempio
496 di questo può essere la cancellazione di un file, mentre leggere o scrivere o
497 cambiarne i permessi ha effetti solo sui tempi del file.
498
499 \begin{table}[htb]
500   \centering
501   \footnotesize
502   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
503     \hline
504     \multicolumn{1}{|c|}{Funzione} 
505     &\multicolumn{3}{p{2cm}}{File o directory di riferimento}
506     &\multicolumn{3}{p{2cm}}{Directory genitrice del riferimento} 
507     &\multicolumn{1}{|c|}{Note} \\
508     \cline{2-7}
509     &  \textsl{(a)} &  \textsl{(m)}&  \textsl{(c)} 
510     &  \textsl{(a)} &  \textsl{(m)}&  \textsl{(c)}& \\
511     \hline
512     \hline
513     \func{chmod}, \func{fchmod} 
514     &         &         &$\bullet$&         &         &         & \\
515     \func{chown}, \func{fchown} 
516     &         &         &$\bullet$&         &         &         & \\
517     \func{creat}  
518     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$&  con 
519     \macro{O\_CREATE} \\    \func{creat}  
520     &         &$\bullet$&$\bullet$&         &$\bullet$&$\bullet$&   
521     con \macro{O\_TRUNC} \\    \func{exec}  
522     &$\bullet$&         &         &         &         &         & \\
523     \func{lchown}  
524     &         &         &$\bullet$&         &         &         & \\
525     \func{link}
526     &         &         &$\bullet$&         &$\bullet$&$\bullet$& \\
527     \func{mkdir}
528     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$& \\
529     \func{mkfifo}
530     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$& \\
531     \func{open}
532     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$& con 
533     \macro{O\_CREATE} \\    \func{open}
534     &         &$\bullet$&$\bullet$&         &         &         & con 
535     \macro{O\_TRUNC}  \\    \func{pipe}
536     &$\bullet$&$\bullet$&$\bullet$&         &         &         & \\
537     \func{read}
538     &$\bullet$&         &         &         &         &         & \\
539     \func{remove}
540     &         &         &$\bullet$&         &$\bullet$&$\bullet$& using 
541     \func{unlink}\\    \func{remove}
542     &         &         &         &         &$\bullet$&$\bullet$& using 
543     \func{rmdir}\\ \func{rename}
544     &         &         &$\bullet$&         &$\bullet$&$\bullet$& per entrambi
545     gli argomenti\\ \func{rmdir}
546     &         &         &         &         &$\bullet$&$\bullet$& \\ 
547     \func{truncate}, \func{ftruncate}
548     &         &$\bullet$&$\bullet$&         &         &         & \\ 
549     \func{unlink}
550     &         &         &$\bullet$&         &$\bullet$&$\bullet$& \\ 
551     \func{utime}
552     &$\bullet$&$\bullet$&$\bullet$&         &         &         & \\ 
553     \func{write}
554     &         &$\bullet$&$\bullet$&         &         &         & \\ 
555     \hline
556   \end{tabular}
557   \caption{Effetti delle varie funzioni su tempi di ultimo accesso 
558     \textsl{(a)}, ultima modifica \textsl{(m)}  e ultimo cambiamento
559     \textsl{(c)}}
560   \label{tab:filedir_times_effects}  
561 \end{table}
562
563 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
564 creazione del file, usato da molti altri sistemi operativi, che in unix non
565 esiste.
566
567
568 \subsection{La funzione \texttt{utime}}
569 \label{sec:filedir_utime}
570
571 I tempi di ultimo accesso e modifica possono essere cambiati usando la
572 funzione \func{utime}, il cui prototipo è:
573
574 \begin{prototype}{utime.h}
575 {int utime(const char * filename, struct utimbuf *times)} 
576
577 Cambia i tempi di ultimo accesso e modifica dell'inode specificato da
578 \var{filename} secondo i campi \var{actime} e \var{modtime} di \var{times}. Se
579 questa è \macro{NULL} allora viene usato il tempo corrente.
580
581 La funzione restituisce zero in caso di successo e -1 in caso di errore, nel
582 qual caso \var{errno} è settata opportunamente.
583 \begin{errlist}
584 \item \texttt{EACCESS} non si ha il permesso di scrittura sul file.
585 \item \texttt{ENOENT} \var{filename} non esiste.
586 \end{errlist}
587 \end{prototype}
588  
589 La struttura \var{utimebuf} usata da \func{utime} è definita come:
590 \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
591 struct utimbuf {
592         time_t actime;  /* access time */
593         time_t modtime; /* modification time */
594 };
595 \end{lstlisting}
596
597 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
598 cosa è l'argomento \var{times}; se è \textit{NULL} la funzione setta il tempo
599 corrente ed è sufficiente avere accesso in scrittura al file; se invece si è
600 specificato un valore la funzione avrà successo solo se si è proprietari del
601 file (o si hanno i privilegi di amministratore).
602
603 Si tenga presente che non è comunque possibile specificare il tempo di
604 cambiamento di stato del file, che viene comunque cambiato dal kernel tutte le
605 volte che si modifica l'inode (quindi anche alla chiamata di \func{utime}).
606 Questo serve anche come misura di sicurezza per evitare che si possa
607 modificare un file nascondendo completamente le proprie tracce.  In realtà la
608 cosa resta possibile, se si è in grado di accedere al device, scrivendo
609 direttamente sul disco senza passare attraverso il filesystem, ma ovviamente è
610 molto più complicato da realizzare.
611
612
613
614
615
616
617 \section{La manipolazione di file e directory}
618
619 Come già accennato in \secref{sec:fileintr_filesystem} in un sistema unix-like
620 i file hanno delle caratteristiche specifiche dipendenti dall'architettura del
621 sistema, esamineremo qui allora le funzioni usate per la creazione di link
622 simbolici e diretti  e per la gestione delle directory, approfondendo quanto
623 già accennato in precedenza.
624
625
626 \subsection{Le funzioni \texttt{link} e \texttt{unlink}}
627 \label{sec:fileintr_link}
628
629 Una delle caratteristiche comuni a vari sistemi operativi è quella di poter
630 creare dei nomi fittizi (alias o collegamenti) per potersi riferire allo
631 stesso file accedendovi da directory diverse. Questo è possibile anche in
632 ambiente unix, dove tali collegamenti sono usualmente chiamati \textit{link},
633 ma data la struttura del sistema ci sono due metodi sostanzialmente diversi
634 per fare questa operazione.
635
636 Come spiegato in \secref{sec:fileintr_architecture} l'accesso al contenuto di
637 un file su disco avviene attraverso il suo inode, e il nome che si trova in
638 una directory è solo una etichetta associata ad un puntatore a detto inode.
639 Questo significa che la realizzazione di un link è immediata in quanto uno
640 stesso file può avere tanti nomi diversi allo stesso tempo, dati da
641 altrettante diverse associazioni allo stesso inode; si noti poi che nessuno di
642 questi nomi viene ad assumere una particolare preferenza rispetto agli altri.
643
644 Per aggiungere un nome ad un inode si utilizza la funzione \texttt{link}; si
645 suole chiamare questo tipo di associazione un collegamento diretto (o
646 \textit{hard link}).  Il prototipo della funzione e le sue caratteristiche
647 principali, come risultano dalla man page, sono le seguenti:
648 \begin{prototype}{unistd.h}
649 {int link(const char * oldpath, const char * newpath)}
650   Crea un nuovo collegamento diretto al file indicato da \texttt{oldpath}
651   dandogli nome \texttt{newpath}.
652   
653   La funzione restituisce zero in caso di successo e -1 in caso di errore. La
654   variabile \texttt{errno} viene settata opportunamente, i principali codici
655   di errore sono:
656   \begin{errlist}
657   \item \texttt{EXDEV} \texttt{oldpath} e \texttt{newpath} non sono sullo
658     stesso filesystem.
659   \item \texttt{EPERM} il filesystem che contiene \texttt{oldpath} e
660     \texttt{newpath} non supporta i link diretti o è una directory.
661   \item \texttt{EEXIST} un file (o una directory) con quel nome esiste di
662     già.
663   \item \texttt{EMLINK} ci sono troppi link al file \texttt{oldpath} (il
664     numero massimo è specificato dalla variabile \texttt{LINK\_MAX}, vedi
665     \secref{sec:xxx_limits}).
666   \end{errlist}
667   
668 \end{prototype}
669
670 La creazione di un nuovo collegamento diretto non copia il contenuto del file,
671 ma si limita ad aumentare di uno il numero di referenze al file (come si può
672 controllare con il campo \var{st\_nlink} di \var{stat}) aggiungendo il nuovo
673 nome ai precedenti. Si noti che uno stesso file può essere così richiamato in
674 diverse directory.
675  
676 Per quanto dicevamo in \secref{sec:fileintr_filesystem} la creazione del
677 collegamento diretto è possibile solo se entrambi i pathname sono nello stesso
678 filesystem; inoltre il filesystem deve supportare i collegamenti diretti (non è
679 il caso ad esempio del filesystem \texttt{vfat} di windows).
680
681 La funzione opera sui file ordinari, come sugli altri oggetti del filesystem,
682 in alcuni filesystem solo l'amministratore è in grado di creare un
683 collegamento diretto ad un'altra directory, questo lo si fa perché in questo
684 caso è possibile creare dei circoli nel filesystem (vedi
685 \secref{sec:fileintr_symlink}) che molti programmi non sono in grado di
686 gestire e la cui rimozione diventa estremamente complicata (in genere occorre
687 far girare il programma \texttt{fsck} per riparare il filesystem); data la sua
688 pericolosità in generale nei filesystem usati in Linux questa caratteristica è
689 stata disabilitata, e la funzione restituisce l'errore \texttt{EPERM}.
690
691 La rimozione di un file (o più precisamente della voce che lo referenzia) si
692 effettua con la funzione \texttt{unlink}; il suo prototipo è il seguente:
693
694 \begin{prototype}{unistd.h}{int unlink(const char * pathname)}
695   Cancella il nome specificato dal pathname nella relativa directory e
696   decrementa il numero di riferimenti nel relativo inode. Nel caso di link
697   simbolico cancella il link simbolico; nel caso di socket, fifo o file di
698   dispositivo rimuove il nome, ma come per i file i processi che hanno aperto
699   uno di questi oggetti possono continuare ad utilizzarlo.
700   
701   La funzione restituisce zero in caso di successo e -1 per un errore, nel
702   qual caso il file non viene toccato. La variabile \texttt{errno} viene
703   settata secondo i seguenti codici di errore:
704   \begin{errlist}
705   \item \texttt{EISDIR} \var{pathname} si riferisce ad una directory
706     (valore specifico ritornato da linux che non consente l'uso di
707     \texttt{unlink} con le directory, e non conforme allo standard POSIX, che
708     prescrive invece l'uso di \texttt{EPERM} in caso l'operazione non sia
709     consnetita o il processo non abbia privilegi sufficienti).
710   \item \texttt{EROFS} \var{pathname} è su un filesystem montato in sola
711   lettura.
712   \item \texttt{EISDIR} \var{pathname} fa riferimento a una directory.
713   \end{errlist}
714 \end{prototype}
715
716 Per cancellare una voce in una directory è necessario avere il permesso di
717 scrittura su di essa (dato che si va a rimuovere una voce dal suo contenuto) e
718 il diritto di esecuzione sulla directory che la contiene (torneremo in
719 dettaglio sui permessi e gli attributi fra poco), se inoltre lo
720 \textit{sticky} bit è settato occorrerà anche essere proprietari del file o
721 proprietari della directory (o root, per cui nessuna delle restrizioni è
722 applicata).
723
724 Una delle caratteristiche di queste funzioni è che la creazione/rimozione
725 della nome dalla directory e l'incremento/decremento del numero di riferimenti
726 nell'inode deve essere una operazione atomica (cioè non interrompibile da
727 altri) processi, per questo entrambe queste funzioni sono realizzate tramite
728 una singola system call.
729
730 Si ricordi infine che il file non viene eliminato dal disco fintanto che tutti
731 i riferimenti ad esso sono stati cancellati, solo quando il \textit{link
732   count} mantenuto nell'inode diventa zero lo spazio occupato viene rimosso. A
733 questo però si aggiunge una altra condizione, e cioè che non ci siano processi
734 che abbiano detto file aperto. Come accennato questa proprietà viene spesso
735 usata per essere sicuri di non lasciare file temporanei su disco in caso di
736 crash dei programmi; la tecnica è quella di aprire il file e chiamare
737 \texttt{unlink} subito dopo.
738
739 \subsection{Le funzioni \texttt{remove} e \texttt{rename}}
740 \label{sec:fileintr_remove}
741
742 Al contrario di quanto avviene con altri unix in Linux non è possibile usare
743 \texttt{unlink} sulle directory, per cancellare una directory si può usare la
744 funzione \texttt{rmdir} (vedi \secref{sec:filedir_dir_creat_rem}), oppure la
745 funzione \texttt{remove}. Questa è la funzione prevista dallo standard ANSI C
746 per cancellare un file o una directory (e funziona anche per i sistemi che non
747 supportano i link diretti), che per i file è identica alla \texttt{unlink} e
748 per le directory è identica alla \texttt{rmdir}:
749
750 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
751   Cancella un nome dal filesystem. Usa \texttt{unlink} per i file e
752   \texttt{rmdir} per le directory.
753   
754   La funzione restituisce zero in caso di successo e -1 per un errore, nel
755   qual caso il file non viene toccato. Per i codici di errori vedi quanto
756   riportato nella descrizione di \texttt{unlink} e \texttt{rmdir}.
757 \end{prototype}
758
759 Per cambiare nome ad un file si usa invece la funzione \texttt{rename}, il
760 vantaggio nell'uso di questa funzione al posto della chiamata successiva di
761 \texttt{unlink} e \texttt{link} è che l'operazione è eseguita atomicamente, in
762 questo modo non c'è la possibilità che un processo che cerchi di accedere al
763 nuovo nome dopo che il vecchio è stato cambiato lo trovi mancante.
764
765 \begin{prototype}{stdio.h}
766 {int rename(const char *oldpath, const char *newpath)}
767   Rinomina un file, spostandolo fra directory diverse quando richiesto.
768
769   La funzione restituisce zero in caso di successo e -1 per un errore, nel
770   qual caso il file non viene toccato. La variabile \texttt{errno} viene
771   settata secondo i seguenti codici di errore:
772   \begin{errlist} 
773   \item \texttt{EISDIR} \texttt{newpath} è una directory già esistente mentre
774     \texttt{oldpath} non è una directory. 
775   \item \texttt{EXDEV} \texttt{oldpath} e \texttt{newpath} non sono sullo
776     stesso filesystem. 
777   \item \texttt{ENOTEMPTY} \texttt{newpath} è una directory già esistente e
778     non vuota.
779   \item \texttt{EBUSY} o \texttt{oldpath} o \texttt{newpath} sono in uso da
780     parte di qualche processo (come directory di lavoro o come root) o del
781     sistema (come mount point).
782   \item \texttt{EINVAL} \texttt{newpath} contiene un prefisso di
783     \texttt{oldpath} o più in generale si è cercato di creare una directory
784     come sottodirectory di se stessa.
785   \item \texttt{EMLINK} \texttt{oldpath} ha già il massimo numero di link
786     consentiti o è una directory e la directory che contiene \texttt{newpath}
787     ha già il massimo numero di link. 
788   \item \texttt{ENOTDIR} Uno dei componenti dei pathname non è una directory
789     o\texttt{oldpath} è una directory e \texttt{newpath} esiste e non è una
790     directory.
791   \item \texttt{EFAULT} o \texttt{oldpath} o \texttt{newpath} è fuori dello
792     spazio di indirizzi del processo.
793   \item \texttt{EACCESS} Non c'è il permesso di scrittura per la directory in
794     cui si vuole creare il nuovo link o una delle directory del pathname non
795     consente la ricerca (permesso di esecuzione).
796   \item \texttt{EPERM} le directory contenenti \texttt{oldpath} o
797     \texttt{newpath} hanno lo sticky bit attivo e i permessi del processo non
798     consentono rispettivamente la cancellazione e la creazione del file, o il
799     filesystem non supporta i link.
800   \item \texttt{ENAMETOOLONG} uno dei pathname è troppo lungo.
801   \item \texttt{ENOENT} Uno dei componenti del pathname non esiste o è un link
802     simbolico spezzato.
803   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
804     completare l'operazione. 
805   \item \texttt{EROFS} I file sono su un filesystem montato in sola lettura.
806   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione del
807     pathname.
808   \item \texttt{ENOSPC} Il device di destinazione non ha più spazio per la
809     nuova voce. 
810   \end{errlist}    
811 \end{prototype}
812
813 \subsection{I link simbolici}
814 \label{sec:fileintr_symlink}
815
816 Siccome la funzione \texttt{link} crea riferimenti agli inodes, essa può
817 funzionare soltanto per file che risiedono sullo stesso filesystem, dato che
818 in questo caso è garantita l'unicità dell'inode, e solo per un filesystem di
819 tipo unix.  Inoltre in Linux non è consentito eseguire un link diretto ad una
820 directory.
821
822 Per ovviare a queste limitazioni i sistemi unix supportano un'altra forma di
823 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
824 come avviene in altri sistemi operativi, dei file che contengono il
825 semplicemente il riferimento ad un altro file (o directory). In questo modo è
826 possibile effettuare link anche attraverso filesystem diversi e a directory, e
827 pure a file che non esistono ancora.
828
829 Il sistema funziona in quanto i link simbolici sono contrassegnati come tali
830 al kernel (analogamente a quanto avviene per le directory) per cui la chiamata
831 ad una \texttt{open} o una \texttt{stat} su un link simbolico comporta la
832 lettura del contenuto del medesimo e l'applicazione della funzione al file
833 specificato da quest'ultimo. Invece altre funzioni come quelle per cancellare
834 o rinominare i file operano direttamente sul link simbolico (per l'elenco vedi
835 \ntab). Inoltre esistono funzioni apposite, come la \texttt{readlink} e la
836 \texttt{lstat} per accedere alle informazioni del link invece che a quelle del
837 file a cui esso fa riferimento.
838
839 Le funzioni per operare sui link simbolici sono le seguenti, esse sono tutte
840 dichiarate nell'header file \texttt{unistd.h}.
841
842 \begin{prototype}{unistd.h}
843 {int symlink(const char * oldname, const char * newname)}
844   Crea un nuovo link simbolico al file indicato da \texttt{oldname} dandogli
845   nome \texttt{newname}.
846   
847   La funzione restituisce zero in caso di successo e -1 per un errore, in caso
848   di errore. La variabile \texttt{errno} viene settata secondo i codici di
849   errore standard di accesso ai files (trattati in dettaglio in
850   \secref{sec:filedir_access_control}) ai quali si aggiungono i seguenti:
851   \begin{errlist}
852   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di
853     già.
854   \item \texttt{EROFS} La directory su cui si vuole inserire il nuovo link è
855     su un filesystem montato readonly.
856   \item \texttt{ENOSPC} La directory o il filesystem in cui si vuole creare il
857     link è piena e non c'è ulteriore spazio disponibile.
858   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione di
859     \texttt{oldname} o di \texttt{newname}.
860   \end{errlist}
861 \end{prototype}
862
863 Dato che la funzione \texttt{open} segue i link simbolici, è necessaria usare
864 un'altra funzione quando si vuole leggere il contenuto di un link simbolico,
865 questa funzione è la:
866
867 \begin{prototype}{unistd.h}
868 {int readlink(const char * path, char * buff, size\_t size)} 
869   Legge il contenuto del link simbolico indicato da \texttt{path} nel buffer
870   \texttt{buff} di dimensione \texttt{size}. Non chiude la stringa con un
871   carattere nullo e la tronca a \texttt{size} nel caso il buffer sia troppo
872   piccolo per contenerla.
873   
874   La funzione restituisce il numero di caratteri letti dentro \texttt{buff} o
875   -1 per un errore, in caso di errore. La variabile \texttt{errno} viene
876   settata secondo i codici di errore:
877   \begin{errlist}
878   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di
879     già.
880   \item \texttt{EROFS} La directory su cui si vuole inserire il nuovo link è
881     su un filesystem montato readonly.
882   \item \texttt{ENOSPC} La directory o il filesystem in cui si vuole creare il
883     link è piena e non c'è ulteriore spazio disponibile.
884   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione di
885     \texttt{oldname} o di \texttt{newname}.
886   \end{errlist}
887 \end{prototype}
888
889 In \ntab\ si è riportato un elenco dei comportamenti delle varie funzioni che
890 operano sui file rispetto ai link simbolici; specificando quali seguono il
891 link simbolico e quali possono operare direttamente sul suo contenuto.
892 \begin{table}[htb]
893   \centering
894   \footnotesize
895   \begin{tabular}[c]{|l|c|c|}
896     \hline
897     Funzione & Segue il link & Non segue il link \\
898     \hline 
899     \hline 
900     \func{access}   & $\bullet$ &           \\
901     \func{chdir}    & $\bullet$ &           \\
902     \func{chmod}    & $\bullet$ &           \\
903     \func{chown}    &           & $\bullet$ \\
904     \func{creat}    & $\bullet$ &           \\
905     \func{exec}     & $\bullet$ &           \\
906     \func{lchown}   & $\bullet$ & $\bullet$ \\
907     \func{link}     &           &           \\
908     \func{lstat}    &           & $\bullet$ \\
909     \func{mkdir}    & $\bullet$ &           \\
910     \func{mkfifo}   & $\bullet$ &           \\
911     \func{mknod}    & $\bullet$ &           \\
912     \func{open}     & $\bullet$ &           \\
913     \func{opendir}  & $\bullet$ &           \\
914     \func{pathconf} & $\bullet$ &           \\
915     \func{readlink} &           & $\bullet$ \\
916     \func{remove}   &           & $\bullet$ \\
917     \func{rename}   &           & $\bullet$ \\
918     \func{stat}     & $\bullet$ &           \\
919     \func{truncate} & $\bullet$ &           \\
920     \func{unlink}   &           & $\bullet$ \\
921     \hline 
922   \end{tabular}
923   \caption{Uso dei link simbolici da parte di alcune funzioni.}
924   \label{tab:filedir_symb_effect}
925 \end{table}
926 si noti che non si è specificato il comportamento delle funzioni che operano
927 con i file descriptor, in quanto la gestione del link simbolico viene in
928 genere effttuata dalla funzione che restituisce il file descriptor
929 (normalmente la \func{open}).
930
931 \begin{figure}[htb]
932   \centering
933   \includegraphics[width=5cm]{img/link_loop.eps}
934   \caption{Esempio di loop nel filesystem creato con un link simbolico.}
935   \label{fig:filedir_link_loop}
936 \end{figure}
937
938 Un caso comune che si può avere con i link simbolici è la creazione dei
939 cosiddetti \textit{loop}. La situazione è illustrata in \curfig, che riporta
940 la struttura della directory \file{/boot}. Come si vede si è creato al suo
941 interno un link simbolico che punta di nuovo a \file{/boot}\footnote{Questo
942   tipo di loop è stato effettuato per poter permettere a \cmd{grub} (un
943   bootloader estremamente avanzato in grado di accedere direttamente
944   attraverso vari filesystem al file da lanciare come sistema operativo) di
945   vedere i file in questa directory, che è montata su una partizione separata
946   (e che grub vedrebbe come radice), con lo stesso path con cui verrebbero
947   visti dal sistema operativo.}. 
948
949 Questo può causare problemi per tutti quei programmi che effettuassero uno
950 scan di una directory senza tener conto dei link simbolici, in quel caso
951 infatti il loop nella directory 
952
953 Un secondo punto da tenere presente è che un link simbolico può essere fatto
954 anche ad un file che non esiste; ad esempio possiamo creare un file temporaneo
955 nella nostra directory con un link del tipo:
956 \begin{verbatim}
957 $ln -s /tmp/tmp_file temporaneo
958 \end{verbatim}%$
959 ma anche se \file{/tmp/tmp\_file} non esiste. Aprendo in scrittura
960 \file{temporaneo} questo verrà scritto; ma se cercassimo di accederlo in sola
961 lettura (ad esempio con \cmd{cat}) otterremmo:
962 \begin{verbatim}
963 $ cat prova 
964 cat: prova: No such file or directory
965 \end{verbatim}%$
966 con un errore che sembra sbagliato, dato \cmd{ls} ci mostrerebbe l'esistenza
967 di \file{temporaneo}.
968
969
970 \subsection{Le funzioni \texttt{mkdir} e \texttt{rmdir}} 
971 \label{sec:filedir_dir_creat_rem}
972
973 Per creare una nuova directory si può usare la seguente funzione, omonima
974 dell'analogo comando di shell \texttt{mkdir}; per accedere ai tipi usati
975 programma deve includere il file \texttt{sys/types.h}.
976
977 \begin{prototype}{sys/stat.h}
978 {int mkdir (const char * dirname, mode\_t mode)}
979   Questa funzione crea una nuova directory vuota con il nome indicato da
980   \texttt{dirname}, assegnandole i permessi indicati da \texttt{mode}. Il nome
981   può essere indicato con il pathname assoluto o relativo.
982   
983   La funzione restituisce zero in caso di successo e -1 per un errore, in caso
984   di errore \texttt{errno} viene settata secondo i codici di errore standard
985   di accesso ai files (trattati in dettaglio in
986   \secref{sec:filedir_access_control}) ai quali si aggiungono i seguenti:
987   \begin{errlist}
988   \item \texttt{EACCESS} 
989     Non c'è il permesso di scrittura per la directory in cui si vuole inserire
990     la nuova directory.
991   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di già. 
992   \item \texttt{EMLINK} La directory in cui si vuole creare la nuova directory
993     contiene troppi file. Sotto Linux questo normalmente non avviene perché il
994     filesystem standard consente la creazione di un numero di file maggiore di
995     quelli che possono essere contenuti nell'hard-disk, ma potendo avere a che
996     fare anche con filesystem di altri sistemi questo errore può presentarsi.
997   \item \texttt{ENOSPC} Non c'è abbastanza spazio sul file system per creare
998     la nuova directory.
999   \item \texttt{EROFS} La directory su cui si vuole inserire la nuova
1000     directory è su un filesystem montato readonly.
1001   \end{errlist}
1002 \end{prototype}
1003  
1004
1005 \subsection{Accesso alle directory}
1006 \label{sec:filedir_dir_read}
1007
1008 Benché le directory siano oggetti del filesystem come tutti gli altri non ha
1009 ovviamente senso aprirle come fossero dei file di dati. Può però essere utile
1010 poterne leggere il contenuto ad esempio per fare la lista dei file che esse
1011 contengono o ricerche sui medesimi.
1012
1013 Per accedere al contenuto delle directory si usano i cosiddetti
1014 \textit{directory streams} (chiamati così per l'analogia con i file stream);
1015 la funzione \texttt{opendir} apre uno di questi stream e la funzione
1016 \texttt{readdir} legge il contenuto della directory, i cui elementi sono le
1017 \textit{directory entries} (da distinguersi da quelle della cache di cui
1018 parlavamo in \secref{sec:fileintr_vfs}) in una opportuna struttura
1019 \texttt{struct dirent}.
1020
1021
1022 \subsection{La directory di lavoro}
1023 \label{sec:filedir_work_dir}
1024
1025 A ciascun processo è associato ad una directory nel filesystem che è chiamata
1026 directory corrente o directory di lavoro (\textit{current working directory})
1027 che è quella a cui si fa riferimento quando un filename è espresso in forma
1028 relativa (relativa appunto a questa directory).
1029
1030 Quando un utente effettua il login questa directory viene settata alla
1031 cosiddetta \textit{home directory} del suo account, il comando \texttt{cd}
1032 della shell consente di cambiarla a piacere, spostandosi da una directory ad
1033 un'altra.  Siccome la directory corrente resta la stessa quando viene creato
1034 un processo figlio, la directory corrente della shell diventa anche la
1035 directory corrente di qualunque comando da essa lanciato.
1036
1037 Le funzioni qui descritte servono esaminare e cambiare la directory di lavoro
1038 corrente. 
1039
1040 \begin{prototype}{unistd.h}{char * getcwd (char * buffer, size\_t size)}
1041   Restituisce il filename completo della directory di lavoro corrente nella
1042   stringa puntata da \texttt{buffer}, che deve essere precedentemente
1043   allocata, per una dimensione massima di \texttt{size}. Si può anche
1044   specificare un puntatore nullo come \textit{buffer}, nel qual caso la
1045   stringa sarà allocata automaticamente per una dimensione pari a
1046   \texttt{size} qualora questa sia diversa da zero, o della lunghezza esatta
1047   del pathname altrimenti. In questo caso si deve ricordare di disallocare la
1048   stringa una volta cessato il suo utilizzo.
1049   
1050   La funzione restituisce il puntatore \texttt{buffer} se riesce,
1051   \texttt{NULL} se fallisce, in quest'ultimo caso la variabile
1052   \texttt{errno} è settata con i seguenti codici di errore:
1053   \begin{errlist}
1054   \item \texttt{EINVAL} L'argomento \texttt{size} è zero e \texttt{buffer} non
1055     è nullo.
1056   \item \texttt{ERANGE} L'argomento \texttt{size} è più piccolo della
1057     lunghezza del pathname. 
1058   \item \texttt{EACCESS} Manca il permesso di lettura o di ricerca su uno dei
1059     componenti del pathname (cioè su una delle directory superiori alla
1060     corrente).
1061   \end{errlist}
1062 \end{prototype}
1063
1064 Di questa funzione esiste una versione \texttt{char * getwd(char * buffer)}
1065 fatta per compatibilità all'indietro con BSD, che non consente di specificare
1066 la dimensione del buffer; esso deve essere allocato in precedenza ed avere una
1067 dimensione superiore a \texttt{PATH\_MAX} (di solito 256 bytes, vedi
1068 \secref{sec:xxx_limits}; il problema è che in Linux non esiste una dimensione
1069 superiore per un pathname, per cui non è detto che il buffer sia sufficiente a
1070 contenere il nome del file, e questa è la ragione principale per cui questa
1071 funzione è deprecata.
1072
1073 Una seconda funzione simile è \texttt{char * get\_current\_dir\_name(void)}
1074 che è sostanzialmente equivalente ad una \texttt{getcwd(NULL, 0)}, con la sola
1075 differenza che essa ritorna il valore della variabile di ambiente
1076 \texttt{PWD}, che essendo costruita dalla shell può contenere anche dei
1077 riferimenti simbolici.
1078
1079 Come già detto in unix anche le directory sono file, è possibile pertanto
1080 riferirsi ad esse tramite il file descriptor dell'interfaccia a basso livello,
1081 e non solo tramite il filename; per questo motivo ci sono due diverse funzioni
1082 per cambiare directory di lavoro.
1083
1084 \begin{prototype}{unistd.h}{int chdir (const char * pathname)}
1085   Come dice il nome (che significa \textit{change directory}) questa funzione
1086   serve a cambiare la directory di lavoro a quella specificata dal pathname
1087   contenuto nella stringa \texttt{pathname}.
1088 \end{prototype}
1089   
1090 \begin{prototype}{unistd.h}{int fchdir (int filedes)} 
1091   Analoga alla precedente, ma usa un file descriptor invece del pathname.
1092
1093   Entrambe le funzioni restituiscono zero in caso di successo e -1 per un
1094   errore, in caso di errore \texttt{errno} viene settata secondo i codici di
1095   errore standard di accesso ai files (trattati in dettaglio in
1096   \secref{sec:filedir_access_control}) ai quali si aggiunge il codice
1097   \texttt{ENOTDIR} nel caso il \texttt{filename} indichi un file che non sia
1098   una directory.
1099 \end{prototype}
1100
1101