Rinominati app_a e app_b
[gapil.git] / filedir.tex
1 \chapter{Files e directories}
2 \label{cha:files_and_dirs}
3
4 In questo capitolo tratteremo in dettaglio le modalità con cui si gestiscono
5 file e directory, ed in particolare esamineremo come è strutturato il sistema
6 base di protezioni e controllo di accesso ai file, e tutta l'interfaccia che
7 permette la manipolazione dei vari attributi di file e directory. Tutto quello
8 che riguarda invece la manipolazione del contenuto dei file è lasciato ai
9 capitoli successivi.
10
11
12
13 \section{Il controllo di accesso ai file}
14 \label{sec:filedir_access_control}
15
16 Una delle caratteristiche fondamentali di tutti i sistemi unix-like è quella
17 del controllo di accesso ai file, che viene implementato per qualunque
18 filesystem standard. In questa sezione ne esamineremo i concetti essenziali e
19 le funzioni usate per gestirne i vari aspetti.
20
21
22 \subsection{I permessi per l'accesso ai file}
23 \label{sec:filedir_perm_overview}
24
25 Il controllo di accesso ai file in unix segue un modello abbastanza semplice,
26 ma adatto alla gran parte delle esigenze, in cui si dividono i permessi su tre
27 livelli. Si tenga conto poi che quanto diremo è vero solo per filesystem di
28 tipo unix, e non è detto che sia applicabile a un filesystem
29 qualunque\footnote{ed infatti non è vero per il filesystem vfat di Windows,
30   per il quale vengono assegnati in maniera fissa con un opzione in fase di
31   montaggio}.  Esistono inoltre estensioni che permettono di implementare le
32 ACL (\textit{Access Control List}) che sono un meccanismo di controllo di
33 accesso molto più sofisticato.
34
35 Ad ogni file unix associa sempre l'utente che ne è proprietario (il cosiddetto
36 \textit{owner}) e il gruppo di appartenenza, secondo il meccanismo degli
37 identificatori di utenti e gruppi (\textsl{uid} e \textsl{gid}), e accessibili
38 da programm tramite i campi \var{st\_uid} e \var{st\_gid} della struttura
39 \var{stat} (si veda \secref{sec:filedir_stat}). Ad ogni file viene inoltre
40 associato un insieme di permessi che sono divisi in tre classi, e cioè
41 attribuiti rispettivamente all'utente proprietario del file, a un qualunque
42 utente faccia parte del gruppo cui appartiene il file, e a tutti gli altri
43 utenti.
44
45 I permessi sono espressi da un insieme di 12 bit: di questi i nove meno
46 significativi sono usati a gruppi di tre per indicare i permessi base di
47 lettura, scrittura ed esecuzione (indicati rispettivamente con le lettere
48 \textsl{w}, \textit{r} \textsl{x} nei comandi di sistema) applicabili
49 rispettivamente al proprietario, al gruppo, a tutti.  I restanti tre bit
50 (\textsl{suid}, \textsl{sgid}, e \textsl{sticky}) sono usati per indicare
51 alcune caratteristiche più complesse su cui torneremo in seguito (vedi
52 \secref{sec:filedir_suid_sgid} e \secref{sec:filedir_sticky}).
53
54 Anche i permessi sono tenuti per ciascun file (di qualunque tipo, quindi anche
55 per le fifo, i socket e i file di dispositivo) nell'inode, in opportuni bit
56 del campo \var{st\_mode} della struttura letta da \func{stat} (vedi
57 \figref{fig:filedir_stat_struct}). 
58
59
60 In genere ci si riferisce a questi permessi usando le lettere \textsl{u} (per
61 \textit{user}), \textsl{g} (per \textit{group}) e \textsl{o} (per
62 \textit{other}), inoltre se si vuole indicare tutti questi gruppi insieme si
63 usa la lettera \textsl{a} (per \textit{all}). Si tenga ben presente questa
64 distinzione, dato che in certi casi, mutuando la termimologia in uso nel VMS,
65 si parla dei permessi base come di permessi di owner, group ed all, le cui
66 iniziali possono da luogo a confuzione. Le costanti che permettono di accedere
67 al valore numerico di questi bit sono riportate in \ntab.
68
69 \begin{table}[htb]
70   \centering
71     \footnotesize
72   \begin{tabular}[c]{|c|l|}
73     \hline
74     \var{st\_mode} bit & Significato \\
75     \hline 
76     \hline 
77     \macro{S\_IRUSR}  &  \textit{user-read}, l'utente può leggere     \\
78     \macro{S\_IWUSR}  &  \textit{user-write}, l'utente può scrivere   \\
79     \macro{S\_IXUSR}  &  \textit{user-execute}, l'utente può eseguire \\ 
80     \hline              
81     \macro{S\_IRGRP}  &  \textit{group-read}, il gruppo può leggere    \\
82     \macro{S\_IWGRP}  &  \textit{group-write}, il gruppo può scrivere  \\
83     \macro{S\_IXGRP}  &  \textit{group-execute}, il gruppo può eseguire\\
84     \hline              
85     \macro{S\_IROTH}  &  \textit{other-read}, tutti possono leggere    \\
86     \macro{S\_IWOTH}  &  \textit{other-write}, tutti possono scrivere  \\
87     \macro{S\_IXOTH}  &  \textit{other-execute}, tutti possono eseguire\\
88     \hline              
89   \end{tabular}
90   \caption{I bit dei permessi di accesso ai file, come definiti in 
91     \texttt{<sys/stat.h>}}
92   \label{tab:file_bit_perm}
93 \end{table}
94
95 Questi permessi vengono usati in maniera diversa dalle varie funzioni, e a
96 seconda che si riferiscano a file, link simbolici o directory, qui ci
97 limiteremo ad un riassunto delle regole generali, entrando nei
98 dettagli più avanti.
99
100 La prima regola è che per poter accedere ad un file attraverso il suo pathname
101 occorre il permesso di esecuzione in ciascuna delle directory che compongono
102 il pathname, e lo stesso vale per aprire un file nella directory corrente (per
103 la quale appunto serve il diritto di esecuzione).
104
105 Per una directory infatti il permesso di esecuzione ha il significato
106 specifico che essa può essere attraversata nella risoluzione del pathname, ed
107 è distinto dal permesso di lettura che invece implica che si può leggere il
108 contenuto della directory. Questo significa che se si ha il permesso di
109 esecuzione senza permesso di lettura si potrà lo stesso aprire un file in una
110 directory (se si hanno i permessi opportuni per il medesimo) ma non si potrà
111 vederlo con \cmd{ls} (per crearlo occorrerà anche il permesso di scrittura per
112 la directory).
113
114 Il permesso di lettura per un file consente di aprirlo con le opzioni di sola
115 lettura (\macro{O\_RDONLY}) o di lettura-scrittura (\macro{O\_RDWR}) e
116 leggerne il contenuto. Il permesso di scrittura consente di aprire un file in
117 sola scrittura (\macro{O\_WRONLY}) o lettura-scrittura (\macro{O\_RDWR}) e
118 modificarne il contenuto, lo stesso permesso è necessario per poter troncare
119 il file con l'opzione \macro{O\_TRUNC}.
120
121 Non si può creare un file fintanto che non si disponga del permesso di
122 esecuzione e di quello di scrittura per la directory di destinazione; gli
123 stessi permessi occorrono per cancellare un file da una directory (si ricordi
124 che questo non implica necessariamente la rimozione fisica del file), non è
125 necessario nessun tipo di permesso per il file stesso (infatti esso non viene
126 toccato, viene solo modificato il contenute della directory).
127
128 Per poter eseguire un file (che sia un programma compilato od uno script di
129 shell), occorre il permesso di esecuzione per il medesimo, inoltre solo i file
130 regolari possono essere eseguiti.
131
132 La procedura con cui il kernel stabilisce se un processo possiede un certo
133 permesso (di lettura, scrittura o esecuzione) si basa sul confronto fra
134 l'utente e il gruppo a cui il file appartiene (i valori di \var{st\_uid} e
135 \var{st\_gid} accennati in precedenza) e l'\textit{effective user id},
136 l'\textit{effective group id} e gli eventuali \textit{supplementary group id}
137 del processo.
138
139 Per una spiegazione dettagliata degli identificatori associati ai processi si
140 veda \secref{sec:prochand_perms}; normalmente, a parte quanto vedremo in
141 \secref{sec:filedir_suid_sgid}, l'\textit{effective user id} e
142 l'\textit{effective group id} corrispondono a uid e gid dell'utente che ha
143 lanciato il processo, mentre i \textit{supplementary group id} sono quelli dei
144 gruppi cui l'utente appartiene.
145
146 % Quando un processo cerca l'accesso al file esso controlla i propri uid e gid
147 % confrontandoli con quelli del file e se l'operazione richiesta è compatibile
148 % con i permessi associati al file essa viene eseguita, altrimenti viene
149 % bloccata ed è restituito un errore di \texttt{EPERM}. Questo procedimento non
150 % viene eseguito per l'amministratore di sistema (il cui uid è zero) il quale
151 % a
152 % pertanto accesso senza restrizione a qualunque file del sistema.
153
154 % In realtà il procedimento è più complesso di quanto descritto in maniera
155 % elementare qui; inoltre ad un processo sono associati diversi identificatori,
156 % torneremo su questo in maggiori dettagli in seguito in
157 % \secref{sec:proc_perms}.
158
159 I passi attraverso i quali viene stabilito se il processo possiede il diritto
160 di accesso sono i seguenti:
161 \begin{itemize}
162 \item Se l'\textit{effective user id} del processo è zero (corrispondente
163   all'amministratore) l'accesso è sempre garantito senza nessun ulteriore
164   controllo. Per questo motivo \textsl{root} ha piena libertà di accesso a
165   tutti i file.
166 \item Se l'\textit{effective user id} del processo è uguale all'uid del
167   proprietario del file (nel qual caso si dice che il processo è proprietario
168   del file) allora:
169   \begin{itemize}
170   \item se il relativo\footnote{per relativo si intende il bit di user-read se
171       il processo, vuole accedere in scrittura, quello di user-write per
172       l'accesso in scrittura, etc.} bit dei permessi d'accesso dell'utente è
173     settato, l'accesso è consentito
174   \item altrimenti l'accesso è negato
175   \end{itemize}
176 \item Se l'\textit{effective group id} del processo o uno dei
177   \textit{supplementary group id} dei processi corrispondono al gid del file
178   allora:
179   \begin{itemize}
180   \item se il bit dei permessi d'accesso del gruppo è settato, l'accesso è
181     consentito, altrimenti l'accesso è negato
182   \end{itemize}
183 \item se il bit dei permessi d'accesso per tutti gli altri è settato,
184   l'accesso è consentito,  altrimenti l'accesso è negato.
185 \end{itemize}
186
187 Si tenga presente che questi passi vengono eseguiti esattamente in
188 quest'ordine. Questo vuol dire che se un processo è il proprietario di un file
189 l'accesso è consentito o negato solo sulla base dei permessi per l'utente; i
190 permessi per il gruppo non vengono neanche controllati; lo stesso vale se il
191 processo appartiene ad un gruppo appropriato, in questo caso i permessi per
192 tutti gli altri non vengono controllati.
193
194 \subsection{I flag \texttt{suid} e \texttt{sgid}}
195 \label{sec:filedir_suid_sgid}
196
197 Quandi si lancia un programma in genere l'\textit{effective user id} e
198 l'\textit{effective group id} sono settati rispettivamente all'uid e al gid
199 dell'utente che ha lanciato il programma. 
200
201
202 Ma nei dodici bit del campo \var{st\_mode} relativi ai permessi esiste un bit
203 speciale, il \textit{set-user-ID bit} o suid, che se settato fa si che quando
204 un programma viene lanciato invece di avere assegnato come \textit{effective
205   user id} l'uid di chi lo lancia, assume quello del proprietario del file.
206 Analogamente il \textit{set-group-ID bit} o sgid settato per un file ha lo
207 stesso effetto sull'\textit{effective group id}.
208
209 Questa caratteristica viene usata per permettere agli utenti normali di usare
210 programmi che abbisognano di privilegi speciali; l'esempio classico è il
211 comando \cmd{passwd} che ha la necessità di modificare il file delle password,
212 che può essere scritto solo dall'amministratore. Per questo il comando
213 \cmd{passwd} appartiene a root e ha il suid bit settato per cui quando viene
214 lanciato da un utente normale ha comunque i privilegi di root.
215
216 Chiaramente avere un processo che ha privilegi superiori a quelli che avrebbe
217 normalmente un utente comporta vari rischi, e questo tipo di programmi devono
218 essere scritti accuratamente (torneremo sull'argomento in
219 \secref{sec:prochand_perms}).
220
221 I due bit suid e sgid possono essere controllati all'interno di \var{st\_mode}
222 con l'uso delle due costanti \macro{S\_ISUID} e \macro{S\_ISGID}, definite in
223 \tabref{tab:filedir_file_mode_flags}.
224
225
226 \subsection{Il flag \texttt{sticky}}
227 \label{sec:filedir_sticky}
228
229 L'ultimo
230
231 \subsection{La titolarità di nuovi files e directory}
232 \label{sec:filedir_ownership}
233
234
235 \subsection{La funzione \texttt{access}}
236 \label{sec:filedir_access}
237
238
239 \subsection{La funzione \texttt{umask}}
240 \label{sec:filedir_umask}
241
242
243 \subsection{Le funzioni \texttt{chmod} e \texttt{fchmod}}
244 \label{sec:filedir_chmod}
245
246 \subsection{Le funzioni \texttt{chown}, \texttt{fchown} e \texttt{lchown}}
247 \label{sec:filedir_chown}
248
249
250
251
252 %La struttura fondamentale che contiene i dati essenziali relativi ai file è il
253 %cosiddetto \textit{inode}; questo conterrà informazioni come il
254 %tipo di file (file di dispositivo, directory, file di dati, per un elenco
255 %completo vedi \ntab), i permessi (vedi \secref{sec:file_perms}), le date (vedi
256 %\secref{sec:file_times}).
257
258
259
260 \section{La manipolazione delle caratteristiche dei files}
261 \label{sec:filedir_infos}
262
263 Come spiegato in \secref{sec:fileintr_filesystem} tutte le informazioni
264 generali relative alle caratteristiche di ciascun file sono mantenute
265 nell'inode. Vedremo in questa sezione come sia possibile accedervi usando la
266 funzione \texttt{stat} ed esamineremo alcune funzioni utilizzabili per
267 manipolare una parte di questa informazione. Tutto quello che invece riguarda
268 il meccanismo di controllo di accesso ad i file e le relative funzioni di
269 manipolazione sarà invece esaminanto in \secref{sec:filedir_access_control}.
270
271
272 \subsection{Le funzioni \texttt{stat}, \texttt{fstat} e \texttt{lstat}}
273 \label{sec:filedir_stat}
274
275 La lettura delle informazioni relative ai file è fatta attraverso la famiglia
276 delle funzioni \func{stat}, che è la funzione che il comando \cmd{ls} usa
277 per poter stampare tutti i dati dei files. I prototipi di queste funzioni sono
278 i seguenti:
279 \begin{functions}
280   \headdecl{sys/types.h} 
281   \headdecl{sys/stat.h} 
282   \headdecl{unistd.h}
283
284   \funcdecl{int stat(const char *file\_name, struct stat *buf)} Legge le
285   informazione del file specificato da \var{file\_name} e le inserisce in
286   \var{buf}.
287   
288   \funcdecl{int lstat(const char *file\_name, struct stat *buf)} Identica a
289   \func{stat} eccetto che se il \var{file\_name} è un link simbolico vengono
290   lette le informazioni relativa ad esso e non al file a cui fa riferimento.
291   
292   \funcdecl{int fstat(int filedes, struct stat *buf)} Identica a \func{stat}
293   eccetto che si usa con un file aperto, specificato tramite il suo file
294   descriptor \var{filedes}.
295   
296   Le funzioni restituiscono zero in caso di successo e -1 per un errore, in
297   caso di errore \texttt{errno} viene settato ai valori:
298   \begin{errlist}
299   \item \texttt{EACCESS} non c'è il permesso di accedere al file.
300   \item \texttt{ENOTDIR} una componente del pathname non è una directory.
301   \item \texttt{EMLOOP} ci sono troppi link simbolici nel pathname.
302   \item \texttt{EFAULT} i puntatori usati sono fuori dallo spazio di indirizzi
303     del processo.
304   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
305     completare l'operazione. 
306   \item \texttt{ENAMETOOLONG} il filename è troppo lungo.
307   \end{errlist}
308 \end{functions}
309
310 La struttura \texttt{stat} è definita nell'header \texttt{sys/stat.h} e in
311 generale dipende dall'implementazione, la versione usata da Linux è mostrata
312 in \nfig, così come riportata dalla man page (in realtà la definizione
313 effettivamente usata nel kernel dipende dall'architettura e ha altri campi
314 riservati per estensioni come tempi più precisi, o per il padding dei campi).
315
316 \begin{figure}[!htb]
317   \footnotesize
318   \centering
319   \begin{minipage}[c]{15cm}
320     \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
321 struct stat {
322     dev_t         st_dev;      /* device */
323     ino_t         st_ino;      /* inode */
324     mode_t        st_mode;     /* protection */
325     nlink_t       st_nlink;    /* number of hard links */
326     uid_t         st_uid;      /* user ID of owner */
327     gid_t         st_gid;      /* group ID of owner */
328     dev_t         st_rdev;     /* device type (if inode device) */
329     off_t         st_size;     /* total size, in bytes */
330     unsigned long st_blksize;  /* blocksize for filesystem I/O */
331     unsigned long st_blocks;   /* number of blocks allocated */
332     time_t        st_atime;    /* time of last access */
333     time_t        st_mtime;    /* time of last modification */
334     time_t        st_ctime;    /* time of last change */
335 };
336     \end{lstlisting}
337   \end{minipage} 
338   \normalsize 
339   \caption{La struttura \texttt{stat} per la lettura delle informazioni dei 
340     file}
341   \label{fig:filedir_stat_struct}
342 \end{figure}
343
344 Si noti come i vari membri della struttura siano specificati come tipi nativi
345 del sistema (di quelli definiti in \tabref{tab:xxx_sys_types}, e dichiarati in
346 \texttt{sys/types.h}). 
347
348
349 \subsection{I tipi di file}
350 \label{sec:filedir_file_types}
351
352 Come riportato in \tabref{tab:fileintr_file_types} in Linux oltre ai file e
353 alle directory esistono vari altri oggetti che possono stare su un filesystem;
354 il tipo di file è ritornato dalla \texttt{stat} nel campo \texttt{st\_mode}.
355
356 Dato che il valore numerico può variare a seconda delle implementazioni, lo
357 standard POSIX definisce un insieme di macro per verificare il tipo di files,
358 queste vengono usate anche da Linux che supporta pure le estensioni per link
359 simbolici e socket definite da BSD, l'elenco completo di tutte le macro
360 definite in GNU/Linux è riportato in \ntab:
361 \begin{table}[htb]
362   \centering
363   \footnotesize
364   \begin{tabular}[c]{|l|l|}
365     \hline
366     Macro & Tipo del file \\
367     \hline
368     \hline
369     \macro{S\_ISREG(m)}  & file regolare \\
370     \macro{S\_ISDIR(m)}  & directory \\
371     \macro{S\_ISCHR(m)}  & device a caraetteri \\
372     \macro{S\_ISBLK(m)}  & device a blocchi\\
373     \macro{S\_ISFIFO(m)} & fifo \\
374     \macro{S\_ISLNK(m)}  & link simbolico \\
375     \macro{S\_ISSOCK(m)} & socket \\
376     \hline    
377   \end{tabular}
378   \caption{Macro per i tipi di file (definite in \texttt{sys/stat.h})}
379   \label{tab:filedir_file_type_macro}
380 \end{table}
381
382 Oltre a queste macro è possibile usare direttamente il valore di
383 \var{st\_mode} per ricavare il significato dei vari bit in esso memorizzati,
384 per questo sempre in \texttt{sys/stat.h} sono definiti i flag riportati in
385 \ntab:
386 \begin{table}[htb]
387   \centering
388   \footnotesize
389   \begin{tabular}[c]{|l|c|l|}
390     \hline
391     Flag & Valore & Significato \\
392     \hline
393     \hline
394     \macro{S\_IFMT}   &  0170000 & bitmask per i bit del tipo di file \\
395     \macro{S\_IFSOCK} &  0140000 & socket             \\
396     \macro{S\_IFLNK}  &  0120000 & link simbolico     \\
397     \macro{S\_IFREG}  &  0100000 & file regolare      \\ 
398     \macro{S\_IFBLK}  &  0060000 & device a blocchi   \\
399     \macro{S\_IFDIR}  &  0040000 & directory          \\ 
400     \macro{S\_IFCHR}  &  0020000 & device a caratteri \\
401     \macro{S\_IFIFO}  &  0010000 & fifo               \\
402     \hline
403     \macro{S\_ISUID}  &  0004000 & set UID bit   \\
404     \macro{S\_ISGID}  &  0002000 & set GID bit   \\
405     \macro{S\_ISVTX}  &  0001000 & sticky bit    \\
406     \hline
407     \macro{S\_IRWXU}  &  00700   & bitmask per i permessi del proprietario  \\
408     \macro{S\_IRUSR}  &  00400   & il proprietario ha permesso di lettura   \\
409     \macro{S\_IWUSR}  &  00200   & il proprietario ha permesso di scrittura \\
410     \macro{S\_IXUSR}  &  00100   & il proprietario ha permesso di esecuzione\\
411     \hline
412     \macro{S\_IRWXG}  &  00070   & bitmask per i permessi del gruppo        \\
413     \macro{S\_IRGRP}  &  00040   & il gruppo ha permesso di lettura         \\
414     \macro{S\_IWGRP}  &  00020   & il gruppo ha permesso di scrittura       \\
415     \macro{S\_IXGRP}  &  00010   & il gruppo ha permesso di esecuzione      \\
416     \hline
417     \macro{S\_IRWXO}  &  00007   & bitmask per i permessi di tutti gli altri\\
418     \macro{S\_IROTH}  &  00004   & gli altri hanno permesso di lettura      \\
419     \macro{S\_IWOTH}  &  00002   & gli altri hanno permesso di esecuzione   \\
420     \macro{S\_IXOTH}  &  00001   & gli altri hanno permesso di esecuzione   \\
421     \hline    
422   \end{tabular}
423   \caption{Costanti per l'identificazione dei vari bit che compongono il campo
424     \var{st\_mode} (definite in \texttt{sys/stat.h})}
425   \label{tab:filedir_file_mode_flags}
426 \end{table}
427
428 Il primo valore definisce la maschera dei bit usati nei quali viene
429 memorizzato il tipo di files, mentre gli altri possono essere usati per
430 effettuare delle selezioni sul tipo di file voluto, combinando opportunamente
431 i vari flag; ad esempio se si volesse controllare se un file è una directory o
432 un file ordinario si potrebbe definire la condizione:
433 \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
434 #define IS_FILE_DIR(x) (((x) & S_IFMT) & (S_IFDIR | S_IFREG))
435 \end{lstlisting}
436 in cui prima si estraggono da \var{st\_mode} i bit relativi al tipo di file e
437 poi si effettua il confronto con la combinazione di tipi scelta.
438
439 \subsection{La dimensione dei file}
440 \label{sec:filedir_file_size}
441
442 Il membro \var{st\_size} contiene la dimensione del file in bytes (se il file
443 è un file normale, nel caso di un link simbolico al dimensione è quella del
444 pathname che contiene). 
445
446 Il campo \var{st\_blocks} definisce la lunghezza del file in blocchi di 512
447 bytes. Il campo \var{st\_blksize} infine definisce la dimensione preferita per
448 i trasferimenti sui file (che è la dimensione usata anche dalle librerie del C
449 per l'interfaccia degli stream); scrivere sul file a blocchi di dati di
450 dimensione inferiore sarebbe inefficiente.
451
452 Si tenga conto che lunghezza del file riportata in \var{st\_size} non è detto
453 che corrisponda all'occupazione dello spazio su disco per via della possibile
454 esistenza dei cosiddetti \textsl{buchi} (detti normalmente \textit{holes}) che
455 si formano tutte le volte che si va a scrivere su un file dopo aver eseguito
456 una \func{seek} (vedi \secref{sec:fileunix_lseek}) oltre la sua conclusione
457 corrente.
458
459 In tal caso si avranno differenti risultati a seconda del modi in cui si
460 calcola la lunghezza del file, ad esempio il comando \cmd{du}, (che riporta il
461 numero di blocchi occupati) potrà dare una dimensione inferiore, mentre se si
462 legge dal file (ad esempio usando \cmd{wc -c}), dato che in tal caso per le
463 parti non scritte vengono restituiti degli zeri, si avrà lo stesso risultato
464 di \cmd{ls}.
465
466 Se è sempre possibile allargare un file scrivendoci sopra od usando la
467 funzione \func{seek} per spostarsi oltre la sua fine. Esistono però anche casi
468 in cui si può avere bisogno di effettuare un troncamento scartando i dati al
469 di là della dimensione scelta come nuova fine del file.
470
471 Un file può essere troncato a zero aprendolo con il flag \macro{O\_TRUNC}, ma
472 questo è un caso particolare; per qualunque altra dimensione si possono usare
473 le due funzioni:
474 \begin{functions}
475   \headdecl{unistd.h} \funcdecl{int truncate(const char *file\_name, off\_t
476     length)} Fa si che la dimensione del file \var{file\_name} sia troncata ad
477     un valore massimo specificato da \var{lenght}. 
478   
479   \funcdecl{int ftruncate(int fd, off\_t length))} Identica a \func{truncate}
480   eccetto che si usa con un file aperto, specificato tramite il suo file
481   descriptor \var{fd}, 
482   
483   Le funzioni restituiscono zero in caso di successo e -1 per un errore, in
484   caso di errore \texttt{errno} viene settato ai valori:
485   \begin{errlist}
486   \item \texttt{EACCESS} non c'è il permesso di accedere al file.
487   \item \texttt{ENOTDIR} una componente del pathname non è una directory.
488   \item \texttt{EMLOOP} ci sono troppi link simbolici nel pathname.
489   \item \texttt{EFAULT} i puntatori usati sono fuori dallo spazio di indirizzi
490     del processo.
491   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
492     completare l'operazione. 
493   \item \texttt{ENOENT} il file non esiste. 
494   \item \texttt{ENAMETOOLONG} il filename è troppo lungo.
495   \end{errlist}
496 \end{functions}
497
498 Se il file è più lungo della lunghezza specificata i dati in eccesso saranno
499 perduti; il comportamento in caso di lunghezza inferiore non è specificato e
500 dipende dall'implementazione: il file può essere lasciato invariato o esteso
501 fino alla lunghezza scelta; in quest'ultimo caso lo spazio viene riempito con
502 zeri (e in genere si ha la creazione di un hole nel file).
503
504
505 \subsection{I tempi dei file}
506 \label{sec:filedir_file_times}
507
508 Il sistema mantiene per ciascun file tre tempi. Questi sono registrati
509 nell'inode insieme agli altri attibuti del file e possono essere letti tramite
510 la funzione \func{stat}, che li restituisce attraverso tre campi della
511 struttura in \figref{fig:filedir_stat_struct}. Il significato di detti tempi e
512 dei relativi campi è riportato nello schema in \ntab:
513
514 \begin{table}[htb]
515   \centering
516   \begin{tabular}[c]{|c|l|l|c|}
517     \hline
518     Membro & Significato & Funzione&opzione \\
519     \hline
520     \hline
521     \var{st\_atime}& ultimo accesso ai dati del file &\func{read}& \cmd{-u}\\ 
522     \var{st\_mtime}& ultima modifica ai dati del file &\func{write}& default\\ 
523     \var{st\_ctime}& ultima modifica ai dati dell'inode&\func{chmod}, 
524     \func{utime} & \cmd{-c} \\ 
525     \hline
526   \end{tabular}
527   \caption{I tre tempi associati a ciascun file}
528   \label{tab:filedir_file_times}
529 \end{table}
530
531 Il primo punto da tenere presente è la differenza fra il cosiddetto tempo di
532 modifica (il \textit{modification time} \var{st\_mtime}) e il tempo di
533 cambiamento di stato (il \textit{chage time} \var{st\_ctime}). Il primo
534 infatti fa riferimento ad una modifica del contenuto di un file, mentre il
535 secondo ad una modifica dell'inode; siccome esistono molte operazioni (come la
536 funzione \func{link} e molte altre che vedremo in seguito) che modificano solo
537 le informazioni contenute nell'inode senza toccare il file, diventa necessario
538 l'utilizzo di un altro tempo.
539
540 Il sistema non tiene conto dell'ultimo accesso all'inode, pertanto funzioni
541 come \func{access} o \func{stat} non hanno alcuna influenza sui tre tempi. Il
542 tempo di ultimo accesso viene di solito usato per cancellare i file che non
543 servono più dopo un certo lasso di tempo (ad esempio \cmd{leafnode} cancella i
544 vecchi articoli sulla base di questo tempo).  
545
546 Il tempo di ultima modifica invece viene usato da \cmd{make} per decidere
547 quali file necessitano di essere ricompilati o (talvolta insieme anche al
548 tempo di cambiamento di stato) per decidere quali file devono essere
549 archiviati per il backup. Il comando \cmd{ls} (quando usato con le opzioni
550 \cmd{-l} o \cmd{-t}) mostra i tempi dei file secondo lo schema riportato
551 nell'ultima colonna di \curtab.
552
553 L'effetto delle varie funzioni di manipolazione dei file sui tempi è
554 illustrato in \ntab. Si sono riportati gli effetti sia per il file a cui si fa
555 riferimento, sia per la directory che lo contiene; questi ultimi possono
556 essere capiti se si tiene conto di quanto già detto, e cioè che anche le
557 directory sono files, che il sistema tratta in maniera del tutto analoga agli
558 altri. 
559
560 Per questo motivo tutte le volte che compiremo una operazione su un file che
561 comporta una modifica della sua directory entry, andremo anche a scrivere
562 sulla directory che lo contiene cambiandone il tempo di modifica. Un esempio
563 di questo può essere la cancellazione di un file, mentre leggere o scrivere o
564 cambiarne i permessi ha effetti solo sui tempi del file.
565
566 \begin{table}[htb]
567   \centering
568   \footnotesize
569   \begin{tabular}[c]{|l|c|c|c|c|c|c|l|}
570     \hline
571     \multicolumn{1}{|c|}{Funzione} 
572     &\multicolumn{3}{p{2cm}}{File o directory di riferimento}
573     &\multicolumn{3}{p{2cm}}{Directory genitrice del riferimento} 
574     &\multicolumn{1}{|c|}{Note} \\
575     \cline{2-7}
576     &  \textsl{(a)} &  \textsl{(m)}&  \textsl{(c)} 
577     &  \textsl{(a)} &  \textsl{(m)}&  \textsl{(c)}& \\
578     \hline
579     \hline
580     \func{chmod}, \func{fchmod} 
581     &         &         &$\bullet$&         &         &         & \\
582     \func{chown}, \func{fchown} 
583     &         &         &$\bullet$&         &         &         & \\
584     \func{creat}  
585     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$&  con 
586     \macro{O\_CREATE} \\    \func{creat}  
587     &         &$\bullet$&$\bullet$&         &$\bullet$&$\bullet$&   
588     con \macro{O\_TRUNC} \\    \func{exec}  
589     &$\bullet$&         &         &         &         &         & \\
590     \func{lchown}  
591     &         &         &$\bullet$&         &         &         & \\
592     \func{link}
593     &         &         &$\bullet$&         &$\bullet$&$\bullet$& \\
594     \func{mkdir}
595     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$& \\
596     \func{mkfifo}
597     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$& \\
598     \func{open}
599     &$\bullet$&$\bullet$&$\bullet$&         &$\bullet$&$\bullet$& con 
600     \macro{O\_CREATE} \\    \func{open}
601     &         &$\bullet$&$\bullet$&         &         &         & con 
602     \macro{O\_TRUNC}  \\    \func{pipe}
603     &$\bullet$&$\bullet$&$\bullet$&         &         &         & \\
604     \func{read}
605     &$\bullet$&         &         &         &         &         & \\
606     \func{remove}
607     &         &         &$\bullet$&         &$\bullet$&$\bullet$& using 
608     \func{unlink}\\    \func{remove}
609     &         &         &         &         &$\bullet$&$\bullet$& using 
610     \func{rmdir}\\ \func{rename}
611     &         &         &$\bullet$&         &$\bullet$&$\bullet$& per entrambi
612     gli argomenti\\ \func{rmdir}
613     &         &         &         &         &$\bullet$&$\bullet$& \\ 
614     \func{truncate}, \func{ftruncate}
615     &         &$\bullet$&$\bullet$&         &         &         & \\ 
616     \func{unlink}
617     &         &         &$\bullet$&         &$\bullet$&$\bullet$& \\ 
618     \func{utime}
619     &$\bullet$&$\bullet$&$\bullet$&         &         &         & \\ 
620     \func{write}
621     &         &$\bullet$&$\bullet$&         &         &         & \\ 
622     \hline
623   \end{tabular}
624   \caption{Effetti delle varie funzioni su tempi di ultimo accesso 
625     \textsl{(a)}, ultima modifica \textsl{(m)}  e ultimo cambiamento
626     \textsl{(c)}}
627   \label{tab:filedir_times_effects}  
628 \end{table}
629
630 Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di
631 creazione del file, usato da molti altri sistemi operativi, che in unix non
632 esiste.
633
634
635 \subsection{La funzione \texttt{utime}}
636 \label{sec:filedir_utime}
637
638 I tempi di ultimo accesso e modifica possono essere cambiati usando la
639 funzione \func{utime}, il cui prototipo è:
640
641 \begin{prototype}{utime.h}
642 {int utime(const char * filename, struct utimbuf *times)} 
643
644 Cambia i tempi di ultimo accesso e modifica dell'inode specificato da
645 \var{filename} secondo i campi \var{actime} e \var{modtime} di \var{times}. Se
646 questa è \macro{NULL} allora viene usato il tempo corrente.
647
648 La funzione restituisce zero in caso di successo e -1 in caso di errore, nel
649 qual caso \var{errno} è settata opportunamente.
650 \begin{errlist}
651 \item \texttt{EACCESS} non si ha il permesso di scrittura sul file.
652 \item \texttt{ENOENT} \var{filename} non esiste.
653 \end{errlist}
654 \end{prototype}
655  
656 La struttura \var{utimebuf} usata da \func{utime} è definita come:
657 \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
658 struct utimbuf {
659         time_t actime;  /* access time */
660         time_t modtime; /* modification time */
661 };
662 \end{lstlisting}
663
664 L'effetto della funzione e i privilegi necessari per eseguirla dipendono da
665 cosa è l'argomento \var{times}; se è \textit{NULL} la funzione setta il tempo
666 corrente ed è sufficiente avere accesso in scrittura al file; se invece si è
667 specificato un valore la funzione avrà successo solo se si è proprietari del
668 file (o si hanno i privilegi di amministratore).
669
670 Si tenga presente che non è comunque possibile specificare il tempo di
671 cambiamento di stato del file, che viene comunque cambiato dal kernel tutte le
672 volte che si modifica l'inode (quindi anche alla chiamata di \func{utime}).
673 Questo serve anche come misura di sicurezza per evitare che si possa
674 modificare un file nascondendo completamente le proprie tracce.  In realtà la
675 cosa resta possibile, se si è in grado di accedere al device, scrivendo
676 direttamente sul disco senza passare attraverso il filesystem, ma ovviamente è
677 molto più complicato da realizzare.
678
679
680
681
682
683
684 \section{La manipolazione di file e directory}
685
686 Come già accennato in \secref{sec:fileintr_filesystem} in un sistema unix-like
687 i file hanno delle caratteristiche specifiche dipendenti dall'architettura del
688 sistema, esamineremo qui allora le funzioni usate per la creazione di link
689 simbolici e diretti  e per la gestione delle directory, approfondendo quanto
690 già accennato in precedenza.
691
692
693 \subsection{Le funzioni \texttt{link} e \texttt{unlink}}
694 \label{sec:fileintr_link}
695
696 Una delle caratteristiche comuni a vari sistemi operativi è quella di poter
697 creare dei nomi fittizi (alias o collegamenti) per potersi riferire allo
698 stesso file accedendovi da directory diverse. Questo è possibile anche in
699 ambiente unix, dove tali collegamenti sono usualmente chiamati \textit{link},
700 ma data la struttura del sistema ci sono due metodi sostanzialmente diversi
701 per fare questa operazione.
702
703 Come spiegato in \secref{sec:fileintr_architecture} l'accesso al contenuto di
704 un file su disco avviene attraverso il suo inode, e il nome che si trova in
705 una directory è solo una etichetta associata ad un puntatore a detto inode.
706 Questo significa che la realizzazione di un link è immediata in quanto uno
707 stesso file può avere tanti nomi diversi allo stesso tempo, dati da
708 altrettante diverse associazioni allo stesso inode; si noti poi che nessuno di
709 questi nomi viene ad assumere una particolare preferenza rispetto agli altri.
710
711 Per aggiungere un nome ad un inode si utilizza la funzione \texttt{link}; si
712 suole chiamare questo tipo di associazione un collegamento diretto (o
713 \textit{hard link}).  Il prototipo della funzione e le sue caratteristiche
714 principali, come risultano dalla man page, sono le seguenti:
715 \begin{prototype}{unistd.h}
716 {int link(const char * oldpath, const char * newpath)}
717   Crea un nuovo collegamento diretto al file indicato da \texttt{oldpath}
718   dandogli nome \texttt{newpath}.
719   
720   La funzione restituisce zero in caso di successo e -1 in caso di errore. La
721   variabile \texttt{errno} viene settata opportunamente, i principali codici
722   di errore sono:
723   \begin{errlist}
724   \item \texttt{EXDEV} \texttt{oldpath} e \texttt{newpath} non sono sullo
725     stesso filesystem.
726   \item \texttt{EPERM} il filesystem che contiene \texttt{oldpath} e
727     \texttt{newpath} non supporta i link diretti o è una directory.
728   \item \texttt{EEXIST} un file (o una directory) con quel nome esiste di
729     già.
730   \item \texttt{EMLINK} ci sono troppi link al file \texttt{oldpath} (il
731     numero massimo è specificato dalla variabile \texttt{LINK\_MAX}, vedi
732     \secref{sec:xxx_limits}).
733   \end{errlist}
734   
735 \end{prototype}
736
737 La creazione di un nuovo collegamento diretto non copia il contenuto del file,
738 ma si limita ad aumentare di uno il numero di referenze al file (come si può
739 controllare con il campo \var{st\_nlink} di \var{stat}) aggiungendo il nuovo
740 nome ai precedenti. Si noti che uno stesso file può essere così richiamato in
741 diverse directory.
742  
743 Per quanto dicevamo in \secref{sec:fileintr_filesystem} la creazione del
744 collegamento diretto è possibile solo se entrambi i pathname sono nello stesso
745 filesystem; inoltre il filesystem deve supportare i collegamenti diretti (non è
746 il caso ad esempio del filesystem \texttt{vfat} di windows).
747
748 La funzione opera sui file ordinari, come sugli altri oggetti del filesystem,
749 in alcuni filesystem solo l'amministratore è in grado di creare un
750 collegamento diretto ad un'altra directory, questo lo si fa perché in questo
751 caso è possibile creare dei circoli nel filesystem (vedi
752 \secref{sec:fileintr_symlink}) che molti programmi non sono in grado di
753 gestire e la cui rimozione diventa estremamente complicata (in genere occorre
754 far girare il programma \texttt{fsck} per riparare il filesystem); data la sua
755 pericolosità in generale nei filesystem usati in Linux questa caratteristica è
756 stata disabilitata, e la funzione restituisce l'errore \texttt{EPERM}.
757
758 La rimozione di un file (o più precisamente della voce che lo referenzia) si
759 effettua con la funzione \texttt{unlink}; il suo prototipo è il seguente:
760
761 \begin{prototype}{unistd.h}{int unlink(const char * pathname)}
762   Cancella il nome specificato dal pathname nella relativa directory e
763   decrementa il numero di riferimenti nel relativo inode. Nel caso di link
764   simbolico cancella il link simbolico; nel caso di socket, fifo o file di
765   dispositivo rimuove il nome, ma come per i file i processi che hanno aperto
766   uno di questi oggetti possono continuare ad utilizzarlo.
767   
768   La funzione restituisce zero in caso di successo e -1 per un errore, nel
769   qual caso il file non viene toccato. La variabile \texttt{errno} viene
770   settata secondo i seguenti codici di errore:
771   \begin{errlist}
772   \item \texttt{EISDIR} \var{pathname} si riferisce ad una directory
773     (valore specifico ritornato da linux che non consente l'uso di
774     \texttt{unlink} con le directory, e non conforme allo standard POSIX, che
775     prescrive invece l'uso di \texttt{EPERM} in caso l'operazione non sia
776     consnetita o il processo non abbia privilegi sufficienti).
777   \item \texttt{EROFS} \var{pathname} è su un filesystem montato in sola
778   lettura.
779   \item \texttt{EISDIR} \var{pathname} fa riferimento a una directory.
780   \end{errlist}
781 \end{prototype}
782
783 Per cancellare una voce in una directory è necessario avere il permesso di
784 scrittura su di essa (dato che si va a rimuovere una voce dal suo contenuto) e
785 il diritto di esecuzione sulla directory che la contiene (torneremo in
786 dettaglio sui permessi e gli attributi fra poco), se inoltre lo
787 \textit{sticky} bit è settato occorrerà anche essere proprietari del file o
788 proprietari della directory (o root, per cui nessuna delle restrizioni è
789 applicata).
790
791 Una delle caratteristiche di queste funzioni è che la creazione/rimozione
792 della nome dalla directory e l'incremento/decremento del numero di riferimenti
793 nell'inode deve essere una operazione atomica (cioè non interrompibile da
794 altri) processi, per questo entrambe queste funzioni sono realizzate tramite
795 una singola system call.
796
797 Si ricordi infine che il file non viene eliminato dal disco fintanto che tutti
798 i riferimenti ad esso sono stati cancellati, solo quando il \textit{link
799   count} mantenuto nell'inode diventa zero lo spazio occupato viene rimosso. A
800 questo però si aggiunge una altra condizione, e cioè che non ci siano processi
801 che abbiano detto file aperto. Come accennato questa proprietà viene spesso
802 usata per essere sicuri di non lasciare file temporanei su disco in caso di
803 crash dei programmi; la tecnica è quella di aprire il file e chiamare
804 \texttt{unlink} subito dopo.
805
806 \subsection{Le funzioni \texttt{remove} e \texttt{rename}}
807 \label{sec:fileintr_remove}
808
809 Al contrario di quanto avviene con altri unix in Linux non è possibile usare
810 \texttt{unlink} sulle directory, per cancellare una directory si può usare la
811 funzione \texttt{rmdir} (vedi \secref{sec:filedir_dir_creat_rem}), oppure la
812 funzione \texttt{remove}. Questa è la funzione prevista dallo standard ANSI C
813 per cancellare un file o una directory (e funziona anche per i sistemi che non
814 supportano i link diretti), che per i file è identica alla \texttt{unlink} e
815 per le directory è identica alla \texttt{rmdir}:
816
817 \begin{prototype}{stdio.h}{int remove(const char *pathname)}
818   Cancella un nome dal filesystem. Usa \texttt{unlink} per i file e
819   \texttt{rmdir} per le directory.
820   
821   La funzione restituisce zero in caso di successo e -1 per un errore, nel
822   qual caso il file non viene toccato. Per i codici di errori vedi quanto
823   riportato nella descrizione di \texttt{unlink} e \texttt{rmdir}.
824 \end{prototype}
825
826 Per cambiare nome ad un file si usa invece la funzione \texttt{rename}, il
827 vantaggio nell'uso di questa funzione al posto della chiamata successiva di
828 \texttt{unlink} e \texttt{link} è che l'operazione è eseguita atomicamente, in
829 questo modo non c'è la possibilità che un processo che cerchi di accedere al
830 nuovo nome dopo che il vecchio è stato cambiato lo trovi mancante.
831
832 \begin{prototype}{stdio.h}
833 {int rename(const char *oldpath, const char *newpath)}
834   Rinomina un file, spostandolo fra directory diverse quando richiesto.
835
836   La funzione restituisce zero in caso di successo e -1 per un errore, nel
837   qual caso il file non viene toccato. La variabile \texttt{errno} viene
838   settata secondo i seguenti codici di errore:
839   \begin{errlist} 
840   \item \texttt{EISDIR} \texttt{newpath} è una directory già esistente mentre
841     \texttt{oldpath} non è una directory. 
842   \item \texttt{EXDEV} \texttt{oldpath} e \texttt{newpath} non sono sullo
843     stesso filesystem. 
844   \item \texttt{ENOTEMPTY} \texttt{newpath} è una directory già esistente e
845     non vuota.
846   \item \texttt{EBUSY} o \texttt{oldpath} o \texttt{newpath} sono in uso da
847     parte di qualche processo (come directory di lavoro o come root) o del
848     sistema (come mount point).
849   \item \texttt{EINVAL} \texttt{newpath} contiene un prefisso di
850     \texttt{oldpath} o più in generale si è cercato di creare una directory
851     come sottodirectory di se stessa.
852   \item \texttt{EMLINK} \texttt{oldpath} ha già il massimo numero di link
853     consentiti o è una directory e la directory che contiene \texttt{newpath}
854     ha già il massimo numero di link. 
855   \item \texttt{ENOTDIR} Uno dei componenti dei pathname non è una directory
856     o\texttt{oldpath} è una directory e \texttt{newpath} esiste e non è una
857     directory.
858   \item \texttt{EFAULT} o \texttt{oldpath} o \texttt{newpath} è fuori dello
859     spazio di indirizzi del processo.
860   \item \texttt{EACCESS} Non c'è il permesso di scrittura per la directory in
861     cui si vuole creare il nuovo link o una delle directory del pathname non
862     consente la ricerca (permesso di esecuzione).
863   \item \texttt{EPERM} le directory contenenti \texttt{oldpath} o
864     \texttt{newpath} hanno lo sticky bit attivo e i permessi del processo non
865     consentono rispettivamente la cancellazione e la creazione del file, o il
866     filesystem non supporta i link.
867   \item \texttt{ENAMETOOLONG} uno dei pathname è troppo lungo.
868   \item \texttt{ENOENT} Uno dei componenti del pathname non esiste o è un link
869     simbolico spezzato.
870   \item \texttt{ENOMEM} il kernel non ha a disposizione memoria sufficiente a
871     completare l'operazione. 
872   \item \texttt{EROFS} I file sono su un filesystem montato in sola lettura.
873   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione del
874     pathname.
875   \item \texttt{ENOSPC} Il device di destinazione non ha più spazio per la
876     nuova voce. 
877   \end{errlist}    
878 \end{prototype}
879
880 \subsection{I link simbolici}
881 \label{sec:fileintr_symlink}
882
883 Siccome la funzione \texttt{link} crea riferimenti agli inodes, essa può
884 funzionare soltanto per file che risiedono sullo stesso filesystem, dato che
885 in questo caso è garantita l'unicità dell'inode, e solo per un filesystem di
886 tipo unix.  Inoltre in Linux non è consentito eseguire un link diretto ad una
887 directory.
888
889 Per ovviare a queste limitazioni i sistemi unix supportano un'altra forma di
890 link (i cosiddetti \textit{soft link} o \textit{symbolic link}), che sono,
891 come avviene in altri sistemi operativi, dei file che contengono il
892 semplicemente il riferimento ad un altro file (o directory). In questo modo è
893 possibile effettuare link anche attraverso filesystem diversi e a directory, e
894 pure a file che non esistono ancora.
895
896 Il sistema funziona in quanto i link simbolici sono contrassegnati come tali
897 al kernel (analogamente a quanto avviene per le directory) per cui la chiamata
898 ad una \texttt{open} o una \texttt{stat} su un link simbolico comporta la
899 lettura del contenuto del medesimo e l'applicazione della funzione al file
900 specificato da quest'ultimo. Invece altre funzioni come quelle per cancellare
901 o rinominare i file operano direttamente sul link simbolico (per l'elenco vedi
902 \ntab). Inoltre esistono funzioni apposite, come la \texttt{readlink} e la
903 \texttt{lstat} per accedere alle informazioni del link invece che a quelle del
904 file a cui esso fa riferimento.
905
906 Le funzioni per operare sui link simbolici sono le seguenti, esse sono tutte
907 dichiarate nell'header file \texttt{unistd.h}.
908
909 \begin{prototype}{unistd.h}
910 {int symlink(const char * oldname, const char * newname)}
911   Crea un nuovo link simbolico al file indicato da \texttt{oldname} dandogli
912   nome \texttt{newname}.
913   
914   La funzione restituisce zero in caso di successo e -1 per un errore, in caso
915   di errore. La variabile \texttt{errno} viene settata secondo i codici di
916   errore standard di accesso ai files (trattati in dettaglio in
917   \secref{sec:filedir_access_control}) ai quali si aggiungono i seguenti:
918   \begin{errlist}
919   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di
920     già.
921   \item \texttt{EROFS} La directory su cui si vuole inserire il nuovo link è
922     su un filesystem montato readonly.
923   \item \texttt{ENOSPC} La directory o il filesystem in cui si vuole creare il
924     link è piena e non c'è ulteriore spazio disponibile.
925   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione di
926     \texttt{oldname} o di \texttt{newname}.
927   \end{errlist}
928 \end{prototype}
929
930 Dato che la funzione \texttt{open} segue i link simbolici, è necessaria usare
931 un'altra funzione quando si vuole leggere il contenuto di un link simbolico,
932 questa funzione è la:
933
934 \begin{prototype}{unistd.h}
935 {int readlink(const char * path, char * buff, size\_t size)} 
936   Legge il contenuto del link simbolico indicato da \texttt{path} nel buffer
937   \texttt{buff} di dimensione \texttt{size}. Non chiude la stringa con un
938   carattere nullo e la tronca a \texttt{size} nel caso il buffer sia troppo
939   piccolo per contenerla.
940   
941   La funzione restituisce il numero di caratteri letti dentro \texttt{buff} o
942   -1 per un errore, in caso di errore. La variabile \texttt{errno} viene
943   settata secondo i codici di errore:
944   \begin{errlist}
945   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di
946     già.
947   \item \texttt{EROFS} La directory su cui si vuole inserire il nuovo link è
948     su un filesystem montato readonly.
949   \item \texttt{ENOSPC} La directory o il filesystem in cui si vuole creare il
950     link è piena e non c'è ulteriore spazio disponibile.
951   \item \texttt{ELOOP} Ci sono troppi link simbolici nella risoluzione di
952     \texttt{oldname} o di \texttt{newname}.
953   \end{errlist}
954 \end{prototype}
955
956 In \ntab\ si è riportato un elenco dei comportamenti delle varie funzioni che
957 operano sui file rispetto ai link simbolici; specificando quali seguono il
958 link simbolico e quali possono operare direttamente sul suo contenuto.
959 \begin{table}[htb]
960   \centering
961   \footnotesize
962   \begin{tabular}[c]{|l|c|c|}
963     \hline
964     Funzione & Segue il link & Non segue il link \\
965     \hline 
966     \hline 
967     \func{access}   & $\bullet$ &           \\
968     \func{chdir}    & $\bullet$ &           \\
969     \func{chmod}    & $\bullet$ &           \\
970     \func{chown}    &           & $\bullet$ \\
971     \func{creat}    & $\bullet$ &           \\
972     \func{exec}     & $\bullet$ &           \\
973     \func{lchown}   & $\bullet$ & $\bullet$ \\
974     \func{link}     &           &           \\
975     \func{lstat}    &           & $\bullet$ \\
976     \func{mkdir}    & $\bullet$ &           \\
977     \func{mkfifo}   & $\bullet$ &           \\
978     \func{mknod}    & $\bullet$ &           \\
979     \func{open}     & $\bullet$ &           \\
980     \func{opendir}  & $\bullet$ &           \\
981     \func{pathconf} & $\bullet$ &           \\
982     \func{readlink} &           & $\bullet$ \\
983     \func{remove}   &           & $\bullet$ \\
984     \func{rename}   &           & $\bullet$ \\
985     \func{stat}     & $\bullet$ &           \\
986     \func{truncate} & $\bullet$ &           \\
987     \func{unlink}   &           & $\bullet$ \\
988     \hline 
989   \end{tabular}
990   \caption{Uso dei link simbolici da parte di alcune funzioni.}
991   \label{tab:filedir_symb_effect}
992 \end{table}
993 si noti che non si è specificato il comportamento delle funzioni che operano
994 con i file descriptor, in quanto la gestione del link simbolico viene in
995 genere effttuata dalla funzione che restituisce il file descriptor
996 (normalmente la \func{open}).
997
998 \begin{figure}[htb]
999   \centering
1000   \includegraphics[width=5cm]{img/link_loop.eps}
1001   \caption{Esempio di loop nel filesystem creato con un link simbolico.}
1002   \label{fig:filedir_link_loop}
1003 \end{figure}
1004
1005 Un caso comune che si può avere con i link simbolici è la creazione dei
1006 cosiddetti \textit{loop}. La situazione è illustrata in \curfig, che riporta
1007 la struttura della directory \file{/boot}. Come si vede si è creato al suo
1008 interno un link simbolico che punta di nuovo a \file{/boot}\footnote{Questo
1009   tipo di loop è stato effettuato per poter permettere a \cmd{grub} (un
1010   bootloader estremamente avanzato in grado di accedere direttamente
1011   attraverso vari filesystem al file da lanciare come sistema operativo) di
1012   vedere i file in questa directory, che è montata su una partizione separata
1013   (e che grub vedrebbe come radice), con lo stesso path con cui verrebbero
1014   visti dal sistema operativo.}. 
1015
1016 Questo può causare problemi per tutti quei programmi che effettuassero uno
1017 scan di una directory senza tener conto dei link simbolici, in quel caso
1018 infatti il loop nella directory 
1019
1020 Un secondo punto da tenere presente è che un link simbolico può essere fatto
1021 anche ad un file che non esiste; ad esempio possiamo creare un file temporaneo
1022 nella nostra directory con un link del tipo:
1023 \begin{verbatim}
1024 $ln -s /tmp/tmp_file temporaneo
1025 \end{verbatim}%$
1026 ma anche se \file{/tmp/tmp\_file} non esiste. Aprendo in scrittura
1027 \file{temporaneo} questo verrà scritto; ma se cercassimo di accederlo in sola
1028 lettura (ad esempio con \cmd{cat}) otterremmo:
1029 \begin{verbatim}
1030 $ cat prova 
1031 cat: prova: No such file or directory
1032 \end{verbatim}%$
1033 con un errore che sembra sbagliato, dato \cmd{ls} ci mostrerebbe l'esistenza
1034 di \file{temporaneo}.
1035
1036
1037 \subsection{Le funzioni \texttt{mkdir} e \texttt{rmdir}} 
1038 \label{sec:filedir_dir_creat_rem}
1039
1040 Per creare una nuova directory si può usare la seguente funzione, omonima
1041 dell'analogo comando di shell \texttt{mkdir}; per accedere ai tipi usati
1042 programma deve includere il file \texttt{sys/types.h}.
1043
1044 \begin{prototype}{sys/stat.h}
1045 {int mkdir (const char * dirname, mode\_t mode)}
1046   Questa funzione crea una nuova directory vuota con il nome indicato da
1047   \texttt{dirname}, assegnandole i permessi indicati da \texttt{mode}. Il nome
1048   può essere indicato con il pathname assoluto o relativo.
1049   
1050   La funzione restituisce zero in caso di successo e -1 per un errore, in caso
1051   di errore \texttt{errno} viene settata secondo i codici di errore standard
1052   di accesso ai files (trattati in dettaglio in
1053   \secref{sec:filedir_access_control}) ai quali si aggiungono i seguenti:
1054   \begin{errlist}
1055   \item \texttt{EACCESS} 
1056     Non c'è il permesso di scrittura per la directory in cui si vuole inserire
1057     la nuova directory.
1058   \item \texttt{EEXIST} Un file (o una directory) con quel nome esiste di già. 
1059   \item \texttt{EMLINK} La directory in cui si vuole creare la nuova directory
1060     contiene troppi file. Sotto Linux questo normalmente non avviene perché il
1061     filesystem standard consente la creazione di un numero di file maggiore di
1062     quelli che possono essere contenuti nell'hard-disk, ma potendo avere a che
1063     fare anche con filesystem di altri sistemi questo errore può presentarsi.
1064   \item \texttt{ENOSPC} Non c'è abbastanza spazio sul file system per creare
1065     la nuova directory.
1066   \item \texttt{EROFS} La directory su cui si vuole inserire la nuova
1067     directory è su un filesystem montato readonly.
1068   \end{errlist}
1069 \end{prototype}
1070  
1071
1072 \subsection{Accesso alle directory}
1073 \label{sec:filedir_dir_read}
1074
1075 Benché le directory siano oggetti del filesystem come tutti gli altri non ha
1076 ovviamente senso aprirle come fossero dei file di dati. Può però essere utile
1077 poterne leggere il contenuto ad esempio per fare la lista dei file che esse
1078 contengono o ricerche sui medesimi.
1079
1080 Per accedere al contenuto delle directory si usano i cosiddetti
1081 \textit{directory streams} (chiamati così per l'analogia con i file stream);
1082 la funzione \texttt{opendir} apre uno di questi stream e la funzione
1083 \texttt{readdir} legge il contenuto della directory, i cui elementi sono le
1084 \textit{directory entries} (da distinguersi da quelle della cache di cui
1085 parlavamo in \secref{sec:fileintr_vfs}) in una opportuna struttura
1086 \texttt{struct dirent}.
1087
1088
1089 \subsection{La directory di lavoro}
1090 \label{sec:filedir_work_dir}
1091
1092 A ciascun processo è associato ad una directory nel filesystem che è chiamata
1093 directory corrente o directory di lavoro (\textit{current working directory})
1094 che è quella a cui si fa riferimento quando un filename è espresso in forma
1095 relativa (relativa appunto a questa directory).
1096
1097 Quando un utente effettua il login questa directory viene settata alla
1098 cosiddetta \textit{home directory} del suo account, il comando \texttt{cd}
1099 della shell consente di cambiarla a piacere, spostandosi da una directory ad
1100 un'altra.  Siccome la directory corrente resta la stessa quando viene creato
1101 un processo figlio, la directory corrente della shell diventa anche la
1102 directory corrente di qualunque comando da essa lanciato.
1103
1104 Le funzioni qui descritte servono esaminare e cambiare la directory di lavoro
1105 corrente. 
1106
1107 \begin{prototype}{unistd.h}{char * getcwd (char * buffer, size\_t size)}
1108   Restituisce il filename completo della directory di lavoro corrente nella
1109   stringa puntata da \texttt{buffer}, che deve essere precedentemente
1110   allocata, per una dimensione massima di \texttt{size}. Si può anche
1111   specificare un puntatore nullo come \textit{buffer}, nel qual caso la
1112   stringa sarà allocata automaticamente per una dimensione pari a
1113   \texttt{size} qualora questa sia diversa da zero, o della lunghezza esatta
1114   del pathname altrimenti. In questo caso si deve ricordare di disallocare la
1115   stringa una volta cessato il suo utilizzo.
1116   
1117   La funzione restituisce il puntatore \texttt{buffer} se riesce,
1118   \texttt{NULL} se fallisce, in quest'ultimo caso la variabile
1119   \texttt{errno} è settata con i seguenti codici di errore:
1120   \begin{errlist}
1121   \item \texttt{EINVAL} L'argomento \texttt{size} è zero e \texttt{buffer} non
1122     è nullo.
1123   \item \texttt{ERANGE} L'argomento \texttt{size} è più piccolo della
1124     lunghezza del pathname. 
1125   \item \texttt{EACCESS} Manca il permesso di lettura o di ricerca su uno dei
1126     componenti del pathname (cioè su una delle directory superiori alla
1127     corrente).
1128   \end{errlist}
1129 \end{prototype}
1130
1131 Di questa funzione esiste una versione \texttt{char * getwd(char * buffer)}
1132 fatta per compatibilità all'indietro con BSD, che non consente di specificare
1133 la dimensione del buffer; esso deve essere allocato in precedenza ed avere una
1134 dimensione superiore a \texttt{PATH\_MAX} (di solito 256 bytes, vedi
1135 \secref{sec:xxx_limits}; il problema è che in Linux non esiste una dimensione
1136 superiore per un pathname, per cui non è detto che il buffer sia sufficiente a
1137 contenere il nome del file, e questa è la ragione principale per cui questa
1138 funzione è deprecata.
1139
1140 Una seconda funzione simile è \texttt{char * get\_current\_dir\_name(void)}
1141 che è sostanzialmente equivalente ad una \texttt{getcwd(NULL, 0)}, con la sola
1142 differenza che essa ritorna il valore della variabile di ambiente
1143 \texttt{PWD}, che essendo costruita dalla shell può contenere anche dei
1144 riferimenti simbolici.
1145
1146 Come già detto in unix anche le directory sono file, è possibile pertanto
1147 riferirsi ad esse tramite il file descriptor dell'interfaccia a basso livello,
1148 e non solo tramite il filename; per questo motivo ci sono due diverse funzioni
1149 per cambiare directory di lavoro.
1150
1151 \begin{prototype}{unistd.h}{int chdir (const char * pathname)}
1152   Come dice il nome (che significa \textit{change directory}) questa funzione
1153   serve a cambiare la directory di lavoro a quella specificata dal pathname
1154   contenuto nella stringa \texttt{pathname}.
1155 \end{prototype}
1156   
1157 \begin{prototype}{unistd.h}{int fchdir (int filedes)} 
1158   Analoga alla precedente, ma usa un file descriptor invece del pathname.
1159
1160   Entrambe le funzioni restituiscono zero in caso di successo e -1 per un
1161   errore, in caso di errore \texttt{errno} viene settata secondo i codici di
1162   errore standard di accesso ai files (trattati in dettaglio in
1163   \secref{sec:filedir_access_control}) ai quali si aggiunge il codice
1164   \texttt{ENOTDIR} nel caso il \texttt{filename} indichi un file che non sia
1165   una directory.
1166 \end{prototype}
1167
1168