r270: Implement prerun and postrun options
[nbd.git] / nbd-server.c
1 /*
2  * Network Block Device - server
3  *
4  * Copyright 1996-1998 Pavel Machek, distribute under GPL
5  *  <pavel@atrey.karlin.mff.cuni.cz>
6  * Copyright 2001-2004 Wouter Verhelst <wouter@debian.org>
7  * Copyright 2002 Anton Altaparmakov <aia21@cam.ac.uk>
8  *
9  * Version 1.0 - hopefully 64-bit-clean
10  * Version 1.1 - merging enhancements from Josh Parsons, <josh@coombs.anu.edu.au>
11  * Version 1.2 - autodetect size of block devices, thanx to Peter T. Breuer" <ptb@it.uc3m.es>
12  * Version 1.5 - can compile on Unix systems that don't have 64 bit integer
13  *      type, or don't have 64 bit file offsets by defining FS_32BIT
14  *      in compile options for nbd-server *only*. This can be done
15  *      with make FSCHOICE=-DFS_32BIT nbd-server. (I don't have the
16  *      original autoconf input file, or I would make it a configure
17  *      option.) Ken Yap <ken@nlc.net.au>.
18  * Version 1.6 - fix autodetection of block device size and really make 64 bit
19  *      clean on 32 bit machines. Anton Altaparmakov <aia21@cam.ac.uk>
20  * Version 2.0 - Version synchronised with client
21  * Version 2.1 - Reap zombie client processes when they exit. Removed
22  *      (uncommented) the _IO magic, it's no longer necessary. Wouter
23  *      Verhelst <wouter@debian.org>
24  * Version 2.2 - Auto switch to read-only mode (usefull for floppies).
25  * Version 2.3 - Fixed code so that Large File Support works. This
26  *      removes the FS_32BIT compile-time directive; define
27  *      _FILE_OFFSET_BITS=64 and _LARGEFILE_SOURCE if you used to be
28  *      using FS_32BIT. This will allow you to use files >2GB instead of
29  *      having to use the -m option. Wouter Verhelst <wouter@debian.org>
30  * Version 2.4 - Added code to keep track of children, so that we can
31  *      properly kill them from initscripts. Add a call to daemon(),
32  *      so that processes don't think they have to wait for us, which is
33  *      interesting for initscripts as well. Wouter Verhelst
34  *      <wouter@debian.org>
35  * Version 2.5 - Bugfix release: forgot to reset child_arraysize to
36  *      zero after fork()ing, resulting in nbd-server going berserk
37  *      when it receives a signal with at least one child open. Wouter
38  *      Verhelst <wouter@debian.org>
39  * 10/10/2003 - Added socket option SO_KEEPALIVE (sf.net bug 819235);
40  *      rectified type of mainloop::size_host (sf.net bugs 814435 and
41  *      817385); close the PID file after writing to it, so that the
42  *      daemon can actually be found. Wouter Verhelst
43  *      <wouter@debian.org>
44  * 10/10/2003 - Size of the data "size_host" was wrong and so was not
45  *      correctly put in network endianness. Many types were corrected
46  *      (size_t and off_t instead of int).  <vspaceg@sourceforge.net>
47  * Version 2.6 - Some code cleanup.
48  * Version 2.7 - Better build system.
49  * 11/02/2004 - Doxygenified the source, modularized it a bit. Needs a 
50  *      lot more work, but this is a start. Wouter Verhelst
51  *      <wouter@debian.org>
52  */
53
54 /* Includes LFS defines, which defines behaviours of some of the following
55  * headers, so must come before those */
56 #include "lfs.h"
57
58 #include <sys/types.h>
59 #include <sys/socket.h>
60 #include <sys/stat.h>
61 #include <sys/select.h>         /* select */
62 #include <sys/wait.h>           /* wait */
63 #ifdef HAVE_SYS_IOCTL_H
64 #include <sys/ioctl.h>
65 #endif
66 #include <sys/param.h>
67 #ifdef HAVE_SYS_MOUNT_H
68 #include <sys/mount.h>          /* For BLKGETSIZE */
69 #endif
70 #include <signal.h>             /* sigaction */
71 #include <netinet/tcp.h>
72 #include <netinet/in.h>         /* sockaddr_in, htons, in_addr */
73 #include <netdb.h>              /* hostent, gethostby*, getservby* */
74 #include <syslog.h>
75 #include <unistd.h>
76 #include <stdio.h>
77 #include <stdlib.h>
78 #include <string.h>
79 #include <fcntl.h>
80 #include <arpa/inet.h>
81 #include <strings.h>
82 #include <dirent.h>
83 #include <unistd.h>
84 #include <getopt.h>
85 #include <pwd.h>
86 #include <grp.h>
87
88 #include <glib.h>
89
90 /* used in cliserv.h, so must come first */
91 #define MY_NAME "nbd_server"
92 #include "cliserv.h"
93
94 /** Default position of the config file */
95 #ifndef SYSCONFDIR
96 #define SYSCONFDIR "/etc"
97 #endif
98 #define CFILE SYSCONFDIR "/nbd-server/config"
99
100 /** Where our config file actually is */
101 gchar* config_file_pos;
102
103 /** What user we're running as */
104 gchar* runuser=NULL;
105 /** What group we're running as */
106 gchar* rungroup=NULL;
107
108 /** Logging macros, now nothing goes to syslog unless you say ISSERVER */
109 #ifdef ISSERVER
110 #define msg2(a,b) syslog(a,b)
111 #define msg3(a,b,c) syslog(a,b,c)
112 #define msg4(a,b,c,d) syslog(a,b,c,d)
113 #else
114 #define msg2(a,b) g_message(b)
115 #define msg3(a,b,c) g_message(b,c)
116 #define msg4(a,b,c,d) g_message(b,c,d)
117 #endif
118
119 /* Debugging macros */
120 //#define DODBG
121 #ifdef DODBG
122 #define DEBUG( a ) printf( a )
123 #define DEBUG2( a,b ) printf( a,b )
124 #define DEBUG3( a,b,c ) printf( a,b,c )
125 #define DEBUG4( a,b,c,d ) printf( a,b,c,d )
126 #else
127 #define DEBUG( a )
128 #define DEBUG2( a,b ) 
129 #define DEBUG3( a,b,c ) 
130 #define DEBUG4( a,b,c,d ) 
131 #endif
132 #ifndef PACKAGE_VERSION
133 #define PACKAGE_VERSION ""
134 #endif
135 /**
136  * The highest value a variable of type off_t can reach. This is a signed
137  * integer, so set all bits except for the leftmost one.
138  **/
139 #define OFFT_MAX ~((off_t)1<<(sizeof(off_t)*8-1))
140 #define LINELEN 256       /**< Size of static buffer used to read the
141                             authorization file (yuck) */
142 #define BUFSIZE (1024*1024) /**< Size of buffer that can hold requests */
143 #define DIFFPAGESIZE 4096 /**< diff file uses those chunks */
144 #define F_READONLY 1      /**< flag to tell us a file is readonly */
145 #define F_MULTIFILE 2     /**< flag to tell us a file is exported using -m */
146 #define F_COPYONWRITE 4   /**< flag to tell us a file is exported using
147                             copyonwrite */
148 #define F_AUTOREADONLY 8  /**< flag to tell us a file is set to autoreadonly */
149 #define F_SPARSE 16
150 GHashTable *children;
151 char pidfname[256]; /**< name of our PID file */
152 char pidftemplate[256]; /**< template to be used for the filename of the PID file */
153 char default_authname[] = SYSCONFDIR "/nbd-server/allow"; /**< default name of allow file */
154
155 /**
156  * Types of virtuatlization
157  **/
158 typedef enum {
159         VIRT_NONE=0,    /**< No virtualization */
160         VIRT_IPLIT,     /**< Literal IP address as part of the filename */
161         VIRT_IPHASH,    /**< Replacing all dots in an ip address by a / before
162                              doing the same as in IPLIT */
163         VIRT_CIDR,      /**< Every subnet in its own directory */
164 } VIRT_STYLE;
165
166 /**
167  * Variables associated with a server.
168  **/
169 typedef struct {
170         gchar* exportname;    /**< (unprocessed) filename of the file we're exporting */
171         off_t expected_size; /**< size of the exported file as it was told to
172                                us through configuration */
173         unsigned int port;   /**< port we're exporting this file at */
174         char* authname;      /**< filename of the authorization file */
175         int flags;           /**< flags associated with this exported file */
176         unsigned int timeout;/**< how long a connection may be idle
177                                (0=forever) */
178         int socket;          /**< The socket of this server. */
179         VIRT_STYLE virtstyle;/**< The style of virtualization, if any */
180         uint8_t cidrlen;     /**< The length of the mask when we use
181                                   CIDR-style virtualization */
182         gchar* prerun;       /**< command to be ran after connecting a client,
183                                   but before starting to serve */
184         gchar* postrun;      /**< command that will be ran after the client
185                                   disconnects */
186 } SERVER;
187
188 /**
189  * Variables associated with a client socket.
190  **/
191 typedef struct {
192         int fhandle;      /**< file descriptor */
193         off_t startoff;   /**< starting offset of this file */
194 } FILE_INFO;
195
196 typedef struct {
197         off_t exportsize;    /**< size of the file we're exporting */
198         char *clientname;    /**< peer */
199         char *exportname;    /**< (processed) filename of the file we're exporting */
200         GArray *export;    /**< array of FILE_INFO of exported files;
201                                array size is always 1 unless we're
202                                doing the multiple file option */
203         int net;             /**< The actual client socket */
204         SERVER *server;      /**< The server this client is getting data from */
205         char* difffilename;  /**< filename of the copy-on-write file, if any */
206         int difffile;        /**< filedescriptor of copyonwrite file. @todo
207                                shouldn't this be an array too? (cfr export) Or
208                                make -m and -c mutually exclusive */
209         u32 difffilelen;     /**< number of pages in difffile */
210         u32 *difmap;         /**< see comment on the global difmap for this one */
211 } CLIENT;
212
213 /**
214  * Type of configuration file values
215  **/
216 typedef enum {
217         PARAM_INT,              /**< This parameter is an integer */
218         PARAM_STRING,           /**< This parameter is a string */
219         PARAM_BOOL,             /**< This parameter is a boolean */
220 } PARAM_TYPE;
221
222 /**
223  * Configuration file values
224  **/
225 typedef struct {
226         gchar *paramname;       /**< Name of the parameter, as it appears in
227                                   the config file */
228         gboolean required;      /**< Whether this is a required (as opposed to
229                                   optional) parameter */
230         PARAM_TYPE ptype;       /**< Type of the parameter. */
231         gpointer target;        /**< Pointer to where the data of this
232                                   parameter should be written. If ptype is
233                                   PARAM_BOOL, the data is or'ed rather than
234                                   overwritten. */
235         gint flagval;           /**< Flag mask for this parameter in case ptype
236                                   is PARAM_BOOL. */
237 } PARAM;
238
239 /**
240  * Check whether a client is allowed to connect. Works with an authorization
241  * file which contains one line per machine, no wildcards.
242  *
243  * @param opts The client who's trying to connect.
244  * @return 0 - authorization refused, 1 - OK
245  **/
246 int authorized_client(CLIENT *opts) {
247         const char *ERRMSG="Invalid entry '%s' in authfile '%s', so, refusing all connections.";
248         FILE *f ;
249         char line[LINELEN]; 
250         char *tmp;
251         struct in_addr addr;
252         struct in_addr client;
253         struct in_addr cltemp;
254         int len;
255
256         if ((f=fopen(opts->server->authname,"r"))==NULL) {
257                 msg4(LOG_INFO,"Can't open authorization file %s (%s).",
258                      opts->server->authname,strerror(errno)) ;
259                 return 1 ; 
260         }
261   
262         inet_aton(opts->clientname, &client);
263         while (fgets(line,LINELEN,f)!=NULL) {
264                 if((tmp=index(line, '/'))) {
265                         if(strlen(line)<=tmp-line) {
266                                 msg4(LOG_CRIT, ERRMSG, line, opts->server->authname);
267                                 return 0;
268                         }
269                         *(tmp++)=0;
270                         if(inet_aton(line,&addr)) {
271                                 msg4(LOG_CRIT, ERRMSG, line, opts->server->authname);
272                                 return 0;
273                         }
274                         len=strtol(tmp, NULL, 0);
275                         addr.s_addr>>=32-len;
276                         addr.s_addr<<=32-len;
277                         memcpy(&cltemp,&client,sizeof(client));
278                         cltemp.s_addr>>=32-len;
279                         cltemp.s_addr<<=32-len;
280                         if(addr.s_addr == cltemp.s_addr) {
281                                 return 1;
282                         }
283                 }
284                 if (strncmp(line,opts->clientname,strlen(opts->clientname))==0) {
285                         fclose(f);
286                         return 1;
287                 }
288         }
289         fclose(f);
290         return 0;
291 }
292
293 /**
294  * Read data from a file descriptor into a buffer
295  *
296  * @param f a file descriptor
297  * @param buf a buffer
298  * @param len the number of bytes to be read
299  **/
300 inline void readit(int f, void *buf, size_t len) {
301         ssize_t res;
302         while (len > 0) {
303                 DEBUG("*");
304                 if ((res = read(f, buf, len)) <= 0)
305                         err("Read failed: %m");
306                 len -= res;
307                 buf += res;
308         }
309 }
310
311 /**
312  * Write data from a buffer into a filedescriptor
313  *
314  * @param f a file descriptor
315  * @param buf a buffer containing data
316  * @param len the number of bytes to be written
317  **/
318 inline void writeit(int f, void *buf, size_t len) {
319         ssize_t res;
320         while (len > 0) {
321                 DEBUG("+");
322                 if ((res = write(f, buf, len)) <= 0)
323                         err("Send failed: %m");
324                 len -= res;
325                 buf += res;
326         }
327 }
328
329 /**
330  * Print out a message about how to use nbd-server. Split out to a separate
331  * function so that we can call it from multiple places
332  */
333 void usage() {
334         printf("This is nbd-server version " VERSION "\n");
335         printf("Usage: port file_to_export [size][kKmM] [-l authorize_file] [-r] [-m] [-c] [-a timeout_sec] [-C configuration file] [-p PID file name] [-o section name]\n"
336                "\t-r|--read-only\t\tread only\n"
337                "\t-m|--multi-file\t\tmultiple file\n"
338                "\t-c|--copy-on-write\tcopy on write\n"
339                "\t-C|--config-file\tspecify an alternate configuration file\n"
340                "\t-l|--authorize-file\tfile with list of hosts that are allowed to\n\t\t\t\tconnect.\n"
341                "\t-a|--idle-time\t\tmaximum idle seconds; server terminates when\n\t\t\t\tidle time exceeded\n"
342                "\t-p|--pid-file\t\tspecify a filename to write our PID to\n"
343                "\t-o|--output-config\toutput a config file section for what you\n\t\t\t\tspecified on the command line, with the\n\t\t\t\tspecified section name\n\n"
344                "\tif port is set to 0, stdin is used (for running from inetd)\n"
345                "\tif file_to_export contains '%%s', it is substituted with the IP\n"
346                "\t\taddress of the machine trying to connect\n" );
347         printf("Using configuration file %s\n", CFILE);
348 }
349
350 /* Dumps a config file section of the given SERVER*, and exits. */
351 void dump_section(SERVER* serve, gchar* section_header) {
352         printf("[%s]\n", section_header);
353         printf("\texportname = %s\n", serve->exportname);
354         printf("\tport = %d\n", serve->port);
355         if(serve->flags & F_READONLY) {
356                 printf("\treadonly = true\n");
357         }
358         if(serve->flags & F_MULTIFILE) {
359                 printf("\tmultifile = true\n");
360         }
361         if(serve->flags & F_COPYONWRITE) {
362                 printf("\tcopyonwrite = true\n");
363         }
364         if(serve->expected_size) {
365                 printf("\tfilesize = %Ld\n", (long long int)serve->expected_size);
366         }
367         if(serve->authname) {
368                 printf("\tauthfile = %s\n", serve->authname);
369         }
370         if(serve->timeout) {
371                 printf("\ttimeout = %d\n", serve->timeout);
372         }
373         exit(EXIT_SUCCESS);
374 }
375
376 /**
377  * Parse the command line.
378  *
379  * @param argc the argc argument to main()
380  * @param argv the argv argument to main()
381  **/
382 SERVER* cmdline(int argc, char *argv[]) {
383         int i=0;
384         int nonspecial=0;
385         int c;
386         struct option long_options[] = {
387                 {"read-only", no_argument, NULL, 'r'},
388                 {"multi-file", no_argument, NULL, 'm'},
389                 {"copy-on-write", no_argument, NULL, 'c'},
390                 {"authorize-file", required_argument, NULL, 'l'},
391                 {"idle-time", required_argument, NULL, 'a'},
392                 {"config-file", required_argument, NULL, 'C'},
393                 {"pid-file", required_argument, NULL, 'p'},
394                 {"output-config", required_argument, NULL, 'o'},
395                 {0,0,0,0}
396         };
397         SERVER *serve;
398         off_t es;
399         size_t last;
400         char suffix;
401         gboolean do_output=FALSE;
402         gchar* section_header;
403
404         if(argc==1) {
405                 return NULL;
406         }
407         serve=g_new0(SERVER, 1);
408         serve->authname = g_strdup(default_authname);
409         while((c=getopt_long(argc, argv, "-a:C:cl:mo:rp:", long_options, &i))>=0) {
410                 switch (c) {
411                 case 1:
412                         /* non-option argument */
413                         switch(nonspecial++) {
414                         case 0:
415                                 serve->port=strtol(optarg, NULL, 0);
416                                 break;
417                         case 1:
418                                 serve->exportname = g_strdup(optarg);
419                                 if(serve->exportname[0] != '/') {
420                                         fprintf(stderr, "E: The to be exported file needs to be an absolute filename!\n");
421                                         exit(EXIT_FAILURE);
422                                 }
423                                 break;
424                         case 2:
425                                 last=strlen(optarg)-1;
426                                 suffix=optarg[last];
427                                 if (suffix == 'k' || suffix == 'K' ||
428                                     suffix == 'm' || suffix == 'M')
429                                         optarg[last] = '\0';
430                                 es = (off_t)atol(optarg);
431                                 switch (suffix) {
432                                         case 'm':
433                                         case 'M':  es <<= 10;
434                                         case 'k':
435                                         case 'K':  es <<= 10;
436                                         default :  break;
437                                 }
438                                 serve->expected_size = es;
439                                 break;
440                         }
441                         break;
442                 case 'r':
443                         serve->flags |= F_READONLY;
444                         break;
445                 case 'm':
446                         serve->flags |= F_MULTIFILE;
447                         break;
448                 case 'o':
449                         do_output = TRUE;
450                         section_header = g_strdup(optarg);
451                         break;
452                 case 'p':
453                         strncpy(pidftemplate, optarg, 256);
454                         break;
455                 case 'c': 
456                         serve->flags |=F_COPYONWRITE;
457                         break;
458                 case 'C':
459                         g_free(config_file_pos);
460                         config_file_pos=g_strdup(optarg);
461                         break;
462                 case 'l':
463                         g_free(serve->authname);
464                         serve->authname=g_strdup(optarg);
465                         break;
466                 case 'a': 
467                         serve->timeout=strtol(optarg, NULL, 0);
468                         break;
469                 default:
470                         usage();
471                         exit(EXIT_FAILURE);
472                         break;
473                 }
474         }
475         /* What's left: the port to export, the name of the to be exported
476          * file, and, optionally, the size of the file, in that order. */
477         if(nonspecial<2) {
478                 g_free(serve);
479                 serve=NULL;
480         }
481         if(do_output) {
482                 if(!serve) {
483                         g_critical("Need a complete configuration on the command line to output a config file section!");
484                         exit(EXIT_FAILURE);
485                 }
486                 dump_section(serve, section_header);
487         }
488         return serve;
489 }
490
491 /**
492  * Error codes for config file parsing
493  **/
494 typedef enum {
495         CFILE_NOTFOUND,         /**< The configuration file is not found */
496         CFILE_MISSING_GENERIC,  /**< The (required) group "generic" is missing */
497         CFILE_KEY_MISSING,      /**< A (required) key is missing */
498         CFILE_VALUE_INVALID,    /**< A value is syntactically invalid */
499         CFILE_PROGERR           /**< Programmer error */
500 } CFILE_ERRORS;
501
502 /**
503  * Remove a SERVER from memory. Used from the hash table
504  **/
505 void remove_server(gpointer s) {
506         SERVER *server;
507
508         server=(SERVER*)s;
509         g_free(server->exportname);
510         if(server->authname)
511                 g_free(server->authname);
512         g_free(server);
513 }
514
515 /**
516  * Parse the config file.
517  *
518  * @param f the name of the config file
519  * @param e a GError. @see CFILE_ERRORS for what error values this function can
520  *      return.
521  * @return a Array of SERVER* pointers, If the config file is empty or does not
522  *      exist, returns an empty GHashTable; if the config file contains an
523  *      error, returns NULL, and e is set appropriately
524  **/
525 GArray* parse_cfile(gchar* f, GError** e) {
526         const char* DEFAULT_ERROR = "Could not parse %s in group %s: %s";
527         const char* MISSING_REQUIRED_ERROR = "Could not find required value %s in group %s: %s";
528         SERVER s;
529         gchar *virtstyle=NULL;
530         PARAM lp[] = {
531                 { "exportname", TRUE,   PARAM_STRING,   NULL, 0 },
532                 { "port",       TRUE,   PARAM_INT,      NULL, 0 },
533                 { "authfile",   FALSE,  PARAM_STRING,   NULL, 0 },
534                 { "timeout",    FALSE,  PARAM_INT,      NULL, 0 },
535                 { "filesize",   FALSE,  PARAM_INT,      NULL, 0 },
536                 { "virtstyle",  FALSE,  PARAM_STRING,   NULL, 0 },
537                 { "prerun",     FALSE,  PARAM_STRING,   NULL, 0 },
538                 { "postrun",    FALSE,  PARAM_STRING,   NULL, 0 },
539                 { "readonly",   FALSE,  PARAM_BOOL,     NULL, F_READONLY },
540                 { "multifile",  FALSE,  PARAM_BOOL,     NULL, F_MULTIFILE },
541                 { "copyonwrite", FALSE, PARAM_BOOL,     NULL, F_COPYONWRITE },
542                 { "autoreadonly", FALSE, PARAM_BOOL,    NULL, F_AUTOREADONLY },
543                 { "sparse_cow", FALSE,  PARAM_BOOL,     NULL, F_SPARSE },
544         };
545         const int lp_size=11;
546         PARAM gp[] = {
547                 { "user",       FALSE, PARAM_STRING,    &runuser,       0 },
548                 { "group",      FALSE, PARAM_STRING,    &rungroup,      0 },
549         };
550         PARAM* p=gp;
551         int p_size=2;
552         GKeyFile *cfile;
553         GError *err = NULL;
554         const char *err_msg=NULL;
555         GQuark errdomain;
556         GArray *retval=NULL;
557         gchar **groups;
558         gboolean value;
559         gint i;
560         gint j;
561
562         errdomain = g_quark_from_string("parse_cfile");
563         cfile = g_key_file_new();
564         retval = g_array_new(FALSE, TRUE, sizeof(SERVER));
565         if(!g_key_file_load_from_file(cfile, f, G_KEY_FILE_KEEP_COMMENTS |
566                         G_KEY_FILE_KEEP_TRANSLATIONS, &err)) {
567                 g_set_error(e, errdomain, CFILE_NOTFOUND, "Could not open config file.");
568                 g_key_file_free(cfile);
569                 return retval;
570         }
571         if(strcmp(g_key_file_get_start_group(cfile), "generic")) {
572                 g_set_error(e, errdomain, CFILE_MISSING_GENERIC, "Config file does not contain the [generic] group!");
573                 g_key_file_free(cfile);
574                 return NULL;
575         }
576         groups = g_key_file_get_groups(cfile, NULL);
577         for(i=0;groups[i];i++) {
578                 memset(&s, '\0', sizeof(SERVER));
579                 lp[0].target=&(s.exportname);
580                 lp[1].target=&(s.port);
581                 lp[2].target=&(s.authname);
582                 lp[3].target=&(s.timeout);
583                 lp[4].target=&(s.expected_size);
584                 lp[5].target=&(virtstyle);
585                 lp[6].target=&(s.prerun);
586                 lp[7].target=&(s.postrun);
587                 lp[8].target=lp[9].target=lp[10].target=
588                                 lp[11].target=lp[12].target=&(s.flags);
589                 
590                 /* After the [generic] group, start parsing exports */
591                 if(i==1) {
592                         p=lp;
593                         p_size=lp_size;
594                 } 
595                 for(j=0;j<p_size;j++) {
596                         g_assert(p[j].target != NULL);
597                         g_assert(p[j].ptype==PARAM_INT||p[j].ptype==PARAM_STRING||p[j].ptype==PARAM_BOOL);
598                         switch(p[j].ptype) {
599                                 case PARAM_INT:
600                                         *((gint*)p[j].target) =
601                                                 g_key_file_get_integer(cfile,
602                                                                 groups[i],
603                                                                 p[j].paramname,
604                                                                 &err);
605                                         break;
606                                 case PARAM_STRING:
607                                         *((gchar**)p[j].target) =
608                                                 g_key_file_get_string(cfile,
609                                                                 groups[i],
610                                                                 p[j].paramname,
611                                                                 &err);
612                                         break;
613                                 case PARAM_BOOL:
614                                         value = g_key_file_get_boolean(cfile,
615                                                         groups[i],
616                                                         p[j].paramname, &err);
617                                         if(!err) {
618                                                 if(value) {
619                                                         *((gint*)p[j].target) |= p[j].flagval;
620                                                 } else {
621                                                         *((gint*)p[j].target) &= ~(p[j].flagval);
622                                                 }
623                                         }
624                                         break;
625                         }
626                         if(err) {
627                                 if(err->code == G_KEY_FILE_ERROR_KEY_NOT_FOUND) {
628                                         if(!p[j].required) {
629                                                 /* Ignore not-found error for optional values */
630                                                 g_clear_error(&err);
631                                                 continue;
632                                         } else {
633                                                 err_msg = MISSING_REQUIRED_ERROR;
634                                         }
635                                 } else {
636                                         err_msg = DEFAULT_ERROR;
637                                 }
638                                 g_set_error(e, errdomain, CFILE_VALUE_INVALID, err_msg, p[j].paramname, groups[i], err->message);
639                                 g_array_free(retval, TRUE);
640                                 g_error_free(err);
641                                 g_key_file_free(cfile);
642                                 return NULL;
643                         }
644                 }
645                 if(virtstyle) {
646                         if(!strncmp(virtstyle, "none", 4)) {
647                                 s.virtstyle=VIRT_NONE;
648                         } else if(!strncmp(virtstyle, "ipliteral", 9)) {
649                                 s.virtstyle=VIRT_IPLIT;
650                         } else if(!strncmp(virtstyle, "iphash", 6)) {
651                                 s.virtstyle=VIRT_IPHASH;
652                         } else if(!strncmp(virtstyle, "cidrhash", 8)) {
653                                 s.virtstyle=VIRT_CIDR;
654                                 if(strlen(virtstyle)<10) {
655                                         g_set_error(e, errdomain, CFILE_VALUE_INVALID, "Invalid value %s for parameter virtstyle in group %s: missing length", virtstyle, groups[i]);
656                                         g_array_free(retval, TRUE);
657                                         g_key_file_free(cfile);
658                                         return NULL;
659                                 }
660                                 s.cidrlen=strtol(virtstyle+8, NULL, 0);
661                         } else {
662                                 g_set_error(e, errdomain, CFILE_VALUE_INVALID, "Invalid value %s for parameter virtstyle in group %s", virtstyle, groups[i]);
663                                 g_array_free(retval, TRUE);
664                                 g_key_file_free(cfile);
665                                 return NULL;
666                         }
667                 } else {
668                         s.virtstyle=VIRT_IPLIT;
669                 }
670                 /* Don't need to free this, it's not our string */
671                 virtstyle=NULL;
672                 /* Don't append values for the [generic] group */
673                 if(i>0) {
674                         g_array_append_val(retval, s);
675                 }
676         }
677         return retval;
678 }
679
680 /**
681  * Signal handler for SIGCHLD
682  * @param s the signal we're handling (must be SIGCHLD, or something
683  * is severely wrong)
684  **/
685 void sigchld_handler(int s) {
686         int status;
687         int* i;
688         pid_t pid;
689
690         while((pid=waitpid(-1, &status, WNOHANG)) > 0) {
691                 if(WIFEXITED(status)) {
692                         msg3(LOG_INFO, "Child exited with %d", WEXITSTATUS(status));
693                 }
694                 i=g_hash_table_lookup(children, &pid);
695                 if(!i) {
696                         msg3(LOG_INFO, "SIGCHLD received for an unknown child with PID %ld", (long)pid);
697                 } else {
698                         DEBUG2("Removing %d from the list of children", pid);
699                         g_hash_table_remove(children, &pid);
700                 }
701         }
702 }
703
704 /**
705  * Kill a child. Called from sigterm_handler::g_hash_table_foreach.
706  *
707  * @param key the key
708  * @param value the value corresponding to the above key
709  * @param user_data a pointer which we always set to 1, so that we know what
710  * will happen next.
711  **/
712 void killchild(gpointer key, gpointer value, gpointer user_data) {
713         pid_t *pid=value;
714         int *parent=user_data;
715
716         kill(*pid, SIGTERM);
717         *parent=1;
718 }
719
720 /**
721  * Handle SIGTERM and dispatch it to our children
722  * @param s the signal we're handling (must be SIGTERM, or something
723  * is severely wrong).
724  **/
725 void sigterm_handler(int s) {
726         int parent=0;
727
728         g_hash_table_foreach(children, killchild, &parent);
729
730         if(parent) {
731                 unlink(pidfname);
732         }
733
734         exit(0);
735 }
736
737 /**
738  * Detect the size of a file.
739  *
740  * @param fhandle An open filedescriptor
741  * @return the size of the file, or OFFT_MAX if detection was
742  * impossible.
743  **/
744 off_t size_autodetect(int fhandle) {
745         off_t es;
746         unsigned long sectors;
747         struct stat stat_buf;
748         int error;
749
750 #ifdef HAVE_SYS_MOUNT_H
751 #ifdef HAVE_SYS_IOCTL_H
752 #ifdef BLKGETSIZE
753         DEBUG("looking for export size with ioctl BLKGETSIZE\n");
754         if (!ioctl(fhandle, BLKGETSIZE, &sectors) && sectors) {
755                 es = (off_t)sectors * (off_t)512;
756                 return es;
757         }
758 #endif /* BLKGETSIZE */
759 #endif /* HAVE_SYS_IOCTL_H */
760 #endif /* HAVE_SYS_MOUNT_H */
761
762         DEBUG("looking for fhandle size with fstat\n");
763         stat_buf.st_size = 0;
764         error = fstat(fhandle, &stat_buf);
765         if (!error) {
766                 if(stat_buf.st_size > 0)
767                         return (off_t)stat_buf.st_size;
768         } else {
769                 err("fstat failed: %m");
770         }
771
772         DEBUG("looking for fhandle size with lseek SEEK_END\n");
773         es = lseek(fhandle, (off_t)0, SEEK_END);
774         if (es > ((off_t)0)) {
775                 return es;
776         } else {
777                 DEBUG2("lseek failed: %d", errno==EBADF?1:(errno==ESPIPE?2:(errno==EINVAL?3:4)));
778         }
779
780         err("Could not find size of exported block device: %m");
781         return OFFT_MAX;
782 }
783
784 /**
785  * Get the file handle and offset, given an export offset.
786  *
787  * @param export An array of export files
788  * @param a The offset to get corresponding file/offset for
789  * @param fhandle [out] File descriptor
790  * @param foffset [out] Offset into fhandle
791  * @param maxbytes [out] Tells how many bytes can be read/written
792  * from fhandle starting at foffset (0 if there is no limit)
793  * @return 0 on success, -1 on failure
794  **/
795 int get_filepos(GArray* export, off_t a, int* fhandle, off_t* foffset, size_t* maxbytes ) {
796         /* Negative offset not allowed */
797         if(a < 0)
798                 return -1;
799
800         /* Binary search for last file with starting offset <= a */
801         FILE_INFO fi;
802         int start = 0;
803         int end = export->len - 1;
804         while( start <= end ) {
805                 int mid = (start + end) / 2;
806                 fi = g_array_index(export, FILE_INFO, mid);
807                 if( fi.startoff < a ) {
808                         start = mid + 1;
809                 } else if( fi.startoff > a ) {
810                         end = mid - 1;
811                 } else {
812                         start = end = mid;
813                         break;
814                 }
815         }
816
817         /* end should never go negative, since first startoff is 0 and a >= 0 */
818         g_assert(end >= 0);
819
820         fi = g_array_index(export, FILE_INFO, end);
821         *fhandle = fi.fhandle;
822         *foffset = a - fi.startoff;
823         *maxbytes = 0;
824         if( end+1 < export->len ) {
825                 FILE_INFO fi_next = g_array_index(export, FILE_INFO, end+1);
826                 *maxbytes = fi_next.startoff - a;
827         }
828
829         return 0;
830 }
831
832 /**
833  * seek to a position in a file, with error handling.
834  * @param handle a filedescriptor
835  * @param a position to seek to
836  * @todo get rid of this; lastpoint is a global variable right now, but it
837  * shouldn't be. If we pass it on as a parameter, that makes things a *lot*
838  * easier.
839  **/
840 void myseek(int handle,off_t a) {
841         if (lseek(handle, a, SEEK_SET) < 0) {
842                 err("Can not seek locally!\n");
843         }
844 }
845
846 /**
847  * Write an amount of bytes at a given offset to the right file. This
848  * abstracts the write-side of the multiple file option.
849  *
850  * @param a The offset where the write should start
851  * @param buf The buffer to write from
852  * @param len The length of buf
853  * @param client The client we're serving for
854  * @return The number of bytes actually written, or -1 in case of an error
855  **/
856 ssize_t rawexpwrite(off_t a, char *buf, size_t len, CLIENT *client) {
857         int fhandle;
858         off_t foffset;
859         size_t maxbytes;
860
861         if(get_filepos(client->export, a, &fhandle, &foffset, &maxbytes))
862                 return -1;
863         if(maxbytes && len > maxbytes)
864                 len = maxbytes;
865
866         DEBUG4("(WRITE to fd %d offset %Lu len %u), ", fhandle, foffset, len);
867
868         myseek(fhandle, foffset);
869         return write(fhandle, buf, len);
870 }
871
872 /**
873  * Call rawexpwrite repeatedly until all data has been written.
874  * @return 0 on success, nonzero on failure
875  **/
876 int rawexpwrite_fully(off_t a, char *buf, size_t len, CLIENT *client) {
877         ssize_t ret;
878
879         while(len > 0 && (ret=rawexpwrite(a, buf, len, client)) > 0 ) {
880                 a += ret;
881                 buf += ret;
882                 len -= ret;
883         }
884         return (ret < 0 || len != 0);
885 }
886
887 /**
888  * Read an amount of bytes at a given offset from the right file. This
889  * abstracts the read-side of the multiple files option.
890  *
891  * @param a The offset where the read should start
892  * @param buf A buffer to read into
893  * @param len The size of buf
894  * @param client The client we're serving for
895  * @return The number of bytes actually read, or -1 in case of an
896  * error.
897  **/
898 ssize_t rawexpread(off_t a, char *buf, size_t len, CLIENT *client) {
899         int fhandle;
900         off_t foffset;
901         size_t maxbytes;
902
903         if(get_filepos(client->export, a, &fhandle, &foffset, &maxbytes))
904                 return -1;
905         if(maxbytes && len > maxbytes)
906                 len = maxbytes;
907
908         DEBUG4("(READ from fd %d offset %Lu len %u), ", fhandle, foffset, len);
909
910         myseek(fhandle, foffset);
911         return read(fhandle, buf, len);
912 }
913
914 /**
915  * Call rawexpread repeatedly until all data has been read.
916  * @return 0 on success, nonzero on failure
917  **/
918 int rawexpread_fully(off_t a, char *buf, size_t len, CLIENT *client) {
919         ssize_t ret;
920
921         while(len > 0 && (ret=rawexpread(a, buf, len, client)) > 0 ) {
922                 a += ret;
923                 buf += ret;
924                 len -= ret;
925         }
926         return (ret < 0 || len != 0);
927 }
928
929 /**
930  * Read an amount of bytes at a given offset from the right file. This
931  * abstracts the read-side of the copyonwrite stuff, and calls
932  * rawexpread() with the right parameters to do the actual work.
933  * @param a The offset where the read should start
934  * @param buf A buffer to read into
935  * @param len The size of buf
936  * @param client The client we're going to read for
937  * @return 0 on success, nonzero on failure
938  **/
939 int expread(off_t a, char *buf, size_t len, CLIENT *client) {
940         off_t rdlen, offset;
941         off_t mapcnt, mapl, maph, pagestart;
942
943         if (!(client->server->flags & F_COPYONWRITE))
944                 return(rawexpread_fully(a, buf, len, client));
945         DEBUG3("Asked to read %d bytes at %Lu.\n", len, (unsigned long long)a);
946
947         mapl=a/DIFFPAGESIZE; maph=(a+len-1)/DIFFPAGESIZE;
948
949         for (mapcnt=mapl;mapcnt<=maph;mapcnt++) {
950                 pagestart=mapcnt*DIFFPAGESIZE;
951                 offset=a-pagestart;
952                 rdlen=(0<DIFFPAGESIZE-offset && len<(size_t)(DIFFPAGESIZE-offset)) ?
953                         len : (size_t)DIFFPAGESIZE-offset;
954                 if (client->difmap[mapcnt]!=(u32)(-1)) { /* the block is already there */
955                         DEBUG3("Page %Lu is at %lu\n", (unsigned long long)mapcnt,
956                                (unsigned long)(client->difmap[mapcnt]));
957                         myseek(client->difffile, client->difmap[mapcnt]*DIFFPAGESIZE+offset);
958                         if (read(client->difffile, buf, rdlen) != rdlen) return -1;
959                 } else { /* the block is not there */
960                         DEBUG2("Page %Lu is not here, we read the original one\n",
961                                (unsigned long long)mapcnt);
962                         if(rawexpread_fully(a, buf, rdlen, client)) return -1;
963                 }
964                 len-=rdlen; a+=rdlen; buf+=rdlen;
965         }
966         return 0;
967 }
968
969 /**
970  * Write an amount of bytes at a given offset to the right file. This
971  * abstracts the write-side of the copyonwrite option, and calls
972  * rawexpwrite() with the right parameters to do the actual work.
973  *
974  * @param a The offset where the write should start
975  * @param buf The buffer to write from
976  * @param len The length of buf
977  * @param client The client we're going to write for.
978  * @return 0 on success, nonzero on failure
979  **/
980 int expwrite(off_t a, char *buf, size_t len, CLIENT *client) {
981         char pagebuf[DIFFPAGESIZE];
982         off_t mapcnt,mapl,maph;
983         off_t wrlen,rdlen; 
984         off_t pagestart;
985         off_t offset;
986
987         if (!(client->server->flags & F_COPYONWRITE))
988                 return(rawexpwrite_fully(a, buf, len, client)); 
989         DEBUG3("Asked to write %d bytes at %Lu.\n", len, (unsigned long long)a);
990
991         mapl=a/DIFFPAGESIZE ; maph=(a+len-1)/DIFFPAGESIZE ;
992
993         for (mapcnt=mapl;mapcnt<=maph;mapcnt++) {
994                 pagestart=mapcnt*DIFFPAGESIZE ;
995                 offset=a-pagestart ;
996                 wrlen=(0<DIFFPAGESIZE-offset && len<(size_t)(DIFFPAGESIZE-offset)) ?
997                         len : (size_t)DIFFPAGESIZE-offset;
998
999                 if (client->difmap[mapcnt]!=(u32)(-1)) { /* the block is already there */
1000                         DEBUG3("Page %Lu is at %lu\n", (unsigned long long)mapcnt,
1001                                (unsigned long)(client->difmap[mapcnt])) ;
1002                         myseek(client->difffile,
1003                                         client->difmap[mapcnt]*DIFFPAGESIZE+offset);
1004                         if (write(client->difffile, buf, wrlen) != wrlen) return -1 ;
1005                 } else { /* the block is not there */
1006                         myseek(client->difffile,client->difffilelen*DIFFPAGESIZE) ;
1007                         client->difmap[mapcnt]=(client->server->flags&F_SPARSE)?mapcnt:client->difffilelen++;
1008                         DEBUG3("Page %Lu is not here, we put it at %lu\n",
1009                                (unsigned long long)mapcnt,
1010                                (unsigned long)(client->difmap[mapcnt]));
1011                         rdlen=DIFFPAGESIZE ;
1012                         if (rawexpread_fully(pagestart, pagebuf, rdlen, client))
1013                                 return -1;
1014                         memcpy(pagebuf+offset,buf,wrlen) ;
1015                         if (write(client->difffile, pagebuf, DIFFPAGESIZE) !=
1016                                         DIFFPAGESIZE)
1017                                 return -1;
1018                 }                                                   
1019                 len-=wrlen ; a+=wrlen ; buf+=wrlen ;
1020         }
1021         return 0;
1022 }
1023
1024 /**
1025  * Do the initial negotiation.
1026  *
1027  * @param client The client we're negotiating with.
1028  **/
1029 void negotiate(CLIENT *client) {
1030         char zeros[300];
1031         u64 size_host;
1032
1033         memset(zeros, '\0', 290);
1034         if (write(client->net, INIT_PASSWD, 8) < 0)
1035                 err("Negotiation failed: %m");
1036         cliserv_magic = htonll(cliserv_magic);
1037         if (write(client->net, &cliserv_magic, sizeof(cliserv_magic)) < 0)
1038                 err("Negotiation failed: %m");
1039         size_host = htonll((u64)(client->exportsize));
1040         if (write(client->net, &size_host, 8) < 0)
1041                 err("Negotiation failed: %m");
1042         if (write(client->net, zeros, 128) < 0)
1043                 err("Negotiation failed: %m");
1044 }
1045
1046 /** sending macro. */
1047 #define SEND(net,reply) writeit( net, &reply, sizeof( reply ));
1048 /** error macro. */
1049 #define ERROR(client,reply) { reply.error = htonl(-1); SEND(client->net,reply); reply.error = 0; }
1050 /**
1051  * Serve a file to a single client.
1052  *
1053  * @todo This beast needs to be split up in many tiny little manageable
1054  * pieces. Preferably with a chainsaw.
1055  *
1056  * @param client The client we're going to serve to.
1057  * @return when the client disconnects
1058  **/
1059 int mainloop(CLIENT *client) {
1060         struct nbd_request request;
1061         struct nbd_reply reply;
1062         gboolean go_on=TRUE;
1063 #ifdef DODBG
1064         int i = 0;
1065 #endif
1066         negotiate(client);
1067         DEBUG("Entering request loop!\n");
1068         reply.magic = htonl(NBD_REPLY_MAGIC);
1069         reply.error = 0;
1070         while (go_on) {
1071                 char buf[BUFSIZE];
1072                 size_t len;
1073 #ifdef DODBG
1074                 i++;
1075                 printf("%d: ", i);
1076 #endif
1077                 if (client->server->timeout) 
1078                         alarm(client->server->timeout);
1079                 readit(client->net, &request, sizeof(request));
1080                 request.from = ntohll(request.from);
1081                 request.type = ntohl(request.type);
1082
1083                 if (request.type==NBD_CMD_DISC) {
1084                         msg2(LOG_INFO, "Disconnect request received.");
1085                         if (client->server->flags & F_COPYONWRITE) { 
1086                                 if (client->difmap) g_free(client->difmap) ;
1087                                 close(client->difffile);
1088                                 unlink(client->difffilename);
1089                                 free(client->difffilename);
1090                         }
1091                         go_on=FALSE;
1092                         continue;
1093                 }
1094
1095                 len = ntohl(request.len);
1096
1097                 if (request.magic != htonl(NBD_REQUEST_MAGIC))
1098                         err("Not enough magic.");
1099                 if (len > BUFSIZE + sizeof(struct nbd_reply))
1100                         err("Request too big!");
1101 #ifdef DODBG
1102                 printf("%s from %Lu (%Lu) len %d, ", request.type ? "WRITE" :
1103                                 "READ", (unsigned long long)request.from,
1104                                 (unsigned long long)request.from / 512, len);
1105 #endif
1106                 memcpy(reply.handle, request.handle, sizeof(reply.handle));
1107                 if ((request.from + len) > (OFFT_MAX)) {
1108                         DEBUG("[Number too large!]");
1109                         ERROR(client, reply);
1110                         continue;
1111                 }
1112
1113                 if (((ssize_t)((off_t)request.from + len) > client->exportsize)) {
1114                         DEBUG("[RANGE!]");
1115                         ERROR(client, reply);
1116                         continue;
1117                 }
1118
1119                 if (request.type==NBD_CMD_WRITE) {
1120                         DEBUG("wr: net->buf, ");
1121                         readit(client->net, buf, len);
1122                         DEBUG("buf->exp, ");
1123                         if ((client->server->flags & F_READONLY) ||
1124                             (client->server->flags & F_AUTOREADONLY)) {
1125                                 DEBUG("[WRITE to READONLY!]");
1126                                 ERROR(client, reply);
1127                                 continue;
1128                         }
1129                         if (expwrite(request.from, buf, len, client)) {
1130                                 DEBUG("Write failed: %m" );
1131                                 ERROR(client, reply);
1132                                 continue;
1133                         }
1134                         SEND(client->net, reply);
1135                         DEBUG("OK!\n");
1136                         continue;
1137                 }
1138                 /* READ */
1139
1140                 DEBUG("exp->buf, ");
1141                 if (expread(request.from, buf + sizeof(struct nbd_reply), len, client)) {
1142                         DEBUG("Read failed: %m");
1143                         ERROR(client, reply);
1144                         continue;
1145                 }
1146
1147                 DEBUG("buf->net, ");
1148                 memcpy(buf, &reply, sizeof(struct nbd_reply));
1149                 writeit(client->net, buf, len + sizeof(struct nbd_reply));
1150                 DEBUG("OK!\n");
1151         }
1152         return 0;
1153 }
1154
1155 /**
1156  * Set up client export array, which is an array of FILE_INFO.
1157  * Also, split a single exportfile into multiple ones, if that was asked.
1158  * @param client information on the client which we want to setup export for
1159  **/
1160 void setupexport(CLIENT* client) {
1161         int i;
1162         off_t laststartoff = 0, lastsize = 0;
1163         int multifile = (client->server->flags & F_MULTIFILE);
1164
1165         client->export = g_array_new(TRUE, TRUE, sizeof(FILE_INFO));
1166
1167         /* If multi-file, open as many files as we can.
1168          * If not, open exactly one file.
1169          * Calculate file sizes as we go to get total size. */
1170         for(i=0; ; i++) {
1171                 FILE_INFO fi;
1172                 gchar *tmpname;
1173                 mode_t mode = (client->server->flags & F_READONLY) ? O_RDONLY : O_RDWR;
1174
1175                 if(multifile) {
1176                         tmpname=g_strdup_printf("%s.%d", client->exportname, i);
1177                 } else {
1178                         tmpname=g_strdup(client->exportname);
1179                 }
1180                 DEBUG2( "Opening %s\n", tmpname );
1181                 fi.fhandle = open(tmpname, mode);
1182                 if(fi.fhandle == -1 && mode == O_RDWR) {
1183                         /* Try again because maybe media was read-only */
1184                         fi.fhandle = open(tmpname, O_RDONLY);
1185                         if(fi.fhandle != -1) {
1186                                 client->server->flags |= F_AUTOREADONLY;
1187                                 client->server->flags |= F_READONLY;
1188                         }
1189                 }
1190                 if(fi.fhandle == -1) {
1191                         if(multifile && i>0)
1192                                 break;
1193                         err("Could not open exported file: %m");
1194                 }
1195                 fi.startoff = laststartoff + lastsize;
1196                 g_array_append_val(client->export, fi);
1197                 g_free(tmpname);
1198
1199                 /* Starting offset and size of this file will be used to
1200                  * calculate starting offset of next file */
1201                 laststartoff = fi.startoff;
1202                 lastsize = size_autodetect(fi.fhandle);
1203
1204                 if(!multifile)
1205                         break;
1206         }
1207
1208         /* Set export size to total calculated size */
1209         client->exportsize = laststartoff + lastsize;
1210
1211         /* Export size may be overridden */
1212         if(client->server->expected_size) {
1213                 /* desired size must be <= total calculated size */
1214                 if(client->server->expected_size > client->exportsize) {
1215                         err("Size of exported file is too big\n");
1216                 }
1217
1218                 client->exportsize = client->server->expected_size;
1219         }
1220
1221         msg3(LOG_INFO, "Size of exported file/device is %Lu", (unsigned long long)client->exportsize);
1222         if(multifile) {
1223                 msg3(LOG_INFO, "Total number of files: %d", i);
1224         }
1225 }
1226
1227 int copyonwrite_prepare(CLIENT* client) {
1228         off_t i;
1229         if ((client->difffilename = malloc(1024))==NULL)
1230                 err("Failed to allocate string for diff file name");
1231         snprintf(client->difffilename, 1024, "%s-%s-%d.diff",client->exportname,client->clientname,
1232                 (int)getpid()) ;
1233         client->difffilename[1023]='\0';
1234         msg3(LOG_INFO,"About to create map and diff file %s",client->difffilename) ;
1235         client->difffile=open(client->difffilename,O_RDWR | O_CREAT | O_TRUNC,0600) ;
1236         if (client->difffile<0) err("Could not create diff file (%m)") ;
1237         if ((client->difmap=calloc(client->exportsize/DIFFPAGESIZE,sizeof(u32)))==NULL)
1238                 err("Could not allocate memory") ;
1239         for (i=0;i<client->exportsize/DIFFPAGESIZE;i++) client->difmap[i]=(u32)-1 ;
1240
1241         return 0;
1242 }
1243
1244 /**
1245  * Run a command. This is used for the ``prerun'' and ``postrun'' config file
1246  * options
1247  *
1248  * @param command the command to be ran. Read from the config file
1249  * @param file the file name we're about to export
1250  **/
1251 int do_run(gchar* command, gchar* file) {
1252         gchar* cmd;
1253         int retval=0;
1254
1255         if(*command) {
1256                 cmd = g_strdup_printf(command, file);
1257                 retval=system(cmd);
1258                 g_free(cmd);
1259         }
1260         return retval;
1261 }
1262
1263 /**
1264  * Serve a connection. 
1265  *
1266  * @todo allow for multithreading, perhaps use libevent. Not just yet, though;
1267  * follow the road map.
1268  *
1269  * @param client a connected client
1270  **/
1271 void serveconnection(CLIENT *client) {
1272         setupexport(client);
1273
1274         if (client->server->flags & F_COPYONWRITE) {
1275                 copyonwrite_prepare(client);
1276         }
1277
1278         setmysockopt(client->net);
1279
1280         if(!do_run(client->server->prerun, client->exportname)) {
1281                 mainloop(client);
1282         }
1283         do_run(client->server->postrun, client->exportname);
1284 }
1285
1286 /**
1287  * Find the name of the file we have to serve. This will use g_strdup_printf
1288  * to put the IP address of the client inside a filename containing
1289  * "%s" (in the form as specified by the "virtstyle" option). That name
1290  * is then written to client->exportname.
1291  *
1292  * @param net A socket connected to an nbd client
1293  * @param client information about the client. The IP address in human-readable
1294  * format will be written to a new char* buffer, the address of which will be
1295  * stored in client->clientname.
1296  **/
1297 void set_peername(int net, CLIENT *client) {
1298         struct sockaddr_in addrin;
1299         struct sockaddr_in netaddr;
1300         size_t addrinlen = sizeof( addrin );
1301         char *peername;
1302         char *netname;
1303         char *tmp;
1304         int i;
1305
1306         if (getpeername(net, (struct sockaddr *) &addrin, (socklen_t *)&addrinlen) < 0)
1307                 err("getsockname failed: %m");
1308         peername = g_strdup(inet_ntoa(addrin.sin_addr));
1309         switch(client->server->virtstyle) {
1310                 case VIRT_NONE:
1311                         client->exportname=g_strdup(client->server->exportname);
1312                         break;
1313                 case VIRT_IPHASH:
1314                         for(i=0;i<strlen(peername);i++) {
1315                                 if(peername[i]=='.') {
1316                                         peername[i]='/';
1317                                 }
1318                         }
1319                 case VIRT_IPLIT:
1320                         client->exportname=g_strdup_printf(client->server->exportname, peername);
1321                         break;
1322                 case VIRT_CIDR:
1323                         memcpy(&netaddr, &addrin, addrinlen);
1324                         netaddr.sin_addr.s_addr>>=32-(client->server->cidrlen);
1325                         netaddr.sin_addr.s_addr<<=32-(client->server->cidrlen);
1326                         netname = inet_ntoa(netaddr.sin_addr);
1327                         tmp=g_strdup_printf("%s/%s", netname, peername);
1328                         client->exportname=g_strdup_printf(client->server->exportname, tmp);
1329                         break;
1330         }
1331
1332         msg4(LOG_INFO, "connect from %s, assigned file is %s", 
1333              peername, client->exportname);
1334         client->clientname=g_strdup(peername);
1335         g_free(peername);
1336 }
1337
1338 /**
1339  * Destroy a pid_t*
1340  * @param data a pointer to pid_t which should be freed
1341  **/
1342 void destroy_pid_t(gpointer data) {
1343         g_free(data);
1344 }
1345
1346 /**
1347  * Go daemon (unless we specified at compile time that we didn't want this)
1348  * @param serve the first server of our configuration. If its port is zero,
1349  *      then do not daemonize, because we're doing inetd then. This parameter
1350  *      is only used to create a PID file of the form
1351  *      /var/run/nbd-server.&lt;port&gt;.pid; it's not modified in any way.
1352  **/
1353 #if !defined(NODAEMON) && !defined(NOFORK)
1354 void daemonize(SERVER* serve) {
1355         FILE*pidf;
1356
1357         if(serve && !(serve->port)) {
1358                 return;
1359         }
1360         if(daemon(0,0)<0) {
1361                 err("daemon");
1362         }
1363         if(!*pidftemplate) {
1364                 if(serve) {
1365                         strncpy(pidftemplate, "/var/run/server.%d.pid", 255);
1366                 } else {
1367                         strncpy(pidftemplate, "/var/run/server.pid", 255);
1368                 }
1369         }
1370         snprintf(pidfname, 255, pidftemplate, serve ? serve->port : 0);
1371         pidf=fopen(pidfname, "w");
1372         if(pidf) {
1373                 fprintf(pidf,"%d\n", (int)getpid());
1374                 fclose(pidf);
1375         } else {
1376                 perror("fopen");
1377                 fprintf(stderr, "Not fatal; continuing");
1378         }
1379 }
1380 #else
1381 #define daemonize(serve)
1382 #endif /* !defined(NODAEMON) && !defined(NOFORK) */
1383
1384 /**
1385  * Connect a server's socket.
1386  *
1387  * @param serve the server we want to connect.
1388  **/
1389 void setup_serve(SERVER *serve) {
1390         struct sockaddr_in addrin;
1391         struct sigaction sa;
1392         int addrinlen = sizeof(addrin);
1393         int sock_flags;
1394 #ifndef sun
1395         int yes=1;
1396 #else
1397         char yes='1';
1398 #endif /* sun */
1399         if ((serve->socket = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP)) < 0)
1400                 err("socket: %m");
1401
1402         /* lose the pesky "Address already in use" error message */
1403         if (setsockopt(serve->socket,SOL_SOCKET,SO_REUSEADDR,&yes,sizeof(int)) == -1) {
1404                 err("setsockopt SO_REUSEADDR");
1405         }
1406         if (setsockopt(serve->socket,SOL_SOCKET,SO_KEEPALIVE,&yes,sizeof(int)) == -1) {
1407                 err("setsockopt SO_KEEPALIVE");
1408         }
1409
1410         /* make the listening socket non-blocking */
1411         if ((sock_flags = fcntl(serve->socket, F_GETFL, 0)) == -1) {
1412                 err("fcntl F_GETFL");
1413         }
1414         if (fcntl(serve->socket, F_SETFL, sock_flags | O_NONBLOCK) == -1) {
1415                 err("fcntl F_SETFL O_NONBLOCK");
1416         }
1417
1418         DEBUG("Waiting for connections... bind, ");
1419         addrin.sin_family = AF_INET;
1420         addrin.sin_port = htons(serve->port);
1421         addrin.sin_addr.s_addr = 0;
1422         if (bind(serve->socket, (struct sockaddr *) &addrin, addrinlen) < 0)
1423                 err("bind: %m");
1424         DEBUG("listen, ");
1425         if (listen(serve->socket, 1) < 0)
1426                 err("listen: %m");
1427         sa.sa_handler = sigchld_handler;
1428         sigemptyset(&sa.sa_mask);
1429         sa.sa_flags = SA_RESTART;
1430         if(sigaction(SIGCHLD, &sa, NULL) == -1)
1431                 err("sigaction: %m");
1432         sa.sa_handler = sigterm_handler;
1433         sigemptyset(&sa.sa_mask);
1434         sa.sa_flags = SA_RESTART;
1435         if(sigaction(SIGTERM, &sa, NULL) == -1)
1436                 err("sigaction: %m");
1437 }
1438
1439 /**
1440  * Connect our servers.
1441  **/
1442 void setup_servers(GArray* servers) {
1443         int i;
1444
1445         for(i=0;i<servers->len;i++) {
1446                 setup_serve(&(g_array_index(servers, SERVER, i)));
1447         }
1448         children=g_hash_table_new_full(g_int_hash, g_int_equal, NULL, destroy_pid_t);
1449 }
1450
1451 /**
1452  * Loop through the available servers, and serve them.
1453  **/
1454 int serveloop(GArray* servers) {
1455         struct sockaddr_in addrin;
1456         socklen_t addrinlen=sizeof(addrin);
1457         SERVER *serve;
1458         int i;
1459         int max;
1460         int sock;
1461         fd_set mset;
1462         fd_set rset;
1463         struct timeval tv;
1464
1465         /* 
1466          * Set up the master fd_set. The set of descriptors we need
1467          * to select() for never changes anyway and it buys us a *lot*
1468          * of time to only build this once. However, if we ever choose
1469          * to not fork() for clients anymore, we may have to revisit
1470          * this.
1471          */
1472         max=0;
1473         FD_ZERO(&mset);
1474         for(i=0;i<servers->len;i++) {
1475                 sock=(g_array_index(servers, SERVER, i)).socket;
1476                 FD_SET(sock, &mset);
1477                 max=sock>max?sock:max;
1478         }
1479         for(;;) {
1480                 CLIENT *client;
1481                 int net;
1482                 pid_t *pid;
1483
1484                 memcpy(&rset, &mset, sizeof(fd_set));
1485                 tv.tv_sec=0;
1486                 tv.tv_usec=500;
1487                 if(select(max+1, &rset, NULL, NULL, &tv)>0) {
1488                         DEBUG("accept, ");
1489                         for(i=0;i<servers->len;i++) {
1490                                 serve=&(g_array_index(servers, SERVER, i));
1491                                 if(FD_ISSET(serve->socket, &rset)) {
1492                                         if ((net=accept(serve->socket, (struct sockaddr *) &addrin, &addrinlen)) < 0)
1493                                                 err("accept: %m");
1494
1495                                         client = g_malloc(sizeof(CLIENT));
1496                                         client->server=serve;
1497                                         client->exportsize=OFFT_MAX;
1498                                         client->net=net;
1499                                         set_peername(net, client);
1500                                         if (!authorized_client(client)) {
1501                                                 msg2(LOG_INFO,"Unauthorized client") ;
1502                                                 close(net);
1503                                                 continue;
1504                                         }
1505                                         msg2(LOG_INFO,"Authorized client") ;
1506                                         pid=g_malloc(sizeof(pid_t));
1507 #ifndef NOFORK
1508                                         if ((*pid=fork())<0) {
1509                                                 msg3(LOG_INFO,"Could not fork (%s)",strerror(errno)) ;
1510                                                 close(net);
1511                                                 continue;
1512                                         }
1513                                         if (*pid>0) { /* parent */
1514                                                 close(net);
1515                                                 g_hash_table_insert(children, pid, pid);
1516                                                 continue;
1517                                         }
1518                                         /* child */
1519                                         g_hash_table_destroy(children);
1520                                         for(i=0;i<servers->len,serve=(g_array_index(servers, SERVER*, i));i++) {
1521                                                 close(serve->socket);
1522                                         }
1523                                         /* FALSE does not free the
1524                                         actual data. This is required,
1525                                         because the client has a
1526                                         direct reference into that
1527                                         data, and otherwise we get a
1528                                         segfault... */
1529                                         g_array_free(servers, FALSE);
1530 #endif // NOFORK
1531                                         msg2(LOG_INFO,"Starting to serve");
1532                                         serveconnection(client);
1533                                         exit(EXIT_SUCCESS);
1534                                 }
1535                         }
1536                 }
1537         }
1538 }
1539
1540 /**
1541  * Set up user-ID and/or group-ID
1542  **/
1543 void dousers(void) {
1544         struct passwd *pw;
1545         struct group *gr;
1546         if(runuser) {
1547                 pw=getpwnam(runuser);
1548                 if(setuid(pw->pw_uid)<0)
1549                         msg3(LOG_DEBUG, "Could not set UID: %s", strerror(errno));
1550         }
1551         if(rungroup) {
1552                 gr=getgrnam(rungroup);
1553                 if(setgid(gr->gr_gid)<0)
1554                         msg3(LOG_DEBUG, "Could not set GID: %s", strerror(errno));
1555         }
1556 }
1557
1558 /**
1559  * Main entry point...
1560  **/
1561 int main(int argc, char *argv[]) {
1562         SERVER *serve;
1563         GArray *servers;
1564         GError *err=NULL;
1565
1566         if (sizeof( struct nbd_request )!=28) {
1567                 fprintf(stderr,"Bad size of structure. Alignment problems?\n");
1568                 exit(-1) ;
1569         }
1570
1571         memset(pidftemplate, '\0', 256);
1572
1573         logging();
1574         config_file_pos = g_strdup(CFILE);
1575         serve=cmdline(argc, argv);
1576         servers = parse_cfile(config_file_pos, &err);
1577         if(!servers || !servers->len) {
1578                 g_warning("Could not parse config file: %s", err->message);
1579         }
1580         if(serve) {
1581                 g_array_append_val(servers, *serve);
1582      
1583                 if (!(serve->port)) {
1584                         CLIENT *client;
1585 #ifndef ISSERVER
1586                         /* You really should define ISSERVER if you're going to use
1587                          * inetd mode, but if you don't, closing stdout and stderr
1588                          * (which inetd had connected to the client socket) will let it
1589                          * work. */
1590                         close(1);
1591                         close(2);
1592                         open("/dev/null", O_WRONLY);
1593                         open("/dev/null", O_WRONLY);
1594 #endif
1595                         client=g_malloc(sizeof(CLIENT));
1596                         client->server=serve;
1597                         client->net=0;
1598                         client->exportsize=OFFT_MAX;
1599                         set_peername(0,client);
1600                         serveconnection(client);
1601                         return 0;
1602                 }
1603         }
1604         if((!serve) && (!servers||!servers->len)) {
1605                 g_message("Nothing to do! Bye!");
1606                 exit(EXIT_FAILURE);
1607         }
1608         daemonize(serve);
1609         setup_servers(servers);
1610         dousers();
1611         serveloop(servers);
1612         return 0 ;
1613 }