r300: Remove all GCC warnings
[nbd.git] / nbd-server.c
1 /*
2  * Network Block Device - server
3  *
4  * Copyright 1996-1998 Pavel Machek, distribute under GPL
5  *  <pavel@atrey.karlin.mff.cuni.cz>
6  * Copyright 2001-2004 Wouter Verhelst <wouter@debian.org>
7  * Copyright 2002 Anton Altaparmakov <aia21@cam.ac.uk>
8  *
9  * Version 1.0 - hopefully 64-bit-clean
10  * Version 1.1 - merging enhancements from Josh Parsons, <josh@coombs.anu.edu.au>
11  * Version 1.2 - autodetect size of block devices, thanx to Peter T. Breuer" <ptb@it.uc3m.es>
12  * Version 1.5 - can compile on Unix systems that don't have 64 bit integer
13  *      type, or don't have 64 bit file offsets by defining FS_32BIT
14  *      in compile options for nbd-server *only*. This can be done
15  *      with make FSCHOICE=-DFS_32BIT nbd-server. (I don't have the
16  *      original autoconf input file, or I would make it a configure
17  *      option.) Ken Yap <ken@nlc.net.au>.
18  * Version 1.6 - fix autodetection of block device size and really make 64 bit
19  *      clean on 32 bit machines. Anton Altaparmakov <aia21@cam.ac.uk>
20  * Version 2.0 - Version synchronised with client
21  * Version 2.1 - Reap zombie client processes when they exit. Removed
22  *      (uncommented) the _IO magic, it's no longer necessary. Wouter
23  *      Verhelst <wouter@debian.org>
24  * Version 2.2 - Auto switch to read-only mode (usefull for floppies).
25  * Version 2.3 - Fixed code so that Large File Support works. This
26  *      removes the FS_32BIT compile-time directive; define
27  *      _FILE_OFFSET_BITS=64 and _LARGEFILE_SOURCE if you used to be
28  *      using FS_32BIT. This will allow you to use files >2GB instead of
29  *      having to use the -m option. Wouter Verhelst <wouter@debian.org>
30  * Version 2.4 - Added code to keep track of children, so that we can
31  *      properly kill them from initscripts. Add a call to daemon(),
32  *      so that processes don't think they have to wait for us, which is
33  *      interesting for initscripts as well. Wouter Verhelst
34  *      <wouter@debian.org>
35  * Version 2.5 - Bugfix release: forgot to reset child_arraysize to
36  *      zero after fork()ing, resulting in nbd-server going berserk
37  *      when it receives a signal with at least one child open. Wouter
38  *      Verhelst <wouter@debian.org>
39  * 10/10/2003 - Added socket option SO_KEEPALIVE (sf.net bug 819235);
40  *      rectified type of mainloop::size_host (sf.net bugs 814435 and
41  *      817385); close the PID file after writing to it, so that the
42  *      daemon can actually be found. Wouter Verhelst
43  *      <wouter@debian.org>
44  * 10/10/2003 - Size of the data "size_host" was wrong and so was not
45  *      correctly put in network endianness. Many types were corrected
46  *      (size_t and off_t instead of int).  <vspaceg@sourceforge.net>
47  * Version 2.6 - Some code cleanup.
48  * Version 2.7 - Better build system.
49  * 11/02/2004 - Doxygenified the source, modularized it a bit. Needs a 
50  *      lot more work, but this is a start. Wouter Verhelst
51  *      <wouter@debian.org>
52  */
53
54 /* Includes LFS defines, which defines behaviours of some of the following
55  * headers, so must come before those */
56 #include "lfs.h"
57
58 #include <sys/types.h>
59 #include <sys/socket.h>
60 #include <sys/stat.h>
61 #include <sys/select.h>         /* select */
62 #include <sys/wait.h>           /* wait */
63 #ifdef HAVE_SYS_IOCTL_H
64 #include <sys/ioctl.h>
65 #endif
66 #include <sys/param.h>
67 #ifdef HAVE_SYS_MOUNT_H
68 #include <sys/mount.h>          /* For BLKGETSIZE */
69 #endif
70 #include <signal.h>             /* sigaction */
71 #include <errno.h>
72 #include <netinet/tcp.h>
73 #include <netinet/in.h>         /* sockaddr_in, htons, in_addr */
74 #include <netdb.h>              /* hostent, gethostby*, getservby* */
75 #include <syslog.h>
76 #include <unistd.h>
77 #include <stdio.h>
78 #include <stdlib.h>
79 #include <string.h>
80 #include <fcntl.h>
81 #include <arpa/inet.h>
82 #include <strings.h>
83 #include <dirent.h>
84 #include <unistd.h>
85 #include <getopt.h>
86 #include <pwd.h>
87 #include <grp.h>
88
89 #include <glib.h>
90
91 /* used in cliserv.h, so must come first */
92 #define MY_NAME "nbd_server"
93 #include "cliserv.h"
94
95 /** Default position of the config file */
96 #ifndef SYSCONFDIR
97 #define SYSCONFDIR "/etc"
98 #endif
99 #define CFILE SYSCONFDIR "/nbd-server/config"
100
101 /** Where our config file actually is */
102 gchar* config_file_pos;
103
104 /** What user we're running as */
105 gchar* runuser=NULL;
106 /** What group we're running as */
107 gchar* rungroup=NULL;
108
109 /** Logging macros, now nothing goes to syslog unless you say ISSERVER */
110 #ifdef ISSERVER
111 #define msg2(a,b) syslog(a,b)
112 #define msg3(a,b,c) syslog(a,b,c)
113 #define msg4(a,b,c,d) syslog(a,b,c,d)
114 #else
115 #define msg2(a,b) g_message(b)
116 #define msg3(a,b,c) g_message(b,c)
117 #define msg4(a,b,c,d) g_message(b,c,d)
118 #endif
119
120 /* Debugging macros */
121 //#define DODBG
122 #ifdef DODBG
123 #define DEBUG( a ) printf( a )
124 #define DEBUG2( a,b ) printf( a,b )
125 #define DEBUG3( a,b,c ) printf( a,b,c )
126 #define DEBUG4( a,b,c,d ) printf( a,b,c,d )
127 #else
128 #define DEBUG( a )
129 #define DEBUG2( a,b ) 
130 #define DEBUG3( a,b,c ) 
131 #define DEBUG4( a,b,c,d ) 
132 #endif
133 #ifndef PACKAGE_VERSION
134 #define PACKAGE_VERSION ""
135 #endif
136 /**
137  * The highest value a variable of type off_t can reach. This is a signed
138  * integer, so set all bits except for the leftmost one.
139  **/
140 #define OFFT_MAX ~((off_t)1<<(sizeof(off_t)*8-1))
141 #define LINELEN 256       /**< Size of static buffer used to read the
142                                authorization file (yuck) */
143 #define BUFSIZE (1024*1024) /**< Size of buffer that can hold requests */
144 #define DIFFPAGESIZE 4096 /**< diff file uses those chunks */
145 #define F_READONLY 1      /**< flag to tell us a file is readonly */
146 #define F_MULTIFILE 2     /**< flag to tell us a file is exported using -m */
147 #define F_COPYONWRITE 4   /**< flag to tell us a file is exported using
148                             copyonwrite */
149 #define F_AUTOREADONLY 8  /**< flag to tell us a file is set to autoreadonly */
150 #define F_SPARSE 16       /**< flag to tell us copyronwrite should use a sparse file */
151 #define F_SDP 32          /**< flag to tell us the export should be done using the Socket Direct Protocol for RDMA */
152 GHashTable *children;
153 char pidfname[256]; /**< name of our PID file */
154 char pidftemplate[256]; /**< template to be used for the filename of the PID file */
155 char default_authname[] = SYSCONFDIR "/nbd-server/allow"; /**< default name of allow file */
156
157 /**
158  * Types of virtuatlization
159  **/
160 typedef enum {
161         VIRT_NONE=0,    /**< No virtualization */
162         VIRT_IPLIT,     /**< Literal IP address as part of the filename */
163         VIRT_IPHASH,    /**< Replacing all dots in an ip address by a / before
164                              doing the same as in IPLIT */
165         VIRT_CIDR,      /**< Every subnet in its own directory */
166 } VIRT_STYLE;
167
168 /**
169  * Variables associated with a server.
170  **/
171 typedef struct {
172         gchar* exportname;    /**< (unprocessed) filename of the file we're exporting */
173         off_t expected_size; /**< size of the exported file as it was told to
174                                us through configuration */
175         gchar* listenaddr;   /**< The IP address we're listening on */
176         unsigned int port;   /**< port we're exporting this file at */
177         char* authname;      /**< filename of the authorization file */
178         int flags;           /**< flags associated with this exported file */
179         unsigned int timeout;/**< how long a connection may be idle
180                                (0=forever) */
181         int socket;          /**< The socket of this server. */
182         VIRT_STYLE virtstyle;/**< The style of virtualization, if any */
183         uint8_t cidrlen;     /**< The length of the mask when we use
184                                   CIDR-style virtualization */
185         gchar* prerun;       /**< command to be ran after connecting a client,
186                                   but before starting to serve */
187         gchar* postrun;      /**< command that will be ran after the client
188                                   disconnects */
189 } SERVER;
190
191 /**
192  * Variables associated with a client socket.
193  **/
194 typedef struct {
195         int fhandle;      /**< file descriptor */
196         off_t startoff;   /**< starting offset of this file */
197 } FILE_INFO;
198
199 typedef struct {
200         off_t exportsize;    /**< size of the file we're exporting */
201         char *clientname;    /**< peer */
202         char *exportname;    /**< (processed) filename of the file we're exporting */
203         GArray *export;    /**< array of FILE_INFO of exported files;
204                                array size is always 1 unless we're
205                                doing the multiple file option */
206         int net;             /**< The actual client socket */
207         SERVER *server;      /**< The server this client is getting data from */
208         char* difffilename;  /**< filename of the copy-on-write file, if any */
209         int difffile;        /**< filedescriptor of copyonwrite file. @todo
210                                shouldn't this be an array too? (cfr export) Or
211                                make -m and -c mutually exclusive */
212         u32 difffilelen;     /**< number of pages in difffile */
213         u32 *difmap;         /**< see comment on the global difmap for this one */
214 } CLIENT;
215
216 /**
217  * Type of configuration file values
218  **/
219 typedef enum {
220         PARAM_INT,              /**< This parameter is an integer */
221         PARAM_STRING,           /**< This parameter is a string */
222         PARAM_BOOL,             /**< This parameter is a boolean */
223 } PARAM_TYPE;
224
225 /**
226  * Configuration file values
227  **/
228 typedef struct {
229         gchar *paramname;       /**< Name of the parameter, as it appears in
230                                   the config file */
231         gboolean required;      /**< Whether this is a required (as opposed to
232                                   optional) parameter */
233         PARAM_TYPE ptype;       /**< Type of the parameter. */
234         gpointer target;        /**< Pointer to where the data of this
235                                   parameter should be written. If ptype is
236                                   PARAM_BOOL, the data is or'ed rather than
237                                   overwritten. */
238         gint flagval;           /**< Flag mask for this parameter in case ptype
239                                   is PARAM_BOOL. */
240 } PARAM;
241
242 /**
243  * Check whether a client is allowed to connect. Works with an authorization
244  * file which contains one line per machine, no wildcards.
245  *
246  * @param opts The client who's trying to connect.
247  * @return 0 - authorization refused, 1 - OK
248  **/
249 int authorized_client(CLIENT *opts) {
250         const char *ERRMSG="Invalid entry '%s' in authfile '%s', so, refusing all connections.";
251         FILE *f ;
252         char line[LINELEN]; 
253         char *tmp;
254         struct in_addr addr;
255         struct in_addr client;
256         struct in_addr cltemp;
257         int len;
258
259         if ((f=fopen(opts->server->authname,"r"))==NULL) {
260                 msg4(LOG_INFO,"Can't open authorization file %s (%s).",
261                      opts->server->authname,strerror(errno)) ;
262                 return 1 ; 
263         }
264   
265         inet_aton(opts->clientname, &client);
266         while (fgets(line,LINELEN,f)!=NULL) {
267                 if((tmp=index(line, '/'))) {
268                         if(strlen(line)<=tmp-line) {
269                                 msg4(LOG_CRIT, ERRMSG, line, opts->server->authname);
270                                 return 0;
271                         }
272                         *(tmp++)=0;
273                         if(inet_aton(line,&addr)) {
274                                 msg4(LOG_CRIT, ERRMSG, line, opts->server->authname);
275                                 return 0;
276                         }
277                         len=strtol(tmp, NULL, 0);
278                         addr.s_addr>>=32-len;
279                         addr.s_addr<<=32-len;
280                         memcpy(&cltemp,&client,sizeof(client));
281                         cltemp.s_addr>>=32-len;
282                         cltemp.s_addr<<=32-len;
283                         if(addr.s_addr == cltemp.s_addr) {
284                                 return 1;
285                         }
286                 }
287                 if (strncmp(line,opts->clientname,strlen(opts->clientname))==0) {
288                         fclose(f);
289                         return 1;
290                 }
291         }
292         fclose(f);
293         return 0;
294 }
295
296 /**
297  * Read data from a file descriptor into a buffer
298  *
299  * @param f a file descriptor
300  * @param buf a buffer
301  * @param len the number of bytes to be read
302  **/
303 inline void readit(int f, void *buf, size_t len) {
304         ssize_t res;
305         while (len > 0) {
306                 DEBUG("*");
307                 if ((res = read(f, buf, len)) <= 0)
308                         err("Read failed: %m");
309                 len -= res;
310                 buf += res;
311         }
312 }
313
314 /**
315  * Write data from a buffer into a filedescriptor
316  *
317  * @param f a file descriptor
318  * @param buf a buffer containing data
319  * @param len the number of bytes to be written
320  **/
321 inline void writeit(int f, void *buf, size_t len) {
322         ssize_t res;
323         while (len > 0) {
324                 DEBUG("+");
325                 if ((res = write(f, buf, len)) <= 0)
326                         err("Send failed: %m");
327                 len -= res;
328                 buf += res;
329         }
330 }
331
332 /**
333  * Print out a message about how to use nbd-server. Split out to a separate
334  * function so that we can call it from multiple places
335  */
336 void usage() {
337         printf("This is nbd-server version " VERSION "\n");
338         printf("Usage: [ip:]port file_to_export [size][kKmM] [-l authorize_file] [-r] [-m] [-c] [-a timeout_sec] [-C configuration file] [-p PID file name] [-o section name]\n"
339                "\t-r|--read-only\t\tread only\n"
340                "\t-m|--multi-file\t\tmultiple file\n"
341                "\t-c|--copy-on-write\tcopy on write\n"
342                "\t-C|--config-file\tspecify an alternate configuration file\n"
343                "\t-l|--authorize-file\tfile with list of hosts that are allowed to\n\t\t\t\tconnect.\n"
344                "\t-a|--idle-time\t\tmaximum idle seconds; server terminates when\n\t\t\t\tidle time exceeded\n"
345                "\t-p|--pid-file\t\tspecify a filename to write our PID to\n"
346                "\t-o|--output-config\toutput a config file section for what you\n\t\t\t\tspecified on the command line, with the\n\t\t\t\tspecified section name\n\n"
347                "\tif port is set to 0, stdin is used (for running from inetd)\n"
348                "\tif file_to_export contains '%%s', it is substituted with the IP\n"
349                "\t\taddress of the machine trying to connect\n" 
350                "\tif ip is set, it contains the local IP address on which we're listening.\n\tif not, the server will listen on all local IP addresses\n");
351         printf("Using configuration file %s\n", CFILE);
352 }
353
354 /* Dumps a config file section of the given SERVER*, and exits. */
355 void dump_section(SERVER* serve, gchar* section_header) {
356         printf("[%s]\n", section_header);
357         printf("\texportname = %s\n", serve->exportname);
358         printf("\tlistenaddr = %s\n", serve->listenaddr);
359         printf("\tport = %d\n", serve->port);
360         if(serve->flags & F_READONLY) {
361                 printf("\treadonly = true\n");
362         }
363         if(serve->flags & F_MULTIFILE) {
364                 printf("\tmultifile = true\n");
365         }
366         if(serve->flags & F_COPYONWRITE) {
367                 printf("\tcopyonwrite = true\n");
368         }
369         if(serve->expected_size) {
370                 printf("\tfilesize = %Ld\n", (long long int)serve->expected_size);
371         }
372         if(serve->authname) {
373                 printf("\tauthfile = %s\n", serve->authname);
374         }
375         if(serve->timeout) {
376                 printf("\ttimeout = %d\n", serve->timeout);
377         }
378         exit(EXIT_SUCCESS);
379 }
380
381 /**
382  * Parse the command line.
383  *
384  * @param argc the argc argument to main()
385  * @param argv the argv argument to main()
386  **/
387 SERVER* cmdline(int argc, char *argv[]) {
388         int i=0;
389         int nonspecial=0;
390         int c;
391         struct option long_options[] = {
392                 {"read-only", no_argument, NULL, 'r'},
393                 {"multi-file", no_argument, NULL, 'm'},
394                 {"copy-on-write", no_argument, NULL, 'c'},
395                 {"authorize-file", required_argument, NULL, 'l'},
396                 {"idle-time", required_argument, NULL, 'a'},
397                 {"config-file", required_argument, NULL, 'C'},
398                 {"pid-file", required_argument, NULL, 'p'},
399                 {"output-config", required_argument, NULL, 'o'},
400                 {0,0,0,0}
401         };
402         SERVER *serve;
403         off_t es;
404         size_t last;
405         char suffix;
406         gboolean do_output=FALSE;
407         gchar* section_header="";
408         gchar** addr_port;
409
410         if(argc==1) {
411                 return NULL;
412         }
413         serve=g_new0(SERVER, 1);
414         serve->authname = g_strdup(default_authname);
415         serve->virtstyle=VIRT_IPLIT;
416         while((c=getopt_long(argc, argv, "-a:C:cl:mo:rp:", long_options, &i))>=0) {
417                 switch (c) {
418                 case 1:
419                         /* non-option argument */
420                         switch(nonspecial++) {
421                         case 0:
422                                 addr_port=g_strsplit(optarg, ":", 2);
423                                 if(addr_port[1]) {
424                                         serve->port=strtol(addr_port[1], NULL, 0);
425                                         serve->listenaddr=g_strdup(addr_port[0]);
426                                 } else {
427                                         serve->listenaddr=g_strdup("0.0.0.0");
428                                         serve->port=strtol(addr_port[0], NULL, 0);
429                                 }
430                                 g_strfreev(addr_port);
431                                 break;
432                         case 1:
433                                 serve->exportname = g_strdup(optarg);
434                                 if(serve->exportname[0] != '/') {
435                                         fprintf(stderr, "E: The to be exported file needs to be an absolute filename!\n");
436                                         exit(EXIT_FAILURE);
437                                 }
438                                 break;
439                         case 2:
440                                 last=strlen(optarg)-1;
441                                 suffix=optarg[last];
442                                 if (suffix == 'k' || suffix == 'K' ||
443                                     suffix == 'm' || suffix == 'M')
444                                         optarg[last] = '\0';
445                                 es = (off_t)atol(optarg);
446                                 switch (suffix) {
447                                         case 'm':
448                                         case 'M':  es <<= 10;
449                                         case 'k':
450                                         case 'K':  es <<= 10;
451                                         default :  break;
452                                 }
453                                 serve->expected_size = es;
454                                 break;
455                         }
456                         break;
457                 case 'r':
458                         serve->flags |= F_READONLY;
459                         break;
460                 case 'm':
461                         serve->flags |= F_MULTIFILE;
462                         break;
463                 case 'o':
464                         do_output = TRUE;
465                         section_header = g_strdup(optarg);
466                         break;
467                 case 'p':
468                         strncpy(pidftemplate, optarg, 256);
469                         break;
470                 case 'c': 
471                         serve->flags |=F_COPYONWRITE;
472                         break;
473                 case 'C':
474                         g_free(config_file_pos);
475                         config_file_pos=g_strdup(optarg);
476                         break;
477                 case 'l':
478                         g_free(serve->authname);
479                         serve->authname=g_strdup(optarg);
480                         break;
481                 case 'a': 
482                         serve->timeout=strtol(optarg, NULL, 0);
483                         break;
484                 default:
485                         usage();
486                         exit(EXIT_FAILURE);
487                         break;
488                 }
489         }
490         /* What's left: the port to export, the name of the to be exported
491          * file, and, optionally, the size of the file, in that order. */
492         if(nonspecial<2) {
493                 g_free(serve);
494                 serve=NULL;
495         }
496         if(do_output) {
497                 if(!serve) {
498                         g_critical("Need a complete configuration on the command line to output a config file section!");
499                         exit(EXIT_FAILURE);
500                 }
501                 dump_section(serve, section_header);
502         }
503         return serve;
504 }
505
506 /**
507  * Error codes for config file parsing
508  **/
509 typedef enum {
510         CFILE_NOTFOUND,         /**< The configuration file is not found */
511         CFILE_MISSING_GENERIC,  /**< The (required) group "generic" is missing */
512         CFILE_KEY_MISSING,      /**< A (required) key is missing */
513         CFILE_VALUE_INVALID,    /**< A value is syntactically invalid */
514         CFILE_VALUE_UNSUPPORTED,/**< A value is not supported in this build */
515         CFILE_PROGERR           /**< Programmer error */
516 } CFILE_ERRORS;
517
518 /**
519  * Remove a SERVER from memory. Used from the hash table
520  **/
521 void remove_server(gpointer s) {
522         SERVER *server;
523
524         server=(SERVER*)s;
525         g_free(server->exportname);
526         if(server->authname)
527                 g_free(server->authname);
528         g_free(server);
529 }
530
531 /**
532  * Parse the config file.
533  *
534  * @param f the name of the config file
535  * @param e a GError. @see CFILE_ERRORS for what error values this function can
536  *      return.
537  * @return a Array of SERVER* pointers, If the config file is empty or does not
538  *      exist, returns an empty GHashTable; if the config file contains an
539  *      error, returns NULL, and e is set appropriately
540  **/
541 GArray* parse_cfile(gchar* f, GError** e) {
542         const char* DEFAULT_ERROR = "Could not parse %s in group %s: %s";
543         const char* MISSING_REQUIRED_ERROR = "Could not find required value %s in group %s: %s";
544         SERVER s;
545         gchar *virtstyle=NULL;
546         PARAM lp[] = {
547                 { "exportname", TRUE,   PARAM_STRING,   NULL, 0 },
548                 { "port",       TRUE,   PARAM_INT,      NULL, 0 },
549                 { "authfile",   FALSE,  PARAM_STRING,   NULL, 0 },
550                 { "timeout",    FALSE,  PARAM_INT,      NULL, 0 },
551                 { "filesize",   FALSE,  PARAM_INT,      NULL, 0 },
552                 { "virtstyle",  FALSE,  PARAM_STRING,   NULL, 0 },
553                 { "prerun",     FALSE,  PARAM_STRING,   NULL, 0 },
554                 { "postrun",    FALSE,  PARAM_STRING,   NULL, 0 },
555                 { "readonly",   FALSE,  PARAM_BOOL,     NULL, F_READONLY },
556                 { "multifile",  FALSE,  PARAM_BOOL,     NULL, F_MULTIFILE },
557                 { "copyonwrite", FALSE, PARAM_BOOL,     NULL, F_COPYONWRITE },
558                 { "autoreadonly", FALSE, PARAM_BOOL,    NULL, F_AUTOREADONLY },
559                 { "sparse_cow", FALSE,  PARAM_BOOL,     NULL, F_SPARSE },
560                 { "sdp",        FALSE,  PARAM_BOOL,     NULL, F_SDP },
561                 { "listenaddr", FALSE,  PARAM_STRING,   NULL, 0 },
562         };
563         const int lp_size=15;
564         PARAM gp[] = {
565                 { "user",       FALSE, PARAM_STRING,    &runuser,       0 },
566                 { "group",      FALSE, PARAM_STRING,    &rungroup,      0 },
567         };
568         PARAM* p=gp;
569         int p_size=2;
570         GKeyFile *cfile;
571         GError *err = NULL;
572         const char *err_msg=NULL;
573         GQuark errdomain;
574         GArray *retval=NULL;
575         gchar **groups;
576         gboolean value;
577         gint i;
578         gint j;
579
580         errdomain = g_quark_from_string("parse_cfile");
581         cfile = g_key_file_new();
582         retval = g_array_new(FALSE, TRUE, sizeof(SERVER));
583         if(!g_key_file_load_from_file(cfile, f, G_KEY_FILE_KEEP_COMMENTS |
584                         G_KEY_FILE_KEEP_TRANSLATIONS, &err)) {
585                 g_set_error(e, errdomain, CFILE_NOTFOUND, "Could not open config file.");
586                 g_key_file_free(cfile);
587                 return retval;
588         }
589         if(strcmp(g_key_file_get_start_group(cfile), "generic")) {
590                 g_set_error(e, errdomain, CFILE_MISSING_GENERIC, "Config file does not contain the [generic] group!");
591                 g_key_file_free(cfile);
592                 return NULL;
593         }
594         groups = g_key_file_get_groups(cfile, NULL);
595         for(i=0;groups[i];i++) {
596                 memset(&s, '\0', sizeof(SERVER));
597                 lp[0].target=&(s.exportname);
598                 lp[1].target=&(s.port);
599                 lp[2].target=&(s.authname);
600                 lp[3].target=&(s.timeout);
601                 lp[4].target=&(s.expected_size);
602                 lp[5].target=&(virtstyle);
603                 lp[6].target=&(s.prerun);
604                 lp[7].target=&(s.postrun);
605                 lp[8].target=lp[9].target=lp[10].target=
606                                 lp[11].target=lp[12].target=
607                                 lp[13].target=&(s.flags);
608                 lp[14].target=&(s.listenaddr);
609
610                 /* After the [generic] group, start parsing exports */
611                 if(i==1) {
612                         p=lp;
613                         p_size=lp_size;
614                 } 
615                 for(j=0;j<p_size;j++) {
616                         g_assert(p[j].target != NULL);
617                         g_assert(p[j].ptype==PARAM_INT||p[j].ptype==PARAM_STRING||p[j].ptype==PARAM_BOOL);
618                         switch(p[j].ptype) {
619                                 case PARAM_INT:
620                                         *((gint*)p[j].target) =
621                                                 g_key_file_get_integer(cfile,
622                                                                 groups[i],
623                                                                 p[j].paramname,
624                                                                 &err);
625                                         break;
626                                 case PARAM_STRING:
627                                         *((gchar**)p[j].target) =
628                                                 g_key_file_get_string(cfile,
629                                                                 groups[i],
630                                                                 p[j].paramname,
631                                                                 &err);
632                                         break;
633                                 case PARAM_BOOL:
634                                         value = g_key_file_get_boolean(cfile,
635                                                         groups[i],
636                                                         p[j].paramname, &err);
637                                         if(!err) {
638                                                 if(value) {
639                                                         *((gint*)p[j].target) |= p[j].flagval;
640                                                 } else {
641                                                         *((gint*)p[j].target) &= ~(p[j].flagval);
642                                                 }
643                                         }
644                                         break;
645                         }
646                         if(err) {
647                                 if(err->code == G_KEY_FILE_ERROR_KEY_NOT_FOUND) {
648                                         if(!p[j].required) {
649                                                 /* Ignore not-found error for optional values */
650                                                 g_clear_error(&err);
651                                                 continue;
652                                         } else {
653                                                 err_msg = MISSING_REQUIRED_ERROR;
654                                         }
655                                 } else {
656                                         err_msg = DEFAULT_ERROR;
657                                 }
658                                 g_set_error(e, errdomain, CFILE_VALUE_INVALID, err_msg, p[j].paramname, groups[i], err->message);
659                                 g_array_free(retval, TRUE);
660                                 g_error_free(err);
661                                 g_key_file_free(cfile);
662                                 return NULL;
663                         }
664                 }
665                 if(virtstyle) {
666                         if(!strncmp(virtstyle, "none", 4)) {
667                                 s.virtstyle=VIRT_NONE;
668                         } else if(!strncmp(virtstyle, "ipliteral", 9)) {
669                                 s.virtstyle=VIRT_IPLIT;
670                         } else if(!strncmp(virtstyle, "iphash", 6)) {
671                                 s.virtstyle=VIRT_IPHASH;
672                         } else if(!strncmp(virtstyle, "cidrhash", 8)) {
673                                 s.virtstyle=VIRT_CIDR;
674                                 if(strlen(virtstyle)<10) {
675                                         g_set_error(e, errdomain, CFILE_VALUE_INVALID, "Invalid value %s for parameter virtstyle in group %s: missing length", virtstyle, groups[i]);
676                                         g_array_free(retval, TRUE);
677                                         g_key_file_free(cfile);
678                                         return NULL;
679                                 }
680                                 s.cidrlen=strtol(virtstyle+8, NULL, 0);
681                         } else {
682                                 g_set_error(e, errdomain, CFILE_VALUE_INVALID, "Invalid value %s for parameter virtstyle in group %s", virtstyle, groups[i]);
683                                 g_array_free(retval, TRUE);
684                                 g_key_file_free(cfile);
685                                 return NULL;
686                         }
687                 } else {
688                         s.virtstyle=VIRT_IPLIT;
689                 }
690                 /* Don't need to free this, it's not our string */
691                 virtstyle=NULL;
692                 /* Don't append values for the [generic] group */
693                 if(i>0) {
694                         if(!s.listenaddr) {
695                                 s.listenaddr = g_strdup("0.0.0.0");
696                         }
697                         g_array_append_val(retval, s);
698                 }
699 #ifndef WITH_SDP
700                 if(s.flags & F_SDP) {
701                         g_set_error(e, errdomain, CFILE_VALUE_UNSUPPORTED, "This nbd-server was built without support for SDP, yet group %s uses it", groups[i]);
702                         g_array_free(retval, TRUE);
703                         g_key_file_free(cfile);
704                         return NULL;
705                 }
706 #endif
707         }
708         return retval;
709 }
710
711 /**
712  * Signal handler for SIGCHLD
713  * @param s the signal we're handling (must be SIGCHLD, or something
714  * is severely wrong)
715  **/
716 void sigchld_handler(int s) {
717         int status;
718         int* i;
719         pid_t pid;
720
721         while((pid=waitpid(-1, &status, WNOHANG)) > 0) {
722                 if(WIFEXITED(status)) {
723                         msg3(LOG_INFO, "Child exited with %d", WEXITSTATUS(status));
724                 }
725                 i=g_hash_table_lookup(children, &pid);
726                 if(!i) {
727                         msg3(LOG_INFO, "SIGCHLD received for an unknown child with PID %ld", (long)pid);
728                 } else {
729                         DEBUG2("Removing %d from the list of children", pid);
730                         g_hash_table_remove(children, &pid);
731                 }
732         }
733 }
734
735 /**
736  * Kill a child. Called from sigterm_handler::g_hash_table_foreach.
737  *
738  * @param key the key
739  * @param value the value corresponding to the above key
740  * @param user_data a pointer which we always set to 1, so that we know what
741  * will happen next.
742  **/
743 void killchild(gpointer key, gpointer value, gpointer user_data) {
744         pid_t *pid=value;
745         int *parent=user_data;
746
747         kill(*pid, SIGTERM);
748         *parent=1;
749 }
750
751 /**
752  * Handle SIGTERM and dispatch it to our children
753  * @param s the signal we're handling (must be SIGTERM, or something
754  * is severely wrong).
755  **/
756 void sigterm_handler(int s) {
757         int parent=0;
758
759         g_hash_table_foreach(children, killchild, &parent);
760
761         if(parent) {
762                 unlink(pidfname);
763         }
764
765         exit(0);
766 }
767
768 /**
769  * Detect the size of a file.
770  *
771  * @param fhandle An open filedescriptor
772  * @return the size of the file, or OFFT_MAX if detection was
773  * impossible.
774  **/
775 off_t size_autodetect(int fhandle) {
776         off_t es;
777         unsigned long sectors;
778         struct stat stat_buf;
779         int error;
780
781 #ifdef HAVE_SYS_MOUNT_H
782 #ifdef HAVE_SYS_IOCTL_H
783 #ifdef BLKGETSIZE
784         DEBUG("looking for export size with ioctl BLKGETSIZE\n");
785         if (!ioctl(fhandle, BLKGETSIZE, &sectors) && sectors) {
786                 es = (off_t)sectors * (off_t)512;
787                 return es;
788         }
789 #endif /* BLKGETSIZE */
790 #endif /* HAVE_SYS_IOCTL_H */
791 #endif /* HAVE_SYS_MOUNT_H */
792
793         DEBUG("looking for fhandle size with fstat\n");
794         stat_buf.st_size = 0;
795         error = fstat(fhandle, &stat_buf);
796         if (!error) {
797                 if(stat_buf.st_size > 0)
798                         return (off_t)stat_buf.st_size;
799         } else {
800                 err("fstat failed: %m");
801         }
802
803         DEBUG("looking for fhandle size with lseek SEEK_END\n");
804         es = lseek(fhandle, (off_t)0, SEEK_END);
805         if (es > ((off_t)0)) {
806                 return es;
807         } else {
808                 DEBUG2("lseek failed: %d", errno==EBADF?1:(errno==ESPIPE?2:(errno==EINVAL?3:4)));
809         }
810
811         err("Could not find size of exported block device: %m");
812         return OFFT_MAX;
813 }
814
815 /**
816  * Get the file handle and offset, given an export offset.
817  *
818  * @param export An array of export files
819  * @param a The offset to get corresponding file/offset for
820  * @param fhandle [out] File descriptor
821  * @param foffset [out] Offset into fhandle
822  * @param maxbytes [out] Tells how many bytes can be read/written
823  * from fhandle starting at foffset (0 if there is no limit)
824  * @return 0 on success, -1 on failure
825  **/
826 int get_filepos(GArray* export, off_t a, int* fhandle, off_t* foffset, size_t* maxbytes ) {
827         /* Negative offset not allowed */
828         if(a < 0)
829                 return -1;
830
831         /* Binary search for last file with starting offset <= a */
832         FILE_INFO fi;
833         int start = 0;
834         int end = export->len - 1;
835         while( start <= end ) {
836                 int mid = (start + end) / 2;
837                 fi = g_array_index(export, FILE_INFO, mid);
838                 if( fi.startoff < a ) {
839                         start = mid + 1;
840                 } else if( fi.startoff > a ) {
841                         end = mid - 1;
842                 } else {
843                         start = end = mid;
844                         break;
845                 }
846         }
847
848         /* end should never go negative, since first startoff is 0 and a >= 0 */
849         g_assert(end >= 0);
850
851         fi = g_array_index(export, FILE_INFO, end);
852         *fhandle = fi.fhandle;
853         *foffset = a - fi.startoff;
854         *maxbytes = 0;
855         if( end+1 < export->len ) {
856                 FILE_INFO fi_next = g_array_index(export, FILE_INFO, end+1);
857                 *maxbytes = fi_next.startoff - a;
858         }
859
860         return 0;
861 }
862
863 /**
864  * seek to a position in a file, with error handling.
865  * @param handle a filedescriptor
866  * @param a position to seek to
867  * @todo get rid of this; lastpoint is a global variable right now, but it
868  * shouldn't be. If we pass it on as a parameter, that makes things a *lot*
869  * easier.
870  **/
871 void myseek(int handle,off_t a) {
872         if (lseek(handle, a, SEEK_SET) < 0) {
873                 err("Can not seek locally!\n");
874         }
875 }
876
877 /**
878  * Write an amount of bytes at a given offset to the right file. This
879  * abstracts the write-side of the multiple file option.
880  *
881  * @param a The offset where the write should start
882  * @param buf The buffer to write from
883  * @param len The length of buf
884  * @param client The client we're serving for
885  * @return The number of bytes actually written, or -1 in case of an error
886  **/
887 ssize_t rawexpwrite(off_t a, char *buf, size_t len, CLIENT *client) {
888         int fhandle;
889         off_t foffset;
890         size_t maxbytes;
891
892         if(get_filepos(client->export, a, &fhandle, &foffset, &maxbytes))
893                 return -1;
894         if(maxbytes && len > maxbytes)
895                 len = maxbytes;
896
897         DEBUG4("(WRITE to fd %d offset %Lu len %u), ", fhandle, foffset, len);
898
899         myseek(fhandle, foffset);
900         return write(fhandle, buf, len);
901 }
902
903 /**
904  * Call rawexpwrite repeatedly until all data has been written.
905  * @return 0 on success, nonzero on failure
906  **/
907 int rawexpwrite_fully(off_t a, char *buf, size_t len, CLIENT *client) {
908         ssize_t ret=0;
909
910         while(len > 0 && (ret=rawexpwrite(a, buf, len, client)) > 0 ) {
911                 a += ret;
912                 buf += ret;
913                 len -= ret;
914         }
915         return (ret < 0 || len != 0);
916 }
917
918 /**
919  * Read an amount of bytes at a given offset from the right file. This
920  * abstracts the read-side of the multiple files option.
921  *
922  * @param a The offset where the read should start
923  * @param buf A buffer to read into
924  * @param len The size of buf
925  * @param client The client we're serving for
926  * @return The number of bytes actually read, or -1 in case of an
927  * error.
928  **/
929 ssize_t rawexpread(off_t a, char *buf, size_t len, CLIENT *client) {
930         int fhandle;
931         off_t foffset;
932         size_t maxbytes;
933
934         if(get_filepos(client->export, a, &fhandle, &foffset, &maxbytes))
935                 return -1;
936         if(maxbytes && len > maxbytes)
937                 len = maxbytes;
938
939         DEBUG4("(READ from fd %d offset %Lu len %u), ", fhandle, foffset, len);
940
941         myseek(fhandle, foffset);
942         return read(fhandle, buf, len);
943 }
944
945 /**
946  * Call rawexpread repeatedly until all data has been read.
947  * @return 0 on success, nonzero on failure
948  **/
949 int rawexpread_fully(off_t a, char *buf, size_t len, CLIENT *client) {
950         ssize_t ret=0;
951
952         while(len > 0 && (ret=rawexpread(a, buf, len, client)) > 0 ) {
953                 a += ret;
954                 buf += ret;
955                 len -= ret;
956         }
957         return (ret < 0 || len != 0);
958 }
959
960 /**
961  * Read an amount of bytes at a given offset from the right file. This
962  * abstracts the read-side of the copyonwrite stuff, and calls
963  * rawexpread() with the right parameters to do the actual work.
964  * @param a The offset where the read should start
965  * @param buf A buffer to read into
966  * @param len The size of buf
967  * @param client The client we're going to read for
968  * @return 0 on success, nonzero on failure
969  **/
970 int expread(off_t a, char *buf, size_t len, CLIENT *client) {
971         off_t rdlen, offset;
972         off_t mapcnt, mapl, maph, pagestart;
973
974         if (!(client->server->flags & F_COPYONWRITE))
975                 return(rawexpread_fully(a, buf, len, client));
976         DEBUG3("Asked to read %d bytes at %Lu.\n", len, (unsigned long long)a);
977
978         mapl=a/DIFFPAGESIZE; maph=(a+len-1)/DIFFPAGESIZE;
979
980         for (mapcnt=mapl;mapcnt<=maph;mapcnt++) {
981                 pagestart=mapcnt*DIFFPAGESIZE;
982                 offset=a-pagestart;
983                 rdlen=(0<DIFFPAGESIZE-offset && len<(size_t)(DIFFPAGESIZE-offset)) ?
984                         len : (size_t)DIFFPAGESIZE-offset;
985                 if (client->difmap[mapcnt]!=(u32)(-1)) { /* the block is already there */
986                         DEBUG3("Page %Lu is at %lu\n", (unsigned long long)mapcnt,
987                                (unsigned long)(client->difmap[mapcnt]));
988                         myseek(client->difffile, client->difmap[mapcnt]*DIFFPAGESIZE+offset);
989                         if (read(client->difffile, buf, rdlen) != rdlen) return -1;
990                 } else { /* the block is not there */
991                         DEBUG2("Page %Lu is not here, we read the original one\n",
992                                (unsigned long long)mapcnt);
993                         if(rawexpread_fully(a, buf, rdlen, client)) return -1;
994                 }
995                 len-=rdlen; a+=rdlen; buf+=rdlen;
996         }
997         return 0;
998 }
999
1000 /**
1001  * Write an amount of bytes at a given offset to the right file. This
1002  * abstracts the write-side of the copyonwrite option, and calls
1003  * rawexpwrite() with the right parameters to do the actual work.
1004  *
1005  * @param a The offset where the write should start
1006  * @param buf The buffer to write from
1007  * @param len The length of buf
1008  * @param client The client we're going to write for.
1009  * @return 0 on success, nonzero on failure
1010  **/
1011 int expwrite(off_t a, char *buf, size_t len, CLIENT *client) {
1012         char pagebuf[DIFFPAGESIZE];
1013         off_t mapcnt,mapl,maph;
1014         off_t wrlen,rdlen; 
1015         off_t pagestart;
1016         off_t offset;
1017
1018         if (!(client->server->flags & F_COPYONWRITE))
1019                 return(rawexpwrite_fully(a, buf, len, client)); 
1020         DEBUG3("Asked to write %d bytes at %Lu.\n", len, (unsigned long long)a);
1021
1022         mapl=a/DIFFPAGESIZE ; maph=(a+len-1)/DIFFPAGESIZE ;
1023
1024         for (mapcnt=mapl;mapcnt<=maph;mapcnt++) {
1025                 pagestart=mapcnt*DIFFPAGESIZE ;
1026                 offset=a-pagestart ;
1027                 wrlen=(0<DIFFPAGESIZE-offset && len<(size_t)(DIFFPAGESIZE-offset)) ?
1028                         len : (size_t)DIFFPAGESIZE-offset;
1029
1030                 if (client->difmap[mapcnt]!=(u32)(-1)) { /* the block is already there */
1031                         DEBUG3("Page %Lu is at %lu\n", (unsigned long long)mapcnt,
1032                                (unsigned long)(client->difmap[mapcnt])) ;
1033                         myseek(client->difffile,
1034                                         client->difmap[mapcnt]*DIFFPAGESIZE+offset);
1035                         if (write(client->difffile, buf, wrlen) != wrlen) return -1 ;
1036                 } else { /* the block is not there */
1037                         myseek(client->difffile,client->difffilelen*DIFFPAGESIZE) ;
1038                         client->difmap[mapcnt]=(client->server->flags&F_SPARSE)?mapcnt:client->difffilelen++;
1039                         DEBUG3("Page %Lu is not here, we put it at %lu\n",
1040                                (unsigned long long)mapcnt,
1041                                (unsigned long)(client->difmap[mapcnt]));
1042                         rdlen=DIFFPAGESIZE ;
1043                         if (rawexpread_fully(pagestart, pagebuf, rdlen, client))
1044                                 return -1;
1045                         memcpy(pagebuf+offset,buf,wrlen) ;
1046                         if (write(client->difffile, pagebuf, DIFFPAGESIZE) !=
1047                                         DIFFPAGESIZE)
1048                                 return -1;
1049                 }                                                   
1050                 len-=wrlen ; a+=wrlen ; buf+=wrlen ;
1051         }
1052         return 0;
1053 }
1054
1055 /**
1056  * Do the initial negotiation.
1057  *
1058  * @param client The client we're negotiating with.
1059  **/
1060 void negotiate(CLIENT *client) {
1061         char zeros[128];
1062         u64 size_host;
1063         u32 flags = NBD_FLAG_HAS_FLAGS;
1064
1065         memset(zeros, '\0', sizeof(zeros));
1066         if (write(client->net, INIT_PASSWD, 8) < 0)
1067                 err("Negotiation failed: %m");
1068         cliserv_magic = htonll(cliserv_magic);
1069         if (write(client->net, &cliserv_magic, sizeof(cliserv_magic)) < 0)
1070                 err("Negotiation failed: %m");
1071         size_host = htonll((u64)(client->exportsize));
1072         if (write(client->net, &size_host, 8) < 0)
1073                 err("Negotiation failed: %m");
1074         if (client->server->flags & F_READONLY)
1075                 flags |= NBD_FLAG_READ_ONLY;
1076         flags = htonl(flags);
1077         if (write(client->net, &flags, 4) < 0)
1078                 err("Negotiation failed: %m");
1079         if (write(client->net, zeros, 124) < 0)
1080                 err("Negotiation failed: %m");
1081 }
1082
1083 /** sending macro. */
1084 #define SEND(net,reply) writeit( net, &reply, sizeof( reply ));
1085 /** error macro. */
1086 #define ERROR(client,reply,errcode) { reply.error = htonl(errcode); SEND(client->net,reply); reply.error = 0; }
1087 /**
1088  * Serve a file to a single client.
1089  *
1090  * @todo This beast needs to be split up in many tiny little manageable
1091  * pieces. Preferably with a chainsaw.
1092  *
1093  * @param client The client we're going to serve to.
1094  * @return when the client disconnects
1095  **/
1096 int mainloop(CLIENT *client) {
1097         struct nbd_request request;
1098         struct nbd_reply reply;
1099         gboolean go_on=TRUE;
1100 #ifdef DODBG
1101         int i = 0;
1102 #endif
1103         negotiate(client);
1104         DEBUG("Entering request loop!\n");
1105         reply.magic = htonl(NBD_REPLY_MAGIC);
1106         reply.error = 0;
1107         while (go_on) {
1108                 char buf[BUFSIZE];
1109                 size_t len;
1110 #ifdef DODBG
1111                 i++;
1112                 printf("%d: ", i);
1113 #endif
1114                 if (client->server->timeout) 
1115                         alarm(client->server->timeout);
1116                 readit(client->net, &request, sizeof(request));
1117                 request.from = ntohll(request.from);
1118                 request.type = ntohl(request.type);
1119
1120                 if (request.type==NBD_CMD_DISC) {
1121                         msg2(LOG_INFO, "Disconnect request received.");
1122                         if (client->server->flags & F_COPYONWRITE) { 
1123                                 if (client->difmap) g_free(client->difmap) ;
1124                                 close(client->difffile);
1125                                 unlink(client->difffilename);
1126                                 free(client->difffilename);
1127                         }
1128                         go_on=FALSE;
1129                         continue;
1130                 }
1131
1132                 len = ntohl(request.len);
1133
1134                 if (request.magic != htonl(NBD_REQUEST_MAGIC))
1135                         err("Not enough magic.");
1136                 if (len > BUFSIZE + sizeof(struct nbd_reply))
1137                         err("Request too big!");
1138 #ifdef DODBG
1139                 printf("%s from %Lu (%Lu) len %d, ", request.type ? "WRITE" :
1140                                 "READ", (unsigned long long)request.from,
1141                                 (unsigned long long)request.from / 512, len);
1142 #endif
1143                 memcpy(reply.handle, request.handle, sizeof(reply.handle));
1144                 if ((request.from + len) > (OFFT_MAX)) {
1145                         DEBUG("[Number too large!]");
1146                         ERROR(client, reply, EINVAL);
1147                         continue;
1148                 }
1149
1150                 if (((ssize_t)((off_t)request.from + len) > client->exportsize)) {
1151                         DEBUG("[RANGE!]");
1152                         ERROR(client, reply, EINVAL);
1153                         continue;
1154                 }
1155
1156                 if (request.type==NBD_CMD_WRITE) {
1157                         DEBUG("wr: net->buf, ");
1158                         readit(client->net, buf, len);
1159                         DEBUG("buf->exp, ");
1160                         if ((client->server->flags & F_READONLY) ||
1161                             (client->server->flags & F_AUTOREADONLY)) {
1162                                 DEBUG("[WRITE to READONLY!]");
1163                                 ERROR(client, reply, EPERM);
1164                                 continue;
1165                         }
1166                         if (expwrite(request.from, buf, len, client)) {
1167                                 DEBUG("Write failed: %m" );
1168                                 ERROR(client, reply, errno);
1169                                 continue;
1170                         }
1171                         SEND(client->net, reply);
1172                         DEBUG("OK!\n");
1173                         continue;
1174                 }
1175                 /* READ */
1176
1177                 DEBUG("exp->buf, ");
1178                 if (expread(request.from, buf + sizeof(struct nbd_reply), len, client)) {
1179                         DEBUG("Read failed: %m");
1180                         ERROR(client, reply, errno);
1181                         continue;
1182                 }
1183
1184                 DEBUG("buf->net, ");
1185                 memcpy(buf, &reply, sizeof(struct nbd_reply));
1186                 writeit(client->net, buf, len + sizeof(struct nbd_reply));
1187                 DEBUG("OK!\n");
1188         }
1189         return 0;
1190 }
1191
1192 /**
1193  * Set up client export array, which is an array of FILE_INFO.
1194  * Also, split a single exportfile into multiple ones, if that was asked.
1195  * @param client information on the client which we want to setup export for
1196  **/
1197 void setupexport(CLIENT* client) {
1198         int i;
1199         off_t laststartoff = 0, lastsize = 0;
1200         int multifile = (client->server->flags & F_MULTIFILE);
1201
1202         client->export = g_array_new(TRUE, TRUE, sizeof(FILE_INFO));
1203
1204         /* If multi-file, open as many files as we can.
1205          * If not, open exactly one file.
1206          * Calculate file sizes as we go to get total size. */
1207         for(i=0; ; i++) {
1208                 FILE_INFO fi;
1209                 gchar *tmpname;
1210                 mode_t mode = (client->server->flags & F_READONLY) ? O_RDONLY : O_RDWR;
1211
1212                 if(multifile) {
1213                         tmpname=g_strdup_printf("%s.%d", client->exportname, i);
1214                 } else {
1215                         tmpname=g_strdup(client->exportname);
1216                 }
1217                 DEBUG2( "Opening %s\n", tmpname );
1218                 fi.fhandle = open(tmpname, mode);
1219                 if(fi.fhandle == -1 && mode == O_RDWR) {
1220                         /* Try again because maybe media was read-only */
1221                         fi.fhandle = open(tmpname, O_RDONLY);
1222                         if(fi.fhandle != -1) {
1223                                 client->server->flags |= F_AUTOREADONLY;
1224                                 client->server->flags |= F_READONLY;
1225                         }
1226                 }
1227                 if(fi.fhandle == -1) {
1228                         if(multifile && i>0)
1229                                 break;
1230                         err("Could not open exported file: %m");
1231                 }
1232                 fi.startoff = laststartoff + lastsize;
1233                 g_array_append_val(client->export, fi);
1234                 g_free(tmpname);
1235
1236                 /* Starting offset and size of this file will be used to
1237                  * calculate starting offset of next file */
1238                 laststartoff = fi.startoff;
1239                 lastsize = size_autodetect(fi.fhandle);
1240
1241                 if(!multifile)
1242                         break;
1243         }
1244
1245         /* Set export size to total calculated size */
1246         client->exportsize = laststartoff + lastsize;
1247
1248         /* Export size may be overridden */
1249         if(client->server->expected_size) {
1250                 /* desired size must be <= total calculated size */
1251                 if(client->server->expected_size > client->exportsize) {
1252                         err("Size of exported file is too big\n");
1253                 }
1254
1255                 client->exportsize = client->server->expected_size;
1256         }
1257
1258         msg3(LOG_INFO, "Size of exported file/device is %Lu", (unsigned long long)client->exportsize);
1259         if(multifile) {
1260                 msg3(LOG_INFO, "Total number of files: %d", i);
1261         }
1262 }
1263
1264 int copyonwrite_prepare(CLIENT* client) {
1265         off_t i;
1266         if ((client->difffilename = malloc(1024))==NULL)
1267                 err("Failed to allocate string for diff file name");
1268         snprintf(client->difffilename, 1024, "%s-%s-%d.diff",client->exportname,client->clientname,
1269                 (int)getpid()) ;
1270         client->difffilename[1023]='\0';
1271         msg3(LOG_INFO,"About to create map and diff file %s",client->difffilename) ;
1272         client->difffile=open(client->difffilename,O_RDWR | O_CREAT | O_TRUNC,0600) ;
1273         if (client->difffile<0) err("Could not create diff file (%m)") ;
1274         if ((client->difmap=calloc(client->exportsize/DIFFPAGESIZE,sizeof(u32)))==NULL)
1275                 err("Could not allocate memory") ;
1276         for (i=0;i<client->exportsize/DIFFPAGESIZE;i++) client->difmap[i]=(u32)-1 ;
1277
1278         return 0;
1279 }
1280
1281 /**
1282  * Run a command. This is used for the ``prerun'' and ``postrun'' config file
1283  * options
1284  *
1285  * @param command the command to be ran. Read from the config file
1286  * @param file the file name we're about to export
1287  **/
1288 int do_run(gchar* command, gchar* file) {
1289         gchar* cmd;
1290         int retval=0;
1291
1292         if(command && *command) {
1293                 cmd = g_strdup_printf(command, file);
1294                 retval=system(cmd);
1295                 g_free(cmd);
1296         }
1297         return retval;
1298 }
1299
1300 /**
1301  * Serve a connection. 
1302  *
1303  * @todo allow for multithreading, perhaps use libevent. Not just yet, though;
1304  * follow the road map.
1305  *
1306  * @param client a connected client
1307  **/
1308 void serveconnection(CLIENT *client) {
1309         if(do_run(client->server->prerun, client->exportname)) {
1310                 exit(EXIT_FAILURE);
1311         }
1312         setupexport(client);
1313
1314         if (client->server->flags & F_COPYONWRITE) {
1315                 copyonwrite_prepare(client);
1316         }
1317
1318         setmysockopt(client->net);
1319
1320         mainloop(client);
1321         do_run(client->server->postrun, client->exportname);
1322 }
1323
1324 /**
1325  * Find the name of the file we have to serve. This will use g_strdup_printf
1326  * to put the IP address of the client inside a filename containing
1327  * "%s" (in the form as specified by the "virtstyle" option). That name
1328  * is then written to client->exportname.
1329  *
1330  * @param net A socket connected to an nbd client
1331  * @param client information about the client. The IP address in human-readable
1332  * format will be written to a new char* buffer, the address of which will be
1333  * stored in client->clientname.
1334  **/
1335 void set_peername(int net, CLIENT *client) {
1336         struct sockaddr_in addrin;
1337         struct sockaddr_in netaddr;
1338         size_t addrinlen = sizeof( addrin );
1339         char *peername;
1340         char *netname;
1341         char *tmp;
1342         int i;
1343
1344         if (getpeername(net, (struct sockaddr *) &addrin, (socklen_t *)&addrinlen) < 0)
1345                 err("getsockname failed: %m");
1346         peername = g_strdup(inet_ntoa(addrin.sin_addr));
1347         switch(client->server->virtstyle) {
1348                 case VIRT_NONE:
1349                         client->exportname=g_strdup(client->server->exportname);
1350                         break;
1351                 case VIRT_IPHASH:
1352                         for(i=0;i<strlen(peername);i++) {
1353                                 if(peername[i]=='.') {
1354                                         peername[i]='/';
1355                                 }
1356                         }
1357                 case VIRT_IPLIT:
1358                         client->exportname=g_strdup_printf(client->server->exportname, peername);
1359                         break;
1360                 case VIRT_CIDR:
1361                         memcpy(&netaddr, &addrin, addrinlen);
1362                         netaddr.sin_addr.s_addr>>=32-(client->server->cidrlen);
1363                         netaddr.sin_addr.s_addr<<=32-(client->server->cidrlen);
1364                         netname = inet_ntoa(netaddr.sin_addr);
1365                         tmp=g_strdup_printf("%s/%s", netname, peername);
1366                         client->exportname=g_strdup_printf(client->server->exportname, tmp);
1367                         break;
1368         }
1369
1370         msg4(LOG_INFO, "connect from %s, assigned file is %s", 
1371              peername, client->exportname);
1372         client->clientname=g_strdup(peername);
1373         g_free(peername);
1374 }
1375
1376 /**
1377  * Destroy a pid_t*
1378  * @param data a pointer to pid_t which should be freed
1379  **/
1380 void destroy_pid_t(gpointer data) {
1381         g_free(data);
1382 }
1383
1384 /**
1385  * Loop through the available servers, and serve them. Never returns.
1386  **/
1387 int serveloop(GArray* servers) {
1388         struct sockaddr_in addrin;
1389         socklen_t addrinlen=sizeof(addrin);
1390         SERVER *serve;
1391         int i;
1392         int max;
1393         int sock;
1394         fd_set mset;
1395         fd_set rset;
1396         struct timeval tv;
1397
1398         /* 
1399          * Set up the master fd_set. The set of descriptors we need
1400          * to select() for never changes anyway and it buys us a *lot*
1401          * of time to only build this once. However, if we ever choose
1402          * to not fork() for clients anymore, we may have to revisit
1403          * this.
1404          */
1405         max=0;
1406         FD_ZERO(&mset);
1407         for(i=0;i<servers->len;i++) {
1408                 sock=(g_array_index(servers, SERVER, i)).socket;
1409                 FD_SET(sock, &mset);
1410                 max=sock>max?sock:max;
1411         }
1412         for(;;) {
1413                 CLIENT *client;
1414                 int net;
1415                 pid_t *pid;
1416
1417                 memcpy(&rset, &mset, sizeof(fd_set));
1418                 tv.tv_sec=0;
1419                 tv.tv_usec=500;
1420                 if(select(max+1, &rset, NULL, NULL, &tv)>0) {
1421                         DEBUG("accept, ");
1422                         for(i=0;i<servers->len;i++) {
1423                                 serve=&(g_array_index(servers, SERVER, i));
1424                                 if(FD_ISSET(serve->socket, &rset)) {
1425                                         if ((net=accept(serve->socket, (struct sockaddr *) &addrin, &addrinlen)) < 0)
1426                                                 err("accept: %m");
1427
1428                                         client = g_malloc(sizeof(CLIENT));
1429                                         client->server=serve;
1430                                         client->exportsize=OFFT_MAX;
1431                                         client->net=net;
1432                                         set_peername(net, client);
1433                                         if (!authorized_client(client)) {
1434                                                 msg2(LOG_INFO,"Unauthorized client") ;
1435                                                 close(net);
1436                                                 continue;
1437                                         }
1438                                         msg2(LOG_INFO,"Authorized client") ;
1439                                         pid=g_malloc(sizeof(pid_t));
1440 #ifndef NOFORK
1441                                         if ((*pid=fork())<0) {
1442                                                 msg3(LOG_INFO,"Could not fork (%s)",strerror(errno)) ;
1443                                                 close(net);
1444                                                 continue;
1445                                         }
1446                                         if (*pid>0) { /* parent */
1447                                                 close(net);
1448                                                 g_hash_table_insert(children, pid, pid);
1449                                                 continue;
1450                                         }
1451                                         /* child */
1452                                         g_hash_table_destroy(children);
1453                                         for(i=0;i<servers->len;i++) {
1454                                                 serve=g_array_index(servers, SERVER*, i);
1455                                                 close(serve->socket);
1456                                         }
1457                                         /* FALSE does not free the
1458                                         actual data. This is required,
1459                                         because the client has a
1460                                         direct reference into that
1461                                         data, and otherwise we get a
1462                                         segfault... */
1463                                         g_array_free(servers, FALSE);
1464 #endif // NOFORK
1465                                         msg2(LOG_INFO,"Starting to serve");
1466                                         serveconnection(client);
1467                                         exit(EXIT_SUCCESS);
1468                                 }
1469                         }
1470                 }
1471         }
1472 }
1473
1474 /**
1475  * Connect a server's socket.
1476  *
1477  * @param serve the server we want to connect.
1478  **/
1479 void setup_serve(SERVER *serve) {
1480         struct sockaddr_in addrin;
1481         struct sigaction sa;
1482         int addrinlen = sizeof(addrin);
1483         int sock_flags;
1484         int af;
1485 #ifndef sun
1486         int yes=1;
1487 #else
1488         char yes='1';
1489 #endif /* sun */
1490
1491         af = AF_INET;
1492 #ifdef WITH_SDP
1493         if ((serve->flags) && F_SDP) {
1494                 af = AF_INET_SDP;
1495         }
1496 #endif
1497         if ((serve->socket = socket(af, SOCK_STREAM, IPPROTO_TCP)) < 0)
1498                 err("socket: %m");
1499
1500         /* lose the pesky "Address already in use" error message */
1501         if (setsockopt(serve->socket,SOL_SOCKET,SO_REUSEADDR,&yes,sizeof(int)) == -1) {
1502                 err("setsockopt SO_REUSEADDR");
1503         }
1504         if (setsockopt(serve->socket,SOL_SOCKET,SO_KEEPALIVE,&yes,sizeof(int)) == -1) {
1505                 err("setsockopt SO_KEEPALIVE");
1506         }
1507
1508         /* make the listening socket non-blocking */
1509         if ((sock_flags = fcntl(serve->socket, F_GETFL, 0)) == -1) {
1510                 err("fcntl F_GETFL");
1511         }
1512         if (fcntl(serve->socket, F_SETFL, sock_flags | O_NONBLOCK) == -1) {
1513                 err("fcntl F_SETFL O_NONBLOCK");
1514         }
1515
1516         DEBUG("Waiting for connections... bind, ");
1517         addrin.sin_family = AF_INET;
1518 #ifdef WITH_SDP
1519         if(serve->flags & F_SDP) {
1520                 addrin.sin_family = AF_INET_SDP;
1521         }
1522 #endif
1523         addrin.sin_port = htons(serve->port);
1524         if(!inet_aton(serve->listenaddr, &(addrin.sin_addr)))
1525                 err("could not parse listen address");
1526         if (bind(serve->socket, (struct sockaddr *) &addrin, addrinlen) < 0)
1527                 err("bind: %m");
1528         DEBUG("listen, ");
1529         if (listen(serve->socket, 1) < 0)
1530                 err("listen: %m");
1531         sa.sa_handler = sigchld_handler;
1532         sigemptyset(&sa.sa_mask);
1533         sa.sa_flags = SA_RESTART;
1534         if(sigaction(SIGCHLD, &sa, NULL) == -1)
1535                 err("sigaction: %m");
1536         sa.sa_handler = sigterm_handler;
1537         sigemptyset(&sa.sa_mask);
1538         sa.sa_flags = SA_RESTART;
1539         if(sigaction(SIGTERM, &sa, NULL) == -1)
1540                 err("sigaction: %m");
1541 }
1542
1543 /**
1544  * Connect our servers.
1545  **/
1546 void setup_servers(GArray* servers) {
1547         int i;
1548
1549         for(i=0;i<servers->len;i++) {
1550                 setup_serve(&(g_array_index(servers, SERVER, i)));
1551         }
1552         children=g_hash_table_new_full(g_int_hash, g_int_equal, NULL, destroy_pid_t);
1553 }
1554
1555 /**
1556  * Go daemon (unless we specified at compile time that we didn't want this)
1557  * @param serve the first server of our configuration. If its port is zero,
1558  *      then do not daemonize, because we're doing inetd then. This parameter
1559  *      is only used to create a PID file of the form
1560  *      /var/run/nbd-server.&lt;port&gt;.pid; it's not modified in any way.
1561  **/
1562 #if !defined(NODAEMON) && !defined(NOFORK)
1563 void daemonize(SERVER* serve) {
1564         FILE*pidf;
1565
1566         if(serve && !(serve->port)) {
1567                 return;
1568         }
1569         if(daemon(0,0)<0) {
1570                 err("daemon");
1571         }
1572         if(!*pidftemplate) {
1573                 if(serve) {
1574                         strncpy(pidftemplate, "/var/run/server.%d.pid", 255);
1575                 } else {
1576                         strncpy(pidftemplate, "/var/run/server.pid", 255);
1577                 }
1578         }
1579         snprintf(pidfname, 255, pidftemplate, serve ? serve->port : 0);
1580         pidf=fopen(pidfname, "w");
1581         if(pidf) {
1582                 fprintf(pidf,"%d\n", (int)getpid());
1583                 fclose(pidf);
1584         } else {
1585                 perror("fopen");
1586                 fprintf(stderr, "Not fatal; continuing");
1587         }
1588 }
1589 #else
1590 #define daemonize(serve)
1591 #endif /* !defined(NODAEMON) && !defined(NOFORK) */
1592
1593 /*
1594  * Everything beyond this point (in the file) is run in non-daemon mode.
1595  * The stuff above daemonize() isn't.
1596  */
1597
1598 void serve_err(SERVER* serve, const char* msg) G_GNUC_NORETURN;
1599
1600 void serve_err(SERVER* serve, const char* msg) {
1601         g_message("Export of %s on port %d failed:", serve->exportname,
1602                         serve->port);
1603         err(msg);
1604 }
1605
1606 /**
1607  * Set up user-ID and/or group-ID
1608  **/
1609 void dousers(void) {
1610         struct passwd *pw;
1611         struct group *gr;
1612         if(rungroup) {
1613                 gr=getgrnam(rungroup);
1614                 if(!gr) {
1615                         g_message("Invalid group name: %s", rungroup);
1616                         exit(EXIT_FAILURE);
1617                 }
1618                 if(setgid(gr->gr_gid)<0) {
1619                         g_message("Could not set GID: %s", strerror(errno));
1620                         exit(EXIT_FAILURE);
1621                 }
1622         }
1623         if(runuser) {
1624                 pw=getpwnam(runuser);
1625                 if(!pw) {
1626                         g_message("Invalid user name: %s", runuser);
1627                         exit(EXIT_FAILURE);
1628                 }
1629                 if(setuid(pw->pw_uid)<0) {
1630                         g_message("Could not set UID: %s", strerror(errno));
1631                         exit(EXIT_FAILURE);
1632                 }
1633         }
1634 }
1635
1636 /**
1637  * Main entry point...
1638  **/
1639 int main(int argc, char *argv[]) {
1640         SERVER *serve;
1641         GArray *servers;
1642         GError *err=NULL;
1643
1644         if (sizeof( struct nbd_request )!=28) {
1645                 fprintf(stderr,"Bad size of structure. Alignment problems?\n");
1646                 exit(-1) ;
1647         }
1648
1649         memset(pidftemplate, '\0', 256);
1650
1651         logging();
1652         config_file_pos = g_strdup(CFILE);
1653         serve=cmdline(argc, argv);
1654         servers = parse_cfile(config_file_pos, &err);
1655         if(!servers || !servers->len) {
1656                 g_warning("Could not parse config file: %s", 
1657                                 err ? err->message : "Unknown error");
1658         }
1659         if(serve) {
1660                 g_array_append_val(servers, *serve);
1661      
1662                 if (!(serve->port)) {
1663                         CLIENT *client;
1664 #ifndef ISSERVER
1665                         /* You really should define ISSERVER if you're going to use
1666                          * inetd mode, but if you don't, closing stdout and stderr
1667                          * (which inetd had connected to the client socket) will let it
1668                          * work. */
1669                         close(1);
1670                         close(2);
1671                         open("/dev/null", O_WRONLY);
1672                         open("/dev/null", O_WRONLY);
1673 #endif
1674                         client=g_malloc(sizeof(CLIENT));
1675                         client->server=serve;
1676                         client->net=0;
1677                         client->exportsize=OFFT_MAX;
1678                         set_peername(0,client);
1679                         serveconnection(client);
1680                         return 0;
1681                 }
1682         }
1683         if((!serve) && (!servers||!servers->len)) {
1684                 g_message("Nothing to do! Bye!");
1685                 exit(EXIT_FAILURE);
1686         }
1687         daemonize(serve);
1688         setup_servers(servers);
1689         dousers();
1690         serveloop(servers);
1691         return 0 ;
1692 }