change time outs on selects
[spider.git] / perl / cluster.pl
index 4c65e86858acb7c7711152562579c06d0384276f..ceb099ca7eb4f6b64977447e6a800d7c5be0c1e6 100755 (executable)
@@ -1,4 +1,4 @@
-#!/usr/bin/perl
+#!/usr/bin/perl -w
 #
 # This is the DX cluster 'daemon'. It sits in the middle of its little
 # web of client routines sucking and blowing data where it may.
 # $Id$
 # 
 
+require 5.004;
+
 # make sure that modules are searched in the order local then perl
 BEGIN {
+       umask 002;
+       
        # root of directory tree for this system
        $root = "/spider"; 
        $root = $ENV{'DXSPIDER_ROOT'} if $ENV{'DXSPIDER_ROOT'};
@@ -19,14 +23,26 @@ BEGIN {
        unshift @INC, "$root/perl";     # this IS the right way round!
        unshift @INC, "$root/local";
 
-#      require Exporter;
-#      $Exporter::Verbose = 1;
+       # try to create and lock a lockfile (this isn't atomic but 
+       # should do for now
+       $lockfn = "$root/perl/cluster.lock";       # lock file name
+       if (-e $lockfn) {
+               open(CLLOCK, "$lockfn") or die "Can't open Lockfile ($lockfn) $!";
+               my $pid = <CLLOCK>;
+               chomp $pid;
+               die "Lockfile ($lockfn) and process $pid exist, another cluster running?" if kill 0, $pid;
+               close CLLOCK;
+       }
+       open(CLLOCK, ">$lockfn") or die "Can't open Lockfile ($lockfn) $!";
+       print CLLOCK "$$\n";
+       close CLLOCK;
 }
 
 use Msg;
 use DXVars;
 use DXDebug;
 use DXLog;
+use DXLogPrint;
 use DXUtil;
 use DXChannel;
 use DXUser;
@@ -41,14 +57,20 @@ use Prefix;
 use Bands;
 use Geomag;
 use CmdAlias;
-use Carp;
+use Filter;
+use Local;
+use Fcntl ':flock'; 
+
+use Carp qw(cluck);
 
 package main;
 
 @inqueue = ();                                 # the main input queue, an array of hashes
 $systime = 0;                                  # the time now (in seconds)
-$version = 1.3;                                        # the version no of the software
-
+$version = "1.33";                             # the version no of the software
+$starttime = 0;                 # the starting time of the cluster   
+$lockfn = "cluster.lock";       # lock file name
+      
 # handle disconnections
 sub disconnect
 {
@@ -57,6 +79,20 @@ sub disconnect
        $dxchan->disconnect();
 }
 
+# send a message to call on conn and disconnect
+sub already_conn
+{
+       my ($conn, $call, $mess) = @_;
+       
+       dbg('chan', "-> D $call $mess\n"); 
+       $conn->send_now("D$call|$mess");
+       sleep(1);
+       dbg('chan', "-> Z $call bye\n");
+       $conn->send_now("Z$call|bye"); # this will cause 'client' to disconnect
+       sleep(1);
+       $conn->disconnect;
+}
+
 # handle incoming messages
 sub rec
 {
@@ -71,37 +107,43 @@ sub rec
        # set up the basic channel info - this needs a bit more thought - there is duplication here
        if (!defined $dxchan) {
                my ($sort, $call, $line) = $msg =~ /^(\w)(\S+)\|(.*)$/;
-               
-               # is there one already connected?
+
+                # is there one already connected to me ? 
+               my $user = DXUser->get($call);
                if (DXChannel->get($call)) {
-                       my $mess = DXM::msg($lang, 'conother', $call);
-                       dbg('chan', "-> D $call $mess\n"); 
-                       $conn->send_now("D$call|$mess");
-                       sleep(1);
-                       dbg('chan', "-> Z $call bye\n");
-                       $conn->send_now("Z$call|bye"); # this will cause 'client' to disconnect
+                       my $mess = DXM::msg($lang, $user->sort eq 'A' ? 'concluster' : 'conother', $call);
+                       already_conn($conn, $call, $mess);
                        return;
                }
                
-               # is there one already connected elsewhere in the cluster?
-               if (DXCluster->get($call)) {
-                       my $mess = DXM::msg($lang, 'concluster', $call);
-                       dbg('chan', "-> D $call $mess\n"); 
-                       $conn->send_now("D$call|$mess");
-                       sleep(1);
-                       dbg('chan', "-> Z $call bye\n");
+               # is there one already connected elsewhere in the cluster (and not a cluster)
+               if ($user) {
+                       if (($user->sort eq 'A' || $call eq $myalias) && !DXCluster->get_exact($call)) {
+                               ;
+                       } else {
+                               if (DXCluster->get($call) || DXChannel->get($call)) {
+                                       my $mess = DXM::msg($lang, $user->sort eq 'A' ? 'concluster' : 'conother', $call);
+                                       already_conn($conn, $call, $mess);
+                                       return;
+                               }
+                       }
+                       $user->{lang} = $main::lang if !$user->{lang}; # to autoupdate old systems
+               } else {
+                       if (DXCluster->get($call)) {
+                               my $mess = DXM::msg($lang, 'conother', $call);
+                               already_conn($conn, $call, $mess);
+                               return;
+                       }
+                       $user = DXUser->new($call);
+               }
+
+               # is he locked out ?
+               if ($user->lockout) {
+                       Log('DXCommand', "$call is locked out, disconnected");
                        $conn->send_now("Z$call|bye"); # this will cause 'client' to disconnect
                        return;
                }
-               
-               my $user = DXUser->get($call);
-               if (!defined $user) {
-                       $user = DXUser->new($call);
-               } else {
-                       $user->{lang} = $main::lang if !$user->{lang}; # to autoupdate old systems
-               }
-               
-               
+
                # create the channel
                $dxchan = DXCommandmode->new($call, $conn, $user) if ($user->sort eq 'U');
                $dxchan = DXProt->new($call, $conn, $user) if ($user->sort eq 'A');
@@ -126,12 +168,61 @@ sub login
 sub cease
 {
        my $dxchan;
+
+       $SIG{'TERM'} = 'IGNORE';
+       $SIG{'INT'} = 'IGNORE';
+       
+       eval {
+               Local::finish();   # end local processing
+       };
+       dbg('local', "Local::finish error $@") if $@;
+
+       # disconnect users
        foreach $dxchan (DXChannel->get_all()) {
-               disconnect($dxchan);
+               next if $dxchan->is_ak1a;
+               disconnect($dxchan) unless $dxchan == $DXProt::me;
        }
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+
+       # disconnect nodes
+       foreach $dxchan (DXChannel->get_all()) {
+               next unless $dxchan->is_ak1a;
+               disconnect($dxchan) unless $dxchan == $DXProt::me;
+       }
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       DXUser::finish();
+       dbg('chan', "DXSpider version $version ended");
+       Log('cluster', "DXSpider V$version stopped");
+       dbgclose();
+       Logclose();
+       unlink $lockfn;
+#      $SIG{__WARN__} = $SIG{__DIE__} =  sub {my $a = shift; cluck($a); };
        exit(0);
 }
 
+# the reaper of children
+sub reap
+{
+       $SIG{'CHLD'} = \&reap;
+       my $cpid = wait;
+}
+
 # this is where the input queue is dealt with and things are dispatched off to other parts of
 # the cluster
 sub process_inqueue
@@ -141,41 +232,73 @@ sub process_inqueue
        
        my $data = $self->{data};
        my $dxchan = $self->{dxchan};
-       my ($sort, $call, $line) = $data =~ /^(\w)(\S+)\|(.*)$/;
+       my ($sort, $call, $line) = $data =~ /^(\w)([A-Z0-9\-]+)\|(.*)$/;
+       my $error;
        
-       # do the really sexy console interface bit! (Who is going to do the TK interface then?)
-       dbg('chan', "<- $sort $call $line\n");
+       # the above regexp must work
+       return unless ($sort && $call && $line);
+       
+       # translate any crappy characters into hex characters 
+       if ($line =~ /[\x00-\x06\x08\x0a-\x1f\x7f-\xff]/o) {
+               $line =~ s/([\x00-\x1f\x7f-\xff])/uc sprintf("%%%02x",ord($1))/eg;
+               ++$error;
+#              dbg('chan', "<- $sort $call **CRAP**: $line");
+#              return;
+       }
        
+       # do the really sexy console interface bit! (Who is going to do the TK interface then?)
+       dbg('chan', "<- $sort $call $line\n") unless $sort eq 'D';
+
        # handle A records
        my $user = $dxchan->user;
-       if ($sort eq 'A') {
-               $dxchan->start($line);  
-       } elsif ($sort eq 'D') {
+       if ($sort eq 'A' || $sort eq 'O') {
+               $dxchan->start($line, $sort);  
+       } elsif ($sort eq 'I') {
                die "\$user not defined for $call" if !defined $user;
-               
-               # normal input
-               $dxchan->normal($line);
-               
+
+               if ($error) {
+                       dbg('chan', "DROPPED with $error duff characters");
+               } else {
+                       # normal input
+                       $dxchan->normal($line);
+               }
                disconnect($dxchan) if ($dxchan->{state} eq 'bye');
        } elsif ($sort eq 'Z') {
                disconnect($dxchan);
+       } elsif ($sort eq 'D') {
+               ;                       # ignored (an echo)
        } else {
                print STDERR atime, " Unknown command letter ($sort) received from $call\n";
        }
 }
 
+sub uptime
+{
+       my $t = $systime - $starttime;
+       my $days = int $t / 86400;
+       $t -= $days * 86400;
+       my $hours = int $t / 3600;
+       $t -= $hours * 3600;
+       my $mins = int $t / 60;
+       return sprintf "%d %02d:%02d", $days, $hours, $mins;
+}
 #############################################################
 #
 # The start of the main line of code 
 #
 #############################################################
 
+$starttime = $systime = time;
+
 # open the debug file, set various FHs to be unbuffered
+dbginit();
 foreach (@debug) {
        dbgadd($_);
 }
 STDOUT->autoflush(1);
 
+Log('cluster', "DXSpider V$version started");
+
 # banner
 print "DXSpider DX Cluster Version $version\nCopyright (c) 1998 Dirk Koopman G1TLH\n";
 
@@ -189,7 +312,7 @@ Bands::load();
 
 # initialise User file system
 print "loading user file system ...\n"; 
-DXUser->init($userfn);
+DXUser->init($userfn, 1);
 
 # start listening for incoming messages/connects
 print "starting listener ...\n";
@@ -199,6 +322,7 @@ Msg->new_server("$clusteraddr", $clusterport, \&login);
 $SIG{'INT'} = \&cease;
 $SIG{'TERM'} = \&cease;
 $SIG{'HUP'} = 'IGNORE';
+$SIG{'CHLD'} = \&reap;
 
 # read in system messages
 DXM->init();
@@ -206,31 +330,45 @@ DXM->init();
 # read in command aliases
 CmdAlias->init();
 
-# initialise the protocol engine
-DXProt->init();
-
 # initialise the Geomagnetic data engine
 Geomag->init();
 
 # initial the Spot stuff
 Spot->init();
 
+# initialise the protocol engine
+print "reading in duplicate spot and WWV info ...\n";
+DXProt->init();
+
+
 # put in a DXCluster node for us here so we can add users and take them away
 DXNode->new(0, $mycall, 0, 1, $DXProt::myprot_version); 
 
-# read in any existing message headers
-print "reading existing message headers\n";
+# read in any existing message headers and clean out old crap
+print "reading existing message headers ...\n";
 DXMsg->init();
+DXMsg::clean_old();
 
 # read in any cron jobs
-print "reading cron jobs\n";
+print "reading cron jobs ...\n";
 DXCron->init();
 
+# starting local stuff
+print "doing local initialisation ...\n";
+eval {
+       Local::init();
+};
+dbg('local', "Local::init error $@") if $@;
+
+# print various flags
+#print "useful info - \$^D: $^D \$^W: $^W \$^S: $^S \$^P: $^P\n";
+
 # this, such as it is, is the main loop!
 print "orft we jolly well go ...\n";
+dbg('chan', "DXSpider version $version started...");
 for (;;) {
        my $timenow;
-       Msg->event_loop(1, 0.001);
+       Msg->event_loop(1, 0.1);
        $timenow = time;
        process_inqueue();                      # read in lines from the input queue and despatch them
        
@@ -243,7 +381,17 @@ for (;;) {
                DXCommandmode::process(); # process ongoing command mode stuff
                DXProt::process();              # process ongoing ak1a pcxx stuff
                DXConnect::process();
+               DXMsg::process();
+               eval { 
+                       Local::process();       # do any localised processing
+               };
+               dbg('local', "Local::process error $@") if $@;
+       }
+       if ($decease) {
+               last if --$decease <= 0;
        }
 }
+cease(0);
+exit(0);