add some FAQs
[spider.git] / sgml / spiderFAQ_en.sgml
1 <!doctype linuxdoc system>
2
3 <article>
4
5 <!-- Title information -->
6
7 <title>The DXSpider FAQ</title>
8 <author>Ian Maude, G0VGS, (g0vgs@gb7mbc.net)</author>
9 <date>February 2005 Revision: 1.8</date>
10 <abstract>
11 A reference for SysOps of the DXSpider DXCluster program.
12 </abstract>
13
14 <!-- Table of contents -->
15 <toc>
16
17 <!-- Begin the document -->
18
19 <P>Please mail any FAQs to the maintainer at the address above.
20
21 <P>
22 <sect>Installation 
23
24 <sect1>Where do I get DXSpider?
25
26 <P>
27 All things Spider can be found at <htmlurl url="http://www.dxcluster.org" name="www.dxcluster.org"> and the actual program and patches can be found in the <htmlurl url="http://www.dxcluster.org/download/index.html" name="download"> area.
28
29 <sect1>How do I use the patches?
30
31 <P>
32 Patching is done in the standard linux way ...
33
34 <tscreen><verb>
35 zcat /tmp/patch-1.40 | patch -p0
36 </verb></tscreen>
37
38 <P>
39 assuming the patch version you are using is 1.40 and resides in /tmp!
40
41 <P>
42 Be aware that each patch assumes the previous patch has been applied.  That
43 is to say if you are patching from version 1.38 to 1.40 you would first need
44 to apply patch-1.39 and then patch-1.40.
45
46 <sect1>If I use a tarball to overwrite my installation, what happens to my configuration?
47
48 <P>
49 The tarballs are designed to not overwrite your existing configuration
50 and can be used at any time to update your Spider software.  All the key
51 files have the suffix .issue (eg. DXVars.pm.issue) at default.
52
53 <sect1>I am running RedHat 5.2 and I am getting strange errors, what is wrong?
54
55 <P>
56 The version of Perl that comes with 5.2 seems to be some kind of pre-release
57 and is broken.  You can get a new version of perl from 
58 <htmlurl url="http://www.dxcluster.org/download/index.html" name="www.dxcluster.org"> 
59 or <htmlurl url="ftp://updates.redhat.com" name="ftp://updates.redhat.com">.  
60 Don't forget to patch it with the CPAN modules.
61
62 <sect>Administration
63
64 <sect1>How can I get Spider to restart automatically if it crashes?
65
66 <P>
67 Put this line into /etc/inittab ..
68
69 <tscreen><verb>
70 DX:3:respawn:/bin/su -c "/usr/bin/perl -w /spider/perl/cluster.pl" sysop > /dev/tty7
71 </verb></tscreen>
72
73 Run <em>telinit q</em> as root.  Spider will restart so be aware.  However, any
74 time you reboot, cluster.pl will start in tty7 and if it crashes, it should restart ok.
75
76 <sect1>How can I monitor traffic to and from a node or user?
77
78 <P>
79 There are 2 ways to achieve this.  You can use the <em>tail</em> command like this ..
80
81 <tscreen><verb>
82 tail -f /spider/data/debug/167.dat |grep G0VGS
83 </verb></tscreen>
84
85 or in later versions of Spider, there is a command called <em>watchdbg</em> in which
86 case you simply type ..
87
88 <tscreen><verb>
89 watchdbg G0VGS
90 </verb></tscreen>
91
92 <sect1>I see spots coming in my debug log, but none go out to the users
93
94 <P>
95 Please check the time on your PC. 
96
97 <P>
98 All spots are checked that they are no more
99 than 15 minutes in the future and 60 minutes in the past. If your clock is not set
100 to GMT (UTC) and is more than one hour out (say on your local (summer) time) then
101 the test will fail and no spots will come out. Neither will they be stored.
102
103 <P>
104 If you are connected to the internet, most linux distributions have an implementation of
105 <htmlurl url="http://www.ntp.org" name="ntpd">. The Microsoft Windows 2003, XP, 
106 2000 and NT machine clock can also be set to be syncronised
107 to an NTP source.  This can be done in the standard time configuration screen. There is also
108 the simple <htmlurl url="http://nettime.sourceforge.net" name="nettime"> program for Windows 95/98/ME.
109
110
111 <sect1>My neighbouring node cannot use the RCMD command to me, he just keeps 
112 getting the "tut tut" message.
113
114 <P>
115 Assuming that the permissions are set correctly (perm level 5 required), it could be
116 that the home_node is set incorrectly.  You can reset the home_node using the <em>spoof</em>
117 command like this ..
118
119 <tscreen><verb>
120 spoof gb7adx set/home gb7adx
121 </verb></tscreen>
122
123 Assuming that the node_call you are changing is gb7adx.
124
125 <sect1>I do not seem to be sending any bulletin mail to my link partners, what is wrong?
126
127 <P>
128 There is a file in /spider/msg called forward.pl.issue.  Rename this to
129 forward.pl and edit it to meet your requirements.  You will need to issue
130 the command <em>load/forward</em> or restart Spider for the changes to 
131 take effect.
132
133 <sect1>How can I automatically limit the amount of debug logfiles that are stored?
134
135 <P>
136 Use the tmpwatch command.  Create a file in /etc/cron.daily/ containing the line ...
137
138 <tscreen><verb>
139 /usr/sbin/tmpwatch -f 240 /spider/data/debug
140 </verb></tscreen>
141
142 Remember to make it executable!
143
144 This will limit your debug data down to the last 10 days
145
146 <sect1>I updated my Linux distribution and now Spider cannot read the users file or the dupefile, what is the problem?
147
148 <P>
149 Almost certainly this is a change in the db format of perl.  Follow these
150 few steps to correct the problem.
151
152 <itemize>
153 <item>stop the cluster (disable any autostart in inittab)
154 <item>cd /spider/data
155 <item>issue the command perl user_asc
156 <item>restart the cluster
157 </itemize>
158
159 That should solve the problem.
160
161 <sect1>Since I last updated I seem to be getting duplicate spots appearing.
162
163 <P>
164 What has probably happened is that the dupefile has got corrupted in
165 some way.  Simply delete the /spider/data/dupefile and restart the
166 cluster.  It may take a little time to become fully functional but
167 should solve your problem.
168
169 <sect1>I have deleted a message but it is still there, why?
170
171 <P>
172 This is now the way messages are handled for deletion in Spider.  If you
173 look closely you will see a 'D' following the message number.  This 
174 message is marked for deletion and will be deleted in 2 days if nothing
175 further is done.  Optionally you can use the command <em>delete/expunge</em>
176 to delete it immediately.
177
178 <sect1>I am updating from CVS and I get all sorts of errors when I restart
179
180 <P>
181 Firstly, whenever you update from CVS, a log is displayed. Next to each
182 file that is downloaded there is a letter, e.g.:
183
184 <tscreen><verb>
185 ? fred.pl
186 ? jim
187 ..
188 .
189 ..
190 cvs server: Updating perl
191 P cluster.pl
192 C Messages
193 M Internet.pm
194 U DXProt.pm
195 ..
196 .
197 ..
198 </verb></tscreen>
199
200 <P>
201 For normal CVS use you should only ever see the letter 'P'. This means that the file has
202 changed in CVS and is more recent than the one that is currenly on your system. You may also
203 possibly see the letter '?', which means that
204 there is a file that you (or the system) has created that CVS doesn't know about and isn't 
205 under its control. These are all normal and good.
206
207 <P>
208 Sometimes you will see the letter 'U' next to a file. This means that it is a new file that you don't currently
209 have. This is also OK.
210
211 <P>
212 However, if you see the letter 'C' or 'M', that means that CVS thinks that the file has 
213 changed locally. For the letter 'C', it has changed sufficiently near to one or more
214 modifications which CVS wants to download to your system. For the 'M', CVS thinks that it
215 is OK to make the change (you may also see some messages about "merging revision 1.xx with 1.yy").
216 Neither of these things are good. Files that are under the control of CVS
217 must not be changed by sysops. It is the files that have the 'C' next to them that will show
218 the errors and they will be things like:-
219
220 <tscreen><verb>
221 Syntax error near '<<<<' at line 23
222 Syntax error near '===' at line 40
223 Syntax error near '>>>' at line 51
224 </verb></tscreen>
225
226 <P>
227 You will now necessarily see all of the errors shown but you will get one or more sets of some
228 of them. The cure is simple: 
229
230 <itemize>
231 <item> identify the file that is causing the problem.  
232 <item> remove the file.
233 <item> run the cvs update again.
234 </itemize>
235
236 <P>
237 You will see that file come back (with a letter 'U' next to it). That will be the correct 
238 file as CVS thinks it should be. If you <em>still</em> have a problem, then get onto the
239 dxspider-support mailing list.
240
241 <P>
242 If all else fails (or you have several conflicts) you can safely remove the entire <tt>/spider/perl</tt> and 
243 <tt>/spider/cmd</tt> directories and then run the cvs update. They will all be recreated in their pristine
244 condition.
245
246 <sect1>I have done a CVS update, restarted and it says that "fileX" is missing
247
248 <P>
249 The correct way to run cvs is:-
250
251 <tscreen><verb>
252 cd /spider
253 cvs -z3 update -d
254 </verb></tscreen>
255
256 <P>
257 The '-d' is crucial. It makes sure that any new directories that may contain new code
258 are created and that new code downloaded. I have absolutely no idea why this is not the
259 default, seeing as CVS (in other circumstances) happily recurses its merry way down a 
260 directory tree, but there you are.
261
262 <P>
263 WinCVS and other graphical CVS frontends have a checkbox for the update screen called something
264 like "create sub-directories" (it may be hidden in some sub-screen - go look for it if it isn't
265 obvious). Make sure that this box is checked. If you can make this the
266 default setting in the program's setup screen then please do that. It will save you a lot
267 of pulled hair. 
268
269 </article>