changed help for filters freq->on
[spider.git] / html / adminmanual-7.html
1 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
2 <HTML>
3 <HEAD>
4  <META NAME="GENERATOR" CONTENT="SGML-Tools 1.0.9">
5  <TITLE>The DXSpider Installation and Administration Manual : Other filters</TITLE>
6  <LINK HREF="adminmanual-8.html" REL=next>
7  <LINK HREF="adminmanual-6.html" REL=previous>
8  <LINK HREF="adminmanual.html#toc7" REL=contents>
9 </HEAD>
10 <BODY>
11 <A HREF="adminmanual-8.html">Next</A>
12 <A HREF="adminmanual-6.html">Previous</A>
13 <A HREF="adminmanual.html#toc7">Contents</A>
14 <HR>
15 <H2><A NAME="s7">7. Other filters</A></H2>
16
17 <H2><A NAME="ss7.1">7.1 Filtering Mail</A>
18 </H2>
19
20 <P>In the /spider/msg directory you will find a file called badmsg.pl.issue.  Rename this to badmsg.pl and edit the file.  
21 The original looks something like this ....
22 <P>
23 <BLOCKQUOTE><CODE>
24 <PRE>
25
26 # the list of regexes for messages that we won't store having
27 # received them (bear in mind that we must receive them fully before
28 # we can bin them)
29
30
31 # The format of each line is as follows
32
33 #     type      source             pattern 
34 #     P/B/F     T/F/O/S            regex  
35
36 # type: P - private, B - bulletin (msg), F - file (ak1a bull)
37 # source: T - to field, F - from field,  O - origin, S - subject 
38 # pattern: a perl regex on the field requested
39
40 # Currently only type B and P msgs are affected by this code.
41
42 # The list is read from the top down, the first pattern that matches
43 # causes the action to be taken.
44
45 # The pattern can be undef or 0 in which case it will always be selected
46 # for the action specified
47
48
49
50 package DXMsg;
51
52 @badmsg = (
53 'B',    'T',    'SALE', 
54 'B',    'T',    'WANTED',
55 'B',    'S',    'WANTED',
56 'B',    'S',    'SALE', 
57 'B',    'S',    'WTB',
58 'B',    'S',    'WTS',
59 'B',    'T',    'FS',
60 );
61 </PRE>
62 </CODE></BLOCKQUOTE>
63 <P>
64 <P>I think this is fairly self explanatory.  It is simply a list of subject headers that we do not want to pass on to either 
65 the users of the cluster or the other cluster nodes that we are linked to.  This is usually because of rules and regulations 
66 pertaining to items for sale etc in a particular country.
67 <P>
68 <H2><A NAME="ss7.2">7.2 Filtering DX callouts</A>
69 </H2>
70
71 <P>In the same way as mail, there are some types of spot we do not wish to pass on to users or linked cluster nodes.  In the 
72 /spider/data directory you will find a file called baddx.pl.issue.  Rename this to baddx.pl and edit the file.  The original 
73 looks like this ....
74 <P>
75 <BLOCKQUOTE><CODE>
76 <PRE>
77
78 # the list of dx spot addresses that we don't store and don't pass on
79
80
81 package DXProt;
82
83 @baddx = qw 
84
85  FROG 
86  SALE
87  FORSALE
88  WANTED
89  P1RATE
90  PIRATE
91  TEST
92  DXTEST
93  NIL
94  NOCALL 
95 );
96 </PRE>
97 </CODE></BLOCKQUOTE>
98 <P>
99 <P>Again, this is simply a list of names we do not want to see in the spotted field of a DX callout.
100 <P>
101 <P>
102 <H2><A NAME="ss7.3">7.3 Filtering words from text fields in Announce, Talk and DX spots</A>
103 </H2>
104
105 <P>Create a file in /spider/data called <EM>badwords</EM>.  The format is quite
106 simple.  Lines beginning with # are ignored so comments can be added.  An
107 example file is below ...
108 <P>
109 <BLOCKQUOTE><CODE>
110 <PRE>
111 # Below is a list of words we do not wish to see on the cluster
112 grunge grunged grunging
113 splodge splodger splodging
114 grince
115 fluffle
116 </PRE>
117 </CODE></BLOCKQUOTE>
118 <P>Multiple words can be used on the same line as shown.  Obviously these
119 are just examples :-)
120 <P>
121 <P>You can reload the file from the cluster prompt as sysop with load/badwords.
122 <P>
123 <HR>
124 <A HREF="adminmanual-8.html">Next</A>
125 <A HREF="adminmanual-6.html">Previous</A>
126 <A HREF="adminmanual.html#toc7">Contents</A>
127 </BODY>
128 </HTML>