Vi serve avere degli archivi dello spam per poter istruire Spamassasin al riconoscimento dello Spam? Allora potete reperire a questo link degli ottimi file compressi che contengono dello spam. Il vecchio sito di Spamarchive.org è out per il momento (ottimo sito famosissimo in cui ogni mese si poteva prelevare il file dello spam, ma ormai il sito non è disponibile da luglio).
Per istruire Spamassassin basta mettere l’archivio decompresso in una cartella temporanea e lanciare il comando seguendo queste istruzioni:
Bisogna salvare la mail in un file {nomefile} che una volta fatto si puo’ anche cancellare.
Il comando e’ “sa-learn –{opzione} {nomefile}”. L’opzione e’ “ham” , “spam” o “forget” a seconda dei casi.
In caso di falso positivo (messaggio buono (detto in gergo “ham”) classificato erroneamente come SPAM) bisogna dare da elios il seguente comando:
- sa-learn –ham {file_con_messaggio_buono}
In caso di falso negativo (messaggio di SPAM non riconosciuto e arrivato quindi come posta normale) bisogna dare da elios il seguente comando:
- sa-learn –spam {file_con_messaggio_di_spam}
Se ci si e’ accorti di aver commesso un errore, esiste la possibilita’ di cancellare le informazioni immesse, tramite il comando:
- sa-learn –forget {stesso_file_usato_nel_sbagliarsi}
Un’ottima guida al settaggio veramente perfetto di spamassassin la potete trovare al seguente link.
*********** Ulteriore guida e consigli ***********
Il file di configurazione è /etc/mail/spamassassin/local.cf in questo file possiamo mettere tutte le regole che vogliamo e non verrà sovrascritto negli aggiornamenti succesivi del software (i file di configurazione presenti nella directory /usr/share/spamassassin invece lo saranno…). La configurazione di spamassasin si presta a molte “manovre” per diminuire lo spam. Bisogna provarle “on the road”. Ma una cosa è veramente importante sapere: per riconoscere lo spam, spamassassin deve essere addestrato.
Siccome si basa su un filtro bayesiano, deve apprendere cosa è spam e cosa non lo è. L’unico modo è quello di dargli in pasto le mail che sfuggono al suo controllo e fargliele segnare come spam. A tal fine entra in gioco il programma sa-learn (man sa-learn per dettagli). Questo vuol dire che all’inizio passeranno tutte le email? No. In rete esistono raccolte di mail spam. Consigliamo il link http://spamlinks.net/filter-archives.htm
Vediamo brevemente come usare sa-learn. Come detto abbiamo due possibilità:
- a. passargli le nostre mail di spam personali;
- b. dargli quelle degli archivi online.
Nel primo caso possiamo usare sa-learn nel seguente modo:
# sa-learn –spam –showdots –file email.eml dove, il messaggio di spam l’abbiamo salvato con il nome di “email.eml” (file salva con nome) e l’opzione showdots semplicemente mostra lo stato di avanzamento dell’operazione con dei puntini.
Nel secondo caso dobbiamo scaricare massivamente gli archivi (per esempio con il comando wget -nc url_archivio_online/*) in una directory appositamente creata. Supponendo che gli archivi siano tutti di tipo .gz, ecco uno script (di shell) che può tornare utile:
# for i in *.gz ; do gunzip -c $i > /tmp/spam.file | sa-learn –spam –mbox –showdots /tmp/spam.file ; dove in definitiva abbiamo creato un ciclo che apre tutti i file della directory (che sono in formato mbox) e li fa leggere a sa-learn.