Home > Guide, Open Source > Archivi dello Spam

Archivi dello Spam

30 dicembre 2006 - 1.163 Volte visto Lascia un commento Vai ai commenti
1 Star2 Stars3 Stars4 Stars5 Stars (1 voti, media: 5,00 di 5)
Loading...

ATTENZIONE:
AVVISO! Le informazioni di questo post potrebbero non essere più valide in quanto non aggiornate. Usa i commenti per contribuire a tenere il post aggiornato.

ULTIMA REVISIONE DEL POST: 17/07/2010


logo
Vi serve avere degli archivi dello spam per poter istruire Spamassasin al riconoscimento dello Spam? Allora potete reperire a questo link degli ottimi file compressi che contengono dello spam. Il vecchio sito di Spamarchive.org è out per il momento (ottimo sito famosissimo in cui ogni mese si poteva prelevare il file dello spam, ma ormai il sito non è disponibile da luglio).
Per istruire Spamassassin basta mettere l’archivio decompresso in una cartella temporanea e lanciare il comando seguendo queste istruzioni:

Bisogna salvare la mail in un file {nomefile} che una volta fatto si puo’ anche cancellare.
Il comando e’ “sa-learn –{opzione} {nomefile}”. L’opzione e’ “ham” , “spam” o “forget” a seconda dei casi.

In caso di falso positivo (messaggio buono (detto in gergo “ham”) classificato erroneamente come SPAM) bisogna dare da elios il seguente comando:

  • sa-learn –ham {file_con_messaggio_buono}

In caso di falso negativo (messaggio di SPAM non riconosciuto e arrivato quindi come posta normale) bisogna dare da elios il seguente comando:

  • sa-learn –spam {file_con_messaggio_di_spam}

Se ci si e’ accorti di aver commesso un errore, esiste la possibilita’ di cancellare le informazioni immesse, tramite il comando:

  • sa-learn –forget {stesso_file_usato_nel_sbagliarsi}

Un’ottima guida al settaggio veramente perfetto di spamassassin la potete trovare al seguente link.

*********** Ulteriore guida e consigli ***********

Il file di configurazione è /etc/mail/spamassassin/local.cf in questo file possiamo mettere tutte le regole che vogliamo e non verrà sovrascritto negli aggiornamenti succesivi del software (i file di configurazione presenti nella directory /usr/share/spamassassin invece lo saranno…). La configurazione di spamassasin si presta a molte “manovre” per diminuire lo spam. Bisogna provarle “on the road”. Ma una cosa è veramente importante sapere: per riconoscere lo spam, spamassassin deve essere addestrato.
Siccome si basa su un filtro bayesiano, deve apprendere cosa è spam e cosa non lo è. L’unico modo è quello di dargli in pasto le mail che sfuggono al suo controllo e fargliele segnare come spam. A tal fine entra in gioco il programma sa-learn (man sa-learn per dettagli). Questo vuol dire che all’inizio passeranno tutte le email? No. In rete esistono raccolte di mail spam. Consigliamo il link http://spamlinks.net/filter-archives.htm

Vediamo brevemente come usare sa-learn. Come detto abbiamo due possibilità:

  • a. passargli le nostre mail di spam personali;
  • b. dargli quelle degli archivi online.

Nel primo caso possiamo usare sa-learn nel seguente modo:

# sa-learn –spam –showdots –file email.eml dove, il messaggio di spam l’abbiamo salvato con il nome di “email.eml” (file salva con nome) e l’opzione showdots semplicemente mostra lo stato di avanzamento dell’operazione con dei puntini.
Nel secondo caso dobbiamo scaricare massivamente gli archivi (per esempio con il comando wget -nc url_archivio_online/*) in una directory appositamente creata. Supponendo che gli archivi siano tutti di tipo .gz, ecco uno script (di shell) che può tornare utile:

# for i in *.gz ; do gunzip -c $i > /tmp/spam.file | sa-learn –spam –mbox –showdots /tmp/spam.file ; dove in definitiva abbiamo creato un ciclo che apre tutti i file della directory (che sono in formato mbox) e li fa leggere a sa-learn.

  1. Nessun commento ancora...


NOTE SUI COMMENTI:

Se non avete mai scritto nulla su questo blog, sappiate che il vostro primo commento dovrà essere approvato manualmente dall'amministratore e quindi non comparirà subito sul sito.
Questo sito usa gli Avatar.
E' possibile usare dei tag HTML nel testo del commento, ma solamente quelli validi come XHTML "Strict" verranno accettati, quindi il risultato potrebbe anche essere un po' diverso dal previsto... nel dubbio, usate il testo semplice!
L'avviso di nuovi commenti è completamente automatizzato e nessuno degli indirizzi e-mail verrà fornito a terzi.
La vostra e-mail, che comunque resterà sempre riservata, serve anche per il conteggio del totale dei vostri commenti e per inviarvi, se ne fate richiesta soluzioni ai problemi o ulteriori informazioni nel totale rispetto del D.Lgs 196/2003.