1 Panoramica
La posta elettronica è una delle applicazioni di rete più comunemente usati, la comunicazione in rete è diventato un modo importante. Tuttavia, lo spam (spam) preoccupare il più recente sondaggio, il 93% degli intervistati ha ricevuto un gran numero di essi sono molto insoddisfatti spam. Qualche incidente spam semplice anche causato problemi di sicurezza molto influente. Aumentare lo spam ora comporta una perdita di 9,4 miliardi di anni (da chinabyte dati news precedenti), in alcuni articoli che, lo spam può prendere una società di 600-1.000 dollari per utente.
Spam Con il costante sviluppo di Internet, un sacco di crescita, non come prima, solo un po 'le molestie, lo spam si può dire ora è schiacciante il. Inizialmente, la maggior parte dello spam è la pubblicità commerciale non richiesta e-mail, ed ora più sul sesso, la politica, lo spam in crescita, anche per la quantità totale di spam del 40% circa, ed è tuttora una crescita sostenuta tendenza. D'altra parte, lo spam è diventato un virus nuovo, la trasmissione rapida.
E il 50% del mondo il messaggio è spam, solo una responsabilità di pochi. Molte le misure anti-spam sono stati fatti, ma solo pochissimi sono stati attuati. Purtroppo, anche queste soluzioni non possono fermare del tutto lo spam, ma anche una normale e-mail da un impatto.
1.1 Cos'è lo spam?
In una certa misura, sulla definizione di spam può essere: quelle persone non vogliono raccogliere e-mail ricevute è spam. Per esempio:
* La pubblicità commerciale. Molte aziende per promuovere nuovi prodotti, nuove attività, quali la pubblicità via e-mail.
* Discorso politico. Attualmente riceve un sacco di reazione di altri paesi o organizzazioni ad inviare tale e-mail, che, come spazzatura e pubblicità commerciale, il marketing e la vendita delle loro accuse.
* E-mail worm. Sempre più al virus di diffondersi rapidamente via e-mail, che è davvero una veloce ed efficace percorso di trasmissione.
* Dannoso e-mail. Intimidazioni, ingannevole e-mail. Come il phishing, che è una pagina web falsa e-mail, è del tutto uno stratagemma per ingannare le informazioni personali dell'utente, numero di conto corrente o carta di credito.
Come ordinario spam e-mail personale è diventato un obiettivo che, per avere questo risultato per molti motivi, come i siti web, forum e in altri luoghi registrato indirizzo e-mail, virus trovato nella cassetta delle lettere di un amico la tua e-mail, l'e-mail i fornitori di enumerazione degli utenti, e così via. In genere, il meno esposto meno a ricevere e-mail di spam, usa il più breve è il tempo di ricevere meno spam. Alcuni frustrazione degli utenti ha scelto di rinunciare alla loro casella di posta e sostituiti con nuove e-mail.
1.2, sicurezza
posta indesiderata per gli utenti di Internet e il generale è una grande influenza, questa influenza non è solo che le persone prendano il tempo di affrontare con lo spam, prendendo le risorse di sistema, porta anche un sacco di problemi di sicurezza.
Spam prende un sacco di risorse di rete, è ovvio. Alcuni server di posta a causa della scarsa sicurezza, sono come spam stazioni di trasmissione sono state le lettere di avvertimento IP e di altri incidenti si sono verificati un gran numero di risorse di rete consumato in normali operazioni così lento. Con lo sviluppo internazionale di anti-spam, la condivisione di "lista nera" tra le organizzazioni, server così innocente è più grande scudo, che senza dubbio darà all'utente la normale causa gravi problemi.
Spam e attacchi di hacker, virus combinato con sempre più da vicino, per esempio, worm SoBig relativa all'installazione aperto, può essere usato per sostenere il spedizioniere e-mail. Con l'evoluzione dello spam con codice maligno, o software di monitoraggio per supportare lo spam è stato notevolmente aumentato. Dicembre 2003 31, una organizzazione brasiliana inviare un hacker malintenzionati avascript spam script a milioni di utenti che navigano attraverso la posta indesiderata di Hotmail queste persone hanno inconsapevolmente trapelare il proprio account. Un altro esempio è il recente numero di URL che viene visualizzato in IE il nome host, aggiungere "% 01" si può nascondere il vero indirizzo host, in poche settimane dopo il rilascio apparso in spam in.
Sempre più ingannevoli e-mail virus, tante aziende soffrono, anche per adottare una buona strategia di protezione della rete, è ancora difficile da evitare, un numero crescente di incidenti di sicurezza dovuti al fatto che il messaggio può essere virus , cavalli di Troia o altri programmi dannosi. truffa Phishing per gli utenti di falso e ordinaria, è davvero difficile fare delle sentenze a destra, ma il danno è molto semplice.
2, anti-spam tecnologia
Esistono già e sono menzionati nella anti-spam per cercare di ridurre il problema dello spam e di rispondere alle esigenze di sicurezza. attacco di virus attraverso la corretta identificazione di spam, e-mail o e-mail le procedure saranno ridotti. Essi assumono una varietà di soluzioni di sicurezza per fermare modi spam.
Il dottor Neal Krawetz in Soluzioni Anti-Spam e di sicurezza, ref [1 carta], le tecniche anti-spam sono stati categoria molto buona. La tecnologia attuale anti-spam possono essere suddivisi in quattro grandi categorie: filtro (Filtro), il reverse query (ricerca inversa), sfide (sfide) e la crittografia (crittografia), queste soluzioni può ridurre il problema dello spam, ma tutti hanno i loro limiti. In questo articolo si discuterà di questi elementi nelle seguenti tecnologie e la realizzazione di alcune delle tecnologie chiave.
2.1, filtro
Filter (Filtro) è un trattamento relativamente semplice, è una tecnologia molto semplice spam. Questa tecnica è utilizzata principalmente per sistema di ricezione (MUA, come ad esempio Outlook Express o MTA, come sendmail) per identificare e trattare con lo spam. Dal punto di vista applicativo, questa tecnica è la più utilizzata, per esempio, molti server di posta anti-spam plug-in, gateway anti-spam, client funzionalità anti-spam, sono utilizzati nella tecnologia di filtraggio.
2.1.1, il filtraggio parola chiave
Le parole chiave della tecnologia di filtraggio spesso creare qualche semplice o complesso associato con la lista spam parola per identificare e trattare con lo spam. Come ad esempio alcune parole chiave appaiono in un gran numero di spam, le intestazioni dei messaggi, come alcuni virus, come ad esempio: test. È più come software anti-virus con le caratteristiche del virus stesso. Può dire che questo è un modo semplice per gestire contenuti filtraggio dello spam, si basa deve essere filtrata per creare un elenco enorme di parole chiave.
E 'chiaro che difetti tecnici, la capacità di filtrare le parole chiave sono ovvio collegamento con l'elenco di parole chiave si tradurrà in errata può essere grande, ovviamente, il sistema utilizza questa tecnologia per gestire e-mail quando il consumo di risorse di sistema sarà più. E, in generale evitare le parole chiave quali lavori di demolizione dei termini tecnici, è facile per bypassare il filtro gruppo di parole.
2.1.2, in bianco e nero lista
Black List (lista nera) e White List (White List). Sono spammer noti o fidati mittente l'indirizzo IP o indirizzo e-mail. Ci sono molte organizzazioni facendo * BL (elenco di blocco), a quelli che spesso inviano posta indesiderata indirizzo IP (o intervallo di indirizzi IP) per raccogliere insieme e rese lista del blocco, come Spamhaus di SBL (Spamhaus Block List), un BL possono essere condivisi in una vasta gamma. numero BL Molti ISP di organizzazioni sta utilizzando per bloccare la ricezione di posta indesiderata. Whitelist e blacklist, al contrario, per coloro che confidano in indirizzo e-mail o l'IP è del tutto accettabile.
Attualmente, molti hanno adottato il destinatario del messaggio, lista in bianco e nero di modi di affrontare lo spam, tra il MUA e il MTA, ovviamente, più ampiamente usato nel MTA, può effettivamente ridurre il carico sul server.
La tecnologia BL ha anche difetti evidenti, perché non può bloccare in elenco contiene tutti (anche se un gran numero di) indirizzo IP, ma gli spammer possono facilmente venire attraverso un indirizzo IP diverse di rifiuti.
2.1.3 HASH Technology
HASH tecnologia è il sistema di posta elettronica mediante la creazione di un hash per descrivere il contenuto del messaggio, come il contenuto del messaggio, il mittente come un parametro, e infine calcolato i messaggi di posta elettronica HASH per descrivere questa. Se lo stesso hash, poi mostra il contenuto del messaggio, il mittente e così lo stesso. Questa è l'introduzione di un certo numero di ISP, se del duplicato valore hash, quindi la massa può essere sospettato di inviare la posta.
2.1.4 basati su regole di filtraggio
Questo filtro basato su determinate caratteristiche (come parola, frase, ubicazione, dimensioni, allegati, ecc) per formare il regolamento, queste norme sono adottate per descrivere junk e-mail, è come IDS è descritto come uno invasione. Per rendere efficace il filtro, significa che i dirigenti devono mantenere un'ampia base di regola.
2.1.5 L'intelligenza e la probabilità di sistema
Ampiamente usato è il bayesiano (Bayesian) algoritmo di imparare la frequenza delle parole e la struttura, in modo da poter e-mail di spam e socio normale di giudicare. Si tratta di un parente con la parola, la tecnologia di contenuti il più complesso e più intelligenti di filtraggio. Mi limiterò a descrivere in dettaglio di seguito nel client e server, la tecnologia più utilizzata.
2.1.5.1 algoritmo bayesiano bayesiano
Nel filtro, adesso la migliore performance dovrebbe essere basato su score (punteggio) Filtri, perché si può facilmente comprendere l'accordo con l'astuzia di spam, tali elenchi in bianco e nero, una biblioteca, o HASH come tale un semplice filtro . Il punteggio è un sistema di filtro filtri algoritmo di base, l'algoritmo Bayesiano è la forma di base. Il suo principio è quello di controllare lo spam con le parole o caratteri, ecc, sarà ogni elemento delle funzionalità (il più semplice elemento è la parola, gli elementi più complessi che la frase) viene dato un punteggio (voti positivi), d'altra parte è quello di verificare il normale le caratteristiche del messaggio elemento è utilizzato per ridurre i tassi di (punteggio negativo). Ultimo messaggio come ottenere insieme, un punteggio di spam, con il punteggio di determinare se lo spam.
Filtro questo punteggio il più possibile per realizzare le funzioni di identificazione automatica di spam, ma ancora ci sono alcune domande inappropriate:
* Caratteristiche di un elenco di elementi o per posta ordinaria è spam. Pertanto, per migliorare l'identificazione del the effect di spam, we dobbiamo imparare dalle centinaia di messaggi, che riduce l'efficienza del filtro, perché per persone diverse, le caratteristiche della normale elemento messaggio non è la stessa.
* Caratteristiche di accedere alla posta elettronica di analisi elementare è una grandezza fondamentale. Se gli spammer si sono adattati a queste caratteristiche, è possibile effettuare più come normale e-mail spam. In questo caso, le caratteristiche del filtro sarebbe cambiato.
* Calcolo dei punteggi di ogni parola dovrebbe essere basata su una buona valutazione, ma ci sono arbitrari. Ad esempio, la funzione non potrà adattarsi a cambiamenti nelle parole di spam, non sarà di adattarsi alle esigenze di un utente.
teoria bayesiana è applicato in una vasta gamma dell'industria dei computer, che è una descrizione della incertezza delle cose, come ad esempio i calcoli di Google per l'uso della teoria bayesiana. filtro di Bayes è il calcolo del contenuto del messaggio in una probabilità spam, dovrebbe essere la prima da un certo numero di spam e posta normale a imparare, quindi, l'effetto del contenuto di filtro ordinaria migliore, errata sarebbe più di meno. I filtri bayesiani anche filtrare in base al punteggio. Ma non solo un semplice calcolo si scopre anche il riconoscimento più fondamentale. È dotato di un tavolo istituito con la modalità automatica, il principio, la prima analisi di grandi quantità di spam e un sacco di posta normale, algoritmo di analisi di diverse caratteristiche del messaggio di probabilità.
algoritmo bayesiano di solito è la fonte caratteristiche:
* La parola nel corpo del messaggio
* Intestazione del messaggio (mittente, il percorso di trasmissione, ecc)
• Altre manifestazioni, come il codice HTML (come il colore, ecc)
* Frase, frase
· Informazioni Meta, come la posizione delle frasi speciali appaiono
Ad esempio, posta ordinaria, le parole che appaiono spesso in AAA, ma la base non è posta indesiderata in là, poi, AAA segnato spam probabilità vicino allo 0, altrimenti naturale.
passi algoritmo bayesiano sono:
1. Per raccogliere un sacco di spam e non spam, costruire scene e non-spam, set di posta indesiderata.
2. Estrazione di caratteristiche indipendenti dalla stringa, come ad esempio AAA e altre serie statistica TOKEN TOKEN estratto numero di occorrenze della stringa di frequenza delle parole. Sono stati trattati secondo il metodo di cui sopra set e lo spam non-spam tutti i messaggi.
3. Ogni set messaggio corrisponde a una tabella di hash, hashtable_good set corrispondente di non-spam, spam e hashtable_bad set corrispondente. tabella TOKEN memorizzato nella stringa alla frequenza carattere del mapping.
4. TOKEN calcolato per ogni stringa tabella hash la probabilità P = (una stringa segno di frequenza delle parole) / (corrispondente alla lunghezza della tabella di hash)
5. Considerando hashtable_good e hashtable_bad, concludere che quando il nuovo messaggio appare in una stringa di token, la nuova posta come spam probabilità. Matematicamente espresso come:
Un caso ---- il messaggio come spam;
t1, t2 ... tn nome .... di stringa TOKEN
Allora P (A | TI) che appare nella stringa di messaggio TOKEN TI, la probabilità che il messaggio come spam. Impostare
P1 (TI) = ti nei valori hashtable_good
P2 (TI) = ti in hashtable_ cattivo valori
Allora P (A | TI) = P2 (TI) / [(P1 (TI) + P2 (TI)];
6. Creare una nuova tabella di hash di stoccaggio hashtable_probability TOKEN ti stringa a P (A | ti) mappatura
7. Hashtable_probability Secondo la tabella di hash stabilito stimare un nuovo e-mail come spam.
Quando il nuovo messaggio, in conformità con la Fase 2, generare TOKEN stringa. hashtable_probability Query ottenere il valore della chiave TOKEN stringa. Supponendo che il messaggio ricevuto un totale di stringa N-token, t1, t2 ... .... Tn, hashtable_probability il corrispondente valore di P1, P2, ... ... PN, P (A | t1, t2, t3 ... ... tn) ha detto in un messaggio simultanea di stringa TOKEN t1, t2 ... tn ..., la probabilità del messaggio come spam.
Disponibile con la formula probabilità composti:
P (A | t1, t2, t3 ... ... tn) = (P1 * P2 * ... ... PN) / [P1 * P2 * ... ... + PN (1-P1) * (1-P2) * ... ... (1-PN )]
Quando P (A | t1, t2, t3 ... ... tn) supera un valore soglia predeterminata, è possibile determinare il messaggio come spam.
Quando arriva nuova posta, filtra attraverso l'analisi bayesiana, calcolato utilizzando le varie caratteristiche della probabilità che il messaggio è spam. Attraverso l'analisi continua, anche i filtri costantemente ricevuto da l'aggiornamento. Per esempio, a giudicare dalle caratteristiche diverse di un messaggio contenente la parola AAA è spam, si caratterizza per la parola AAA come spam probabilità aumentata.
In questo modo, i filtri bayesiani hanno la capacità di adattamento sia automatico e manuale utente possono essere anche in grado di adattarsi al singolo utente da utilizzare. Gli spammer devono ottenere questo adattamento sarà molto difficile e quindi più difficile da eludere i filtri di filtraggio, che ovviamente può essere molto popolare e-mail travestito da messaggi come normale. A meno che gli spammer possono andare al il filtro di una persona a giudicare, per esempio, inviare la ricevuta con i mezzi per capire ciò che il messaggio è stato opened e altri utenti, in modo they può adattare il filtro.
Sebbene l'esistenza di filtri bayesiani tasso di difetto anche di filtro, ma è più ottimizzato. La pratica ha dimostrato che i filtri bayesiani sul client e server in effetti è molto chiara, eccellente filtri bayesiani in grado di identificare oltre il 99,9% di spam. La maggior parte dei prodotti attualmente utilizzati anti-spam hanno adottato questa tecnologia. Come ad esempio il filtraggio bayesiano in Foxmail.
2.1.6 Limitazioni e svantaggi
Molti dei prodotti di uso corrente di filtro anti-spam tecnologia sono di solito usato una varietà di tecnologie di filtraggio al fine di rendere il prodotto più efficace. Filtrare attraverso i loro falsi positivi e falsi negativi di sub-grado. L'omissione è che filtri anti-spam di bypassare il filtro. Il falso positivo aspirata normale e-mail a giudicare da spam. sistema filtrante perfetto dovrebbe essere omissioni e falsi positivi, ma questa è la situazione ideale.
Alcuni filtri basati sul principio dei sistemi anti-spam di solito hanno le tre seguenti limitazioni:
* Può essere bypassato. Gli spammer e gli strumenti non vengono utilizzati per inviare statiche, si adatterà in fretta al filtro. Ad esempio, l'elenco di parole chiave, possono cambiare a caso l'ortografia di alcune parole, come ("duro", "Gongsui difeso", "forte - feroce"). Hash-buster (in ogni messaggio HASH produrre differenti) è quello di bypassare il filtro hash. L'attuale utilizzo generalizzato di filtri bayesiani, inserendo la parola o frase casuale di bypass. La maggior parte dei filtri sono in solo poche settimane prima che il sistema più efficace anti-spam per mantenere pertinenza, le regole di filtraggio devono essere continuamente aggiornate, come ad esempio gli aggiornamenti giornalieri o settimanali.
* Falso problema positivi. Il problema più mal di testa è di determinare il normale e-mail come spam. Per esempio, un campione normale di messaggi che contengono la parola può dunque essere giudicato come spam. Sfortunatamente, alcuni server normale organizzazioni irresponsabile incluso nella versione della lista di blocco del contenitore di protezione di un segmento, anziché l'invio di spam (xfocus il server è un esempio). Tuttavia, se si vuole ridurre il problema di falsi positivi, può causare gravi problemi sotto-segnalazione.
* Filtro di revisione. Poiché il problema di falsi positivi e di solito è contrassegnata come messaggi di spam di solito non saranno immediatamente cancellati, essi sono collocati all'interno della casella di posta indesiderata per l'ispezione successiva. Sfortunatamente, ciò significa anche che gli utenti devono ancora passare il tempo a look at spam, anche se solo per il titolo del messaggio.
Presentare un problema più serio è che la gente pensa ancora che i filtri possano effettivamente bloccare lo spam. In effetti, filtri anti-spam non si può effettivamente bloccare lo spam, nella maggioranza dei casi, lo spam è ancora lì, ancora attraverso la rete, ed è tuttora diffuso benessere. Esiste a meno che l'utente non dispiacerebbe essere false e-mail, non importa che lo spam sarà ancora qui. I filtri possono aiutarci ad organizzare e separare i messaggi come spam e messaggi normali, ma i filtri e la tecnologia non può impedire lo spam, in realtà solo "" spam trattamento.
Nonostante i limiti delle tecnologie di filtraggio, ma è attualmente la tecnologia più utilizzata anti-spam.
2.2, verificare la query
SMTP quando il progetto non tiene conto di questioni di sicurezza. Nel 1973, la sicurezza del computer non ha alcun significato, in quel momento di avere un protocollo eseguibile e-mail è una fantastica. Ad esempio, RFC524 SMTP come un accordo a parte illustrerà alcune delle situazioni:
"Anche se le persone possono o potrebbero essere in grado di progettare software basato su questo documento, ma vi prego di essere adeguatamente sostenuto. Si prega di dare suggerimenti e domande. Sono fermamente convinto che l'accordo esiste ancora, spero che i lettori possono leggere la RFC quando sono in grado di indicarlo. "
Anche se il gruppo di comando SMTP ha sviluppato da tempo, ma la gente ancora in RFC524 come base per l'attuazione di SMTP, e anche supporre che i problemi (come ad esempio le questioni di sicurezza) saranno risolti in futuro. Così fino al 2004, da errori RFC524 o esiste ancora, questa volta SMTP è diventato molto esteso e molto difficile essere semplicemente sostituito. Lo spam è un esempio di abuso del protocollo SMTP, la maggior parte degli strumenti di spam può essere intestazioni contraffatte, forgiato mittente, o nascondere la fonte.
Lo spam è generalmente utilizzato forgiato l'indirizzo del mittente, una manciata di spam utilizzerà l'indirizzo reale. Gli spammer fucina e-mail con i seguenti motivi:
* Perché è contro la legge. In molti paesi, l'invio di spam è illegale, inviando l'indirizzo falso, il mittente può evitare il processo.
* Per quanto impopolare. Gli spammer sanno che lo spam non è il benvenuto. Di forgia l'indirizzo del mittente, è possibile ridurre questa reazione.
* Soggette a restrizioni ISP. La maggior parte dei provider di servizi Internet sono termini anti-spam di servizio, di forgia l'indirizzo del mittente, possono essere provider per ridurre la possibilità di vietare l'accesso alla rete.
Pertanto, se possiamo usare un elenco simile di bianco e nero, l'intelligenza come più per identificare ciò che è falso e-mail, che è un messaggio legittimo, quindi in grado di risolvere il problema dello spam da una larga misura, verificare la tecnologia di query si basa sul punto di partenza generati. Quanto segue anche risolvere alcune delle tecnologie più importanti anti-spam, come Yahoo, Microsoft, IBM e il sostegno di altri e presieduto dalla tecnologia anti-spam per verificare la loro classificazione nella tecnologia di query inversa non è molto appropriato, ma, da un punto di vista, queste tecnologie sono le query più complesse di verifica.
2.2.1, la tecnologia di reverse query
Forgiato dal punto di vista dello spam, forgiato e-mail per risolvere il problema, si può evitare un sacco di spam generato. Per limitare l'indirizzo del mittente falsificato, verificare il mittente di alcuni requisiti di sistema per indirizzi e-mail, questi sistemi sono:
Reverse Exchange Mail (RMX) http://www.ietf.org/internet-drafts/draft-danisch-dns-rr-smtp-03.txt
Inviare il permesso (SPF) http://spf.pobox.com/
Contrassegnato protocollo di posta elettronica (DMP) http://www.pan-am.ca/dmp/
Queste tecniche sono simili. DNS è un servizio Internet a livello globale per gestire l'indirizzo IP e il nome del dominio di conversione tra. Nel 1986, DNS estensioni, e ha avuto un record Mail Exchange (MX), quando l'invio di e-mail quando il server di posta interrogando il record MX al nome a dominio corrispondente ricevitore.
Simile alla soluzione di ricerca i record MX, reverse è quello di definire un record di reverse MX ("RMX" - RMX ", SPF" - SPF, "DMP" - DMP), utilizzati per determinare se il messaggio specificato nomi di dominio e indirizzi IP è completamente corrispondente. La ragione fondamentale è che falso indirizzo e-mail non è l'indirizzo reale dal RMX, in modo da poter stabilire se il falso.
2.2.2 La tecnologia DKIM
DKIM (DomainKeys Identified Mail) La tecnologia si basa sulla tecnologia di autenticazione di Yahoo e Cisco DomainKeys Identified Internet Mail.
Yahoo DomainKeys autenticazione tramite crittografia a chiave pubblica, mittente e-mail. Inviare il sistema genera una firma e la firma in intestazione e-mail, il sistema ricevente utilizza DNS rilasciato una chiave pubblica di verificare la firma. tecnologia di autenticazione di Cisco utilizza anche la crittografia, ma è la firma e il relativo e-mail messaggio stesso. Inviare e-mail server e la firma del messaggio e la chiave di firma pubblica utilizzata per generare la firma per inserire una nuova rubrica. Il sistema utilizzato per la ricezione di e-mail messaggio di verificare la firma della chiave pubblica è autorizzata ad utilizzare l'indirizzo del mittente.
DKIM integrerà questi due sistemi di verifica. Essa intende utilizzare allo stesso modo e DomainKeys DNS pubblico chiave di sblocco di verifica della firma, userà la tecnologia della firma Cisco titolo per garantire la coerenza.
DKIM per e-mail allo stesso tempo fornire un meccanismo per verificare la posta elettronica per ogni dominio e l'integrità del messaggio. Una volta che il dominio può essere verificata, saranno utilizzati per inviare gli stessi messaggi sono stati confrontati per individuare gli indirizzi falsi. Se è falso, ci possono essere spam o ingannevole e-mail, possono essere eliminati. Se non è falso, e il dominio è noto, può costruire una buona reputazione per, e si legano ai sistemi di politica anti-spam possono anche essere condivise tra i fornitori di servizi, o anche direttamente all'utente.
Per le società ben nota, di solito bisogno di inviare messaggi ai clienti di varie attività commerciali, banche, ecc, così la conferma via e-mail diventa molto importante. Può evitare di protezione dagli attacchi di phishing.
Ora, le norme tecnologia DKIM presentato alla IETF, può fare riferimento alla bozza di documento http://www.ietf.org/internet-drafts/draft-delany-domainkeys-base-00.txt
L'attuazione di DomainKeys
Dopo che il server invia due fasi:
1, costruire. proprietari di domini necessità di generare una coppia di pubblica / chiave privata utilizzata per contrassegnare tutta la posta in uscita (che consente maggiore della chiave), la chiave pubblica nel DNS nel pubblico, la chiave privata del server di posta uso DomainKey.
2, firma. Quando ad ogni utente di inviare la posta quando il sistema di posta utilizza automaticamente la chiave privata memorizzata per generare la firma. Firmato come parte dell'intestazione del messaggio, il messaggio viene passato al server di ricezione.
Ricezione di server per verificare i messaggi firmati in tre passi:
1, da preparare. server ricevente estrae la firma dal intestazione del messaggio e inviare il dominio (Da:) e quindi ottenere la chiave appropriata pubblica dal DNS.
2, verifica. Ottenuto dal server DNS utilizzato per ricevere la chiave pubblica per verificare le firme create con la chiave privata. Ciò assicura che il vero e-mail inviate e non è stato alterato.
3, superato. server ricevente utilizza la politica locale per rendere il risultato finale, se il dominio è stato verificato e di altri test anti-spam e non ha deciso, allora il messaggio è stato consegnato alla casella di posta elettronica dell'utente, in caso contrario, il messaggio può essere scartato, isolamento.
2.2.3, la tecnologia SenderID
Nel 2004, Gates ha previsto che Microsoft ha promesso di eliminare lo spam, in futuro, si spera che la tecnologia Sender ID, ma di recente è tornato alle sue previsioni. Questo è lo standard della concorrenza, Microsoft spera IETF mittente tecnologia ID può essere usato come uno standard, e ottenere un sacco di sostegno, come Cisco, Comcast, IBM, Cisco, Port25, Sendmail, Symantec, VeriSign, ecc, anche le defezioni di AOL, e più tardi sostegno, ma nella comunità open source, Microsoft non è stato un sostegno sufficiente, IETF ha respinto la proposta di Microsoft alla fine.
La tecnologia SenderID comprende principalmente due aspetti: supporto per l'invio e la ricezione di e-mail i messaggi di supporto laterale. Inviare e-mail di sostegno per un lato ci sono tre parti principali: il mittente necessità di modificare DNS del server di posta, aumentare il record SPF per dimostrare che la specifica identità delle loro lettere, come la "v = spf1 ip4:" 192.0.2.0/24-all, ha detto Usa spf1 versione, per 192.0.2.0/24 questo segmento è valida, in alcuni casi specifici, MTA del mittente per posta la lettera di sostegno nei suoi protocolli di comunicazione come l'aggiunta di estensione Submitter, e un aumento del suo messaggio risentirsi-Sender, risentirsi-Da, Sender e altre intestazioni.
Ricevere e-mail lato del supporto sono: server di posta del destinatario di verificare che utilizzano la tecnologia SenderID, ha ricevuto l'assegno e-mail PRA o mailFrom, record SPF mittente query DNS, e quindi di verificare l'identità del mittente.
Pertanto, l'uso della tecnologia Sender ID, l'intero processo sono:
Il primo passo, il mittente ha scritto il messaggio e inviarlo;
La seconda fase, il trasferimento di messaggi al server di posta ricevente;
Il terzo passo, il server di posta che riceve attraverso la tecnologia SenderID rivendicato identità del mittente controlli (i controlli effettuati da una query DNS specifico);
Il quarto passo, se troviamo l'identità del mittente rivendicazioni e le loro lettere indirizzo partite, quindi ricevere il messaggio, altrimenti il messaggio di adottare azioni specifiche, come ad esempio direttamente rifiutare il messaggio, o come spam.
Sender ID tecnologia non è una vera arma magica per eliminare lo spam, è solo una soluzione per la sorgente di spam tecnologia, dalla sostanza, e non può determinare se un messaggio è spam. Ad esempio, gli spammer possono registrare il nome a dominio economici per inviare spam, da un punto di vista tecnico, tutto è conforme; Inoltre, gli spammer anche attraverso la vulnerabilità degli altri server di posta di trasmettere la loro spazzatura e-mail, che è anche SenderID tecnologia non può essere risolto.
2.2.4, la tecnologia FairUCE
FairUCE (Fair use di Unsolicited Commercial Email), sviluppato da IBM, la tecnologia che utilizzano reti strumenti integrati di gestione delle identità, analizzando il filtro del dominio e-mail e bloccare lo spam.
FairUCE per ricevere e-mail con l'indirizzo IP sorgente collegata a - l'indirizzo e-mail, e-mail di dominio e inviare una mail a stabilire un collegamento tra il computer per determinare la legittimità di e-mail. Come l'utilizzo di SPF o altri metodi. Se si riesce a trovare una relazione, quindi verificare lista bianca del destinatario e il nome di dominio, che determina il funzionamento del messaggio, come la ricezione, il rifiuto e così via.
FairUCE anche una caratteristica che si ottiene per rintracciare la fonte di spam inviato, e passare sopra quelli spam e quindi inviare di nuovo alla fonte, al fine di combattere gli spammer. Questo approccio ha vantaggi e svantaggi. Vantaggio è che può influire sulle prestazioni della fonte di posta indesiderata, il danno rischia di saltare giù server normale (come ad esempio dall'uso di) il lavoro normale, mentre un altro esemplare della funzione di un sacco di traffico spazzatura.
2.2.5, i limiti e le carenze
Queste soluzioni hanno la disponibilità di alcuni, ma vi sono alcuni svantaggi:
** Non-host o nome di dominio dello spazio
Reverse approccio query richiede e-mail da noti e affidabili server di posta e l'indirizzo IP corrispondente a un ragionevole (reverse record MX). Tuttavia, la maggior parte del nome a dominio in realtà completamente diversa indirizzo IP statico corrisponde. In genere, gli individui e le piccole imprese vogliono avere il proprio nome di dominio, ma non fornisce sufficienti indirizzi IP per soddisfare i requisiti. DNS registrato host, quali GoDaddy, solo per coloro che non host o nome di dominio spazio per fornire il servizio gratuito di inoltro e-mail. Anche se questo servizio di inoltro di e-mail può gestire solo per ricevere la posta, ma non possono fornire il servizio di posta.
Reverse soluzione di query per queste non host o nome di dominio del solo utente vuoto causare alcuni problemi:
• Non vi è alcun record MX inverso. Questi utenti possono ora configurare il client di posta è possibile utilizzare il nome di dominio registrato per inviare il messaggio. Tuttavia, per invertire nome di dominio query indirizzo IP del mittente sul impossibile da trovare. Soprattutto per il mobile, dial-up e l'altro cambiano frequentemente i loro indirizzi IP degli utenti.
* Impossibile inviare e-mail. Per risolvere il problema di cui sopra, una soluzione è tramite il server del provider per inoltrare il messaggio, in modo che puoi realizzare un record reverse MX, ma finché il nome del dominio del mittente e nome a dominio ISP non è la stessa di quando, ISP non è permesso di trasmettere e-mail.
In entrambi i casi, questi utenti saranno bloccate sistema reverse query.
** Il dominio del diritto
Per verificare l'identità, non necessariamente lo status giuridico, come ad esempio: gli spammer possono registrare nomi a dominio economici per inviare spam, da un punto di vista tecnico, tutto ciò che è conforme; vi è attualmente un sacco di spam server di posta del mittente attraverso un altro scappatoia legale per entrare nel sistema di posta di trasmettere la propria posta indesiderata, questi problemi non possono essere risolti per il controllo di convalida è anche.
2,3 Sfide
Alcuni spammer usano software per inviare messaggi automatici ogni giorno in grado di produrre milioni di e-mail. Le sfide tecniche di e-mail attraverso il processo lento, sarà in grado di ostacolare un sacco di e-mail del mittente. Inviati solo una piccola quantità di posta che gli utenti normali non saranno interessati in modo significativo. Tuttavia, la sfida della tecnologia è utilizzata solo in pochissimi casi hanno avuto successo. Se i casi più popolare, può essere più preoccupa è se la gente interesserà la consegna della posta, piuttosto che ostacolare spam.
Qui ci sono due sfide principali nella forma di: Sfide - Response, e sfide computazionali (challenge-response e proposto sfide computazionali)
2.3.1 Challenge - Risposta
Challenge - risposta (Challenge-Response: CR) sistema mantiene un elenco di mittenti autorizzati. Un nuovo mittente e-mail per inviare il messaggio sarà temporaneamente conservati e non consegnati immediatamente. Quindi tornare a questa e-mail inviato un messaggio che contiene la sfida (sfida potrà essere richiesto di collegare URL o indietro). Dopo il completamento delle sfide, il nuovo mittente è stato aggiunto alla lista dei mittenti autorizzati. Per coloro che utilizzano falsi indirizzi e-mail di spam, che non potevano ricevere una sfida, ma se si usa vero indirizzo di posta elettronica, quindi, non può assolutamente rispondere a tutte le sfide. Tuttavia, i sistemi CR hanno ancora molti limiti:
CR deadlock. Se Alice dice Bill a dare un amico inviare un messaggio di Charlie. Bill per inviare un messaggio a Charlie, il sistema convenzionale di Charlie, l'interruzione temporanea del messaggio e inviare una sfida Bill. Ma il sistema convenzionale di Bill manda qui si romperà messaggio di sfida di Charlie, e inviare le loro sfide. Pertanto, il risultato è che gli utenti non ricevono una sfida, ma gli utenti non possono rispondere a un messaggio. E l'utente non può sapere che un problema si è verificato durante le sfide. Pertanto, se entrambe le parti di utilizzare il sistema CR, essi possono non essere in grado di comunicare.
Sistema automatico di problemi. Mailing list o quelli sistemi automatici, come ad esempio alcuni siti su "Invia ad un amico ... ..." caratteristica, è impossibile per rispondere alle sfide.
Spiegare la sfida. Attuazione di sistemi CR in molte sfide interpretative. Il sistema CR è costituito da un complesso di riconoscimento dei caratteri e la congruenza dei parametri, ma anche così, è possibile automatizzare le operazioni. Per esempio, il sistema convenzionale di Yahoo nel tempo a creare un nuovo account di posta elettronica, personaggi intelligenti che hanno una semplice analisi del sistema è vulnerabile. Messaggio Hushmail CR requisiti di sistema per scoprire l'immagine di sfondo blu specificato grafica (di sfondo, per scoprire la grafica, l'autore coordinate, questo è possibile)
Il mito di propaganda del mercato ha evidenziato due punti: uno, la gente devono fornire sfida, 2, questi problemi sono molto complessi e non suscettibili di automazione. Ma in realtà, la maggior parte gli spammer non ignorano questi sistemi CR poiché essi sono principalmente preoccupati non è un gran numero di destinatari, piuttosto che preoccuparsi sfide troppo complesse. Molti spammer utilizzare anche un indirizzo email valido. Quando il sistema CR interferisce con lo spam, chi vorrebbe identificare il mittente di automazione approcci abbottonata a queste sfide.
2.3.2, le sfide di calcolo
Ora apportato una serie di sfide computazionali programma Computational Challenge (CC), ad esempio, aumentando la posta di invio "costi". La maggior parte dei CC del sistema utilizza sofisticati algoritmi per ritardare intenzionalmente. Per gli utenti individuali, questo ritardo è difficile da scoprire, ma per inviare email di massa di mittenti di spam, questo significa spendere un sacco di tempo. istanze del sistema CC, come Hash di cassa (http://www.cypherspace.org/adam/hashcash/). Ma anche così, il sistema CC possa modificare l'impatto della rapida comunicazione, non solo spam. Queste limitazioni sono:
* Influenza disuguale.计算性挑战是以CPU、内存和网络为基础的,比如,在1Ghz计算机上挑战可能花费10秒,但是在500Mhz上就需要花费20秒了。
·邮件列表。许多邮件列表都有数千,甚至数百万的接受者。比如BugTraq,就可能会被看作垃圾邮件了。CC系统来处理邮件列表是不现实的。如果垃圾邮件发送有办法通过合法的邮件列表来绕过挑战,那么他们也就有办法绕过其他的挑战了。
·机器人程序。Sobig或者其他象垃圾邮件一样的病毒,能让垃圾邮件发送者控制大量的机器。这就让他们能够用大量的系统来均衡"费用"了。
·合法的机器人程序。垃圾邮件发送者发送垃圾邮件是因为会给他们带来收入。如果这些人联合起来,就可能提供大量的系统来分担"费用",这完全是合法的,而且不需要通过病毒了。
当前,计算性挑战还没有广泛应用,因为这种技术还不能解决spam问题,反而可能干扰正常用户。
2.4、密码术
现在提出了一些采用密码技术来验证邮件发送者的方案。从本质上来说,这些系统采用证书方式来提供证明。没有适当的证书,伪造的邮件就很容易被识别出来,下面就是一些研究中的密码解决办法:
AMTP. http://www.ietf.org/internet-drafts/draft-weinman-amtp-02.txt
MTP. http://www.ietf.org/internet-drafts/draft-danisch-email-mtp-00.txt
S/MIME and PGP/MIME. http://www.imc.org/smime-pgpmime.html
目前的邮件协议(SMTP)不能直接支持加密验证。研究中的解决方案扩展了SMTP(比如S/MIME,PGP/MIME和AMTP),还有一些其他的则打算代替现在的邮件体系,比如MTP。有趣的是,MTP的作者说到:"SMTP已经有20多年历史了,然而近代的一些需求则在过去5到10年内发展起来。许多扩展都是针对SMTP的语句和语义,纯粹的SMTP不能满足这些需求,如果不改变SMTP的语句,是很难有所突破的。"但是,很多的扩展的SMTP实例恰恰表明了SMTP的可变性,而不是不变性,完全创造一个新的邮件传输协议并不是必须的。
在采用证书的时候,比如X.509或TLS,某些证书管理机构必须得可用,但是,如果证书存储在DNS,那么私钥必须得在验证的时候可用。(换句话说,如果垃圾邮件发送者可以访问这些私钥,那么他们就可以产生有效的公钥)。另一方面,也要用到主要的证书管理机构(CA),但是,邮件是一种分布式系统,没有人希望所有的邮件都由单独的CA来控制。一些解决办法因此允许多个CA系统,比如,X.509就会确定可用的CA服务器。这种扩展性也导致垃圾邮件发送者也可以运行着私有的CA服务器。
如果没有证书管理机构,就需要其他的途径在发送者和接收者之间来分发密钥。比如,PGP,就可以预先共享公钥。在未连接网络或者比较封闭的群组中,这种办法是可行的,但是在大量个体使用的时候,就不是太适合,特别是对于需要建立新的联系的情况下。从本质上来说,预先共享密钥有些类似白名单的过滤器:只有彼此知道的人才能发送邮件。
不幸的是,这些加密解决方案还不能阻止垃圾邮件,比如,假设其中的一种加密方案广泛被接受了。这些办法都不能确认邮件地址是真实的,而只是可以确认发送者有邮件的正确密钥。缺点就是:
·滥用自动化工具。如果在广大范围内被应用,就需要有一种办法为所有用户产生证书或者密钥(包括邮件服务器端,邮件客户端,依赖与相应的解决办法)系统很可能通过一种自动化的方法来提供密钥。可是,可以相信垃圾邮件发送者也会滥用任何自动化系统,并且用来发送经认证的垃圾邮件。
·可用性问题。这也有一些可用性的争论。比如,如果CA服务器不可用怎么办?邮件被挂起?退票?还是依然可用?垃圾邮件发送者近来对一半以上的提供黑名单网站进行了拒绝服务攻击,并导致这些网站都无法访问。显然,这些垃圾邮件发送者想阻止别人更新黑名单。对于单一的CA服务器,很显然也无法避免这样的命运。
3、总结
上面介绍了一些反垃圾邮件的技术,其实,现在很多反垃圾邮件方案所采用的都不会只是一种技术,而是多种多类技术的综合体。
垃圾邮件的危害现在已经深入人心,反垃圾邮件也取得越来越多的成绩,比如,Scott Richter向微软赔款700万。不少国家也在为反垃圾邮件进行立法,以便能够得到法律上的支持。
但从技术上来说,这跟反攻击一样,是一个正反双方的博弈过程,一种新的反垃圾邮件技术必然会出现一种对应得垃圾邮件技术,况且,任何一种技术,还没有办法去解决所有问题,技术的发展也将延续下去。