Posta Elettronica 2009: diamo i numeri!
I numeri del 2009
Per dare un’idea del carico di lavoro affrontato dalla nostra infrastruttura di gestione della posta elettronica, riportiamo di seguito i dati più significativi, relativi all’anno 2009.
Messaggi ricevuti | 71,5 milioni |
Messaggi spediti | 6,9 milioni |
I messaggi ricevuti sono molto maggiori di quelli spediti dai nostri clienti, a causa dello SPAM. Vediamo come sono ripartiti i messaggi ricevuti.
Messaggi bloccati da antispam/greylist | 64,8 milioni ( 90,6 % ) |
Messaggi bloccati da antispam/regole | 0,5 milioni ( 0,7 %) |
Messaggi buoni, consegnati ai clienti | 6,2 milioni ( 8,7 % ) |
Come è composta l’infrastruttura
Il sistema, attualmente formato da 4 server, è stato progettato in modo da essere scalabile, con possibilità di aumentare il numero di server parallelamente all’incremento del volume di email da gestire.
Lo schema in figura mostra le relazioni tra i server.
Server di controllo (back end)
Si tratta di un sistema completamente ridondato, il cui scopo è quello di autenticare gli utenti che spediscono e scaricano i messaggi di posta, e di fornire alcuni servizi di controllo, quali la gestione delle regole per l’individuazione degli SPAM, la verifica delle greylist, la funzionalità webmail.
Server front-end
Attualmente due server, che potranno aumentare parallelamente all’incremento del numero di mail da gestire, che si occupano di assolvere alle funzionalità di consegna della posta al destinatario (protocollo POP3), di ricezione dal mittente dei messaggi da spedire (protocollo SMTP), e controllo antivirus/antispam.
Storage
Un sistema NAS completamente ridondato, in grado di memorizzare i messaggi di posta ricevuti, fino a quando gli stessi non vengono letti dai relativi destinatari. Il sistema è accessibile da parte dei server di Front End grazie al protocollo NFS.
Come vengono gestite le email
Di seguito sono descritte le varie fasi attraversate da un messaggio, a partire dal suo invio fino alla ricezione da parte del destinatario.
Interrogazione del DNS
Il nostro DNS viene interrogato dal mittente, per conoscere l’indirizzo IP del server di posta elettronica. L’indirizzo fornito non è sempre lo stesso; il DNS fornisce a rotazione gli indirizzi di ogni server Front End, secondo una modalità denominata round-robin.
Questo significa che i mittenti che contattano la nostra infrastruttura vengono “smistati” alternativamente su più server, ciascuno dei quali avrà quindi un carico di lavoro inferiore.
Lettura degli “header”
Il server di Front End legge l’intestazione del messaggio (header) e contatta il server di controllo perchè esegua le opportune verifiche.
Verifica dei dati del destinatario
Il server di controllo verifica che esista la casella indicata come destinatario. In caso negativo termina il processo di gestione del messaggio e notifica al mittente che l’indirizzo del destinatario è inesistente.
Greylist
Il server di controllo applica il metodo di protezione da spam basato su greylist, che permette di filtrare la gran parte dei messaggi “spazzatura”.
Verifica antispam/antivirus
Se le due precedenti verifiche sono regolari, il server di controllo informa il server di Front End e questo procede con la verifica antispam/antivirus. Nel caso in cui il messaggio risulti SPAM, questo viene marcato per essere facilmente identificato e gestito dal destinatario.
Nel caso di presenza di virus, il messaggio viene eliminato e viene informato il mittente.
Memorizzazione su storage
Al termine di queste fasi il messaggio, se non eliminato precedentemente, viene memorizzato sul sistema di storage, in attesa che il destinatario controlli la sua posta e prelevi il messaggio.