encontrei este relatório (em inglês) de uma entidade que resolveu fazer o seguinte, criou um grupo de endereços de email apenas para este estudo e usou cada um desses endereços apenas num sitio especifico e analisou durante seis meses o spam que recebia por cada um deles. dai resultou uma analise interessante, link:
http://www.cdt.org/speech/spam/030319spamreport.shtml