Metodologia

O procedimento adotado é meio ingênuo, deixa de considerar várias mensagens, não considera vários tipos de dados hostis, mas produz um cenário representativo do problema.

Passos

  1. expressão regular /http:.*[.](exe|scr|zip)/
  2. depena manual de falsos positivos
  3. remoção de URLs repetidas
  4. contagem por domínio hospedeiro
  5. wget

Foram aproximadamente dois meses de coleta, só com mensagens que eu recebi e que foram reconhecidas como SPAM/scam.

Estatísticas sobre malware. GTER-18