p***** de spam
Par kim le dimanche, mai 28 2006, 21:05 - Général - Lien permanent
Bon alors quand on se prend du spam qui dit "I use Firefox in Ubuntu :)", on fait quoi, hein ?
Conclusion : ce blog étant francophone, je déconseille très fortement d'employer de l'anglais pour les commentaires, je vais commencer à mettre des mots courants d'anglais pour filtrer le spam. Ca me gonfle, ça vous gonfle, mais c'est comme ça. Dans la liste des mots actuellement ajoutés : "was", "Thanks" et "use" devraient m'enlever quelques spams.
Pour les faux positifs, ben ma foi, si vous avez de la chance, ils seront remis en ligne à mon passage, si il passe à la trappe, il faudra... pleurer sur son sort, ou engager des poursuites actives contre les spammeurs.
Evidemment, si quelqu'un a une meilleure idée, let's tell it, je me ferai un plaisir de l'explorer.
Commentaires
Je ne comprends pas comment tu peux laisser passer "ubuntu" ! </troll>
J'ai failli filtrer ce mot, justement pour le plaisir de lancer un troll, et puis, non /D
En fait, idéalement, faudrait un filtre bayesien ala SpamAssassin...
Deja pense, mais :
* ca consomme des ressources
* C'est bien joli mais stopper via un bayesian une phrase comme celle citee plus haut, je ne trouve pas ca plus credible que ca.
Je decouvre un plugin anti spam bayesien, je regarde ce soir ce que ca peut donner...
Bon, j'ai colle le plugin Spam Clear, qui fait du bayesien sur les commentaires, et deux commentaires s'imposent :
* pour filtrer spam / pas spam, c'est vachement mieux que spamplemousse
* pour ce qui est de l'apprentissage, on verra avec le temps. En attendant je vire de spamplemousse tous les mots qui ne devraient pas y etre.
Fr33 Vi4gr4 anyone? (voyons si le filtre apprend...)