Gmail filtre 100 millions de spams supplémentaires chaque jour grâce à l’IA

Cet article est une traduction résumée d’un post publié sur le blog de Google Cloud par Neil Kumaran. Nous tirons quelques conclusions après la traduction.

Titre original : Le spam ne nous apporte pas la joie – débarasser Gmail de 100 millions de spams supplémentaires avec TensorFlow

1,5 milliards de personnes utilisent Gmail chaque mois, et 5 millions d’entreprises utilisent Gmail via G Suite. Pour les consommateurs comme pour les entreprises, une grande partie de l’atrait de Gmail est du à la gestion intégrée de la sécurité.

Une bonne sécurité signifie de rester toujours à l’avant-garde des menaces, et nos modèles de Machine Learning actuels sont très efficaces. En combinaison avec nos autres protections, ils permettent d’empêcher plus de 99,9% des spams, phishing et logiciels malveillants d’atteindre les boîtes de réception Gmail.

Récemment, nous avons mis en place de nouvelles protections en utilisant TensorFlow, une framework Opensource d’apprentissage automatique développé par Google. Ces nouvelles protections complètent les protections existantes, que ce soit via le Machine Learning ou basées sur des règles. Avec TensorFlow, environ 100 millions de spams supplémentaires sont bloqués chaque jour.

Où ces 100 millions de spams supplémentaires ont-ils été trouvés ? Principalement dans des catégories de spam très difficiles à détecter. L’utilisation de TensorFlow a permis de bloquer des messages utilisant des images, des emails avec un contenu masqué et des messages provenant des domaines récemment créés qui tentent de masquer une faible volume de spams dans du trafic légitime.

Étant donné que Gmail bloque déjà la majorité des spam, en bloquer des millions en plus avec précision est un exploit.TensorFlow permet de bloquer le dernier 0,1% sans bloquer accidentellement des messages importants pour les utilisateurs.

Le spam d’une personne est le trésor d’une autre

Le Machine Learning rend l’interception du spam possible en aidant à identifier des modèles dans de grands ensembles de données que les humains qui créent les règles ne pourraient pas détecter. Cela permet de s’adapter rapidement aux évolutions constantes des tentatives de spam.

Le Machine Learning permet une prise de décision plus granulaire sur de nombreux paramètres. Considérez que chaque email continent plusieurs milliers de signaux potentiels. Ce n’est pas parce qu’un email continent des signaux communément considérés comme du spam que le message est nécessairement du spam. Le Machine Learning permet de vérifier tous ces signaux ensemble afin de prendre une décision.

Finalement, cela nous aide aussi à personnaliser notre protection anti-spam à chaque utilisateur. Ce qu’une personne considère comme du spam, une autre personne peut le considérer comme un message important (pensez aux newsletter ou au notifications régulières d’une application).

Quelques commentaires “Made in Badsender”

Comme chaque fois, lorsque l’on fait (comme vous et nous très probablement) un usage marketing de l’email, une avancée dans l’intelligence des filtres anti-spam nous pose la question de l’impact que cela va avoir sur nos campagnes. Et il y en aura forcément. Comme le dit Google, le spam d’une personne peut être le trésor d’une autre. Il en va donc de même sur la perception de la légitimité d’un message, qui est très variable d’une personne à l’autre.

Ce qui est très net, et dans l’air du temps du côté de la lutte anti-spam, c’est que tous les messages marketing, je dis bien TOUS, peuvent potentiellement être considérés comme du spam. Même si vous avez recueilli un consentement, même s’il y a eu des ouvertures, même si vous avez une hygiène de base de donnée exemplaire.

Dans cette évolution, on ne retiendra pas forcément la partie concernant la détection des messages inclus dans les images, les emails utilisant des contenus cachés ou les messages venant de domaines “frais”. Ces pratiques étant clairement réservées aux spammeurs… il conviendra tout de même de rester le plus éloigné possible de celles-ci. Ce que l’on retiendra, c’est surtout la notion de personnalisation de la protection anti-spam. Si par le passé on vous parlait de signaux positifs (ouverture, clic, réponses, transfert, rangement) et négatifs (plainte spam, suppression avant lecture, bounces, …) qui affectaient votre réputation d’expéditeur, il semblerait que Gmail soit en train d’ajouter une réputation personnalisée par destinataire.

Qu’est-ce que cela dit sur l’évolution des bonnes pratiques ? Toutes les bonnes pratiques du passé restent probablement valables, mais la personnalisation des vos actions d’engagement doivent être toujours plus fortes. Il est plus important que jamais de moduler votre pression marketing, de personnaliser vos contenus en fonction de l’individu à qui vous adressez un message.

Besoin d’aider pour améliorer votre délivrabilité ?

Découvrez nos prestations de monitoring délivrabilité et d’audit délivrabilité.

Related Articles

Responses

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *