Google a rendu l'outil de filigrane SynthID open source

Google a annoncé avoir rendu open source la technologie de filigrane appelée SynthID, qu'il a développée pour permettre une identification plus facile des textes produits par l'intelligence artificielle (IA). Cette technologie est désormais disponible pour les développeurs via la boîte à outils Responsible Producer AI de Google.

Pushmeet Kohli, vice-président de la recherche Google DeepMind, a déclaré au MIT Technology Review : « D'autres développeurs d'IA pourront utiliser cette technologie pour détecter le texte émergeant de leurs grands modèles de langage (LLM), ce qui permettra à davantage de développeurs de créer une IA de manière responsable. « Cela facilitera les choses », a-t-il déclaré.

Récemment, l’utilisation de modèles linguistiques à grande échelle pour diffuser de la désinformation politique, créer du contenu sexuel non consensuel et à d’autres fins préjudiciables a rendu les technologies de filigrane encore plus importantes. Par exemple, l’État de Californie envisage de rendre obligatoire l’utilisation de filigranes d’intelligence artificielle, tandis que le gouvernement chinois a adopté cette exigence l’année dernière. Cependant, ces outils sont encore en développement.

Introduit en août dernier, SynthID ajoute un filigrane invisible aux sorties produites par l'intelligence artificielle, permettant de détecter ces contenus. La technologie peut fonctionner avec différents formats tels que l'image, l'audio, la vidéo et le texte. Selon Google, la version texte de SynthID fonctionne en rendant la sortie légèrement moins susceptible d'être détectée par l'œil humain. De cette manière, l’objectif est d’utiliser le texte en toute sécurité sans en abuser.

Un LLM produit du texte un par un en petites unités appelées jetons. Ces jetons peuvent représenter un seul caractère, un mot ou une partie d'une phrase. Pour générer une chaîne de texte, le modèle prédit le prochain jeton le plus probable. Ces prédictions sont basées sur les mots précédents et les scores de probabilité attribués à chaque jeton possible.

Par exemple, « Mes fruits tropicaux préférés sont __ ». En termes d'expression, LLM peut combler cette lacune avec des jetons tels que « mangue », « litchi », « papaye » ou « durian », et chaque jeton se voit attribuer un score de probabilité. SynthID peut ajuster les scores de probabilité des jetons à sélectionner sans compromettre la qualité, la précision et la créativité du résultat.

Ce processus est répété dans tout le texte généré, ce qui donne lieu à des dizaines de scores de probabilité ajustés dans une phrase et des centaines dans une page. Le modèle final de scores de probabilité ajustés par les préférences de mots du modèle est considéré comme le filigrane.

Google a intégré le système dans Gemini

Google affirme que le système est déjà intégré au chatbot Gemini et que le processus de filigrane n'a pas d'impact négatif sur la qualité, la précision, la créativité ou la rapidité du texte. Cette technologie, qui peut fonctionner même avec des textes aussi courts que trois phrases, peut être efficace même avec des textes qui ont été coupés, réécrits ou modifiés. Cependant, ce système peut rencontrer des difficultés dans les textes courts, les contenus réécrits et les réponses aux questions de connaissances.

« SynthID n'est pas une solution magique pour détecter le contenu généré par l'IA », a déclaré Google dans un article de blog publié en mai. « Mais il s'agit d'un élément important pour développer des outils d'identification d'IA plus fiables et peut aider des millions de personnes à prendre des décisions éclairées sur la manière d'interagir avec le contenu généré par l'IA. »