Aujourd’hui, les développeurs de détecteurs de contenu IA les présentent comme des outils pour garantir l’authenticité. La question est de savoir s’ils méritent la confiance et l’investissement. Dans cet article, nous examinerons comment fonctionnent les détecteurs de contenu IA, pourquoi ils pourraient disparaître, quels défis ils posent et les dilemmes éthiques qu’ils soulèvent.
Les détecteurs de contenu IA sont basés sur des modèles linguistiques similaires à ceux utilisés pour générer du contenu IA. Ils peuvent être divisés en ceux dont la tâche est de vérifier l’origine des images, des textes et de la musique générés avec le soutien de l’intelligence artificielle. Chaque type de “détecteur IA” fonctionne légèrement différemment, mais aucun d’eux ne peut distinguer avec une certitude absolue entre le contenu créé par des humains et celui généré par l’IA.
Les détecteurs d’images générées par IA jouent un rôle de plus en plus important en raison du pouvoir des médias à générer de fausses nouvelles. Ils analysent les anomalies, les styles et les motifs distinctifs, et recherchent des signes laissés par des modèles tels que DALL-E.
Parmi les détecteurs utilisés pour identifier les images, l’outil “AI or Not” d’Optic se distingue, utilisant des bases de données d’images générées par Midjourney, DALL-E et Stable Diffusion. Bien que les résultats soient incertains, c’est un pas vers le développement de méthodes d’identification plus précises à l’avenir.
Source : AI or Not (https://www.aiornot.com/)
À l’arrière-plan du fonctionnement des détecteurs IA qui reconnaissent les textes générés par IA se trouvent des algorithmes avancés qui analysent la structure et le choix des mots du texte, puis reconnaissent des motifs spécifiques à l’IA. Ils utilisent :
Les éléments mentionnés ci-dessus sont utilisés ensemble par les détecteurs de contenu IA pour évaluer si nous avons affaire à un texte créé par l’homme ou par une machine.
Les détecteurs de contenu IA fonctionnent dans divers domaines – de l’éducation au marketing et au recrutement. Voici les principales raisons de les avoir comme outil d’évaluation, mais pas comme preuve définitive de la génération de contenu :
Cependant, il convient de rappeler que l’origine du texte n’est pas la base de la baisse du classement d’un site par Google. Le blog du Centre de recherche de Google indique qu’il est essentiel pour Google de “récompenser le contenu de qualité, peu importe comment il est créé […]. L’automatisation est utilisée depuis longtemps pour générer du contenu utile, tel que des scores sportifs, des prévisions météorologiques et des transcriptions. L’IA peut ouvrir de nouveaux niveaux d’expression et de créativité et être un outil clé pour soutenir la création d’un excellent contenu web.”
Bien que les détecteurs de contenu IA soient omniprésents, leur efficacité peut être remise en question. Les principaux problèmes sont :
Des tests menés par OpenAI ont montré que leur classificateur reconnaissait le texte généré par GPT seulement 26 % du temps. Un exemple intéressant de l’irréliabilité des générateurs peut être vu dans une expérience menée par TechCrunch, qui a montré que l’outil GPTZero identifiait correctement cinq des sept textes générés par IA. Alors que le classificateur d’OpenAI n’en identifiait qu’un.
Source : GPTZero (https://gptzero.me/)
De plus, il existe un risque de recevoir un faux positif, c’est-à-dire d’identifier un texte écrit par un humain comme généré par l’IA. Par exemple, le début du deuxième chapitre de Don Quichotte de Miguel de Cervantes a été marqué par le détecteur d’OpenAI comme étant le plus susceptible d’avoir été écrit par une intelligence artificielle.
Bien que les erreurs dans l’analyse de textes littéraires historiques puissent être considérées comme une curiosité amusante, la situation devient plus compliquée lorsque nous voulons utiliser des détecteurs comme outils d’évaluation des textes. La Constitution des États-Unis a été marquée par ZeroGPT comme étant écrite à 92,15 % par une intelligence artificielle. Et, selon une étude publiée par des chercheurs de l’Université de Stanford, 61 % des essais TOEFL écrits par des étudiants non natifs anglophones ont été classés comme générés par l’IA. Malheureusement, il n’existe pas de données sur le pourcentage de textes faussement classés comme positifs dans d’autres langues.
Un autre problème est le changement de classification lors des exécutions successives du détecteur. Cela est dû au fait qu’il arrive souvent qu’un détecteur tel que ZeroGPT ou Scribbr change la classification de fragments de texte, qu’il marque une fois comme générés par l’IA et une autre fois comme écrits par des humains.
Source : Scribbr (https://www.scribbr.com/ai-detector/)
Les détecteurs d’images et de vidéos IA sont principalement utilisés pour identifier les deepfakes et d’autres contenus générés par IA qui peuvent être utilisés pour diffuser de la désinformation.
Les outils de détection actuels tels que Deepware, Illuminarty et FakeCatcher ne fournissent pas de résultats de test sur leur fiabilité. Dans le contexte légal de la détection de matériel visuel généré par IA, il existe des initiatives pour ajouter des filigranes aux images IA. Cependant, c’est une méthode très peu fiable – on peut facilement télécharger une image sans filigrane. Midjourney adopte une approche différente en matière de filigranage, laissant aux utilisateurs le choix de savoir s’ils souhaitent ou non ajouter un filigrane à une image de cette manière.
Les entrepreneurs doivent être conscients que les détecteurs de contenu IA ne remplacent pas l’évaluation de la qualité humaine et ne sont pas toujours fiables. Leurs problèmes de maintenance pratique peuvent poser des difficultés considérables, tout comme essayer d’éviter que votre contenu soit classé comme généré par l’IA. Surtout lorsque l’IA est simplement un outil entre les mains d’un professionnel – c’est-à-dire qu’il ne s’agit pas de “contenu généré par l’IA”, mais plutôt de “contenu créé en collaboration avec l’IA.”
Il est relativement simple d’ajouter quelqu’un aux matériaux générés, de sorte que la manière dont ils sont créés est vraiment difficile à détecter. Si la personne qui utilise l’IA générative sait quel effet elle souhaite obtenir, elle peut simplement ajuster manuellement les résultats.
La question fondamentale réside dans la raison pour laquelle nous voulons éviter la détection si le contenu a été généré par l’IA.
Cela soulève également la question de savoir si nous voulons promouvoir l’utilisation responsable de l’IA par le biais d’interdictions et de détracteurs (ZeroGPT et GPTZero !), ou par une appréciation de la transparence, de la construction de la confiance et de l’utilisation honnête des technologies avancées.
Source : ZeroGPT (https://www.zerogpt.com/)
La réponse à la question de savoir si les détecteurs de contenu IA valent la peine d’être utilisés est loin d’être claire. Les détecteurs de contenu IA sont encore en développement, et leur avenir est difficile à prédire. Une chose est certaine – ils évolueront avec le développement de la technologie IA. Les avancées en IA, y compris la capacité croissante des modèles linguistiques à imiter le style d’écriture humain, signifient que la détection de contenu IA pourrait devenir encore plus compliquée. Pour les entreprises, c’est un signe de suivre ces développements et de ne pas se fier uniquement aux outils, mais à leur évaluation du contenu et de son adéquation à l’objectif pour lequel il a été créé. Et d’utiliser l’intelligence artificielle en rapide développement de manière judicieuse.
Si vous aimez notre contenu, rejoignez notre communauté de abeilles occupées sur Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
Expert en JavaScript et instructeur qui forme les départements informatiques. Son objectif principal est d'améliorer la productivité de l'équipe en enseignant aux autres comment coopérer efficacement lors du codage.
Les entreprises luttent pour gérer une vaste quantité de contenu publié en ligne, des publications…
À l'ère de la transformation numérique, les entreprises ont accès à une quantité sans précédent…
Saviez-vous que vous pouvez obtenir l'essence d'un enregistrement de plusieurs heures d'une réunion ou d'une…
Imaginez un monde où votre entreprise peut créer des vidéos engageantes et personnalisées pour n'importe…
Pour tirer pleinement parti du potentiel des grands modèles de langage (LLMs), les entreprises doivent…
En 2018, Unilever avait déjà entrepris un voyage conscient pour équilibrer les capacités d'automatisation et…