La technologie de l’intelligence artificielle modifie notre perception du web et notre façon de communiquer avec les autres. L’intelligence artificielle, qui fait désormais partie de notre vie quotidienne, a de nombreuses applications.
Comme l’IA est de plus en plus utilisée à des fins plus sinistres, telles qu’une campagne de désinformation et de politique qui diffuse de faux articles, nous devons apprendre à la reconnaître. Comment savoir si le texte d’un article est généré par l’IA ?
Comment savoir si un article a été rédigé par ChatGPT ?
De nombreuses méthodes et outils sont aujourd’hui disponibles pour déterminer si un article que vous lisez a été écrit par un robot. Toutes peuvent être faussement positives, et toutes ne sont pas fiables.
Le caractère aléatoire est, à tout le moins, un bon indicateur d’un document écrit par un humain. Il est très peu probable que les systèmes linguistiques d’IA fassent les mêmes erreurs que les humains, qui utilisent souvent de l’argot ou des styles d’écriture différents et commettent des fautes de frappe. Selon la MIT Technology Review, « les textes écrits par des humains sont truffés de fautes de frappe et incroyablement incohérents », alors que les textes générés par l’IA, comme ChatGPT, sont beaucoup plus efficaces pour créer des textes sans erreur. Il est important de noter qu’un bon rédacteur produira également les mêmes résultats, et qu’il faut donc rechercher d’autres erreurs que l’orthographe.
Les schémas de ponctuation sont un autre indicateur. Les humains sont plus susceptibles de ponctuer de manière aléatoire que les modèles d’IA. Les mots générés par l’IA sont également souvent plus remplis de connecteurs tels que « the », « it » ou « is » au lieu de mots plus grands et moins courants. Cela s’explique par le fait que les modèles d’IA prédisent quel mot sera probablement le suivant et ne parviennent pas à produire une phrase qui sonne bien.
ChatGPT a répondu de cette manière à l’une des questions de l’OpenAI. À la question « Pouvez-vous expliquer l’informatique quantique en termes simples ? », on obtient des phrases comme celle-ci : « Ce qui rend les Qubits spéciaux, c’est qu’ils peuvent exister dans plusieurs états en même temps, grâce à une propriété appelée superposition. C’est un peu comme si un seul qubit pouvait agir à la fois comme un zéro et un un au même moment. «
Chat GPT répondant à la question : « Puis-je vous expliquer l’informatique quantique en termes simples ? »
Des mots de liaison simples et des phrases courtes sont fréquemment utilisés. Les paragraphes suivent également une structure cohérente. Il en résulte une écriture à consonance robotique.
Qu’est-ce que l’intelligence artificielle ?
L’IA peut-elle être utilisée pour la détection de textes ?
Les modèles de grandes langues peuvent également être entraînés à repérer les textes générés par l’IA. En théorie, le système peut apprendre à reconnaître un texte généré par l’IA en s’entraînant sur deux ensembles : un ensemble de textes écrits par l’IA et l’autre par une personne.
Les chercheurs ont également travaillé sur des technologies de filigrane pour détecter les textes et les articles générés par l’IA. Tom Goldstein, qui enseigne à l’université du Maryland, travaille sur la modélisation du langage de l’IA en filigrane dans l’espoir qu’elle permette de détecter les textes générés par des machines, même s’ils sont suffisamment bons pour imiter le hasard humain.
Invisible à l’œil nu, un algorithme détecterait le filigrane. Il déterminerait ensuite s’il est généré par l’homme ou par l’IA en fonction de la fréquence à laquelle le filigrane respecte ou non les directives en la matière. Malheureusement, cette méthode n’a pas été testée aussi bien sur les anciens modèles de ChatGPT.
Vérifier si un article est écrit par ChatGPT
Des outils de copier-coller sont disponibles en ligne pour aider à déterminer si un article est généré par l’IA. Plusieurs d’entre eux analysent le texte à l’aide de modèles linguistiques. C’est le cas de ChatGPT-4.
Undetectable, par exemple, se propose de rendre l’écriture AI indiscernable. Ce programme vous permet de copier et de coller du texte dans une fenêtre, et il compare les résultats avec d’autres logiciels de détection de l’IA comme GPTZero. Il attribue ensuite un score de vraisemblance.
Originality peut être utilisé par les grands éditeurs ou producteurs de contenu. Il utilise ChatGPT-4, qui est réputé être plus précis et plus fiable que d’autres outils similaires. Parmi les outils de vérification les plus populaires, citons
GPTZero
Copyleaks
Writer
La plupart de ces outils logiciels proposent un pourcentage, par exemple 96 % d’intelligence humaine et 4 % d’intelligence artificielle, pour déterminer si le texte a été écrit par des humains. Si le score est de 40 à 50 % d’IA (ou plus), il s’agit probablement d’un texte généré par l’IA.
Bien que les développeurs s’efforcent d’améliorer leurs outils de détection des contenus générés par l’IA, aucun n’est précis à 100 %. Ils peuvent donc être amenés à repérer à tort des contenus générés par des humains. Il est à craindre qu’à mesure que les grands modèles de langage tels que le GPT-4 continuent de s’améliorer, les outils de détection ne parviennent pas à rattraper leur retard.
Entraînez votre cerveau à détecter l’IA
Vous pouvez apprendre à détecter les contenus générés par l’IA en vous formant vous-même. Il faut du temps pour s’améliorer, mais avec de la pratique.
Daphne Ippolito a créé un nouveau jeu, Real Or Fake Text. Ce jeu peut vous aider à faire la différence entre une phrase humaine et une phrase robotisée en vous apprenant progressivement à détecter quand quelque chose ne semble pas correct.
Selon M. Ippolito, les textes dépourvus de sens sont un signe courant de l’IA. Par exemple, « il est impossible de faire une bonne tasse de café en deux heures ». M. Ippolito souhaite aider les utilisateurs à détecter ces erreurs. Les programmes d’écriture basés sur l’IA ont à plusieurs reprises énoncé des informations inexactes en toute confiance. Ils ne sont pas non plus doués pour les calculs mathématiques, et vous ne devriez donc pas leur confier vos devoirs.
À l’heure actuelle, nous ne disposons que de ces méthodes pour détecter les textes générés par l’IA. Les modèles de langage s’améliorent rapidement, ce qui rend les méthodes de détection actuelles rapidement obsolètes.