Article mis à jour le 19 août 2025 à 10:19
[Série « L’IA dans tous ses états », épisode 2] Beaucoup ignorent que les intelligences conversationnelles comme Chat GPT puisent la moitié de leurs sources dans l’encyclopédie en ligne Wikipédia. Mais cette dernière commence à vaciller sous la pression d’articles rédigés par une IA qui risque alors de se sourcer elle-même. Fabricio Cárdenas, bibliothécaire à Canet-en-Roussillon et l’un des plus grands contributeurs mondiaux du Wikipédia francophone, nous révèle la bataille secrète en cours.
La fiabilité est en effet une question centrale de l’intelligence artificielle. Un nouveau type de site internet vient d’arriver dans la sphère de la désinformation. Il s’agit de sites intégralement produits par IA qui fabriquent des articles à la chaîne sans intervention humaine. Leur seul but : monétiser la fréquentation. On trouve des sites pour amateurs de voitures qui inventent littéralement des véhicules. Presque tous les loisirs sont concernés.
Un site d’information catalan avec des villages qui n’existent pas
Les Pyrénées-Orientales sont également touchées. Depuis son rachat il y a quelques mois, le site d’information « Le Journal Catalan » piège par exemple les touristes avec de faux articles générés automatiquement. On y présente des villages imaginaires, des lacs qui n’existent pas, une histoire locale fictive, à l’image de ces fausses « gravures préhistoriques interdites » dans une grotte de Tautavel… Le tout illustré par des visuels générés par IA sans rapport avec la réalité. Chat GPT lui-même se fait avoir à l’occasion, puisqu’il pioche dans ce média pour certaines réponses. L’IA qui se source dans l’IA aboutit à une consanguinité de la désinformation.
Notre regard change, et puisque tout peut être faux, nous passons de l’art du doute à la mécanique du soupçon. Comme l’explique l’essayiste canadienne Naomi Klein, il est tentant d’utiliser la notion de fake news à la manière d’un Trump, en qualifiant de « fait par IA » ce qui dérange nos convictions, au lieu de chercher la vérité.
Dans un tel contexte, à quelles informations peut-on faire confiance sur internet ?
Grâce à un procédé de vérification des sources ingénieux, Wikipédia jouit d’un taux de fiabilité évalué à 95 %, comparable aux encyclopédies papier. Cela en fait l’une des sources les plus fiables d’internet, avec des erreurs corrigées en moins de 1,30 minute sur les articles les plus consultés.
Mais Wikipédia est assailli. Jusque-là, les « patrouilleurs » de l’encyclopédie en ligne luttaient contre un vandalisme d’origine humaine, en particulier pour tous les sujets liés aux théories complotistes. Au point que des articles trop attaqués devaient être « figés » pour stopper la menace. Depuis peu, c’est à l’intelligence artificielle qu’ils sont confrontés.
Fabricio Cárdenas est l’un des plus gros contributeurs au monde du Wikipédia francophone, et l’un des 140 administrateurs mondiaux de l’encyclopédie. Bibliothécaire à Canet-en-Roussillon, il est très attentif au devenir de ce projet collectif qu’est l’encyclopédie en ligne.
« Avant même le contenu des articles, on a commencé à voir arriver l’IA avec les statistiques de consultation. »
C’est bien simple, la fréquentation s’effondre. D’abord parce que Google s’est transformé en moteur de réponse plutôt qu’en moteur de recherche, diminuant le recours à l’encyclopédie. Mais désormais à cause de l’IA. « La deuxième chute, elle arrive maintenant. Et là c’est beaucoup plus important. » Rien qu’en 2025, Wikipédia voit une baisse de 10 à 15 % de son trafic. « Les gens n’utilisent même plus Google, ils demandent directement à Chat GPT ou Gemini. »
Chat GPT produit des sources « pour faire plaisir »
Des réponses qui souvent ne donnent pas leur source. « Pour avoir beaucoup testé Chat GPT, quand on lui demande une source, il donne un lien vers un article. Et quand je remarque que l’article n’existe pas, il répond qu’il a donné une source car cela semblait me faire plaisir… » Le sujet inquiète les « wikipédiens », ces membres actifs de l’encyclopédie. « Certains se demandent si on va disparaître. Si on va servir encore à quelque chose. »
Les intelligences artificielles se réfèrent à Wikipédia pour près de 50 % de leurs éléments de réponse, ce qui peut sembler rassurant. « C’est là que c’est paradoxal. Le problème est que les IA n’ont pas de hiérarchie des sources, contrairement à Wikipédia. » L’IA peut déduire que des sources sont plus fiables parce qu’elles davantage citées, même s’il s’agit de conspirations. Et le tout varie d’une intelligence artificielle à l’autre. « Si on prend Grok de Twitter, il pioche absolument n’importe où. »
Quand les robots ont des tics de langage
Le nouveau phénomène, remarqué depuis moins d’un an et accentué depuis six mois, ce sont les articles rédigés par IA que des contributeurs tentent de glisser dans Wikipédia. « On en a tous les jours. Au début, on supprimait tout de manière impitoyable. »
Même si le contenu semble vrai, Wikipédia doit rester écrit par des humains. Le risque d’obtenir des « hallucinations », à savoir les erreurs commises par les IA, serait délétère. Mais c’est aussi le risque de perdre une traçabilité, et donc la vérifiabilité de ce qui est écrit. En revanche, les wikipédiens tolèrent l’utilisation de robots pour rédiger des brouillons d’articles, s’ils sont ensuite vérifiés.
Jusque-là, les patrouilleurs de l’encyclopédie repéraient la rédaction par IA grâce à des tics de langage propres aux robots. « Mais très vite les gens se sont mis à demander aux IA d’écrire ‘dans le style de Wikipédia’ et ça devient de plus en plus difficile de les repérer. » C’est une véritable course à la technologie, avec l’usage de logiciels toujours plus fins pour traquer les articles générés.
« Aujourd’hui, on ne peut plus supprimer tout ce qui est fait par IA tant il y en a. C’est un tsunami. Des contributeurs se mettent à créer des articles toutes les 5 minutes, c’est évident qu’il y a quelque chose qui les aide. »
300 patrouilleurs pour 2,5 millions d’articles
Wikipédia compte à peine 300 patrouilleurs dans le monde pour surveiller deux millions et demi d’articles. Quant aux administrateurs, ils ont chuté de 160 à 140 en trois ans. « On a vécu une époque où internet était écrit exclusivement par des humains. Tout est en train d’être pollué par des contenus écrits par IA. » Et le niveau de qualité n’est plus le même.
« Il y a une dégradation du contenu. L’humain est nettement meilleur, il a un regard critique que n’aura jamais l’IA. Est-ce qu’il ne faudrait pas faire une photographie d’internet aujourd’hui, qu’on garderait pour archive, tant que le contenu est en bon état ? »
L’encyclopédie résiste encore à la vague. Mais pour combien de temps ? « Si plus personne ne nous lit, plus personne ne nous fera de don, et on ne vit que des dons. » Les administrateurs réfléchissent déjà à changer de modèle et restreindre l’accès à la contribution aux personnes s’étant inscrit avec un compte, même si c’est opposé à la philosophie de départ qui voulait que tout le monde participe à la transmission de la connaissance. « On revient en arrière sur ce rêve, je trouve ça dommage. »
Made In Perpignan est un média local, sans publicité, appartenant à ses journalistes. Chaque jour, nous enquêtons, vérifions et racontons les réalités sociales, économiques et environnementales des Pyrénées-Orientales.
Cette information locale a un coût. Et pour qu’elle reste accessible à toutes et tous, sans barrière ni influence, nous avons besoin de votre soutien. Faire un don, c’est permettre à une presse libre de continuer à exister, ici, sur notre territoire.
- Vies professionnelles en mutation dans les Pyrénées-Orientales : nos entreprises sous perfusion d’IA - 21 août 2025
- Quand les machines se font créatrices : quel avenir pour les artistes humains ? - 20 août 2025
- L’intelligence artificielle au cœur d’une guerre des sources : un administrateur Wikipédia des Pyrénées-Orientales témoigne - 19 août 2025