Ile Maurice: Alexandre Gefen - «L'intelligence artificielle ne peut pas remplacer l'expérience personnelle de l'écrivain»

Une machine qui lit 10 000 romans en une nuit. Un algorithme qui cartographie la diffusion d'une idée à travers trois siècles de littérature. Un modèle de langage qui résume, traduit, commente - et, parfois, invente. Ce n'est plus de la science-fiction : c'est le quotidien d'un nombre croissant de chercheurs. Alexandre Gefen, directeur de recherche au CNRS, pionnier des humanités numériques et auteur d'«Humanités numériques» **(Hermann), apporte un éclairage.

Votre livre, paru chez Hermann, part d'un constat que vous qualifiez d'irréversible : les humanités sont entrées dans l'ère numérique. Mais «irréversible», c'est un mot un peu fort. Est-ce qu'il y a quelque chose que vous regrettez dans ce basculement ?

Les humanités se sont intéressées très tôt aux méthodes numériques, aux méthodes statistiques et elles ont cherché à s'aligner dès le XIXe siècle sur la manière dont les sciences exactes fonctionnaient, en essayant d'avoir des données, des calculs. Ce mouvement n'a pas cessé. Il se dirige vers l'analyse quantitative, vers l'objectivation, vers l'expérimentation. Et c'est un mouvement qui s'est exprimé fortement dans ce qu'on appelait les humanités numériques, à savoir les méthodes utilisant un ordinateur pour analyser le savoir. Et ces humanités numériques avec l'intelligence artificielle (IA) deviennent peut-être des humanités artificielles. C'est un mouvement qui me semble tout à fait inscrit dans la très longue durée de l'histoire des savoirs.

Suivez-nous sur WhatsApp | LinkedIn pour les derniers titres

Ensuite, la question de savoir si on regrette ou si on approuve ce mouvement, et de savoir si à côté de cela on va maintenir un rapport humaniste au savoir, au texte, à la transmission - mon domaine, c'est la littérature, mais je travaille plus largement sur des enjeux de philosophie et d'histoire des idées. Ce qui importe pour moi, c'est que l'ensemble des textes soient à un moment lus, que le rapport à une parole, à un savoir lointain, soit conservé, et pas seulement une sorte de purée algorithmique de ce qu'on a pensé au XIe siècle. J'ai envie qu'on lise les auteurs, j'ai envie qu'on entende leur voix singulière, parce qu'il est fondamental dans la culture humaniste de construire un rapport fondé sur la communication, l'examen critique, la discussion intellectuelle avec les penseurs qui nous ont précédés. Il faut être vigilant à conserver ce rapport incarné, personnel, humain, cette inscription du chercheur dans l'histoire et dans un rapport à une personne en particulier, pas seulement à un algorithme.

Étienne Klein, physicien et philosophe des sciences, avance que l'IA «n'est pas intelligente - elle mime l'intelligence d'une façon qui est spectaculaire». Selon lui, la physique moderne, née sans données avec Galilée, a produit ses lois les plus universelles contre l'observation directe. En quoi cette distinction vous semble-t-elle pertinente pour juger ce que l'IA peut ou ne peut pas apporter à la recherche ?

Il y a deux points dans ce que vous dites. Le premier, c'est de savoir si l'intelligence d'une machine est une intelligence. Elle mime parfaitement l'intelligence. Toute une série de philosophes, depuis Alan Turing lui-même, l'un des inventeurs de l'IA, ont réfléchi à cette question : peut-on parler d'intelligence pour quelque chose qui mime des processus avec des réseaux de neurones, mais qui n'a pas un rapport réel au monde, seulement un rapport au langage ? Peut-on parler de conscience, de sensibilité, pour l'imitation de processus qui ne sont pas incarnés dans un corps qui peut interagir, qui est ému, qui est frappé par le réel et qui peut rétroagir sur le réel ? C'est un débat philosophique. Remarquez qu'aux États-Unis ou en Angleterre, le terme «intelligence» est beaucoup plus général. En France, l'idée d'une adaptation, d'une subtilité, d'un esprit lui est attachée. Et effectivement, dans le champ culturel français, on peut discuter de l'utilisation de ce terme.

Le deuxième point que vous évoquez, c'est le rapport entre la recherche empirique et la recherche théorique. L'IA n'est capable ni de recherche empirique, parce qu'elle ne peut pas faire d'expérience, ni de recherche théorique, parce qu'elle n'a pas affaire à des raisonnements causaux, abstraits, mais à des mots, à la manière dont les mots s'organisent. Elle peut généraliser à partir des mots, elle peut comprendre ce qu'est la gravité à partir de l'ensemble des manuels de physique, des discours sur la gravité, mais il lui manque deux choses. D'une part, elle ne peut pas faire l'expérience empirique de ce qu'est un objet qui tombe. Yann LeCun, l'un des grands inventeurs des réseaux convolutifs, vous dit qu'un chat en sait beaucoup plus sur la gravité. D'autre part, elle n'a pas de théorie causale, de théorie abstraite de la gravité - elle n'a qu'un enchevêtrement de mots. Et effectivement, pour un physicien, ce sont deux limites fortes.

Blaise Pascal voyait dans l'imagination «cette maîtresse d'erreurs et de faussetés» qui ne distingue pas le vrai du faux - et c'est précisément le reproche qu'on adresse aujourd'hui aux IA génératives. En quoi le fait qu'une machine hallucine est-il philosophiquement différent du fait qu'un être humain imagine ?

Qu'est-ce qu'une hallucination ? C'est le fait que pour une IA, quelque chose peut être vrai par une prédiction sur les mots et non par la réalité. Si vous lui demandez les titres des livres d'Alexandre Gefen, jusqu'à il y a peu, elle m'inventait des livres que j'aurais dû écrire à partir des idées que j'ai eues, mais que je n'ai jamais écrits, simplement parce qu'elle ne peut pas entrer dans une bibliothèque, dans un fichier de bibliothèque. C'est ce qu'on appelle une hallucination. On sait très bien la décrire ; de plus en plus, les IA vont essayer de vérifier sur internet qu'elles n'hallucinent pas, mais elles ont encore une grande propension à halluciner - d'autant plus qu'elles sont entraînées à vous faire plaisir. Elles sont entraînées à répondre toujours positivement à votre question. Elles ne savent pas qu'elles ne savent pas, puisque quelque chose est toujours vrai statistiquement.

Est-ce que c'est ainsi de l'imagination humaine ? C'est une grande question. Tout simplement, j'ai envie de vous répondre que nous ne savons pas vraiment ce qu'est l'imagination humaine. C'est un concept philosophique chez Pascal, c'est un concept en neurosciences aujourd'hui qui mérite examen, sur lequel on fait beaucoup d'expériences, mais on n'a pas de définition très claire. Je ne peux donc pas vous répondre si l'imagination humaine, c'est imaginer des choses qui pourraient être, ou si c'est une autre manière de divaguer que celle des machines.

Gaston Bachelard écrivait que «la pensée scientifique réclame qu'on résiste à la première réflexion» - qu'il faut, en somme, penser contre son cerveau. Comment fait-on pour résister à la première réponse d'un modèle de langage qui, par construction, produit ce qui est le plus probable - c'est-à-dire, souvent, ce qu'on attendait ?

C'est un vrai problème. On a, vous le notez justement, un effet de fascination. En quelques secondes, une réponse qui paraît extrêmement claire, fluide, documentée. On est presque honteux de ne pas avoir su ce que la machine sait. Il y a un effet d'autorité absolue, et pour beaucoup de gens, cet effet va s'étendre jusqu'à des considérations sur leur vie personnelle - leur vie amoureuse, la façon d'éduquer leurs enfants, leurs choix professionnels - parce qu'on se dit : voilà quelque chose qui ne va pas se tromper, voilà un calcul et donc la vérité, et non pas ce que mon voisin, mon meilleur ami m'aura dit. Il faut s'en méfier.

Le savoir que vous donne une IA n'est pas un savoir pur. C'est une construction à partir de ce que les êtres humains ont déjà dit et des règles que les créateurs des IA ont données - ce qu'on appelle les règles d'alignement. Il y a des valeurs éthiques imposées aux IA. Si vous posez une question sur un sujet sensible, la peine de mort, par exemple, vous allez avoir une moyenne de ce que les gens ont dit, et en même temps la position politique des créateurs. Ce n'est pas pareil d'avoir l'IA Grok d'Elon Musk, qui se situe dans le champ politique de la droite américaine, et des IA plus alignées avec des valeurs peut-être plus démocratiques, comme Claude d'Anthropic ou ChatGPT d'OpenAI. Ces réponses vont varier, mais l'effet d'autorité va être le même. D'où la nécessité de réfléchir par soi-même. Et heureusement, de plus en plus d'IA implémentent des processus qui vous exposent un raisonnement critique - la première chose à demander à une IA quand elle vous donne quelque chose, c'est pourquoi elle dit cela, et si on ne peut pas penser le contraire.

Votre ouvrage porte notamment sur la fouille numérique des textes et la lecture à distance : on peut désormais «lire» des milliers de romans simultanément, repérer des structures, des récurrences, des absences. Y a-t-il des questions que seule la lecture lente, patiente, incarnée peut encore poser - et que l'algorithme, par définition, ne posera jamais ?

Il y a plusieurs modalités de lecture. Le grand chercheur Franco Moretti a inventé le concept de lecture à distance à partir du moment où il a constaté que les bibliothèques numériques permettaient de faire des lectures de 1 000, 10 000, 100 000 textes à la fois. C'est une modalité extrêmement intéressante parce qu'elle permet de repérer des régularités, des circulations d'idées, des circulations de métaphores qu'on ne peut pas repérer manuellement. L'IA nous permet de travailler sur la longue durée, sur des motifs culturels de longue durée. Cette lecture à distance s'inscrit dans une réflexion que les historiens ont depuis longtemps, l'École des Annales, Fernand Braudel travaillant sur La Méditerranée sur plusieurs siècles. La machine est formidable pour cela.

En revanche, il existe aussi ce qu'on appelle une lecture de près, une lecture herméneutique qui va essayer de trouver le sens, une lecture philologique qui va essayer d'établir le texte - et celle-là ne peut pas être remplacée. Quand vous voulez commenter un texte, vous devez en faire une lecture extrêmement lente, extrêmement fine, vous devez vous immerger pour mieux le comprendre. Ça, la machine, lorsque vous la faites travailler sur des milliers de textes, elle fait tout à fait autre chose.

Vous avez fondé Fabula.org. Que reste-t-il, dans votre travail quotidien de chercheur, que vous refusez de déléguer à une machine - et pourquoi ?

Vous posez une question extrêmement importante. Je suis né en 1970, j'ai connu la première révolution qu'ont été Internet et l'ordinateur ; si j'ai créé Fabula, c'est parce qu'il y a plus de vingt-cinq ans, j'ai découvert la possibilité de faire circuler les idées, les concepts, les travaux beaucoup plus facilement grâce au réseau. Ma génération a été percutée il y a quelques mois par cette nouvelle révolution que sont les modèles de langage. Il y a encore deux ou trois ans, on avait des IA trop maladroites - elles pouvaient à la rigueur remplacer un étudiant. Ensuite, j'ai vu des modèles capables de remplacer des collègues assez moyens pour la revue de littérature. Là, j'ai des IA capables de m'apporter des combinaisons conceptuelles, de l'organisation du savoir et de l'argumentation de très haut niveau. Et depuis quelques mois, avec une nouvelle version de Claude pour ne pas le nommer, j'ai parfois un frisson qui me parcourt. Pour la première fois, j'ai le sentiment que je pourrais être remplacé, du moins dans un ensemble de travaux.

Aussi, j'essaie de garder une hygiène numérique : ne pas me laisser impressionner par l'autorité de l'IA, aller vérifier si c'est solide, si je peux moi-même internaliser ce qu'elle me dit. Pour le moment, je veux garder la main sur l'écriture, sur la conception et la proposition générale, sur tout ce qui est échange scientifique. Mais, par exemple, pour faire de la synthèse, je peux donner la main à une IA en vérifiant les résultats - pour me proposer des contre-argumentations, aller chercher les angles, combiner deux espaces conceptuels. Ça fonctionne très bien, parce que les modèles de langage sont tout à fait capables de faire ce type de transfert.

La numérisation du patrimoine - les corpus de Gallica, Google Books, les éditions numériques de textes - a rendu possible des pratiques comme la lecture à distance, la fouille de textes, la cartographie littéraire. Mais Anne Alombert, dans son livre intitulé «De la bêtise artificielle**»****,** met en garde : ces systèmes vont incorporer «des représentations, des valeurs, des cadres de pensée spécifiques liés à des entreprises et des nations». Quand un chercheur interroge un corpus numérisé avec des outils algorithmiques, est-il encore maître de ses questions ?

Il y a deux types de biais à distinguer. Le premier se situe au niveau des corpus. Quand vous interrogez Gallica, la grande bibliothèque de la Bibliothèque nationale de France, vous n'avez pas affaire à de l'IA - c'est un moteur de recherche. Mais le moteur de recherche a ses biais, et surtout, il y a un biais dans ce qui a été numérisé : c'est le fait que tel conservateur ait voulu numériser tel texte, que le manuscrit était accessible, en bon état, que son format permettait la numérisation. Construire un ensemble de données, ce n'est jamais neutre. Les données qui servent d'entraînement aux intelligences artificielles sont à 80 % de l'anglais ; elles sont réunies parce que c'est le plus facile à trouver, le moins cher, parce que les fournisseurs d'IA n'achètent pas nécessairement les droits de Harvard University Press.

Ensuite, il y a un second niveau de biais - celui que dénonce Anne Alombert. Il est lié au fait que ces IA sont situées : en Californie, dans un monde anglo-saxon avec ses systèmes de valeurs. Comme je vous l'expliquais, les données que vous donne l'IA ont été corrigées, alignées à des systèmes de valeurs. Quand vous avez un résultat, vous incorporez des biais culturels qui viennent du monde anglo-saxon contemporain et des biais politiques qui viennent des fabricants des IA.

Anne Alombert avertit également d'un «risque de conditionnement de nos esprits» : une prise de pouvoir sur le langage qui est aussi une prise de pouvoir sur nos manières de penser. Ce risque est-il nouveau, ou y avons-nous toujours été exposés sans le savoir ?

Il y a clairement un risque de normalisation. Quand sur WhatsApp on vous propose une réponse déjà prête à écrire et que vous n'avez plus qu'à appuyer sur «envoyer», quand votre outil d'assistance vous propose des réécritures, il y a un effet de normalisation, de moyennisation de la langue. On risque d'avoir tous la même manière de penser, la même manière de discuter. Nos vies algorithmiques pourraient être normalisées : pour partir en vacances, on va tous utiliser Claude, et Claude va recommander les mêmes choses à tout le monde. Il y a un vrai risque de normativité par la moyenne.

Mais cette normativité, est-elle totalement nouvelle ? Bien sûr que non. Le langage, c'est toujours une norme, c'est toujours un système idéologique. Dans les années 1970, Roland Barthes criait contre le langage comme machine normative. Il disait que le langage parlait sans notre contrôle. Et effectivement, le langage est de fait une machine normative dont notre forme d'expression personnelle, dont la forme d'expression des écrivains, va essayer de sortir ou de transformer.

Étienne Klein s'inquiète moins de la concurrence de l'IA que de l'appauvrissement du langage qu'elle pourrait entraîner : «Est-ce qu'on va parler comme des machines ?» Pour un spécialiste de littérature, cette question est-elle anecdotique ou touche-t-elle à quelque chose de fondamental dans ce que signifie penser ?

Il faut s'en méfier. On a commencé à observer que les gens répètent des tics de langage de ChatGPT dans leurs conversations courantes. Et par ailleurs, cet appauvrissement va venir des machines elles-mêmes : les contenus sur internet étant de plus en plus produits par des machines, les machines s'entraînant sur ces contenus, les modèles vont s'entraîner sur d'autres modèles, à l'infini. C'est ce qu'on appelle la possibilité d'un model collapse. C'est comme si vous traduisiez un texte dans une langue, puis dans une autre, puis dans une autre, dans un circuit fermé. Il y a effectivement un danger d'appauvrissement, de dérive vers un langage simplifié et fortement biaisé.

Par ailleurs, nous ne pouvons pas renoncer à nous entraîner à parler par nous-mêmes, parce que la pensée se niche dans le langage. Il n'y a pas de pensée sans langage - ou très peu. Il faut être extrêmement prudent à l'idée d'avoir de nouvelles générations qui ne vont pas apprendre ce que c'est que synthétiser, que se traduire, que renverser un argument de manière critique. Ce sont des opérations fondamentales. Imaginez que nos sociétés aient décidé de tout faire en voiture : on aurait une atrophie musculaire. Heureusement, on continue à marcher. Eh bien, je pense qu'on va être obligés de faire du jogging critique : nous allons beaucoup utiliser les IA, mais de temps en temps, on aura des séances d'hygiène numérique où on réapprendra à penser et à raisonner par nous-mêmes.

Une étude du MIT de 2025 montre que l'utilisation de ChatGPT pour des tâches d'écriture réduit la connectivité cérébrale de près de 55 %. Anne Alombert parle de «dette cognitive». Dans vos conférences, vous défendez l'idée d'une hygiène mentale face à l'IA. Concrètement, à quoi ressemble cette hygiène pour un chercheur en lettres en 2026 ?

Elle consiste à être vigilant à ne pas perdre ses muscles - un peu comme quelqu'un qui s'achète un vélo électrique doit quand même faire attention à sa forme. J'utilise intensément les IA, mais en même temps, je m'oblige à faire toute une série de choses par moi-même : traduire par moi-même un message sur trois, sur cinq, rédiger les messages les plus importants, les plus stratégiques. Je m'impose de revoir, d'internaliser lentement, de ralentir. Et lorsque je demande à une IA de résumer une quantité de textes, je m'impose de lire quand même de près certains passages, et dans certains cas de renoncer complètement au résumé algorithmique pour lire pleinement moi-même - parce que c'est souvent dans les détails, dans la phrase même, dans la manière dont elle sonne, dans la démarche précise d'une pensée que se trouvent les choses les plus intéressantes, et pas seulement dans le résumé.

Le philosophe allemand Günther Anders parlait de «honte prométhéenne» - cette honte qui s'empare de l'homme devant l'humiliante qualité des choses qu'il a lui-même fabriquées. Le champion du monde de Go battu par une machine est tombé en dépression. Est-ce que le chercheur en humanités qui voit une IA lire 10 000 romans en une nuit ressent quelque chose de cet ordre ?

Il y a un moment de honte prométhéenne, je ne peux pas vous le cacher. Lorsque, il y a une semaine, j'ai demandé à une IA d'utiliser tel ou tel texte pour analyser tel ou tel concept, et que j'ai obtenu un travail qui était au-dessus de ce que j'aurais pu faire en une semaine, je vous avoue avoir éprouvé cette honte. Maintenant, les gens continuent à jouer au Go, les gens continuent à jouer aux échecs. Il y a un après cette honte prométhéenne. Les joueurs d'échecs ont appris depuis plus d'une décennie qu'ils ne pourraient plus jamais gagner contre une machine, mais ils continuent à jouer entre êtres humains. Parfois, ils utilisent les machines pour ouvrir des types de jeux, des stratégies qu'ils n'avaient pas pensées - mais ils jouent entre humains avec l'aide des machines, et ils n'ont pas perdu le plaisir de jouer. Je pense qu'il y a un après la dépression et après la honte prométhéenne.

Dan Banik, professeur à l'université d'Oslo, souligne que les outils d'IA les plus utiles sont ceux qui «s'adaptent aux langues et aux contextes locaux». Or les grands corpus qui alimentent les modèles de langage sont à 90 % en anglais. Comment rendre visibles, dans ce patrimoine numérique mondial, les littératures, les mémoires et les traditions intellectuelles qui n'ont pas encore été numérisées - ou qui l'ont été selon des critères qui ne sont pas les leurs ?

Vous avez tout à fait raison. L'IA est un enjeu géopolitique, et il y a un danger de colonialisme numérique, de néocolonialisme numérique. J'ai commenté les enjeux de l'IA en Afrique, à La Réunion, dans de nombreux pays - il y a une vulnérabilité réelle par rapport à ces systèmes, par rapport au type de savoir, au type de référence, au type d'échange culturel qu'ils véhiculent. Je ne suis pas sûr que la manière dont on discute à l'île Maurice soit exactement la même qu'en Californie. Il faut être vigilant, en particulier pour tout ce qui concerne notre vie personnelle, nos relations, notre éducation.

Par ailleurs, on commence à voir des modèles de langage ouverts qui sont des alternatives aux grands modèles de la Silicon Valley. Certains sont produits par la Chine, avec une stratégie d'ouverture des modèles. D'autres sont produits par la France - Mistral, par exemple. D'autres encore par des scientifiques eux-mêmes, des modèles plus petits, adaptés à des contextes culturels différents, qu'on peut personnaliser, entraîner. On pourrait imaginer de personnaliser un modèle pour qu'il ait une pensée plus proche des manières de vivre et de s'exprimer du monde créole, par exemple. Au CNRS, il y a eu des tentatives de développer des modèles entraînés sur des langues africaines. Il n'est pas totalement impossible d'être vigilant contre l'homogénéisation culturelle et linguistique.

Dans le débat sur l'écriture littéraire, vous avez dit qu'aucune IA ne peut remplacer un grand écrivain, parce qu'un écrivain a «une expérience du monde, une originalité, une intention». Mais à l'heure où l'IA peut imiter Proust ou générer une partie d'un roman primé au Japon, que reste-t-il de la notion d'auteur ?

L'affaire que vous évoquez - cette romancière japonaise qui a eu le prix Akutagawa - a utilisé l'IA pour 5 % de son roman. On a récemment mis en cause la Prix Nobel polonaise Olga Tokarczuk d'avoir utilisé l'IA ; elle a expliqué s'en servir parfois pour la documentation. L'IA n'est pas capable de faire encore un grand roman, pour des raisons à la fois technologiques - elle n'est pas capable d'avoir une écriture longue qui prenne en compte des personnages complexes - et parce qu'elle ne peut pas remplacer l'expérience d'un être humain, ce qu'il apporte de nouveau.

Pourquoi s'intéresse-t-on à un écrivain ? Parce qu'il écrit quelque chose qui n'a jamais été écrit. On n'a pas envie de relire pour la centième fois une nouvelle de Scott Fitzgerald. L'IA, elle fait des moyennes - comment voulez-vous qu'elle innove à partir du moment où elle est conditionnée à faire des moyennes ? Elle peut être un outil pour la documentation, pour des variations dans une formule. Mais ça ne remplace pas l'intention, la sensibilité, l'incarnation d'un écrivain. L'IA n'est pas sensible, elle n'a pas d'histoire personnelle, pas de désir, pas peur de la mort, pas envie de séduire. Il lui manque beaucoup de choses.

Dernière question : demain, un livre entièrement généré par une IA pourrait-il remporter le Goncourt - et si cela arrivait, qu'est-ce que cela changerait à notre définition de la littérature ?

Ce n'est pas possible techniquement, ce n'est pas possible sur le fond. On peut gagner un prix de nouvelles à la rigueur, sur des thèmes stéréotypés. On ne peut pas encore gagner un prix Nobel avec une IA pure. En revanche, que des collaborations de plus en plus fréquentes entre auteurs et IA changent déjà notre idée de la littérature - ça, oui. Pourquoi ? Parce que la littérature, contrairement au cinéma, est un art dans lequel on écrit seul. On n'a pas d'atelier d'artiste comme en peinture, pas d'orchestre comme en musique. C'est un art très individuel, et donc très chamboulé par l'idée que la collaboration puisse y rentrer. Cette vision de l'auteur inspiré a déjà été bousculée par l'idée qu'on n'écrit jamais ex nihilo, qu'on est toujours influencé. Mais je crois qu'effectivement, cela peut nous conduire à interroger le concept d'auteur, mais aussi le concept d'oeuvre, le concept de style. Pour moi qui suis d'origine littéraire, il va falloir les repenser à l'heure de l'IA.

Lire l'article original sur L'Express.