Des phrases complexes et inconnues font travailler plus fort le réseau linguistique du cerveau, révèle une étude
Avec l'aide d'un réseau de langage artificiel, les neuroscientifiques du MIT ont découvert quels types de phrases sont les plus susceptibles de déclencher les principaux centres de traitement du langage du cerveau.
La nouvelle étude révèle que les phrases plus complexes, soit en raison d'une grammaire inhabituelle, soit d'une signification inattendue, génèrent des réponses plus fortes dans ces centres de traitement du langage. Les phrases très simples engagent à peine ces régions, et les séquences de mots absurdes ne font pas grand-chose non plus pour elles.
Par exemple, les chercheurs ont découvert que ce réseau cérébral était plus actif lors de la lecture de phrases inhabituelles telles que « Les signaux d'achat et de vente restent particuliers », extraites d'un ensemble de données linguistiques accessible au public appelé C4. Cependant, cela devenait silencieux lors de la lecture de quelque chose de très simple, comme « Nous étions assis sur le canapé ».
“L'entrée doit ressembler suffisamment à un langage pour engager le système”, explique Evelina Fedorenko, professeure agrégée de neurosciences au MIT et membre du McGovern Institute for Brain Research du MIT. “Et puis, dans cet espace, si les choses sont vraiment faciles à traiter, alors vous n'avez pas beaucoup de réponse. Mais si les choses deviennent difficiles ou surprenantes, s'il y a une construction inhabituelle ou un ensemble de mots inhabituels que vous êtes en train de faire.” peut-être pas très familier, alors le réseau doit travailler plus dur.
Fedorenko est l'auteur principal de l'étude, qui paraît aujourd'hui dans Comportement humain. Greta Tuckute, étudiante diplômée du MIT, est l'auteur principal de l'article.
Langage de traitement
Dans cette étude, les chercheurs se sont concentrés sur les régions de traitement du langage trouvées dans l'hémisphère gauche du cerveau, qui comprend l'aire de Broca ainsi que d'autres parties des lobes frontaux et temporaux gauches du cerveau.
“Ce réseau linguistique est très sélectif en fonction de la langue, mais il est plus difficile de comprendre ce qui se passe dans ces régions linguistiques”, explique Tuckute. “Nous voulions découvrir quels types de phrases, quels types d'entrées linguistiques animent le réseau linguistique de l'hémisphère gauche.”
Les chercheurs ont commencé par compiler un ensemble de 1 000 phrases provenant d’une grande variété de sources : fiction, transcriptions de mots parlés, textes Web et articles scientifiques, entre autres.
Cinq participants humains lisaient chacune des phrases tandis que les chercheurs mesuraient l'activité de leur réseau linguistique à l'aide de l'imagerie par résonance magnétique fonctionnelle (IRMf). Les chercheurs ont ensuite introduit ces mêmes 1 000 phrases dans un grand modèle de langage – un modèle similaire à ChatGPT, qui apprend à générer et à comprendre le langage en prédisant le mot suivant dans d’énormes quantités de texte – et ont mesuré les modèles d’activation du modèle en réponse à chaque phrase.
Une fois qu'ils disposaient de toutes ces données, les chercheurs ont formé un modèle de cartographie, appelé « modèle de codage », qui relie les modèles d'activation observés dans le cerveau humain avec ceux observés dans le modèle de langage artificiel. Une fois formé, le modèle pourrait prédire comment le réseau du langage humain réagirait à toute nouvelle phrase en fonction de la façon dont le réseau du langage artificiel répondrait à ces 1 000 phrases.
Les chercheurs ont ensuite utilisé le modèle de codage pour identifier 500 nouvelles phrases qui généreraient une activité maximale dans le cerveau humain (les phrases « drive »), ainsi que des phrases qui susciteraient une activité minimale dans le réseau linguistique du cerveau (les phrases « supprimer ») .
Dans un groupe de trois nouveaux participants humains, les chercheurs ont découvert que ces nouvelles phrases stimulaient et supprimaient effectivement l'activité cérébrale comme prévu.
“Cette modulation en boucle fermée de l'activité cérébrale pendant le traitement du langage est nouvelle”, explique Tuckute. “Notre étude montre que le modèle que nous utilisons (qui cartographie les activations du modèle de langage et les réponses cérébrales) est suffisamment précis pour ce faire. Il s'agit de la première démonstration de cette approche dans des zones cérébrales impliquées dans la cognition de niveau supérieur, telles que le réseau linguistique.
Complexité linguistique
Pour comprendre ce qui fait que certaines phrases stimulent l'activité plus que d'autres, les chercheurs ont analysé les phrases en fonction de 11 propriétés linguistiques différentes, notamment la grammaticalité, la plausibilité, la valence émotionnelle (positive ou négative) et la facilité de visualiser le contenu de la phrase.
Pour chacune de ces propriétés, les chercheurs ont demandé aux participants des plateformes de crowdsourcing d’évaluer les phrases. Ils ont également utilisé une technique informatique pour quantifier la « surprise » de chaque phrase, ou à quel point elle est rare par rapport à d’autres phrases.
Cette analyse a révélé que les phrases avec une surprise plus élevée génèrent des réponses plus élevées dans le cerveau. Ceci est cohérent avec des études antérieures montrant que les gens ont plus de difficulté à traiter les phrases avec une plus grande surprise, disent les chercheurs.
Une autre propriété linguistique en corrélation avec les réponses du réseau linguistique était la complexité linguistique, qui est mesurée par la mesure dans laquelle une phrase adhère aux règles de la grammaire anglaise et par sa plausibilité, c'est-à-dire le sens que le contenu a, en dehors de la grammaire.
Les phrases aux deux extrémités du spectre – soit extrêmement simples, soit si complexes qu’elles n’ont aucun sens – évoquaient très peu d’activation dans le réseau linguistique. Les réponses les plus nombreuses provenaient de phrases qui ont un certain sens mais nécessitent du travail pour les comprendre, comme « Jiffy Lube of—of therapies, yes », qui provient de l'ensemble de données Corpus of Contemporary American English.
“Nous avons découvert que les phrases qui suscitent la plus grande réponse cérébrale ont une grammaire étrange et/ou une signification étrange”, explique Fedorenko. “Il y a quelque chose d'un peu inhabituel dans ces phrases.”
Les chercheurs envisagent maintenant de voir s’ils peuvent étendre ces résultats aux locuteurs de langues autres que l’anglais. Ils espèrent également explorer quels types de stimuli peuvent activer les régions de traitement du langage dans l'hémisphère droit du cerveau.
Plus d'information:
Greta Tuckute et al, Piloter et supprimer le réseau de langage humain à l'aide de grands modèles de langage, Comportement humain (2024). DOI : 10.1038/s41562-023-01783-7
Fourni par le Massachusetts Institute of Technology
Citation: Des phrases complexes et inconnues font travailler plus fort le réseau linguistique du cerveau, révèle une étude (3 janvier 2024) récupéré le 3 janvier 2024 sur
Ce document est soumis au droit d'auteur. En dehors de toute utilisation équitable à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.