
Rendre les modèles de prédiction génétique plus inclusifs
Dans le but de rendre les scores de risque polygénique plus inclusifs, les chercheurs du MIT ont créé un nouveau modèle qui prend en compte les informations génétiques provenant de personnes d’origines génétiques plus diverses. Crédit : José-Luis Olivares, MIT
Alors que deux génomes humains sont identiques à environ 99,9 %, la variation génétique dans les 0,1 % restants joue un rôle important dans la diversité humaine, notamment dans le risque de développer certaines maladies.
La mesure de l’effet cumulatif de ces petites différences génétiques peut fournir une estimation du risque génétique d’un individu pour une maladie particulière ou de sa probabilité de posséder un trait particulier. Cependant, la majorité des modèles utilisés pour générer ces « scores polygéniques » sont basés sur des études réalisées auprès de personnes d’origine européenne et n’évaluent pas avec précision le risque pour les personnes d’ascendance non européenne ou les personnes dont le génome contient un mélange de régions chromosomiques héritées. issus de populations auparavant isolées, également connues sous le nom d’ascendance mixte.
Dans le but de rendre ces scores génétiques plus inclusifs, les chercheurs du MIT ont créé un nouveau modèle qui prend en compte les informations génétiques provenant de personnes issues d’une plus grande diversité d’ascendances génétiques à travers le monde. En utilisant ce modèle, ils ont montré qu’ils pouvaient augmenter la précision des prédictions basées sur la génétique pour une variété de traits, en particulier pour les personnes issues de populations traditionnellement sous-représentées dans les études génétiques.
“Pour les personnes d’ascendance africaine, notre modèle s’est avéré être environ 60 % plus précis en moyenne”, déclare Manolis Kellis, professeur d’informatique au laboratoire d’informatique et d’intelligence artificielle (CSAIL) du MIT et membre du Broad Institute of MIT. et Harvard. “Pour les personnes ayant des antécédents génétiques mixtes en général, qui ont été exclues de la plupart des modèles précédents, la précision de notre modèle a augmenté en moyenne d’environ 18 %.”
Les chercheurs espèrent que leur approche de modélisation plus inclusive pourrait contribuer à améliorer les résultats de santé d’un plus large éventail de personnes et à promouvoir l’équité en matière de santé en diffusant plus largement les avantages du séquençage génomique à travers le monde.
“Ce que nous avons fait, c’est créer une méthode qui vous permet d’être beaucoup plus précis pour les individus mélangés et d’ascendance diversifiée, et de garantir que les résultats et les avantages de la recherche en génétique humaine soient partagés également par tout le monde”, a déclaré Yosuke Tanigawa, postdoctorant au MIT. auteur principal et co-correspondant de l’article, qui paraît aujourd’hui sous forme en libre accès dans le Journal américain de génétique humaine. Les chercheurs ont rendu toutes leurs données accessibles au public pour que la communauté scientifique au sens large puisse les utiliser.
Des modèles plus inclusifs
Les travaux s’appuient sur le projet Génome humain, qui a cartographié tous les gènes présents dans le génome humain, et sur des études de cohorte ultérieures à grande échelle sur la façon dont les variantes génétiques du génome humain sont liées au risque de maladie et à d’autres différences entre les individus. .
Ces études ont montré que l’effet de toute variante génétique individuelle est généralement très faible. Ensemble, ces petits effets s’additionnent et influencent le risque de développer une maladie cardiaque ou un diabète, d’avoir un accident vasculaire cérébral ou de recevoir un diagnostic de troubles psychiatriques tels que la schizophrénie.
“Nous avons des centaines de milliers de variantes génétiques associées à des traits complexes, dont chacune joue individuellement un faible effet, mais ensemble, elles commencent à être prédictives des prédispositions aux maladies”, explique Kellis.
Cependant, la plupart de ces études d’association à l’échelle du génome incluaient peu de personnes d’origine non européenne, de sorte que les modèles de risque polygénique basés sur celles-ci se traduisent mal dans les populations non européennes. Les personnes de différentes zones géographiques peuvent présenter différents modèles de variation génétique, façonnés par la dérive stochastique, l’histoire de la population et des facteurs environnementaux. Par exemple, chez les personnes d’ascendance africaine, les variantes génétiques qui protègent contre le paludisme sont plus courantes que dans d’autres populations.
Ces variantes affectent également d’autres caractéristiques impliquant le système immunitaire, telles que le nombre de neutrophiles, un type de cellule immunitaire. Cette variation ne serait pas bien capturée dans un modèle basé uniquement sur l’analyse génétique de personnes d’ascendance européenne.
“Si vous êtes une personne d’origine africaine, d’origine latino-américaine ou asiatique, alors vous êtes actuellement exclu du système”, déclare Kellis. “Cette inéquité dans l’utilisation de l’information génétique pour prédire le risque des patients peut entraîner un fardeau inutile, des décès inutiles et un manque inutile de prévention, et c’est là que notre travail entre en jeu.”
Certains chercheurs ont commencé à tenter de remédier à ces disparités en créant des modèles distincts pour les personnes d’origine européenne, africaine ou asiatique. Ces approches émergentes attribuent les individus à des groupes d’ascendance génétique distincts, regroupent les données pour créer un résumé d’association et créent des modèles de prédiction génétique. Cependant, ces approches ne représentent toujours pas bien les personnes ayant des antécédents génétiques mixtes.
“Notre approche s’appuie sur les travaux antérieurs sans obliger les chercheurs à attribuer des individus ou des segments génomiques locaux d’individus à des groupes d’ascendance génétique distincts prédéfinis”, explique Tanigawa. “Au lieu de cela, nous développons un modèle unique pour tout le monde en travaillant directement sur les individus tout au long du continuum de leurs ancêtres génétiques.”
En créant leur nouveau modèle, l’équipe du MIT a utilisé des techniques informatiques et statistiques qui leur ont permis d’étudier le profil génétique unique de chaque individu au lieu de regrouper les individus par population. Cette avancée méthodologique a permis aux chercheurs d’inclure des personnes d’ascendance mixte, qui représentaient près de 10 % de l’ensemble de données de la biobanque britannique utilisée pour cette étude et représentent actuellement environ un nouveau-né sur sept aux États-Unis.
“Comme nous travaillons au niveau individuel, il n’est pas nécessaire de calculer des données récapitulatives pour différentes populations”, explique Kellis. “Ainsi, nous n’avons pas eu besoin d’exclure les individus d’ascendance mixte, augmentant ainsi notre pouvoir en incluant davantage d’individus et en représentant les contributions de toutes les populations dans notre modèle combiné.”
De meilleures prédictions
Pour créer leur nouveau modèle, les chercheurs ont utilisé les données génétiques de plus de 280 000 personnes, collectées par UK Biobank, une base de données biomédicale à grande échelle et une ressource de recherche contenant des informations anonymisées sur la génétique, le mode de vie et la santé d’un demi-million de participants britanniques. .
En utilisant un autre ensemble d’environ 81 000 individus de la UK Biobank, les chercheurs ont évalué leur modèle sur 60 traits, qui comprenaient des traits liés à la taille et à la forme du corps, tels que la taille et l’indice de masse corporelle, ainsi que des traits sanguins tels que le blanc. le nombre de cellules sanguines et le nombre de globules rouges, qui ont également une base génétique.
Les chercheurs ont découvert que par rapport aux modèles formés uniquement sur des individus d’ascendance européenne, les prédictions de leur modèle sont plus précises pour tous les groupes d’ascendance génétique. Le gain le plus notable concerne les personnes d’ascendance africaine, qui ont montré une amélioration moyenne de 61 %, même si elles ne représentaient qu’environ 1,5 % des échantillons de la biobanque britannique. Les chercheurs ont également constaté des améliorations de 11 % pour les personnes d’origine sud-asiatique et de 5 % pour les Britanniques blancs. Les prévisions pour les personnes d’ascendance mixte se sont améliorées d’environ 18 %.
“Lorsque vous rassemblez tous les individus dans l’ensemble de formation, tout le monde contribue à la formation de la modélisation des scores polygéniques sur un pied d’égalité”, explique Tanigawa. “Combinée à des efforts de collecte de données de plus en plus inclusifs, notre méthode peut aider à tirer parti de ces efforts pour améliorer l’exactitude prédictive pour tous.”
L’équipe du MIT espère que son approche pourra éventuellement être intégrée aux tests du risque individuel de contracter diverses maladies. De tels tests pourraient être combinés avec des facteurs de risque conventionnels et utilisés pour aider les médecins à diagnostiquer une maladie ou pour aider les gens à gérer leur risque de contracter certaines maladies avant qu’elles ne se développent.
“Notre travail met en évidence le pouvoir des efforts de diversité, d’équité et d’inclusion dans le contexte de la recherche en génomique”, déclare Tanigawa.
Les chercheurs espèrent désormais ajouter encore plus de données à leur modèle, y compris des données provenant des États-Unis, et les appliquer à des caractéristiques supplémentaires qu’ils n’ont pas analysées dans cette étude.
“Ce n’est que le début”, dit Kellis. “Nous sommes impatients de voir davantage de personnes se joindre à nos efforts pour promouvoir une recherche inclusive en génétique humaine.”
Plus d’information:
Yosuke Tanigawa et coll., Journal américain de génétique humaine (2023).
Fourni par le Massachusetts Institute of Technology
Cette histoire est republiée avec l’aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l’actualité de la recherche, de l’innovation et de l’enseignement du MIT.
Citation: Rendre les modèles de prédiction génétique plus inclusifs (26 octobre 2023) récupéré le 26 octobre 2023 sur
Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.