
Une nouvelle méthode révèle des variations génétiques cachées
Aperçu schématique des événements génétiques identifiés par Chameleolyser. Les régions R1 et R2 sont deux régions avec une identité de séquence très élevée. En panneaux un, b et c ces deux régions sont complètement identiques (Seq. Id = 100%). En conséquence, les lectures qui s’alignent sur ces régions auront des qualités de mappage de 0 (lorsqu’aucun masquage n’est appliqué). Pour l’indiquer, les lectures sont affichées en blanc. Dans Chameleolyser, les lectures sont extraites et réalignées sur une séquence de référence dans laquelle R2 est masqué. En conséquence, les lectures s’alignent uniquement sur R1 et auront des scores de mappage différents de 0. Ceci est indiqué en les représentant en gris. En appliquant une variante sensible faisant appel à cet alignement masqué, Chameleolyser est capable d’identifier des variantes de nucléotide unique et de petits indels (SNV/Indels ; puce verte dans le panneau b). Néanmoins, la position exacte de la variante reste ambiguë, c’est pourquoi nous les avons appelées VAP (variante à position ambiguë). Dans le cas où R1 et R2 sont identiques en séquence, Chameleolyser limite l’identification des délétions homozygotes aux événements dans lesquels R1 et R2 sont tous deux supprimés (panel c). Panneaux d, e et F illustrent les scénarios dans lesquels R1 et R2 ne sont pas complètement identiques (Seq. Id ≠ 100 %). Les trois positions dans lesquelles R1 diffère de R2 sont indiquées par une puce colorée. Étant donné que les lectures qui s’alignent sur ces régions auront des qualités de cartographie suffisamment bonnes, l’identification de SNV/Indels réguliers ne pose pas de problème pour les pipelines d’analyse de données standard. Néanmoins, les SNV/Indels résultant d’une conversion génique restent généralement non identifiés. En considérant uniquement le profil de couverture de R1, une conversion génique ectopique et une délétion semblent identiques (panels e et F). Chameleolyser prend également en compte la couverture au locus R2. En conséquence, les conversions génétiques peuvent être distinguées des délétions. En effet, en cas de conversion génique ectopique, les lectures provenant du site accepteur s’aligneront sur la séquence de référence du site donneur, ce qui entraînera une couverture de séquençage accrue par opposition au scénario dans lequel aucune conversion génique n’est présente. Crédit: Communications naturelles (2023). DOI : 10.1038/s41467-023-42531-9
De nombreuses variations génétiques cachées peuvent être détectées grâce au Chameleolyser, une nouvelle méthode développée à Nimègue. Ces informations permettent déjà de diagnostiquer de nouveaux patients et pourraient également conduire à la découverte de gènes de maladies encore inconnus, écrivent Wouter Steyaert et Christian Gilissen de Radboudumc dans Communications naturelles.
La science médicale utilise le séquençage de l’exome depuis environ 15 ans pour cartographier les gènes de patients individuels atteints de maladies rares. Avec cette technique, l’ADN d’environ 20 000 gènes humains d’une personne est découpé en petits morceaux afin que les lettres d’ADN puissent être lues. Cela crée une énorme quantité de minuscules fragments d’ADN, qui sont ensuite réassemblés en gènes entiers comme un puzzle. Le résultat est un aperçu des 20 000 gènes de cette seule personne.
“Malheureusement, un tel aperçu n’est jamais tout à fait complet”, déclare Christian Gilissen, professeur de bioinformatique du génome. “Cela est dû à l’évolution de notre génome, de notre matériel héréditaire. Lors de la copie d’ADN, les choses tournent parfois mal. De petits morceaux d’ADN disparaissent ou sont ajoutés. Certains morceaux sont copiés plus d’une fois.”
“Il arrive aussi qu’un gène copié soit placé ailleurs dans le génome, ce qui donne un pseudogène en plus du gène d’origine. Ces “négligences” génétiques sont très importantes car elles sont le moteur de l’évolution. C’est ainsi que surviennent les changements génétiques. Des changements qui peuvent être sans effet ou bénéfiques, mais parfois aussi provoquer de nouvelles maladies. »
Des pseudogènes déroutants
Zoom sur le gène et les pseudogènes un instant. Le gène a une fonction, le pseudogène n’en a généralement pas. Au fil du temps, de petits changements, des mutations, peuvent survenir à la fois dans le gène et dans le pseudogène. Mais le gène et le pseudogène sont si similaires que lors du séquençage, il n’est pas clair quelle partie appartient au gène et laquelle appartient au pseudogène.
Gilissen explique : « Pour cette raison, ces régions d’ADN ne sont pas incluses dans l’analyse. Une mutation trouvée peut provenir du pseudogène et n’avoir aucune signification. Si vous ajoutez cette mutation au gène normal, vous poserez un diagnostic erroné. je ne veux pas de ça.”
Rendre visible l’invisible
Avec Wouter Steyaert, Gilissen a développé une méthode, Chameleolyser, qui détecte les combinaisons de gènes et de pseudogènes dans les données de séquençage d’exome existantes et peut également visualiser les variations génétiques entre elles.
Steyaert déclare : « Nous détectons désormais de nombreuses variations génétiques qui étaient auparavant invisibles. Par exome, nous trouvons une soixantaine de variantes génétiques supplémentaires. Pour un certain nombre de personnes, ces données nous ont permis de déterminer définitivement la cause de leur maladie. Avec une nouvelle technique de séquençage de PacBio, qui analyse des séquences d’ADN plus longues, nous avons établi la fiabilité de notre méthode.
La nouvelle méthode est intéressante car elle peut être appliquée à des données de séquençage d’exome déjà existantes. Ainsi, aucune nouvelle étude chez les patients n’est nécessaire. N’importe quel centre de séquençage dans le monde peut appliquer cette méthode.
“Une analyse à si grande échelle peut également fournir de nouvelles informations biologiques”, explique Gilissen. “Dans de nombreux troubles, la cause génétique ne peut être déterminée que chez la moitié des patients. Nous pensons que nous trouverons également de nouveaux gènes de maladie dans ces combinaisons gène-pseudogène. Pour certains de ces patients, c’est peut-être là que réside la cause génétique de leur maladie. mensonges.”
Plus d’information:
Wouter Steyaert et al, L’analyse systématique des régions paralogues dans 41 755 exomes révèle une variation cliniquement pertinente, Communications naturelles (2023). DOI : 10.1038/s41467-023-42531-9
Fourni par l’Université Radboud
Citation: Une nouvelle méthode révèle des variations génétiques cachées (1er novembre 2023) récupéré le 1er novembre 2023 sur
Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.