Réduire les risques liés à la découverte de médicaments grâce à l’IA prédictive
Le développement d’un nouveau médicament peut nécessiter des années de recherche et coûter des millions de dollars. Pourtant, plus de 90 % des médicaments candidats échouent lors des essais cliniques, et un nombre encore plus élevé n’atteint jamais le stade clinique. De nombreux médicaments échouent parce qu’ils ne sont tout simplement pas sûrs.
Des chercheurs du Broad Institute du MIT et de Harvard ont développé des modèles d’IA capables de détecter les effets biologiques potentiels des médicaments avant même qu’ils ne pénètrent dans un organisme vivant.
Srijit Seal, chercheur invité au laboratoire Carpenter-Singh de la plateforme d’imagerie de Broad, a formé plusieurs modèles d’apprentissage automatique prédictifs pour identifier les caractéristiques chimiques et structurelles des médicaments susceptibles de provoquer des effets toxiques chez l’homme.
Ensemble, ces outils évaluent l’impact qu’un médicament peut avoir sur divers résultats intéressant les développeurs de médicaments : la santé cellulaire générale, la pharmacocinétique et la fonction cardiaque et hépatique. À ce jour, des articles décrivant trois de ces outils d’apprentissage automatique ont été publiés dans le Journal d’information et de modélisation chimiques, Biologie moléculaire de la celluleet Recherche chimique en toxicologieUn quatrième est en préparation.
Les modèles prédictifs n’éliminent pas les expériences en laboratoire, mais ils peuvent aider les chercheurs à réduire le nombre de médicaments potentiels sélectionnés, en allouant plus de temps et de ressources à l’expérimentation sur les candidats les plus prometteurs.
Seal a commencé ce travail après s’être demandé si la structure chimique d’un médicament candidat pouvait fournir davantage d’informations toxicologiques. La toxicité des médicaments peut être un problème même après l’approbation de la FDA ; la cardiotoxicité induite par les médicaments (DICT) et les lésions hépatiques induites par les médicaments (DILI) contribuent chacune à un pourcentage significatif des retraits de médicaments après la mise sur le marché.
Pour mieux comprendre les mécanismes biologiques complexes qui rendent les médicaments toxiques pour les organes humains, la FDA a établi des listes catégoriques de la probabilité que les médicaments provoquent des effets toxiques sur le cœur et le foie.
« Depuis que la FDA a publié ces ensembles de données, nous nous sommes demandé si nous pouvions les utiliser pour prédire la toxicité à l’aide de l’apprentissage automatique », a déclaré Seal.
Seal a utilisé ces listes organisées par la FDA comme données de formation pour deux modèles d’apprentissage automatique de prédiction de la toxicité : l’un pour la cardiotoxicité et l’autre pour les lésions hépatiques. Grâce à des données supplémentaires sur la structure chimique, les propriétés physicochimiques et les paramètres pharmacocinétiques, les modèles ont appris à identifier les caractéristiques qui contribuent à la toxicité des médicaments. Le prédicteur de cardiotoxicité, DICTrank Predictor, est le premier modèle prédictif de la liste de classement DICT de la FDA.
Souvent, des composés structurellement similaires ont des effets différents sur la fonction hépatique chez les animaux et les humains. C’est pourquoi DILIPredictor a dû relever le défi supplémentaire de devoir différencier la toxicité entre les espèces. DILIPredictor a correctement prédit le moment où les composés seraient sans danger pour les humains, même si les mêmes composés étaient toxiques pour les animaux.
Les développeurs de médicaments évaluent également les effets pharmacocinétiques, c’est-à-dire la manière dont un organisme absorbe, distribue, métabolise et élimine un médicament. Il est essentiel de déterminer ces propriétés le plus tôt possible : les médicaments qui ne se distribuent pas à la cible souhaitée ne sont pas efficaces, tandis que les médicaments qui restent trop longtemps dans l’organisme peuvent induire des effets toxiques.
La modélisation pharmacocinétique est difficile, prend du temps et nécessite des instruments et des logiciels coûteux. L’apprentissage automatique prédictif pourrait permettre aux chercheurs de « échouer plus rapidement » et de concentrer leurs efforts expérimentaux sur les médicaments présentant la meilleure biodisponibilité. Pour y parvenir, Seal a travaillé avec des collaborateurs pour développer un outil de modélisation pharmacocinétique prédictive.
« L’apprentissage automatique en pharmacocinétique devient populaire », a déclaré Seal. « Nous nous sommes demandé si nous pouvions concevoir un modèle prédictif et le comparer aux modèles de l’industrie, du moins pour l’instant en tant que preuve de concept.
« La conception de médicaments nécessite une sorte de boucle de rétroaction pour garantir que ce que vous concevez fonctionnera réellement dans le corps humain et ne provoquera pas de toxicité involontaire », a-t-il ajouté. Cette suite d’outils d’apprentissage automatique prédictif, si elle est appliquée aux premières étapes de la découverte de médicaments, pourrait fournir le cadre de cette boucle.
Un autre aspect de la toxicologie des médicaments est lié à la santé cellulaire. Lorsque les modèles d’apprentissage automatique prédisent l’impact potentiel d’un composé, les chercheurs souhaitent souvent obtenir plus de détails, comme le mécanisme par lequel le composé affecte les cellules. Seal s’est alors tourné vers les caractéristiques extraites par CellProfiler, un logiciel d’imagerie open source permettant d’interpréter les caractéristiques morphologiques cellulaires.
« CellProfiler analyse les caractéristiques physiques des cellules sous forme de données basées sur des images et tente de prédire leur évolution par rapport à un contrôle », explique Seal. « Lorsque nous avons demandé aux biologistes du secteur comment ils travaillaient avec les données CellProfiler, ils nous ont dit qu’ils ne savaient parfois pas comment interpréter ces caractéristiques basées sur des images dans un contexte biologique. »
Pour rendre les données de CellProfiler plus interprétables biologiquement, Seal a développé BioMorph, un modèle d’apprentissage profond qui combine les données d’imagerie de CellProfiler avec des données sur la santé cellulaire, telles que les taux de croissance et de multiplication des cellules.
L’entraînement sur deux ensembles de données complémentaires permet à BioMorph de déduire comment le mécanisme d’action d’un composé particulier pourrait affecter la santé cellulaire. Lorsque BioMorph a été testé sur des données extérieures à son ensemble d’entraînement, le modèle a correctement associé les composés aux caractéristiques cellulaires affectées par ce composé particulier.
« BioMorph fournit des détails supplémentaires que les scientifiques peuvent lire et comprendre d’un point de vue biologique », a déclaré Seal. « Nous attendons avec impatience de connaître les commentaires des utilisateurs sur l’utilisation de BioMorph pour leurs cas de test individuels. »
Plus d’information:
Srijit Seal et al., Insights into Drug Cardiotoxicity from Biological and Chemical Data : Les premiers classificateurs publics pour le classement de la cardiotoxicité induite par les médicaments de la FDA, Journal d’information et de modélisation chimiques (2024). DOI: 10.1021/acs.jcim.3c01834
Srijit Seal et al., Des pixels aux phénotypes : l’intégration du profilage basé sur l’image avec les données sur la santé cellulaire, car les fonctionnalités BioMorph améliorent l’interprétabilité, Biologie moléculaire de la cellule (2024). DOI: 10.1091/mbc.E23-08-0298
Srijit Seal et al., Amélioration de la détection des lésions hépatiques induites par les médicaments en intégrant les données in vivo et in vitro prédites, Recherche chimique en toxicologie (2024). DOI: 10.1021/acs.chemrestox.4c00015
Fourni par le Broad Institute du MIT et de Harvard
Citation:Réduire les risques liés à la découverte de médicaments grâce à l’IA prédictive (18 juillet 2024) récupéré le 18 juillet 2024 à partir de
Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni à titre d’information uniquement.