PsychoACTIF / Rechercher

oazis

ça fait plaisir de lire des articles bien informés et bien présentés comme celui ci. même si je suis loin de bien comprendre, je vois mieux comment par sa configuration spatiale une molécule peut chambouler notre appareil cognitif. Un jeu de construction si complexe qu'il permet de faire le lien entre une molécule et la conscience.

oazis

[quote=g-rusalem][justify]Aujourd'hui, j'aimerais vous parler d'intelligence artificielle (IA), et en profiter pour vous montrer qu'on peut potentiellement l'utiliser comme outil de réduction des risques (RdR).

L'objectif de ce billet est déjà de vous expliquer les bases de l'intelligence artificielle, puis d'appliquer cet outil pour tenter de prédire la cardiotoxicité d'une molécule n'ayant jamais été recherchée en laboratoire, par exemple un nouveau RC.

[b] 1. Le processus de développement d'un médicament[/b]

Lorsque les chercheurs essayent de concevoir un médicament, le processus passe par plusieurs phases.[/justify]

Image: https://www.psychoactif.org/forum/uploads/images/1645/11.png

[justify]Une fois la cible identifiée, un récepteur par exemple, il est possible de tester l'interaction entre le récepteur et des milliers (voir centaines de milliers) de molécules différentes. Cela s'appelle le criblage haut débit. Les boîtes pharmaceutiques les plus fortunées ont des machines automatiques pour faire cela : elles font des dizaines de tests en éprouvette (dits tests "in vitro" avec des cellules dans des éprouvettes, à opposer à des tests "in vivo" chez des rats par exemple, ou "in silico" par simulations informatiques) avec à chaque fois le récepteur en question et une molécule différente. L'objectif est de trouver l'aiguille (la ou les molécules active sur la cible) dans une botte de foin (la banque contenant les X molécules différentes).

Si les chercheurs sont chanceux, ils vont identifier quelques centaines de molécules différentes (ils appellent ça des "hits" dans le jargon pharmaceutique) et passer à la seconde phase, le développement préclinique. Les molécules identifiées à l'étape précédentes sont optimisées, leur toxicité est testée sur des cellules, on observe leur impact sur des modèles plus complexes que des cellules, poisson zèbre, rat, souris (tests "in vivo")... Au cours de ce processus, si une molécule est très prometteuse, mais qu'elle montre des signes de toxicité, elle est immédiatement sortie du lot. Les quelques molécules qui ne sont pas éliminées sont appelées des "leads" et vont passer à l'étape suivante : la phase clinique, tests chez l'homme. Comme vous vous en doutez, seules les molécules qui ont prouvé leur non-dangerosité au maximum sont administrées chez l'homme.

[b] 2. Molécules propres, molécules sales[/b]

Une étape indispensable avant tout administration chez l'homme, c'est le test de la molécule candidate sur d'autres cibles que le récepteur d'intérêt. Certaines protéines dans le corps sont connues pour être toxiques lorsqu'elles sont activées, c'est le cas des canaux hERG (hERG pour ... "the [b]h[/b]uman [b]E[/b]ther-à-go-go-[b]R[/b]elated [b]G[/b]ene", ne me demandez pas pourquoi). Si on se rend compte qu'une molécule active fortement les canaux hERG, même si elle est très prometteuse sur la cible en question, c'est Game Over pour elle. En effet, les molécules qui activent ces canaux peuvent créer de dangereuses arythmies cardiaques, appelées "torsades-de-pointes", qui peuvent provoquer des morts subites.

Les chercheurs préfèrent donc identifier les molécules les plus spécifiques possibles sur la cible en question. Si elles ne tapent que là où on veut qu'elles tapent, alors les risques d'effets secondaires sont grandement diminués. De là viens là le concept de molécule "sale" ou "propre". Une molécule sale, c'est une molécule qui tape sur plein de cibles différentes. L'éthanol en est une. L'ibogaïne est l'archétype de la molécule sale. Selon la concentration, elle tape sur : les récepteurs opiacés, les récepteurs sigma, les récepteurs sérotoninergiques, les récepteurs nicotiniques, les récepteurs NMDA...[/justify]
[url=https://www.psychoactif.org/forum/image-reelle.php?code=1645/21.png]Image: https://www.psychoactif.org/forum/uploads/images/1645/21.png[/url]

[justify]Si l'on regarde rapidement sa structure, on peut voir clairement le noyau indole typique des tryptamines. Pour l'action sur les récepteurs NMDA, je ne connais pas le site actif de la mémantine et donc je peux me tromper avec mon hypothèse, mais on retrouve une partie de la mémantine dans la structure de l'ibogaïne et c'est peut être de là dont viens son côté dissociatif.

Je vous spoile direct : non contente de pouvoir activer la myriade de récepteurs dont on vient de parler, l'ibogaïne active aussi les canaux hERG, ce qui en fait une drogue potentiellement cardiotoxique.

Nous arrivons finalement à notre question initiale...

[b]3. Comment prédire l'activité d'une molécule pour les canaux hERG ?[/b]

On peut faire ça à l'aide de l'intelligence artificielle (IA). Les chercheurs de cet [url=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5720373/]article[/url] ont créé un modèle de machine learning (ML) (pour faire simple, un autre nom pour IA), et ils l'ont mis à disposition à l'aide d'un serveur web. Vous, moi, pouvons l'utiliser.

Avant d'utiliser leur webserveur, j'ai tout de même la présomption de vouloir vous expliquer très rapidement (et sans maths, juste visuellement) en quoi consiste l'IA. Ce n'est pas si compliqué, et ce n'est pas vraiment de l'intelligence (artificielle) comme vous allez le voir.

Mettons que nous avons un jeu de données sur plusieurs personnes, avec 2 informations : Leur taille en cm, leur poids en kg.[/justify]
Image: https://www.psychoactif.org/forum/uploads/images/1645/33.png
Nous pouvons mettre ces données en graphique :
Image: https://www.psychoactif.org/forum/uploads/images/1645/42.png
Si l'on veut décrire ces données, instinctivement, on peut tout simplement tracer un trait.
Image: https://www.psychoactif.org/forum/uploads/images/1645/52.png
[justify]Ce trait, cette droite, c'est un modèle mathématique de notre jeu de donnée (une régression linéaire, le plus simple). Ni plus, ni moins. Selon notre jeu de données, et suivant notre modèle nouvellement créé, on peut prédire le poids qu'aurait une personne de 170 cm. Grossièrement, environ 67 kg.[/justify]
Image: https://www.psychoactif.org/forum/uploads/images/1645/62.png
[justify]Récapitulons : Grâce à un jeu de données, nous avons construit un modèle pour prédire une valeur, le poids. Ce modèle est extrêmement simple, mais tous les algorithmes de machine learning essayent de faire plus ou moins la même chose : Décrire un jeu de donnée de façon mathématique, pour pouvoir faire une prédiction sur un problème en s'appuyant sur les données existantes. 2 précisions :
- Si nous avions eu 10000 personnes au lieu de 5 dans notre jeu de donnée, le modèle (la droite) aurait eu une meilleure performance de prédiction du poids dans la population générale. De manière générale (même si ce n'est pas toujours le cas car il y a la question de la qualité des données), plus de données, c'est des modèles plus précis.
- Si nous utilisons notre modèle linaire pour prédire le poids d'un bébé par exemple, notre modèle aura surement une performance médiocre. Nous n'avons que des personnes entre 1m60 et 1m90. Cet intervalle entre 1m60 et 1m90, c'est le domaine d'applicabilité de notre modèle. Si nous sortons de ce modèle, le modèle prédira toujours une valeur, mais la performance sera probablement médiocre.[/justify]
Image: https://www.psychoactif.org/forum/uploads/images/1645/71.png

[b]4. Le webserveur Pred-hERG.[/b]

[justify]Il existe un énorme intérêt à réussir à prédire rapidement l'action d'une molécule sur le canal hERG. Comme dit précédement, si une molécule est fortement active sur le canal, ses chances d'être autorisé pour devenir un médicament sont faibles. Plus tôt son activité sur le canal est identifiée dans le processus de création d'un médicament, plus on évite des dépenses inutiles. Les chercheurs de l'article sus-linké ont donc créé un modèle de machine learning pour prédire cela, dans l'idée d'accélérer le processus de sélection des molécules potentielles.

Sauf qu'à la place de 5 entrées comme dans notre base de donnée taille/poids d'exemple, ils ont rassemblé les données in vitro d'environ 6000 molécules. C'est-à-dire que pour chacune de ces molécules, on sait (1) leur activité sur le canal hERG (la valeur qu'on cherche à prédire, le poids dans notre exemple), (2) on connaît la structure des 6000 molécules (la taille dans notre exemple). Le problème, c'est qu'un ordinateur ne fait pas sens d'une structure sous la forme d'une représentation visuelle. Pour contourner ce problème, il existe ce qu'on appelle des descripteurs physicochimiques, qui permettent de décrire la structure d'une molécule en un langage que l'ordinateur peut comprendre. On a par exemple la masse moléculaire de la molécule, son nombre de carbones, son nombre de doubles liaisons, de cycles... Au lieu d'un seul descripteur (la taille), ils ont généré à partir de la structure de chaque molécule des centaines de différents descripteurs.

Une fois ceci fait, ils ont "appris" (c'est-à-dire) entrainé leur modèle sur ces données, et ils l'ont mis online [url=http://predherg.labmol.com.br/]ici[/url] (il faut scroller en bas). Comme il aurait été pénible de devoir générer soi-même les descripteurs physico-chimiques pour chaque molécule dont on veut prédire l'affinité pour hERG, ils ont créé une interface simplifiée qui nous fait ça en coulisse. Il y a juste 2 manières de procéder : (1) Soit ajouter un SMILES d'une molécule, soit (2) la dessiner.[/justify]
[url=https://www.psychoactif.org/forum/image-reelle.php?code=1645/8.png]Image: https://www.psychoactif.org/forum/uploads/images/1645/8.png[/url]
[justify]Un SMILES, c'est un langage symbolique qui permet de décrire (de façon extrêmement compacte, son principal intérêt) une molécule, tout en conservant un maximum d'information sur la molécule. Par exemple, la formule brute de l'ibogaine (C20H26N2O) est très compacte, mais contrairement au SMILES, elle ne contient ni l'information du nombre de doubles liaisons, ni comment la molécule s'agence dans l'espace.

On sait déjà que l'ibogaïne active le canal hERG, on va donc commencer par tester cette molécule-là pour voir quelle est la prédiction de leur modèle. Pour ce faire, sur la page wikipédia de l'ibogaïne est fourni le SMILES de la molécule.[/justify]
[quote]CC[C@H]([C@@H]1[N@](C2)CC3)C[C@@H]2C[C@H]1C(N4)=C3C5=C4C=CC(OC)=C5[/quote]
Voici les résultats du modèle :
[url=https://www.psychoactif.org/forum/image-reelle.php?code=1645/91.png]Image: https://www.psychoactif.org/forum/uploads/images/1645/91.png[/url]
[justify]On peut observer que l'ibogaïne est prédite comme potentiellement cardiotoxique, et que l'interaction entre cette molécule et les canaux hERG est prédite comme faible à modérée. Pour chaque résultat est donné un pourcentage de fiabilité de la prédiction. Très important, on peut aussi voir que la structure de l'ibogaïne est à la limite du domaine de fiabilité du modèle (si le score avait été inférieur à 0.26, on serai sorti du domaine d'applicabilité) : Pour simplifier, cela veut dire que l'ibogaïne ressemble juste assez structurellement aux 6000 molécules utilisées pour entrainer le modèle, pour que la prédiction soit fiable.

On peut tester le 3MMC, selon le modèle, le 3MMC n'as pas d'action sur le canal hERG.[/justify]
[url=https://www.psychoactif.org/forum/image-reelle.php?code=1645/10.png]Image: https://www.psychoactif.org/forum/uploads/images/1645/10.png[/url]

[justify][b]Une note importante : Ce webserveur est un modèle de machine learning tout ce qu'il y a de plus [u]expérimental[/u]. Son utilité principale (tout du moins à mon avis) réside dans sa capacité à trier rapidement des milliers de molécules dans le processus de création d'un médicament. Ce n'est aucunement parce que la prédiction du modèle d'une molécule ressort sans cardiotoxicité avérée qu'il faut considérer la molécule en question comme non dangereuse pour la consommation (vrai négatif).[/b]

J'ai été surpris que le THC soit reporté par le modèle comme potentiellement cardiotoxique, avec une forte activité sur le canal hERG.[/justify]
[url=https://www.psychoactif.org/forum/image-reelle.php?code=1645/111.png]Image: https://www.psychoactif.org/forum/uploads/images/1645/111.png[/url]
[justify]Il est avéré que certains cannabinoïdes sont cardiotoxiques (par exemple le JWH-030 [url=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6061033/]ici[/url]). La possibilité de faux positif est tout aussi possible.

En creusant un peu plus, le CBD est lui aussi reporté comme cardiotoxique par le modèle, pourtant, il aurai une action bloquante sur les canaux hERG, venant moduler la dangerosité du THC selon cet [url=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7528081/]article[/url] (la nature fait bien les choses, et nous surprend chaque jours !). J'aurai appris quelque chose. Ces erreurs du modèle sont explicables par le fait que la proximité chimique entre le THC et le CBD est extrêmement forte.[/justify]
[url=https://www.psychoactif.org/forum/image-reelle.php?code=1645/12.png]Image: https://www.psychoactif.org/forum/uploads/images/1645/12.png[/url]
[justify]En effet, la différence entre une molécule activant une protéine (agoniste), une molécule bloquante (antagoniste), ou une molécule désactivante (agoniste inverse) est souvent extrêmement subtile, et se joue parfois à un atome près (sans parler des agonistes partiels, plus sur le sujet à venir), ce qui pousse le machine learning dans ses retranchements. En l'état, leur modèle semble dont seulement pouvoir prédire si une molécule va interagir ou pas avec les cannaux hERG, pas la façon dont les molécules agissent sur le canal.

EDIT : Après coup je me rends compte que le CBD et le THC sortent du modèle d'applicabilité du modèle (encore une fois, comprendre qu'il ne doit pas y avoir de cannabinoïdes dans la base de données ayant servi à construire le modèle). La prédiction n'est donc pas fiable pour ces molécules. Cependant, la discution à propos de la difficulté de prédire la différence entre une molécule qui active ou qui bloque le canal reste entièrement valide.

C'est tout pour aujourd'hui. En espérant que ça n'ai pas été trop long ni compliqué. Je suis conscient que les concepts sont pas évidents à capter. Je serai content si vous avez un peu touché du doigt l'idée derrière l'intelligence artificielle (prédire une variable en utilisant des données pré-existantes). J'espère que vous avez compris que ce n'est ni magique, ni infaillible, et que les performances dépendent de la qualité/quantité des données, et du problème considéré. Merci à vous si vous avez réussi à lire jusqu'ici.[/justify][/quote]
Le fait que le THC soit reporté par ce modèle comme une molécule cardio toxique corrèle t'il avec les observations cliniques faites à ce propos ? voici, par exemple, un article à ce sujet https://www.edimark.fr/Front/frontpost/getfiles/13535.pdf …

oazis

Au bout de combien de sujets de forum, ou de posts, peut on envoyer des champis aux participants du forum ?

merci

Le blog de g-rusalem » 1. La tête dans un site actif : Le LSD couplé à son récepteur 5HT2B » 11 juin 2022 à 20:11

Le blog de g-rusalem » 2. Prédire la cardiotoxicité d'un RC ? RdR par l'IA. » 11 juin 2022 à 11:33

Le blog de Equipe de PsychoACTIF » Les champis : Le système de réputation du forum » 09 janvier 2020 à 18:10

Pied de page des forums