AIDE DE L'ORDINATEUR EN SYNTHESE ORGANIQUE

(R. Barone - Cycle Chimie Fine - juin 2001)


Objectif: synthétiser une molécule donnée
Comment s'y prend un chimiste ? Présence d'une sous-structure caractéristique :

Synthèse de l’Ibogamine : S.I. Salley, J. Am. Chem. Soc., 1967, 89, 6762.

Un produit de départ proche de la molécule cible est disponible (cas de la première synthèse de la cortisone à partir de l'acide desoxycholique) :

Cité par E.J. Corey dans Science,1969, 166,178.

Hémisynthèse. Synthèse du Taxol (qu'on trouve dans l'écorce de l'if) à partir de déacétylbaccatin disponible (dans les feuilles de l'if) (A.E. Greene et al., JACS, 1988, 110, 5917.

Application d'une réaction particulière :

Synthèse du benzomorphane : L. Stella, B. Raynier, J.M. Surzur, Tetrahedron Lett., 1977, 2721.

Hasard : Synthèse du longifolène par Jonhson, qui étudiait la formation d'hydroazulènes :

à côté du produit se formait :

D'où application de cette réaction pour la synthèse du longifolène (JACS, 1975, 97(16), 4777).

            Aucune des méthodes ci-dessus n'est possible, solutions :

Se retrousser les manches et faire travailler ses cellules grises.

Faire appel à l'ordinateur :

Utiliser les bases de données.

Essayer la synthèse assistée par ordinateur.

La Synthèse Assistée par Ordinateur.

C'est E.J. Corey (prix Nobel de Chimie, quelques années plus tard) qui a eu l'idée, le premier, de développer un programme d'aide à la synthèse organique. (Corey et Wipke, Science, 1969, 166,178).

Ordinateur = mémoire immense et infaillible, capable d'envisager des milliers de combinaisons, peut apporter une aide en synthèse par une étude systématique, compense le manque d’imagination par une étude systématique.

Stratégie développée : analyse rétrosynthétique, arbre de synthèse :

Nos approches en synthèse assistée par ordinateur.

Notre laboratoire s'est lancé dans cette aventure dès 1971 et en 1973 une première approche du logiciel SOS Synthèse Organique Simulée) était disponible. (R. Barone, Chimie Actualités, sept. 1973, 1515, 29). Approche limitée à la chimie hétérocyclique pour le fichier de réactions disponible.

Comment ça marche ?

Le programme recherche une sous-structure cible dans la molécule cible et la remplace par la sous-structure précurseur. Par exemple, pour la réaction de Diels-Alder, le programme doit rechercher le motif suivant :

S'il est présent dans la cible,il doit le remplacer par le motif précurseur :

Ceci est une description trop simple, il est nécessaire d'ajouter des tests afin d'éviter des solutions erronées. Par exemple, si la cible est :

Le précurseur proposé serait   A. Allais, Masson, 1962). Exemples de "réactions" :

Approche limitée, manque de créativité => codage des réactions par mécanismes réactionnels : substitution nucléophile, élimination, addition nucléophiles, etc. => 20 motifs pour remplacer les 200 précédents. Par exemple :

A = n'importe quel atome.

L = groupe libérable laissé au choix du chimiste.

Résultats :

- Thiazole :

Autres suggestions :

Ces deux exemples montrent que le programme peut proposer des solutions originales, même pour des structures simples.

- Indazole :

Autres suggestions :

SOS avait été développé sur IBM 1130 de 16 Kmots (un ordinateur qui occupait une salle entière climatisée !). Il a été adapté ensuite sur Apple II (Bull. Soc. Chim. Belg., 1982, 91(4), 333) puis sur IBM/PC (sous DOS). Par la suite une version beaucoup plus performante et beaucoup plus conviviale a été développée sur Macintosh : MARSEIL (J. Org. Chem., 1988, 53, 720). Il est en cours d’adaptation sous Windows.

Autres approches

Recherche de l'étape-clé

L'analyse rétrosynthétique décrite ci-dessus correspond à une approche cherchant à trouver l'ensemble des solutions, étape par étape. Or le chimiste, quand il analyse une molécule en vue de sa synthèse,  n'envisage pas toutes les possibilités. Il effectue plutôt une analyse qui lui permet de sélectionner rapidement les voies intéressantes de l'arbre de synthèse. Son expérience le conduit à déterminer quelles sont les étapes clés d'une synthèse. E.J. Corey, dans la première synthèse du longifolène (JACS, 1964, 86, 478) a proposé une approche analytique qui consiste à sélectionner les liaisons stratégiques dans une structure complexe et à construire le squelette des précurseurs en effaçant une ou plusieurs liaisons stratégiques. Voici son analyse dans le cas du longifolène :

D'autres "solutions" intéressantes peuvent être envisagées à partir des liaisons en alpha des liaisons stratégiques, par exemple :

Programme SAS

Nous avons programmé cette approche : logiciel SAS (Synthèse Analytique Simulée) (Barone, et al. Comput. Chem., 1979, 3, 83). Appliqué au squelette de l'ellipticine (Barone, Chanon, Heterocycles, 1981, 16, 1357) quelques résultats qui suggèrent des réactions de Diels-Alder :

Une synthèse faisant intervenir l'idée n° 2 a été réalisée ultérieurement par l'équipe du Prof. Ghosez (Tet. Lett., 1985, 26(13), 1647) :

L'idée n° 2 a été réalisée récemment (Blechert, et al., Synthesis, 1995, 5, 592) :

Cette approche est intéressante mais présente une limitation : elle ne peut mettre en évidence des réactions de fragmentation ou de réarrangement. L'intérêt est qu'on travaille au niveau du squelette de la molécule et qu'on va directement à l'étape-clé de la synthèse. Par exemple l'idée :

Ensuite le chimiste doit améliorer cette idée, on pourrait envisager par exemple :

Cette idée de rechercher l'étape-clé nous a conduit à envisager une nouvelle approche.

Programme REKEST (REsearch for the KE STep) (Chimia, 1986, 40, 436).

L'idée de cette approche nous est venue en étudiant une belle synthèse du longifolène réalisée par Oppolzer (J. Am. Chem. Soc., 1978, 100, 2583), dont l'étape-clé fait intervenir une réaction de de Mayo intramoléculaire ([2+2] puis rétroaldol) :

Cette synthèse pourrait être trouvée par l'approche rétrosynthétique classique, si la réaction de de Mayo a été codée et si l'on arrive à la dicétone. Or un des inconvénients de l'approche rétrosynthétique est le grand nombre de solutions proposées et parfois il peut arriver à l'utilisateur de négliger un intermédiaire.

Avec SAS le programme proposerait l'intermédiaire suivant (parmi d'autres solutions) :

qui est assez éloigné de la solution. Nous avons donc imaginé un autre codage des réactions pour "décortiquer" la molécule cible : "réactions" qui effacent ou ajoutent une ou deux liaisons  dans la cible :

Et la synthèse précédente serait suggérée à partir des intermédiaires suivants (en travaillant au niveau du squelette uniquement) :

Cette approche simple peut mettre en évidence des intermédiaires intéressants, par exemple :

Son principal inconvénient est d'engendrer un grand nombre de solutions, dont beaucoup sont peu intéressantes.

Ces programmes avaient été développés sur micro ordinateur Apple II qui n'est plus disponible et avaient été abandonnés. Récemment, Paul Wender, dans un article  intitulé : "Toward the ideal synthesis : connectivity analysis and multbond-forming processes"  (Organic Synthesis, Theory and Applications, T. Hudlicky ed., 1993, vol. 2, 27-66), a repris sous une autre forme l'idée de l'approche analytique  et a montré son intérêt. Cet article, venant d'un excellent chimiste de synthèse, nous a incité a reprendre nos  programmes, SAS et REKEST et de les fondre dans une nouvelle version que nous avons appelée CONAN (CONnectivity ANalysis) (Barone et al. J. Chem. Inf. Comput. Sci., 1995, 35, 467).

- CONAN

Depuis, nous avons écrit une nouvelle version de CONAN (elle n'a pas encore été publiée, disponible sur PC,sous DOS et sur Macintosh) pour rechercher des découpages intéressants de la molécule cible. Outre les options de la première version :

- Ajouter une liaison dans la cible.

- Effacer une ou deux liaisons.

D'autres options ont été introduites :

- Rechercher les coupures convergentes.

- Rechercher des précurseurs linéaires.

- Rechercher des précurseurs possédant un cycle et une chaîne linéaire.

- Appliquer une réaction donnée.

- Analyse des précurseurs sur deux niveaux : quand un précurseur est présent à l'écran on peut l'analyser directement.

Quelques exemples dans le cas du sqelette du taxol et des stéroïdes :

- Ajout d'une liaison :

Le programme propose un grand nombre de solutions, par exemple :

Ce précurseur étant à l'écran, il est possible de l'analyser directement, il devient molécule cible et l'on peut appliquer la réaction [2+2] ce qui donne comme précurseurs potentiels :

ou, redessinés :

- Effacer une ou deux liaisons.

Nous utilisons l'approche proposée par P. Wender pour classer les liaisons en fonction de leur complexité. Par exemple pour le squelette d'un stéroïde, nous avons :

Dans ce cas il existe trois types de liaison, de complexité 6, 5, 4.

Le chimiste sélectionne le type des liaisons à effacer. Voici par exemple les solutions où l'on a demandé d'effacer deux liaisons de complexité 6.

La structure 3 correspond à un schéma décrit dans la littérature.

Cette approche conduit à des précurseurs de moindre complexité, mais qui possèdent souvent de grands cycles, ce qui n'est pas toujours intéressant d'un point de vue chimique.

Coupures convergentes :

Le programme coupe deux ou trois liaisons des cycles internes. Pour un stéroïde, les cycles internes, sont les cycles B et C :

Voici les coupures convergentes proposées par le programme (les solutions 4, 5, 6 ont été décrites dans la littérature) :

- Précurseurs linéaires :

Les programme efface les liaisons de manière à construire des précurseurs linéaires. Une version spécifique a été développée sous Windows (programme SLIP : Search for LInear Precursors, Barone et al. MATCH, 2000, 41, 99-106). Voici les solutions concernant le taxol :

- Précurseurs avec un cycle et une chaîne.

Dans cette option le programme efface les liaisons de manière à construire des précuseurs qui possèdent un cycle et une chaîne linéaire. Solutions pour les stéroïdes :

et pour le taxol :

Tous ces découpages correspondent à des propositions de synthèse que le chimiste doit analyser ensuite avec ses propres connaissances. Par exemple, pour la solution 10, ci-dessus, on peut imaginer une réaction radicalaire :

Recherche de l'étape-clé, une autre approche

Les approches ci-dessus (SAS, REKEST, CONAN) sont intéressantes, mais sont assez éloignées de la réalité chimique car elles ne font pas appel aux réactions.

Une autre approche pour rechercher l'étape-clé d'une synthèse nous a été suggérée par le Professeur Goverdhan Mehta (Hyderabad, Inde) qui a réalisé de nombreuses synthèses de produits naturels.

Son idée était d'utiliser le programme MARSEIL d'une manière simplifiée : u lieu de construire un arbre de synthèse aussi complet que possibe, on se borne à "regarder" si une réaction, codée de manière simplifiée, peut être utilisée dans la construction du squelette carboné de la molécule cible. Par exemple, pour la synthèse du taxol, qui possède des fonctions C - OR,  qui peuvent provenir de C = O, le chimiste peut se demander : "Est-ce que ce C=O pourrait être introduit par une réaction oxy-Cope ?" :

sera codée de manière simplifiée :

et les cibles suivantes seront successivement testées :

Voici par exemple quelques solutions proposées pour 11 :

et pour 12 :

Ces exemples montrent que cette approche est extrêmement intéressante pour vérifier rapidement si une réaction peut être utilisée dans l'étape-clé. Elle permet de mettre en évidence, dans le cas de molécules complexes, des solutions qui ne sont pas évidentes à percevoir, même pour un bon chimiste.

Cette approche nécessite, dans certains cas,  de tester plusieurs cibles, nous l'avons ensuite généralisée  en supprimant toutes les fonctions. On ne conserve que le squelette, pour la cible et les réactions (Tetrahedron, 1992, 48(41), 8953). La réaction oxy-Cope sera codée, dans le sens rétrosynthétique, de la manière suivante  :

L'inconvénient de cette approche est qu'on a beaucoup de propositions, mais surtout qu'on a du mal à faire la relation entre les précurseurs et la cible. Aussi avons-nous ajouté une option qui permet d'appliquer, sur les précurseurs obtenus,  la réaction dans le sens direct.

Nous partons du squelette de la cible, nous y appliquons une transformation et nous obtenons des précurseurs partiellement fonctionnalisés. Sur ces précurseurs nous appliquons la réaction dans le sens direct (codée, elle, avec les fonctions chimiques) et nous pouvons alors observer où se placent les fonctions dans la cible.

Les réactions se codent en deux parties : sens rétrosynthétique sans les fonctions chimiques et sens direct avec les fonctions. Le programme fonctionne dans le sens rétrosynthétique (squelette cible => précurseurs) et dans le sens direct (précurseurs -> cible avec fonctions). Voici d'autres solutions intéressantes proposées par le programme :

cible avec fonctions

Le chimiste peut introduire ses réactions. S'il est intéressé par la formation d'une double liaison par oxy-Cope, il peut coder la réaction de la manière suivante :

Dans le cas du taxol, la cible à soumettre est :

les précurseurs et les produits possibles sont :

Cette approche est doublement intéressante : elle permet de mettre rapidement en évidence des précurseurs qui ne sont pas toujours évident à percevoir, mais aussi elle permet de proposer des analogues de la molécule cible. Bien entendu le problème n'est pas complètement résolu,  cependant   un certain défrichage peut être effectué et des idées originales peuvent surgir. Ainsi dans le cas de l'analyse de la crinipelline :

par réaction radicalaire le programme avait proposé la séquence suivante, qui était nouvelle :

A notre demande elle a été réalisée avec succès par D.P. Curran sur un modèle plus simple (D.P. Curran, Aust. J. Chem., 1995, 48, 261) :

img width=296 height=65 src="image138.gif" > Avec cette approche la réaction de Mayo est codée :

et l'étape-clé de la synthèse du longifolène selon Oppolzer est trouvée directement.

De même la réaction de Diels-Alder est codée :

HOLOWIN

Cette approche avait été développée sur Macintosh. Récemment, nous l'avons installée, en l'améliorant, sur IBM/PC, sous Windows (logiciel HOLOWin : Tetrahedron, 1996, 52(46), 14625-14630 : lorsqu'un précurseur est à l'écran on peut l'analyser directement dans une nouvelle fenêtre, ce qui permet une exploration à la fois en largeur et en profondeur. Une nouvelle version est en cours de développement.

Cette analyse sur différents niveaux permet de mettre en évidence, très rapidement, non pas une seule étape-clé, mais plusieurs. Elle permet ainsi de révéler des réactions tandem, ou en cascade, pour accéder à la molécule cible.




Last revised:25/06/2002