AIDE DE L'ORDINATEUR EN SYNTHESE ORGANIQUE
(R. Barone - Cycle Chimie Fine - juin 2001)
Objectif: synthétiser une
molécule donnée
Comment s'y prend un chimiste ? Présence d'une
sous-structure caractéristique :
Synthèse de l’Ibogamine : S.I. Salley, J. Am. Chem. Soc., 1967,
89, 6762.
Un produit de départ proche de la molécule cible est disponible (cas
de la première synthèse de la cortisone à partir de l'acide desoxycholique) :
Cité par
E.J. Corey dans Science,1969, 166,178.
Hémisynthèse. Synthèse du Taxol (qu'on trouve dans l'écorce de l'if)
à partir de déacétylbaccatin disponible (dans les feuilles de l'if) (A.E. Greene
et al., JACS, 1988, 110, 5917.
Application
d'une réaction particulière :
Synthèse du
benzomorphane : L. Stella, B. Raynier, J.M. Surzur, Tetrahedron Lett., 1977,
2721.
Hasard : Synthèse du longifolène par Jonhson, qui étudiait la
formation d'hydroazulènes :
à côté du
produit se formait :
D'où
application de cette réaction pour la synthèse du longifolène (JACS, 1975,
97(16), 4777).
Aucune des
méthodes ci-dessus n'est possible, solutions :
Se retrousser les manches
et faire travailler ses cellules grises.
Faire appel à l'ordinateur :
Utiliser les bases de données.
Essayer la synthèse assistée par ordinateur.
La Synthèse Assistée par Ordinateur.
C'est E.J. Corey (prix Nobel de Chimie, quelques années plus tard) qui a
eu l'idée, le premier, de développer un programme d'aide à la synthèse
organique. (Corey et Wipke, Science, 1969, 166,178).
Ordinateur = mémoire immense et infaillible, capable d'envisager des
milliers de combinaisons, peut apporter une aide en synthèse par une étude
systématique, compense le manque d’imagination par une étude systématique.
Stratégie développée : analyse rétrosynthétique, arbre de synthèse :
Nos
approches en synthèse assistée par ordinateur.
Notre laboratoire s'est lancé dans cette aventure dès 1971 et en 1973 une
première approche du logiciel SOS Synthèse Organique
Simulée) était disponible. (R. Barone, Chimie Actualités, sept. 1973,
1515, 29). Approche limitée à la chimie hétérocyclique pour le fichier de
réactions disponible.
Comment ça marche ?
Le programme recherche une sous-structure cible dans la molécule cible et
la remplace par la sous-structure précurseur. Par exemple, pour la réaction de
Diels-Alder, le programme doit rechercher le motif suivant :
S'il est
présent dans la cible,il doit le remplacer par le motif précurseur :
Ceci est une
description trop simple, il est nécessaire d'ajouter des tests afin d'éviter des
solutions erronées. Par exemple, si la cible est :
Le précurseur
proposé serait
A. Allais, Masson,
1962). Exemples de "réactions" :
Approche
limitée, manque de créativité => codage des réactions par mécanismes
réactionnels : substitution nucléophile, élimination, addition nucléophiles,
etc. => 20 motifs pour remplacer les 200 précédents. Par exemple :
A =
n'importe quel atome.
L = groupe libérable laissé au choix du chimiste.
Résultats :
- Thiazole :
Autres
suggestions :
Ces deux exemples
montrent que le programme peut proposer des solutions originales, même pour des
structures simples.
- Indazole :
Autres
suggestions :
SOS avait
été développé sur IBM 1130 de 16 Kmots (un ordinateur qui occupait une salle
entière climatisée !). Il a été adapté ensuite sur Apple II (Bull. Soc. Chim.
Belg., 1982, 91(4), 333) puis sur IBM/PC (sous DOS). Par la suite une
version beaucoup plus performante et beaucoup plus conviviale a été développée
sur Macintosh : MARSEIL (J. Org. Chem., 1988, 53, 720). Il est en cours
d’adaptation sous Windows.
Autres approches
Recherche de l'étape-clé
L'analyse rétrosynthétique décrite ci-dessus correspond à une approche
cherchant à trouver l'ensemble des solutions, étape par étape. Or le chimiste,
quand il analyse une molécule en vue de sa synthèse, n'envisage pas toutes les possibilités.
Il effectue plutôt une analyse qui lui permet de sélectionner rapidement les
voies intéressantes de l'arbre de synthèse. Son expérience le conduit à
déterminer quelles sont les étapes clés d'une synthèse. E.J. Corey, dans la
première synthèse du longifolène (JACS, 1964, 86, 478) a proposé une
approche analytique qui consiste à sélectionner les liaisons stratégiques dans
une structure complexe et à construire le squelette des précurseurs en effaçant
une ou plusieurs liaisons stratégiques. Voici son analyse dans le cas du
longifolène :
D'autres
"solutions" intéressantes peuvent être envisagées à partir des liaisons en alpha
des liaisons stratégiques, par exemple :
Programme SAS
Nous avons programmé cette approche : logiciel SAS (Synthèse Analytique Simulée) (Barone, et al. Comput. Chem.,
1979, 3, 83). Appliqué au squelette de l'ellipticine (Barone, Chanon,
Heterocycles, 1981, 16, 1357) quelques résultats qui suggèrent des réactions de
Diels-Alder :
Une synthèse faisant intervenir
l'idée n° 2 a été réalisée ultérieurement par l'équipe du Prof. Ghosez (Tet.
Lett., 1985, 26(13), 1647) :
L'idée n° 2
a été réalisée récemment (Blechert, et al., Synthesis, 1995, 5, 592) :
Cette
approche est intéressante mais présente une limitation : elle ne peut mettre en
évidence des réactions de fragmentation ou de réarrangement. L'intérêt est qu'on
travaille au niveau du squelette de la molécule et qu'on va directement à
l'étape-clé de la synthèse. Par exemple l'idée :
Ensuite le
chimiste doit améliorer cette idée, on pourrait envisager par exemple :
Cette idée
de rechercher l'étape-clé nous a conduit à envisager une nouvelle approche.
Programme REKEST (REsearch for the KE STep) (Chimia, 1986, 40,
436).
L'idée de cette approche nous est venue en étudiant une belle synthèse du
longifolène réalisée par Oppolzer (J. Am. Chem. Soc., 1978, 100, 2583), dont
l'étape-clé fait intervenir une réaction de de Mayo intramoléculaire ([2+2] puis
rétroaldol) :
Cette
synthèse pourrait être trouvée par l'approche rétrosynthétique classique, si la
réaction de de Mayo a été codée et si l'on arrive à la dicétone. Or un des
inconvénients de l'approche rétrosynthétique est le grand nombre de solutions
proposées et parfois il peut arriver à l'utilisateur de négliger un
intermédiaire.
Avec SAS le programme proposerait
l'intermédiaire suivant (parmi d'autres solutions) :
qui est assez éloigné de la
solution. Nous avons donc imaginé un autre codage des réactions pour
"décortiquer" la molécule cible : "réactions" qui effacent ou ajoutent une ou
deux liaisons dans la cible :
Et la
synthèse précédente serait suggérée à partir des intermédiaires suivants (en
travaillant au niveau du squelette uniquement) :
Cette
approche simple peut mettre en évidence des intermédiaires intéressants, par
exemple :
Son principal
inconvénient est d'engendrer un grand nombre de solutions, dont beaucoup sont
peu intéressantes.
Ces programmes avaient été développés sur micro ordinateur Apple II qui
n'est plus disponible et avaient été abandonnés. Récemment, Paul Wender, dans un
article intitulé : "Toward the
ideal synthesis : connectivity analysis and multbond-forming processes" (Organic Synthesis, Theory and
Applications, T. Hudlicky ed., 1993, vol. 2, 27-66), a repris sous une autre
forme l'idée de l'approche analytique
et a montré son intérêt. Cet article, venant d'un excellent chimiste de
synthèse, nous a incité a reprendre nos
programmes, SAS et REKEST et de les fondre dans une nouvelle version que
nous avons appelée CONAN (CONnectivity ANalysis) (Barone et
al. J. Chem. Inf. Comput. Sci., 1995, 35, 467).
- CONAN
Depuis, nous avons écrit une nouvelle version de CONAN (elle n'a pas
encore été publiée, disponible sur PC,sous DOS et sur Macintosh) pour rechercher
des découpages intéressants de la molécule cible. Outre les options de la
première version :
- Ajouter une liaison dans la cible.
- Effacer une ou deux liaisons.
D'autres options ont été introduites :
- Rechercher les coupures convergentes.
- Rechercher des précurseurs linéaires.
- Rechercher des précurseurs possédant un cycle et une chaîne linéaire.
- Appliquer une réaction donnée.
- Analyse des précurseurs sur deux niveaux : quand un précurseur est
présent à l'écran on peut l'analyser directement.
Quelques exemples dans le cas du sqelette du taxol et des stéroïdes :
- Ajout d'une liaison :
Le programme propose un grand nombre de solutions, par exemple :
Ce
précurseur étant à l'écran, il est possible de l'analyser directement, il
devient molécule cible et l'on peut appliquer la réaction [2+2] ce qui donne
comme précurseurs potentiels :
ou, redessinés :
- Effacer une ou deux
liaisons.
Nous utilisons l'approche proposée par P. Wender pour classer les
liaisons en fonction de leur complexité. Par exemple pour le squelette d'un
stéroïde, nous avons :
Dans ce cas il existe
trois types de liaison, de complexité 6, 5, 4.
Le chimiste sélectionne le type des liaisons à effacer. Voici par exemple
les solutions où l'on a demandé d'effacer deux liaisons de complexité 6.
La
structure 3 correspond à un schéma décrit dans la littérature.
Cette approche conduit à des précurseurs de moindre complexité, mais qui
possèdent souvent de grands cycles, ce qui n'est pas toujours intéressant d'un
point de vue chimique.
Coupures convergentes :
Le programme coupe deux ou trois liaisons des cycles internes. Pour un
stéroïde, les cycles internes, sont les cycles B et C :
Voici les
coupures convergentes proposées par le programme (les solutions 4, 5, 6 ont été
décrites dans la littérature) :
- Précurseurs linéaires :
Les programme efface les liaisons de manière à construire des précurseurs
linéaires. Une version spécifique a été développée sous Windows (programme
SLIP : Search for LInear Precursors, Barone et al. MATCH, 2000, 41,
99-106). Voici les solutions concernant le taxol :
-
Précurseurs avec un cycle et une chaîne.
Dans cette option le programme efface les liaisons de manière à
construire des précuseurs qui possèdent un cycle et une chaîne linéaire.
Solutions pour les stéroïdes :
et pour le
taxol :
Tous ces
découpages correspondent à des propositions de synthèse que le chimiste doit
analyser ensuite avec ses propres connaissances. Par exemple, pour la solution
10, ci-dessus, on peut imaginer une réaction radicalaire :
Recherche de
l'étape-clé, une autre approche
Les approches ci-dessus (SAS, REKEST, CONAN) sont intéressantes, mais
sont assez éloignées de la réalité chimique car elles ne font pas appel aux
réactions.
Une autre approche pour
rechercher l'étape-clé d'une synthèse nous a été suggérée par le Professeur
Goverdhan Mehta (Hyderabad, Inde) qui a réalisé de nombreuses synthèses de
produits naturels.
Son idée était d'utiliser le programme MARSEIL d'une
manière simplifiée : u lieu de construire un arbre de synthèse aussi complet que
possibe, on se borne à "regarder" si une réaction, codée de manière simplifiée,
peut être utilisée dans la construction du squelette carboné de la molécule
cible. Par exemple, pour la synthèse du taxol, qui possède des fonctions C -
OR, qui peuvent provenir de C = O,
le chimiste peut se demander : "Est-ce que ce C=O pourrait être introduit par
une réaction oxy-Cope ?" :
sera codée
de manière simplifiée :
et les
cibles suivantes seront successivement testées :
Voici par
exemple quelques solutions proposées pour 11 :
et pour 12
:
Ces exemples montrent que cette
approche est extrêmement intéressante pour vérifier rapidement si une réaction
peut être utilisée dans l'étape-clé. Elle permet de mettre en évidence, dans le
cas de molécules complexes, des solutions qui ne sont pas évidentes à percevoir,
même pour un bon chimiste.
Cette approche nécessite, dans certains cas, de tester plusieurs cibles, nous l'avons
ensuite généralisée en supprimant
toutes les fonctions. On ne conserve que le squelette, pour la cible et les
réactions (Tetrahedron, 1992, 48(41), 8953). La réaction oxy-Cope sera codée,
dans le sens rétrosynthétique, de la manière suivante :
L'inconvénient de cette approche est qu'on a beaucoup de propositions, mais
surtout qu'on a du mal à faire la relation entre les précurseurs et la cible.
Aussi avons-nous ajouté une option qui permet d'appliquer, sur les précurseurs
obtenus, la réaction dans le sens direct.
Nous partons du squelette de la cible, nous y appliquons une
transformation et nous obtenons des précurseurs partiellement fonctionnalisés.
Sur ces précurseurs nous appliquons la réaction dans le sens direct (codée,
elle, avec les fonctions chimiques) et nous pouvons alors observer où se placent
les fonctions dans la cible.
Les réactions se codent en deux parties : sens rétrosynthétique sans les
fonctions chimiques et sens direct avec les fonctions. Le programme fonctionne
dans le sens rétrosynthétique (squelette cible => précurseurs) et dans le
sens direct (précurseurs -> cible avec fonctions). Voici d'autres solutions
intéressantes proposées par le programme :
cible avec fonctions
Le chimiste peut introduire ses
réactions. S'il est intéressé par la formation d'une double liaison par
oxy-Cope, il peut coder la réaction de la manière suivante :
Dans le cas
du taxol, la cible à soumettre est :
les
précurseurs et les produits possibles sont :
Cette approche est doublement
intéressante : elle permet de mettre rapidement en évidence des précurseurs qui
ne sont pas toujours évident à percevoir, mais aussi elle permet de proposer des
analogues de la molécule cible. Bien entendu le problème n'est pas complètement
résolu, cependant un certain défrichage peut être effectué et des
idées originales peuvent surgir. Ainsi dans le cas de l'analyse de la
crinipelline :
par réaction
radicalaire le programme avait proposé la séquence suivante, qui était nouvelle
:
A notre
demande elle a été réalisée avec succès par D.P. Curran sur un modèle plus
simple (D.P. Curran, Aust. J. Chem., 1995, 48, 261) :
img width=296 height=65 src="image138.gif" > Avec cette approche la
réaction de Mayo est codée :
et
l'étape-clé de la synthèse du longifolène selon Oppolzer est trouvée
directement.
De même la réaction de Diels-Alder est codée :
HOLOWIN
Cette approche avait été développée sur Macintosh. Récemment,
nous l'avons installée, en l'améliorant, sur IBM/PC, sous Windows (logiciel
HOLOWin : Tetrahedron, 1996, 52(46), 14625-14630 : lorsqu'un précurseur est
à l'écran on peut l'analyser directement dans une nouvelle fenêtre, ce qui
permet une exploration à la fois en largeur et en profondeur. Une nouvelle
version est en cours de développement.
Cette analyse sur différents
niveaux permet de mettre en évidence, très rapidement, non pas une seule
étape-clé, mais plusieurs. Elle permet ainsi de révéler des réactions tandem, ou
en cascade, pour accéder à la molécule cible.


Last revised:25/06/2002