Partie V :
Détermination de la structure du domaine TolAIII3 isolé en solution

 

 

 


V.A. Etude de la structure de TolAIII seul en solution

Jusqu’alors, la seule structure tridimensionnelle connue de TolAIII d’Escherichia coli était celle obtenue par diffraction aux rayons X sur les cristaux du domaine N-terminal de la protéine de capside de phage g3p (g3p N1) en complexe avec le domaine C-terminal de TolA (TolAIII) (Lubkowski et al., 1999). Ce complexe a été obtenu grâce à une technique originale : afin d’imposer une stœchiométrie équimolaire et d’augmenter la concentration locale de chacun des domaines, les auteurs ont reliés ces domaines par un séparateur de 18 résidus riche en résidus de glycine. Ce séparateur précède la partie N-terminale de TolAIII, qui n’est pas structurée. Au total, 59 résidus consécutifs ne donnent aucune densité électronique interprétable et il est probable que cette région flexible n’introduise pas de biais dans la structure du complexe.

La structure ainsi déterminée (figure16) sert actuellement de référence aux études sur TolAIII. Elle met en évidence l’interaction de g3p N1 avec la première hélice de TolAIII et son dernier brin ß, lequel prolonge le feuillet ß de g3p N1. Néanmoins, comme nous l’avons présenté dans la partie précédente, le spectre HSQC 1H–15N de TolAIII3 est considérablement modifié lors de l’interaction avec g3p N1 puisqu’on observe un déplacement de l’ensemble des résonances. Dans la plupart des études d’interactions par RMN (Zuiderweg, 2002), seules les résonances de la zone d’interactions sont notablement affectées et permettent précisément de localiser cette zone sur la protéine. L’observation de profonds changements dans le spectre de TolAIII est en faveur de réarrangements conformationnels significatifs de TolAIII lors de son contact avec g3p N1.

Par conséquent, nous avons entrepris de déterminer la structure de TolAIII3 seul en solution afin d’élucider ces changements spectraux et conformationnels.


V.B. Calcul de la structure de TolAIII3 avec attribution semi-automatique des contacts NOE

La structure d’une protéine en solution est déterminée par un calcul de modélisation moléculaire prenant en compte deux types de données. D’une part, des données disponibles a priori (longueurs de liaison covalente, angles de valence, planéité, rayons de van der Waals, etc.) constituent un « champ de force ». D’autre part, des données extraites des expériences de Résonance Magnétique Nucléaire (déplacements chimiques, contacts NOE, couplages scalaires, couplages dipolaires, etc.) constituent un « jeu de contraintes » (liaisons hydrogènes, distances interprotons, angles dièdres, orientations à longue portée, etc.).

La conformité d’un modèle moléculaire avec ces deux types de données est estimée grâce à une « fonction d’énergie » hybride qui pénalise les écarts à la norme. La détermination des conformations de plus basse énergie est un problème trop complexe pour envisager une approche exhaustive. L’exploration de l’espace conformationnel est réalisée ici par un calcul de dynamique moléculaire (« recuit simulé ») répété à partir de coordonnées initiales aléatoires. D’autres approches sont également envisageables (Nilges, 2001).

Aujourd’hui, il est devenu possible (Hus et al., 2001) de déterminer ab initio la structure de la chaîne principale d’une protéine en utilisant seulement les couplages dipolaires résiduels, mais cette méthode ne permet pas de définir la structure des chaînes latérales.

Les contacts NOE représentent encore un jeu de contraintes de distances primordial pour le calcul de structures par RMN ab initio. En première approximation, la distance entre deux protons dans l’espace est inversement proportionnelle à la racine sixième de l’intensité de la relaxation croisée par effet nucléaire Overhauser (NOE) entre ces protons. Cette relaxation se manifeste dans les spectres NOESY par un pic de corrélation entre les fréquences de résonances des deux protons. Une fois connue l’attribution séquentielle des résonances de la protéine, il reste à attribuer ces pics de corrélation NOE.

On distingue classiquement 4 à 5 types de contacts NOE (Markley et al., 1998) : les NOE intrarésiduels (entre protons appartenant au même résidu), les NOE séquentiels (entre protons appartenant à des résidus voisins dans la séquence), les NOE à moyenne portée (entre protons appartenant à des résidus distants de 2 à 4 résidus dans la séquence), les NOE à longue portée (entre protons appartenant à des résidus distants de 5 résidus et plus dans la séquence) et, le cas échéant, les NOE intermoléculaires (entre protons de macromolécules distinctes). Cette classification est bien sûr basée sur la distance entre les protons dans la séquence de la protéine et non pas dans l’espace. Les NOE intrarésiduels et séquentiels sont les plus faciles à identifier mais n’apportent pas d’information sur la structure tertiaire de la protéine. Ils sont utiles lors de l’étape d’attribution séquentielle des résonances et donnent une indication de la structure secondaire (proximité du proton amide i avec le proton amide i+1 dans les hélices a ; proximité du proton a i avec le proton amide i+1 dans les brins ß). Les NOE à moyenne portée sont utiles dans la définition de la structure secondaire de la protéine, en particulier dans les hélices a (proximité du proton amide i avec les protons amide i+3 et dans une moindre mesure i+2 et i+4). Les NOE à longue portée sont essentiels pour la définition de la structure tertiaire de la protéine. Ce sont également les plus difficiles à déterminer a priori, sans ambiguïté.

L’étape d’attribution des contacts NOE est délicate. En effet, plusieurs facteurs rendent cette attribution ambiguë. Tout d’abord, des résonances ayant le même déplacement chimique peuvent se superposer. Ensuite, la précision sur le déplacement chimique est limitée par la résolution spectrale (largeur de raie) et digitale (nombre de points) du spectre et par les chevauchements de pics qui décalent les résonances apparentes. Par ailleurs, le déplacement chimique d’un atome peut différer entre les spectres ayant servi à son attribution séquentielle et ceux exploités pour définir des contraintes structurales (NOE), si les conditions d’enregistrement ne sont pas exactement identiques (tampon, température effective, etc.). La multiplicité de certains pics, due aux couplages, peut également venir également brouiller les pistes.

Une partie des superpositions peut être évitée par l’ajout de dimension(s) spectrale(s) supplémentaire(s) permettant l’édition en fréquence d’un (3D) ou de plusieurs (4D) hétéroatomes (15N, 13C).

Par ailleurs, certains moyens de contrôle permettent de conforter l’attribution d’un contact NOE. L’incertitude sur la valeur du déplacement chimique dans l’expérience analysée (par rapport à l’expérience ayant servi à l’attribution séquentielle) peut être levée par comparaison avec un NOE intrarésiduel ou séquentiel issu du même enregistrement et faisant intervenir le proton à identifier. Des considération de symétrie sont également très favorables dans la levée de certaines ambiguïté. Dans le cas de l’expérience NOESY 2D, on comparera les deux côtés de la diagonale (en profitant d’une résolution digitale meilleure dans la dimension directe). Dans le cas de l’expérience 3D NOESY-HSQC 1H-13C, une corrélation entre (Ca,Ha) du résidu X et Hß du résidu Y sera, par exemple, privilégiée si une corrélation « symétrique » entre (Cß,Hß) du résidu Y et Ha du résidu X est retrouvée dans le même spectre.

Une fois les pics de corrélation NOE attribués, il faut les convertir en contraintes de distances pour la détermination de structure par modélisation moléculaire. La distance entre protons est inversement proportionnelle à la racine sixième de l’intensité du pic NOE. Ici encore, il faut prendre en compte les éventuelles superpositions de pics, qui peuvent conduire à surestimer certaines intensités, et donc à sous-estimer certaines distances entre protons. Le coefficient de proportionnalité peut être calibré sur la base de distances prédéfinies pour certaines paires de protons.

Dans un premier temps, quelques contraintes à longue portée suffisent en général pour déterminer le repliement approximatif de la protéine, lors d’un calcul initial de dynamique moléculaire. Pour cette étape initiale, on aura volontiers introduit des contraintes de liaison hydrogène dans les hélices alpha[39], ainsi que toutes les autres contraintes structurales dont on dispose (pont disulfure, angles dièdres, orientations issues des couplages dipolaires résiduels, etc.). Ensuite, on pourra s’appuyer sur le modèle moléculaire calculé pour éliminer certains candidats dans les attributions et lever ainsi certaines ambiguïtés. Il s’agit là d’un processus itératif. Chaque nouvelle contrainte permet de définir un peu plus précisément la structure et chaque structure calculée permet de lever des ambiguïtés sur les contraintes avec une confiance de plus en plus élevée. Bien sûr, il faut être très prudent dans les étapes initiales, afin de ne pas propager d’éventuelles erreurs d’attribution.

En général, l’attribution des résonances n’est pas stéréospécifique au début de ce processus : les substituants identiques portés par un même carbone (par exemple les deux protons d’un carbone secondaire) n’ont pas pu être distingués et il faut en tenir compte pour l’attribution des NOE. Une solution consiste à laisser indéterminée la chiralité des carbones concernés, en autorisant des échanges entre substituants jusqu’à trouver la configuration qui satisfait le mieux les contraintes NOE. On parle de « chiralité flottante ». L’attribution stéréospécifique est alors faite a posteriori.

Plusieurs approches pour automatiser le processus laborieux d’attribution des NOE ont été proposées et sont présentées en partie VII.

La détermination par RMN de la structure de TolAIII3 a été l’occasion de mettre en œuvre la méthode ARIA, inédite au laboratoire, pour le calcul de structure et l’attribution semi-automatique des contacts NOE. Les principes et l’utilisation de la suite logicielle ARIA (Linge et al., 2001) sont décrits dans la partie VII.D.

Les résultats et les paramètres du calcul sont présentés dans un article en préparation. Le repliement de TolAIII3 est le même que dans la structure cristallographique précédente. En revanche, il apparaît que la liaison de g3p N1 avec TolAIII3 induit un déplacement de l’hélice N-terminale et un une extension du feuillet ß de TolAIII3.