Informations

Dans les interactions protéine-protéine, quelle est la différence entre un site de liaison et une interface ?


Je vois le site de liaison et l'interface utilisés presque de manière interchangeable dans la littérature, mais je ne sais pas si c'est exactement la même chose ou non - quelle est la différence ?


Un site de liaison d'interaction protéine-protéine (PPI) est un taper d'interface. S'il a été établi que l'interface est un site de liaison PPI, alors les termes peuvent à partir de ce moment être utilisés de manière interchangeable. Mais le mot "interface" est très générique et n'a pas de sens scientifique spécifique donc la nature de l'interface doit être définie ou bien le terme n'a pas de sens.


Les préférences d'interaction entre les interfaces protéine-protéine des composants obligatoires et non obligatoires sont différentes

Une chaîne polypeptidique d'un complexe protéine-protéine est dite obligatoire si elle est liée à une autre chaîne tout au long de sa durée de vie fonctionnelle. Une telle chaîne pourrait ne pas adopter le pli natif sous la forme non liée. Une chaîne polypeptidique non obligatoire s'associe à une autre chaîne et se dissocie lors d'un stimulus moléculaire. Bien que des changements conformationnels à l'interface d'interaction soient attendus, la structure 3-D globale de la chaîne non obligatoire n'est pas modifiée. La présente étude se concentre sur les complexes protéine-protéine pour mieux comprendre les différences entre les interfaces obligatoires et non obligatoires.

Résultats

Une chaîne non obligatoire dans un complexe de structure 3-D connue est reconnue par son existence stable avec le même pli dans les formes liées et non liées. Au contraire, une chaîne obligatoire est détectée par son existence uniquement sous la forme liée sans aucune preuve du pli de type natif de la chaîne sous la forme non liée. Diverses propriétés interfaciales d'un grand nombre de complexes de structures 3-D connues ainsi classées sont analysées comparativement dans le but d'identifier des descripteurs structuraux qui distinguent ces deux types d'interfaces. Nous rapportons que les modèles d'interaction à travers les interfaces des composants obligatoires et non obligatoires sont différents et que les contacts établis par les chaînes obligatoires sont principalement non polaires. Les chaînes obligatoires ont un nombre de contacts par interface plus élevé (20 ± 14 contacts par interface) que les chaînes non obligatoires (13 ± 6 contacts par interface). L'implication des atomes de la chaîne principale est plus élevée dans le cas des chaînes obligatoires (16,9 %) par rapport aux chaînes non obligatoires (11,2 %). La formation de feuillets à travers les sous-unités n'est observée que parmi les chaînes protéiques obligatoires de l'ensemble de données. En dehors de celles-ci, d'autres caractéristiques telles que les préférences de résidus et la zone d'interface produisent des différences marginales et elles peuvent être considérées collectivement tout en distinguant les deux types d'interfaces.

Conclusion

Ces résultats peuvent être utiles pour distinguer les deux types d'interfaces observées dans les structures déterminées à grande échelle dans les initiatives de génomique structurale, en particulier pour les assemblages de protéines à plusieurs composants pour lesquels la caractérisation biochimique est incomplète.


Q&A sur les interactions protéine-protéine

GEN s'est récemment entretenu avec Ryan Bomgarden, PhD, directeur principal de la R&D chez Thermo Fisher Scientific, sur les nombreuses avancées réalisées dans la compréhension des interactions protéine-protéine ainsi que sur ce que l'avenir nous réserve.

GEN : Le site Web de Thermo Fisher Scientific déclare : « Les tests pull-down sont idéaux pour étudier les interactions fortes ou stables ou celles pour lesquelles aucun anticorps n'est disponible pour la co-immunoprécipitation. Pourriez-vous donner quelques exemples d'analyses spécifiques qui ont été exploitées par les enquêteurs pour étudier de telles interactions ?

Ryan Bomgarden, PhD

Bomgarden: Il convient tout d'abord de noter la différence entre les tests pull-down et l'immunoprécipitation. Alors que les tests pull-down utilisent une protéine ou un marqueur chimique pour la liaison à la protéine cible, l'immunoprécipitation utilise un anticorps pour lier l'antigène de la protéine cible. Outre cette différence dans la capture de la protéine cible, il s'agit pratiquement du même processus. L'idée générale est d'enrichir la protéine cible d'intérêt (l'appât) pour pêcher la protéine en interaction (la proie).

Les tests pull-down sont préférés pour les protéines recombinantes où des marqueurs de fusion (tels que GST, HIS) ou des marqueurs chimiques (tels que la biotine) sont utilisés comme groupes d'affinité pour capturer l'appât qui se lie aux protéines de proie. GST, MBP et d'autres grands marqueurs de fusion sont idéaux pour solubiliser des protéines/peptides plus petits qui sont utilisés pour la cartographie du domaine d'interaction protéine-protéine. Les pull-downs d'étiquettes chimiques sont populaires pour les techniques où la biotine est transférée aux protéines via des interactions protéine-protéine (telles que APEX, TSA, BioID ou sulfo-SBED).

GEN : Y a-t-il des classes ou des types particuliers de protéines qui sont favorisés par les tests pull-down par rapport à la co-immunoprécipitation ?

Bomgarden: Les tests pull-down sont préférés pour les protéines recombinantes ou les protéines pour lesquelles il peut ne pas y avoir de bons anticorps validés IP. Certaines protéines ne peuvent pas être bien exprimées en tant que protéine recombinante, telles que les protéines membranaires.

De plus, les dosages pull-down seraient préférés lorsqu'un petit domaine ou un domaine peptidique recombinant est utilisé comme protéine cible pour la cartographie des interactions protéiques. Ces petites protéines ou peptides peuvent avoir une faible solubilité ou peuvent ne pas être de bons antigènes pour l'enrichissement à l'aide de techniques d'immunoprécipitation, nécessitant à la place l'utilisation de tests pull-down.

GEN : Existe-t-il des alternatives à l'utilisation de la spectrométrie de masse pour l'analyse expérimentale de l'interaction protéine-protéine ? Quels seraient les avantages et les inconvénients relatifs de telles procédures ?

Bomgarden: La spectrométrie de masse (MS) basée sur la protéomique est la méthode la plus polyvalente et la plus complète pour découvrir de nouvelles interactions protéiques pour des protéines cibles spécifiques. Les avantages incluent la capture à partir de systèmes endogènes (en utilisant IP-MS et APEX), la cartographie des surfaces d'interaction (telles que HDX, FPOP ou la réticulation), l'identification des PTM et des isoformes et la détermination de la stoechiométrie (en utilisant la MS native). La plupart des applications d'interaction protéique MS ne nécessitent aucun anticorps ou un seul pour IP-MS, contrairement à la plupart des approches basées sur des immunoessais qui nécessitent deux anticorps spécifiques (tels que co-IP Western blot, ELISA, Luminex ou PLA).

De plus, la découverte de la protéomique ascendante ne nécessite aucune connaissance préalable des interacteurs et peut identifier plusieurs interacteurs au sein des complexes protéiques.

Outre l'accessibilité des instruments, certains inconvénients de la spectrométrie de masse incluent une faible sensibilité pour les protéines peu abondantes et l'interférence des protéines de fond qui se lient aux résines d'affinité utilisées dans l'IP-MS.

Les approches de criblage de bibliothèques recombinantes (telles que la levure 2-hybride ou la présentation sur phage) peuvent également être utilisées pour trouver et cartographier les interactions protéiques, mais nécessitent généralement une expression dans des systèmes non natifs. En plus des faux positifs, certaines protéines (plus grosses, membranaires) ne sont pas facilement exprimées dans ces tests. Les techniques de mammifères 2-hybrides ont résolu certains de ces problèmes, mais sont encore principalement limitées à l'étude des interactions par paires.

GEN : Les méthodes de calcul pour l'analyse des interactions protéine-protéine sont organisées en trois catégories, notamment les méthodes basées sur la qualité des clusters, les méthodes basées sur l'affinité des nœuds et les méthodes de clustering d'ensemble. Pourriez-vous s'il vous plaît discuter de certaines applications typiques de ces méthodes et lesquelles peuvent être les plus appropriées ?

Bomgarden: Il y a eu des avancées majeures dans l'utilisation d'algorithmes pour modéliser des ensembles de données mondiaux et prédire les interactions protéine-protéine. Beaucoup d'entre eux impliquent l'organisation des données d'interaction en clusters ou en nœuds pour générer un réseau avec une topologie qui peut être utilisé pour regrouper les protéines en complexes ou par fonction.

À l'avenir, il pourrait y avoir d'autres opportunités d'intégrer ces ensembles de données d'interaction protéique avec d'autres, telles que les données liées à la localisation subcellulaire des protéines, la proximité (BioID ou APEX), la structure.

GEN : Les différentes modifications post-traductionnelles, la phosphorylation, l'acylation, la glycosylation et l'ubiquitination, présentent-elles des défis particuliers lors de l'analyse des interactions protéine-protéine ?

Bomgarden: Les modifications post-traductionnelles (PTM) sont extrêmement importantes pour l'étude des interactions protéiques. Certaines modifications protéiques sont nécessaires pour les interactions protéiques, telles que les protéines du domaine SH2 se liant aux sites de phosphorylation du récepteur tyrosine kinase. D'autres modulent l'interaction protéique, comme l'acétylation des histones liées à l'ADN. Par conséquent, il est préférable d'étudier les interactions protéiques dans les systèmes natifs exprimés à des niveaux endogènes pour maintenir et identifier les PTM pertinents pour les interactions protéiques.

Dans le passé, la plupart des études d'interaction protéique n'étaient pas menées dans des systèmes endogènes, mais en exprimant des protéines dans, par exemple, la levure. Ces systèmes manqueraient de PTM, ou des PTM corrects, ce qui pourrait conduire à des faux négatifs ou des faux positifs en ce qui concerne les interactions protéine-protéine. Le principal moyen d'identifier ou de mesurer les PTM aujourd'hui est la spectrométrie de masse, qui permet l'analyse des différentes isoformes de protéines et la stoechiométrie des PTM.

GEN : À la fin des années 1990, l'analyse de la fonction des protéines est passée des protéines uniques aux interactions protéine-protéine. Dans cette période intermédiaire, de nombreux progrès ont été réalisés dans notre compréhension de la protéomique et des interactions protéine-protéine. Comment cela a-t-il affecté votre approche de l'étude des interactions protéine-protéine ?

Bomgarden: Au cours des trois dernières décennies, il y a eu une transition dans l'étude des interactions spécifiques des protéines cibles in vitro vers l'étude des complexes protéiques et des réseaux d'interaction globaux in vivo. Cette transition a été facilitée par de nouvelles technologies qui ont amélioré la sensibilité et la spécificité de l'identification des protéines et des mesures d'abondance. En outre, des technologies plus récentes ont également fourni des informations supplémentaires sur la structure, la stoechiométrie et la dynamique des complexes protéiques. Au fur et à mesure que notre base de connaissances sur les interactions a augmenté au fil des ans, des progrès significatifs ont été réalisés en utilisant des outils logiciels pour prédire et modéliser les interactions entre les protéines.

GEN : Quels sont certains des contaminants spécifiques qui sont présents dans les études d'interaction protéine-protéine, et comment votre méthodologie les élimine-t-elle ?

Bomgarden: Pour les tests pull-down utilisant des protéines recombinantes, les contaminants peuvent provenir d'une liaison non spécifique à des résines d'affinité ou à des protéines d'appât recombinantes impures. La liaison non spécifique aux résines d'affinité est également une source de contaminants pour les techniques basées sur les anticorps. De plus, les anticorps avec une faible spécificité peuvent également se lier à d'autres protéines contribuant à un bruit de fond élevé. L'utilisation d'anticorps et de résines IP vérifiés (qui ont des surfaces de liaison faible aux protéines ou passivées) est le meilleur moyen de minimiser les protéines contaminantes.

Les protéines contaminantes qui contribuent à une partie des interactions faussement positives peuvent être éliminées à l'aide d'approches expérimentales, telles que des pull-downs réciproques (ou immunoprécipitations) et des méthodes orthogonales pour vérifier les protéines présentes dans un complexe particulier (comme l'IP-MS, l'imagerie ou analyse structurelle).

Les contaminants de fond peuvent être éliminés facilement selon la technologie utilisée. Avec la spectrométrie de masse, les protéines de fond qui sont présentes dans plus d'un essai pull-down peuvent être éliminées simplement en utilisant le logiciel approprié. Cependant, si des anticorps sont utilisés, le seul moyen d'éliminer les faux positifs est d'utiliser un meilleur anticorps ou de meilleurs réactifs.

GEN : Comment Thermo Fisher envisage-t-il l'avenir de l'étude des interactions protéiques

Bomgarden: La société prend en charge tous les outils de biochimie classiques utilisés pour étudier les interactions protéine-protéine in vitro, y compris les méthodes co-IP et les tests pull-down. Cependant, la société se concentre désormais sur les technologies de pointe dans ce domaine, à savoir le profilage global basé sur la spectrométrie de masse pour les interactions protéine-protéine.

L'un des objectifs est d'utiliser la réticulation en combinaison avec la SEP pour essentiellement geler les protéines interagissant dans une cellule, puis les enrichir et les profiler dans leur état natif sans anticorps. Il existe des applications disponibles qui peuvent également quantifier les changements dans les interactions à l'aide de marqueurs de réticulation et de masse en tandem, pour mesurer les changements dans les interactions protéiques de manière plus globale.

Bien que l'étude des interactions par paires puisse être importante dans certains scénarios, cette technologie nous permet d'évoluer vers des analyses globales pour examiner les réseaux de protéines. À l'aide de la SEP, les chercheurs peuvent identifier plusieurs isoformes dans différentes cellules ou cas de maladie et déterminer comment leurs interactions changent. Regarder ces interactions de manière dynamique et dans différentes localisations à travers une approche globale est l'avenir de ce domaine d'étude.

Il existe par ailleurs plusieurs techniques ouvrant de nouvelles possibilités dans l'étude des interactions protéine-protéine. Par exemple, avec l'augmentation de la disponibilité des anticorps commerciaux au fil des ans, les chercheurs se sont éloignés de l'expression et de la purification de protéines recombinantes utilisées dans les pull-downs au profit des immunoprécipitations. Cependant, une nouvelle technique a émergé qui utilise l'expression de protéines recombinantes pour faciliter le transfert de biotine de protéines pour le pulldown de streptavidine, mais est maintenant effectuée in vivo.

Plutôt que de cultiver des protéines d'appât dans des bactéries, il est possible de surexprimer une fusion de cette protéine avec une enzyme dans des cellules de mammifères, avant d'ajouter une étiquette ou une sonde de biotine. L'enzyme activera la biotine dans une zone localisée, permettant d'étudier non seulement les interactions directes de la protéine d'intérêt, mais aussi sa proximité avec d'autres protéines, afin que les chercheurs puissent créer efficacement une carte de l'emplacement de la protéine. Cette approche est utilisée dans des méthodes telles que BioID et APEX.

Une autre technique consiste à appliquer la protéomique globale pour étudier la localisation subcellulaire. Avec cette méthode, les chercheurs peuvent suivre toutes les protéines qui se déplacent des différents compartiments cellulaires tels que de la membrane au noyau d'une cellule, en suivant efficacement les complexes protéiques et les interactions à l'échelle mondiale. L'avenir intègre les données de localisation des protéines avec les données du réseau d'interactions protéiques, pour fournir une dimension supplémentaire relative à la localisation et à la proximité.

Du point de vue de Thermo Fisher, il existe deux domaines d'intérêt importants pour améliorer l'étude des interactions entre les protéines. L'une consiste à améliorer la cartographie et la vérification des interactions protéiques, qui reposent en grande partie sur des informations d'interaction statiques binaires. Cela peut être entrepris à l'aide d'outils de biologie structurelle, tels que la MS native, la cryo-EM et la MS réticulante basée sur la protéomique. Ces techniques sont complémentaires aux méthodes traditionnelles d'interaction protéine-protéine et permettent aux chercheurs de mieux comprendre comment s'assemblent les complexes protéiques.

Le deuxième objectif est de mesurer les changements dans les complexes protéiques au fil du temps et avec le traitement. Les étiquettes de masse en tandem (TMT) sont une technologie qui mesure les changements de localisation et d'abondance des protéines au fil du temps à l'échelle mondiale à l'aide de la spectrométrie de masse. Cela ajoute une dimension supplémentaire aux informations sur les interactions protéiques, permettant aux chercheurs de construire une image plus complète et d'utiliser des données dynamiques.


2 Etudes PPI associant approches in vitro et in silico : du réseau aux caractéristiques structurelles et mutations des interfaces, bref aperçu

Il est important dans un premier temps de sélectionner le bon complexe protéine  protéine parmi plusieurs centaines de milliers d'interactions connues ou anticipées. Afin d'effectuer cette étape de manière rationnelle, la connaissance des réseaux PPI peut être critique. Pourtant, pour acquérir des connaissances supplémentaires sur les complexes sélectionnés, une analyse structurelle et des prévisions sont généralement nécessaires. Plusieurs de ces aspects peuvent être étudiés expérimentalement, mais les stratégies in silico peuvent grandement aider le processus.

2.1 Réseau PPI

La croissance explosive des données PPI dérivées d'études à petite échelle à l'échelle du génome a impliqué le développement de plus de 100 bases de données et de services in silico dédiés aux PPI. Ces nombreuses bases de données publiques sur les PPI sont importantes car elles aident la communauté scientifique à acquérir de nouvelles connaissances sur les PPI (c'est-à-dire que les données doivent être collectées, intégrées, conservées et traduites en connaissances). À l'heure actuelle, certaines bases de données se concentrent sur certaines espèces spécifiques et peuvent être très spécialisées, d'autres peuvent contenir des données provenant d'études à grande échelle. Dans l'ensemble et à l'heure actuelle, de nombreuses bases de données contiennent des informations redondantes. Certaines bases de données contiennent des données sur des complexes protéine  protéine identifiés « expérimentalement » (par exemple, avec Y2H, co-expression génique, ubiquitine fractionnée, tests de complémentation protéique, AP-MS… chaque méthode a des forces et des faiblesses et il existe des artefacts connus 45 ) tandis que d'autres sont construits à l'aide d'interactions collectées à partir de recherches bibliographiques, certaines bases de données contiennent les structures 3D de complexes protéiques (voir par exemple 45 – 47). Une difficulté majeure avec certaines données à grande échelle est que les IPP détectés en utilisant les mêmes méthodes ou avec des méthodes différentes par différents groupes de recherche mais sur le même organisme peuvent afficher un chevauchement très limité (faux positifs : interactions détectables mais faux négatifs fonctionnellement non pertinents : manque d'interactions qui se produisent) appelant à des efforts de conservation majeurs pour filtrer les interactions non fiables (supprimer le bruit) et quantifier les erreurs. Ces différences suggèrent également que les techniques pourraient fournir des descriptions complémentaires. 48 Il y a en fait de nombreuses raisons à ces écarts, y compris les différences évidentes entre les méthodes expérimentales utilisées (c'est-à-dire que certaines méthodes peuvent capturer des interactions transitoires, d'autres sont orientées vers l'identification d'interactions stables, etc.), mais pourtant, à l'heure actuelle, ces différences représentent une préoccupation sérieuse pour le domaine PPI car les analyses en aval des réseaux résultants peuvent empêcher des estimations significatives de la taille de l'interactome fonctionnel ou de l'importance de certaines interactions dans un état pathologique donné. L'adoption du format PSI-MI (Proteomics Standards Initiative Molecular Interaction) 49 et les directives connexes du consortium IMEx devraient contribuer à améliorer la qualité des données 50, mais beaucoup de travail est nécessaire dans ce domaine. Il a été supposé jusqu'à récemment que les données PPI organisées par la littérature étaient d'une plus grande précision que celles produites par des études à haut débit, car elles étaient dérivées d'enquêtes ciblées, mais des analyses récentes suggèrent que ce n'est plus le cas. 51

Certaines bases de données bien connues incluent la base de données des protéines interagissantes (DIP), 52 le réseau d'interaction biomoléculaire (BIND), 53 l'interaction moléculaire (MINT), 54 l'interaction protéine de mammifère (MIPS), 55 l'interaction hôte-pathogène base de données (HPIDB), 56 IntAct, 57 BioGRID, 58 STRING. 59 Les informations structurelles peuvent être trouvées dans la Protein Data Bank (PDB) et, par exemple, PISite collecte les données d'interface à partir de la PDB. 60 Des structures d'interactions domaine-domaine sont disponibles auprès de 3did, 61 et iPfam, 62 tandis qu'une classification spatiale de la base de données d'interactions de domaine protéique 3D, KBDOCK, a récemment été rapportée. 63 La base de données Instruct contient des réseaux d'interactomes protéiques résolus structurellement en 3D de haute qualité. 64 Les modèles d'homologie peuvent également être utilisés pour étudier d'autres IPP et augmenter la couverture. La base de données Interactome3D 46 fournit 12 000 PPI structurellement résolus dans 8 organismes tandis qu'Instruct contient plus de 6 500 PPI humains. 64 Une autre ressource, la plate-forme PRIMOS ( Protein Interaction and Molecule Search), représente un nouveau portail Web qui unifie six bases de données PPI primaires (BIND DIP HPRD (Human Protein Reference Database) IntAct MINT et MIPS, Munich Information Center for Protein Sequences) dans un référentiel unique et cohérent. 65 Dans le même ordre d'idées, iRefWeb est une ressource bioinformatique qui donne accès à une vaste collection de données sur les interactions protéine  protéine dans plus d'un millier d'organismes. Cette collection est consolidée à partir de 14 grandes bases de données publiques. 51 De même, les données PPI organisées peuvent également être trouvées via le service Web PSICQUIC, qui permet d'accéder à la volée aux fichiers mis à disposition par plus de 28 bases de données sources. 66 De plus, le service DASMIweb a actuellement accès à 36 sources de données distribuées. Dix d'entre eux fournissent des données d'interaction qui ont été déterminées expérimentalement ou sélectionnées à partir de la littérature scientifique, 24 sources de données contiennent des prédictions informatiques et 2 sources de données peuvent être utilisées pour évaluer la qualité des interactions. 67 Un autre exemple est UniHI 7 (Unified Human Interactome). L'outil en ligne intègre environ 350 000 interactions moléculaires pour plus de 30 000 protéines humaines. Outre les interactions protéine  protéine provenant de 12 ressources différentes (y compris les bases de données HPRD, BioGrid, IntAct, DIP, BIND et Reactome) ainsi que quatre cartes d'interaction produites par des prédictions informatiques et deux cribles à haut débit levure-2-hybride, UniHI 7 comprend également interactions régulatrices transcriptionnelles organisées à partir de trois bases de données complémentaires TRANSFAC, miRTarBase et HTRIdb. En plus de ces interactions, le service a également intégré des informations sur les cibles médicamenteuses de DrugBank qui peuvent être cartographiées et visualisées en ligne sans avoir à télécharger, traiter manuellement et charger les données dans une application autonome externe. 68 Les données peuvent être filtrées par les utilisateurs (par exemple, nombre de références PubMed, expérimentations à petite ou grande échelle, connexion directe ou indirecte, interaction binaire ou complexe).

Les réseaux PPI peuvent être dérivés de données collectées par les méthodes mentionnées ci-dessus, à savoir des méthodes qui sondent les interactions binaires (par exemple, Y2H) et des approches qui détectent les complexes multiprotéiques (par exemple, AP-MS). Les méthodes de détection AP-MS et binaires sondent toutes deux les constructions de protéines non natives, où des étiquettes sont ajoutées aux polypeptides natifs, modifiant potentiellement leurs propriétés. 45 Comme mentionné ci-dessus, les réseaux peuvent également être construits à partir de données PPI organisées et collectées dans la littérature. Toutes ces données peuvent être visualisées à l'aide, par exemple, du package Cytoscape. 69 De tels réseaux PPI, comprenant chez l'homme environ 130 000 à 650 000 interactions protéiques (seul un petit sous-ensemble a été entièrement identifié expérimentalement) 70, 71 peuvent apporter un nouvel éclairage sur les maladies humaines. 72, 73 En outre, la surveillance des parties du réseau qui changent lorsque les états et les conditions cellulaires sont modifiés pourrait également donner de nouvelles informations sur les états de santé et de maladie.

L'analyse des réseaux PPI à l'aide d'outils informatiques et statistiques aide à comprendre comment les réseaux médient les relations entre le génotype et le phénotype. Si nous prenons comme exemple des cartes d'interactomes binaires, structurellement, ces cartes se sont avérées avoir une topologie dite sans échelle avec une modularité hiérarchique. 74 Dans les réseaux de cette topologie, les protéines sont représentées comme des nœuds et les interactions comme des bords et en général, seules certaines protéines, appelées hubs, ont un très grand nombre de partenaires d'interaction (voir la littérature 75, 76 pour une discussion approfondie des réseaux PPI et la visualisation du réseau) (Figure 3). Cela signifie également que ces réseaux sont résilients contre les défaillances de nœuds aléatoires (par exemple, par mutation) mais sensibles aux attaques ciblées des concentrateurs. De manière fascinante, à la fois chez les plantes et chez l'homme, les protéines d'agents pathogènes viraux, bactériens et fongiques se sont toutes avérées cibler de telles protéines de plaque tournante. 2 Les protéines essentielles ont tendance à être plus interconnectées que les protéines non essentielles. Il semblerait que les protéines humaines associées aux maladies soient également plus interconnectées que les protéines non pathologiques. 74

Représentation du réseau PPI. Une illustration simple d'une partie d'un réseau PPI avec la thrombine à sérine protéase au centre.

Enfin, comme le séquençage du génome entier et du transcriptome devient moins cher et plus rapide, les analyses de profil d'expression génique des conditions normales et pathologiques devraient également contribuer à l'identification initiale des IPP cliniquement pertinents qui nécessiteront ensuite une enquête plus approfondie. Par exemple, les protéines IAP et BCL-2 pro-survie représentent des cibles PPI très attractives car leur surexpression est associée à la progression et au maintien de la tumeur. De nombreuses bases de données comparatives d'expression génique ont donc été développées, qui permettent la récupération, l'analyse et la comparaison des modèles d'expression génique au sein ou entre les espèces (voir par exemple la littérature 77 - 79). Bien que l'on ne sache pas exactement combien d'IPP auraient un potentiel thérapeutique, une telle image suggère fortement que la conception de composés de faible poids moléculaire ciblant les IPP pourrait avoir un impact majeur dans un proche avenir. En ce qui concerne les efforts de découverte de médicaments, même si à l'heure actuelle les réseaux PPI ne révèlent pas complètement les topologies des réseaux opérant réellement dans les cellules en raison des limitations mentionnées ci-dessus, une telle analyse peut toujours aider à proposer une liste de cibles PPI potentiellement intéressantes qui nécessitent alors à explorer plus avant et/ou pourraient identifier plusieurs protéines qui devraient être ciblées en même temps suivant, par exemple, le concept de conception rationnelle de la polypharmacologie. 80 – 83

2.2 Analyse structurale des interfaces protéine  protéine : des structures expérimentales aux mutations ponctuelles impliquées dans l'état pathologique

En introduisant des connaissances sur la résolution atomique (par exemple, en utilisant les rayons X, la RMN, la microscopie électronique à haute résolution) dans les réseaux PPI et par une analyse approfondie à petite échelle des interfaces protéine  protéine, de nouvelles informations peuvent être acquises en ce qui concerne la conception rationnelle de PPI modulateurs. Des principes généraux sur les PPI aux niveaux atomiques ont été proposés par exemple par Janin et Chothia en 1990 84 ou par Jones et Thornton en 1996. 85 La gamme de K valeurs observées dans les processus biologiquement pertinents qui reposent sur les IPP est large et s'étend sur environ 12 ordres de grandeur de 10 -4 à 10 -16 M (dans l'ensemble, l'énergie de liaison Δg entre les protomères ne semble pas être corrélé avec la taille de l'interface ou d'autres paramètres d'interface tels que la planéité et la polarité pour la plupart des PPI 86). Une distinction fondamentale clé entre les PPI réside dans leur durée (c'est-à-dire si l'interaction est permanente ou transitoire et celle-ci peut être divisée en interactions transitoires faibles et fortes). Une définition légèrement différente exprime la durée ainsi que l'aspect fonctionnel, divisant les interactions protéine  protéine en termes de complexes obligatoires (les protomères ne sont pas stables seuls in vivo) et non obligatoires 1 , 25 , 86 - 89 (Figure 4 ).

Interactions transitoires et permanentes. Une interaction permanente est généralement très stable et n'existe donc généralement que sous sa forme complexée. 86, 269 Une interaction transitoire s'associe et se dissocie in vivo. Dans un PPI obligatoire, les protomères ne sont pas trouvés en tant que structures stables par eux-mêmes in vivo. Les interactions structurellement ou fonctionnellement obligatoires sont généralement permanentes, tandis que les interactions non obligatoires peuvent être transitoires ou permanentes (souvent des systèmes anticorps-antigène et enzyme-inhibiteur). Il est important de noter que de nombreux IPP ne relèvent pas de types distincts. Il existe plutôt un continuum entre les interactions non obligatoires et obligatoires. La catégorie transitoire forte des interactions illustre le continuum qui existe entre les interactions faibles et les interactions plus permanentes. Cette catégorie comprend les interactions qui sont déclenchées/stabilisées par une molécule effectrice ou un changement de conformation. Quelques exemples sont donnés ici pour illustrer ces concepts. Obligatoire : le dimère du répresseur Arc (fichier PDB : 1ARQ) (le répresseur Arc du bactériophage P22 de Salmonella est une protéine de liaison à l'ADN spécifique à une séquence dimère, une chaîne est indiquée en noir et l'autre est peinte en gris) Hétérodimère permanent non obligatoire : inhibiteur de Kazal à double domaine dérivé d'insectes Rhodniine en complexe avec de la thrombine (fichier PDB : 1TBQ) (la thrombine (noir) est une sérine protéase clé du système de coagulation, l'inhibiteur est peint en gris) transitoire (faible) : dimère de lysine d'ormeau rouge ( Fichier PDB : 2lyn) (Le sperme d'ormeau utilise de la lysine pour faire un trou dans l'enveloppe vitelline protectrice de l'ovule, une chaîne est en noir, l'autre est en gris).

Il est important de noter que de nombreux IPP ne relèvent pas de types distincts, mais qu'un continuum existe généralement. Selon les types de complexes (permanents, transitoires…), la nature de l'interface diffère généralement. Par exemple, des complexes protéine non obligatoire  protéine ont été analysés et la taille de l'interface mesurée par l'approche de la surface enfouie a une valeur moyenne de 1910 Å 2 , avec une moyenne de 204 atomes contribuant à cette région appartenant à 57 acides aminés, c'est-à-dire environ 28 résidus par protéine. 3 L'analyse d'un nouvel ensemble de données PPI suggère que la surface minimale de protéine qui doit être enterrée pour former un complexe fonctionnel est de l'ordre de 900 2 (environ 500 Å 2 fourni par chaque partenaire) et implique environ 12 résidus sur chaque partenaire (de bien entendu ces valeurs peuvent légèrement différer selon les jeux de données et la manière dont les calculs sont effectués). Une grande majorité des atomes dans les interfaces non obligatoires sont généralement encore accessibles au solvant. Par rapport à la surface protéique accessible, les interfaces de tels complexes sont appauvries en Glu, Asp et Lys et enrichies en Met, Tyr et Trp. Le rebord constitué de résidus dans lesquels aucun des atomes d'interface n'est totalement enfoui a une composition proche de la surface accessible aux protéines. Le noyau comprend des atomes enterrés et environ 55 % de tous les résidus d'interface. Cette région centrale est enrichie en résidus aromatiques et dans une moindre mesure, en résidus aliphatiques (mais pas Val, Ala et Pro). Des résidus Arg peuvent être présents à la fois dans les régions du noyau et du bord. Une autre région a également été récemment décrite, la zone dite de support qui semble similaire en composition à l'intérieur de la protéine. 90 Par comparaison avec d'autres types d'interfaces, comme par exemple les homodimères, ces complexes tendent à avoir en moyenne une surface enterrée double de celle des complexes non obligatoires. 3 L'interface est ici plus hydrophobe et a tendance à s'enrichir en résidus aliphatiques et aromatiques, en moyenne, d'un facteur 2 par rapport aux interfaces non obligatoires. L'analyse des interfaces peut également être réalisée en terme de protéines impliquées dans une maladie donnée, et/ou en terme de protéines hub versus protéines non hub. Par exemple, il a été montré que les complexes protéine  et les protéines hub dans le cancer ont des sites de liaison plus petits, plus planaires et moins serrés que les protéines non cancéreuses (et les protéines non hub), indiquant une faible affinité et une spécificité élevée du cancer. -interactions liées. 91 , 92

De plus, au sein des régions d'interface, en général, tous les résidus ne sont pas d'égale importance et il est possible d'utiliser le concept de points chauds (l'énergie de liaison n'est pas également répartie entre tous les acides aminés participant à l'interaction, certains résidus sont directement responsables de la stabilisation du complexe, ces résidus confèrent la majeure partie de l'énergie de liaison à l'interaction, typiquement ils sont définis comme les résidus contribuant à au moins 2 kcal mol -1 à l'énergie de liaison totale du complexe). 93 Ces points chauds (les points chauds ont tendance à se produire en grappes et peuvent appartenir aux différents partenaires protéiques, ceux-ci sont en contact les uns avec les autres et forment un réseau d'interactions souvent appelées régions chaudes 25 ) peuvent être identifiés expérimentalement mais un certain nombre d'approches computationnelles peuvent également être utilisé. 94 Il ne faut pas oublier que les résidus de hotspot ne sont pas faciles à identifier expérimentalement (par exemple, des expériences d'analyse à l'alanine) ou in silico (voir par exemple les discussions sur les idées fausses possibles sur les résultats d'analyse à l'alanine 89 , 95 ). Les résidus de points chauds (parmi les acides aminés les plus conservés) sont généralement situés autour du centre de l'interface et sont protégés du solvant en vrac par des résidus énergétiquement moins importants formant un joint torique hydrophobe. Le tryptophane (21 %), l'arginine (13,3 %) et la tyrosine (12,3 %) sont souvent des résidus de hotspot alors que la leucine, la sérine, la thréonine et la valine ont tendance à être défavorisées. 96 – 98 La surface d'une région contenant des résidus de hotspot est d'environ 600 2 , une taille compatible avec une petite molécule (NB : interaction traditionnelle protéine-petit ligand ∼300–1000 Å 2 et surface accessible au solvant de nombreux les médicaments à petites molécules vont généralement de 150 à 500 2 ), et beaucoup plus petits qu'une interface protéine  protéine typique (par exemple, 1200 à 2000 à bien plus de 3000 Å 2 ). 3 De plus, des études de dynamique moléculaire ont montré que les points chauds sont relativement rigides par rapport aux résidus d'interface environnants. 99 L'estimation récente du nombre de types d'interactions protéiques possibles, estimé à environ 4000, est également importante. 100 En examinant la structure de la zone d'interface et grâce aux enquêtes de la Protein Data Bank, 101 il semble que l'espace d'interface est les chaînes limitées et même avec des plis différents ont souvent des interfaces similaires. Il est possible que l'espace d'interface soit presque complet à l'heure actuelle, ce qui suggère que des modèles d'interfaces sont probablement disponibles dans la version actuelle de la Protein Data Bank (environ 100 000 structures de protéines en 2014). 102 – 104 En outre, il est important de noter que de nombreux complexes protéiques semblent être dominés par un segment chaud où l'interaction est dominée par un épitope continu et, en tant que tels, les segments chauds pourraient être de bons prédicteurs de la pharmacogabilité des PPI. 34 Toujours dans le même ordre d'idées pour tenter de prédire la pharmacogabilité des IPP en termes de région capable de lier une petite molécule, une étude récemment publiée tente de définir des classes d'IPP qui pourraient être plus facilement modulées par des composés de faible poids moléculaire et suggère que et étroite » et « faible et étroite » protéines les catégories de complexes protéiques sont de bons candidats. 105 Les IPP peuvent également être classés à partir d'une approche centrée sur la structure secondaire, mais les liens avec la pharmacogabilité de l'interface ne sont pas entièrement compris à l'heure actuelle, 106 pourtant, les interactions impliquant une hélice avec un sillon de liaison pourraient être plus faciles à moduler avec un petit composé que d'autres types d'interfaces. 107

Des informations supplémentaires sur l'importance d'un complexe protéine protéine et sur les interfaces pourraient provenir d'études de polymorphisme de nucléotide unique (nsSNP) non synonymes (c'est-à-dire des modifications d'une seule base entraînant une modification de la séquence d'acides aminés de la protéine codée) car de nombreux de ces variantes sont associées à la maladie. De toute évidence, le développement de techniques abordables pour le séquençage des génomes et l'application de ces approches généreront une grande quantité de nouvelles données, y compris les SNP. Jusqu'à présent, des études portant sur les effets des nsSNP ont été réalisées sur des protéines individuelles, mais maintenant, l'impact des nsSNP sur les interactions protéine  protéine commence à être étudié. 108, 109 Il semble que lorsqu'un nsSNP causant une maladie ne se produit pas dans une région centrale de la protéine, ils sont préférentiellement situés à une interface protéine  protéine plutôt que sur des régions sans interface. 110 Ces études pourraient aider à trouver des règles qui aident à la sélection d'une cible. Le long de cette ligne, la base de données SKEMPI organisée manuellement a été développée et contient les effets de la mutation sur les énergies de liaison pour environ 2792 mutations à travers 85 complexes protéine  protéine. 111 De nouvelles perspectives devraient définitivement provenir de l'analyse d'un tel référentiel.

2.3 Interfaces protéine  protéine et zones qui pourraient être droguées

De nombreux outils in silico différents peuvent être utilisés pour sonder les IPP au niveau structurel. Il existe des outils qui prédisent les résidus de points chauds et des méthodes qui suggèrent des régions de protéines les plus susceptibles d'être dans une région d'interface. D'autres algorithmes tentent de prédire la structure d'un complexe protéine protéine, soit par amarrage (guidé ou non par des méthodes de prédiction in silico de régions d'interface protéine protéine) soit par modélisation comparative. Comme les interfaces peuvent être flexibles, les outils de simulation tels que la dynamique moléculaire et l'analyse en mode normal sont d'une importance majeure. De plus, comme les petits ligands ont tendance à se lier dans les cavités, des outils pour prédire les poches de liaison, pour prédire la pharmacogabilité d'une poche de liaison et des outils de simulation (qui peuvent démêler les poches de liaison transitoires) sont également nécessaires. En outre, il peut être intéressant de comparer et de regrouper les interfaces PPI pour faciliter la conception d'un composé qui pourrait se lier à plusieurs complexes protéiques ou pour acquérir des connaissances sur les PPI médicamenteux. Plusieurs de ces méthodes seront brièvement présentées ci-dessous et il est important de noter que certains outils peuvent être utilisés à plusieurs fins, par exemple, prédire les résidus d'interface et les points chauds ou définir les poches de liaison les plus probables pour un petit composé et des points chauds.

2.3.1 Prédictions in silico des points chauds et des résidus présents aux interfaces protéine protéine

Diverses méthodes de prédiction du site de liaison aux protéines protéine  ont été rapportées (voir les discussions sur ces outils dans 97, 112) (Figure 5), principalement basées sur la conservation de la séquence, les propensions aux résidus, la topologie de surface (planéité et protrusion), l'électrostatique, l'hydrophobie et l'accessibilité des solvants. .16 , 21 , 23 , 97 , 112 – 114 Certaines approches de prédiction de site de liaison de protéine  sont basées sur la séquence protéique seule comme l'approche ISIS (sites d'interaction identifiés à partir de séquence, approche de réseau de neurones) 115 et PPIcons (même si l'outil utilisé certaines informations structurelles pendant l'entraînement) 116 ou SPPIDER (il fonctionne avec ou sans informations sur la structure 3D). 117 Il a cependant été noté que les méthodes qui utilisent des informations structurelles ont tendance à être plus précises que les approches basées sur les séquences (voir par exemple la littérature 46 ). D'autres outils visant à prédire les régions d'interface nécessitent la structure de la ou des protéines. Certaines méthodes utilisent des fonctions de notation empiriques comme ODA (voir pour une revue de la littérature 97 ), d'autres approches utilisent la conservation de séquence parmi d'autres paramètres comme Promate, 118 tandis que d'autres utilisent des techniques d'apprentissage automatique comme SPPIDER. 117 Des méta-serveurs, combinant différents outils ont également été développés comme le méta-PPISP. 119 L'interface protéique peut également être sondée par amarrage. 113

Outils in silico pour étudier les interfaces protéiques. a) Exemples de progiciels qui prédisent les résidus d'interface et les points chauds. b) Quelques outils pour prédire la structure 3D des complexes protéine  protéine.

D'autres outils développés pour prédire spécifiquement les points chauds (l'approche expérimentale couramment utilisée est le balayage à l'alanine) nécessitent en général la structure 3D du complexe protéique et peuvent utiliser, par exemple, une fonction de notation empirique pour évaluer l'interface (par exemple, HotPoint 120 ) tout en d'autres sont basés sur l'énergie comme ROBETTA (ou ROSETTA), 121 ou FoldX, 122 ou iPred. 123] D'autres méthodes de prédiction des points chauds utilisent les structures protéiques non liées de chaque partenaire d'un complexe et d'amarrage, par exemple le module pyDockNIP du progiciel pyDock 97, 124). Les points chauds peuvent également être étudiés par la dynamique moléculaire dans l'eau et dans l'environnement de cosolvant isopropanol/eau (voir par exemple la littérature 125 ). Très peu de méthodes basées sur la séquence seule ont été rapportées pour prédire les points chauds, mais la méthode ISIS mentionnée ci-dessus a également été appliquée pour prédire les résidus de points chauds.

2.3.2 Protéine  Amarrage des protéines et prédictions structurelles basées sur des modèles (et threading) des complexes protéiques

Une difficulté majeure dans le domaine de la modulation des PPI par de petites molécules a été le manque de connaissances structurelles sur les protéines individuelles formant le complexe ou sur le complexe macromoléculaire lui-même et le fait que certains PPI impliquent au moins un partenaire (ou une région) qui est intrinsèquement désordonné. 126 , 127 Actuellement, environ 100 000 structures expérimentales sont rapportées au PDB (le % de complexe protéine  protéine est encore très faible) et il est possible de construire des modèles d'homologie pour de nombreuses protéines individuelles tandis que les initiatives de génomique structurale de deuxième génération ainsi que les avancées dans les prédictions d'interaction protéine  protéine in silico devraient améliorer la situation en ce qui concerne l'obtention d'informations structurelles sur les complexes protéiques dans les années à venir. 46, 112, 113, 128 Les approches d'amarrage de la protéine  et la modélisation de la structure basée sur des modèles d'outils PPI peuvent en effet être utilisées pour proposer des modèles fiables (au moins certaines solutions possibles qui devront être validées expérimentalement) du complexe 129 - 131 ( graphique 5). Pourtant, en raison de la complexité du problème, ces outils bénéficient généralement de la connaissance des résidus d'interaction prédits (par exemple, pour effectuer un amarrage sous contraintes), de la mutagenèse dirigée et d'autres informations expérimentales telles que SAXS ou la microscopie électronique. De nombreux moteurs d'amarrage protéine  protéine ont été examinés comme par exemple dans 23, 128 tandis que certains nouveaux outils d'amarrage protéine protéine sortis (ou optimisés) en 2013 incluent DockTrina (pour amarrer les trimères protéiques triangulaires), 132 ATTRACT, 133 MEGADOCK, 134 pyDockWEB, 135 F(2)Dock 2.0 et GB-rerank, 136 et SwarmDock (intégrant la flexibilité). 137 Ces approches peuvent également bénéficier de nouvelles fonctions de scoring comme illustré par la combinaison de DockRank et de l'outil d'amarrage protéine  protéine ClusPro. 138 L'autre approche pour construire un complexe protéique consiste à utiliser une modélisation basée sur un modèle qui construit un complexe en copiant et en affinant le cadre structurel des complexes protéine  protéine apparentés connus expérimentalement. Une liste de méthodes in silico a été récemment rapportée par la littérature 130, 131 et comprend par exemple TACOS (Template-based Assembly of Complex Structures) 139 ou le serveur Struct2Net. 140

2.3.3 Prédiction de poche contraignante pour les petites molécules et les points chauds, aptitude à la drogue et regroupement des IPP

La plupart des cibles thérapeutiques (par exemple, enzymes, GPCR, canaux ioniques) présentent généralement une poche de liaison concave claire qui peut lier une petite molécule. Si avoir sous la main la structure 3D d'un complexe protéine  protéine est très utile, il est tout de même possible de concevoir de petits modulateurs PPI même si l'on ne dispose que de la structure 3D d'un partenaire (modèle expérimental ou d'homologie) du complexe. Plusieurs outils ont été développés pour prédire les poches de liaison et accéder à la pharmacogabilité (définie ici comme la probabilité de trouver des liants de faible poids moléculaire de haute affinité (c'est-à-dire également appelée ligandabilité 87 inventée par Edfeldt et al. 142) de ces poches. Les outils ont été essentiellement développés pour des cibles régulières, mais de telles méthodes peuvent toujours être appliquées (avec des précautions) sur les PPI. En général, les PPI n'ont pas évolué pour se lier à un composé chimique de faible poids moléculaire, les interfaces ont tendance à être plates , relativement grande, souvent dépourvue d'une cavité claire de liaison au ligand, mais les interfaces protéine  protéine qui se lient à de petites molécules possèdent souvent des régions avec 3 à 5 sous-poches (voir ci-dessous) 143 et il a également été découvert que les poches de liaison peuvent ne pas être directement à l'interface mais à moins de 6 de l'interface 102 (d'intérêt, nous avons également constaté que de petites poches de liaison de ligand peuvent être trouvées près des acides aminés d'un domaine protéique interagissant de manière transitoire avec h une surface membranaire, 144 de petites poches de liaison de ligand pourraient-elles être présentes à côté de la plupart des interfaces macromoléculaires ?). En outre, les interfaces protéine  protéine ont tendance à s'adapter dynamiquement aux ligands à venir (petites ou grandes macromolécules), et des cavités transitoires non visibles dans certaines structures expérimentales peuvent apparaître sur la surface moléculaire pendant (ou avant) l'événement de liaison. 126 Dans de tels cas, alors que la flexibilité à l'interface pose un défi important pour les approches de conception de médicaments basées sur la structure, les outils de simulation moléculaire peuvent aider et compléter les études par rayons X ou RMN. 145 – 148

Les algorithmes de détection de poche de liaison sont essentiellement subdivisés en deux grandes classes, les outils basés sur la géométrie et les outils basés sur l'énergie. 149 En plus de prédire les poches de liaison, certains outils fournissent également un score de pharmacogabilité, c'est-à-dire qu'ils attribuent un score et classent les poches en fonction de leur probabilité de se lier à un composé de faible poids moléculaire (qui peut être différent de la présentation d'une liste de caries). En général, les méthodes fonctionnent sur une structure protéique statique, mais certaines prennent également en compte la flexibilité des protéines. Plusieurs articles ou revues récents décrivent ces outils et les concepts sous-jacents. 112, 149 – 156 L'observation selon laquelle les points chauds de liaison protéine-ligand dans les IPP semblent être en corrélation avec les points chauds protéine  est importante. 88

Parce que l'identification de petits sites de liaison moléculaire à l'intérieur ou à proximité des interfaces protéine  peut être difficile avec les méthodes conventionnelles, d'autres outils orientés vers les IPP ont été développés. Par exemple, des méthodes basées sur le sondage d'une surface de protéine (qui peut être ajustée pour les IPP) avec des fragments organiques et sur la prédiction des emplacements des régions de liaison probables en fonction de l'endroit où les fragments interagissent avec une affinité élevée ont été développées. Des outils tels que FTMAP 157 (cartographie informatique avec 16 sondes chimiques différentes) et l'extension FTFLEX de FTMAP (qui prend en compte la flexibilité de la chaîne latérale à la volée) 158 peuvent être utilisés pour localiser une région qui peut être explorée par des approches de criblage virtuel basées sur la structure et pour la prédiction des points chauds tandis que si plusieurs structures sont disponibles (ou obtenues via la dynamique moléculaire), FTProd 159 pourrait être appliqué. En fait, il a été montré que lorsqu'une région de point chaud principal à une interface protéine protéine a une topologie concave, avec un ou deux points chauds supplémentaires suffisamment proches pour être atteints depuis le premier site principal de point chaud par une molécule de la taille d'un médicament, alors la région est susceptible d'être droguée. 95 , 157

Le concept de sites « d'ancrage » est lié aux points chauds et aux outils qui pourraient aider à cibler les IPP avec de petites molécules organiques. L'outil ANCHOR a été développé selon ce concept pour aider à la conception de modulateurs à petites molécules des IPP. 160 Un autre concept connexe est la notion d'interface médicamenteuse. La fonction de notation 2P2I a été spécialement conçue pour étudier les interfaces et suggère des interfaces qui pourraient être droguées. 161

Un autre outil dédié au PPI identifie et classe les clusters de résidus d'interface dans un PPI qui sont les plus appropriés comme points de départ pour la conception rationnelle de petites molécules. Ces clusters sont appelés points de départ des inhibiteurs de petites molécules (SMISP) et l'approche est complémentaire aux méthodes qui identifient les sites de liaison grâce à une analyse de la surface du récepteur (soit à l'aide de descripteurs de forme ou de sondes chimiques). Le service Web PocketQuery a été développé autour de ce concept pour prédire les points chauds, les résidus d'ancrage et les régions chaudes. 162 Dans la même étude, les auteurs s'attendent à ce qu'après une analyse à l'échelle de la PDB, environ 48 % des complexes protéiques puissent être modulés avec une molécule de faible poids moléculaire. Un concept connexe implique l'étude des chevauchements entre les petites molécules et les sites de liaison aux protéines au sein des familles de structures protéiques (c. Davis et al. 164 ont signalé le logiciel HOMOLOBIND, 163 un outil qui identifie les résidus dans les séquences de protéines avec une similitude significative avec les sites de liaison structurellement caractérisés.

Ces outils ont tendance à travailler sur une structure statique (bien que l'on puisse générer des conformations alternatives avant les calculs) tandis que d'autres combinent l'identification des points chauds par décomposition en énergie libre MM-PBSA sur la base de l'ensemble structurel généré par la dynamique moléculaire (MD) et génération de poches transitoires à l'aide de la dynamique moléculaire et des simulations FRODA. 165

Des outils pour comparer les pochettes de reliure traditionnelles ont été développés 149 et quelques exemples d'approches récemment rapportées incluent PocketAnnotate 166 , APoc 167 et SiteComp. 168 Toutes ces poches ont été stockées dans des bases de données comme par exemple le pocketome. 169 Quelque peu liées, dans une étude récente, des interfaces ont été définies et regroupées, ce qui a permis d'identifier 22 604 structures d'interface uniques dans l'APB. 170


Dans les interactions protéine-protéine, quelle est la différence entre un site de liaison et une interface ? - La biologie

Instantané de données expérimentales

  • Méthode : DIFFRACTION DES RAYONS X
  • Résolution : 1,90
  • Valeur R gratuite : 0,247 
  • Travail de valeur R : 0.219 

Validation wwPDB   Rapport 3D Rapport complet

L'architecture modulaire des interfaces de liaison protéine-protéine

(2005) Proc Natl Acad Sci U S A 102: 57-62

  • PubMed: 15618400  Recherche sur PubMedRecherche sur PubMed Central
  • DOI : 10.1073/pnas.0407280102
  • Citation principale des structures connexes :  
    1XXM, 1S0W
  • Résumé PubMed : 

Les interactions protéine-protéine sont essentielles à la vie. Pourtant, notre compréhension des principes généraux régissant la liaison n'est pas complète. Dans la présente étude, nous montrons que l'interface entre les protéines est construite de manière modulaire, chaque module est composé d'un certain nombre de résidus en interaction étroite, avec peu d'interactions entre les modules.

Les interactions protéine-protéine sont essentielles à la vie. Pourtant, notre compréhension des principes généraux régissant la liaison n'est pas complète. Dans la présente étude, nous montrons que l'interface entre les protéines est construite de manière modulaire, chaque module est composé d'un certain nombre de résidus en interaction étroite, avec peu d'interactions entre les modules. Les limites entre les modules sont définies en regroupant la carte de contact de l'interface. Nous montrons que les mutations dans un module n'affectent pas les résidus situés dans un module voisin. En conséquence, les conséquences structurelles et énergétiques de la suppression de modules entiers sont étonnamment faibles. Au contraire, au sein de leur module, les mutations entraînent des conséquences énergétiques et structurelles complexes. Expérimentalement, ce phénomène est montré sur l'interaction entre la TEM1-bêta-lactamase et la protéine inhibitrice de bêta-lactamase (BLIP) en utilisant l'analyse de mutants multiples et la cristallographie aux rayons X. Le remplacement d'un module entier de cinq résidus d'interface par Ala a créé une grande cavité dans l'interface, sans aucun effet sur la structure détaillée de l'interface restante. L'architecture modulaire des sites de liaison, qui ressemble à la conception de l'ingénierie humaine, simplifie grandement la conception de nouvelles interactions protéiques et fournit une vision réaliste de l'évolution de ces interactions.

Affiliation organisationnelle

Départements de chimie biologique et de biologie structurale, Institut des sciences Weizmann, Rehovot 76100, Israël.


© 2014 Les auteurs. Publié par la Royal Society sous les termes de la Creative Commons Attribution License http://creativecommons.org/licenses/by/4.0/, qui permet une utilisation sans restriction, à condition que l'auteur et la source d'origine soient crédités.

Les références

Manfioletti G, Brancolini C, Avanzi G& Schneider C

. 1993 La protéine codée par un gène spécifique de l'arrêt de croissance (gas6) est un nouveau membre des protéines dépendantes de la vitamine K liées à la protéine S, un corégulateur négatif de la cascade de la coagulation sanguine . Mol. Cell Biol. 13, 4976-4985. Crossref, PubMed, Google Scholar

. 2006 Gas6 et protéine S. Ligands dépendants de la vitamine K pour la sous-famille des récepteurs tyrosine kinase Axl . FEBS J. 273, 5231–5244. (doi: 10.1111/j.1742-4658.2006.05529.x). Crossref, PubMed, Google Scholar

Walker FJ, Chavin SI et Fay PJ

. 1987 Inactivation du facteur VIII par la protéine C et la protéine S activées. Cambre. Biochimie. Biophys. 252, 322-328. (doi:10.1016/0003-9861(87)90037-3). Crossref, PubMed, Google Scholar

. 1980 Régulation de la protéine C activée par une nouvelle protéine. Une fonction possible pour la protéine bovine S . J. Biol. Chem. 255, 5521–5524. PubMed, Google Scholar

Hackeng TM, Seré KM, Tans G& Rosing J

. 2006 La protéine S stimule l'inhibition de la voie du facteur tissulaire par un inhibiteur de la voie du facteur tissulaire. Proc. Natl Acad. Sci. Etats-Unis 103, 3106-3111. (doi:10.1073/pnas.0504240103). Crossref, PubMed, Google Scholar

Robins RS, Lemarié CA, Laurance S, Aghourian MN, Wu J& Blostein MD

. 2013 Vascular Gas6 contribue à la thrombogénèse et favorise la régulation positive du facteur tissulaire après une lésion vasculaire chez la souris . Du sang 121, 692-699. (doi:10.1182/sang-2012-05-433730). Crossref, PubMed, Google Scholar

Lijfering WM, Mulder R, ten Kate MK, Veeger NJ, Mulder AB et van der Meer J

. 2009 Pertinence clinique de la diminution des taux de protéine S libre : résultats d'une étude de cohorte familiale rétrospective impliquant 1143 parents . Du sang 113, 1225-1230. (doi:10.1182/sang-2008-08-174128). Crossref, PubMed, Google Scholar

Brouwer JL, Bijl M, Veeger NJ, Kluin-Nelemans HC et van der Meer J

. 2004 Contribution des anomalies thrombophiliques héréditaires et acquises, seules ou associées à des anticorps antiphospholipides, à la thromboembolie veineuse et artérielle chez les patients atteints de lupus érythémateux disséminé. Du sang 104, 143-148. (doi:10.1182/sang-2003-11-4085). Crossref, PubMed, Google Scholar

Wu CS, Hu CY, Tsai HF, Chyuan IT, Chan CJ, Chang SK et Hsu PN

. 2014 Un taux sérique élevé de protéine 6 spécifique à l'arrêt de croissance (Gas6) chez les patients atteints de lupus érythémateux disséminé est associé à la néphrite et à la vascularite cutanée . Rhumatol. Int. 34, 625-629. (doi:10.1007/s00296-013-2882-1). Crossref, PubMed, Google Scholar

2012 Les taux du gène 6 (Gas6) spécifique à l'arrêt de croissance sont élevés chez les patients atteints d'insuffisance rénale chronique . Néphrol. Cadran. Transplantation. 27, 4166-4172. (doi:10.1093/ndt/gfs337). Crossref, PubMed, Google Scholar

Vigano-D'Angelo S, D'Angelo A, Kaufman CE, Sholer C, Esmon CT& Comp PC

. 1987 Une carence en protéine S survient dans le syndrome néphrotique . Anne. Interne. Méd. 107, 42–47. (doi : 10.7326/0003-4819-107-1-42). Crossref, PubMed, Google Scholar

Borgel D, Clauser S, Bornstain C, Bièche I, Bissery A, Remones V, Fagon JY, Aiach M& Diehl JL

. 2006 Taux plasmatiques élevés de protéine 6 spécifique à l'arrêt de la croissance chez les patients atteints de sepsis sévère . Critique. Soins Méd. 34, 219-222. (doi:10.1097/01.CCM.0000195014.56254.8A). Crossref, PubMed, Google Scholar

2004 Des changements universels dans les biomarqueurs de la coagulation et de l'inflammation se produisent chez les patients atteints de sepsis sévère, quel que soit le micro-organisme en cause [ISRCTN74215569] . Critique. Se soucier 8, R82–R90. (doi:10.1186/cc2459). Crossref, PubMed, Google Scholar

2010 Les cellules malignes alimentent la croissance tumorale en éduquant les leucocytes infiltrants pour produire le mitogène Gas6 . Du sang 115, 2264–2273. (doi:10.1182/sang-2009-06-228684). Crossref, PubMed, Google Scholar

Yigit E, Gönüllü G, Yücel I, Turgut M, Erdem D& Cakar B

. 2008 Relation entre les paramètres hémostatiques et les facteurs pronostiques/prédictifs dans le cancer du sein . EUR. J. Stagiaire. Méd. 19, 602-607. (doi:10.1016/j.ejim.2007.06.036). Crossref, PubMed, Google Scholar

Dit JM, Ignjatovic V, Monagle PT, Walker SP, Higgins JR& Brennecke SP

. 2010 Plages de référence modifiées pour la protéine C et la protéine S en début de grossesse : Implications pour le diagnostic de déficit en protéine C et en protéine S pendant la grossesse . Thromb. Haemost. 103, 984-988. (doi:10.1160/TH09-07-0476). Crossref, PubMed, Google Scholar

Mulder R, Tichelaar YI, Sprenger HG, Mulder AB& Lijfering WM

. 2011 Relation entre l'infection à cytomégalovirus et les changements procoagulants chez les patients infectés par le virus de l'immunodéficience humaine . Clin. Microbiole. Infecter. 17, 747-749. (doi : 10.1111/j.1469-0691.2010.03415.x). Crossref, PubMed, Google Scholar

Tans G, Curvers J, Middeldorp S, Thomassen MC, Meijers JC, Prins MH, Bouma BN, Büller HR& Rosing J

. 2000 Une étude croisée randomisée sur les effets des contraceptifs oraux contenant du lévonorgestrel et du désogestrel sur les voies anticoagulantes . Thromb. Haemost. 84, 15-21. Crossref, PubMed, Google Scholar

Balogh I, Hafizi S, Stenhoff J, Hansson K& Dahlbäck B

. 2005 Analyse de Gas6 dans les plaquettes et le plasma humains . Artériosclér. Thromb. Vasc. Biol. 25, 1280-1286. (doi:10.1161/01.ATV.0000163845.07146.48). Crossref, PubMed, Google Scholar

Griffin JH, Gruber A& Fernández JA

. 1992 Réévaluation des taux de protéine S totale, libre et liée et de protéine de liaison C4b dans le plasma anticoagulé avec du citrate ou de l'hirudine. Du sang 79, 3203-3211. PubMed, Google Scholar

. 2005 Le cycle de la vitamine K . J. Thromb. Haemost. 3, 1873–1878. (doi : 10.1111/j.1538-7836.2005.01419.x). Crossref, PubMed, Google Scholar

Sasaki T, Knyazev PG, Clout NJ, Cheburkin Y, Göhring W, Ullrich A, Timpl R& Hohenester E

. 2006 Base structurelle de la signalisation Gas6-Axl . EMBO J. 25, 80-87. (doi: 10.1038/sj.emboj.7600912). Crossref, PubMed, Google Scholar

Fernández JA, Heeb MJ & amp Griffin JH

. 1993 Identification des résidus 413-433 de la protéine plasmatique S comme étant essentiels pour la liaison à la protéine de liaison C4b. J. Biol. Chem. 268, 16 788–16 794. Google Scholar

Fernández JA, Griffin JH, Chang GT, Stam J, Reitsma PH, Bertina RM et Bouma BN

. 1998 Implication des résidus d'acides aminés 423–429 de la protéine S humaine dans la liaison à la protéine de liaison C4b . Cellules sanguines Mol. Dis. 24, 101-112. (doi:10.1006/bcmd.1998.0175). Crossref, PubMed, Google Scholar

Linse S, Härdig Y, Schultz DA& Dahlbäck B

. 1997 Une région de la protéine S dépendante de la vitamine K qui se lie à la protéine de liaison C4b (C4BP) identifiée à l'aide de bibliothèques de présentation de peptides bactériophages . J. Biol. Chem. 272, 14 658-14 665. (doi:10.1074/jbc.272.23.14658). Référence croisée, Google Scholar

Giri TK, Linse S, García de Frutos P, Yamazaki T, Villoutreix BO& Dahlbäck B

. 2002 Exigences structurelles de la protéine anticoagulante S pour sa liaison à la protéine de liaison C4b du régulateur du complément . J. Biol. Chem. 277, 15 099-15 106. (doi:10.1074/jbc.M103036200). Référence croisée, Google Scholar

. 1992 Liaison de la protéine S à la protéine de liaison C4b : mutagenèse de la protéine S . J. Biol. Chem. 267, 8140-8145. PubMed, Google Scholar

Saposnik B, Borgel D, Aiach M& Gandrille S

. 2003 Propriétés fonctionnelles du domaine de type SHBG (sex-hormone-binding globulin) de la protéine anticoagulante S . EUR. J. Biochem. 270, 545-555. (doi:10.1046/j.1432-1033.2003.03423.x). Crossref, PubMed, Google Scholar

. 1989 Caractérisation d'un peptide synthétique qui inhibe l'interaction entre la protéine S et la protéine de liaison C4b . J. Biol. Chem. 264, 17 645–17 648. Google Scholar

Evenäs P, García De Frutos P, Linse S& Dahlbäck B

. 1999 Les deux domaines de type G de la protéine S sont requis pour l'interaction de haute affinité avec la protéine de liaison C4b. EUR. J. Biochem. 266, 935-942. (doi:10.1046/j.1432-1327.1999.00928.x). Crossref, PubMed, Google Scholar

Chang GT, Ploos van Amstel HK, Hessing M, Reitsma PH, Bertina RM et Bouma BN

. 1992 Expression et caractérisation de la protéine S humaine recombinante dans des cellules hétérologues—études de l'interaction des résidus d'acides aminés leu-608 à glu-612 avec la protéine de liaison C4b humaine. Thromb. Haemost. 67, 526-532. Crossref, PubMed, Google Scholar

Chang GT, Maas BH, Ploos van Amstel HK, Reitsma PH, Bertina RM et Bouma BN

. 1994 Études de l'interaction entre la protéine S humaine et la protéine humaine de liaison à C4b à l'aide de variants de délétion de la protéine S humaine recombinante. Thromb. Haemost. 71, 461-467. PubMed, Google Scholar

Evenäs P, García de Frutos P, Nicolaes GA& Dahlbäck B

. 2000 Le second domaine de type G de la laminine de la protéine S est indispensable pour l'expression de l'activité complète du cofacteur dans l'inactivation catalysée par la protéine C activée du facteur Va et du facteur VIIIa. Thromb. Haemost. 84, 271-277. Crossref, PubMed, Google Scholar

Nyberg P, Dahlbäck B& García de Frutos P

. 1998 La région de type SHBG de la protéine S est cruciale pour la fonction du cofacteur APC dépendant du facteur V . FEBS Lett. 433, 28-32. (doi:10.1016/S0014-5793(98)00877-1). Crossref, PubMed, Google Scholar

Heeb MJ, Kojima Y, Rosing J, Tans G& Griffin JH

. 1999 Les résidus C-terminaux 621 à 635 de la protéine S sont essentiels pour la liaison au facteur Va. J. Biol. Chem. 274, 36 187–36 192. (doi:10.1074/jbc.274.51.36187). Référence croisée, Google Scholar

Reglińska-Matveyev N, Andersson HM, Rezende SM, Dahlbäck B, Crawley JT, Lane DA& Ahnström J

. 2014 Fonction cofacteur TFPI de la protéine S : rôle essentiel du domaine de type SHBG de la protéine S . Du sang 123, 3979-3987. (doi:10.1182/sang-2014-01-551812). Crossref, PubMed, Google Scholar

2011 Fonction cofacteur de la protéine C activée de la protéine S : un nouveau rôle pour un résidu d'acide γ-carboxyglutamique . Du sang 117, 6685–6693. (doi:10.1182/sang-2010-11-317099). Crossref, PubMed, Google Scholar

Fernández JA, Villoutreix BO, Hackeng TM, Griffin JH& Bouma BN

. 1994 Analyse des interactions protéine S C4b-protéine par modélisation d'homologie et anticorps inhibiteurs . Biochimie 33, 11 073-11 078. (doi:10.1021/bi00203a003). Référence croisée, Google Scholar

. 1994 Un site de liaison à la protéine S sur la protéine de liaison C4b implique des résidus de chaîne bêta 31-45. J. Biol. Chem. 269, 2535–2540. PubMed, Google Scholar

Villoutreix BO, Fernández JA, Teleman O& Griffin JH

. 1995 Modélisation comparative des trois modules CP de la chaîne bêta de C4BP et évaluation des sites potentiels d'interaction avec la protéine S . Protéine Ing. 8, 1253-1258. (doi : 10.1093/protéine/8.12.1253). Crossref, PubMed, Google Scholar

. 1996 Le module amino-terminal de la chaîne bêta de la protéine de liaison C4b contient le site de liaison de la protéine S . J. Biol. Chem. 271, 20 861–20 867. (doi: 10.1074/jbc.271.34.20861). Référence croisée, Google Scholar

van de Poel RH, Meijers JC& Bouma BN

. 1999 Interaction entre la protéine S et la protéine C4b-binding protein (C4BP) du complément : études d'affinité utilisant des chimères contenant des répétitions consensus courtes de chaîne bêta de c4 pb . J. Biol. Chem. 274, 15 144-15 150. (doi:10.1074/jbc.274.21.15144). Référence croisée, Google Scholar

van de Poel RH, Meijers JC, Dahlbäck B& Bouma BN

. 1999 C4b-binding protein (C4BP) à chaîne bêta Short Consensus Repeat-2 contribue spécifiquement à l'interaction de C4BP avec la protéine S . Cellules sanguines Mol. Dis. 25, 279-286. (doi:10.1006/bcmd.1999.0255). Crossref, PubMed, Google Scholar

Webb JH, Villoutreix BO, Dahlbäck B& Blom AM

. 2003 Rôle de CCP2 de la chaîne bêta de la protéine de liaison C4b dans la liaison de la protéine S évalué par mutagenèse et anticorps monoclonaux . EUR. J. Biochem. 270, 93-100. (doi:10.1046/j.1432-1033.2003.03365.x). Crossref, PubMed, Google Scholar

Studer RA& Robinson-Rechavi M

. 2009 Dans quelle mesure pouvons-nous être sûrs que les orthologues sont similaires, mais que les paralogues diffèrent ? Tendances Genet. 25, 210-216. (doi:10.1016/j.tig.2009.03.004). Crossref, PubMed, Google Scholar

. 2013 Implications fonctionnelles et évolutives de l'orthologie des gènes . Nat. le révérend Genet. 14, 360-366. (doi : 10.1038/nrg3456). Crossref, PubMed, Google Scholar

. 2003 Évolution par duplication de gènes : une mise à jour . Tendances Écol. Évol. 18, 292-298. (doi:10.1016/S0169-5347(03)00033-8). Crossref, ISI, Google Scholar

Studer RA& Robinson-Rechavi M

. 2009 Preuve d'un modèle épisodique d'évolution des séquences protéiques. Biochimie. Soc. Trans. 37, 783-786. (doi:10.1042/BST0370783). Crossref, PubMed, Google Scholar

. 2003 Divergence fonctionnelle dans l'évolution des séquences protéiques (familiales). Génétique 118, 133-141. (doi:10.1007/978-94-010-0229-5_4). Crossref, PubMed, Google Scholar

Studer RA, Dessailly BH& Orengo CA

. 2013 Mutations résiduelles et leur impact sur la structure et la fonction des protéines : détection des changements bénéfiques et pathogènes . Biochimie. J. 449, 581–594. (doi: 10.1042/BJ20121221). Crossref, PubMed, ISI, Google Scholar

Cacan E, Kratzer JT, Cole MF et Gaucher EA

. 2013 Fonctionnalité d'échange entre les facteurs d'allongement homologues à l'aide de signatures d'hétérotachie . J. Mol. Évol. 76, 4-12. (doi:10.1007/s00239-013-9540-9). Crossref, PubMed, Google Scholar

. 2013 Logiciel d'alignement de séquences multiples MAFFT version 7 : améliorations des performances et de la convivialité . Mol. Biol. Évol. 30, 772-780. (doi:10.1093/molbev/mst010). Crossref, PubMed, ISI, Google Scholar

Waterhouse AM, Procter JB, Martin DM, Clamp M& Barton GJ

. 2009 Jalview Version 2—un éditeur d'alignement de séquences multiples et un plan de travail d'analyse . Bioinformatique 25, 1189-1191. (doi: 10.1093/bioinformatics/btp033). Crossref, PubMed, ISI, Google Scholar

. 2003 Un algorithme simple, rapide et précis pour estimer de grandes phylogénies par maximum de vraisemblance . Syst. Biol. 52, 696–704. (doi:10.1080/10635150390235520). Crossref, PubMed, ISI, Google Scholar

Huelsenbeck JP& Ronquist F

. 2001 MRBAYES : Inférence bayésienne des arbres phylogénétiques . Bioinformatique 17, 754-755. (doi: 10.1093/bioinformatique/17.8.754). Crossref, PubMed, ISI, Google Scholar

Hedges SB, Dudley J& Kumar S

. 2006 TimeTree : une base de connaissance publique des temps de divergence entre les organismes . Bioinformatique 22, 2971–2972. (doi: 10.1093/bioinformatics/btl505). Crossref, PubMed, ISI, Google Scholar

. 2005 BADASP : prédiction de la spécificité fonctionnelle dans les familles de protéines à l'aide de séquences ancestrales . Bioinformatique 21, 4190-4191. (doi:10.1093/bioinformatics/bti678). Crossref, PubMed, Google Scholar

Studer RA& Robinson-Rechavi M

. 2010 Analyse à grande échelle d'orthologues et de paralogues sous des modèles d'évolution des acides aminés de type covarion et constants mais différents. Mol. Biol. Évol. 27, 2618–2627. (doi:10.1093/molbev/msq149). Crossref, PubMed, Google Scholar

Gaston D, Susko E& Roger AJ

. 2011 Un modèle de mélange phylogénétique pour l'identification de résidus de protéines fonctionnellement divergents. Bioinformatique 27, 2655-2663. (doi: 10.1093/bioinformatics/btr470). Crossref, PubMed, ISI, Google Scholar

. 2005 Évaluation d'une méthode améliorée de vraisemblance du site de branchement pour détecter la sélection positive au niveau moléculaire . Mol. Biol. Évol. 22, 2472-2479. (doi:10.1093/molbev/msi237). Crossref, PubMed, ISI, Google Scholar

. 2007 PAML 4 : analyse phylogénétique par maximum de vraisemblance . Mol. Biol. Évol. 24, 1586-1591. (doi:10.1093/molbev/msm088). Crossref, PubMed, ISI, Google Scholar

2014 Mise à jour Selectome : contrôle qualité et améliorations computationnelles d'une base de données de sélection positive . Acides nucléiques Res. 42, D917–D921. (doi:10.1093/nar/gkt1065). Crossref, PubMed, Google Scholar

Proux E, Studer RA, Moretti S& Robinson-Rechavi M

. 2009 Selectome : une base de données de sélection positive . Acides nucléiques Res. 37, D404–D407. (doi:10.1093/nar/gkn768). Crossref, PubMed, Google Scholar

Schymkowitz J, Borg J, Stricher F, Nys R, Rousseau F& Serrano L

. 2005 Le serveur web FoldX : un champ de force en ligne . Acides nucléiques Res. 33, W382–W388. (doi:10.1093/nar/gki387). Crossref, PubMed, Google Scholar

. 1993 Modélisation comparative des protéines par satisfaction des contraintes spatiales . J. Mol. Biol. 234, 779-815. (doi:10.1006/jmbi.1993.1626). Crossref, PubMed, ISI, Google Scholar

Baker NA, Sept D, Joseph S, Holst MJ& McCammon JA

. 2001 Electrostatique des nanosystèmes : application aux microtubules et au ribosome . Proc. Natl Acad. Sci. Etats-Unis 98, 10 037-10 041. (doi:10.1073/pnas.181342398). Crossref, ISI, Google Scholar

. 2010 Le système graphique moléculaire PyMOL, version 1.3r1. Voir http://www.pymol.org. Google Scholar

Fernandez-Recio J, Totrov M, Skorodumov C& Abagyan R

. 2005 Zone d'amarrage optimale : une nouvelle méthode de prédiction des sites d'interaction protéine-protéine . Protéines 58, 134-143. (doi:10.1002/prot.20285). Crossref, PubMed, Google Scholar

. 1970 Évolution par duplication de gènes . Londres, Royaume-Uni : George Allen & Unwin . Référence croisée, Google Scholar

. 2005 Chronologie et mécanisme des duplications du génome des vertébrés anciens : l'aventure d'une hypothèse . Tendances Genet. 21, 559-567. (doi:10.1016/j.tig.2005.08.004). Crossref, PubMed, ISI, Google Scholar

DePristo MA, Weinreich DM & amp Hartl DL

. 2005 Méandres faux-sens dans l'espace des séquences : une vue biophysique de l'évolution des protéines . Nat. le révérend Genet. 6, 678-687. (doi : 10.1038/nrg1672). Crossref, PubMed, ISI, Google Scholar

Tokuriki N, Stricher F, Serrano L& Tawfik DS

. 2008 Comment la stabilité des protéines et les nouvelles fonctions s'équilibrent . Calcul PLoS. Biol. 4, e1000002. (doi: 10.1371/journal.pcbi.1000002). Crossref, PubMed, ISI, Google Scholar

Studer RA, Christin PA, Williams MA& Orengo CA

. 2014 Les compromis stabilité-activité contraignent l'évolution adaptative de RubisCO . Proc. Natl Acad. Sci. Etats-Unis 111, 2223-2228. (doi:10.1073/pnas.1310811111). Crossref, PubMed, Google Scholar

Dasmeh P, Serohijos AW, Kepp KP et amp Shakhnovich EI

. 2013 Des sites sélectionnés positivement dans les myoglobines de cétacés contribuent à la stabilité des protéines . Calcul PLoS. Biol. 9, e1002929. (doi: 10.1371/journal.pcbi.1002929). Crossref, PubMed, Google Scholar

den Dunnen JT& Antonarakis SE

. 2000 Extensions de la nomenclature des mutations et suggestions pour décrire les mutations complexes : une discussion . Hum. Mutat. 15, 7-12. (doi:10.1002/(SICI)1098-1004(200001)15:1<7::AID-HUMU4>3.0.CO2-N). Crossref, PubMed, Google Scholar


Nouvel outil chimique qui met en lumière la façon dont les protéines se reconnaissent et interagissent les unes avec les autres

Un groupe de recherche dirigé par le professeur Xiang David LI de la Division de recherche en chimie et du Département de chimie de l'Université de Hong Kong, a développé un nouvel outil chimique pour élucider les réseaux d'interaction protéique dans les cellules. Cet outil facilite non seulement l'identification des partenaires d'interaction d'une protéine dans le contexte cellulaire complexe, mais permet également simultanément la « visualisation » de ces interactions protéine-protéine. Les résultats ont été récemment publiés dans la revue scientifique Cellule moléculaire.

Dans le corps humain, les protéines interagissent les unes avec les autres pour réguler de manière coopérative pratiquement tous les processus biologiques allant de l'expression des gènes et de la transduction du signal à la réponse immunitaire. En conséquence, les interactions protéiques dérégulées conduisent souvent à des maladies humaines, telles que le cancer et la maladie d'Alzheimer. En biologie moderne, il est important de bien comprendre les réseaux d'interactions protéiques, ce qui a des implications dans le diagnostic des maladies et peut faciliter le développement de traitements.

Pour disséquer des réseaux de protéines complexes, il faut répondre à deux questions : le « qui » ​​et le « comment » de la liaison aux protéines. Le « qui » ​​fait référence à l'identification des partenaires d'interaction d'une protéine, tandis que le « comment » fait référence aux « régions de liaison » spécifiques qui interviennent dans ces interactions. Répondre à ces questions est un défi, car les interactions protéiques sont souvent trop instables et trop transitoires pour être détectées. Pour s'attaquer à ce problème, le groupe du professeur Li a précédemment développé une série d'outils pour « piéger » les interactions protéine à protéine avec une liaison chimique. Ceci est possible parce que ces outils sont équipés d'une « caméra » spéciale activée par la lumière - un groupe diazirine qui capture chaque partenaire de liaison d'une protéine lorsqu'il est exposé à la lumière UV. Les interactions peuvent alors être examinées et interprétées. Malheureusement, la « résolution » de cette « caméra » était relativement faible, ce qui signifie que des informations clés sur la façon dont les protéines interagissent les unes avec les autres ont été perdues. À cette fin, le groupe du professeur Li a maintenant conçu un nouvel outil (appelé ADdis-Cys) doté d'une « caméra » améliorée pour améliorer la « résolution ». Une poignée en alcyne installée à côté de la diazirine permet de « zoomer » pour voir clairement les régions de liaison des protéines. Couplé à une spectrométrie de masse de pointe, ADdis-Cys est le premier outil capable d'identifier simultanément les partenaires d'interaction d'une protéine et de localiser leurs régions de liaison.

Dans l'article publié, le laboratoire du professeur Li a pu identifier de manière exhaustive de nombreuses interactions protéiques - certaines connues et d'autres récemment découvertes - qui sont importantes pour la régulation des processus cellulaires essentiels tels que la réplication de l'ADN, la transcription des gènes et la réparation des dommages à l'ADN. Plus important encore, le laboratoire du professeur Li a pu utiliser ADdis-Cys pour révéler les régions de liaison qui interviennent dans ces interactions protéiques. Cet outil pourrait conduire au développement de modulateurs chimiques qui régulent les interactions protéiques pour le traitement des maladies humaines. En tant qu'outil de recherche, ADdis-Cys trouvera des applications de grande envergure dans de nombreux domaines d'études, en particulier dans le diagnostic et le traitement des maladies.


Aperçu

Ce script trouve les résidus d'interface entre deux protéines ou chaînes, en utilisant le concept suivant. Tout d'abord, nous prenons la zone du complexe. Ensuite, nous avons divisé le complexe en deux morceaux, un pour chaque chaîne. Ensuite, nous calculons la surface de la chaîne uniquement. Enfin, nous prenons la différence entre les zones à base de comeplex et les zones à base de chaîne uniquement. Si cette valeur est supérieure à la coupure fournie, nous l'appelons un résidu d'interface.


Interactions protéine-protéine : passer des méthodes classiques aux approches protéomiques et bioinformatiques

Suite au séquençage du génome humain et de nombreux autres organismes, les recherches sur les gènes codant pour les protéines et leurs fonctions (génomique fonctionnelle) se sont intensifiées. Par la suite, avec le constat que les protéines sont bien les effecteurs moléculaires de la plupart des processus cellulaires, la discipline de la protéomique est née. De toute évidence, les protéines ne fonctionnent pas comme des entités individuelles mais plutôt comme un réseau dynamique d'acteurs d'équipe qui doivent communiquer.Bien que les méthodes génétiques (levure à deux hybrides Y2H) et biochimiques (co-immunoprécipitation Co-IP, purification par affinité AP) aient été les méthodes de choix au début de l'étude des interactions protéine-protéine (PPI), au cours des dernières années, il y a eu une évolution vers des méthodes basées sur la protéomique et des approches basées sur la bioinformatique. Dans cette revue, nous décrivons d'abord en profondeur les IPP et nous expliquons pourquoi démêler l'interactome est le prochain défi dans le domaine de la protéomique. En outre, des méthodes classiques d'investigation des PPI et des approches bioinformatiques basées sur la structure sont présentées. L'accent est mis sur les méthodes protéomiques, en particulier les techniques natives qui ont été récemment développées et qui se sont avérées fiables. Enfin, nous soulignons les limites de ces méthodes et la nécessité de mettre en place un standard pour la validation des expériences PPI.

Ceci est un aperçu du contenu de l'abonnement, accessible via votre institution.


Les références

Fields S, Song O : Un nouveau système génétique pour détecter les interactions protéine-protéine. La nature. 1989, 340 : 245-246. 10.1038/340245a0.

Rigaut G, Shevchenko A, Rutz B, et al: Une méthode générique de purification des protéines pour la caractérisation des complexes protéiques et l'exploration du protéome. Nat Biotech. 1999, 17 : 1030-1032. 10.1038/13732.

Gavin AC, Aloy P, Grandi P, et al : L'étude du protéome révèle la modularité de la machinerie des cellules de levure. La nature. 2006, 440 : 631-636. 10.1038/nature04532.

Bouwmeester T, Bauch A, Ruffner H, et al: Une carte physique et fonctionnelle de la voie de transduction du signal TNF-alpha/NF-kappa B humain. Nat Cell Biol. 2004, 6 : 97-105. 10.1038/ncb1086.

Gavin AC, Bosche M, Krause R, et al : Organisation fonctionnelle du protéome de levure par analyse systématique des complexes protéiques. La nature. 2002, 415 : 141-147. 10.1038/415141a.

Berggård T, Linse S, James P : Méthodes de détection et d'analyse des interactions protéine-protéine. Protéomique. 2007, 7 : 2833-2842. 10.1002/pmic.200700131.

Phizicky EM, Champs S : Interactions protéine-protéine : Méthodes de détection et d'analyse. Microbiol Rev. 1995, 59 : 94-123.

Shoemaker BA, Panchenko AR: Déchiffrer les interactions protéine-protéine. Partie I. Techniques expérimentales et bases de données. PLoS Comput Biol. 2007, 3 : e42-10.1371/journal.pcbi.0030042.

Suderman M, Hallett M : Outils pour explorer visuellement les réseaux biologiques. Bioinformatique. 2007, 23 : 2651-2659. 10.1093/bioinformatique/btm401.

Cline MS, Smoot M, Cerami E, et al : Intégration de réseaux biologiques et de données d'expression génique à l'aide de Cytoscape. Protocoles Nat. 2007, 2 : 2366-2382. 10.1038/nprot.2007.324.

Albert R, Barabasi AL : Mécanique statistique des réseaux complexes. Rév Mod Phys. 2002, 74 : 47-97. 10.1103/RevModPhys.74.47.

Futschik ME, Chaurasia G, Herzel H: Comparaison des cartes d'interaction protéine-protéine humaine. Bioinformatique. 2007, 23 : 605-611. 10.1093/bioinformatique/btl683.

Huber W, Carey V, Long L, et al : Graphiques en biologie moléculaire. BMC Bioinformatique. 2007, 8 : S8-

Sharan R, Ulitsky I, Shamir R : prédiction basée sur le réseau de la fonction des protéines. Mol Syst Biol. 2007, 3 : 88-

von Mering C, Krause R, Snel B, et al : Évaluation comparative d'ensembles de données à grande échelle sur les interactions protéine-protéine. La nature. 2002, 417 : 399-403.

Schwikowski B, Uetz P, Fields S : Un réseau d'interactions protéine-protéine chez la levure. Nat Biotechnol. 2000, 18 : 1257-1261. 10.1038/82360.

Kerrien S, Orchard S, Montecchi-Palazzi L, et al : Élargir l'horizon - Niveau 2.5 du format HUPO-PSI pour les interactions moléculaires. BMC Biol. 2007, 5 : 44-10.1186/1741-7007-5-44.

Stark C, Breitkreutz BJ, Reguly T, et al : BioGRID : un référentiel général pour les ensembles de données d'interaction. Nucl Acides Res. 2006, 34 : D535-D539. 10.1093/nar/gkj109.

Zanzoni A, Montecchi-Palazzi L, Quondam M, et al: MINT: A Molecular INTeraction database. FEBS Lett. 2002, 513 : 135-140. 10.1016/S0014-5793(01)03293-8.

Bader GD, Donaldson I, Wolting C, et al : BIND - La base de données du réseau d'interaction biomoléculaire. Nucl Acides Res. 2001, 29 : 242-245. 10.1093/nar/29.1.242.

Xenarios I, Rice DW, Salwinski L, et al : DIP : La base de données des protéines en interaction. Nucl Acides Res. 2000, 28 : 289-291. 10.1093/nar/28.1.289.

Hermjakob H, Montecchi-Palazzi L, Lewington C, et al : IntAct : Une base de données d'interaction moléculaire open source. Nucl Acides Res. 2004, 32 : D452-D455. 10.1093/nar/gkh052.

Peri S, Navarro JD, Amanchy R, et al : Développement d'une base de données de référence sur les protéines humaines en tant que plate-forme initiale pour aborder la biologie des systèmes chez l'homme. Génome Res. 2003, 13 : 2363-2371. 10.1101/gr.1680803.

Cusick ME, Hu H, Smolyar A, et al: Ensembles de données d'interaction protéique organisés par la littérature. Nat Meth. 2009, 6 : 39-46. 10.1038/nmeth.1284.

Giot L, Bader JS, Brouwer C, et al: A protein interaction map of Drosophila melanogaster, Science. 2003, 302 : 1727-1736.

Rual J-F, Venkatesan K, Hao T, et al: Vers une carte à l'échelle du protéome du réseau d'interaction protéine-protéine humaine. La nature. 2005, 437 : 1173-1178. 10.1038/nature04209.

John PM, Russell SL, Asa BH, et al : Identification à grande échelle des interactions de protéines membranaires intégrales de levure. Proc Natl Acad Sci USA. 2005, 102 : 12123-12128. 10.1073/pnas.0505482102.

Formstecher E, Aresta S, Collura V, et al : Cartographie des interactions protéiques : une étude de cas sur la drosophile. Génome Res. 2005, 15 : 376-384. 10.1101/gr.2659105.

L'UniProt C : La ressource protéique universelle (UniProt). Nucl Acides Res. 2008, 36 : D190-D195. 10.1093/nar/gkn141.

Prieto C, De Las Rivas J : APID : analyseur de données d'interaction protéique agile. Nucl Acides Res. 2006, 34 : W298-W302. 10.1093/nar/gkl128.

Ashburner M, Ball CA, Blake JA, et al : Gene ontology : Outil pour l'unification de la biologie. Le consortium d'ontologie génétique. Nat Genet. 2000, 25 : 25-29. 10.1038/75556.

Finn RD, Tate J, Mistry J, et al: La base de données des familles de protéines Pfam. Nucl Acides Res. 2008, 36 : D281-D288. 10.1093/nar/gkn226.

Chaurasia G, Iqbal Y, Hanig C, et al : UniHI : Une porte d'entrée à l'interactome de la protéine humaine. Nucl Acides Res. 2007, 35 : D590-D594. 10.1093/nar/gkl817.

Jensen LJ, Kuhn M, Stark M, et al : STRING 8 - Une vue globale sur les protéines et leurs interactions fonctionnelles dans 630 organismes. Nucl Acides Res. 2009, 37 : D412-D416. 10.1093/nar/gkn760.

Bader GD, Cary MP, Sander C: Pathguide: Une liste de ressources de chemin. Nucl Acides Res. 2006, 34 : D504-D506. 10.1093/nar/gkj126.