Informations

Comment identifier une bobine enroulée à partir de la séquence d'acides aminés ?


Je me demandais, quand on a une séquence d'acides aminés, est-il suffisant de vérifier si les positions a-d correspondent à des acides aminés hydrophobes pour dire si elle peut former une structure enroulée ? Ou faudrait-il s'assurer que les autres positions ne sont pas trop hydrophobes ?

Toute aide grandement appréciée.


La répétition heptade, notée [abcdefg]m, a typiquement des résidus hydrophobes à une et , et des résidus polaires/chargés à e et g.

D'ici.

Il existe un outil de prédiction avec des images utiles ici.


La classification de la famille de protéines humaines THAP identifie une région de bobine enroulée conservée au cours de l'évolution

La famille de protéines THAP (Thanatos Associated Proteins) chez l'homme est impliquée dans divers processus cellulaires importants comme la régulation épigénétique, le maintien de la pluripotence, la transposition et des troubles comme les cancers et l'hémophilie. La famille des protéines THAP humaines, qui se compose de douze membres de longueurs différentes, possède un domaine de liaison à l'ADN, amino-terminal bien caractérisé, de coordination au zinc, appelé domaine THAP. Cependant, l'extrémité carboxy de la plupart des protéines THAP n'a pas encore été caractérisée structurellement. Une région de bobine enroulée est connue pour aider à l'oligomérisation des protéines dans THAP1 et THAP11. On ne sait pas si d'autres protéines THAP humaines s'oligomérisent. Nous avons utilisé des outils bioinformatiques pour explorer la possibilité de dimérisation des protéines THAP via une région enroulée.

Résultats

La classification de la protéine THAP humaine en trois groupes basés sur la taille a conduit à l'identification d'une région hélicoïdale alpha conservée au cours de l'évolution, en aval du domaine THAP amino-terminal. Les prédictions de structure secondaire, les tracés de roue hélicoïdale alpha et les modèles de protéines ont démontré la forte possibilité de formation de bobines enroulées dans cette région conservée et riche en leucine de toutes les protéines THAP à l'exception de THAP10.

Conclusion

L'identification d'une région d'oligomérisation prédite dans la famille de protéines THAP humaines ouvre de nouvelles voies pour étudier les membres de cette famille de protéines.


Fond

Des techniques expérimentales à haut débit ont récemment commencé à découvrir des interactions protéine-protéine à l'échelle protéomique [1–6]. Cependant, à mesure que le nombre d'organismes entièrement séquencés augmente, il devient de plus en plus nécessaire de développer des méthodes informatiques pour prédire ces interactions. La difficulté de prédire informatiquement les structures des protéines suggère une stratégie consistant à se concentrer d'abord sur les interactions médiées par des interfaces spécifiques de géométrie connue.

Dans cet article, nous nous concentrons sur une interface d'interaction protéique commune et bien caractérisée - la bobine enroulée parallèle à deux brins. Les bobines enroulées se trouvent dans des protéines qui participent à de nombreux processus divers, y compris la transcription, l'oncogenèse et la fusion membranaire, prédisant que les interactions protéine-protéine médiées par ce motif auront des ramifications biologiques importantes. Les bobines enroulées se composent de deux ou plusieurs hélices α qui s'enroulent l'une autour de l'autre avec une légère torsion superhélicoïdale à gauche. Une répétition heptadique caractéristique (abcdefg)m définit le placement des résidus dans chaque hélice par rapport à l'interface d'interaction (Figure 1). Les positions enterrées une et contiennent généralement des acides aminés hydrophobes, et les positions les plus exposées g et e contiennent souvent des acides aminés chargés et polaires. Cette structure simple et cette périodicité permettent la reconnaissance de séquences potentielles de bobines enroulées par des méthodes statistiques (par exemple, [7-12]), ainsi que des prédictions détaillées de la structure et de l'énergétique de leurs interfaces hydrophobes grâce à la modélisation moléculaire [13-15].

Caricature d'une bobine enroulée parallèle à deux brins. (une) Vue latérale et (b) vue de dessus. L'interface entre les hélices dans une structure enroulée est formée par des résidus aux positions du noyau une, , e et g. Les positions dans les deux hélices se distinguent par la notation première par exemple, une et une' sont des positions analogues dans les deux hélices. N, extrémité amino C, extrémité carboxy.

Une grande partie de ce qui est connu sur la structure et la spécificité des bobines enroulées parallèles à deux brins a été vérifiée par des études biophysiques de peptides dérivés de facteurs de transcription bZIP (par exemple, [16–22]). Les régions enroulées de ces protéines sont également connues sous le nom de fermetures éclair à leucine parce que le noyau les positions sont dominées par les résidus leucine. Les bZIPs s'homo- et hétéro-dimérise les uns avec les autres via leurs régions enroulées. Malgré une homologie de séquence évidente, ils présentent un degré élevé de sélectivité de partenariat qui leur permet de fonctionner dans diverses voies. Récemment, la technologie des puces à protéines a été utilisée pour déterminer les interactions coiled-coil au sein d'un ensemble presque complet de facteurs de transcription humains bZIP [23]. Les interactions découvertes ont montré une reproductibilité élevée et une excellente cohérence avec les études publiées précédemment, ce qui nous donne une grande confiance dans les données.

Dans ce travail, nous appliquons une méthode de prédiction des interactions coiled-coil [24] aux protéines humaines bZIP. Les données du réseau offrent une excellente occasion de tester notre méthode et d'évaluer son utilité pour le problème général de prédiction de la bobine enroulée. Notre méthode représente les bobines enroulées en termes de leurs interactions interhélicoïdales et elle dérive, à partir d'un ensemble de données de base de séquences et de données expérimentales, un « poids » qui indique à quel point chaque interaction résidu-résidu est favorable. Notre méthode est capable de prédire les partenaires d'interaction avec un niveau de confiance élevé, en identifiant une fraction significative (70 %) d'appariements bZIP forts tout en maintenant que la majorité (92 %) des interactions prédites sont correctes. D'autres tests de validation croisée démontrent à quel point les données bZIP humaines affinent notre méthode et suggèrent des niveaux de confiance, basés sur la similarité des séquences partagées, pour prédire les interactions bZIP au sein de nouveaux génomes.

Avant ce travail, il n'y a eu qu'un succès modeste dans la prédiction de la spécificité de partenariat des protéines en spirale d'origine naturelle. Une version antérieure de notre méthode a été testée sur des bobines fibreuses enroulées. Il a été capable d'éliminer une grande partie des partenaires n'interagissant pas pour une séquence donnée, mais pas de trouver le partenaire réel [24]. Plusieurs autres groupes ont compté le nombre d'interactions électrostatiques favorables et défavorables pour faire des prédictions spécifiques sur la nature d'interactions hélicoïdales particulières [18, 25, 26]. Récemment, des règles simples incorporant à la fois ge' électrostatique et aa' les interactions polaires ont été utilisées pour évaluer la dimérisation potentielle de bZIP dans le Drosophile génome [27], mais la plupart de ces prédictions n'ont pas encore été corroborées expérimentalement. Sur les données bZIP humaines, ces règles simples ne sont capables d'identifier qu'une petite fraction des interactions fortes connues à un niveau de précision élevé. Par exemple, lorsqu'elles sont définies de manière à identifier au moins un tiers des interactions fortes, elles donnent lieu à autant de faux positifs (FP) que de vrais positifs (TP).

Les approches génomiques entières et croisées pour prédire les partenaires protéiques ont eu un certain succès [28-34]. Notre travail, cependant, est le premier à démontrer des prédictions informatiques à grande échelle et à haute confiance pour tout motif d'interaction protéique.


Prédiction du domaine protéique

Les domaines protéiques sont des arrangements d'éléments de structure secondaires, qui confèrent une fonction biologique. Les protéines complexes ont évolué par un assemblage mix-and-match de domaines individuels ou en concaténant plusieurs unités du même domaine ensemble. Les domaines ont une fonction similaire dans différents organismes et l'organisation des domaines protéiques conduit à des indications sur la fonction des protéines. L'un des motifs les plus répandus est une "hélice-tour-hélice", qui suggère que votre protéine est capable de lier l'ADN dans une certaine mesure.

Exemples de programmes prédisant des domaines spécifiques :

Atelier d'analyse de séquences de protéines PSIPRED – comprenant la structure secondaire et la prédiction de protéines désordonnées

Segments hélicoïdaux transmembranaires Phobius – et séquences signal

COILS – prédiction des régions coiled-coil, caractéristiques des protéines structurelles ou des protéines impliquées dans la régulation de la transcription


Projections de roue hélicoïdale pour les protéines

Une roue hélicoïdale est un type de tracé ou de représentation visuelle utilisé pour illustrer les propriétés des hélices alpha dans les protéines. La séquence d'acides aminés qui composent une région hélicoïdale de la structure secondaire de la protéine est tracée de manière rotative où l'angle de rotation entre les acides aminés consécutifs est de 100°, de sorte que la représentation finale regarde vers le bas de l'axe hélicoïdal. Le graphique révèle si les acides aminés hydrophobes sont concentrés d'un côté de l'hélice, généralement avec des acides aminés polaires ou hydrophiles de l'autre. Cet arrangement est courant dans les hélices alpha au sein des protéines globulaires, où une face de l'hélice est orientée vers le noyau hydrophobe et une face est orientée vers la surface exposée au solvant. Des modèles spécifiques caractéristiques des replis protéiques et des motifs d'amarrage des protéines sont également révélés, comme dans l'identification des régions de dimérisation à glissière à leucine et des bobines enroulées. Ce diagramme de projection est souvent appelé et "roue d'Edmondson" d'après son inventeur.

Que dit son inventeur ?

Edumudosn mentionné dans son article classique

Comment lire une roue hélicoïdale

À partir de la compréhension de base des structures hélicoïdales alpha déterminées par corey, Pauling et Ramachandran, nous savons qu'un tour hélicoïdal complet (ce qui signifie une rotation de 360 ​​degrés) est obtenu dans une plage de 3,6 résidus (et c'est la raison pour laquelle l'hélice alpha est également appelée 3.613 hélice). Imaginez maintenant regarder et l'hélice alpha du haut. Toute hélice du haut ressemblerait à une roue. Mais pour déterminer une séquence, il faut noter les angles sous lesquels les acides aminés suivants seront observés. Ainsi, à partir des informations ci-dessus, nous pouvons dire qu'un nouvel ajout d'acides aminés à un peptide en hélice alpha aura lieu à 100 degrés (360 degrés divisés par 3,6). Il faut également se rappeler qu'en cas d'hélice alpha pour droitier, la lecture se fera dans le sens des aiguilles d'une montre, tandis qu'en hélice alpha pour gaucher, la lecture se fera dans le sens inverse des aiguilles d'une montre.

Exemple de roue hélicoïdale

La figure suivante illustre une simple projection de roue hélicoïdale, pour le peptide hélicoïdal alpha avec la séquence ADITYAARYA. S'il s'agissait d'une hélice gauche (ou d'une hélice composée d'acides aminés D au lieu d'acides aminés L), nous la lirions dans le sens inverse des aiguilles d'une montre.


<p>Cette section fournit des informations sur l'expression d'un gène au niveau de l'ARNm ou de la protéine dans les cellules ou les tissus d'organismes multicellulaires.<p><a href='/help/expression_section' target='_top'>Plus. </a></p> Expression i

Bases de données d'expression génique

Base de données Bgee pour l'évolution de l'expression génique

ExpressionAtlas, Expression différentielle et de base

Portail de recherche Genevisible vers les données d'expression normalisées et organisées de Genevestigator

Bases de données spécifiques aux organismes


<p>Cette section affiche par défaut la séquence protéique canonique et sur demande toutes les isoformes décrites dans l'entrée. Il comprend également des informations relatives à la ou aux séquences, y compris <a href="http://www.uniprot.org/help/sequence%5Flength">length</a> et <a href="http://www.uniprot .org/help/sequences">poids moléculaire</a>. Les informations sont classées dans différentes sous-sections. Les sous-sections actuelles et leur contenu sont répertoriés ci-dessous :<p><a href='/help/sequences_section' target='_top'>Plus. </a></p> Séquence s (2+) i

<p>Cette sous-section de la section <a href="http://www.uniprot.org/help/sequences%5Fsection">Sequence</a> indique si la <a href="http://www.uniprot.org/help /canonical%5Fand%5Fisoforms">séquence canonique</a> affichée par défaut dans l'entrée est complète ou non.<p><a href='/help/sequence_status' target='_top'>Plus. </a></p> Statut de la séquence i : Terminé.

Cette entrée décrit 2 <p>Cette sous-section de la section « Séquence » répertorie les séquences protéiques alternatives (isoformes) qui peuvent être générées à partir du même gène par un seul ou par la combinaison de jusqu'à quatre événements biologiques (utilisation de promoteurs alternatifs, épissage alternatif, initiation alternative et décalage du cadre ribosomique). De plus, cette section fournit des informations pertinentes sur chaque isoforme de protéine alternative.<p><a href='/help/alternative_products' target='_top'>Plus. </a></p> isoformes que j'ai produites par épissage alternatif . AlignAjouter au panierAjouté au panier

Cette entrée a 2 isoformes décrites et 1 isoforme potentielle qui est mappée informatiquement.Afficher toutAligner tout

Cette isoforme a été choisie comme <div> <p><b>Quelle est la séquence canonique ?</b><p><a href='/help/canonical_and_isoforms' target='_top'>Plus. </a></p> séquence i canonique. Toutes les informations de position dans cette entrée s'y réfèrent. C'est également la séquence qui apparaît dans les versions téléchargeables de l'entrée.

La séquence de cette isoforme diffère de la séquence canonique comme suit :
225-273 : VQHKRYDAIL. ELRKCIGMQE → GLAPSPRLEC. IFSRDGVSPC

<p>Dans les protéomes de référence eucaryotes, les entrées non révisées susceptibles d'appartenir au même gène sont mappées informatiquement, sur la base des identifiants de gènes d'Ensembl, EnsemblGenomes et des bases de données d'organismes modèles.<p><a href='/help/gene_centric_isoform_mapping' target='_top '> Plus. </a></p> Séquences potentielles d'isoformes cartographiées i

Note d'annotation : 1 sur 5

Variante naturelle

Clé de fonctionnalitéPoste(s)Description Actions Vue graphiqueLongueur
<p>Cette sous-section de la section "Séquence" décrit la ou les variantes naturelles de la séquence protéique.<p><a href='/help/variant' target='_top'>Plus. </a></p> Variante naturelle i VAR_061579 269I → T. Correspond à la variante dbSNP:rs9567280 Ensembl . 1

Séquence alternative

Clé de fonctionnalitéPoste(s)Description Actions Vue graphiqueLongueur
<p>Cette sous-section de la section « Séquence » décrit la séquence d'isoforme(s) de protéine alternative(s) naturelle(s). Les modifications de la séquence d'acides aminés peuvent être dues à un épissage alternatif, à l'utilisation d'un promoteur alternatif, à une initiation alternative ou à un décalage du cadre ribosomique.<p><a href='/help/var_seq' target='_top'>Plus. </a></p> Séquence alternative i VSP_025114 225 – 273VQHKR…IGMQE → GLAPSPRLECSSAISAHCKL CLPGSRHSPASASGVAGTTG ACHHTQLIFCIFSRDGVSPC en isoforme 2. 2 Publications

<p>Informations organisées manuellement qui sont basées sur des déclarations dans des articles scientifiques pour lesquels il n'existe aucun support expérimental.</p> <p><a href="/manual/evidences#ECO:0000303"> Suite. </a></p> Assertion manuelle basée sur l'opinion en i


Mirsky, A.E. & Pauling, L. Sur la structure des protéines natives, dénaturées et coagulées. Proc. Natl. Acad. Sci. Etats-Unis 22, 439–447 (1936).

Matthews, B.W. Structure aux rayons X des protéines. Les Protéines (eds H. Neurath & R.L Hill) 403-590 (Academic Press, San Francisco, vol. 3) (1977).

Fischer, E. Einfluss der konfiguration auf die wirkung der enzyme. Ber. Dt., Chem. Gès. 27, 2985–2993 (1894).

Lederberg, J.W. Gènes et anticorps. Science 129, 1649–1653 (1959).

Petsko, G.A. & Ringe, D. Fluctuations de la structure des protéines à partir de la diffraction des rayons X. Anne. Rév. Biophys. Biophys. Chem. 13, 331–371 (1984).

Carr, C.M. & Kirn, PS Un mécanisme à ressort pour le changement de conformation de l'hémagglutinine grippale. Cellule 73, 823–832 (1993).

Bullough, P.A., Hughson, F.M., Skehel, J.J. & Wiley, D.C. Structure de l'hémagglutinine de la grippe au pH de la fusion membranaire. La nature 371, 37–43 (1994).

Stein, P. & Chothia, transformation de la structure tertiaire C. Serpin. J. Mol Biol. 221, 615–621 (1991).

Sprang, S.R. et al. Modifications structurelles de la glycogène phosphorylase induites par la phosphorylation. La nature 336, 215–221 (1988).

Olson, A.J., Bricogne, G. & Harrison, S.C. Structure du virus du rabougrissement de la tomate IV. La particule virale à une résolution de 2,9 . J. Mol. Biol. 171, 61–93 (1983).

Petersen, J.M. et al. Modulation de la liaison à l'ADN du facteur de transcription Ets-1 : dépliement induit par l'ADN d'une hélice . Science 269, 1866–1869 (1995).

Foote, J. & Milstein, C. Isomérie conformationnelle et diversité des anticorps. Proc. Nat. Acad. Sci. Etats-Unis 91, 10370–10374 (1994).

Braig, K. et al. La structure cristalline de la chaperonine bactérienne GroELat 2,8 . La nature 371, 578–586 (1994).

Barrow, C.J. & Zagorski, M.G. Structures en solution du peptide bêta et de ses fragments constitutifs : relation avec le dépôt d'amyloïde. Science 253, 179–182 (1991).

Betz, S.F., Bryson, J.W. & DeGrado, W.F. Faisceaux -hélicoïdaux conçus de manière native et structurellement caractérisés. Cour. Avis. Structurer. Biol. 5, 457–463 (1995).

Hill, C.P., Anderson, D.H., Wesson, L., DeGrado, W.F. & Eisenberg, D. Structure cristalline d'alpha 1 : implications pour la conception de protéines. Science 249, 543–546 (1990).

Landschultz, W.H., Johnson, P.F. & McKnight, S.L. La fermeture éclair à leucine : Une structure hypothétique commune à une nouvelle classe de protéines de liaison à l'ADN. Science 240, 1759–1764 (1988).

Hodges, R.S. Sodek, J., Smillie, LB. & Jurasek, L. Tropomyosine: séquence d'acides aminés et structure en spirale. Symptôme du port de Cold Spring. Quant. Biol. 37, 299–310 (1972).

Cohen, C. & Parry, A.D. Bobines et faisceaux enroulés -hélicoïdaux : comment concevoir une protéine -hélicoïdale. Protéines 7, 1–15 (1990).

Harbury, P.B., Zhang, T., Kirn, P.S. & Alber, T. Un commutateur entre les bobines enroulées à deux, trois et quatre brins dans les mutants GCN4 leucine-zipper. Science 262, 1401–1407 (1993).

Zhu, B.Y., Zhou, N.E., Kay, CM. & Hodges, R.S. Effets de tassement et d'hydrophobie sur le repliement et la stabilité des protéines : effets des acides aminés -ramifiés, de la valine et de l'isoleucine, sur la formation et la stabilité des spirales -hélicoïdales à deux brins/des fermetures à glissière leucine. Protéine Sci. 2, 383–394 (1993).

Harbury, P.B., Kirn, P.S. & Alber, T. Structure cristalline d'un trimère isoleucine-zipper. La nature 371, 80–83 (1994).

Lovejoy, B. et al. Structure cristalline d'une fermeture à glissière synthétique en leucine à trois brins. Science 259, 1288–1293 (1993).

Gonzalez, Jr., L., Plecs, J.J. & Alber, T. Un commutateur allostérique conçu dans l'oligomérisation de la leucine-zipper. Structure de la nature. Biol. 3, 510–515 (1996).

Betz, S., Fairman, R., O'Neil, K., Lear, J. & DeGrado, W.F. Conception de peptides coiled-coil à deux et trois brins. Phil. Trans. Roy. Soc. Londres.B 348, 81–88 (1995).

Lumb, K.J. & Kim, PS Une interaction polaire enterrée confère une unicité structurelle dans une bobine enroulée hétérodimérique conçue. Biochimie 34, 8642–5648 (1995).

O'Shea, E.K., Rutkowski, R. & Kim, P.S. Preuve que la fermeture à glissière leucine est une bobine enroulée. Science 243, 538–542 (1989).

O'Shea, E.K., Klemm, J.D., Kim, P.S. & Alber, T. Structure aux rayons X de la fermeture éclair à leucine GCN4, une bobine enroulée parallèle à deux brins. Science 254, 539–544 (1991).

Hurst, H.C. Séquences de protéines bZIP. Prot. Profil 1, 125–134 (1994).

Junius, F.K. et al. Caractérisation par résonance magnétique nucléaire du domaine de fermeture éclair à leucine de Jun: propriétés inhabituelles des résidus polaires interfaciaux enroulés. Biochimie 34, 6164–6174 (1995).

Potekhin, S.A., Medvedkin, V.N., Kashparov, I.A. & Venyaminov, S.U. Synthèse et propriétés du peptide correspondant à la forme mutante de leucine zipper de l'activateur transcriptionnel GCN4 de levure. Protéine Engng. 7, 1097–1101 (1994).

Brünger, A.T. Extension du remplacement moléculaire : une nouvelle stratégie de recherche basée sur le raffinement de la corrélation de Patterson. Acta Crystallogr. A46, 46–57 (1990).

Crick, F.H.C. Le garnissage des hélices : simples coils enroulés. Acta Crystallogr. 6, 689–697 (1953).

Harbury, P.B., Tidor, B. et Kim, P.S. Reconditionnement des noyaux protéiques avec liberté de l'épine dorsale : prédiction de structure pour les bobines enroulées. Proc. Nat. Acad. Sci. Etats-Unis 92, 8408–8412 (1995).

Réfléchissez, J.W. & Richards, F.M. Modèles tertiaires pour les protéines. Utilisation de critères d'emballage dans l'énumération des séquences autorisées pour différentes classes structurelles. J. Mol. Biol. 193, 775–791 (1987).

Goodman, E.M. & Kim, P.S. Périodicité des taux d'échange de protons d'amide dans un peptide à glissière à leucine enroulé. Biochimie 30, 11615–11620 (1991).

Lumb, K.J., Carr, C.M. & Kim, PS Pliage de sous-domaine de la fermeture éclair à leucine enroulée à partir de l'activateur transcriptionnel GCN4. Biochimie 33, 7361–7367 (1994).

Seo, J. & Cohen, C. Diversité de hauteur dans les bobines hélicoïdales . Protéines 15, 223–234 (1993).

DeLano, W.L. & Brünger, A.T. Emballage d'hélice dans les protéines : prédiction et analyse énergétique réussies des structures de bobines enroulées GCN4 dimères, trimères et tétramères. Structuration des protéines. Fonction Genet. 20, 105–123 (1994).

Connolly, M.L. Surfaces de protéines et d'acides nucléiques accessibles aux solvants. Science 222, 709–713 (1983).

Eisenberg, D. & McLachlan, A.D. Énergie de solvatation dans le repliement et la liaison des protéines. La nature 319, 199–203 (1986).

Pauling, L. & Corey, R.B. Configurations hélicoïdales composées de chaînes polypeptidiques : structure des protéines de type -kératine. La nature 171, 59–61 (1953).

Phillips, G.N. Quel est le pas de la bobine hélicoïdale ? Protéines 14, 425–429 (1992).

Offre, G. & Sessions, R. Modélisation informatique de la bobine enroulée -hélicoïdale : Emballage de chaînes latérales dans le noyau interne. J. Mol. Biol. 249, 967–987 (1995).

Fraser, R.D.B. & MacRae, T.P. Conformation dans les protéines fibreuses et les polypeptides synthétiques apparentés. 456-462 (Londres : Academic Press, 1973).

Chothia, C., Levitt, M. & Richardson, D. Emballage d'hélice à hélice dans les protéines. J. Mol. Biol. 145, 215–250 (1981).

Zhang, H. et al. Transitions conformationnelles dans les peptides contenant deux hélices alpha putatives de la protéine prion. J. Mol. Biol. 250, 514–526 (1995).


Résultats

La famille LRIM

La superfamille LRR est composée de protéines contenant LRR avec une variété d'architectures de domaine telles que les récepteurs transmembranaires Toll avec leurs domaines intracellulaires Toll-Interleukin Receptor (TIR). Plus de 180 membres de la superfamille LRR se trouvent dans les protéomes prédits de chacun des trois moustiques, tels que reconnus par leurs annotations InterPro «Leucine-rich repeat» (IPR001611). La recherche de gènes contenant LRR avec des caractéristiques de séquence ressemblant le plus à AgLRIM1 et AgAPL1C utilisé une combinaison d'approches et identifié 24 Un. Gambie, 29 Ae. egypte, et 30 Cx. quinquefasciatus LRIM-like genes (voir le fichier supplémentaire 1). Leurs protéines codées présentent toutes ou la plupart des caractéristiques clés de Ag LRIM1 et Ag APL1C : le peptide signal, les LRR, les modèles de résidus de cystéine et les coiled-coils. Cependant, aucun gène apparenté avec ces caractéristiques déterminantes n'a été identifié dans aucun des autres génomes d'insectes représentatifs (mouche des fruits, abeille ou pou de corps). Les LRIM de moustiques avec toutes les caractéristiques de séquence de clés peuvent être regroupés dans la sous-famille « Longue » avec 10 LRR ou plus qui comprend Ag LRIM1 et Ag APL1C, et les LRIM « courts » avec seulement 6 ou 7 LRR (Figure 1). Des gènes apparentés supplémentaires comprennent les LRIM « TM » avec une région transmembranaire C-terminale prédite, et les LRIM « sans bobine » qui présentent les signatures de séquence caractéristiques mais manquent des domaines de bobine enroulée C-terminale.

Les protéines LRIM de moustique identifiées peuvent être classées en quatre sous-familles distinctes. Les membres de la famille LRIM qui correspondent à toutes les caractéristiques déterminantes sont classés en LRIM longs avec 10 LRR ou plus et en LRIM courts avec 6 ou 7 LRR. Ceux qui présentent les caractéristiques déterminantes mais qui sont en outre prédits contenir un domaine transmembranaire C-terminal sont classés comme LRIM TM, et ceux auxquels il manque uniquement le domaine coiled-coil sont appelés LRIM sans bobine. Les unités LRR répétitives forment une structure en fer à cheval où les brins bêta courts forment une feuille bêta parallèle sur la face concave de l'arc et les hélices ou spires de liaison reposent sur la face convexe.

Les principales caractéristiques de séquence des membres de la famille LRIM permettent de faire des inférences concernant leurs architectures structurelles probables, avec leur caractéristique commune d'un domaine LRR de longueur variable. Les structures cristallines de plusieurs protéines contenant LRR révèlent que chaque répétition se compose d'un court brin bêta et d'une hélice ou d'une spire bêta où les brins forment une feuille bêta parallèle sur la face interne d'une structure en fer à cheval tandis que les hélices ou les spires reposer sur la face externe. La détermination de la structure de l'ectodomaine humain Toll-Like Receptor 3 (TLR3) LRR a confirmé le pli en fer à cheval et a permis de proposer un modèle d'interaction où la surface sans glycosylation pourrait être importante à la fois pour l'oligomérisation et la liaison du ligand [18, 19]. Ces structures suggèrent que les LRIM contenant 6 ou 7 LRR sont susceptibles de former un arc peu profond tandis que ceux avec plus de LRR peuvent se courber en structures plus étendues en forme de fer à cheval (Figure 1).

Analyses comparatives de séquences du moustique LRIM-les gènes similaires ont identifié des relations orthologues et paralogues probables. Ceci a été facilité par l'examen des régions génomiques orthologues (synténie) parmi les trois moustiques, qui ont identifié des grappes de LRIM orthologues avec des événements locaux de duplication et de brassage de gènes. Un groupe de courts LRIM (LRIM 7, 8, 9, et 10) se trouve à proximité immédiate d'un gène contenant le facteur d'échange de nucléotides de guanine (GNEF) présent chez les trois espèces (figure 2). duplications de LRIM8 dans Un. Gambie et LRIM10 dans Ae. egypte ont créé deux paires paralogues, tandis que LRIM7 et LRIM9 sont restés des orthologues à copie unique. L'emplacement relatif et l'orientation de LRIM9 est resté conservé pendant que LRIM10 apparaît inversé dans Un. Gambie. Les LRIM7-LRIM8 paire a conservé son orientation tête-bêche chez les trois espèces (avec le LRIM8B paralogue dans Un. Gambie), mais en Ae. egypte il a déménagé par rapport au dupliqué LRIM10. La portée génomique de la région orthologue dans Ae. egypte est environ quatre fois plus importante, principalement en raison de l'accumulation de nombreux éléments répétitifs et cohérente avec l'ensemble

étendue de régions de synténie 4,6 fois plus grande dans Ae. egypte par rapport à Un. Gambie [20]. Cette expansion génomique notable dans Ae. egypte est également observé dans le AgAPL1 cluster, qui est situé avec LRIM 3, 4, et 11 orthologues entre conservés BRACA2-like (protéine de susceptibilité au cancer du sein) et les gènes à doigt de zinc. Examen de l'organisation génomique de LRIM-like genes révèle ainsi des événements de duplication et de brassage de gènes qui ont façonné l'évolution de la LRIM famille de gènes chez les moustiques.

Amas génomiques orthologues de moustique Court LRIM gènes. Anopheles gambiae (rouge) chromosome (Chr) et orthologue Culex quinquefasciatus (violet) et Aedes aegypti (jaune) les supercontigs (Scont) sont représentés avec LRIM gènes (vert), un facteur d'échange de nucléotides de guanine (GNEF) contenant un gène (bleu) et des régions répétées (ombrage clair). Des analyses de séquences comparatives révèlent des duplications (lignes pointillées) de LRIM8 dans Un. Gambie et de LRIM10 dans Ae. egypte, tandis que LRIM7 et LRIM9 restent des orthologues à copie unique. Quelques brassages de LRIM les ordres et orientations des gènes se sont produits, et l'accumulation d'éléments répétitifs a laissé le Ae. egypte Région

Plusieurs des identifiés LRIM- des gènes similaires ont été attribués à des rôles immunitaires à partir d'études fonctionnelles, ce qui suggère qu'ils peuvent également fonctionner dans des réactions immunitaires clés contre les moustiques. Ceux-ci inclus AgLRIM4, un long LRIM induit dans l'intestin moyen par P. falciparum invasion ookinete [21] AgLRIM7 et AgLRIM10, des LRIM courts qui présentent des réponses transcriptionnelles aux parasites du paludisme [21] et AgLRIM8B, un troisième gène Short LRIM qui montre des schémas transcriptionnels sensibles au parasite [21] et est régulé à la baisse lors d'infections par une bactérie Gram-négative [22]. Le sans bobine AgLRIM17 Le gène est également induit par transcription dans l'intestin moyen du moustique lors de l'invasion du parasite [21] et a été initialement identifié dans le même Un. Gambie enquête de population qui a mis en évidence le rôle AgAPL1 en réponse à Plasmodium [6]. Faire taire AgLRIM17 révélé qu'il est un antagoniste des deux P. berghei et P. falciparum [21]. Dans Ae. egypte, le probable LRIM1 l'orthologue est régulé positivement avec d'autres gènes immunitaires après une infection par Wolbachia bactéries entraînant une activation immunitaire et une durée de vie raccourcie des moustiques [23]. Interroger les résultats des expériences de microarray examinant Un. Gambie les réponses transcriptionnelles aux infections parasitaires du paludisme [24] et l'alimentation sanguine [25] ont identifié au moins 18 LRIM avec des changements significatifs dans l'expression des gènes (voir le fichier supplémentaire 1). Presque tous ces Un. GLIM gambiae sont sensibles à l'alimentation par le sang, tandis que LRIM 1, 4, 6, 8A, 8B, 10 et 26 répondre à P. berghei infections. De plus, au moins 12 LRIM montrent une expression significativement plus élevée dans le corps gras, le principal organe immunitaire des insectes, par rapport aux tissus de l'intestin moyen ou des ovaires. L'identifié LRIMLes gènes similaires forment ainsi une famille de gènes de moustiques vecteurs de maladies qui semblent être des effecteurs importants dans l'immunité innée des moustiques.

Caractéristiques de la séquence de protéines LRIM

La nature répétitive des domaines LRR et coiled-coil, ainsi que leur tolérance à des niveaux élevés de substitutions d'acides aminés, présentent un défi considérable pour les algorithmes d'alignement de séquences multiples. Néanmoins, des approches par étapes avec curation manuelle des alignements de séquences de protéines LRIM ont servi à identifier les caractéristiques qui définissent la famille et aident à déduire les relations séquence-structure-fonction probables. Ces caractéristiques de séquence deviennent clairement discernables en comparant les protéines de moustique les plus étroitement liées à Ag LRIM1 et Ag APL1A/B/C (Figure 3) : les LRIM longs (LRIM 1-4 et APL1), le LRIM sans bobine le plus long (LRIM17) et les LRIM TM (LRIM 15-16).

Caractéristiques des séquences caractéristiques de la famille des protéines LRIM de moustique. UNE. L'alignement de séquences multiples annoté des longs LRIM (LRIM1-4), le plus long LRIM sans bobine (LRIM17) et les TM LRIM (LRIM15-16) de Anopheles gambiae (Ag, rouge), Aedes aegypti (Aa, jaune) et Culex quinquefasciatus (Cq, violet). L'alignement met en évidence les caractéristiques LRIM déterminantes, notamment le peptide signal (SP), les modèles de résidus de cystéine (C-C, C-CC et C *), le leader riche en leucine (LRL), les répétitions riches en leucine (LRR un) et les domaines double et simple coiled-coil (foncé, > 90% de propension, clair < 90% de propension). La région transmembranaire (TM) C-terminale identifie les LRIM TM et la répétition d'acides aminés PANGGL (Pro-Ala-Asn-Gly-Gly-Leu) est unique à Ag APL1C. Les losanges noirs indiquent les positions d'un décalage du cadre de séquence dans le gène codant Ag APL1A et insertion d'un élément transposable dans le gène codant Cq LRIM2A. B. L'examen des variations de longueur LRR révèle différentes contraintes sur les longueurs des séquences reliant les brins bêta qui forment la structure en fer à cheval LRR. Les proportions des longueurs LRR sont indiquées pour chaque ensemble de LRR alignés définis sur la figure 3A (à l'exclusion de ceux avec seulement 3 ou 4 séquences représentatives) et pour ceux calculés à partir du balayage automatisé des 26 LRIM illustrés dans le panneau A (UNE), les protéomes complets de chacune des trois espèces de moustiques (MME), et les protéomes de quatre autres insectes (DANS, Apis mellifera, Bombyx mori, Drosophila melanogaster, et Tribolium castaneum). C. Le modèle de conservation des résidus d'acides aminés du LRR- inhabituellement courtg (défini dans le panneau A) est représenté sous forme de logo de séquence. La signature LRR se distingue par l'asparagine conservée (N) et les leucines (L) (ou les isoleucines physicochimiquement similaires (je) et valines (V)), et la proline (P) les résidus sont communs aux positions 17 et 18 de LRR-g.

Les LRIM ciblent l'hémolymphe du moustique

Ag LRIM1 et Ag Les anticorps peptidiques APL1C reconnaissent spécifiquement les bandes de protéines uniques des tailles prédites dans Un. Gambie extraits d'hémolymphe [3], cohérents avec les séquences de peptides signal prédites qui dirigeraient ces protéines à sécréter dans le système circulatoire du moustique. Fait intéressant, l'épuisement de l'un ou l'autre des transcrits bloque la sécrétion des deux protéines par les hémocytes, indiquant que la co-expression de ces deux LRIM est requise pour la formation et la sécrétion correctes du complexe fonctionnel LRIM1/APL1C [3]. A part l'un des Cx. quinquefasciatus Paralogues LRIM2 (Cq LRIM2C, figure 3A), des sites de clivage pour les prédictions de peptide signal sont trouvés pour toutes les protéines LRIM (voir le fichier supplémentaire 1). Le premier exon contenant le peptide signal de CqLRIM2C est probablement masquée par une insertion d'élément transposable (TE) étroitement voisine qui peut rendre ce gène non fonctionnel. De même, un

Étendue de 4,4 Ko des insertions TE dans la région de codage de la bobine enroulée du CqLRIM2A paralogue (Figure 3A) peut perturber la fonction de cette copie, laissant CqLRIM2B comme orthologue fonctionnel probable APL1/LRIM2. Les peptides signal des TM LRIM devraient les diriger vers la voie de sécrétion, mais leurs régions C-terminales hydrophobes les ancrent probablement dans la membrane cellulaire exposant leurs ectodomaines contenant LRR d'une manière similaire aux TLR. Le court,

Les régions intracellulaires de 30 acides aminés des LRIM TM n'ont pas de domaines de tri ou de signalisation reconnaissables, mais les résidus sérine et thréonine conservés pourraient être des cibles potentielles de phosphorylation. Sécrétés dans l'hémolymphe du moustique ou exposés sur les membranes cellulaires (éventuellement des hémocytes), les LRIM sont ainsi capables de circuler largement vers des sites où une épreuve immunitaire peut déclencher une réponse.

La répétition PANGGL est unique à AgAPL1C

La région N-terminale adjacente au peptide signal du AgAPL1C gene encompasses multiple repeats of the consensus amino acid sequence Pro-Ala-Asn-Gly-Gly-Leu, PANGGL (Figure 3A). Such repeats are not present in the other LRIM proteins and could not be identified in any other protein-coding genes. Sequencing multiple APL1C cDNA clones from laboratory adult male An. Gambie mosquitoes indicated the existence of polymorphic AgAPL1C alleles encoding variable numbers of PANGGL repeats (Figure 4). The G3 mosquitoes exhibit three major bands likely corresponding to different alleles, while up to six different alleles were identified from individuals of the more recently colonised Yaounde strain. However, the possible structural and functional significance of these PANGGL repeat polymorphisms remains to be determined.

Variation of Anopheles gambiae APL1C PANGGL (Pro-Ala-Asn-Gly-Gly-Leu) repeats in individual male mosquitoes from three laboratory strains. PCR primers amplify variable-length fragments likely corresponding to up to three, four, and six PANGGL repeat copy-number variations in samples of 12 individual G3, L35, and Yaounde mosquitoes, respectively.

LRIMs contain 6 to 14 LRRs of different lengths

The Short LRIMs and the majority of Coil-less LRIMs contain 6 or 7 recognisable LRRs while the LRR domains of the Long, TM, and remaining 3 Coil-less LRIMs are made up of 10 to 14 repeats (see additional file 1). LRR motifs are typically 20 to 30 residues in length and are characterised by an 11-residue consensus defined principally by the spacing of the leucines, LxxLxLxxNxL (Figure 3). The LRR pattern tolerates various substitutions with the leucines (L) frequently being replaced by valine (V) or isoleucine (je) and the position of the asparagine (N) accepting serine (S), threonine (T), or cysteine (C) replacements. LRRs of the Coil-less LRIMs show frequent N replacements while the N is ubiquitous among Long LRIM LRRs and highly-conserved among TM and Short LRIMs: T replaces N in LRR-k of the TM LRIMs (Figure 3A), and the Short LRIM5 and LRIM11 each have one LRR where N is not maintained. Apart from the LRIM1 orthologues, the LRIM LRR domains are preceded by a leucine-rich leader (LRL, Figure 3A) that resembles the LRR signature sequence but exhibits elevated leucine substitutions and almost never has the characteristic N. The similarity suggests that LRLs may form similar strand-helix/turn structures of the more canonical LRRs, but as the first of these repeating structures the LRL sequences are likely to be less constrained. The Short and Coil-less LRIMs also exhibit LRL sequences, but these are less distinct among many Coil-less LRIMs where the LRR consensus sequences are generally less well-defined. Such an irregular type of LRR-like sequence found at the start of the LRR domain is also frequently observed in the sequences of vertebrate TLRs [26]. The last LRR (LRR-m) is distinct from the other LRIM LRRs, this LRR is well-conserved with a tryptophan (W) or phenylalanine (F) consistently replacing the last 'L' of the LRR consensus followed by a ubiquitously present cysteine residue (LxxLxLxxNx[WF]xC). This distinctive terminal LRR pattern is also observed among the Short and Coil-less LRIMs.

Examining the lengths of the LRIM LRRs revealed the exceptionally short LRR-g, which is consistently only 19 amino acids long (Figure 3B). The majority of LRIM LRRs are 24 residues in length, which is also the most common LRR length among LRR-containing proteins of mosquitoes and other insects. LRR lengths include the 11-residue consensus identifiable from sequence profiles plus the additional variable-length region before the start of the next consensus, which for LRR-g is just 8 residues long (Figure 3C). Although rare, examples of short LRRs with only 19 amino acids have been identified, e.g. Mimivirus protein R380 [27], suggesting that such short LRRs may not necessarily interrupt the complete LRR fold. Proline residues in the LRR variable regions are common in short LRRs where they form part of the convex side of these repeats. Consistent with this observation, proline is the most common residue at positions 17 and 18 of LRR-g (Figure 3C). The LRR immediately following the short LRR-g exhibits the most variable lengths with LRRs of 20, 21, 22, 23, and 24 amino acids (LRR-h) and the third 'L' of its 11-residue LRR consensus is almost always replaced by a less bulky alanine (UNE) residue. The mosquito LRIM-like genes are thus characterised by a variable number of 6 to 14 recognisable LRRs of different lengths, with a subset of LRIMs that exhibit an unusually short LRR of only 19 amino acids.

Patterns of LRIM cysteine residues suggest critical disulphide bridging

The comparison of protein sequences most closely related to Ag LRIM1 and Ag APL1C highlights several well-conserved patterns of cysteine residues (Figure 3A). The leading C-C motif is notably absent from Ag LRIM1 and Ag APL1B, while the double-cysteine motif (C-CC) is incomplete in Aa LRIM2 and missing from the frameshift-disrupted Ag APL1A. This frameshift is present in the sequenced An. Gambie PEST genome assembly but may not occur in other populations where anti-parasitic effects of Ag APL1A have been observed [13]. The double-cysteine motif is consistently replaced by a tyrosine-cysteine motif in the TM LRIMs, and a third solitary cysteine (C*) is conserved in only LRIM1 and LRIM2/APL1 proteins. The leading C-C motif and the double-cysteine motif are also present in all Short and Coil-less LRIMs apart from the three LRIM20 orthologues that lack the leading C-C motif (see additional file 1). Such cysteine patterns are common to many LRR-containing proteins in the regions immediately flanking the LRR domain where they form intramolecular disulphide-bonded caps that stabilise the N-and C-terminal ends of the LRR domains [27]. A double-cysteine motif resembling that found in the LRIMs forms the disulphide-bonded C-terminal cap of the Nogo-66 receptor, a human LRR protein involved in signalling that modulates axon regeneration [28]. This motif contains six cysteines that form three disulphide bridges, suggesting that the LRIM C-CC motif, together with a ubiquitously conserved cysteine residue that immediately follows the last LRR consensus, could allow for the formation of two disulphide bridges to build a stabilising cap.

As well as forming the N-and C-terminal LRR caps, the patterns of cysteine residues may also be important in stabilising LRIM-LRIM interactions as in the case of Ag LRIM1 and Ag APL1C. Examining the behaviour of Ag LRIM1 and Ag APL1C using specific antibodies under non-reducing conditions revealed major protein bands of a high molecular weight complex that resolved into expected monomer sizes under reducing conditions [3]. Thus, these two LRIMs form a disulphide-bridged complex, further suggesting that the patterns of conserved cysteine residues that characterise the family of LRIM proteins may be critical to the formation of LRIM complexes. LRR-flanking cysteines have also been implicated in facilitating interactions with other proteins as in the case of mammalian TLR4 and its MD-2 (myeloid differentiation protein) partner required for the recognition of lipopolysaccharide [29]. The MD-2-like family of proteins is expanded in mosquitoes compared to the fruitfly and exhibits six conserved cysteines that may be important in such protein-protein interactions [1, 21]. At least one of these MD-2-like proteins in An. Gambie shows specificity in regulating resistance to P. falciparum [21]. Thus, cysteine residue patterns among LRIM-like proteins may be important for LRR capping as well as for stable interactions both in the formation of LRIM complexes and in the interaction with other protein partners.

LRIM coiled-coil domains may facilitate protein-protein interactions

The LRIM1 and APL1/LRIM2 proteins all exhibit a double coiled-coil C-terminal domain (Figure 3A), while the remaining Long LRIMs and all the Short LRIMs exhibit at least one coiled-coil C-terminal region (see additional file 1). Coiled-coil domains can take on a variety of conformations with different helix stoichiometries and orientations [30]. Protein coiled-coils are formed when alpha-helices wrap around each other into stable supercoiled structures of parallel or anti-parallel, homo-or hetero-, dimers or higher order oligomers found in both fibrous and globular proteins. Each of the seven-residue repeats that define the primary structure of coiled-coils gives rise to a complete turn along the alpha-helix, with an amphipathic nature required for supercoil formation. Despite understanding these principles, reliable predictions of coiled-coil domain interactions remain generally unfeasible.

While the predicted monomer sizes of An. Gambie LRIM1 and APL1C are

80 kD, respectively, the disulphide-bridged complex migrated at

260 kD suggesting the presence of a functional multimer in the hemolymph [3]. However, given that the observed size changes significantly depending on the resolving power of the gel system used for protein separation (Povelones M, unpublished data), and that coiled-coil containing proteins often exhibit aberrantly slow electrophoretic mobility, it is possible that the complex is assembled from 2-4 LRIM1 or APL1C monomers. Their double coiled-coil domains may facilitate initial associations that bring the proteins together in an orientation to promote the formation of stabilising disulphide bridges. The LRIM coiled-coil domains may therefore play critical roles in facilitating protein-protein interactions, both in the formation of LRIM protein complexes as well as in associating with other components of the mosquito complement-like system.


Protein Secondary Structure: α-Helices and β-Sheets

In the following we will focus on the general aspects of protein secondary structure. Many of the features discussed here are essential for practical applications &minus for example in sequence alignment and analysis, homology modelling and analysis of model quality, in planning mutations or when analyzing protein-ligand interactions.

The &alpha-helix
The most common type of secondary structure in proteins is the &alpha-helix. Linus Pauling was the first to predict the existence of &alpha-helices. The prediction was confirmed when the first three-dimensional structure of a protein, myoglobin (by Max Perutz and John Kendrew) was determined by X-ray crystallography. An example of an &alpha-helix is shown on the image below. This type of representation of a protein structure is called &ldquosticks representation&rdquo. To get a better impression of how a helix looks like, only the main chain of the polypeptide is shown, no side chains. There are 3.6 residues/turn in an &alpha-helix, which means that there is one residue every 100 degrees of rotation (360/3.6). Each residue is translated 1.5 Å along the helix axis, which gives a vertical distance of 5.4 Å between structurally equivalent atoms in a turn (pitch of a turn). The repeating structural pattern in helices is a result of repeating (similar) &phi and &psi values, which is reflected in the clustering of the torsion angles within the helical region of the Ramachandran plot . When looking at the helix in the figure below, notice how the carbonyl (C=O) oxygen atoms (shown in red) point in one direction, towards the amide NH groups 4 residues away (i, i+4). Together these groups form a hydrogen bond, one of the main forces in the stabilization of secondary structure in proteins. The hydrogen bonds are shown on the figure as dashed lines.

The &alpha-helix is not the only helical structure in proteins. Other helical structures include the 3_10 helix, which is stabilized by hydrogen bonds of the type (i, i+3) and the &pi-helix, which is stabilized by hydrogen bonds of the type (i, i+5). The 3_10 helix has a smaller radius, compared to the &alpha-helix, while the &pi-helix has a larger radius. The first detailed analysis of the occurrence of the &pi-helix in proteins, based on the analysis of entries in the Protein Data Bank (PDB), was published by Fodje & Al-Karadaghi, 2002 .
We should also note that in addition to the &ldquosimple&rdquo helical structures mentioned here, there is a number of so-called coiled-coil structures, in which two or more &alpha-helices together build higher-order helical structures.

The &beta-sheet
The second major secondary structure element in proteins is the &beta-sheet. &beta-sheets consist of several &beta-strands, stretched segments of the polypeptide chain kept together by a network of hydrogen bonds between adjacent strands. An example of a &beta-sheet, with the stabilizing hydrogen bonds between adjacent strands (shown as dotted lines), is shown in the image below:

It is important to note that unlike in helices, the residues informing hydrogen bonds between the adjacent strands are separated from each other by long segments of the amino acid sequence.

In the following image the same &beta-sheet is shown, this time in the context of the 3D structure to which it belongs and in a so-called "ribbon" representation (the coloring here is according to secondary structure - &beta-sheets in yellow and helices in magenta). Each &beta&minusstrand is represented by an arrow, which defines its direction starting from the N- to the C-terminus. When the strand arrows point in the same direction, we call such &beta-sheet parallel (the protein PDB code is 1G8P, BchI subunit of magnesium chelatase). You may also notice a &beta-hairpin, two strands connected by a loop in the left corner of the image:

In the image below you can see that the strand arrows point in opposite directions, which is a characteristic of an anti-parallel &beta-sheet (this protein PDB code is 1USR, Newcastle disease virus hemagglutinin-neuraminidase).

Loops, turns and hairpins
When there are only 2 anti-parallel &beta-strands, like in the figure below, it is called a &beta-hairpin.

The loop between the two strands is called a &beta-turn. Short turns and longer loops play an important role in protein 3D structures, connecting together strands to strands, strands to &alpha-helices, or helices to helices. The amino acid sequences in loop regions are often highly variable within a protein family. But in some cases, when a loop has some specific function, for example interaction with another protein, the sequence may be conserved. Loop length in proteins from organisms living at elevated temperatures (thermophilic organisms) is usually shorter than in protein from lower-temperature family members, presumably to give a protein additional stability at high temperatures, preventing its unfolding and denaturation. During sequence alignment and homology modeling , when it is essential to have an accurate sequence alignment, the highly variable length of loop regions justifies the localization of insertions and deletions in the amino acid sequence to loop regions.

Structural motifs that contain combinations of helices, helices and strands, etc., are closely linked to protein fold. For this reason, when viewing a protein 3D structures, it is an advantage to be able to recognize the secondary structure elements and to identify structural motifs. In the next section we will examine some of the ways by which secondary structure elements connect to each other, forming common structural motifs and folds .


Voir la vidéo: Kristian Kivimäki: uratarina Silja Serenaden Safetyksi #tallinksiljastaff (Décembre 2021).