Informations

Comment deux génomes adoptent-ils lorsque la cellule passe du corps du donneur au corps du receveur ?


Nous donnons souvent du sang à un autre en suivant le tableau de compatibilité des dons de sang. La transplantation cardiaque et les transplantations similaires amènent également sa cellule dans le corps d'un autre.

Ma curiosité est, quand une cellule va au corps du receveur du corps du donneur, que se passe-t-il réellement en ce qui concerne le génome ?

Si les génomes ne fusionnent pas en un seul, alors comment en identifier un à l'identique ? Comment les empreintes génétiques, la détection des parents, etc. fonctionnent-ils correctement ? Plus généralement, comment maintient-il la cohérence ?

Remarques:

Mon hypothèse était : "Toutes les cellules du corps d'une personne en particulier portent la même information génomique ou ADN. Et chaque individu a un génome ou une information ADN distincts". Mais après quelques études et quelques commentaires, j'ai trouvé que la déclaration est en fait fausse.

Cependant, cet article m'a amené à casser ma fausse idée.


Ma réponse précédente était à la question initiale qui portait sur les globules rouges qui ne contiennent pas d'ADN. Maintenant que la question a été révisée pour se concentrer sur la transplantation de tissus, où les cellules contiennent de l'ADN étranger, ma réponse modifiée traite de quelques-uns des points soulevés, mais seulement brièvement avec la question de l'identification.

Incorporation d'ADN étranger dans le génome humain

Il est extrêmement improbable que l'ADN du tissu du donneur soit incorporé dans l'ADN des cellules du receveur. Les cellules du donneur devraient être brisées (c'est-à-dire mourir) pour libérer l'ADN, qui est le plus susceptible d'être dégradé au cours du processus. Même s'il survivait, il devrait alors être absorbé par les cellules hôtes, ce qui est peu probable car il n'y a pas de mécanisme spécifique pour le permettre. Cependant, si l'ADN étranger arrivait d'une manière ou d'une autre dans le noyau, il aurait besoin d'une machinerie spécifique pour être incorporé dans l'ADN hôte. Cela implique que des enzymes effectuent des coupes décalées dans l'ADN étranger et hôte pour permettre l'annelage et les enzymes de ligaturer les deux ensemble. Nous connaissons ce genre de choses parce que les rétrovirus et les virus qui peuvent exister dans le génome à l'état latent ont des mécanismes spécifiques pour le faire. Il est peu probable que cela se produise par hasard.

Même si de l'ADN étranger a été incorporé, il doit toujours se trouver dans un environnement qui lui permet de s'exprimer (promoteurs appropriés). Une possibilité plus probable est l'insertion dans une position qui affecte un gène hôte. Cela peut entraîner une division incontrôlée des cellules, c'est-à-dire qu'elles deviennent cancéreuses, et c'est un problème qui a été rencontré en utilisant des virus du type mentionné pour insérer des gènes dans des génomes en thérapie génique.

Les différences dans l'ADN des tissus transplantés sont-elles importantes ?

De toute évidence, les différences dans l'ADN de différents individus ont un effet sur l'individu. Ce sont les différences génétiques qui font que les gens diffèrent par la taille, la forme, les caractéristiques, la couleur des cheveux, etc. Oh, et certains sont des filles et d'autres sont des garçons. Mais lorsque les tissus et les organes ont fini de se développer, cela n'a probablement pas d'importance si un morceau de foie transplanté provient d'un donneur masculin ou féminin. Le programme génétique qui provoque la différenciation sexuelle et la fonction n'est pas celui qui s'exprime dans le foie adulte. Les gènes qui sont exprimés sont ceux des enzymes dont le foie a besoin pour jouer son rôle métabolique (trop nombreux pour être énumérés), et s'ils fonctionnent, ils fonctionnent, même si les protéines diffèrent dans la séquence d'acides aminés par l'acide aminé impair qui ne n'altère pas sa fonction.

Le problème de l'identification par ADN

J'aurais pensé que ce ne serait pas vraiment un problème. Après tout, si vous voulez prélever un échantillon d'ADN sur une personne, vous pouvez le faire avec des racines de cheveux, des globules blancs ou des raclures de la peau de la bouche. Vous n'auriez pas besoin de recourir à des biopsies du foie et autres.

Docteur en philosophie

Enfin, je peux voir qu'il y a une préoccupation philosophique générale sur qui l'on est si l'on a des tissus ou des organes d'un autre donneur, mais jusqu'à ce que nous ayons une greffe de cerveau, je ne vais pas m'inquiéter à ce sujet. (Et quand cela arrivera, je ne répondrai pas aux questions sur le sujet.)


Étagère à livres

Bibliothèque NCBI. Un service de la National Library of Medicine, National Institutes of Health.

Comité du Conseil national de la recherche (États-Unis) sur les droits de propriété intellectuelle dans la recherche et l'innovation en génomique et en protéines Merrill SA, Mazza AM, rédacteurs. Récolter les bénéfices de la recherche génomique et protéomique : droits de propriété intellectuelle, innovation et santé publique. Washington (DC): National Academies Press (États-Unis) 2006.


1. Introduction

Comprendre comment un génome instruit les caractéristiques phénotypiques d'un organisme est l'un des principaux efforts scientifiques de la génétique moléculaire moderne. Ceci est largement réalisé par une combinaison d'études génétiques avancées, qui utilisent des traits phénotypiques pour cartographier de manière impartiale la base génétique de phénomènes biologiques définis, et d'études de génétique inverse, qui analysent les effets phénotypiques de la modification d'un élément génétique donné. Pour le génome nucléaire, notre capacité à effectuer de la génétique directe et inverse est établie depuis plusieurs décennies [1]. Les récents progrès des technologies de séquençage et la révolution CRISPR-Cas9 ont encore amélioré notre capacité de cartographie et d'édition de génomes nucléaires avec une efficacité sans précédent dans une multitude d'organismes [2], conduisant à de nombreuses applications dans la recherche, l'industrie, la médecine et l'agriculture.

En revanche, le génome mitochondrial a été laissé pour compte dans cette ère du génie génétique. La recombinaison peu fréquente et la nature multicopie de l'ADNmt présentent de nombreux défis qui nous empêchent de cartographier les fondements génétiques des traits phénotypiques. De plus, l'absence d'une méthode robuste pour modifier génétiquement l'ADNmt dans presque toutes les espèces nous laisse peu de pouvoir pour étudier divers aspects de la biologie de l'ADNmt et pour modéliser la progression de la maladie causée par des mutations pathogènes. Compte tenu des fonctions essentielles de l'ADNmt et de son lien avec les maladies incurables, il existe une pression croissante pour le développement d'outils génétiques pour disséquer les rôles complexes que joue l'ADNmt dans le développement, le vieillissement, la maladie et l'évolution. Dans cet article, nous discutons de la motivation et des défis de la cartographie et de l'édition de l'ADNmt animal.


Résultats

Corrélation entre la distance de Mash et les estimations de confinement

Pour le k-mères d'un génome de référence donné une, un génome apparenté une contenu dans un ensemble de lecture métagénomique b devrait, par conception, avoir un score de confinement Mash, Mc(une,b) (voir « Fondements mathématiques »), qui est inversement corrélée à la distance de Mash M(une,b ). Idéalement, Mc(une,b)=1−M(une,une ). Cependant, étant donné que le métagénome peut contenir k-mers correspondant une qui ne sont pas de une , et les différentes formulations de la distance et du confinement de Mash, la corrélation est imparfaite.

Pour tester la corrélation entre le score de confinement de Mash et la distance de Mash, nous avons analysé les lectures métagénomiques, à la fois réelles et simulées, d'une communauté fictive de bactéries et d'archées avec des constituants connus [17], appelée ici ensemble de données Shakya. Pour les scores attendus, nous avons utilisé tous les génomes RefSeq de taille proche des constituants Shakya (entre 100K et 20M de nucléotides, excluant effectivement les virus et les eucaryotes) et calculé avec une grande précision (taille de l'esquisse 100 000), les distances Mash du génome entier entre chacun de ces génomes et leur constituant Shakya le plus proche. Ces distances ont été comparées aux scores de confinement de Mash pour les mêmes génomes, obtenus en criblant les lectures métagénomiques brutes contre RefSeq. Le criblage des 11,1 gigabases d'Illumina par rapport à RefSeq (compressé de 1,14 To à un sketch de 1,2 Go) pour cette analyse a pris 61 minutes CPU, en utilisant un pic de 11 Go de mémoire (détails du système dans « Corrélation entre la distance de Mash et les estimations de confinement ») . Bien que n'étant pas directement comparable aux méthodes d'indexation mentionnées ci-dessus, qui ont à la fois des approches et des applications différentes, la compression de la base de données de Mash (950 × dans ce cas) est d'une échelle similaire à celle rapportée par Mantis [15] (250 ×) ou BIGSI [16] (113 ×). Les besoins en mémoire de ces outils ont tendance à suivre de près la taille de ces index, et cela est également vrai pour Mash Screen.

Les scores de confinement du mash ont montré une bonne corrélation pour les distances de mash inférieures à 0,2 (r 2 = 0,99), mais avait tendance à surestimer les distances Mash supérieures à 0,2 (r 2 = 0,43 pour tous les points avec des scores de confinement non nuls, Fig. 3a). Premièrement, comme les estimations de distance de Mash, l'erreur attendue des estimations de confinement augmente pour les séquences plus divergentes. Deuxièmement, lors de l'estimation du confinement, k-mers de n'importe quel génome dans le mélange sont autorisés à correspondre à la référence, alors que la distance Mash est limitée à la correspondance uniquement k-mères du génome comparé. La figure 3 (à gauche) met également en évidence un certain nombre de valeurs aberrantes qui se situent bien en dehors de la diagonale. Les points entourés de rouge représentent les génomes RefSeq qui ne partagent pas une grande similitude avec les génomes constituants attendus, mais qui ont des scores de confinement élevés par rapport au métagénome. Cela indique une suspicion de contamination dans la communauté fictive de Shakya.

Corrélation des scores de confinement de Mash avec les distances de Mash par paires. Les points représentent les génomes RefSeq avec des tailles comprises entre 100K et 20M. Les X-axis est la distance Mash au génome le plus proche dans le métagénome synthétique Shakya, qui sert de score de confinement attendu. Pour le oui-axe, les lectures brutes de ce métagénome ont été passées à travers Mash Screen (taille d'esquisse 1000) pour obtenir un score de confinement réel pour chacun des génomes. À gauche, de vraies lectures d'Illumina séquencées à partir de la communauté fictive (SRR606249). La zone entourée en rouge met en évidence les génomes RefSeq avec des scores de confinement plus élevés que prévu en raison de la contamination de la séquence de séquençage. Cette contamination a été confirmée de manière indépendante via une cartographie de lecture, révélant la présence d'au moins quatre espèces supplémentaires. Encerclés en magenta et orange se trouvent deux clades de F. nucleatum qui sont cohérents avec la faible abondance de la souche de référence (magenta) et la contamination intra-espèce (orange), qui ont toutes deux été décrites précédemment pour cet ensemble de données. À droite, la simulation des lectures à partir des seuls constituants connus corrige les valeurs aberrantes et donne la corrélation attendue. Non affiché : 1645 points (0,28 X≤0.52,oui=0) (tracé de gauche) et 356 points en (0,32≤X≤0.52,oui=0) (tracé de droite), représentant les limites de sensibilité de la taille d'esquisse par défaut (1000) utilisée pour le oui-axe, par rapport à la sensibilité plus élevée utilisée pour le X-axis (taille d'esquisse de 100 000). Aucun point ne se trouve à droite des zones de tracé

Escherichia coli et Proteiniclasticum ruminis la contamination avait déjà été détectée dans cette communauté fictive par Awad et al. [18], et nous avons donc supposé que cela provoquait l'écart entre la distance de Mash et les estimations de confinement. Conformément à cette explication, la simulation de lectures à partir des seuls constituants répertoriés a amélioré la corrélation globale pour les scores de confinement non nuls à r 2 = 0,73 (Fig. 3, à droite). Une enquête plus approfondie sur les points aberrants a révélé des Propionibacterium acnes et Streptococcus parasanguinis contamination qui n'a pas été identifiée par les études antérieures. La cartographie de toutes les lectures métagénomiques sur ces génomes de référence a confirmé la présence des quatre espèces contaminantes ou de leurs proches parents (tableau 1). Après filtrage des points résultant de ces contaminants, la corrélation de l'ensemble de données réel était similaire à celle de l'ensemble de données simulé (r 2 = 0,72). Les points plus proches de la diagonale sont également remarquables, mais toujours en groupes distincts, surlignés en magenta et en orange sur la figure 3 (à gauche). Ceux-ci représentent deux clades distincts de F. nucleatum, un commensal gram-négatif de la cavité buccale humaine qui a des sous-espèces bien délimitées [19]. La souche de référence attendue, ATCC 25586, a été notée par Awad et al. être présent en faible abondance, ce qui explique probablement que le confinement de Mash soit plus faible que prévu pour cette souche et des souches similaires (sous la diagonale, encerclée en magenta). Les déformations au-dessus de la diagonale (cerclées en orange), cependant, représentent Fusobacterium nucleatum sous-espèce (polymorphe et vincentii) qu'Awad et al. pourrait être des contaminants intraspécifiques. Les résultats de cette expérience sont donc largement en accord avec des recherches antérieures indépendantes, validant à la fois les découvertes passées et notre nouvelle méthode.

Qu'y a-t-il dans mon run de séquençage ?

Comme illustré ci-dessus, Mash Screen peut découvrir des organismes inattendus dans des mélanges de séquences. Cela peut être utile pour vérifier tout cycle de séquençage pour une contamination accidentelle. En explorant les résultats du confinement pour un certain nombre d'ensembles de données SRA, nous avons identifié un certain nombre d'événements de contamination potentiels. Par exemple, SRA run ERR024951 est un ensemble de données à lecture courte de 1,1 Go étiqueté comme Salmonella enterica subsp. enterica sérovar Typhimurium. Cependant, l'analyse avec Mash Screen a également indiqué la présence de Klebsiella pneumoniae, la souche k1037 (GCF_900086185.1) étant la plus proche. Nous avons vérifié la présence du contaminant en mappant toutes les lectures aux deux Salmonella enterica et Klebsiella pneumoniae génomes de référence. Cela a révélé que la majorité des lectures dans cet échantillon provenaient en fait de Klebsiella pneumoniae (Tableau 2). Les métadonnées sur cet ensemble de données particulier indiquent qu'il fait partie d'un séquençage multiplexé, suggérant une source de contamination possible. Étant donné que Mash Screen est extrêmement rapide à exécuter, il peut être utilisé dans le cadre d'un flux de travail de séquençage standard pour détecter de tels événements avant que les données ne soient soumises aux archives publiques.

Dans les exemples ci-dessus, nous montrons comment Mash Screen peut identifier une « liste restreinte » de génomes susceptibles de faire partie d'un séquençage. Cela peut être généralisé au problème de la classification métagénomique, où les bases de données de référence sont souvent trop grandes pour permettre les techniques traditionnelles d'analyse de séquences telles que la cartographie de lecture. Bien qu'il ne s'agisse pas d'un classificateur à part entière, Mash Screen peut aider à résoudre ce problème en filtrant rapidement les génomes de référence qui ne sont pas bien contenus par le mélange de requêtes. Cela peut réduire considérablement le nombre de séquences de référence nécessaires pour de bons résultats de cartographie et/ou de classification. Pour tester cette application, nous avons comparé la vérité connue du métagénome de Shakya aux résultats du dépistage des lectures pour le confinement des génomes RefSeq. Les génomes filtrés représentent une réduction de taille significative en termes de fraction de nucléotides représentés, mais englobaient toujours la grande majorité des génomes constituants connus (tableau 3). Notez qu'un seuil de 1 (confinement parfait) laisse de nombreux génomes de côté car Mash Screen est sensible à la fois à l'identité et à l'exhaustivité, et il a été observé que la couverture de certains génomes dans cet échantillon est faible [18]. Cette expérimentation est donc une bonne illustration du compromis entre la taille de la base de données et la sensibilité de la classification qui peut être nécessaire. Cependant, dans ce cas, le présélection à un confinement Mash de 0,9 conserve tous les génomes de référence corrects tout en réduisant considérablement la taille de la base de données, et le resserrement du seuil à 0,99 conserve 56/58 des génomes corrects tout en réduisant la taille de la base de données un ordre supplémentaire de ordre de grandeur. Ainsi, Mash Screen peut être utile pour recruter un ensemble approprié de génomes de référence pour la cartographie de lecture métagénomique.

Estimer le confinement du protéome avec un écran traduit

Mash Screen introduit la prise en charge d'un alphabet d'acides aminés, y compris la traduction à 6 images des lectures d'entrée. Cela permet l'esquisse de protéines et l'estimation du confinement du protéome directement à partir des lectures de séquençage métagénomique, ce qui peut être utile lors de la recherche de gènes ou de génomes divergents à l'aide de lectures courtes. Pour démontrer que Mash's k-mer-based peut mesurer efficacement la similarité des protéines, nous avons comparé Mash Screen au programme d'alignement traduit couramment utilisé DIAMOND [20]. Pour un ensemble de référence, nous avons commencé avec des fragments de protéines signalés à partir de deux échantillons du Human Microbiome Project [21], SRS015937 et SRS020263, et avons recruté leurs meilleurs résultats sur des protéines complètes dans la base de données NCBI nr, résultant en 28 334 séquences protéiques. Les lectures de séquence à partir d'un seul échantillon, SRS020263, ont ensuite été mappées avec DIAMOND sur cet ensemble combiné de protéines pour garantir une large gamme de scores d'alignement. Notez que Mash et DIAMOND sont conçus pour des tâches différentes. Mash estime la similarité globale, tandis que DIAMOND calcule les alignements locaux. Pour estimer la similarité globale à partir des alignements DIAMOND, un résidu consensus a été calculé à chaque position de référence alignée à la majorité simple, et le nombre total de correspondances a été divisé par la longueur de la protéine de référence pour estimer la similarité globale, en tenant compte à la fois de la similarité et de la couverture. Par défaut et lors de l'exécution, DIAMOND rapporte le meilleur HSP (c'est-à-dire le mappage) pour un maximum de 25 séquences de référence pour chaque lecture. Les scores de consensus décrivent ainsi à quel point chaque protéine est représentée dans les lectures, sans affecter chaque lecture exclusivement à une protéine, de manière analogue à Mash Screen. Les scores de consensus ont été comparés aux scores de confinement de Mash calculés en criblant les lectures de séquençage par rapport à une bibliothèque de croquis constituée des mêmes protéines de référence. La corrélation globale entre les deux scores était r 2 = 0,64, et la relation est restée linéaire même pour les protéines à faible couverture (Fig. 4). Comme on l'a vu dans les comparaisons ci-dessus avec la distance de Mash, le score de confinement de Mash avait tendance à surestimer les scores DIAMOND par paire, en particulier avec des scores plus faibles, mais de manière assez cohérente.

Corrélation des scores de confinement de Mash Screen avec l'identité de mappage de lecture de DIAMOND, chacune utilisant des traductions de six cadres pour comparer les lectures de nucléotides aux séquences de référence de protéines. Chaque point représente un gène de l'ensemble recruté choisi pour l'expérience. Positionner sur le X-axis correspond à l'identité d'alignement global estimée à partir de la cartographie, tandis que la position sur le oui-axis représente le score de confinement pour la même protéine tel que rapporté par Mash Screen. La coloration représente le Mash Screen p valeur. Les points indiqués par des flèches ont des alignements légitimes qui n'ont pas été captés par DIAMOND avec ses paramètres les plus sensibles en orange une séquence courte (20aa) (AMP55843.1) et en séquences magenta avec des régions de faible complexité (ESV13988.1, EYQ74458.1 , WP_002468660.1) qui n'étaient pas alignés malgré la désactivation du filtre de faible complexité. Points le long de la X-axis représentent les limites de la sensibilité de Mash Screen. Pour ces gènes, les discordances étaient suffisamment courantes et suffisamment réparties pour changer tout k-mers indexés par Mash Screen, qui dans ce cas étaient longs de 9 acides aminés

L'esquisse de séquence confère son plus grand avantage lorsque les séquences de référence sont longues. Ainsi, dans le cas de protéines individuelles, Mash Screen n'est que légèrement plus efficace qu'un outil basé sur la cartographie tel que DIAMOND (41 contre 121 heures CPU dans l'expérience ci-dessus), car les esquisses résultantes sont presque aussi grandes que les protéines d'origine. Au lieu de cela, Mash Screen est conçu pour mesurer le confinement de génomes et de protéomes entiers dans de nombreux métagénomes. Étant donné que le dépistage d'un croquis de protéome entier ne nécessite aucun espace ou temps d'exécution supplémentaire par rapport au dépistage d'une seule protéine, Mash s'adapte extrêmement bien dans ce cas, alors que l'utilisation d'un outil basé sur la cartographie serait infaisable. Les sections ci-dessous illustrent comment cette évolutivité peut être utilisée pour traiter l'intégralité de l'archive de lecture de séquence NCBI afin de faire de nouvelles découvertes génomiques.

Criblage de tous les métagénomes dans l'archive de lecture de séquence

Mash Screen a été conçu pour traiter l'énorme collection de données métagénomiques disponibles dans les archives de séquences publiques, et s'adapte linéairement à la taille de l'entrée, ce qui ne nécessite que légèrement plus de temps que ce qui serait nécessaire pour simplement lire un fichier FASTQ. Nous avons tiré parti de cette efficacité pour traiter l'intégralité du catalogue métagénomique de l'archive de lecture de séquence NCBI et calculer un score de confinement pour chaque génome et plasmide dans NCBI RefSeq par rapport à chaque métagénome dans le SRA. Au moment de cette analyse, il y avait 144 909 séquences de séquençage métagénomique (totalisant environ 4 Po de fichiers) et 103 346 génomes et plasmides RefSeq (totalisant 1,14 To) dans le NCBI. Notez que lors de l'analyse, un petit nombre d'exécutions (entre 1 et 2 %) n'a pas pu être consulté en raison d'une suppression de la base de données, de restrictions d'accès ou d'échecs répétés de requêtes serveur (les listes des exécutions interrogées sont fournies avec les données en ligne). Le tableau résultant, bien que clairsemé, représente un total d'env. 15 milliards d'estimations de confinement. L'autonomie totale était d'env. 500 000 heures CPU (environ 1 000 000 pour six images traduites), qu'il est possible de recalculer pour chaque version majeure de RefSeq avec parallélisation. En comparaison, l'ajout d'exécutions SRA supplémentaires à la table complète est trivial et ne nécessite que 8 minutes de processeur pour 1 Gbp de séquence (16 minutes de processeur pour six images) et utilise 10 à 15 Go de mémoire.

Ici, nous mettons à disposition les résultats de l'écran de confinement RefSeq-SRA, composé de toutes les données disponibles à partir d'août 2018. Pour limiter la taille de ces tableaux, nous fournissons les résultats filtrés de deux manières : une table contient des correspondances au-dessus d'un confinement de 0,95 seuil, tandis qu'un autre assouplit ce seuil à 0,80 mais nécessite 3 × médiane k-mer multiplicité (c'est-à-dire au moins la moitié de la k-mers dans une esquisse RefSeq donnée doit être observé 3 fois ou plus dans l'exécution SRA, cette valeur est sortie par Mash Screen). Le premier est utile pour trouver des séquences contenant une cible spécifique, tandis que le second est utile pour découvrir de nouvelles séquences, comme démontré dans la section suivante. Les criblages ont été effectués en utilisant à la fois des criblages de nucléotides non traduits et de protéines traduites, ce qui a donné un total de quatre tableaux, disponibles dans les données en ligne.

Distribution mondiale des espèces de polyomavirus humains dans la SRA

Les polyomavirus sont éliminés de manière chronique des surfaces épithéliales et sont connus pour être des constituants courants des échantillons cliniques et environnementaux. Bien que des études séro-épidémiologiques récentes aient confirmé que la plupart des humains sont immunologiquement exposés aux polyomavirus humains HPyV 1 à 11, la séroréactivité contre HPyV12, le polyomavirus du New Jersey (NJPyV) et le polyomavirus Lyon-IARC (LIPyV) est étonnamment rare [22, 23]. On pense que les polyomavirus co-spécialisent généralement avec leurs hôtes et, par conséquent, la phylogénie des polyomavirus tend à récapituler les relations phylogénétiques des animaux hôtes [24]. L'application de ce principe a conduit à la récente suggestion que HPyV12 peut avoir été un contaminant de laboratoire qui provient finalement de spécimens de musaraigne [25]. De même, LIPyV a été initialement détecté par PCR dans la salive humaine, mais présente une faible séroréactivité dans la population générale [22], suggérant une source externe pour la détection d'origine (par exemple, les animaux domestiques).

Nous avons sélectionné toutes les analyses du métagénome SRA avec un score de confinement du protéome ≥ 0,8, une médiane k-mer multiplicité ≥3 (comme pour le tableau dans « Screening all metagenomes in the Sequence Read Archive »), et a p valeur ≤1x10-100 pour au moins un polyomavirus associé à l'homme. La figure 5 montre les scores de confinement pour les 456 (sur un total d'environ 143 000) pistes répondant à ces critères. Les résultats montrent que la plupart des polyomavirus à tropisme humain connus étaient contenus dans plusieurs métagénomes. En revanche, HPyV12, NJPyV et LIPyV n'ont été détectés dans aucun métagénome. Le résultat ajoute un support complémentaire pour les preuves sérologiques et phylogénétiques que l'infection humaine par HPyV12, NJPyV et LIPyV est rare ou inexistante.

Metagénomique SRA fonctionne avec des coups aux polyomavirus humains. Le regroupement hiérarchique a été appliqué aux deux axes et, si possible, les descriptions des organisme Les champs de métadonnées ont été utilisés pour étiqueter diverses catégories, représentées dans les bandes colorées sur la gauche. La grande majorité des échantillons épithéliaux PyV-positifs (cyan) sont des métagénomes cutanés issus d'une étude sur l'eczéma (BioProject PRJNA46333). La flèche bleue indique l'échantillon fécal dans lequel QPyV a été initialement détecté (SRR2565980). À titre d'exemple d'échantillon environnemental avec de forts impacts sur plusieurs polyomavirus humains, la flèche verte indique un métagénome monétaire (SRR5256705)

NJPyV a été initialement détecté chez une femme immunodéprimée qui a été exposée aux eaux de crue à la suite de l'ouragan Sandy [26]. Le virus a été détecté par hybridation in situ dans des lésions myosites et cutanées, démontrant de manière concluante une infection productive du patient. Contrairement à HPyV12 et LIPyV, NJPyV montre une similarité nucléotidique proche (70-80%) avec les polyomavirus trouvés chez les primates de l'ancien monde. Une explication possible de ces observations est que le NJPyV est un véritable virus à tropisme humain mais que sa prévalence est extrêmement faible.

Pour rechercher des exemples supplémentaires de la catégorie hypothétique NJPyV, nous avons recherché des séquences SRA contenant de bons résultats (mais pas parfaits) sur des espèces de polyomavirus connues (Fig. 5). Une série identifiée était une analyse métagénomique d'échantillons fécaux humains provenant d'un patient hospitalisé âgé de 85 ans à Montréal, Canada (SRR2565980). Les principaux hits de polyomavirus pour cette série étaient HPyV6 et HPyV7, avec k-mer multiplicités de 2 et 3, et scores de confinement du protéome de 0,88 et 0,82, respectivement. L'absence d'un score de confinement ≥ 0,90 pour tout polyomavirus connu a été interprétée comme la preuve d'un virus potentiellement nouveau. Toutes les lectures de ce métagénome ont été assemblées avec des métaSPAdes, révélant un polyomavirus presque complet lié à HPyV6 et HPyV7, qui a été terminé manuellement pour récupérer le génome complet. Ce nouveau virus, pour lequel nous suggérons le nom de polyomavirus du Québec (QPyV, GenBank BK010702), est identique à 80 % à HPyV7 et à 67 % identique à HPyV6 au niveau nucléotidique. Comme preuve supplémentaire du nouveau virus, une autre exécution (SRR2565981), représentant un point de temps supplémentaire pour le même patient, avait également des scores de confinement de Mash dépassant le seuil (0,82 et 0,84, avec une médiane k-mer multiplicité 3 et 6, respectivement, pour HPyV6 et HPyV7). L'enquête sur un troisième point dans le temps du même patient (SRR2565982) a également révélé 4 lectures mappées vers le nouvel assemblage QPyV, qui était inférieur au seuil de détection de Mash. Bien que le degré élevé de similitude de QPyV avec HPyV6 et HPyV7 suggère fortement qu'il s'agit d'un polyomavirus à tropisme primate, QPyV n'a été détecté que dans des échantillons fécaux d'une seule étude de patients hospitalisés. Il reste difficile de savoir si QPyV (ou NJPyV) doit être considéré comme un polyomavirus véritablement tropique pour l'homme.


Résultats

Criblage direct de génomes recombinants dans une lignée hétéroplasmique

Nous avons utilisé l'analyse Southern pour tester la recombinaison entre les génomes distingués par des différences dans les sites de restriction. Une lignée hétéroplasmique pour m:ND2 del1 , qui manque du site BglII, et mt:CoI T300I , qui n'a pas le site XhoI, porte les deux génomes de manière stable à 29°C (Figure 1B) (Ma et al., 2014). Chacun des génomes de cette lignée hétéroplasmique présente un défaut complété par l'autre de sorte que la lignée est saine mais aucun des génomes n'est perdu, une sélection équilibrante (Ma et al., 2014). La recombinaison devrait produire des génomes de type sauvage distingués par la présence des deux sites de restriction et la production conséquente d'un fragment d'environ 1,6 kb lors de la coupure avec à la fois BglII et Xhol. Même après le maintien de cette lignée pendant plus de 60 générations, cette bande de 1,6 kb n'a pas été détectée (figure 1B). La reconstruction montre que ce test Southern peut détecter des molécules recombinantes au niveau de 1 sur 1000 (figure 1B). Ainsi, à l'instar des expériences menées par d'autres (Hagström et al., 2013), cet essai physique n'a pas réussi à détecter la recombinaison. Nous concluons que la recombinaison dans cette situation n'est pas fréquente (Sato et al., 2005).

La sélection révèle une recombinaison entre les génomes mitochondriaux

Nous avons ensuite développé des méthodes pour sélectionner génétiquement des génomes mitochondriaux recombinants dans l'espoir que de telles approches permettraient à la fois de détecter son apparition et de permettre l'isolement du produit de recombinaison. Pour donner un avantage aux génomes recombinants, nous avons produit une lignée hétéroplasmique dans laquelle un génome était compromis par une mutation sensible à la température et l'autre était compromis dans sa capacité à entrer en compétition pour la transmission. Un génome thermosensible avec deux mutations, m:ND2 del1 + mt:CoI T300I , a été introduit dans une souche avec un génome nommé ATP6[1] (Celotto et al., 2006, 2011). Haute température, 29°C, sélectionnée contre le mt:CoI T300I allèle, et dans les lignées hétéroplasmiques précédemment analysées où le génome partenaire était un génome de type sauvage étroitement apparenté, cette sélection a entraîné un déclin multigénérationnel du génome sensible à la température et son élimination éventuelle (Ma et al., 2014). À notre grande surprise, en concurrence avec le ATP6[1] génome, qui se distingue par de nombreux polymorphismes de séquence et une région riche en AT plus courte, le génome sensible à la température a déplacé le ATP6[1] génome sur quelques générations à 29°C, même si les mouches sont homoplasmiques pour ATP6[1] sont relativement sains et apparemment plus robustes que m:ND2 del1 + mt:CoI T300I vole aux deux températures. Le déclin de ATP6[1] quitte le génome thermosensible sans complémenter mt:CoI activité, et la population entière meurt après plusieurs générations (figure 2A).

La sélection a révélé une recombinaison homologue dans une lignée hétéroplasmique contenant le ATP6[1] génome et le double mutant sensible à la température : m:ND2 del1 + mt:CoIT 300I .

(UNE) L'abondance ATP6[1] le génome a diminué lorsque co-résident avec m:ND2 del1 + mt:CoI T300I à 29°C. Après plusieurs générations, les mouches à 29°C ont commencé à mourir. (B) Une combinaison d'un polymorphisme de longueur de fragment de restriction et d'une différence de site de restriction révèle l'émergence d'un génome recombinant. L'ADNmt isolé de 40 adultes de chaque génération a été coupé avec EcoRI en présence ou en l'absence de Xhol. Les schémas montrent la distribution des sites EcoRI et Xhol sur l'ensemble des génomes parentaux (à gauche) et un détail du plus grand fragment EcoRI avec la position (barre violette) d'une sonde d'hybridation (centre). L'analyse Southern montre des échantillons de coupe simple et double prélevés à différentes générations au cours de la sélection. Seules les deux bandes parentales ont été détectées précocement, de G0 à G5 (montré pour G3). A partir de G6, un troisième fragment EcoRI est apparu qui avait une longueur caractéristique de la m:ND2 del1 + mt:CoI T300I génome mais avec un site Xhol. Par le G7, le ATP6[1] fragment spécifique n'a pas été détecté alors qu'un nouveau génome apparemment recombinant dominait la population. (C) Cartes détaillées de trois génomes séquencés par PacBio SMRT. Les lignes rouges indiquent des discordances entre ATP6[1] et m:ND2 del1 + mt:CoI T300I séquences. Les ATP6[1] le génome manque également de ∼ 1,6 kb de la région riche en AT (deux répétitions de type I et deux répétitions de type II, voir la figure 2 - supplément de la figure 1A pour plus de détails). Les flèches roses indiquent les points d'échange approximatifs avec la plage donnée définie par les polymorphismes voisins les plus proches (voir les séquences complètes déposées dans GenBank comme KT174472, KT174473 et KT174474). () Progression proposée menant au recombinant. L'original ATP6[1] le génome est toujours déplacé, mais le recombinant nouvellement émergé entre en compétition efficacement et persiste. À la génération 6, l'abondance du génome recombinant est suffisante pour compléter le génome sensible à la température afin que certaines mouches viables maintiennent la lignée. Au cours des générations suivantes à 29°C, le génome recombinant augmente en abondance relative en raison de la sélection contre le génome sensible à la température.

Pour sélectionner d'éventuels génomes recombinants, nous avons suivi cinq lignées établies indépendamment avec une forte proportion de départ de ATP6[1] génomes (50-90%) à 29°C. Initially, all the lines were healthy and grew productively, but with decline in ATP6[1] abundance, the health of the lines held at 29°C declined abruptly after five or six generations and died out within the next few generations. One line went through a similar crisis with diminished survival, recovered and continued to produce viable progeny in subsequent generations. Southern analysis showed emergence of a new genotype, which was cut by XhoI (like the ATP6[1] genome), but had a long AT-rich region (like the double mutant) (Figure 2B). To map recombination sites, we sequenced the parental and recombinant genomes using the PacBio single molecule real-time sequencing technique (SMRT), whose long reads gave us unambiguous sequence that included the repeats of the 5 kb highly AT-rich noncoding region (Figure 1A and Figure 2). Complete sequences of these genomes revealed that the two parental genomes differed by more than 100 SNPs plus >20 indels, and the ATP6[1] genome lacked ∼1.6 kb of the AT-rich region that was present in the mt:ND2 del1 + mt:CoI T300I genome (Figure 2C and Figure 2—figure supplement 1A). The recombinant genome was the result of an exchange of a large continuous segment to produce an ∼60%/40% chimera of the ATP6[1] et mt:ND2 del1 + mt:CoI T300I genomes that lacks the mt:ND2 et mt:CoI mutations but contains the non-coding region of the mt:ND2 del1 + mt:CoI T300I genome (Figure 2C).

Southern analysis also showed the abundance of the recombinant genome at later stages of the selection. After generation 6, the original ATP6[1] genome was no longer detected (Figure 2B), and a new heteroplasmic line was formed with the other parental genome mt:ND2 del1 + mt:CoI T300I and the recombinant genome. This line was viable at 29°C as the temperature-sensitive defect of the double mutant is complemented by the ATP6[1] mt:CoI of the recombinant genome (Figure 2D). Over subsequent generations, a multigenerational selection for function caused an increase in the proportion of the recombinant genome (Figure 2B), showing that it had lost the transmission disadvantage of the parental ATP6[1] génome. This led us to conclude that the ability to compete for transmission is localized to the sequences of the recombinant that came from the temperature-sensitive genome. This includes the entire AT-rich regulatory region and some flanking sequences distinguished by three SNPs (Figure 2C).

We later isolated two other recombinant genomes by following another 46 heteroplasmic lines as above. Both recombinants had a size (∼19.5 kb) similar to the temperature-sensitive genome, implying that mt:ND2 del1 + mt:CoI T300I was the source of the regulatory region. By sequencing the coding region, we show that one recombinant has the entire coding sequence of the ATP6[1] genome, whereas the other contains a much smaller segment of ATP6[1] extending at least from mt671 to mt5978, with the rest of the coding region belonging to the mt:ND2 del1 + mt:CoI T300I genome (Figure 2—figure supplement 1B). We conclude that our selection has isolated recombinant genomes including extensive stretches of sequence originating from the parental genomes and exhibiting functional traits of these parental genomes.

Homologous exchange upon introduction of reciprocal DSBs

Normal meiotic recombination is induced by DSBs and studies in many contexts have suggested that DSBs, whether experimentally produced or secondary to DNA damage, greatly stimulates recombination. Indeed, DSBs are thought to be the key initiators of homologous exchange. To test the importance of DSBs for mtDNA recombination, we set up a condition to select for recombination in conjunction with restriction cutting of the mtDNA.

We had produced genomes that lacked the XhoI site, mt:CoI R301Q , or the BglII site, mt:ND2 del1 . While each genome is resistant to one enzyme, expression of mito-BglII and mito-XhoI simultaneously in the germline should cut either of these genomes. Indeed, germline expression of both enzymes in flies that were homoplasmic for either mt:ND2 del1 ou mt:CoI R301Q led to sterility in females (Figure 3A). As previously shown, resistance ought to emerge at a low frequency due to mutations at the second restriction site (Xu et al., 2008). Indeed, upon selection ∼1% of the females were weakly fertile, giving a few escaper F1 progeny harboring a variety of mutant alleles that inactivate the remaining restriction site. In contrast, even though the combination of enzymes was able to select against both genotypes, when flies were heteroplasmic for the two genomes (in a 50:50 ratio), fertile females were very frequent (>90%), and most (60%) were as fecund as wild type. PCR, DNA sequencing, and phenotypic analysis showed that these progeny carried a single genome with the restriction-resistant alleles found in the two parents (Figure 3A).

Introducing DSBs into both parental genomes vastly induces homologous recombination in two heteroplasmic lines.

(UNE) Expression of both mito-BglII and mito-XhoI enzymes in the germline effectively sterilizes most females carrying either mt:ND2 del1 ou mt:CoI R301Q genome, resistant to only one of the enzymes, but resistant progeny appear at a much higher frequency if the female carries both types of sensitive genomes. The resistant progeny from the heteroplasmic parent are homoplasmic for a newly generated recombinant genotype carrying both parental alleles: mt:ND2 del1 + mt:CoI R301Q . (B) The same level of rescue was observed when a different heteroplasmic line was used, which had a different starting ratio of two parental genomes. Results are means ±SD (n = 4 × 100 for each heteroplasmic line).

A second heteroplasmic line where the mt:CoI R301Q allele was replaced with the mt:CoI T300I allele gave a similar frequency of recombinant progeny, even though the starting ratio for the two parental genomes was not equal (Figure 3B). The resulting recombinant lines exhibited the phenotypes expected for the input alleles. Par exemple, mt:ND2 del1 + mt:CoI R301Q flies were male sterile, and mt:ND2 del1 + mt:CoI T300I flies were temperature lethal.

The success of a second and very different selection confirms that homologous exchange between mitochondrial genomes can occur. Most females exposed to the restriction enzyme selection were fertile, while in the selection without DSBs (above, Figure 2), the recombinant emerged from a population over several generations of selection. The difference suggests that the frequency of recombination upon expression of the two restriction enzymes is much higher. We propose that DSBs produced by restriction enzyme cutting induces exchange as well as selecting for the products that are resistant to cutting.

To test whether recombination could also occur in somatic tissues, we examined the consequence of expressing both restriction enzymes in the developing eye under the control of ey:GAL4 driver. The high level of expression that occurs at 29°C results in pupal lethality (headless phenotype) in 99% flies that are homoplasmic for mitochondrial genomes mutant at only one site and the few survivors are eyeless or have a small eye phenotype. Similar expression in flies heteroplasmic for the two mutant genomes gave survivors at 10% with most survivors showing well-developed eyes (Supplementary file 1), suggesting that recombination of mtDNA also occurred in somatic tissues exposed to the double restriction enzyme selection. Somatically, active recombination could impact the stability of the mitochondrial genome in the soma, a factor thought to be important in aging (Cortopassi et al., 1992 Liu et al., 1998 Cao et al., 2001 Bender et al., 2006).

Recombination upon introduction of a single DSB

Given the high frequency of recovered recombinants when both genomes of a heteroplasmic strain were cut, we asked whether we could detect recombination if DSBs were introduced into only one genome. To do this, we made a heteroplasmic line containing the wild-type genome and the temperature-sensitive double-mutant mt:ND2 del1 + mt:CoI T300I , and used expression of restriction enzyme to select against wild-type genome and used the temperature-dependent selection against the double mutant. When we expressed mito-BglII in the germline while keeping the flies at 29°C, about 14.6% of the F1 females were viable and fertile (Figure 4A). PCR analysis and restriction digestion showed that the progeny had lost the wild-type allele of mt:ND2, which was targeted by the restriction enzyme, but they were heteroplasmic for a new mt:ND2 del1 genome and the double-mutant parental mt:ND2 del1 + mt:CoI T300I genome (Figure 4A). Apparently, the wild-type mtDNA was cut and homologous repair or exchange using the mutant mt:ND2 del1 sequence led to loss of the site. Initially, the abundance of the newly generated mt:ND2 del1 genome was very low in all the progeny (Figure 4B), probably because only a small fraction of the wild-type genomes underwent homologous exchange. However, because a low level of the recombinant genome is sufficient to rescue the temperature-sensitive phenotype of mt:ND2 del1 + mt:CoI T300I , this low level of recombinant genome supported production of fertile heteroplasmic flies. Since the more functional mt:ND2 del1 genome has a selective advantage at 29°C, its abundance increased over subsequent generations (Figure 4B), and in some lineages, the mt:ND2 del1 + mt:CoI T300I genome was completely eliminated after 18 generations (Ma et al., 2014).

Homology-dependent conversion of the wild-type BglII site into the sequence of the mt:ND2 del1 allele following cutting of the BglII site.

(UNE) Expression of mito-BglII in the germline of flies heteroplasmic for wild-type and mt:ND2 del1 + mt:CoI T300I genomes at 29°C led to isolation of progeny with repaired wild-type genome at the BglII site and converted it to mt:ND2 del1 . (B) The starting abundance for the newly generated mt:ND2 del1 was low, but it increased over generations as the genome possessed a selective advantage at 29°C. The abundance of mt:ND2 del1 was measured by PCR amplifying a mtDNA region (mt1826–mt2496) using mtDNA from 40 adults as template followed by restriction digestion using XhoI in four heteroplasmic lineages from generation 1 to 3.

Again, we isolated recombinant genomes at a relatively high frequency, which leads us to propose that a single DSB is sufficient to promote recombination (see ‘Discussion’). However, we note that without additional markers, we could do little to characterize the nature of the exchange events.

Exchange between the mitochondrial genomes of two different species

In order to study whether DSB-induced exchanges involve restricted local repair events, or exchange of longer stretches of DNA, we needed more markers. To achieve this, we examined recombination between the diverged mitochondrial genomes of Drosophila melanogaster et Drosophile yakuba. We made a heteroplasmic D. melanogaster line in which the D. yakuba mtDNA is sensitive to BglII and the D. melanogaster genome is sensitive to XhoI (see ‘Materials and methods’) (Figure 5A). Within the coding sequences, the D. yakuba genome shared about 93% sequence identity with mt:ND2 del1 , while the non-coding AT-rich sequence was highly diverged and reduced to about 1 kb in length. We introduced DSBs into both genomes by germline expression of mito-BglII and mito-XhoI and found that about 10% of the females were fertile. Progeny homoplasmic for recombinant genomes were recovered. All propagating recombinants contained the AT-rich region of the D. melanogaster genome (assessed by Southern analysis, Figure 5—figure supplement 1), which we expected because D. melanogaster genomes outcompete D. yakuba genomes very quickly when co-resident (H Ma and PH O'Farrell, unpublished). We characterized the mitochondrial genomes of three progeny lines by PCR and standard sequencing. All the recombinant genomes had one crossover point very close to but upstream of the XhoI site of the mt:ND2 del1 genome (Figure 5B). A second crossover is considerably downstream: in two of the recombinants, the other crossover occurred between markers at mt3124 and 3184, and between markers at mt3379 and 3445. In the third case, the other crossover is further downstream and we obtained mixed sequencing signals for a region between mt5524 and mt6291 (Figure 5C). Flies were likely to be heteroplasmic for that particular region as if multiple recombinants are carried in this line. Based on these recombinants, we concluded that homology-based repair of DSBs promoted exchange of a substantial uninterrupted stretch of sequence. We also note that there were no discontinuities in the mapped region of exchange as might occur if repair randomly converted mismatches in heteroduplex in one direction or the other (see below for more discussion).

Exchange between two mitochondrial genomes of different species that share 93% sequence homology.

(UNE) A heteroplasmic line containing both a Drosophile yakuba (mt:ND1 R274W ) genome and a Drosophila melanogaster (mt:ND2 del1 ) genome was made. 90% of heteroplasmic females induced to express both mito-BglII and mito-XhoI enzymes in the germline were sterile, but the escaper progeny from the fertile females contained newly generated recombinant genotypes. (B) Sequences of the parental and three recombinant genomes reveal that one recombination junction is close to the XhoI site of the D. melanogaster génome. The XhoI site (yellow highlight) present in the D. melanogaster parent sequence (top line) is absent in all the other sequences. Pink rectangles indicate the interval in which recombination occurred. (C) A schematic illustration of where the second crossover was for the recombinant genomes. Arrows indicate the approximate position and the numbers, which are based on the D. melanogaster sequence, given the positions of bounding polymorphisms.


Les références

Ochman H, Lawrence JG, Groisman EA: Lateral gene transfer and the nature of bacterial innovation. La nature. 2000, 405: 299-304. 10.1038/35012500.

Keeling PJ, Palmer JD: Horizontal gene transfer in eukaryotic evolution. Nat Rev Genet. 2008, 9: 605-618. 10.1038/nrg2386.

Richardson AO, Palmer JD: Horizontal gene transfer in plants. J Exp Bot. 2007, 58: 1-9. 10.1093/jxb/erl148.

Mower JP, Stefanovic S, Hao W, Gummow JS, Jain K, Ahmed D, Palmer JD: Horizontal acquisition of multiple mitochondrial genes from a parasitic plant followed by gene conversion with host mitochondrial genes. BMC Biol. 2010, 8: 150-10.1186/1741-7007-8-150.

Hao W, Richardson AO, Zheng Y, Palmer JD: Gorgeous mosaic of mitochondrial genes created by horizontal transfer and gene conversion. Proc Natl Acad Sci U S A. 2010

Rice DW, Palmer JD: An exceptional horizontal gene transfer in plastids: gene replacement by a distant bacterial paralog and evidence that haptophyte and cryptophyte plastids are sisters. BMC Biol. 2006, 4: 31-10.1186/1741-7007-4-31.

Richards TA, Soanes DM, Foster PG, Leonard G, Thornton CR, Talbot NJ: Phylogenomic analysis demonstrates a pattern of rare and ancient horizontal gene transfer between plants and fungi. Cellule de plante. 2009, 21: 1897-1911. 10.1105/tpc.109.065805.

Cho Y, Qiu YL, Kuhlman P, Palmer JD: Explosive invasion of plant mitochondria by a group I intron. Proc Natl Acad Sci USA. 1998, 95: 14244-14249. 10.1073/pnas.95.24.14244.

Bergthorsson U, Adams KL, Thomason B, Palmer JD: Widespread horizontal transfer of mitochondrial genes in flowering plants. La nature. 2003, 424: 197-201. 10.1038/nature01743.

Bergthorsson U, Richardson AO, Young GJ, Goertzen LR, Palmer JD: Massive horizontal transfer of mitochondrial genes from diverse land plant donors to the basal angiosperm Amborella. Proc Natl Acad Sci USA. 2004, 101: 17747-17752. 10.1073/pnas.0408336102.

Wolfe KH, Li WH, Sharp PM: Rates of nucleotide substitution vary greatly among plant mitochondrial, chloroplast, and nuclear DNAs. Proc Natl Acad Sci USA. 1987, 84: 9054-9058. 10.1073/pnas.84.24.9054.


Informations sur l'auteur

Affiliations

Harvard Stem Cell Institute and the Department of Stem Cell and Regenerative Biology, The Stowers Medical Institute, Harvard University, Cambridge, Massachusetts, USA

Dieter Egli, Garrett Birkhoff & Kevin Eggan

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Auteur correspondant


Résultats

In Allograft Recipients, Microchimerism is Found in All Categories of Skin Specimens. To detect the presence of male cells in allograft recipient skin tumors, DNA was recovered from the tumor tissue sections and subjected to Y sequence-specific PCR amplification. Amplification curves of the samples were compared with those of serial dilutions of male into female cells enabling absolute quantification of the male copy number. Numerous negative controls [without DNA and prepubertal female skin samples (nevi)] were included in all experiments to show the absence of PCR contamination. The Y detection sensitivity was one to two copies. Because the number of amplifiable genomes was 500 to 3,000 cells as judged by amplifying a one-copy autosomal gene (data not shown), the microchimerism sensitivity detection limit was between 0.2% and 0.03%. In addition, analysis of female peripheral blood lymphocytes as well as of eight prepubertal females skin samples (nevi) and eight BCC from nongrafted females showed the absence of any Y signal, confirming the specificity of quantitative PCR which has been previously validated by others (19).

The complete results are shown in Fig. 2 . Amplifiable DNA was present in 40/48 specimens. Male cells were detected in 5/15 squamous cell carcinoma/Bowen specimens, 3/5 BCC, 6/11 actinic keratosis, 2/4 keratoacanthoma, and 2/5 benign lesions. In the positive samples, the ranges of male copy numbers were 4 to 180 in squamous cell carcinomas, 91 to 645 in BCC, 7 to 102 in actinic keratosis, 22 to 41 in keratoacanthoma, and 14 to 55 in benign lesions. In the eight nongrafted females with BCC or nevi, male cells were never detected ( Fig. 2), confirming the specificity of the procedure.

Quantitative evaluation of SRY sequences in microdissected specimens of cutaneous tumors obtained from females grafted with male kidneys. BCC, basal cell carcinomas SCC/Bowen, squamous cell carcinoma and Bowen's disease (which is an in situ carcinoma) AK, actinic keratosis KA, keratoacanthoma Benign, benign lesions such as warts, molluscum, and nevi. Controls were obtained from prepubertal specimens of female nevi.

There was no statistically significant differences in the number of male cells as well as the number of Y-positive samples between the groups (Kruskal-Wallis test).

The mean inflammatory infiltrate densities were 2.3 in the patients with squamous cell carcinoma/Bowen (range, 1-3), 2.4 in those with BCC (1.5-3), 2.35 in the actinic keratosis group (1–3) , 2.33 in keratoacanthoma (2-2.5), and 1 within benign lesions. As expected, the degree of inflammation was significantly lower in the benign lesions (Kruskal-Wallis test P < 0.03) but was not different between all the other groups of malignant or premalignant lesions.

A Specimen of Cutaneous Basal Cell Carcinoma Seems to be Derived From Donor Cells. One specimen (gr9) revealed a very high level of Y sequences by PCR (645 Y sequence see Fig. 2), suggesting that this peculiar dorsal BCC could have been derived from male keratinocytes. In order to confirm this hypothesis, FISH for Y and X chromosome was done. In gr9 ( Fig. 3UNE et B ), many XY cells were seen in tumoral buds, the average percentage of male cells in nine fields (taking into account both the tumor buds and the overlying epidermis) was 40 ± 10% (mean ± SE). Of note, normal overlying epidermis only displayed XX cells ( Fig. 3UNE). The count of tumoral buds alone showed that there was sometimes up to 105% of cells displaying XY genotype. In control male skin ( Fig. 3C), the percentage of male cells was 103 ± 5%. In two other allografted female samples in which PCR had not found Y sequences, FISH was also negative for Y chromosome (an example is shown in Fig. 3). To more precisely show that the tumor epithelial cells were derived from male cells, immuno-FISH with anticytokeratin antibody was carried out. Several cytokeratin-positive cells within dermal nests seemed to be XY, showing that malignant keratinocytes of this BCC gr9 were male ( Fig. 4UNE et B , to compare with histology, ). In a classic sample of male BCC, a very similar picture was found ( Fig. 4C) not all the cells displayed Y chromosome. Substitution of anticytokeratin antibody by IgG showed the absence of any staining, demonstrating the specificity of the immune reaction (data not shown). Interestingly, some nonepithelial XY cells were seen between buds in gr9, probably corresponding to inflammatory infiltrating cells ( Fig 4B, yellow arrow). Of note, the female bearing the gr9 BCC had nine different skin samples analyzed initially by PCR. Besides gr9, two other specimens (gr42 and gr55) displayed male sequences by PCR. One of these, an actinic keratosis (gr55) with 47 sequences of Y DNA, showed the presence of some cytokeratin-positive XY cells ( Fig. 4F). In contrast, six other specimens (two actinic keratosis, two squamous cell carcinomas, one keratoacanthoma, and one BCC) from this woman were negative by PCR. Two of these were nevertheless analyzed in situ and FISH was also negative, demonstrating the correspondence between the two techniques. Therefore, the presence of male cells is restricted to some sites in this female recipient.

X and Y FISH analysis of gr9 and controls. Red spots, Y chromosomes green spots, X chromosome. UNE et B, the gr9 BCC with normal XX overlying epidermis (UNE) and several XY cells (flèches blanches) in tumoral nests in two different fields (UNE et B). C, male specimen with several XY cells in epidermis and dermis. RÉ, FISH result of a cutaneous specimen of a female grafted with a male kidney but which did not show the presence of Y sequence by PCR. There was also no male cell by PCR in this specimen.

Immuno-FISH using X,Y cocktail and anticytokeratin AE1/AE3 antibody. UNE et B, gr9 showing cytokeratin-positive buds, several XY cells being present in these cytokeratin buds (flèches blanches). Yellow arrow, a nonepithelial, cytokeratin-negative, male cell. C, result of a male nongrafted BCC showing results similar to gr9. RÉ, the H&E-stained section of gr9 with typical dermal nests of BCC under the epidermis. E, specimen of a female patient allografted with a male kidney and with Y sequence positive by PCR. XY cells do not appear to be surrounded by cytokeratin blue staining, indicating that these male cells were not epithelial (yellow arrow). F, actinic keratosis developing in the same female as gr9 but at another skin site. Presence of a few XY cells surrounded by cytokeratin within proliferating epidermis shows male keratinocytes in this dysplastic lesion (flèches blanches).

The analysis by immuno-FISH of six other lesions (gr27, gr28, gr65, gr68, and gr110) obtained from other female patients, which showed the presence of male cells by PCR revealed the presence of noncytokeratin-positive XY cells (an example is shown in Fig. 4E, yellow arrows). Combination of FISH and CD45-common leukocyte antigen-staining was done and also showed the presence of CD45+ microchimeric cells ( Fig. 5 ).

Immuno-FISH using X,Y cocktail and anti-CD45 antibody on a skin tumor. Presence of a male (donor-derived, arrow) CD45+ cell in the dermis. Attention is required here, because in this experiment, Y chromosome was labeled in vert and X chromosome in rouge. CD45 staining appears as a brownish-red ring shape around the cell. Nuclei were counterstained with 4′,6-diamidino-2-phenylindole (bleu).


Genomics and Proteomics in Brain Complexity in Relation to Chemically Induced PTSD

Concluding Remarks and Future Directions

It is clear that PTSD is not a monolithic disorder that can be characterized by unique and consistent mental and biological traits , as the development of this disorder results from complex interactions among numerous factors. Genetic background, as well as environmental factors, may contribute to whether one is sensitive to complex circumstances such as trauma exposure, leading to PTSD development. Recent research studies provided solid evidence that specific DNA functions can be modified by such exposure through epigenetic pathways, resulting in alterations in gene expression leading to a pathological phenotype. This chapter provided a comprehensive picture of the technological advances in genotyping, expression profiling, and proteomics, which offer exciting and promising approaches in understanding the basis of PTSD, as well as improved diagnosis and therapy. Additionally, short- and long-term exposure to toxic chemicals, such as OP nerve agents and insecticides, and other CWAs contribute toward PTSD onset. The combination of genomic and proteomic information will allow early and more accurate prediction of individuals’ susceptibility to chemical exposure–related trauma, development of PTSD, and disease progression. Although significant discoveries have been made, there is obviously substantial promise and potential remaining to be fully realized through increasing use of and further development of these technologies.


Spatial multi-omics in single cells

Barbara Treutlein. Incredibly, the first single-cell transcriptome was sequenced just over a decade ago 68 ! Since this milestone, transcriptomes of millions of cells have been sequenced and analysed from diverse organisms, tissues and other cellular biosystems, and these maps of cell states are revolutionizing the life sciences. The technologies and associated computational methods have matured and been democratized to such an extent that nearly all laboratories can apply the approach to their particular system or question.

Of course, the transcriptome is not enough, and protocols have already been developed to measure chromatin accessibility, histone modifications, protein abundances, cell lineages and other features linked to genome activity in single cells 69 . Currently, many studies use dissociation-based single-cell genomics methods, where the spatial context is disrupted to facilitate the capture of single cells for downstream processing. Methods are improving to measure genomic features in situ 70 , as well as to computationally map features to spatial contexts 71,72 . The stage is set for the next phase of single-cell genomics, where spatial registration of multimodal genome activity across molecular, cellular and tissue or ecosystem scales will enable virtual reconstructions with extraordinary resolution and predictive capacity. These virtual maps will rely on multi-omic profiling of healthy and perturbed tissues and organisms, which presents major challenges and opportunities for innovation.

Cell throughput remains a challenge, and it is unclear what role dissociation-based single-cell sequencing protocols will play in the future. These protocols are fairly easy to implement, and laboratories around the world can execute projects with tens of thousands of cells analysed per experiment. However, there are scenarios in which measuring millions of cells per experiment would be desired, such as in perturbation screens. Combinatorial barcoding methods push cell-throughput boundaries 73 however, it is unclear how to scale full transcriptome sequencing economically to millions of cells using current sequencing technologies. ‘Compressed sensing’ modalities — whereby a limited, selected and/or random number of features are measured per cell, and high-dimensional feature levels are recovered through inference or similarity to a known reference — provide an interesting possibility to increasing cell throughput 74 .

Most single-cell transcriptome protocols are currently limited to priming the polyadenylation track present on all cellular mRNAs however, this approach leads to biased sampling of highly expressed mRNAs. Clever innovations for random or targeted RNA enrichment could be a way to build up composite representations of cell states. Image-based in situ sequencing methods provide a means for increasing the number ofcells measured per experiment, as millions of cells can be imaged without a substantial increase in financial cost, although imaging time is a limiting factor. There remains a lot of room for experimental and computational optimizations to measure the transcriptome, random barcodes, DNA conformations and protein abundances from the micrometre scale to the centimetre scale spatially, and it will be interesting to see how methods for spatial registration advance over the next 5 years.

Currently, most high-throughput measurements are performed on cell suspensions or on intact tissues using one modality. That said, studies are emerging that measure several features from the same cell for example, mRNA and chromatin accessibility 75 or mRNA and lineage 76 . To build virtual maps, independent measurements from different cells can be integrated with use of data integration tools 77 , although it can be difficult to align cell states across modalities in particular in developing systems. Therefore, the ultimate goal is to directly measure as many features as possible (for example, RNA, lineage, chromatin, proteins and DNA methylation) in the same cell 78 , ideally with spatial resolution. Furthermore, combining genetic and pharmacological perturbation screens with single-cell multi-omic measures will be informative to understand cell state landscapes and underlying regulatory networks for each cell type. The CRISPR–Cas field continues to develop creative tools for precise single-locus editing and other manipulations 79 , and incorporation of these toolkits with single-cell sequencing readouts will certainly bring new mechanistic insight.

Life forms are inherently dynamic, and each cell has a story to tell. Static measurements do not provide sufficient insight into the mechanisms that give rise to each cell state observed in a tissue. Computational approaches to stitch together independent measurements across time can be used to reconstruct potential histories however, these are indirect inferences. Long-term live imaging in 2D cultures using confocal microscopy and in 3D tissues using light-sheet microscopy provides morphology, behaviour, location and, in some cases, molecular information on the history of a cell. Indeed, such long-term imaging experiments revealed that cell fates or states can be predicted from cell behaviour across many generations 80 . Cell tracking combined with end point single-cell genomics experiments can help to understand how cell states came to be however, these experiments lack molecular resolution of the intermediates. There are strategies using CRISPR–Cas systems to capture highly prevalent RNAs inside cells at given times and insert these RNAs into DNA for storage and subsequent readout 81 . Together with live tracking and end-point single-cell genomics, such methods could provide unprecedented insight into cell histories.

My vision is that the emerging technologies described above can be applied to human 2D cell culture and 3D organoid biosystems to understand human development and disease mechanisms. My team and others are working to build virtual human organs that are based on high-throughput, multimodal single-cell genomics data. Organoid counterparts provide opportunities to perturb the system and understand lineage histories. Together, the next generation of single-cell genomics methods and human organoid technologies will provide unprecedented opportunities to develop new therapies for human disease.

“the next generation of single-cell genomics methods and human organoid technologies will provide unprecedented opportunities”


Sommaire

Despite the recognition, nearly a century ago, that the human microbiome plays a clinically relevant role in drug disposition, mechanistic insights, and translational applications are still limited. Here, we highlight the recent re-emergence of “pharmacomicrobiomics,” which seeks to understand how inter-individual variations in the microbiome shape drug efficacy and side effect profiles. Multiple bacterial species, genes, and enzymes have already been implicated in the direct biotransformation of drugs, both from targeted case studies and from systematic computational and experimental analyses. Indirect mechanisms are also at play for example, microbial interactions with the host immune system can have broad effects on immunomodulatory drugs. Finally, we discuss multiple emerging strategies for the precise manipulation of complex microbial communities to improve treatment outcomes. In the coming years, we anticipate a shift toward a more comprehensive view of precision medicine that encompasses our human and microbial genomes and their combined metabolic activities.


Voir la vidéo: Organisme, Système, Organe, Tissu et Cellule (Novembre 2021).