Informations

Outil pour traduire les chomosomes, les numéros d'index en informations de séquence


Existe-t-il un outil qui me permette de transformer des informations sous la forme (numéro de chromosome, index de début, index de fin) en informations de séquence ? Par exemple, quelque chose comme (6, 43770819, 43770841) devrait donner GACCCCCTCCACCCCGCCTCCGG car ce sont les bases pertinentes sur le 6ème chromosome.

Un exécutable en ligne de commande est préférable, bien qu'un service Web convienne également. Merci beaucoup d'avance.


Vous pouvez écrire un petit script pour le faire. Fondamentalement, vous n'avez qu'à imprimer une chaîne de la position-x à la position-y. Expliquer comment faire cela n'est pas vraiment d'actualité ici.

Parmi les outils disponibles, vous pouvez utiliser getfasta du draps emballer. Cela nécessite un LIT fichier, ou un GTF fichier en entrée. Le format à trois colonnes comme dans votre question fonctionnera également, mais généralement l'orientation (+/-) est également important pour récupérer la bonne séquence ; sinon toutes les séquences seraient extraites du+brin seulement.GTFle format est un peu différent : les trois colonnes de votre question seraient les première, quatrième et cinquième colonnes duGTF. La septième colonne contient l'orientation.

bedtools getfasta [OPTIONS] -fi  -lit  -fo 

(ou):

getFastaFromBed [OPTIONS] -fi  -lit  -fo 

Il y en a un autre qui s'appelle gfread qui vient avec lehaut-de-formeemballer.

gfreadprend unGTF/GFFen entrée et vous donne un fichier rapide de séquences correspondant aux positions listées dans leGTFdéposer. La troisième colonne (caractéristique) doit êtreexonoutranscriptioncar cet outil a en fait été conçu pour extraire des séquences de transcrits.

gffread -w transcripts.fa -g /chemin/vers/génome.fa transcripts.gtf


Voir la vidéo: 21-Traduire un document (Décembre 2021).