资源描述
实验一 核酸序列的检索
GenBank格式
LOCUS (代码):是该序列条目的标记,或者说标识符,蕴涵这个序列的功能。该字段还包括其它相关内容,如序列长度、类型、种属来源以及录入日期等。说明字段是有关这一序列的简单描述。
ACCESSION (编号):具有唯一性和永久性,在文献中引用这个序列时,应该以此编号为准。
KEYWORDS (关键词):由该序列的提交者提供,包括该序列的基因产物以及其它相关信息。
SOURCE (数据来源):说明该序列是从什么生物体、什么组织得到的,次关键字ORGANISM (种属)指出该生物体的分类学地位。
REFERENCE (文献):说明该序列中的相关文献,包括AUTHORS (作者)、TITLE (题目)及JOURNAL (杂志名)等,以次关键词列出。该字段中一般还列出医学文献摘要数据库MEDLINE的代码。该代码实际上是个超文本链接,点击它可以直接调用上述文献摘要。一个序列可以有多篇文献,以不同序号表示,并给出该序列中的哪一部分与文献有关。
FEATURES (特性表):具有特定的格式,用来详细描述序列特性,包括蛋白质编码区以及翻译所得的氨基酸序列,外显子和内含子位置、转录单位、突变单位、修饰单位、重复序列等信息,以及与蛋白质数据库SwissProt和分类学数据库Taxonomy等其它数据库的交叉索引编号。特性表中带有‘-xref/’标志的字符可以连接到其它数据库。
BASE COUNT(碱基含量):给出序列中的碱组成,A、T、G、C每类的个数。
ORIGIN:是序列的引导行,引导碱基序列,以双斜杠行“//”结束。)
FASTA格式
>gi|19527219|ref|NM_133999.1| Mus musculus FIG4 homolog (S. cerevisiae) (Fig4), mRNA
GGGAATCCGGAAGCAGCCGGCGAGCCCGCTGCTGAACGTTTGGTGTTCTGACACTGTTTTTGTCAGCTGT
GTCTGGTGTGCTGGAGGTCTGCGGGGTCTCCTCGCTCTGTCTCCAGGGGGAACCCCGCCGCTGTCACGAC
CTGGGCCGCGGCCTGGTGCCCTGTGGCGGGGCCGCCATTGGCTGGAGCCATGCCCACGGCCGCTGCCCCC
ATCATCAGCTCGGTCCAGAAGCTGGTGCTGTATGAGACCAGAGCTAGATACTTTCTAGTTGGGAGCAATC
ATGCAGAAACGAAGTACCGTGTCCTGAAAATTGATAGAACAGAACCGAAGGACTTGGTGGTAATCGACGA
CAGGCACGTGTACACACAACAAGAAGTGAGGGAACTTCTTGGCCGCCTGGATCTGGGAAACAGAACAAAG
ATGAGCCAGAAAGGATCCTCCGGGTTGTTTCGAGCCGTCTCAGCTTTTGGAGTCGTAGGTTTTGTCAGGT
TCTTAGAAGGCTACTATATTGTATTAATAACTAAGCGGAGGAAGATGGCAGACATTGGAGGTCATGCAAT
TTATAAGATTGAAGATACAAGTATGATTTATATCCCCAATGACTCTGTTCGGATTTCTCACCCCGACGAA
GCTAGGTATCTAAGGATATTTCAAAATGTGGATCTATCTAGCAATTTTTACTTTAGTTACAGCTATGATT
TGTCACACTCACTTCAGTATAATCTTACCGTCCTGCGAATGCCCCTGGAGATGTTAAAGTCAGAAACATC
CAAGGCGTGCCAGGAGAGCTTCGACATCTTTGAAGATGAAGGATTAATTACACAGGGTGGCAGTGGTGTA
TTTGGGATCTCTAGTGAGCCTTATATGAAGTATGTATGGAACGGTGAACTTCTGGATATAATTAAAAACA
CTGTGCATCGTGACTGGCTATTGTATATCATTCATGGGTTCTGCGGGCAGTCCAAGCTTTTGATCTATGG
ACGACCAGTGTATGTGACCCTAATAGCCAGGAGATCCAGTAGGTTTGCTGGGACGCGCTTTCTCAAGAGA
GGCGCAAACTGTGAGGGTGACGTTGCAAATGAGGTGGAGACCGAGCAGATCCTCTGTGATGCTTCTGTGA
TGTCTTTTACCGCAGGCAGTTACTCTTCTTACGTACAAGTTAGAGGATCCGTTCCCTTATTCTGGTCCCA
AGACATCTCAACTATGATGCCGAAACCACCCATTACACTGGACCAGGCGGATCCCTTTGCACACGTGGCT
GCTCTTCACTTTGACCAGATGCTCCAGAGGTTCGGCTCCCCCATCATCATCTTGAACTTAGTGAAGGAGA
GGGAGAAGAGAAAGCACGAAAGGATCCTGAGTGAAGAGCTGGTGGCTGCGGTCACTTACCTGAACCAGTT
CCTGCCACCGGAGCACACCATTGTCTACATCCCCTGGGACATGGCCAAGTACACCAAGAGTAAGCTGTGC
AACGTTCTCGATCGGCTGAATGTGATTGCGGAAAGCGTGGTAAAGAAGACAGGATTCTTTGTAAACCGCC
CTGATTCTTACTGCAGCATTTTACGGCCAGATGAAAAGTGGAATGAACTAGGAGGTCATGTGATTCCCAC
TGGTCGGCTCCAGACTGGCATCCTTCGAACCAACTGTGTGGACTGTTTGGATCGCACCAACACTGCGCAG
TTCATGGTGGGCAAGTGTGCCCTGGCTTACCAGCTGTATTCCTTAGGGCTGATTGACAAGCCTAACCTGC
AGTTCGACACGGATGCAGTGAGGTTGTTTGAGGAACTCTATGAAGACCATGGAGACACCCTTTCCCTGCA
GTACGGAGGCTCTCAGCTGGTTCATCGGGTAAAGACCTACAGAAAGATAGCACCGTGGACCCAGCACTCC
AAGGACATCATGCAGACTCTGTCCCGGTACTACAGCAACGCCTTCTCGGATGCTGATAGACAAGATTCCA
TCAACCTGTTTTTGGGTGTTTTCCACCCCACAGAAGGGAAACCTCATCTCTGGGAACTCCCCACAGACTT
TTACCTCCATCACAAAAACACCATGAGCCTTTTACCCCCCAGAAGGAGTTATACTTACTGGTGGACGCCA
GAGGTGGTGAAGCATCTGCCGCTGCCTTACGATGAAGTTATCTGTGCTGCAAACTTAAAGAAGTTGATGG
TGAAGAAATTTCACAGATGGGAAGAAGAGATTGATATTCACAATGAGTTCTTCCGGCCGTATGAATTGAG
TAGTTTTGATGACACCTTTTGCTTGGCCATGACAAGTTCAGCACGTGATTTTATGCCTAAAACTGTTGGC
ATTGATCCAAGTCCATTTACCGTGCGAAAACCAGATGAAACTGGAAAATCTGTACTGGGGAACAAAAACA
CTAGAGAGGAAGCTGTCCTGCAGCGGAAGACGGCAGCCAGCGCCCCGCCACCCCCGAGCGAGGAGGCTGT
GTCCAGCAGCTCTGAGGATGACTCTGGCACCGACCGGGAAGATGAAGGCTCCATCTCTCAGCGATCCACT
CCTGTGAAGATGACTGACACGGGAGACAGTGCCAAAGCGACTGAGAATGTGGTCCAGCCCATGAAGGAAG
TGTATGGAGTCAGTCTCTCCAGTAGCCTGTCAGAGGAGGATCACTCCATTTATGCCAGGTTTGTTCAGCT
GGGGCAAAGTCAACATAAACAGGACCGAGGTAACCAGCAGCTGTGTTCCCGTTGCTCAGATGGAGTTATA
AAACTAACTCCCATCTCAGCTTTCTCGCAAGACAACATTTATGAAGTTCAGCCTCCAAGAGTAGACAGAA
AGTCTACAGAGATCTTCCAGGCCCATATCCAAGCTAGCCAAGGTATCATGCAGCCCCTTGGCAAAGAGGA
CACTGCCATGTACCGGGAGTACATCAGAAACCGCTACTTATAGAGACGGCCTCGAGGACAGTGTCCTCTG
TGAGAAGGCGTGCCCCAGATCCTGAGATGCAGCTCATTGGTAAAGGACTCCCCAGCACCTGTATCACAGC
CTTCGGTGATTCCAGCTACCAGGAATCCAGTGTTGTCTTCCAGATTTTGTAGGCACCTATACTCAAGTAG
GTGCCTGTGTGTGCACACACATGCACAGGAGTGCATACACACACATGTATGCACACACACAGTAAAAATA
ATAAAAGTAAAATCTTTAAAAATCAATTCATCCAAATCATGTATCTGAAACTTTTCACCTCTTTGTACCA
TGCAAATGACTAATTGCAGGTAATAAAGAAATGCTGCCTCTTTAAAAAAAAAAAAAAA
SRS查询
FASTA格式
>ENA|AAH31887|AAH31887.1 Mus musculus (house mouse) FIG4 homolog (S. cerevisiae)
ATGCCCACGGCCGCTGCCCCCATCATCAGCTCGGTCCAGAAGCTGGTGCTGTATGAGACC
AGAGCTAGATACTTTCTAGTTGGGAGCAATCATGCAGAAACGAAGTACCGTGTCCTGAAA
ATTGATAGAACAGAACCGAAGGACTTGGTGGTAATCGACGACAGGCACGTGTACACACAA
CAAGAAGTGAGGGAACTTCTTGGCCGCCTGGATCTGGGAAACAGAACAAAGATGAGCCAG
AAAGGATCCTCCGGGTTGTTTCGAGCCGTCTCAGCTTTTGGAGTCGTAGGTTTTGTCAGG
TTCTTAGAAGGCTACTATATTGTATTAATAACTAAGCGGAGGAAGATGGCAGACATTGGA
GGTCATGCAATTTATAAGATTGAAGATACAAGTATGATTTATATCCCCAATGACTCTGTT
CGGATTTCTCACCCCGACGAAGCTAGGTATCTAAGGATATTTCAAAATGTGGATCTATCT
AGCAATTTTTACTTTAGTTACAGCTATGATTTGTCACACTCACTTCAGTATAATCTTACC
GTCCTGCGAATGCCCCTGGAGATGTTAAAGTCAGAAACATCCAAGGCGTGCCAGGAGAGC
TTCGACATCTTTGAAGATGAAGGATTAATTACACAGGGTGGCAGTGGTGTATTTGGGATC
TCTAGTGAGCCTTATATGAAGTATGTATGGAACGGTGAACTTCTGGATATAATTAAAAAC
ACTGTGCATCGTGACTGGCTATTGTATATCATTCATGGGTTCTGCGGGCAGTCCAAGCTT
TTGATCTATGGACGACCAGTGTATGTGACCCTAATAGCCAGGAGATCCAGTAGGTTTGCT
GGGACGCGCTTTCTCAAGAGAGGCGCAAACTGTGAGGGTGACGTTGCAAATGAGGTGGAG
ACCGAGCAGATCCTCTGTGATGCTTCTGTGATGTCTTTTACCGCAGGCAGTTACTCTTCT
TACGTACAAGTTAGAGGATCCGTTCCCTTATTCTGGTCCCAAGACATCTCAACTATGATG
CCGAAACCACCCATTACACTGGACCAGGCGGATCCCTTTGCACACGTGGCTGCTCTTCAC
TTTGACCAGATGCTCCAGAGGTTCGGCTCCCCCATCATCATCTTGAACTTAGTGAAGGAG
AGGGAGAAGAGAAAGCACGAAAGGATCCTGAGTGAAGAGCTGGTGGCTGCGGTCACTTAC
CTGAACCAGTTCCTGCCACCGGAGCACACCATTGTCTACATCCCCTGGGACATGGCCAAG
TACACCAAGAGTAAGCTGTGCAACGTTCTCGATCGGCTGAATGTGATTGCGGAAAGCGTG
GTAAAGAAGACAGGATTCTTTGTAAACCGCCCTGATTCTTACTGCAGCATTTTACGGCCA
GATGAAAAGTGGAATGAACTAGGAGGTCATGTGATTCCCACTGGTCGGCTCCAGACTGGC
ATCCTTCGAACCAACTGTGTGGACTGTTTGGATCGCACCAACACTGCGCAGTTCATGGTG
GGCAAGTGTGCCCTGGCTTACCAGCTGTATTCCTTAGGGCTGATTGACAAGCCTAACCTG
CAGTTCGACACGGATGCAGTGAGGTTGTTTGAGGAACTCTATGAAGACCATGGAGACACC
CTTTCCCTGCAGTACGGAGGCTCTCAGCTGGTTCATCGGGTAAAGACCTACAGAAAGATA
GCACCGTGGACCCAGCACTCCAAGGACATCATGCAGACTCTGTCCCGGTACTACAGCAAC
GCCTTCTCGGATGCTGATAGACAAGATTCCATCAACCTGTTTTTGGGTGTTTTCCACCCC
ACAGAAGGGAAACCTCATCTCTGGGAACTCCCCACAGACTTTTACCTCCATCACAAAAAC
ACCATGAGCCTTTTACCCCCCAGAAGGAGTTATACTTACTGGTGGACGCCAGAGGTGGTG
AAGCATCTGCCGCTGCCTTACGATGAAGTTATCTGTGCTGCAAACTTAAAGAAGTTGATG
GTGAAGAAATTTCACAGATGGGAAGAAGAGATTGATATTCACAATGAGTTCTTCCGGCCG
TATGAATTGAGTAGTTTTGATGACACCTTTTGCTTGGCCATGACAAGTTCAGCACGTGAT
TTTATGCCTAAAACTGTTGGCATTGATCCAAGTCCATTTACCGTGCGAAAACCAGATGAA
ACTGGAAAATCTGTACTGGGGAACAAAAACACTAGAGAGGAAGCTGTCCTGCAGCGGAAG
ACGGCAGCCAGCGCCCCGCCACCCCCGAGCGAGGAGGCTGTGTCCAGCAGCTCTGAGGAT
GACTCTGGCACCGACCGGGAAGATGAAGGCTCCATCTCTCAGCGATCCACTCCTGTGAAG
ATGACTGACACGGGAGACAGTGCCAAAGCGACTGAGAATGTGGTCCAGCCCATGAAGGAA
GTGTATGGAGTCAGTCTCTCCAGTAGCCTGTCAGAGGAGGATCACTCCATTTATGCCAGG
TTTGTTCAGCTGGGGCAAAGTCAACATAAACAGGACCGAGGTAACCAGCAGCTGTGTTCC
CGTTGCTCAGATGGAGTTATAAAACTAACTCCCATCTCAGCTTTCTCGCAAGACAACATT
TATGAAGTTCAGCCTCCAAGAGTAGACAGAAAGTCTACAGAGATCTTCCAGGCCCATATC
CAAGCTAGCCAAGGTATCATGCAGCCCCTTGGCAAAGAGGACACTGCCATGTACCGGGAG
TACATCAGAAACCGCTACTTATAG
展开阅读全文