1、NCBI 资源简介 本文目录: NCBI(美国国立生物技术信息中心) 简介 NCBI 站点地图 NCBI癌症基因组研究 NCBI-Coffee Break NCBI-基因和疾病 NCBI-UniGene Cluster of Orthologous Groups of proteins(COG)简介 Gene Expression Omnibus (GEO)简介 LocusLink简介 关于RefSeq:NCBI参照序列 NCBI(美国国立生物技术信息中心)简介 简介 理解自然无声但精妙关于生命细胞语言是当代分子生物学规定。通过只有四
2、个字母来代表DNA化学亚基字母表,浮现了生命过程语法,其最复杂形式就是人类。阐明和使用这些字母来构成新“单词和短语”是分子生物学领域中心焦点。数目巨大分子数据和这些数据隐秘而精细模式使得计算机化数据库和分析办法成为绝对必要。挑战在于发现新手段去解决这些数据容量和复杂性,并且为研究人员提供更好便利来获得分析和计算工具,以便推动对咱们遗传之物和其在健康和疾病中角色理解。 国立中心建立 日后参议员Claude Pepper意识到信息计算机化过程办法对指引生物医学研究重要性,发起了在1988年11月4日建立国立生物技术信息中心(NCBI)立法。NCBI是在NIH国立医学图书馆(NLM)一种分支。N
3、LM是由于它在创立和维护生物信息学数据库方面经验被选取,并且这可以建立一种内部关于计算分子生物学研究筹划。NCBI任务是发展新信息学技术来协助对那些控制健康和疾病基本分子和遗传过程理解。它使命涉及四项任务: 建立关于分子生物学,生物化学,和遗传学知识存储和分析自动系统 实行关于用于分析生物学重要分子和复合物构造和功能基于计算机信息解决,先进办法研究 加速生物技术研究者和医药治疗人员对数据库和软件使用。 全世界范畴内生物技术信息收集合伙努力。 NCBI通过下面筹划来实现它四项目: 基本研究 NCBI有一种多学科研究小组涉及计算机科学家,分子生物学家,数学家,生物化学家,实
4、验物理学家,和构造生物学家,集中于计算分子生物学基本和应用研究。这些研究者不但仅在基本科学上做出重要贡献,并且往往成为应用研究活动产生新办法源泉。她们一起用数学和计算办法研究在分子水平上基本生物医学问题。这些问题涉及基因组织,序列分析,和构造预测。当前研究筹划某些代表是:检测和分析基因组织,重复序列形式,蛋白domain和构造单元,建立人类基因组基因图谱,HIV感染动力学数学模型,数据库搜索中序列错误影响分析,开发新数据库搜索和多重序列对齐算法,建立非冗余序列数据库,序列相似性记录明显性评估数学模型,和文本检索矢量模型。此外,NCBI研究者还坚持推动与NIH内部其她研究所及许多科学院和政府研究
5、实验室合伙。 数据库和软件 在1992年10月,NCBI承担起对GenBank DNA序列数据库责任。NCBI受过度子生物学高档训练工作人员通过来自各个实验室递交序列和同国际核酸序列数据库(EMBL和DDBJ)互换数据建立起数据库。同美国专利和商标局安排使得专利序列信息也被整合。 GenBank是NIH遗传序列数据库,一种所有可以公开获得DNA序列注释过收集。GenBank同日本和欧洲分子生物学实验室DNA数据库共同构成了国际核酸序列数据库合伙。这三个组织每天互换数据。 GenBank以指数形式增长,核酸碱基数目大概每14个月就翻一种倍。近来,GenBank拥有来自47,00
6、0个物种30亿个碱基。 孟德尔人类遗传(OMIM),三维蛋白质构造分子模型数据库(MMDB),唯一人类基因序列集合(UniGene),人类基因组基因图谱,分类学浏览器,同国立癌症研究所合伙癌症基因组剖析筹划(CGAP)。 Entrez是NCBI为顾客提供整合访问序列,定位,分类,和构造数据搜索和检索系统。Entrez同步也提供序列和染色体图谱图形视图。Entrez是一种用以整合NCBI数据库中信息搜寻和检索工具。这些数据库涉及核酸序列,蛋白序列,大分子构造,全基因组,和通过PubMed检索MEDLINE。Entrez一种强大和独特特点是检索有关序列,构造,和参照文献能力。杂志文献通过
7、PubMed获得,PubMed是一种网络搜索界面,可以提供对在MEDLINE上九百万杂志引用访问,包括了链接到参加出版商网络站点全文文章。 BLAST是一种NCBI开发序列相似搜索程序,还可作为鉴别基因和遗传特点手段。BLAST可以在不大于15秒时间内对整个DNA数据库执行序列搜索。NCBI提供附加软件工具备:开放阅读框寻觅器(ORF Finder),电子PCR,和序列提交工具,Sequin和BankIt。所有NCBI数据库和软件工具可以从WWW或FTP来获得。NCBI尚有E-mail服务器,提供用文本搜索或序列相似搜索访问数据库一种可选办法。 教诲和训练 NCBI通过赞助会议,研讨
8、会,和系列演讲来培养在应用于分子生物学和遗传学计算机领域科学交流。一种科学访问学者项目已经成立,来培养同外部科学家合伙。作为NIH内部某些研究项目,也提供博士后工作位置。 NCBI站点地图---关于Database普通简介 GenBank Overview 基本信息 什么是GenBank?GenBank是一种有来自于70,000各种生物核苷酸序列数据库。每条纪录均有编码区(CDS)特性注释,还涉及氨基酸翻译。GenBank属于一种序列数据库国际合伙组织,涉及EMBL和DDBJ。 纪录样本 - 关于GenBank各个字段详细描述,以及同Entrez搜索字段交叉索引。
9、 访问GenBank - 通过Entrez Nucleotides来查询。用accession number,作者姓名,物种,基因/蛋白名字,尚有许多其她文本术语来查询。关于Entrez更多信息请看下文。用BLAST来在GenBank和其她数据库中进行序列相似搜索。用E-mail来访问Entrez和BLAST可以通过Query和BLAST服务器。此外一种选取是可以用FTP下载整个GenBank和更新数据。 增长记录 - 参见发布告知2.2.6(每个分类记录),2.2.7(每个物种记录),2.2.8(GenBank增长)小节。 发布告知,最新 - 近来和即将有变化,GenBank分类,数
10、据增长记录,GenBank引用。 发布告知,旧 - 同上相似,是过去发布记录。 遗传密码 - 15个遗传密码概要。用来保证GenBank中纪录编码序列被对的翻译。 (向)GenBank提交(数据) 关于提交序列数据,收到accession number,和对纪录作更新普通信息。 BankIt - 用于一条或者少数条提交基于WWW提交工具软件。(请在提交前用VecScreen去除载体) Sequin - 提交软件程序,用于一条或者诸多条提交,长序列,完整基因组,alignments,人群/种系/突变研究提交。可以独立使用,或者用基于TCP/IP“network aware
11、模式,可以链接到其她NCBI资源和软件例如Entrez和PowerBLAST。(请在提交前用VecScreen去除载体) ESTs - 表达序列标签,短、单次(测序)阅读cDNA序列。也涉及来自于差别显示和RACE实验cDNA序列。 GSSs - 基因组调查序列,短、单次(测序)阅读cDNA序列,exon trap获得序列,cosmid/BAC/YAC末端,及其她。 HTGs - 来自于大规模测序中心高通量基因组序列,未完毕(阶段0,1,2)和完毕(阶段3)序列。(注意:完毕人类HTG序列可以同步在GenBank和Human Genome Sequencing页面上访问。)
12、STSs - 序列标签位点。短在基因组上可以被唯一操作序列,用于产生作图位点。 注:SNPs - 人类和其她物种遗传变异数据可以提交到NCBI数据库单核苷酸多态性库中(dbSNP)。 国际核苷酸序列数据库合伙组织 GenBank,DDBJ,EMBL - 合伙筹划概述,并链接到相应主页。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)数据库共享数据是每天都互换,因而她们是相等。数据纪录格式和搜索方式也许会不同样,但是accession number,序列数据
13、和注解都是一模同样。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到成果是完全同样序列数据,参照内容等等。 DDBJ/EMBJ/GenBank特性表 — 特性表格式和原则被合伙数据库用在序列记录注释上,使得数据共享成为也许,涉及详细描述生物特性和特性限定语附录,以及IUPAC规定核苷酸和氨基酸代号。 FTP GenBank and Daily Updates GenBank普通文献格式 — 参见GenBank记录样本和在GenBank发布告知中详细描述,下载大多数近来完全公示和寻常积累或非积累更新数据。 ASN.
14、1格式 — 摘要句法记号1,国际原则组织(ISO)数据表达格式,下载大多数近来完全公示和寻常积累或非积累更新数据。 FASTA格式 — 定义行号后只跟随序列数据(示例),参见描述数据库readme文献,涉及nt.Z(每天更新非冗余BLAST核酸数据库,涉及GenBank+EMBL+DDBJ+PDB序列,但是不涉及EST,STS,GSS,or HTGS序列),nr.Z(每日更新非冗余蛋白质),est.Z,gss.Z,htg.Z,sts.Z,和其他文献。 核酸序列 Entrez核酸 — 用accession number,作者姓名,物种,基因/蛋白名字,以及诸多其他文本术语来搜索核酸序列
15、记录(在GenBank + PDB中)。更多关于Entrez信息见下。如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。 RefSeq — NCBI数据库参照序列。校正,非冗余集合,涉及基因组DNA contigs,已知基因mRNAs和蛋白,在将来,整个染色体。Accession numbers用NT_xxxxxx,NM_xxxxxx,NP_xxxxxx,和NC_xxxxxx形式来表达。 dbEST — 表达序列标签数据库,短、单次(测序)阅读cDNA序列。也涉及来自于差别显示和RACE实验cDNA序列。 dbGSS —基因组调查序列数据库,短、单次(测序)
16、阅读cDNA序列,exon trap获得序列,cosmid/BAC/YAC末端,及其她。 dbSTS —序列标签位点数据库,短在基因组上可以被唯一操作序列,用于产生作图位点。 dbSNP — 单核苷酸多态性数据库,涉及SNPs,小范畴插入/缺失,多态重复单元,和微卫星变异。 完整基因组 参见下面Genome和Maps某些,涉及各种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。 UniGene — 被整顿成簇EST和全长mRNA序列,每一种代表一种特定已知或假设人类基因,有定位图和表达信息以及同其他资源交叉参照。序列数据可以以cluster形
17、式在Unigene网页下载,完整数据可以从FTP站点repository/UniGene目录下下载。 人类UniGene 小鼠UniGene 大鼠UniGene 斑马鱼UniGene BLAST — 将你序列同核酸库中序列比较,检索相似序列。(更详细信息见下面Tools/Sequence相似搜索某些) 蛋白序列 Entrez蛋白 —用accession number,作者姓名,物种,基因/蛋白名字,以及诸多其他文本术语来搜索蛋白序列记录(在GenPept + Swiss-Prot + PIR + RPF + PDB中)。更多关于Entrez信息见下。如果要检索
18、大量数据,也可使用Batch Entrez(批量Entrez)。 RefSeq — NCBI数据库参照序列。Curated,非冗余集合涉及基因组DNA contigs,已知基因mRNAs和蛋白,在将来,整个染色体。Accession numbers用NT_xxxxxx,NM_xxxxxx,NP_xxxxxx,和NC_xxxxxx形式来表达。 FTPGenPept — 下载“genpept.fsa.Z”文献,这个文献包括了从GenBank/EMBL/DDBJ记录中翻译过来FASTA格式氨基酸序列,这些记录均有一到两个CDS特性描述。 完整基因组 参见下面Genome和Maps某些,涉及各
19、种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。 Entrez基因组 — 提供了一种编码区概要和各种物种分类表(TaxTable)。编码区概要列出了在基因组中所有蛋白,并提供链接到FASTA文献和BLAST。分类表总结了蛋白BLAST分析成果,建议她们也许功能,并用颜色编码图来显示物种同其他物种之间关系(参见下面'Genomes和Maps,'某些Entrez基因组普通描述) FTP基因组蛋白 — 从ftp站点genbank/genomes目录下下载各种物种FASTA格式氨基酸序列*.faa和蛋白表文献*.ptt。参见readme文献。蛋白表也可以在En
20、trez基因组中看到。 PROW — Web上蛋白资源,关于大概200种人类CD细胞表面分子简短官方向导。互相检索,为每个CD抗原提供大概20中原则信息分类(生化功能,配体,等等) BLAST — 将你序列同蛋白库中序列比较,检索相似序列。(更详细信息见下面Tools/Sequence相似搜索某些) 构造 构造主页 — 关于NCBI构造小组普通信息和她们研究筹划,此外也可以访问分子模型数据库(MMDB)和用来搜索和显示构造有关工具。 MMDB:分子模型数据库 — 一种关于三维生物分子构造数据库,构造来自于X-ray晶体衍射和NMR色谱分析。MMDB是来源于Brookhav
21、en蛋白数据库(PDB)三维构造一某些,排除了那些理论模型。MMDB重新组织和验证了这些信息,从而保证在化学和大分子三维构造之间交叉参照。数据阐明书涉及生物多聚体空间构造,这个分子在化学上是如何组织,以及联系两者一套指针。运用将化学,序列,和构造信息整合在一起,MMDB筹划成为基于构造同源模型化和蛋白构造预测资源服务。MMDB记录以ASN.1格式存储,可以用Cn3D,Rasmol,或 Kinemage来显示。此外,数据库中类似构造已经被用VAST确认,新构造可以用VASTsearch来同数据库进行比较。 Cn3D — “See in 3-D”, 一种用于NCBI数据库构造和序列相似显示工具
22、它容许观测3-D构造和序列—构造或构造—构造同源比较。Cn3D用起来就象你浏览器上一种协助工具。 VAST — 矢量同源比较搜索工具—一种在NCBI开发计算算法,用于拟定相似蛋白三维构造。每一种构造“构造邻居”都是预先计算好,并且可以通过MMDB构造概要页面链接访问。这些邻居可以用来确认那些不能被序列比较辨认远同源性。 VAST 搜索 — 构造—构造相似搜索服务。比较一种新解出蛋白构造和在MMDB/PDB数据库中构造三维坐标。VAST搜索计算一系列也许会被交互浏览构造邻居,用分子图形来观测重叠和同源相似。 分类学 NCBI分类数据库主页 — 关于分类筹划普通信息,涉及分类资源
23、和同NCBI分类学家合伙外部管理者列表。 分类浏览器 — 搜索NCBI分类数据库,涉及不不大于70000个物种名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。可以检索一种特定种或者更高分类(如属,科)核酸,蛋白,和构造记录。如果有新物种序列数据被放到数据库中,这个物种就北加到(分类)数据库中。NCBI分类数据库目是为序列数据库建立一种一致种系发生分类学。 文献数据库概要 PubMed — 一种关于生物医药科学检索系统,涉及引用,摘要,和杂志索引术语。它涉及直接由出版商提供应NCBI文献引用以及链接到在出版商网址上全文URLs。 PubMed涉及MEDLINE和P
24、REMEDLINE完整内容。它还涉及某些被MEDLINE以为超过范畴文章和杂志,(这些文章或杂志)由于内容或在某一时期不在索引范畴内。因而PubMed是比MEDLINE更大集合。 杂志浏览器 — 容许你去查找收录到PubMed系统杂志名字,MEDLINE缩写,或ISSN号码。 PubRef(开发中)— 一种关于来自于广大范畴科学杂志数目记录,和链接到出版商网址全文。PubRef包括了PubMEd,加上了来自其他学科杂志出版商提供引用和摘要。因而它是比PubMed更大集合。这个筹划启动是由于NAS规定为科学领域电子杂志提供一种“白皮书”服务。 PubMed中心(开发中) — PubMed中心是一
25、种无障碍NIH资源,用于在生命科学领域中同业互查基本研究报告。从一月开始接受杂志文章。所有在PubMed中心材料将由当前任一重要摘要和索引服务中列出杂志提供,或者在编辑委员会中拥有3个以上有重要资金机构研究经费拥有人杂志提供。 OMIM — 在线人类孟德尔遗传—经常更新人类基因和遗传失调目录,有链接到其他有关文献参照,序列记录,和有关数据库。 书籍 — 同书籍出版商合伙NCBI为网络改编了教科书,并把她们链接到PubMed—生物医药书目数据库。这是为了给PubMed提供背景信息,这样使用者可以探究在PubMed搜索成果中不熟悉概念。当前收录书有: Molecular Biology of
26、the Cell,3rd ed. Alberts B.,Bray D.,Lewis J.,Raff M.,Roberts K.,Watson J.D.,1994,Garland Publishing. 外部链接 — 一种登记服务,用于建立从在Entrez中特定文章,杂志,或生物数据到外部网址链接。第三方可以提供一种URL,资源名字,关于她们网址简要描述,和关于从NCBI数据哪里她们但愿建立链接详细阐明。这个详细阐明可以用对Entrez有效布尔查询来写,也可以用特定文章或序列标志列表来写。这样NCBI PubMed顾客将可以通过“NCBI小房间”服务(开发中)来选取哪个外部链接在她们搜索中是可见
27、 引用匹配 — 容许你找到任何一篇在PubMed数据库中文章PubMed ID或MEDLINE UID,给出书目信息(杂志,卷,页码等)。 单篇文章引用匹配。 许多文章批量引用匹配。 E-mail引用匹配也是可以,也可以用于单篇或许多文章。如果要获得协助文献,给写一封只有内容为HELPE-Mail。 Genomes and Maps Overview Entrez基因组:人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒,和真核细胞器。 Entrez基因组(各种物种) Entrez基因组 — 超过800种在GenBank中被完整测序物种,涉及不不大于500
28、种病毒,〉25种细菌,酵母,和许多viroids,质粒,和细胞器。还涉及正在进行中基因组,例如人,小鼠,线虫,疟原虫,果蝇,利什曼原虫,水稻,和玉米。提供完毕基因组/染色体图形概览,并可以探究那些逐渐细化区域。也提供那些已经被NCBI工作人员分析过物种编码区摘要和TaxTables。此外,Entrez Map Viewer,Entrez基因组一种软件构成某些,提供整合果蝇(细胞遗传学和序列图谱)和人类(细胞遗传学,遗传连锁,序列,放射杂交,和其他图谱)染色体图谱浏览。 通过每个物种Entrez基因组页面来下载〈350kb基因组。 通过NCBI ftp站点来下载〉350kb基因组—参见在
29、genbank/genomes目录下readme文献,ftp链接在每个物种Entrez基因组页面上也有。 NCBI站点地图---Human Genome人类基因组数据简介 向导 人类基因组资源向导 — 可用人类基因组数据资源概览。涉及关于人类基因组公示和进展报告和提供对此前分离数据集中访问。 人类基因组序列数据状态 — 描述了当前在GenBank中数据范畴,涉及完毕和草图高通量基因组序列数据讨论。 染色体 人类基因组测序 — 每一条染色体,概述了人类基因组筹划测序进展(图示和记录)。提供对基因组序列数据访问,也有链接到参加国际基因组中心,各种STS图谱,疾病基因信息,和选
30、取出参照文献。列出完毕contig大小和位置。Contig可以被显示出来,以表达构成她们GenBank中记录成分,或者那些由e-PCR拟定位于其上STS标记。Contig用在GenBank中处在第三期HTG序列记录来组装起来,组装办法是用Jang,et al描述过程,并给于一种NT_*accession number,作为RefSeq筹划一某些。关于各期HTG序列详细阐明见HTG网页。 Entrez图谱浏览器 — 整合染色体图谱—图谱浏览器是Entrez基因组一种软件构成某些,用来显示一种或各种用共同标记或基因名字互相align过图谱,以及用相似序列进行比较过序列图谱。在人类基因组数据和搜
31、索技巧文献中关于于20种序列,细胞遗传,遗传连锁,放射杂交,和其他图谱。Entrez图谱浏览器协助文献提供了关于如何使用这个工具普通阐明。 FTP — 每个染色体均有一种文献目录包括各种格式完毕基因组contig(NT_*记录): hs_chr*.asn ASN.1 格式 (description above) hs_chr*.fna.gz FASTA 格式(description above) hs_chr*.gbk.gz GenBank flat file 格式 (当前注解涉及STS标记,已知和预期基因将被在将来几种月中加入) hs_chr*.gbs GenBank
32、 summary 格式 (这个格式不具有序列数据,但是包括一种“CONTIG”字段,表白这个contig是如何有独立GenBank记录组装起来。) BLAST人类基因组序列数据 BLAST人类染色体 — 将一种核酸或蛋白序列同已经完毕HTG contig比较。Contig用在GenBank中处在第三期HTG序列记录来组装起来,组装办法是用Jang,et al描述过程,并给于一种NT_*accession number,作为RefSeq筹划一某些。关于各期HTG序列详细阐明见HTG网页。同人类染色体作BLAST是人类基因组测序页面一种构成某些。 BLAST htgs数据库 — 将
33、一种核酸或蛋白序列同未完毕HTG序列(第0,1,2期)进行比较(关于各期HTG序列详细阐明见HTG网页)。尽管htgs数据库包具有来自许多物种序列,你可以使用Advanced BLAST页面来限定你搜索只在人类。 BLAST gss数据库 — 将一种核酸或蛋白序列同随机“单次(测序)阅读”基因组调查序列比较,犹如cosmid/BAC/YAC末端序列,exon trap获得基因组序列,和Alu PCR序列。尽管gss数据库包具有来自许多物种序列,你可以使用Advanced BLAST页面来限定你搜索只在人类。 基因 位点链接(LocusLink) — 为校
34、正过序列和遗传位点描述信息提供一种单次查询界面。LocusLink给每个位点发布一种稳定ID,并提供官方命名,同名,序列accesssion number,表型,EC号码,OMIM号码,Unigene簇,图谱信息,和有关网址。LocusLink是NCBI,人类基因命名委员会,OMIM和其他组织合伙成果。LocusLink当前包括人类,小鼠,大鼠,斑马鱼,和果蝇位点,物种可以被分开或合在一起查询。 OMIM — 在线人类孟德尔遗传—经常更新人类基因和遗传失调目录,有链接到其他有关文献参照,序列记录,和有关数据库。 RefSeq — NCBI数据库参照序列。校正,非冗余集合,涉及基因组DN
35、A contigs,已知基因mRNAs和蛋白,在将来,整个染色体。Accession numbers用NT_xxxxxx,NM_xxxxxx,NP_xxxxxx,和NC_xxxxxx形式来表达。 UniGene — 被整顿成簇EST和全长mRNA序列,每一种代表一种特定已知或假设人类基因,有定位图和表达信息以及同其他资源交叉参照。序列数据可以以cluster形式在Unigene网页下载,完整数据可以从FTP站点repository/UniGene目录下下载。 序列 人类基因组测序 — 每一条染色体,概述了人类基因组筹划测序进展(图示和记录)。提供对基因组序列数据访问,也有链接到参加
36、国际基因组中心,各种STS图谱,疾病基因信息,和选取出参照文献。列出完毕contig大小和位置。Contig可以被显示出来,以表达构成她们GenBank中记录成分,或者那些由e-PCR拟定位于其上STS标记。Contig用在GenBank中处在第三期HTG序列记录来组装起来,组装办法是用Jang,et al描述过程,并给于一种NT_*accession number,作为RefSeq筹划一某些。关于各期HTG序列详细阐明见HTG网页。 RefSeq — NCBI数据库参照序列。校正,非冗余集合,涉及基因组DNA contigs,已知基因mRNAs和蛋白,在将来,整个染色体。Accessio
37、n numbers用NT_xxxxxx,NM_xxxxxx,NP_xxxxxx,和NC_xxxxxx形式来表达。 Entrez — 对GenBank,EMBL,DDBJ,PIR-International,PRF,Swiss-Prot,and PDB数据库中核酸和蛋白序列数据提供整合访问,同步提供对3D蛋白构造,基因组图谱信息和PubMed MEDLINE访问。Entrez包括了对每个数据库记录预先计算好相似搜索,产生一种有关序列,构造,和MEDLINE登记表。涉及了来自〉70000个物种序列数据,可以用物种字段来限制记录只在人类搜索。 UniGene — 被整顿成簇EST和全长mRN
38、A序列,每一种代表一种特定已知或假设人类基因,有定位图和表达信息以及同其他资源交叉参照。序列数据可以以cluster形式在Unigene网页下载,完整数据可以从FTP站点repository/UniGene目录下下载。 DbEST — 表达序列标签数据库—短(300—500bp)cDNA序列,代表mRNA单次(测序)阅读。经常有大量EST被测序,并代表了在一种给定组织或一种给定发育阶段基因表达快照。同步包括了由CGAP筹划产生ESTs,和来自差别显示及RACE实验序列。 克隆 克隆登记 — 由多方人类基因组测序中心使用数据库,用来记录哪些克隆已经被选来测序,哪些正在被测序,哪些已经
39、完毕,哪些已经被送到GenBank中去了。涉及BACs,PACs,cosmids,fosmids。使用统一克隆名字表达克隆在微量板上位置(板号,行,和列),位置前面加上库缩写,来产生唯一名字。涉及了克隆定购信息。 基因组图谱 Entrez基因组 — 链接到人类基因组测序站点人类染色体视图。Entrez基因组同步涉及了一种人类线粒体视图(通过真核细胞器来访问),可以查看完整状况或查看逐渐详细信息。 Entrez图谱浏览器 — 整合染色体图谱—图谱浏览器是Entrez基因组一种软件构成某些,用来显示一种或各种用共同标记或基因名字互相align过图谱,以及用相似序列进行比较过序列图谱。在
40、人类基因组数据和搜索技巧文献中关于于20种序列,细胞遗传,遗传连锁,放射杂交,和其他图谱。Entrez图谱浏览器协助文献提供了关于如何使用这个工具普通阐明。 GeneMap’99 — 〉35000个人类基因标记物理图谱,由国际放射杂交图谱联合用一致RH试剂和办法建成。提供了突出了染色体上核心标志(富含基因区)框架,从而加速了测序,代表了超过100名科学家国际合伙努力。 NCBI RH图谱 — NCBI整合RH图谱,涉及来自GeneMap’99G3和GB4RH单子上23723个标记。这些标记相对于1084个框架标记(一种G3和GB4共同子集)被绘制。所有标记被统一在GB4尺度上。R. A
41、garwala et al.文章提供了详细整合方略,以及评估整合图谱质量办法。 Mitelman癌症染色体变异摘要 — 由Drs. Mitelman,Mertens,和 Johansson建立基因组范畴人类癌症中染色体断裂位点图谱。参见Nature Genetics,Vol. 15(Spec. No.):417-74 (April 1997)超文本版本。 OMIM基因图 — 被报道和被许多定位办法决定基因细胞遗传位点。可以用基因代号或细胞遗传染色体位点来搜索。可以从OMIM页面上访问。 OMIM致病图 — 按字母排列疾病和相应细胞遗传图位点,链接到OMIM条目。可以从OMIM页面访
42、问。 人类/小鼠同源图 —University of California at DavisM. F. Seldin建立,一张比较人和老鼠在同源区段DNA上基因表,按在每个基因组上位置排列。 绘制标记 dbSTS —序列标签位点数据库,短在基因组上可以被唯一操作序列,因而可以拟定在物理图谱上特定位置。 电子PCR(e-PCR) — 找到一种查询序列假设位点图。用于在DNA序列上发现STS位点计算过程。 GeneMap’99 — 〉35000个人类基因标记物理图谱,由国际放射杂交图谱联合用一致RH试剂和办法建成。提供了突出了染色体上核心标志(富含基
43、因区)框架,从而加速了测序,代表了超过100名科学家国际合伙努力。 人类基因组测序 — 绘制标记已经用e-PCR自动被放到完毕HTG序列构成contig上。标记来源于dbSTS,GeneMap'99(基于基因标记),Stanford G3 RH单子(又有基因标记也有非基因标记),Whitehead GB4 RH单子和YAC图谱(又有基因标记也有非基因标记),Genethon遗传图谱,和某些染色体特异图谱,如NHGRI7号染色体图谱,Washington UniversityX染色体图谱。 OMIM基因图 — 被报道和被许多定位办法决定基因细胞遗传位点。可以用基因代号或细胞遗传染色体位点
44、来搜索。可以从OMIM页面上访问。 基因表达 CGAP cDNA表达谱 — 在UniGene簇和cDNA库中ESTs分布。可以在CGAP页面上访问。 SAGEmap — CGAP SAGE(Serial Analysis of Gene Expression)库差别显示。也包括了对在人类GenBank记录中SAGE标签完整分析,在人类GenBank记录中一种UniGene标志被分派给了每个具有一种SAGE标签人类序列 遗传变异 dbSNP — 单核苷酸多态性数据库,涉及SNPs,小范畴插入/缺失,多态重复单元,和微卫星变异。DbSNP包括种族特异频率和基因型数据,实验条件,分
45、子上下文,及中性多态和临床变异定位信息。 OMIM — 在线人类孟德尔遗传—约900个OMIM记录等位变异。为了查看这些OMIM记录列表,在等位变异字段上搜索“0001”。或者,把一种疾病名字同“0001”放到一起。如:Gaucher & 0001。 位点特异突变数据库 — 从OMIM主页和有关LocusLink条目链接到许多外部数据库。 失调 基因和疾病 — 简介遗传因素和人类疾病关系。有约60种遗传疾病概要信息,以及链接到有关数据库和组织。 Mitelman癌症染色体变异摘要 — 由Drs. Mitelman,Mertens,和 Johansson建立基因组范畴人类癌症
46、中染色体断裂位点图谱。参见Nature Genetics,Vol. 15(Spec. No.):417-74 (April 1997)超文本版本。 OMIM — 在线人类孟德尔遗传—经常更新人类基因和遗传失调目录,有链接到其他有关文献参照,序列记录,和有关数据库。 OMIM Morbid Map - alphabetical listing of diseases and corresponding cytogenetic map locations,with links to OMIM entries. Accessible from OMIM page (see Genes).
47、 OMIM致病图 — 按字母排列疾病和相应细胞遗传图位点,链接到OMIM条目。可以从OMIM页面访问。 癌症研究 CCAP — 癌症染色体变异筹划—筹划用来加速同恶性转移有关明显染色体变异定义和详细特性描述。 CGAP — 癌症基因组剖析筹划 — 交叉学科项目,目是基于cDNA库,鉴定在不同癌症阶段人类基因表达,和决定正常,癌前和恶性细胞分子表达谱。是NCI,NCBI和其他许多实验室合伙。 Mitelman癌症染色体变异摘要 — 由Drs. Mitelman,Mertens,和 Johansson建立基因组范畴人类癌症中染色体断裂位点图谱。参见Nature Genetics,V
48、ol. 15(Spec. No.):417-74 (April 1997)超文本版本。 SAGE分析 — 在癌症库中SAGE标签差别表达 NCBI站点地图---其她基因组数据简介 小鼠基因组 小鼠基因组资源向导 — 把从各个中心来各种小鼠有关资源整合在一起,涉及序列,图谱,和克隆信息以及指向小鼠种系和突变资源指针。 小鼠基因组测序 — 小鼠基因组筹划测序进展,HTG序列contigs(可以用大小和染色体号来浏览)由测序中心数据建立,可以contig或染色体形式来下载。 小鼠UniGene — 被整顿成簇EST和全长mRNA序列,每一种代表一种特定已知
49、或假设基因,有定位图和表达信息以及同其他资源交叉参照。序列数据可以以cluster形式在Unigene网页下载,完整数据可以从FTP站点repository/UniGene目录下下载 位点链接(LocusLink) — 为校正过序列和遗传位点描述信息提供一种单次查询界面。LocusLink给每个位点发布一种稳定ID,并提供官方命名,序列accesssion number, Unigene簇,图谱信息,和有关网址。LocusLink是NCBI,人类基因命名委员会,OMIM和其他组织合伙成果。LocusLink当前包括人类,小鼠,大鼠,斑马鱼,和果蝇位点,物种可以被分开或合在一起查询。 E
50、ntrez —涉及了来自〉70000个物种序列数据,可以用物种字段来限制记录只在小鼠搜索。 人类/小鼠同源图 —University of California at DavisM. F. Seldin建立,一张比较人和老鼠在同源区段DNA上基因表,按在每个基因组上位置排列。 大鼠基因组 大鼠UniGene —被整顿成簇EST和全长mRNA序列,每一种代表一种特定已知或假设基因,有定位图和表达信息以及同其他资源交叉参照。序列数据可以以cluster形式在Unigene网页下载,完整数据可以从FTP站点repository/UniGene目录下下载 位点链接(LocusLin






