1、GW-analysis:an introductionYong-Xiang Lin第1页GW 基本流程基本流程1.取得相同基因家族序列2.取得保守domain3.建库并使用已取得保守domain进行同源 性搜索4.依据搜索结果提取对应序列5.使用pfam和smart进行验证并剔除不保守序 列6.剔除重复序列7.相同性比对构建进化树第2页OsIBCD003925 MMGSGMPHMYFASSSHGTGAHYQSPGGAPITMAVPDMGFLVAGIGMAPSSFVMPEGALAASYSAMATVPVGVVVPQQQSSRFGGNNGNPGSFKGAWTRQEDEVLKQMVILHGDRKWAT
2、IAKSLPGRIGKQCRERWTNHLRPDIKKDVWTEEDDRMLIEAHKTYGNRWSVIARCLPGRSENAVKNHWNATKRSLKSKRRMKKKSVQVVNSPPGQLSPLEEYIRSQYPSAVETTPLPPAVPAPPSDVIVHGAGSVSAGPTVATQEPTGTNPSEMGIYLGLGNPAGPTTQQLAAMNLNMSLAPDLNAYNDQREGYYLPFVPQGNLHYGMHVPAPPVQQQQQQGISVDQGLHSSCLSLYHPFPGTHPVSLDFGCQSSNHANAGGYYSEAGPSSGSGSGDPDDVD VIQMASRQFLMPSEAEV
3、TLDLTRFK 怎样取得相同基因家族序列?1.查文件,比如找做水稻或拟南芥相同家族 2.文件,使用文件中列出序列3.2.查网站,比如某网站已列出水稻或拟南芥对应家族序列,便可下载使用第3页怎样取得保守domain序列?查pfam(http:/pfam.sanger.ac.uk/)第4页复制保守domain序列保守domain名称搜索结果第5页怎样构建数据库?dnatools 软件应用 第6页构建蛋白数据库构建核酸数据库第7页粘贴pfam得到保守domain序列,而且格式化格式化怎样进行同源性比对搜索?第8页参数设置第9页取得比对结果1.保留比对结果3.假如全部得到基 因数目数目是80且都 有
4、保守domain,则要 删除这80个基因重新 建库,再次搜索以穷尽 全部可能基因2.抽提对应基因 序列,深入验证 是否含有保守domain第10页怎样依据得到gene名取得对应序列?UltraEdit 软件使用使用UltraEdit 打开库文件第11页使用搜索功效并复制基因名第12页将得到每个序列分别存入文本文档第13页怎样验证搜到基因是否含有保守domain?1.Search pfam database(http:/pfam.sanger.ac.uk/)2.Search smart database(http:/smart.embl-heidelberg.de/)第14页怎样将候选基因进行基
5、因组定位?染色体染色体起始位置起始位置结束位置结束位置第15页定位作图软件MapInspect使用第16页第17页第18页文件格式染色体长度(Mb)基因在染色体上位置(Mb)几号染色体第19页怎样剔除重复序列?重复序列定位在基因组中相同位置,而且序列同源性很高 看这些基因起始和结束位置可一样(相差一百bp以内),使用同源性比对软件(Mega、ClusterX等)对全部序列进行比对,保留较长而且domain保守序列,剔除较短序列。第20页第21页怎样构建进化树?Mega 4.0 软件使用首先进行序列比对第22页ClusterW 同源性比对第23页NJ法构建进化树第24页第25页假如同源性差不能用Mega软件构建进化树怎么办?可尝试使用ClusterX软件进行同源比对构建进化树基本界面第26页导入序列第27页序列比对第28页构建进化树第29页用Mega打开树文件*.phb第30页