1、,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。
2、本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考
3、,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,单击此处编辑母版标题样式,单击此处编辑母版
4、文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。
5、本资料仅供参考!,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,生物信息学中不确定性和分类问题,邹 权,(,博士、副教授,),厦门大学数据挖掘试验室,M V,.Human genetics:Dr Watsons base pairsJ.,Nature,452(7189):819-820.,HapMap,计划,/1000 Genome,计划,大数据,3/19,生物信息学中我国计算机学者,算法阶段,(1990-),朱大铭、姜涛
6、、卜东波,标注阶段,(-),王晓龙、朱小燕等,系统分析阶段,(-),李衍达、张学工等,大规模数据处理阶段,(-now),华大基因,4/19,一些生物信息学中分类问题,microRNA,识别,蛋白质功效预测,基因表示数据分析,全基因组关联分析,5/19,microRNA识别,诺贝尔奖-RNA干扰机制,CCCCUCUAUUCACAAUUGUUUGGAACUCAGUUUUGUGAUUAUUCUAUCAUUGCCAGGGAGUUUGUGUGGUUGCAUCAGGGG,6/19,7/19,8/19,microRNA分类相关论文,Chenghai Xue,Fei Li,Tao He,Guo-Ping Li
7、u,Yanda Li,Xuegong Zhang,.Classification of real and pseudo microRNA precursors using local structure-sequence features and,support vector machine,.,BMC Bioinformatics,.6:310(谷歌 scholar,引用,271,次,截至,.8.2),Peng Jiang,Haonan Wu,Wenkai Wang,Wei Ma,Xiao Sun,Zuhong Lu,.,MiPred:classification of real and p
8、seudo microRNA precursors using,random forest,prediction model with combined features.,Nucleic Acids Research,.,35:W339-W344(谷歌 scholar,引用,239,次,截至,.8.2),Leyi Wei,Minghong Liao,Yue Gao,Rongrong Ji,Zengyou He,Quan Zou,.Improved and promising identification of human microRNAs by incorporating a high-q
9、uality negative Set.,IEEE/ACM Transactions on Computational Biology and Bioinformatics,.,11(1):192-201,9/19,microRNA与疾病关系,图挖掘,相同度度量、不确定性,参考文件,Jiang Q,Hao Y,Wang G,et al.Prioritization of disease microRNAs through a human phenome-microRNAome networkJ.BMC Systems Biology,4(Suppl 1):S2.,Xuan P,Han K,Gu
10、o M,et al.Prediction of microRNAs associated with human diseases based on weighted k most similar neighborsJ.PloS one,8(8):e70204.,10/19,一些生物信息学中分类问题,microRNA,识别,蛋白质功效预测,基因表示数据分析,全基因组关联分析,11/19,蛋白质功效预测,问题,输入:蛋白质序列,进行聚类、分类,特殊蛋白识别,-,不平衡分类,亚细胞定位,-,多类分类,酶和多功效酶,-,多类,少许多标识,功效预测,-,多示例、多标识,二级结构、结构域,-,标注、,HM
11、M,难点,特征提取,分类器,12/19,一些生物信息学中分类问题,microRNA,识别,蛋白质功效预测,基因表示数据分析,全基因组关联分析,13/19,基因表示数据分析,14,/57,聚类,分类,双聚类,14/19,一些生物信息学中分类问题,microRNA,识别,蛋白质功效预测,基因表示数据分析,全基因组关联分析,15/19,全基因组关联分析(GWAS),16/19,GWAS,难点,高维小样本,SNP-SNP,相互作用,结果可解释性,前景,疾病遗传机理,遗传育种(作物、养殖),17/19,总结,机器学习在寻找生物信息学,应用,-,分类、聚类、降维、不确定性,结果解释和验证,生物试验验证,文件验证,生物信息学在寻找机器学习,数据量在增大,统计学无法满足精度需要,18/19,邹权,,Email,:,zouquan,敬请指正!,19/19,