1、44生通报学物2023年第7 期月总第58 卷Linux系统下应用生物信息学技术的高中生物学校本课程探索常小光(福建师范大学附属中学福建福州350000)摘要生物信息学是一门新兴交又学科,当代信息技术的发展对高中生物学课程有重要影响。Linux系统具有安全高效、操作简单、运行稳定、兼容性强等优点,为高中生分析生物信息数据提供新的途径和平台。在高中生物学校本课程中,Linux系统下应用生物信息学教学有利于培养学生计算思维和生物学学科核心素养。笔者以生物学进化分析中系统发育树构建和分析为例,从数据检索下载、比对、构树方法选取、系统发育树构建评估等方面进行操作讲授。笔者借助Linux平台,带领学生实
2、践操作,对以生物信息学技术为依托的高中生物学校本课程活动进行教学探索。关键词校本课程系统发育树Linux系统中国图书分类号:G633.91文献标识码:A人教版普通高中生物学教材多次提及生物信息学相关内容,选择性必修3 生物技术与工程第3 章第4 节也以课外实践“基于网络数据分析2.5引导探究将模拟实验数据与实现现象结合,请学生思考并回答在上述实验过程中,气球在鱼类中对应的器官及充气相当于鱼类的哪些行为。引导学生积极思考,将模拟实验与鱼类的浮沉活动建立有机的对应,最终使学生意识到鱼是鱼类重要的调节器官。当鱼内气体体积变大,鱼体体积也会随之变大,鱼体质量不变(鱼内空气质量忽略),重力不变,浮力变大
3、,鱼体上浮;当鱼内气体体积变小,鱼体体积也会随之变小,鱼体质量不变(鱼内空气质量忽略),重力不变,浮力变小,鱼体下沉。最终学生能够明白鱼类通过鱼内气体体积的改变来帮助调节鱼体的浮沉。3总结与反思课程标准指出,探究活动是主动获得新知识的重要途径,教师应充分认识这种学习活动在培养学生核心素养中的价值,指导学生采用实验、资料分析、调查测量等多种方式开展探究活动。生物学是以实验为基础,研究生命现象及其本质的科学,生物学实验技术与物理学、化学等基因和蛋白质的序列信息”为例,让学生尝试利用生物信息学技术初步分析和比较人、猪、牛胰岛素的基因和蛋白质序列信息差异。笔者以人的胰学科有密切联系,本次实验将生物学现
4、象与物理学的原理进行了有机结合,使学生将身边常见的生物及其生物学现象,通过积极主动地探究,与物理学原理生动地结合起来。通过综合活动探究,学生认识了鱼类的重要器官及其功能,意识到结构与功能相适应的原理。将物理学中的经典力学实验与鱼类的活动相结合,既是将理论与实际生活相结合的过程,也是提升自己动手能力和思维的过程初中物理学中的浮力原理在生物学的鱼类运动中得到了鲜明的体现。这次综合课程活动使学生领悟到鱼类精密的结构,有趣的物理学浮力原理,也锻炼了学生实验设计及预设问题的能力。同时,在具体操作过程中,由于理论与实际测定值存在差异,也培养了学生主动进行多方面、多层次思考和实事求是的科学精神。主要参考文献
5、1 】中华人民共和国教育部.义务教育生物学课程标准(2 0 2 2年版)S.北京:北京师范大学出版社,2 0 2 2:3 3.(E-mail:)45通报学生物2023年第7 期总第58 卷岛素蛋白序列作为查询序列(querysequence),其他2 个物种胰岛素蛋白序列作为目标序列(s u b j e c t s e q u e n c e),带领学生利用blast进行序列信息比对之后,又添加羊的胰岛素蛋白序列,鼓励和指导学生从熟悉的Windows系统人手,利用MEGA软件构建、编辑系统发育树,比较人、猪、牛、羊4种生物的亲缘关系,激发了学生极大的学习和探究热情。将生物信息学应用于高中生物学
6、课堂教学,可以将教材中较为抽象的相关知识具体化,既能开阔学生眼界,又能锻炼其动手和探索能力,加深学生对知识的理解,培养科学探究精神。然而,该课外实践活动于学生而言操作较为简易,不能加强学生对生物信息学的直观认识。普通高中生物学课程标准(2 0 1 7 年版2 0 2 0 年修订)(以下简称课程标准)指出,教师在此模块教学过程中,应结合具体案例进行分析,利用互联网上各种数据库的数据,阐明和理解大量生物数据所包含的生物学意义,并应用于解决生命科学研究和生物技术相关产业中的各种问题。福建师范大学附属中学在校本课程上做了诸多有益实践,为学生提供了优秀的实验平台。依照课程标准精神和校本课程需要,笔者结合
7、具体案例,对教材课外实践活动进行延伸教学,利用校本课程中学生较为熟悉的真菌,进行在Linux系统下,以生物信息学技术为辅助的系统发育分析和进化树制作的高中生物学校本课程活动的尝试。1课前准备利用生物信息学进行教学需要可登录互联网的计算机,因此需提前准备网络良好的计算机教室。为完成教学目标,教师可展示已经提前完成的校本课程结果图片,激发学生探索兴趣,让学生提前查找关于本节课程的相关资料,并尝试自学与本次课程相关的生物信息学知识。Linux系统稳定且高效,对计算机配置要求低,学生可免费使用多种软件。学生通过自主学习,不仅增强自主探究能力,拓宽知识层面,而且能够保证在课堂上取得更好的教学效果。为每位
8、学生注册服务器账号,以供学生在Linux系统下运行程序2教学过程2.1NCBI数据库和Linux系统介绍高中生对数据库知识了解相对较少,教师可首先向学生介绍生物信息学中数据库的类型。然后引导学生登录NCBI数据库(https:/www.ncbi.nlm.nih.gov),以该数据库和中国科学院北京基因组研究所(国家生物信息中心)官方网站为例,阐述数据库与网站的区别和联系等理论知识。简单讲解NCBI首页下拉框中 Gene,Genome,Protein,Pubmed,SNP等几个常用类别的含义和功能,如“Genome主要针对已经完全测序的基因组,是可搜索的基因数据库;“PubMed”主要是生物学期
9、刊和生物学医学文献的相关数据等。最后,向学生展示该数据库的使用方法。如利用该数据库查找英文文章,选择首页下拉框中“PubMed选项,在搜索框中输人文章题目或者关键词,点击“Search”即可跳转到文章链接界面。学生对Linux系统比较陌生,教师可以以学生较为熟悉的Windows系统为切人点,向学生介绍Linux系统,如Windows系统以图形为界面,Linux系统以数字为界面等。然后教师向学生演示使用该系统时较为简单的如“cd、l s、I I”等基础命令。在Windows系统下下载并安装Winscp软件,展示利用Winscp软件实现Windows系统与Linux系统的文件互传方法2.2蛋白质序
10、列信息检索对NCBI数据库有简单的认识后即可以检索并下载蛋白质序列。若蛋白质序列已上传,可直接打开NCBI数据库,在首页下拉框中选择“Protein选项,然后输人拉丁文名称,点击“Search”,选择fasta格式(网页中为“.fna”文件)下载,利用Winscp软件上传至Linux系统。笔者使用的一些蛋白质序列未被直接上传至数据库,教师需提前从注释文件中获取蛋白质序列文件并发送给学生。如杏鲍菇的蛋白质序列,在NBCI数据库首页下拉框中选择“Genome选项,输人拉丁文名称“Pleurotus eryngif,点击“Search”,下载“genomic.gbff.gz文件,利用Winscp软件
11、上传至Linux系统。在Linux系统下,直接利用conda安装EMBOSS软件,输人命令“condainstall emboss”。然后使用“seqret命令转化,如seqret-feature-osformat2 gff3-outseq Ple.gff Ple.gh”,获得gff3格式文件,最后利用gffread提取gff3格式文件中的蛋白质序列。笔者使用的1 0 种真菌包括:双孢蘑菇(Agaricusbisporus)、污叉丝孔菌46通报物学2023年第7 期总第58 卷(Dichomitus squalens))、蕈菌(Hydnomerulius pinastri)、真姬菇(Hypsi
12、zygus Mamoreus)、双色蜡蘑(Laccariabicolor)、粗糙链孢菌(Neurosporacrassa)、糙皮侧耳(Pleurotus ostreatus)、酿酒酵母(Saccharomycescerevisiae)、白灵菇(Pleurotus tuoliensis)、杏鲍菇。上传至Linux系统的蛋白质序列是以压缩包“文件名.fna.gz文件格式存在的。教师展示解压压缩包的方法,输人命令“gunzip文件名fna.gz”即可完成。然后输人“cd文件名命令打开文件夹,“ls”或“ll命令查看文档。若想在Windows系统下查看文件,可在解压后,用文本编辑打开解压后的文件。展示
13、并介绍fasta数据格式:fasta格式第1 行以标识符“”开始,后面跟着一行序列信息的描述,下面是具体的氨基酸序列,如杏鲍菇蛋白质序列信息:MPLSATHSY.,每个字母表示1 个氨基酸的缩写,表示氨基酸不同的排列顺序。也可在以上1 0 种真菌中任选1 种真菌下载基因组序列信息,如杏鲍菇基因组序列信息:GGGAAGTG,每1 个字母表示1 个脱氧核苷酸,该顺序表示脱氧核苷酸的不同排列。2.3系统发育树的构建在生物信息学中,系统发育树可用于展示不同生物亲缘之间的关系,通过分析可以帮助人们了解生物的进化过程 2。与大多数人利用Windows系统中的MEGA软件构建系统发育树不同的是,笔者带领学生
14、构建的系统发育树是在Linux系统下完成的。程序运行需要时间,为提高课堂效率,在Linux系统下,可使用命令“nohup将任务提交后台,即可保证在学生退出时程序仍然正常运行。教师指导学生在Linux系统下下载并安装OrthoFinder、M A FFT、G b l o c k s、Fa s t T r e e、Fi g T r e e 这几个软件(每种软件在Linux系统和Windows系统下安装方法不同,FigTree在Windows系统下安装,详细步骤可参照各软件官网)。OrthoFinder是比较基因组学中常用的软件,可用于查找各物种间最近共同祖先中某基因进化而得到的1 组基因和2个物种
15、间最近共同祖先中某基因进化而得到的1组基因,即直系同源组和直系同源物;推断直系同源组的有根基因树,识别基因树中的基因重复事件,为不同物种基因组间的比较分析提供全面的统计信息,从而实现下一代的系统发育学分析。笔者在Linux系统下用conda直接安装该软件,用“orthofinder-h”命令测试安装后的软件是否可以正常运行,利用该软件对所有物种蛋白质进行序列比对分析,参数设置为“e-valuetree”,即可获得格式为fasta或phylip的结果文件。在Windows下使用FigTree软件打开使用FastTree获得的结果文件,编辑美化系统发育树。最后,利用Bootstrap值,即自展值,
16、检验评估进化树分支是否可信。如果Bootstrap值 7 0%,则构建的发育树比较可靠;7 0%,则可信度不高。操作流程如图1 所示。检索并下载数据上传到NCBI数据库序列数据Linux系统比对、分析亲获得不同生物基安装并测试、缘关系因组单拷贝序列运行软件评估发育树绘制发育树可信度图1应用Linux系统构建发育树流程2.4结果分析展示学生构建的系统发育树,讲解系统发育树各部分代表的含义,如最基部为根节点,表明所分析生物类群具有共同的祖先,和勤奋有关系吗?人的智力有极限吗?诸多的何产生视觉的?人体是如何感知时间的?成功蛋?动物是如何感受痛觉和痒觉的?动物是如书已出版发行先有鸡还是先有偶然与必然生
17、命现象的系列丛书第2 册纷乱中的秩序2-由郑光美院士主编的生物学通报科普文选通47报学生物2023年第7 期总第58 卷即笔者分析的1 0 种真菌起源于同一祖先。最末端为叶节点,代表1 个生物类群。包含多个叶节点的分支称为进化支,支的长度可用来估计后代和祖先之间的远近(4。利用系统发育树,带领学生讨论构建出2 个发育树及物种间的亲缘关系,从而加深学生对生命进化观念的理解,培养科学探究精神和科学思维。3教学反思校本课程的开设实现了多元化教学,丰富了学生的学习生活。本次校本课程是学生第1次接触生物信息学相关知识,于学生而言较为新颖,使学生充满好奇心,吸引学生注意力的同时,也使其对生物学学习热情高涨
18、,感受到学科交叉的魅力,锻炼了学生处理信息的能力,培养了理性思维。系统发育树的构建是学生第1 次在校本课程上利用生物信息学得出的成果,既学会了生物信息学相关基础技术,又有助于他们深刻理解生物学进化相关知识,帮助学生实现从理论知识到技术实践的过渡,增强了生物学学习自信心。笔者只以蛋白质序列为例构建系统发育树,在时间充裕的情况下,教师也可带领学生利用基因组序列构建发育树,与蛋白质序列构建的发育树做比较分析,从而在高中生可接受的知识范围内观察、对比基因序列和蛋白质序列的关系。此外,本次校本课是学生第1 次真实接触和利用物种的蛋白质序列和基因组序列,在学生熟练操作之后,也可以尝试让学生以常见哺乳动物的
19、蛋白质序列和基因组序列为例构建系统发育树,培养其独立思考和自主解决问题的能力,体验科学探究的严谨性。纷乱中的秩序2生命现象的偶然与必然生物学通报科普文选系列丛书第2 册出版发行在高中生物学课堂教学中,生物信息学技术也具有很强的实用性。向学生展示fasta格式的蛋白质序列和基因组序列,可以更直观地帮助学生理解必修1 分子与细胞中“氨基酸是蛋白质的基本单位”“蛋白质结构种类繁多与氨基酸的数目和种类多样、排列顺序千变万化有关”与必修2 遗传与进化中“基因在染色体上”“遗传信息储存在碱基的排列顺序中”和“碱基排列顺序的千变万化,构成了DNA分子的多样性”等知识。必修2 第4 章第1 节“基因指导蛋白质
20、的合成”指出,对大多数生物而言,基因的表达包括转录和翻译,即遗传信息从DNA传递到RNA,最后从RNA传递到蛋白质。教师可下载一段序列,依据DNA和RNA的区别,利用生物信息学技术帮助学生判断该序列是否为DNA序列,然后将DNA序列转变为RNA序列,最后翻译成蛋白质序列。加深学生对该知识模块的理解,理论与实践相结合,培养学生生物学学科核心素养。主要参考文献1中华人民共和国教育部.普通高中生物学课程标准(2 0 1 7 年版2 0 2 0 年修订)S.北京:人民教育出版社,2 0 2 0:4 4-4 5.2Katherine S J.Review paper:The shape of phylo
21、genetictreespaceJ.Systematic Biology,2017,66(1):83.3陈铭,白有煌,邵朝纲.生物信息学 M.北京:科学出版社,2 0 1 9:2 3 2-2 4 2.4Zhou Z,Jiang Y,Wang Z,et al.Resequencing 302 wildand cultivated accessions identifies genes related todomestication and improvement in soybeanJ.NatureBiotechnology,2015,33(4):408.(E-mail:)生命现象,哪些是必然的,哪些又是偶然的?本书收录了由美国南加州大学医学院朱钦士副教授为我刊“生命探秘”栏目撰写的系列文章,以严谨科学的态度、通俗生动的语言,为我们揭开了生命科学中的种种奥秘。本书适合所有对生命科学感兴趣的读者,特别是青少年阅读。本书由科学出版社出版,读者可在当当网、京东书城等各大网络书店购买,本刊编辑部暂不售书。(本刊讯)(广告)