前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇生物信息学范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
关键词:推荐系统;生物信息学
推荐系统(RecommenderSystem)[1]是个性化信息服务的主要技术之一,它实现的是“信息找人,按需服务”;通过对用户信息需要、兴趣爱好和访问历史等的收集分析,建立用户模型,并将用户模型应用于网上信息的过滤和排序,从而为用户提供感兴趣的资源和信息。生物信息学(Bioinformatics)[2,3]是由生物学、应用数学和计算机科学相互交叉所形成的一门新型学科;其实质是利用信息科学的方法和技术来解决生物学问题。20世纪末生物信息学迅速发展,在信息的数量和质量上都极大地丰富了生物科学的数据资源,而数据资源的急剧膨胀需要寻求一种科学而有力的工具来组织它们,基于生物信息学的二次数据库[4]能比较好地规范生物数据的分类与组织,但是用户无法从大量的生物数据中寻求自己感兴趣的部分(著名的生物信息学网站NCBI(美国国立生物技术信息中心),仅仅是小孢子虫(Microsporidia)的DNA序列就达3399种),因此在生物二次数据库上建立个性化推荐系统,能使用户快速找到自己感兴趣的生物信息。特别是在当前生物信息数据量急剧增长的情况下,生物信息学推荐系统将发挥强大的优势。
1推荐系统的工作流程
应用在不同领域的推荐系统,其体系结构也不完全相同。一般而言,推荐系统的工作流程[5]如图1所示。
(1)信息获取。推荐系统工作的基础是用户信息。用户信息包括用户输入的关键词、项目的有关属性、用户对项目的文本评价或等级评价及用户的行为特征等,所有这些信息均可以作为形成推荐的依据。信息获取有两种类型[6],即显式获取(Explicit)和隐式获取(Implicit),由于用户的很多行为都能暗示用户的喜好,因此隐式获取信息的准确性比显式高一些。
(2)信息处理。信息获取阶段所获得的用户信息,一般根据推荐技术的不同对信息进行相应的处理。用户信息的存储格式中用得最多的是基于数值的矩阵格式,最常用的是用m×n维的用户—项目矩阵R来表示,矩阵中的每个元素Rij=第i个用户对第j个项目的评价,可以当做数值处理,矩阵R被称为用户—项目矩阵。
(3)个性化推荐。根据形成推荐的方法的不同可以分为三种,即基于规则的系统、基于内容过滤的系统和协同过滤系统。基于规则的推荐系统和基于内容过滤的推荐系统均只能为用户推荐过去喜欢的项目和相似的项目,并不能推荐用户潜在感兴趣的项目。而协同过滤系统能推荐出用户近邻所喜欢的项目,通过用户与近邻之间的“交流”,发现用户潜在的兴趣。因此本文所用的算法是基于协同过滤的推荐算法。
(4)推荐结果。显示的任务是把推荐算法生成的推荐显示给用户,完成对用户的推荐。目前最常用的推荐可视化方法是Top-N列表[7],按照从大到小顺序把推荐分值最高的N个事物或者最权威的N条评价以列表的形式显示给用户。
2生物信息学推荐系统的设计
综合各种推荐技术的性能与优缺点,本文构造的生物信息学推荐系统的总体结构如图2所示。
生物信息学推荐系统实现的主要功能是在用户登录生物信息学网站时,所留下的登录信息通过网站传递到推荐算法部分;推荐算法根据该用户的用户名从数据库提取出推荐列表,并返回到网站的用户界面;用户访问的记录返回到数据库,系统定时调用推荐算法,对数据库中用户访问信息的数据进行分析计算,形成推荐列表。
本系统采用基于近邻的协同过滤推荐算法,其结构可以进一步细化为如图3所示。算法分为邻居形成和推荐形成两大部分,两部分可以独立进行。这是该推荐系统有别于其他系统的优势之一。由于信息获取后的用户—项目矩阵维数较大,使得系统的可扩展性降低。本系统采用SVD矩阵降维方法,减少用户—项目矩阵的维数,在计算用户相似度时大大降低了运算的次数,提高了推荐算法的效率。
(1)信息获取。用户对项目的评价是基于用户对某一个项目(为表示简单,以下提及的项目均指网站上的生物物种)的点击次数来衡量的。当一个用户注册并填写好个人情况以后,系统会自动为该用户创建一个“信息矩阵”,该矩阵保存了所有项目的ID号以及相应的用户评价,保存的格式为:S+编号+用户评价,S用于标记项目,每个项目编号及其评价都以“S”相隔开;编号是唯一的,占5位;用户评价是用户点击该项目的次数,规定其范围是0~100,系统设定当增加到100时不再变化。这样做可防止形成矩阵时矩阵评价相差值过大而使推荐结果不准确。(2)信息处理。信息处理是将所有用户的信息矩阵转换为用户—项目矩阵,使用户信息矩阵数值化,假设系统中有M个用户和N个项目,信息处理的目的就是创建一个M×N的矩阵R,R[I][J]代表用户I对项目J的评价。
(3)矩阵处理。协同过滤技术的用户—项目矩阵的数据表述方法所带来的稀疏性严重制约了推荐效果,而且在系统较大的情况下,它既不能精确地产生推荐集,又忽视了数据之间潜在的关系,发现不了用户潜在的兴趣,而且庞大的矩阵增加了计算的复杂度,因此有必要对该矩阵的表述方式做优化,进行矩阵处理。维数简化是一种较好的方法,本文提出的算法应用单值分解(SingularValueDecomposition,SVD)技术[8],对用户—项目矩阵进行维数简化。
(4)相似度计算。得到降维以后的用户矩阵US,就可以寻找每个用户的近邻。近邻的确定是通过两个用户的相似度来度量的。本文采用Pearson相关度因子[9]求相似度。(5)计算用户邻居。该方法有两种[10],即基于中心的邻居(Center-BasedNeighbor)和集合邻居(AggregateNeighbor)。本系统采用了第一种方法,直接找出与用户相似度最高的前N个用户作为邻居,邻居个数N由系统设定,比如规定N=5。
(6)推荐形成。推荐形成的前提是把当前用户的邻居ID号及其与当前用户的相似度保存到数据库中,而在前面的工作中已找出各用户的邻居以及与用户的相似度,推荐形成部分只需要对当前登录用户进行计算。推荐策略是:对当前用户已经访问过的项目不再进行推荐,推荐的范围是用户没有访问的项目,其目的是推荐用户潜在感兴趣的项目;考虑到系统的项目比较多,用户交互项目的数量很大,所以只筛选出推荐度最大的N个项目,形成Top-N推荐集,设定N=5。
3生物信息学推荐系统的实现
生物信息学推荐系统的实现可以用图4来表示。数据库部分主要存储用户信息和项目信息,用SQLServer2000实现。
数据访问层实现了与用户交互必需的存储过程以及触发器,也使用SQLServer2000,主要完成以下功能:初始化新用户信息矩阵;插入新项目时更新所有用户的信息矩阵;用户点击项目时更新该用户对项目的评价;删除项目时更新所有用户的信息矩阵。用户访问层主要涉及网页与用户的交互和调用数据访问层的存储过程,在这里不做详细的介绍。
推荐算法完成整个个性化推荐的任务,用Java实现。
(1)数据连接类DataCon。该类完成与SQLServer2000数据库的连接,在连接之前必须要下载三个与SQLServer连接相关的包,即msutil.jar、msbase.jar和mssqlserver.jar。
(2)数据操作类DataControl。该类负责推荐算法与数据库的数据交换,静态成员Con调用DataCon.getcon()获得数据库连接,然后对数据库进行各种操作。把所有方法编写成静态,便于推荐算法中不创建对象就可以直接调用。
(3)RecmmendSource与CurrentUserNeighbor。这两个类作为FCRecommand类的内部类,RecmmendSource用于保存当前用户的推荐列表,包括推荐项目号和推荐度;CurrentUserNeighbor用于保存邻居信息,包括邻居ID号、相似度及其访问信息。
(4)协同过滤推荐算法FCRecommand。该类实现了整个推荐算法,主要分为邻居形成方法FCArithmetic和推荐形成方法GenerateRecommend。
下面给出方法FCArithmetic的关键代码:
Matrixuser_item=this.User_Item_Arry();//获取用户—项目矩阵
user_item=this.SVD_Calculate(user_item);//调用SVD降维方法
Vectorc_uservector=newVector();//当前用户向量
Vectoro_uservector=newVector();//其他用户向量
Vectorc_user_correlate_vector=newVector();
//当前用户与其他用户之间相似度向量
for(inti=0;ifor(intj=0;jc_uservector.addElement(user_item.get(i,j));
//1.获得当前用户向量
for(intk=0;ko_uservector.clear();
for(intl=0;lo_uservector.addElement(user_item.get(k,l));
//2.获得其他用户的向量
//3.计算当前用户与其他用户的相似度
usercorrelativity=this.Correlativity(c_uservector,o_uservector);
c_user_correlate_vector.addElement(usercorrelativity);
}
//4.根据当前用户与其他用户的相似度,计算其邻居
this.FindUserNeighbor(i,c_user_correlate_vector);
}
根据邻居形成方法FCArithmetic,可以得到每个用户的邻居。作为测试用例,图6显示用户Jack与系统中一部分用户的相似度,可以看出它与自己的相似度必定最高;并且它与用户Sugx访问了相同的项目,它们之间的相似度也为1,具有极高的相似度。
4结束语
在传统推荐系统的基础上,结合当前生物信息学网站的特点,提出一个基于生物信息平台的推荐系统,解决了传统生物信息网站平台信息迷茫的缺点,为用户推荐其感兴趣物种的DNA或蛋白质序列。
优点在于协同过滤的推荐算法能发现用户潜在的兴趣,能促进生物学家之间的交流;推荐算法的邻居形成与推荐形成两部分可以单独运行,减少了系统的开销。进一步的工作是分析生物数据的特点及生物数据之间的关系,增加用户和项目数量,更好地发挥推荐系统的优势。
参考文献:
[1]PAULR,HALRV.Recommendersystems[J].CommunicationsoftheACM,1997,40(3):56-58.
[2]陈新.生物信息学简介[EB/OL].(2001).166.111.68.168/bioinfo/papers/Chen_Xin.pdf.
[3]林毅申,林丕源.基于WebServices的生物信息解决方案[J].计算机应用研究,2005,22(6):157-158,164.[4]邢仲璟,林丕源,林毅申.基于Bioperl的生物二次数据库建立及应用[J].计算机系统应用,2004(11):58-60.
[5]AIRIAS,TAKAHISAA,HIROYAI,etal.Personalizationsystembasedondynamiclearning:InternationalSemanticWebConference[C].Sardinia:[s.n.],2002.
[6]BREESEJS,HECKERMAND,KADIEC.Empericalanalysisofpredictivealgorithmsforcollaborativefiltering:proceedingsoftheFourteenthConferenceonUniversityinArtificialIntelligence[C].Madison:WI,1998:43-52.
[7]SCHAFERJB,KONSTANJ,RIEDLJ.Recommendersystemsine-commerce:proceedingoftheACMConferenceonElectronicCommerce[C].Pittsburgh:PA,1999:158-166.
[8]PRYORMH.Theeffectsofsingularvaluedecompositiononcollaborativefiltering[EB/OL].(1998).cs.dartmouth.edu/reports/TR98-338.pdf.
关键词:生物信息学;教材;师范院校
20世纪80年代末以来,生物信息学以惊人的发展速度,获得了很多突破性成就,正日益成为生命科学在21世纪发展的核心内容。对于未来生物科学中坚力量的现代生物科学工作者而言,掌握生物信息学的相关知识尤为重要。
作为一门新兴的课程,生物信息学课程在全国很多高等院校都已经开设,并进行了一些卓有成效的探索和改革。我们结合自身的教学实践和相关学校的教学现状,对师范院校生物信息学课程教学内容、师资力量、教学模式和方法、跨学科合作、教学实践实施情况等方面的现状进行了积极分析和思考。目前,师范院校生物信息学教学的现状如下。
一、教学内容陈旧、教学资源缺乏
生物信息学是一门新兴的学科,在高等院校开设时间较晚,我国对生物信息学专业精品课程的建设方面投入不够,成熟的生物信息学教学大纲、教案、多媒体课件、教学视频和习题等教学资源稀少。目前,市场上也缺乏相关的生物信息学教学多媒体课件和音像制品辅导材料等相关产品,造成生物信息学教学资源匮乏的现状。
目前师范院校所用教材大多数是徐程主编的《生物信息与数据处理》,蒋彦等编著的《基础生物信息学及应用》等几种不同版本的教材。这些教材在知识性、科学性和系统性方面还行,但是在教学内容的新颖性、时效性和实践性以及生物相关背景的介绍和对师范院校的适用性等方面有所欠缺。生物信息学的知识日新月异,新的数据库、新的软件、新的算法层出不穷,而生物信息学的课堂往往不能及时地将最新进展呈现给学生,导致课堂内容陈旧,不利于学生的发展和对生物信息知识的合理掌握,从而影响了生物信息学教学的质量。
二、师资力量缺乏
生物信息学是一门新兴的交叉学科,需要熟练掌握计算机与生物学知识的老师来授课。然而,实际上,由于缺少生物信息学的专业教师,教授该学科的教师多为生物学其他课程兼任,这些老师往往缺乏专门的生物信息学训练,在知识的传授和应用方面存在欠缺。与生物信息学教学要求存在着较大的差距,不能很好地满足教学大纲的要求。另外,师范院校通常将生物信息学作为选修课来开设,该课程在专业建设和人才培养方案中的地位偏低,造成相关部门对师资培养不够重视。
三、教学模式和方法落后
由于生物信息学课程涉及大量的数据库和软件知识,教师普遍采用多媒体教学。而多媒体课件的容量通常很大,学生忙于笔记,难以把握重难点。同时,幻灯片展示的知识点犹如放电影一般一闪而过,学生没有足够的时间思考和消化,跟不上教师的进度。教师进行多媒体教学时,往往是一堂课上从头讲到尾,语调缺乏抑扬顿挫,没有起伏,学生很容易昏昏欲睡。因此,教师虽然使用的是先进的教学工具,采用模式的却是传统的灌输式教学,只管埋头照本宣科,不管学生接收领悟多少。学生为了达到期末考试标准,只顾死记硬背,这样的教育让学生失去创新精神和主动思考的能力,失去对生物信息课程的兴趣。
四、缺乏与相关学科的合作交流
生物信息学实际上是生物学与计算机科学的交叉学科。然而一般高校往往只在生命科学学院开设生物信息学,由生物学老师来担任授课老师。由于对计算机科学知识的缺乏,导致生物专业教师对生物信息学课程很难深入开展;另一方面,计算机科学专业由于没有开设生物信息学课程,使学生不能了解到生物信息学的重要性,以及如何使计算机科学更快更好地发挥其在生物信息学中的作用。总的来说,生物信息学课程的建设欠缺相关学科的协作,不能有效地整合资源,不利于培养复合型人才。
五、缺乏实践教学内容
现有的生物信息学课程也有一些实践内容,但实践课时数少,内容相对简单,缺乏系统完善的实践过程。教师为学生讲授具体知识时,通常只通过多媒体课件演示操作,并没有为学生设置具体的动手操作步骤。使得学生对信息反馈迟钝,印象不深刻,不容易掌握方法。生物信息学实践教学并不需要价格昂贵的实验设备,只需要一网的电脑和一些相关的分析软件便可以进行实验。然而,目前的状况是,生物信息学课程中真正开展实践性教学的内容少之又少。
生物信息学的学习是一个长期积累的过程,教学水平的提高也需要在大量的教学实践中不断总结和完善。我们通过分析发现,在师范院校生物信息学教学中仍存在很多问题,其原因是多方面的,需要教学工作者进一步深入探讨并提出切实可行的策略。
参考文献:
[1]汤丽华.浅谈大学本科生物信息学课程建设与教学[J].科技
信息,2010(1).
[2]贾小平,孔祥生.生物信息学实践教学初探[J].陕西教育,
2010(3).
[3]军.农学专业生物信息学课程教学改革探析[J].现代农
业科技,2010(5).
[4]郝新保.充分利用网络资源开展生物信息学教育[J].中国医
关键词:生物信息学;考试;网络
生物信息学(Bioinformatics)是建立在分子生物学的基础上,随着20世纪90年代人类基因组计划的实施以及高通量自动化测序技术的应用而诞生的。生物信息学是以DNA和蛋白质序列等数据为核心,综合运用高等数学、计算机科学和生物学工具,通过数据库的建立、生物学数据的检索、生物学数据的处理、生物学数据的利用(计算生物学)等,以达到诠释数据中的生物学意义的目的。目前生物信息学的主要的研究方向有:序列比对、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及建立进化模型等。[1,2]生物信息学作为一门新型交叉学科,我国很多高校先后在生物科学、生物技术和基础医学等专业开设了生物信息学课程。此外,北京大学、清华大学和浙江大学等部分高校还在高校招生中增设了生物信息学专业。按照教学规律,生物信息学是在学生掌握生物化学、遗传学、分子生物学以及计算机应用等相关知识的基础上开设的。通过生物信息学课程的学习,不仅可以加深对分子生物学和基因工程等课程的理解,而且可以为进一步学习基因组学(Genomics)和蛋白质组学(Protemics)奠定基础。[3]我校在国内较早地涉足该课程的教学工作,笔者于2007年开始在生物技术和生物科学专业本科生中开设了生物信息学课程,其中生物技术专业作为必修课程,生物科学专业列为选修课程。对本科生而言,通过该课程的学习,要求获得如下生物信息学的知识和技能:(1)熟练掌握和使用生物信息学中的相关数据库,包括DNA序列数据库、蛋白质序列和结构数据库、已测定全序列的动植物和微生物的完整基因组数据库以及国内外文献数据库。(2)熟练掌握DNA和蛋白质序列的同源性比较和分析。(3)能分析DNA序列转录翻译成氨基酸序列的结构和功能。(4)熟练掌握生物信息学常用的分析软件。实际操作能力是生物信息学教学过程中需要重点培养的能力。另一方面,考试是对学生知识和能力的一种测量,它的功能是量化学生的知识和能力,以及通过考试促进学生的知识和能力的增长提高。考试是教学过程中的一个重要的环节,是检查学生对所学知识的掌握程度、应用所学知识的综合能力及衡量教师教学效果的主要形式,它可以督促学生全面系统地复习和巩固所学的知识和技能,是评定学生成绩的有效手段。科学、合理的考试,可以使学生明了学习的差距,自动调节学习方向,充分发挥学生学习的主观能动性,教师亦可通过考试了解教学效果,调节和改进教学内容和教学方法,充分发挥考试的导向作用,提高教学质量。[4,5]
一、常规考试方法在生物信息学课程考试中存在的问题
常规传统的考试方式是每位学生使用同一份完全同的试卷,在同一时间中进行考试。对于生物信息学课程来说,由于其课程的特点所限,在考试整个过程中,为了完成试卷中操作题的解答,需要使用联网的计算机,因此,生物信息学课程常规的考试方式是每位学生发给考题完全相同的纸质试卷,学生将答案写在纸质的考卷上,其中操作题利用联网的计算机完成操作后将答案写在纸质的试卷上。我们自2007年开始经过5年的教学实践发现,常规传统的考试方法存在一些亟待解决的问题。由于参加考试的每位学生是同一份完全相同的试卷,同时考试过程中必须使用联网的计算机,根据考试结果中出现少量完全雷同的卷面显示,虽然考试过程中有监考教师的严格监督和巡查,依然有少量的学生通过计算机联网的及时在线信息系统,如:QQ、MSN、e-mail等,相互传递试题的答案并进行比对,因此,在客观上难以彻底杜绝考试作弊现象。鉴于这种情况,迫切需要探索一种新的考试方式,克服传统考试方式的局限性,以适应生物信息学课程的特点和需要,达到更加客观、科学、公正地评价学生考试和课程成绩的目的。
二、新的考试方法的探索——网络考试系统的构建
为解决上述生物信息学课程考试中出现的问题,笔者构建了生物信息学网络考试系统,以便替代传统的考试方法(图1)。本考试系统具有以下特点:
第一,建立较大容量的试题库。试题库中题型包括选择题、判断题、简答题和操作题等四种题型,分别含有500、100、50和50道题。每套完整的试题满分为100分,其中设置为选择题50分(每题1分,共50小题)、判断题10分(每题1分,共10题)、简答题20分(每题5分,共4题)、操作题20分(每小题10分,共2题),每套试卷也可以根据考试需要重新设置每种题型的分值和题目数量。试题库题目主要以《基础生物信息学及其应用》和《简明生物信息学》等教材为依据。[6,7]题库中的题目考核内容涵盖教材的所有章节和主要知识点,其中的操作题目覆盖课程的重点教学内容。
第二,自动随机组卷。随机组题方式设置2种,一是全体参加考试的学生试卷中所有试题都相同,但每道题目的题号前后顺序有别;二是每位学生的试卷中不仅试题的题号顺序不同,而且试题也不完全相同。两种组题方式各有利弊,前者能保证每位学生的试卷难度系数完全相同,但只是学生的试卷中试题的顺序不同,题目依然还是相同的;后者则能保证彻底杜绝参加考试的学生通过互联网比对试题答案的可能,但由于每位学生的试题不同,因此可能导致不同的学生之间的试题难度系数存在一定的差异。两种不同的组题方式还有待在今后的教学实践中进行比较和科学选择。
第三,自动阅卷和人工阅卷方式相结合。阅卷方式中设置客观试题(包括选择题和判断题)自动阅卷和自动评分,主观题(包括简答题和操作题)采用在计算机上人工阅卷。同时也留有全部设置为人工阅卷的后台操作系统。
第四,考试时间设置倒计时。可以按照学校的考试时间安排,设置固定时长的考试时间,考试开始后设置的固定时长开始倒计时,到点后自动保存试卷和答案并关闭考试系统。参加考试的学生也可以点击按钮保存试卷和答案提前交卷。此外,考试系统主界面还设置了课程的一些相关信息(如授课教师、学校名称、课程简介等),并设置将来将考试系统转入网络课程一部分的链接,为将来进一步改进和发展该考试系统提供了窗口。
科学、合理、公正的考试,对课程教学可以起积极促进作用,激发学生学习的积极性,培养学生的创新能力,有利于学生个性的发展;反之,则不仅不利于教学,而且会挫伤学生学习的积极性和自尊心,阻碍学生创造力和个性的发展。笔者构建的网络自动组题的生物信息学考试系统能较好地实现生物信息学课程的客观公正的考试,在客观上彻底杜绝考试作弊现象的发生,达到科学检测学生对生物信息学课程基础知识和操作能力掌握的情况,客观公正地评价学生的考试成绩和课程成绩。
参考文献:
[1]戴凌燕,姜述君,高亚梅.《生物信息学》课程教学方法探索与实践[J].生物信息学,2009,7(4):311-313,319.
[2]张纪阳,刘伟,谢红卫.生物信息学课程研究性教学的实践与思考[J].高等教育研究学报,2011,34(4):51-53,57.
[3]向太和.我国现有《生物信息学》教材和网络资源的分析[J].杭州师范学院学报(自然科学版),2006,5(6):495-498.
[4]赵晴.考试方法改革的研究与实践[J].中山大学学报论丛,2001,21(1):144-146.
[5]高艳阳,张峰.高校考试方法改革研究综述[J].理工高教研究,2003,22(6):100-101.
[6]蒋彦,王小行,曹毅,等.基础生物信息学及其应用[M].北京:清华大学出版社,2003.
[7]钟扬,张亮,赵琼.简明生物信息学[M].北京:高等教育出版社,2001.
生物信息学教学模式探索任务引领生物信息学是用数理和信息科学的观点、理论和方法研究生命现象、组织和分析呈现指数增长的生物医学数据的一门学科,它是生物医学、数学、信息科学以及计算机科学等诸多学科的崭新交叉学科。生物信息学几乎是今后所有生物(医药)研究开发所必需的工具。
21世纪是生物科学的世纪。近年,我国生物技术公司对生物信息学人员的相关需求也迅速增加,浙江理工大学生命科学学院生物技术专业在进行了行业调研并进行专业课程体系构建研究后,于2006年定位和开设了生物信息学课程。该门课程经过8年多的建设后,对教学团队的建设、课程目标的设定、教学内容及教学教法的选择等方面进行了卓有成效的探索,这些探索所形成的结论,可为即将开设或正在进行该课程教学改革的学校提供可借鉴的经验。
一、生物信息学的课程特点
诺贝尔奖获得者W.Gilbert1991年提出了这样一个观点:传统生物学解决问题的方式是实验的,而现在,基于全部基因都将知晓,并以电子可操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的,是一个科学家先从理论推测出发设定研究目标,然后再回到实验中去追踪或验证这些理论假设。而生物信息学研究正是从英特网上源源不断地采集数据,进行分析、归类与重组,发现新线索、新现象和新规律,用以指导实验工作设计,是一条既快又省的研究路线。它对于找寻一个研究项目的突破口是非常重要的,选定合适的研究出发点,可避免许多不必要的重复,最大程度节约研究资源,使研究成果最大化。鉴于该门技术对生物科学的理论、实践要求以及对信息技术掌握的要求,生物信息学课程与其他课程的教学有很大不同。
1.在课程目标定位中,提高学生对相关网络资源的使用能力是该门课程的重要目标之一。学生必需使用强大的搜索功能实现数据储存、检索和分析,学校在教学资源配置上必需向此倾斜。
2.该门课程学科交叉性强,所涉及的生物及计算机等学科的相关知识更新都很快,导致其理论和实践内容不断推陈出新,这使得在教学内容选择上要紧跟这些更新,不断进行调整。
3.课程教学实践性强,同时涉及生物技术专业实践和计算机应用技术的实践,这需要教师在授课过程中根据学生的学习规律合理安排实践项目,发挥好这两种技术的协同作用。
二、生物信息学课程教学模式探索
1.教学目标与其所培养学生的核心技能
合理的课程目标与定位是决定课程建设成败和教学效果的基础,其主要依据是人才培养需求与授课对象的实际情况。经过对该门课程教学对象的研究发现,在生物专业课程体系下培养的本科生,其前导课程主要集中在生物领域,通常没有系统的学习过计算机、信息技术、编程等知识。对信息检索、模型建立、软件的识别及应用的能力相当薄弱。因此,本门课程将提高学生的信息技术能力也作为一个重要的课程目标。学生在本门课程中将学习与生物技术相关的各种数据库和软件的使用。当然,对学生信息技术能力的要求也定位在能使用、会使用就行,不需要将学生掌握生物数据库构建和软件开发作为课程教学的目标。
在课程目标的设定过程中,应牢记高校对文化的传承的功能,要使学生了解生物信息学发展的历程。在生物信息学学科发展过程中所涌现出来的著名学者,众所周知的震撼人心、启迪心灵的奇闻秩事,能使学生对这门课程产生浓厚的兴趣,甚至更深刻地领会这门课程的含义。
熟练掌握生物数据库的检索和使用是生物信息学课程教学的首要目标。到目前为止,生物学数据库总数已达500个以上,在DNA序列方面有GenBank、EMBL和DDBJ等;在蛋白质一级结构方面有UniProt、SWISS-PROT、PIR和MIPS等;在蛋白质和其他生物大分子的结构方面有PDB等;在蛋白质结构分类方面有SCOP和CATH等。各数据库均通过Internet提供多种形式的数据检索服务。例如,NCBI-GenBank数据库就提供Retrieve(Email),Entrez(Web集成信息检索)及Query(Email集成检索)等多种方式的检索服务。这类检索服务是生物数据库所能提供的多种服务中最基本的信息共享和应用服务,也是生物专业学生和科研工作者经常使用的。在教学过程中需通过设计检索任务来完成对这些数据库使用方法的学习,如通过生物数据库检索家蚕profilin基因的相关信息。
增强学生使用生物信息处理软件的能力,是生物信息学课程教学的重要目标。在世界各地,科学家每天都要通过序列比对软件进行成千上万次的序列比对。学生需要通过课程的学习熟练掌握各种生物信息处理软件,有时还有必要进行一些简单程序的设计,进而掌握发现新线索、查找新规律的工具。例如,目前,借助于生物信息手段的蛋白质预测是提供蛋白质结构及功能信息的重要方法,对这种预测方法的学习将使学生更多更快地了解蛋白质的信息,加深对生物技术科学的理解和运用。除了生物数据库和生物软件使用学习外,还要着重体现生物学文献调研和阅读、论文撰写等基本能力的训练,如EndNote文献管理软件的使用。
2.教学内容选择和教学顺序的组织
生物信息学的课程教学内容的选择,要紧随生物信息学的发展方向,涵盖最前沿知识和最先进技术领域。与此同时,教学内容的选择还应充分考虑学生基础和对该门课程的需求。生物信息学选课学生通常有两类,一类是具有较为扎实的生物学基础的学生,他们学习目的非常明确,其学习重点在于提高对生物信息实验所得结果的分析解释和验证能力。另一类是生物学基础相对较弱的学生,这些学生主要是为了了解生物信息学发展前沿、掌握检索能力以及初步的分析技能,对分析、处理、预测结果的验证涉及不多。无论哪种学生,都比较欠缺信息技术方面的知识,因此,这类知识在前面部分介绍。而后面部分则随学生的类型有所改变,我们根据授课学生的分类选择不同的授课内容和授课重点,尝试据此来划分教学组织的各个阶段,在每个教学节点精心设置任务(如表1所示)。
与其他课程的教学一样,生物信息学课程的教学需遵守学生对知识的掌握规律,其内容的选择与安排应按照循序渐进的原则。从第一阶段到第二阶段,教学内容“由易到难”。随着教学过程的深入,课程内容更侧重于对生物信息学某一专业领域的引导,此时授课教师的指导更加重要,这类领域往往与开课院系专业的优势研究领域和导师研究方向相结合。
3.课程教学方法的改革
生物信息学是一门涉及知识面深刻而广泛,学生独立自学的难度很大的交叉科学。依据建构主义教学理论的特点,这类难度大、技术性和实践性强的课程要特别重视以学生为教学主体的教学方法,应尝试从任务引领入手,将生物信息学的一些重要学习内容逐步展现出来。
在生物信息学教学中,教学内容侧重于任务引领,设定与学生生活相贴近的、接合学科发展前沿的引领任务。例如,可以从高水平杂志(Nature、Science)上根据任务引领的关键词搜索综述,根据综述总结出该任务发展脉络,提炼教学任务,将较为抽象的计算机算法、生物学基础知识融于任务中,使学生有积极参与的意愿。及时将任务相关工具提供给学生,或是提前引导学生自己查询工具,使学生有完成任务的基础。
学生在每个节点都非常清晰地知道下个节点的主题,并在完成教师的任务过程中,构建局部知识框架,形成自己的见解。教师需在课堂上和课堂以外及时掌握学生对各个节点知识的掌握情况,找到学生的最近发展区,针对重点、难点解惑,提高教学效果。这样可以使选择的教学任务吸引学生、引领学科前沿,还能在教学过程与学生的互动中有效地实现教学相长。
4.重视切合课程设计的教材编写
生物信息学不同于其他学科,其很多内容和知识节点更新很快,很多最新成果必须教师根据生物信息学发展前沿及时整理和总结,其教学内容设置着重于保证教学内容的先进性和前沿性。教材的更新和修订周期较短,几乎每学期均需要重新修订。
2001年,教育部在[2001]4号文件中明确要求直属高校的“本科教育要创造条件使用英语等外语进行公共课和专业课教学”,在信息技术、生物科学、管理、金融、法律等专业力争在3年内使外语讲授的课程达到所开课程的5%~10%,尤其强调了生物科学更要先行一步。现实情况也使英文自编教材的编写刻不容缓,现在,绝大部分前沿生物数据信息(最主要的核酸和蛋白质)数据库均为全英文操作界面,操作者只有熟练掌握生物信息学英文术语才能自如地使用该系统,才能更有效的进行生物信息学的学习和研究工作。在英文自编教材编写时,理论部分的参考书我们精心应选定了具有非常严谨理论体系和反应了最前沿生物信息技术的《BIOINFORMATICS:Databases,Tools, and Algorithms》。编写时需要特别注意应依据教学设计来设定来序化任务,突出不同教学阶段的教学重点,使学生学习过程是个循序渐进的过程。我校采用的自编教材根据教学阶段共设置五个引领任务:
(1)Pubmed检索profilin基因研究进展;
(2)家蚕profilin基因结构分析与PCR扩增引物的设计;
(3)家蚕profilin基因同源序列的获取与进化树的构建;
(4)家蚕profilin蛋白二级和三级结构的模拟;
(5)家蚕profilin蛋白理化性质和功能位点的分析.
5.合理配置网络资源和多媒体教学资源
首先,学会利用互联网、计算机、数据库和应用软件进行生物信息分析的基本方法和技能本身就是生物信息学教学重点。以往普通的多媒体教室已难以提供一个交互式的网络化、信息化的教学环境,如果想上好生物信息学这门课程,网络资源和多媒体教学资源的应用,将贯穿于整个生物信息学课程(从任务下发及申领、任务控制及执行、任务完成结果检验与反馈)的整个教与学的过程。而我们通过极域电子教室和学校4A网络教学平台结合,较好的实现了生物信息学交互式的网络化、信息化的教学环境。
课前,教师通过网络平台将任务教学内容、任务序列、工具等传递给学生,学生通过登陆互联网络,利用网络资源和软件尝试完成预习任务。此处可以设置学情反馈点,教师通过网络论坛等形式掌握学生预习情况。授课过程中,教师利用教师机客户端的文件分发系统将任务教学内容、任务序列、工具等发送到学生桌面,再通过广播教学多媒体技术为学生形象的讲解任务内容以及完成方法。每位学生在教师的监督下在互联网上执行任务。教师在监控学生完成任务过程中,不断的得到学生任务进程的反馈,对于任务中学生出现共性问题,利用网络、广播教学或演示等形式及时解决。课下,学生同样可通过学校4A网络教学平台将任务报告、作业、问题和意见等反馈给教师,教师在平台上批改任务报告后将成绩和评语发送给学生,让学生及时了解自己的学习情况,师生还可以通过平台中的网络论坛进行问题讨论等。网络环境下的生物信息学任务引领式教学,不仅能提高学生的学习兴趣,还能创造更为有效的师生互动信息教学环境。
三、结束语
经过多年的生物信息学教学实践发现,如果想建设好生物信息学课程,我们需要设定非常清晰的教学目标,理清课程需要培养学生的核心技能;结合行业发展的技术前沿精心选择教学内容,合理序化教学顺序;要依据建构教学理论,重视以学生为教学主体的教学方法,尝试从任务引领入手引领学生学习,提高学生的学习兴趣;要重视切合课程设计的教材编写,理论部分引自精选英文参考书,设计教材结构应切合任务引领的教学方法;合理配置网络资源和多媒体教学资源,加强学生互动,为成功地实现“反转课堂”提供保障。
参考文献:
[1]张林,柴惠.现代教学手段在生物信息学教学中的应用[J].新课程研究,2011,219(4):156-158.
[2]柴惠,赵虹,张婷.高等院校生物信息学双语教学课程建设之我见[J].中国高等医学教育,2010,(4):83-84.
[3]Gilbert,W.Towards a paradigm shift in biology[J].Nature,1991,(349):99.
[4]刘伟,张纪阳.“生物信息学”课程中研讨式教学实践[J].中国电力教育,2012,(23):60-61.
[5]范丙友,贾小平,胥华伟.生物信息学课程教学改革与探索[J].大学教育,2013,(16):61-62.
关键词:生物信息学;生物技术;教学改革
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2014)36-0197-03
一、生物信息学课程的教学背景
生物信息学(Bioinformafics)是一门集数学、计算机科学以及生物学等多学科交叉而形成的新兴热点学科,实质就是利用信息科学与技术解决生物学问题。它的内涵目前包含了分子生物大数据的获取、加工、存储、分配、分析、解释等在内的所有方面。依据分子生物大数据的类型不同,生物信息学的数据对象分布在基因组、转录组、蛋白质组等不同水平层次的数据以及跨层次的转录调控、转录后调控和表观遗传修饰等纵向连接。依据学科任务的不同,生物信息学一方面要组织好生物大数据的储存和获取,一方面要开发优良的算法和工具软件对生物大数据教学分析,同时还要利用这些生物大数据和工具来产生新的生物学认识,为下游的湿实验生物学家提供理论依据和指导。近年来,随着高通量生物大数据检测技术,如基因芯片技术、高通量测序技术等的发展,生物信息学已经在生物、医学、药物开发、环境保护以及农业应用等众多领域普及推广了起来。大量的生物数据急迫地需要处理,相应地产生了对生物信息专门人才的广泛需求。
因此,《生物信息学》课程也快速地在各院校大学生教学中开展了起来,甚至在局部高校产生了生物信息学本科专业。然而在实际的教学中也伴随着种种问题,影响了该课程的教学效果。本文现就近年来在生物背景的学生中所开展的生物信息学的教学实践浅谈一点体会,对其存在的问题和对策作一论述。
二、生物信息学课程教学改革
(一)教学内容特点
生物信息学属于多学科交叉学科,需要在分子生物学、遗传学、高等数学以及计算机编程等的课程基础上进行讲授。不同学科基础以及不同来源的生物数据反映在教学内容上,生物信息学的一个特点就是信息量大。它囊括了概率统计、计算机语言、人工智能和机器学习、生物数据库介绍、序列比对、分子进化分析、基因组序列分析、基因注释与功能分类、基因表达谱分析、蛋白质表达与结构分析、生物分子网络以及计算表观遗传学等众多的内容模块。
从历史发展角度看,这些内容以基因组测序为主体,生物信息学的发展可以划分为3个阶段:前基因组时代、基因组时代以及后基因组时代(又称为功能基因组时代)。以人类基因组计划的完成为时间节点标记,目前的生物信息学已经进入到了功能基因组学时代。因此,体现在当前的生物信息学教学内容上的另外一个特点就是“新”。
(二)教材的选择
生物信息学教学内容的以上特征要求在教材的选择上更需要全面衡量考虑。由于对生物信息学知识的大量需求,目前教材市场上的相关书籍也琳琅满目,选择余地较大。我们推荐的教材是科学出版社2010年第二版的Instant Notes Bioinformatics,由T. Charlie Hodgman等人编写[1]。这本书的教学内容以基因组的生物信息学分析为主体,兼顾概率统计、机器学习、代谢组学等数理基础知识和后续功能基因组分析。其中尤以序列比对、打分矩阵、系统发育树的构建分析为核心内容。这种课程设置把庞大的生物信息学体系缩小集中在了序列分析部分,这样既便于学生系统充分地掌握生物信息学知识,又兼顾了学科的发展基础和趋势。
另外,本教材为英文教材,这适应了生物信息学快速发展的要求,让学生近距离地体验到学科前沿气息。为了扩大学生的知识渠道来源,我在教学中推荐了几种不同类型的参考书籍。其中,David W. Mount编写的《Bioinformatics Sequence and Genome Analysis》和本校陶士珩教授主编的《生物信息学》,在教学内容以及体系上均和本教材较为相近[2,3]。乔纳森.佩夫斯纳著,孙之荣主译的《生物信息学与功能基因组学》则更侧重功能基因组学的内容[4]。李霞主编的《生物信息学》在内容全面、丰富的同时,也较为侧重功能基因组学的内容,同时还强调在医药卫生领域的应用和研究热点[5]。
该书使用了彩印版,同时伴有光盘、习题集以及参考答案,目前在教材市场上较为受欢迎。最后,考虑到生物学背景的学生在计算机实际动手能力方面相对较为弱势,我在教学中还特别推荐了几本结合生物信息学与编程语言的书籍供同学们课后学习。这些教材包括:A.基于Perl语言的《Beginning Perl for Bioinformatics》、《Mastering Perl for Bioinformatics》;B.基于R语言的《R Programming for Bioinformatics》;C.基于Python语言的《Bioinformatics Programming Using Python》[6-9]。
(三)学时和考核方式的设定
生物信息学课程尽管面临学科发展的迫切需要,教学内容广泛而众多,但由于大学本科生的学时学分限制,目前我们的相关教学仅包括32学时的理论学时以及两周的生物信息学实习。为了弥补学时不足的限制,我们更突出强调了实际表现的考核方式。考核成绩中的平时成绩由30%上升到40%,包括平时表现、随堂测验以及课后作业等。
(四)存在的主要问题与解决办法
1.激发兴趣。由于所教授的学生为生物学背景,不少学生均对数学、计算机等数理课程较为恐惧,缺乏学习兴趣和韧性。这是本课程讲授过程中所面临的第一大问题。为此,我尝试了多种教学办法进行解决,取得了一定的效果。
(1)去除学生的恐惧心理。从心理学上讲,恐惧的形成源于过去失败经历的阴影以及对于未知事物的不确定性。因此,我在教学中注意突出生物学在生物信息学中的重要地位,以生物信息学领域的成功科学家为例,破除以往失败经历的阴影。同时,适当地浓缩教学内容,降低学生对未知事物不确定性的恐惧。
(2)激发学习生物信息学的热情。通过教学的互动,让学生在互动中消除对生物信息学的陌生感,熟悉生物信息学,激起学习的欲望。
(3)在学习中感受生物信息学发展的脉搏。通过介绍生物信息学的发展史,对比历史上类似的科学发展历程,让学生深刻地领悟到当前的生物信息学在学科史中的定位。
(4)在实践中感受生物信息学的魅力。比如,在进行系统发育树构建的讲授中,同学们可以看到由于数学算法的使用,原本枯燥无味的序列数据居然能够反映物种和基因的进化历程。通过教学中的改革实践,同学们的学习兴趣有了较大的提升。
2.夯实基础。生物学背景的学生另外一个特点是数理基础和计算机语言编程能力相对较为薄弱。在教学过程中,我首先注意引导学生扬长避短,充分发挥学生在生物学理解能力上的优势,避免进入基础性的数学算法纠缠中。同时,让学生认识到,作为一个交叉性的学科,生物信息学的上下游学科链较长,同学们可以根据自身条件选择进入不同的环节。比如,擅长基础性的算法工具软件开发的同学可以进入上游的理论环节,擅长生物学理解的同学可以使用这些工具进入下游的生物信息应用领域。第三,在课程设置上,着重加强生物信息学方向的数理基础课程,比如生物统计、Linux以及Perl语言等,改善生物技术专业的学生在生物信息学方向的薄弱环节。最后,向同学们强调,注意在学习的过程中提高学习能力才是根本。让同学们意识到,基础不是问题,只要提高了学习能力,持之以恒地去实践,均能学好本门课程。
3.紧跟前沿。生物信息学是一门前沿性很强的学科。为了既能提高学生的知识水平,又提高学生的学习能力,这就要求在教学中既要恰当地剪裁知识结构和体系,又要有提供充分的学习锻炼空间。为此,我们将课程设置为双语课程,这样做的好处是既不耽误知识的学习,又能适当地提高学生的适应能力,为学生在将来英文环境较普遍的生物信息学领域中的学习研究应用打下扎实基础。同时,为了更适应将来学生对生物信息的使用环境,同时也为了降低难度,我们的双语课程更侧重阅读、理解能力的提高,以避免简化为英语学习课,和普通的英文课程内容的重叠。另外,前沿性很强的生物信息学处处蕴藏着创新的机会,在教学过程中,我注意鼓励学生的创新意识。比如,学生在上课过程中的一些小想法,我鼓励其大胆投入,形成研究性论文。
4.注重实践性。生物信息学在教学中既要注重对学生思维方式的转变的教育,形成用生物信息学去看待生物大数据的思想,而不仅仅是解决某个具体生物学问题的“小工具”,又要求学生在课程学习中具备一定的实践能力。由于长久以来的教育体制和学习习惯的制约,同学们的学习重点仍然集中在知识的记忆、考试的应付上面,缺乏对实际动手能力的正确认识。这给生物信息学这门课程的教学,特别是实践教学带来了较大的压力。为此,我在教学中着重采用身边的典型案例教学法进行教学。比如,以往届学生由于其突出的实践能力最后促成了他毕业就业的成功为例,说明动手能力的重要性。贯穿在课程教学中,我对学生实验课程的理念是鼓励其独立自主地完成实验,尽量少干涉,允许其在实践中犯错误,在犯错中学习提高。经过思想观念的转变、实践中的反复雕琢提高,学生们的实践动手能力都得到了较好的提升。
三、结语
生物信息学是一门快速发展的新型热门学科,其发展与生命科学发展是相辅相成的。本文针对《生物信息学》的教学进行了一些探讨,特别是针对生物背景学生的教学进行了深入集中的研究。
本文认为,只有激发学生的学习兴趣,夯实基础,注重实践动手能力,紧跟学科发展前沿趋势,这样才能切实做好生物信息学的课程教学工作,提高该课程的教学质量,以此满足我国目前该领域对人才的教育需要,培养出具有一定的实践操作能力和很强的创新能力的大学生。
参考文献:
[1]T.Chalie Hodgman AF,David R. Westhead.生物信息学导读版[M].北京:科学出版社,2010.
[2]Mount DW (2002) Bioinformatics Sequence and Genome Analysis:科学出版社.
[3]陶士珩.生物信息学[M].北京:科学出版社,2007.
[4]乔纳森.佩夫斯纳.生物信息学与功能基因组学[M].孙之荣,主译.北京:化学工业出版社,2009.
[5]李霞.生物信息学[M].北京:人民卫生出版社,2010.
[6]Tisdall J (2001) Beginning Perl for Bioinformatics:O'Reilly.
[7]Tisdall J (2003) Mastering Perl for Bioinformatics:O'Reilly.
[8]Gentleman R (2008) R Programming for Bioinformatics:Chapman & Hall/CRC.
[9]Model ML (2009) Bioinformatics Programming Using Python:O'Reilly.