前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇生物信息学分析方法范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
一、实验目的的确定
探究实验的本质是根据某一合理假设,通过设计和实施实验,对作用主体与作用对象之间的内在联系作出分析和判断,从而得出科学结论的过程。因此,生物学探究实验的实验目的一般描述方式为:探究某因素对生物某方面特征(如形态、结构、生理功能)的影响。例如,探究光照强度对植物光合作用速率的影响;探究生长素浓度对植物插枝生根的影响;探究紫外线对草本植物植株形态和株高的影响等。
从实际应用出发,实验目的可以从两个不同角度分析确定。(1)可以从实验课题中分析实验目的。很多探究课题实验目的明确,不需要作进一步分析。但也有部分课题探究目标比较模糊。如,探究小麦生长中心与旗叶光合作用的关系。该课题既有可能是探究生长中心对旗叶光合速率的影响,也有可能是探究旗叶光合作用对生长中心生长速率的影响。因此,需要进一步细化,确定探究方向。(2)从实验步骤中归纳实验目的。从训练学生思维的角度出发,在某些情境下可能给定实验步骤,要求归纳实验目的。此种情境下的一般方法是:根据实验步骤找出实验中的自变量和因变量,将实验目的概括为“探究某因素(自变量)对某形态结构或生理功能(因变量)的影响”。
二、实验原理的分析和归纳
实验原理是对实验的理论基础、操作方法和目标指向的高度浓缩概括。其内容应包含四个方面的基本要素:实验的科学理论依据;操作过程要点;实验结果的检测方法和指标;实验的结论目标指向。
在独立设计实验时,确定实验原理的基本途径是:(1)从生物科学的基本理论出发,深入分析影响因素与作用对象之间的内在联系。(2)分析操控影响因素的具体方法,确定自变量。(3)分析实验对象受到影响后可能发生的反应,找出与这些反应相关的外在表现,确定观测指标。(4)概括说明该实验能达成的最终目标。
如果是在已有的实验方案基础上归纳实验原理,基本方法是:找出实验方案中的自变量和因变量,从理论上分析二者之间可能存在的联系;然后以方案中实验组为依据,描述对自变量的控制和对结果的检测方法,忽略掉对照组设置以及对无关变量的控制等细节,从而归纳出实验原理。
一个科学的实验原理可以对实验材料的选择、实验步骤的设计、观测指标的确定以及实验结果的预测分析都能起到有效的指导作用,是整个实验方案的纲领。
三、实验步骤设计的方法和原则
实验步骤是实验探究方案的主体内容。它直接决定实验过程能否实现以及实验目标能否达成。
实验步骤设计的一般思路是:首先要明确自变量和因变量,再结合探究目标确定变量控制方法和对照实验设置方法,最后确定对实验结果的检测方法和指标。如果是定性探究,则应该以被探究因素的有、无或者强、弱等典型条件设置对照;如果是定量探究,则应该以被探究因素的强弱程度设置一系列梯度实验进行探究。例如,若要探究“温度对植物光合作用的影响”就可作定性探究,此时只需要设置高温、常温、低温三个典型温度条件作对照实验即可。如果要求“探究植物光合作用的最适温度”,这就是一个定量探究课题。必须在一定温度范围内设置一系列温度由低到高的梯度实验进行对照。检测方法要有可行性,检测指标必须是实验对象受自变量影响后产生的必然预期结果。
实验步骤设计必须遵循的原则主要有:科学性原则;对照原则;单一变量原则;平行重复原则。
科学性原则的基本含义是:有确实的科学理论依据,逻辑推理严密,操作方法和顺序合理,变量控制可靠有效,观测手段简便易行。
对照原则:探究过程中要通过设置对照实验的方法来增强实验的说服力。可根据不同课题要求,在实验中设计空白对照、条件对照、相互对照和自身对照等不同的对照实验形式。
单一变量原则:实验组与对照组只能有一个变量差异。即除开自变量以外,实验组和对照组其他所有无关变量应保持相同且适宜。
平行重复原则有两层含义:一是指进行探究实验时对生理状况相同的多个实验对象同时进行相同的实验操作,以减少偶然因素或实验对象个体差异带来的误差;另一层含义是指控制自变量在相同的变化幅度下,以同样的条件进行重复实验,从而体现过程与结果之间联系的必然性。
在上述原则下,实验步骤的设计可以大致上分为三个要点:第一步,准备和分组。对实验材料要进行准备和预处理,使其初始状态相同并达到实验要求。然后,根据实验需要划分为不同组别,为后续的对照实验做好准备。第二步,对照处理和变量控制。将不同组别控制在自变量的不同变化幅度之下形成对照,其余条件控制到相同且适宜的状态,并给予充分的后续反应时间。第三步,实验现象的观测统计。选定适当的观察测量指标对不同组别分别进行观察和统计,以反映实验结果。
四、实验结果分析和结论归纳
>> 小菜蛾PxALP1基因的克隆与生物信息学分析 高丛越桔UFGT基因电子克隆和生物信息学分析 丹参类贝壳杉烯氧化酶(SmKOL)基因全长克隆及其生物信息学分析 小菜蛾p38MAPK基因的克隆与生物信息学分析 黄瓜DVR基因的生物信息学分析 沙棘WRI1转录因子基因的生物信息学分析 黔北麻羊RERGL基因cDNA克隆与生物信息学分析 玉米淹水诱导表达ZmERF5基因启动子的克隆与生物信息学分析 茶陵野生稻冷响应基因OrCr3的克隆及其生物信息学分析 黄芩葡萄糖醛酸水解酶基因的克隆、生物信息学分析及表达 金铁锁糖基转移酶PtT1的克隆与生物信息学分析 结核分枝杆菌pst S1基因的扩增及生物信息学分析 平邑甜茶MhWRKY15基因cDNA克隆及其生物信息学分析 红白忍冬SABATH甲基转移酶基因克隆及其生物信息学分析 子宫内膜异位症相关基因和microRNA的挖掘及生物信息学分析 太子参分解代谢关键酶8′羟化酶基因的克隆及生物信息学分析 FZ6基因及其蛋白的生物信息学分析 欧文氏杆菌铁代谢相关基因的生物信息学分析 水稻2个F―box基因的生物信息学分析 弓1虫RH株SAG1基因序列体外扩增及生物信息学分析 常见问题解答 当前所在位置:l)对氨基酸序列进行多重比对,并用MEGA4 NJ法(bootstrap 1000)构建系统树。在CCD数据库()进行二硫键预测。在Swiss-Model(http:///)进行蛋白的三级结构预测。
2.4 丹参毛状根中SmNAC1表达谱分析 采用SYBR Green Premix染料(TaKaRa公司)进行qRT-PCR分析,以丹参β-actin作管家基因,分别以特异性引物SmNAC F:5′-CTCCCAACATCAGTCAAG-3′,SmNAC R:5′-ATGGCGGTGACGAT-3′,检测SmNAC1在YE+Ag+处理丹参毛状根0,2,4,8,12,24 h的表达变化。PCR体系为 SYBR Premix TaqTM 5 μL,正反引物各0.2 μL,ROX Reference Dye II 0.2 μL,稀释10倍的cDNA模板1.0 μL,加ddH2O至10 μL。PCR程序为,95 ℃ 30 s,95 ℃ 5 s,60 ℃ 34 s, 40个循环,增加溶解曲线。每个样品设3个生物学重复。
3 结果
3.1 丹参SmNAC1基因序列分析 丹参SmNAC1基因全长591 bp,编码196个氨基酸。Blastx检索结果显示,SmNAC1与野生马铃薯Solanum chacoense的NAC1,番茄S. lycopersicum NAC1-like,烟草Nicotiana benthamiana NAC1,水稻Oryza sativa Indica Group NAC-like,紫花苜蓿Medicago truncatula的相似度分别是84%,83%,84%,77%,73%。与SmBTF的相似度只有56%。SmNAC1蛋白55~120 位是NAC_AB(PS51151)的保守结构域。应用Softberry(http:///berry.phtml)分析调控元件和PLANTCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)预测,C-端氨基酸有23个顺势作用元件,包括TGGTTT厌氧响应顺式调控元件,AAACAGA赤霉素响应元件,GTTTTCTTAC参与胁迫防御应答的顺式作用元件以及TCTTTAC光应答元件等。使用NetPhos 2.0 Server(http://cbs.dtu.dk/services/NetPhos/)分析磷酸化位点,共发现10个磷酸化位点,其中丝氨酸位点7个,苏氨酸位点2个,酪氨酸位点1个,没有发现糖基化为点。
3.2 SmNAC1编码蛋白质的基本性质分析 SmNAC1蛋白由196个氨基酸残基组成,相对分子质量为21.66 kDa,等电点4.36。CFSSP 对SmNAC1蛋白进行二级结构预测,该蛋白包含87.8%的α螺旋结构, 36.7% 的β折叠结构和14.8%的无规卷曲,见图1(由于α螺旋和β折叠交互计算,故几种结构类型之和>100%)。无规则卷曲主要位于55~120个氨基酸功能区内,连接其他二级结构元件。在SWISS-MODEL用同源建模方法以人的NAC蛋白(3mcbA)为模板构建同源模型,对SmNAC1的NAC结构域氨基酸进行三级结构预测,结果见图2。SignalP 4.0 Server和TMHMM 2.0分析显示SmNAC1非氨基酸序列没有信号肽,也不包含跨膜结构域,也不是分泌蛋白。亚细胞定位分析表明,该基因不定位于叶绿体或线粒体,推测可能定位在细胞核,具有DNA结合,激活,转录调控,乙酰化等功能。
以人的NAC蛋白(3mcbA)为模板,E=9.311 57e-17。将SmNAC1与Genbank中17个物种25种蛋白进行比对,应用MEGA4使用NJ法(bootstrap 1000)构建系统进化树。SmNAC1与茄科马铃薯S. chacoense NAC2(ScNAC2, ACB32231.1),本氏烟N. benthamiana NAC(NbNAC,BAF46352.1)和番茄S.lycopersicum NAC(SINAC,XP_004249331.1)
亲缘关系最近,见图3。从图中可以看出NAC的变异率是比较高的,同一植物的NAC蛋白并不聚在一起,如拟南芥中的拟南芥Arabidopsis thaliana中的5个蛋白NAC1-1(AtNAC1-1,NP_187845.1),NAC1-2(AtNAC1-2,NP_190516.1),NAC1-3(AtNAC1-3,NP_1196889.4),NAC1-4(AtNAC1-4,NP_001078369.1)和NAC1-5(AtNAC1-5,AEE31552.1),AtNAC1-1和AtNAC1-3聚为一小支,AtNAC1-4和AtNAC1-5聚为一小支,而AtNAC1-2则和蓖麻Ricinus communis NAC1-2(RcNAC1-2,XP_002521293.1)聚为一小支,三者间间隔距离较远。玉米种的3个NAC蛋白中ZmNAC1-1(NP_001147422.1)和ZmNAC1-3(NP001148944.1)聚为一支,与ZmNAC1-2(NP_001147705.1)的距离较远。水稻中的3个NAC蛋白则各自聚在不同的分支。可见NAC蛋白虽然具有保守的结构域,但是其结构的变异性非常大。
3.3 SmNAC1基因表达谱分析 对培养18 d的丹参毛状根进行YE+Ag+处理,分析SmNAC1在处理后5个时间点的mRNA水平的相对表达量,见图4。处理后2 h表达量上调至对照的1.4倍,处理后4 h表达量达到对照的2倍,8~12 h保持2倍的表达水平,处理后24 h SmNAC1下调至对照表达水平以下。说明SmNAC1响应YE+Ag+处理,参与了胁迫应答反应。
4 讨论
NAC家族基因是陆生植物特异的转录因子家族,NAC蛋白参与植物的生长发育、形态建成及多马铃薯Solanum chacoense NAC2(ScNAC2, ACB32231. 1);本氏烟Nicotiana benthamiana NAC(NbNAC,BAF46352. 1);番茄S. lycopersicum NAC(SINAC,XP_004249331. 1);丹参Salviae miltiorrhizae NAC1(SmNAC1,kF006346);黄瓜Cucumis sativus(CsNAC, XP_004171778. 1);葡萄Vitis vinifera NAC2(VvNAC2,XP_003632619. 1);野草莓Fragaria vesca subsp. vesca NAC(Fvssp. vescaNAC,XP_004306474. 1);拟南芥Arabidopsis thaliana NAC1-3(AtNAC1-3,NP_1196889. 4);拟南芥A. thaliana NAC1-1(AtNAC1-1,NP_187845. 1);水稻Oryza sativa Japonica Group NAC1(OsNAC1,BAB89723. 1);水稻O. sativa NAC1-3(OsNAC1-3,AAT01337. 1);葡萄V. vinifera NAC1(VvNAC1,XP_002283581. 2);二穗短柄草Brachypodium distachyon NAC(BdNAC,XP_003557882. 1);玉米Zea mays NAC1-3(ZmNAC1-3,NP001148944. 1);玉米Z. mays NAC1-1(ZmNAC1-1,NP_001147422. 1);大豆Glycine max NAC(GmNAC,XP_003554096);蒺藜状苜蓿Medicago truncatula NAC1(MtNAC1,XP_003624883. 1);火炬松Pinus taeda NAC(PtNAC,AAF27917. 1);Micromonas sp. RCC299(Msp. NAC1,ACO64924. 1);Coccomyxa subellipsoidea C-169(CsuNAC1,EIE21909. 1);拟南芥A. thaliana NAC1-5(AtNAC1-5,AEE31552. 1);拟南芥A. thaliana NAC1-4(AtNAC1-4,NP_001078369. 1);水稻O. sativa NAC1-2(OsNAC1-2,AAM52321. 1);玉米Z. mays NAC1-2(ZmNAC1-2,NP_001147705. 1);拟南芥A. thaliana NAC1-2(AtNAC1-2,NP_190516. 1);蓖麻Ricinus communis NAC1-2(RcNAC1-2,XP_002521293. 1)。
种生物和非生物胁迫应答过程。如玉米的ZmSNAC1基因在低温、干旱、高盐及脱落酸处理后表达量显著上调,而水杨酸处理后表达下调[13]。葡萄中的VvNAC1基因响应病原菌、脱落酸、茉莉酸和乙烯处理表达上调[14]。在巴西橡胶树HbNAC1启动子序列中有多个CCAAT-box,EECCRCAH1,MYB2CONAENSUSAT元件识别MYB和MYC转录因子,在ABA信号通路和非生物胁迫答应中起重要作用[15]。SmBTF3与SmNAC1氨基酸序列的相似度只有56%,但是在N-端都具有NAC-AB保守结构域,二级结构都以α螺旋为主。荧光定量PCR分析表明SmBTF3在根中的表达量最高,对ABA诱导的响应不明显,干旱胁迫短时间内抑制其表达。本研究发现SmNAC1在YE+Ag+联合处理后2 h表达量上调至对照的1.4倍,4 h上调至对照的2倍,24 h表达量下调至对照表达水平一下,可见丹参中的这2个转录因子在丹参的抗逆胁迫中起作用。
[参考文献]
[1] Phan Tran L S, Nakashima K, Sakuma Y, et al. Isolation and functional analysis of Arabidopsis stress-inducible NAC transcription factors that bind to a drought-responsive cis-element in the early responsive to dehydration stress 1 promotor[J]. Plant cell, 2004, 16(9):2481.
[2] Park J, Kim Y S, Kim S G, et al. Integration of auxin and salt signals by the NAC transcription factor NTM2 during seed germination in Arabidopsis[J]. Plant Physiol, 2011, 156(2):537.
[3] Hu H H, You J, Fang Y J, et al. Characterization of transcription factor gene SNAC2 conferring cold and salt tolerance in rice[J]. Plant Mol Biol, 2008, 67(1/2):169.
[4] 孙欣,上官凌飞,房经贵,等. 葡萄NAC转录因子家族生物信息学分析[J]. 基因组学与应用生物学,2011,20(2):229.
[5] Hu R B, Qi G, Kong Y Z, et al. Comprehensive analysis of NAC domain transcription factor gene family in Populus trichocarpa[J]. BMC Plant Biol, 2010, 10(1):145.
[6] Rushton P J, Bokowiec M T, Han S C, et al. Tobacco transcription factors : novel insights into transcriptional regulation in the solanaceae[J]. Plant Physiol, 2008, 147(1):280.
[7] Le D T, Nishiyama R, Watanabe Y, et al. Genome-wide survey and expression analysis of the plant-specific NAC transcription factor family in soybean during development and dehydration stress[J]. DNA Res, 2011, 18(4): 263.
[8] Puranik S, Sahu P P, Srivastava P S, et al. NAC proteins: regulation and role in stress tolerance[J]. Trends Plant Sci, 2012, 17(6):369.
[9] 何炜,叶冰莹,周平,等. 转录因子NAC的研究进展[J]. 亚热带农业研究,2008,4(4):311.
[10] 何苗,武雪,王喆之. 丹参BTF3基因的克隆及生物信息学分析[J]. 武汉植物学研究, 2009, 26(6):582.
[11] 张夏楠,崔光红,蒋喜红,等. 丹参转基因毛状根离体培养体系的建立及分析[J]. 中国中药杂志,2012, 37(15):2257.
[12] 吕冬梅,袁媛,张东,等. 丹参毛状根化学成分稳定性研究[J]. 中国中药杂志,2008,33(6):653.
[13] Lu M, Ying S, Zhang D F, et al. A maize stress-responsive NAC transcription factor, ZmSNAC1, confers enhanced tolerance to dehydration in transgenic Arabidopsis[J]. Plant Cell Rep, 2012, 31(9):1701.
[14] Zhu Z, Shi J, He M, et al. Isolation and functional characterization of a transcription factor VpNAC1 from Chinese wild Vitis pseudoreticulata[J]. Biotechnol Lett, 2012, 34(7):1335.
[15] 康桂娟,黎瑜,夏可灿,等. 巴西橡胶树HbNAC1基因启动子的克隆及序列分析[J]. 基因组学与应用生物学, 2012, 31(5):447.
Cloning and bioinformatics analysis of SmNAC1 from Salvia miltiorrhiza hairy root
WANG Ya-jun1, JIANG Chao1, ZHAO Rong1, ZHAO Le2, SHEN Ye1*, HUANG Lu-qi1*
(1.National Resource Center for Chinese Materia Medica, China Academy of Chinese Medical Sciences, Beijing 100700, China;
2.College of Pharmaey, Henan University of Traditional Chinese medicine, Zhengzhou 450008, China)
[Abstract] In order to study function of NAC transcription in development, hormone regulation and the stress response of Salvia miltiorrhiza, the NAC transcription was cloned and analyzed. By retrieving cDNA database of S. miltiorrhiza hairy root one NAC unigene was found, then a full length of cDNA was cloned by designing specific primers and PCR amplifying. Using ORF finder it was found that the cDNA containing a NAC-AB conserved domain in N-terminal, so the cDNA was a NAC transcription factor, named as SmNAC1(kF006346). Bioinformatics analysis showed that SmNAC1 had an open reading frame (ORF) of 591 bp encoding 196 amino acids. The calculated protein had isoelectric point (pI) of 4.36 with molecular weight about 21.66 kDa. The transcription level of SmNAC1 after dealing with yeast extract (YE) and silver ion (Ag+) in S. miltiorrhiza hairy root was markedly stimulated up regulating. It was 1.4 fold compared with the control after induction 2 h, and maintained 2.0 fold on 4-12 h after induction. SmNAC1 may participate in regulation of stress response of YE+Ag+.
关键词:大数据;生物信息学;教学探索
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2015)29-0210-02
一、引言
生物信息学是由生物学与数学、计算科学交叉形成的前沿学科,主要通过研发并应用计算机技术及数学与统计方法,对海量生物数据进行管理、整合、分析、建模,从而解决重要的生物学问题,阐明新的生物学规律,获得传统生物学手段无法获得的创新发现。生物信息学是当今生命科学和自然科学的重大前沿领域之一,是多学科之间的交叉领域。因此,做好生物信息学教学工作对提高生物信息学研究水平具有重要的理论和实践意义。
随着高通量测序数据的大量出现,生命科学已经进入到大数据时代,生物信息学研究的重点将转移到组学的研究上。相应地,生物信息学教学的重点也要从单个基因的分析转向多个基因甚至在组学水平的分析。在生物大数据背景下,对生物信息学专业的人才需求也将越来越大。本文结合生物大数据的特点和教学经验,谈谈目前生物信息学教学中存在的问题,并针对这些问题提出自己的建议和方法。
二、生物大数据的特点
“大数据”一词最初起源于互联网和IT行业,它具有数据量大、数据多样化、高速、有价值等特点。生物大数据不仅带有“大数据”的特点,而且具有生物数据自身的特性,具体表现在:
1.数据量大:全球每年生物数据总量已经达到EB量级,完整的人体基因组有约30亿个碱基对,个体化基因组差异达6百万碱基。同时由于高通量测序成本的下降,目前大量的生物物种得以全基因组范围的基因组从头测序、重测序以及转录组测序,积累了大量的生物数据。
2.数据种类多:由于测序仪器种类繁多,产生的测序数据格式也各不相同。除高通量测序产生的基因组和转录组数据外,另外还有蛋白组、代谢组、表型组、相互作用组的序列数据和结构数据。
3.数据增速快:这主要体现在数据的急剧增长速度上,几乎每一周都有关于某一物种的全基因组或者转录组测序的信息。尤其是随着新一代测序技术的发展,更大数量级的基因组数据产出日渐增加――每台高通量的测序仪每天可产生约100GB的数据。
4.数据价值高:随着生物信息学的发展,越来越多有价值的信息可从生物数据中挖掘出来,这些价值不仅体现在生物科研领域,而且已应用于农业和医学等领域。
三、大数据背景下生物信息学教学中存在的问题
经过多年的发展,生物信息学教学虽然有了一定的提高和改善,但还存在一些问题,主要表现在:
(一)课程设置不合理
生物信息学是由生物学与数学、计算科学交叉形成的前沿学科,对生物背景的学生来说,需要掌握计算机和数学特别是统计学方面的知识和技能。但由于受课程设置的影响,很多学校只把C语言作为计算机的必修课,而没有在大一或者大二年级开设概率论和数理统计,并且生物统计学等课程也只是在大三或者大四才作为选修课或者限定选修课来开设的,造成部分开课专业学生的数理基础比较薄弱,因此在后续学习中存在一定的困难。
(二)教材内容不够全面
由于生物信息学发展日新月异,各种分析生物大数据的算法、方法和软件层出不穷,并且其更新换代是非常快的,而国内外相关教材的内容不够全面,并且其更新速度较慢,不能紧跟生物信息学的最新发展,造成教师在授课时要综合多本生物信息学教材的内容,不利于学生对生物信息学内容的全面掌握,从而制约了生物信息学教学的发展。
(三)教师的教学方法单一
生物信息学课程目前虽然在很多院校已经开设,但由于该学科对教师的授课水平和学生的学习能力要求较高,目前多数学校对于生物信息学的授课方式还是以教师讲授为主的填鸭式教学方式。随着大数据时代的到来,传统的教学方式和方法远不能满足生物信息学教学的需要。
四、生物大数据背景下生物信息学教学的建议和方法
为了适应大数据背景下生物信息学的教学形势,针对目前教学中存在的问题,作者结合自己的教学实践,建议从以下5个方面改进和提高生物信息学教学。
(一)合理设置基础课,强化基础理论
生物信息学是一门交叉性很强的学科,以复杂而强大的理论体系作为支撑,所涉及的内容包括计算机编程、信息检索以及数据库技术等。为了让学生学好生物信息学这门课程,各院校可以合理设置生物信息学的专业基础课,将生物信息学课程定位在大三或者大四年级学生,在大一、大二年级做好高等数学、数据库原理以及Perl语言等与之相关课程的教学工作,这些学生在掌握了一些与生物信息学相关的基础理论知识后,其对生物信息学的学习能力和理解能力才会有较大的提高。此外,学校要鼓励学生了解国内外有关大数据和生物信息学技术的发展趋势,并推荐有代表性且通俗易懂的文章和书籍,以强化学生的基础理论体系,为生物信息学的学习提供必要的知识储备
(二)培养大数据意识,加强对大数据分析的科学素养
生命科学研究已经进入到大数据时代,生物大数据的挖掘已经在农林科学、医学等领域产生巨大的效益,所以我们要培养学生树立大数据思维意识,全面认识生物大数据带来的机遇和挑战。生物信息学以生物数据为对象展开分析,它同时具备具体性和抽象性的特点。具体性是指以数据为对象挖掘出的生物学知识是客观存在的,其对生物学规律的解释性较强;抽象性是针对生物信息学中的理论和方法而言的,一般要求学生具有一定的生物信息学专业基础。在进行生物信息学教学时,要激发学生的学习兴趣,逐渐培养学生的大数据意识,规范学生对大数据分析的基本方法。可以通过实例,让学生参与到具体的生物信息学分析中去,以便理解生物信息学数据分析的基本操作流程,并在业余时间开展生物大数据在农业和医药行业成功应用的案例调查,以便激发学生利用生物信息学手段分析大数据的热情。
(三)优化教材内容,精心安排教学内容
鉴于目前生物信息学发展速度快,而国内外相关教材的更新速度较慢,所以要求在生物信息学教材的选取方面要下大力气,并且在授课时整合各个教材的优点。一般在生物信息学授课中整合以下三本书的内容:David W. Mount编写的《Bioinformatics Sequence and Genome Analysis》、李霞主编的《生物信息学》以及陈铭编写的《生物信息学》。
在教学过程中,为了使学生在有限的课堂教学时间内掌握生物信息学课程的主要内容,首先要优化课程教学体系,统筹安排教学内容,在生物信息授课中要抓住以下两条主线:序列―结构―功能―进化;基因组―转录组―蛋白组―相互作用组―代谢组,多组学贯穿。同时针对不同专业的特点与人才培养目标要求,合理分配各章节的教学课时,做到突出与专业密切相关的内容重点精讲。如在生物技术专业中,增加课时讲授分子药物设计章节,不仅要让学生了解生物信息学与分子药物设计的关系,而且要让学生掌握计算机辅助药物设计的理论方法以及软件操作。因此,以生物信息学教学内容的两条主线为依托,紧密围绕各专业的培养目标,做到理论联系实际,构建的教学体系和教学内容既能让学生掌握学科的知识理论体系,又有利于培养学生理解、分析、运用学科知识解决实际问题的能力。
(四)合理选用教学方法,提高教学效果
实践表明,不同的教学内容采用不同的教学方法授课可以收到良好的教学效果。为实现生物信息学课堂教学目标,完成相应的教学任务,教师要根据每堂课的教学内容,采用合适的教学方法,调动学生学习的积极性和主动性,提高课堂教学效果。可以从解决问题的角度出发进行理论教学。在理论课教学中,如果仍沿用传统的灌输式教学模式,肯定达不到预期的教学效果。课堂教学还可以根据需要,适时融入案例教学、问卷调查、多媒体展示、影片教学等方法,提高实际教学效果,培养学生的综合素质和创新思考能力。
上机实习注重发挥学生的主观能动性。生物信息学是一门实践性很强的课程,上机实习是教学的重要环节,它不但能够帮助学生更好地理解理论课所学知识,而且能够提高学生运用生物信息学的理论和方法解决实际问题的能力,对培养学生独立思考能力、观察能力、动手能力起着重要作用,更是培养学生创新能力的重要途径。
(五)理论和实践相结合,注重考核的灵活化
生物信息学是一门融合了多个学科的实践性很强的课程,对应的考核方式应该与其他专业课程有所区别,其最终的成绩不应该只以理论课考试的成绩为准。理论知识的考核注重学生对生物信息学基本概念、分析流程和主要分析算法的掌握情况,主要以试卷考核的方式为主,采用统一考核方式和评判标准。对于上机技能的考核,主要强调的是学生对不同类型数据进行分析时应掌握的相关软件使用技能的考查,也应纳入到学生的成绩考核中,我们认为理论考试占70分、实习成绩占30分是一个好的评价方式。
五、结束语
大数据背景下对生物信息学的教学提出了新的更高的要求。本文针对《生物信息学》教学中存在的问题,结合自己的教学经历对改进生物信息学教学和方法进行了一些探讨。本文认为要做好大数据时代的生物信息学教学,要从强化基础理论、培养大数据意识、精心设计教学内容、创新教学方法和改革考核评价体系等五个方面来开展和抓好生物信息学教学。
参考文献:
一、过去教学中存在的问题
(一)实验课教学学时偏少
生物技术专业五年制生物信息学课程总学时为72学时,其中理论48学时,实验24学时。生物信息学课程最主要的目标是培养学生通过在线程序或利用生物信息学软件来分析生物学问题的能力,有效解决学生实验学时不足,实际操作时间少,解决实际问题能力较弱的问题。
(二)与其他课程联系较少
生物信息学课程开设在生物技术专业教学进程的第6学期,此时学生已具备普通生物学、细胞生物学、分子生物学、生物化学、医学免疫学、遗传学、基因组学、基因工程原理等生命科学的基础知识。但是,在生物信息学理论课和实践课学习的内容,如查阅的文献、分析的目的则由授课教师自行指定,忽略了与其他课程的联系,不利于学生系统地学习专业课的知识。
二、教学体系的改革和完善
(一)增加实验课教学学时
从2012年起,我校生物技术专业由五年制调整为四年制,同时在修订教学进程的时候将学时调整为理论36学时,实验36学时,理论课结束后即为该内容的实践部分,以此增加学生的实践训练时间。
(二)将基因工程原理实验课程与生物信息学实践相联系
在基因工程原理的实验中,我们把家蝇防御素基因作为目的基因,主要设计的实验内容包括:(1)目的基因的获得:利用PCR技术扩增已经克隆到pMD-18T载体上的家蝇防御素基因;(2)pSK质粒载体的小量制备;(3)目的基因与载体的酶切;(4)目的基因与载体的连接;(5)大肠杆菌感受态细胞的制备;(6)重组质粒的转化;(7)重组子的蓝白斑筛选;(8)菌落PCR鉴定重组子[2]。在学生对基因工程实验内容熟悉的基础上,我们在生物信息学的教学过程中对学生提出问题:家蝇防御素基因现有的研究现状是怎样的?PCR扩增目的基因的过程中引物该如何设计?获得阳性重组子后我们如何判断获得的插入序列就是目的基因呢?针对这样的疑问,我们结合基因工程实验对教学内容进行适当的调整:(1)PUBMED获取文献信息:由学生通过PUBMED查找近五年发表的有关家蝇防御素基因研究的文献;(2)核酸序列分析:以家蝇防御素基因为对象,分核酸序列的检索、搜索开放阅读框(ORF)、限制性酶切分析、引物设计、载体序列识别、核酸序列的比对、分子质量/碱基组成/碱基分布分析和序列转换共8大部分内容进行讲解和学生实践操作;(3)蛋白质序列分析:同样以家蝇防御素蛋白为对象,分蛋白质序列检索、蛋白质序列比对、蛋白质基本性质分析(蛋白质的氨基酸组成、分子量、等电点、亲疏水性分析、跨膜区分析、信号肽分析)、蛋白质功能预测、蛋白质结构预测(蛋白质二级结构和三级结构预测)共5大部分内容进行讲解和指导学生进行实践操作。
(三)以科研促进生物信息学的教学改革
笔者所在课程组主要集中于功能基因组学的研究,涉及了功能基因的获取、生物信息学分析、功能验证等方面的内容。学生在课程学习中,参与到教师的科研课题中,学会运用生物信息学所学知识实际解决科研问题。学生可自行完成从文献的查阅、目的序列的获取(由公共数据库获得或实验室测序获得)、基因序列的分析、理论推导氨基酸序列基本性质的分析及结构和功能的预测、系统发育分析,如有可能,学生可通过实验的方法验证生物信息学分析的结果,同时鼓励学生自主选择感兴趣的基因、蛋白进行课程设计研究,实践结束后学生将结果以论文形式提交给教师。
三、教学探索的成效
单链抗体除本身的治疗作用外,还可作为载体与细胞因子等结合,构建成双功能抗体用于肿瘤的导像治疗。据文献报道[1~3]各衍生因子两个完整基因融合成单一蛋白,经抗肿瘤活性检测发现,融合蛋白具有双重活性,但融合蛋白的亲和性及抗肿瘤活性分别较衍生因子的功能及活性有所变化,可能由于融合蛋白结构变化导致功能及活性的变化。利用生物信息学网络资源分析融合蛋白的二级结构及其理化性质,为进一步探讨单链双功能抗体基因融合蛋白提供依据。
1双功能抗体的研究进展
随着分子生物学的发展,肿瘤的药敏基因治疗成为各国学者研究的热点[3~5]。将目的基因导入靶细胞是基因治疗过程中的一个重要环节,因为目的基因导入靶细胞效率的高低将直接影响基因治疗的效果甚至成败。由逆转录病毒介导的基因转移所面临的最大问题是病毒转导效率较低,原因之一是由于包装后难以得到稳定产生较高滴度感染性逆转录病毒的包装细胞系。单链抗体(ScFv)是由Fv抗体衍生而来,将抗体重链可变区和轻链可变区通过一段连接肽连接而成,ScFv具有天然抗体的亲和力,而分子只有完整抗体的六分之一。具有分子小、穿透力强、容易进入实体瘤周围的血液循环等特点,体内应用具有较大的分布容积和较高的组织分布比例,ScFv是构建双功能抗体,双特异性抗体等多种新功能抗体分子的理想元件。一个蛋白或蛋白片段可以融合到ScFv片段上以配备附加的性质,如免疫毒素的产生,是通过将一个肿瘤特异的ScFv或Fab融合到一个内源化能杀死靶细胞的毒素上。许多细胞特异抗体可将试剂传递到肿瘤部位发挥其细胞毒元件的作用。肿瘤特异性抗体片段已经与细胞因子融合[4~8]。在这种情况下,称免疫细胞因子的分子注射到患者体内,在肿瘤细胞表面积聚,可以激活肿瘤附近的T淋巴细胞。这些融合蛋白内在的肿瘤结合活性允许使用低浓度,没有通常与系统细胞因子注射相关的副作用。
细胞因子融合蛋白均具有衍生因子的双重活性,其中有一些的活性较各自野生型低,或者与野生型因子的相加一致,或者其活性高于衍生因子的相加活性,人工构建的新蛋白可能具有与衍生因子无关的新活性[9~11]。事实证明:具有不同功能域的复合蛋白质以及连接肽的设计是今后寻找新的治疗因子的有效途径和研究方向。生物信息学可以促进药物的发现和开发过程,即充分利用生物信息学的生物学和遗传学信息来寻找和开发以基因为基础的药物。
2双功能抗体的表达及其生物学性质的预测
对于cDNA序列包含一个完整的蛋白质编码区,重要的则是分析所编码蛋白质的功能。蛋白质序列的生物信息学分析是从理论分析迈向实验研究的最为重要的部分。如果拟对所感兴趣的基因投入实验研究,那么,基于生物信息学获得尽可能多的关于该基因/蛋白质的信息是十分重要和极其重要的,尤其是当采用生物信息学的分析得到其结构功能域的信息后,将对研究思路的制定提供重要的指导信息[12,13]。
传统生物学认为,蛋白质的序列决定了它的结构,也就决定了它的功能[14,15]。因此,随着近10年来生物学分子序列信息的爆炸性增长,大大促进了各种序列分析和预测技术的发展,目前已经可以用理论预测的方法获得大量的结构和功能信息,用生物信息学的方法,通过计算机模拟和计算来“预测”出未知蛋白质信息或提供与之相关的辅助信息,可以用较低的成本和较快的时间就能获得可靠的结果[16~18]。重组融合蛋白是通过DNA重组的方法,将功能上相关的两种蛋白用连接肽连接,以达到优化蛋白功能的目的,如免疫毒素和细胞因子融合蛋白,并已用于肿瘤治疗。我们在构建融合蛋白之后,运用生物信息学资源DNAssist核酸序列分析软件分析ScFv-TNF-αDNA序列翻译并获得了氨基酸序列,蛋白质分析软件(ANTHEPROTV5)分析融合蛋白的二级结构及其理化性质。利用生物信息学网络资源进行分析预测融合蛋白的性质,为进一步探讨单链双功能抗体基因融合蛋白提供依据。构建重组导向的融合蛋白[19],通过重组PCR方法在编码ScFv与TNF-α的碱基之间引入酶切位点,并克隆到逆转录病毒表达载体PLxSN上表达,用脂质体转染法转染PA317包装细胞,G418筛选10天后共挑选50个细胞集落,扩大培养后测定29个细胞集落的病毒滴度,筛选出一株cfu>1×109/L的感染性重组病毒产生细胞系C26。
【参考文献】
1StrubeRW,ChenSY.Characterizationofanti-cyclinEsingle-chainFvantibodiesandintrabodiesinbreastcancercells:enhancedintracellularstabilityofnovelsFv-F(c)intrabodies.JImmunolMethodsK,2002,263(1-2):149-167.
2KimEJ,ChoD,HwangSY,etal.Interleukin-2fusionproteinwithanti-CD3single-chainFv(sFv)selectivelyprotectsTcellsfromdexamethasone-inducedapoptosis.Vaccine,2001,20(3-4):608-615.
3PengLS,PenichetML,DelaCruzJS,etal.Mechanismofantitumoractivityofasingle-chaininterleukin-12IgG3antibodyfusionprotein(mscIL-12.her2.IgG3).JInterferonCytokineRes,2001,21(9):709-720.
4ScherfU,BenharI,WebberKO,etal.Cytotoxicandantitumoractivityofarecombinanttumornecrosisfactor-B1(Fv)fusionproteinonLeYantigen-expressinghumancancercells.ClinCancerRes,1996,2(9):1523-1531.
5ChenP,ChenCQ,YaoLB,etal.ReconstructionandanalysisofaHumansmallmolecularantibodytotumornecrosisfactoralpha.ShengwuHuaxueYuShengwuWuliXuebao,2001,33(1):71-76.
6WuestT,GerlachE,BanerjeeD,etal.TNF-Selectokine:anovelprodruggeneratedfortumortargetingandsite-specificactivationoftumornecrosisfactor.Oncogene,2002,21(27):4257-4265.
7MaJ,LiZ,LuoD.Singlechainantibodyvaccinationinmiceagainsthumanovariancancerenhancedbymicrospheresandcytokines.JDrugTarget,2003,11(3):169-176.
8BremerE,KuijlenJ,SamploniusD,etal.Targetcell-restrictedand-enhancedapoptosisinductionbyascFv:sTRAILfusionproteinwithspecificityforthepancarcinoma-associatedantigenEGP2.IntJCancer,2004,109(2):281-290.
9TrevorKT,HershEM,BraileyJ,etal.TransductionofhumandendriticcellswitharecombinantmodifiedvacciniaAnkaravirusencodingMUC1andIL-2.CancerImmunolImmunother,2001,50(8):397-407.
10NiethammerAG,XiangR,RuehlmannJM,etal.Targetedinterleukin2therapyenhancesprotectiveimmunityinducedbyanautologousoralDNAvaccineagainstmurinemelanoma.CancerRes,2001,61(16):6178-6184.
11LiuX,ZhangL,ZhangM,etal.Co-modificationofIL-2-TNFalphafusiongeneandB7.1genetomurinebreasttumorcellsleadstoimprovedtumorrejectionandvaccineeffect.ChinMedJ(Engl),2000,113(2):167-171.
12张成岗,贺福初.生物信息学方法与实践.北京:科学出版社,2002,126-136.
13黄韧,薛成.生物信息学网络资源与应用.广州:中山大学出版社,2003,237-306.
14GuexN,PeitschMC.SWISS-MODELandtheSwiss-PdbViewer:Anenvironmentforcomparativeproteinmodelling.Electrophoresis,1997,18(15):2714-2723.
15GuexN,DiemandA,PeitschMC.Proteinmodellingforall.TiBS,1999,24(9):364-367.
16ClaverieJM.Effectivelarge-scalesequencesimilaritysearches.MethodsEnzymol,1996,266:212-227
putationalgeneidentification.JMolMed,1997,75(6):389-393.