前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇生物技术的进展范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
摘 要:随着国民经济的不断发展,各行业排放的工业废水的量也与日俱增。其中,对水环境污染尤为严重当属造纸工业了。统计显示,我国现有的10000多家大中小型的造纸企业,就能到达40多亿t的年废水量,是全国废水排放总量的十分之一。废水对生态环境造成了一定的影响。该文综合阐述了目前造纸废水生物治理中好氧技术、厌氧-好氧组合处理技术以及厌氧技术的应用和进展;对国内外生物处理造纸废水技术的研究进展进行了总结和分析,包括应用白腐真菌降解造纸废水、生物酶技术和生物固定化技术。
关键词:造纸废水 好氧 厌氧 白腐真菌 生物酶 生物固定化
中图分类号:X793 文献标识码:A 文章编号:1672-3791(2015)04(a)-0000-00
随着国民经济的不断发展,各行业工业废水的排放量也在逐渐增加。其中,造纸工业排放的废水对水环境造成了严重的污染。统计数据显示,我国10000多家的大中小型造纸企业,每年就会排出40多亿t的污水,占到了全国废水排放总量的十分之一[1]。2010年,造纸废水CODCr排放95.2万t约占轻工行业CODCr排放总量47%[2],对生态环境造成难以想象的破坏后果。对此,对新型的有效治理造纸废水污染的方法以及途径进行探索和研究,是非常具有研究意义和现实意义的。
1 造纸废水的来源和特点
其生产的各个环节都会产生废水,但主要来自于中段水、纸机白水以及蒸煮液[3]。提取黑液后浆料在洗涤、筛选、漂白的过程中排出来的废水,就是中段水,这种废水成分复杂,且富含对环境危害较大的有机氯化物。纸机白水中主要有细小纤维、填料和胶料(松香等)。酸法制浆的红液或碱法制浆的黑液叫蒸煮液,在整个造纸工业污染中占90%。碱法制浆是我国造纸业普遍采用的,其主要成分是纤维素、木质素、半纤维素、单糖、有机酸和碳水化合物的降解产物等。
2.造纸废水生物处理技术
化学方法、物理方法、生物法、物化方法等,是目前国内外造纸污水处理的主要方法。近几年,得到人们重视的膜分离、超临界分离、磁分离、超声波分离等物化处理法因比较昂贵,处理效率不高,应用比较有限。而操作方便、运行费用相对较低、没有二次污染等优点的生物处理法,则越来越受重视。
2.1好氧处理技术
指借助于好氧或兼性厌氧微生物在有溶解氧的情况下来分解、吸收有机物,使之被氧化成简单的无机物,污水得到净化。当前,活性污泥法和生物膜法等好氧生物法是国内外用来处理造纸废水的方法。
处理效果较好且成本低的活性污泥法既能去除部分色度,还能分解大量有机物质,易于管理是我国最常用的好氧处理方法。崔延瑞等[4]采用序批式活性污泥法处理碱法草浆造纸废水,COD的去除率高达80%。张述林[5]等采用混凝与低氧―好氧两段活性污泥法来处理某造纸厂COD为6230mg/L的综合废水,可达93.8%的COD去除率。
生物膜法是指微生物附着在介质表面上形成生物膜,且在不断繁殖生长的同时,还能对污水中的有机污染物进行降解吸收,将其转化为稳定的无机物和原生质,从而达到净化污水的作用。此方法剩余污泥量少且不会产生污泥膨胀,占地少,运行管理方便。Chandler等[6]通过塑料填料,利用两级生物膜反应器中试处理造纸厂废水。结果显示,水力有3h的停留时间,可减少93%的BOD5,出水BOD5达到7.83mg/L的平均浓度。张苗等[7]采用混凝沉淀协同好氧生物膜技术深度处理造纸废水,结果显示,效果最为显著的就是以FeCl3为混凝剂的协同好氧生物膜技术,最高可达69.30%的色度去除率,比单独的混凝沉淀高了3.72 %的去除率。
2.2厌氧处理技术
在专性与兼性厌氧菌的条件下,通过发酵和分解对有机物进行降解的处理技术称为厌氧处理技术。与好氧处理技术相比,其污泥产量小、节省动力能耗、对营养物质需求不高,且能更好地降解某些难降解有机物。殷承启等[8]采用上流式厌氧污泥床( UASB)处理二次纤维造纸废水。UASB 稳定运行时对COD的去除率可达90%以上,总硬度在50%以上以及硫酸根离子80% 以上。刘峰等[9]研究了预酸析―多孔高分子载体固定化微生物厌氧流化床(AFB)处理碱法草浆黑液的效能,结果证明,AFB对黑液进行直接处理时,发挥了其活性生物量浓度大、传质能力强的特点,可有效地去除COD,色度亦有所下降。采用酸析预处理利用AFB的厌氧消化功能,可去除黑液中大部分难生化降解的高分子物质。
2.3 厌氧-好氧处理技术
造纸废水因难降解有机物成分多、污染物浓度高、废水流量和负荷波动大、有较差的可生化性能等,用好氧处理效果不好且能耗大。因此,利用厌氧-好氧组合处理工艺进行处理。首先,能使厌氧处理技术的优势充分发挥,水解、酸化废水中生化性很差的高分子物质,成为易于进行好氧处理的较小分子或分子结构。同时,也可对回流到厌氧池的好氧阶段污泥进行较为彻底的厌氧消化,减少整个系统的污泥排放。该工艺结合了厌氧与好氧处理技术的优点,具有占地面积少、处理效果好、能耗低、节省药剂以及运转、管理方便等优点。
丁志芬[10]对某造纸厂应用厌氧-好氧组合技术处理废水的情况进行了介绍,且和好氧工艺作了比较。结果证明,厌氧-氧工艺运行电费可降低50%,且运行稳定,其COD有机物85%都转化为甲烷气体了,剩余污泥量也减少了60%以上。李巡案等[11]分析了万隆造纸厂废水处理工程改建为厌氧-好氧工艺以及实行清洁生产后,污染物质排放总量明显减少,水质可达到GB18918- 2002一级A标准,与原有的好氧生物处理工艺相比可节省动力约55%。
3 生物处理造纸废水技术的研究进展
3.1 应用白腐真菌对造纸废水进行降解
造纸工业排放黑液COD和色度形成主要是因为木质素,其异质多晶三维多聚体结构是由甲氧基取代的对-羟基肉桂酸聚合而成,分子间的醚键、C-C键很稳定,是当前公认的微生物难降解芳香化合物之一[12]。目前,国内大部分工厂处理造纸废水采用传统生物法应用的微生物主要以细菌为主,并不能有效去除造纸废水中的木素衍生物以及漂白过程中产生的氯酚类物质,这便成为造纸废水达标排放的主要障碍。
白腐真菌是目前所发现的对木质素及其衍生物降解最有效的微生物。多数白腐真菌属于担子菌纲,少数为子囊菌纲。其中,黄饱原毛平革菌(Phanerochaete Chrysosporium)是已被广泛研究的典型白腐真菌。
3.1.1 白腐真菌的降解机制及优势
白腐菌降解木质素通常分两步进行[13]:第一,菌体利用菌丝吸附木质素;第二,白腐菌分泌出的酶催化氧化木质素等污染物,主要分为细胞内和细胞外两过程,整个降解系统在主要营养物质( 碳、氮、硫) 限制条件下才得以启动形成[14~16]。锰过氧化物酶( Mnp)、漆酶(La)、木质素过氧化物酶( Lip) 均合成于细胞内,通过分泌到细胞外对污染物进行降解。前两者均须以H2O2为底物,漆酶以氧气作电子受体催化形成醌及自由基。故降解污染物时,白腐菌需借助H2O2激活,由酶触发启动自由基链反应,产生具有超常的氧化能力的细胞外?OH,对芳香化合物有很好的降解作用。
故白腐菌在降解污染物上所有具有的优点是其他生物系统尤其是细菌没有的[14]:(1)特定污染物不需要预条件化:处理系统以细菌为主的,诱导合成所需的降解酶须预先置于一定有效浓度的污染物。白腐真菌降解酶的诱导与降解底物的有无多少无关。(2)动力学优势:细菌对化学物的降解多为酶促转化,遵循米氏动力学。初始氧化反应的酶经白腐真菌催化启动对底物没有真正意义上的Km值,对氧化产物的形成有利。(3)产生氧化能力极强的?OH (4)有毒污染物不必进入细胞内代谢而在其细胞外即可有效降解。可忍受高浓度有毒污染物的同时,避免有毒污染物对细胞的毒害。(5)非专一性降解的特性:能降解大量结构不同的化学物质。(6)对营养物的要求低。
3.1.2 白腐菌在造纸废水中的应用
从上述可知白腐真菌在治理造纸废水方面有极大的研究价值。吴涓等[17]比较了几株白腐真菌在造纸黑液废水中的挂膜生长状况及其对黑液废水的处理效果。黄孢原毛平革菌、侧耳菌和S22菌都可以在较强碱性的废水中生长挂膜,且对木质素有显著的降解作用,有很强的适应废水的能力。李雪芝等[18]用8株不同的白腐菌对造纸废水进行处理,选出的白腐菌L02处理效果是最好的。该菌株可直接应用于造纸废水的处理,大幅度降低废水CODCr含量(降低84%以上)、废水的色度(降低93%以上)以及废水的pH值。路忻[19]采用序列间歇式活性污泥法(SBR)法利用白腐菌共代谢理论分析及处理试验研究含木质素的造纸废水。结果表明,相同进水COD浓度和水力停留时间,与单纯好氧生物处理相比,共代谢作用下好氧处理的COD去除率要高得多,有约30%的提高率。
3.2 生物酶技术
白腐菌降解木质素,是通过其分泌的酶的作用来实现。相较于锰过氧化物酶、木质素过氧化酶,在白腐菌木质素降解酶系统中,漆酶的实际应用价值更大一些。首先,木质素过氧化物酶和锰过氧化物酶产生的条件是限碳和氮的。而漆酶可在碳和/或氮存在条件下由菌体分泌[20]。其次,木质素过氧化物酶和锰过氧化物酶只在系统存在H2O2时,才可降解有机污染物,这在现实情况下很难实现的。最后,重要的还在于漆酶具有780 mV氧化还原电位,在不存在H2O2和其它次级代谢产物时,有机污染物的氧化也能够被催化。所以,在环境保护和生物技术方面,漆酶的应用潜力是非常巨大的。
据林鹿等人[21]研究通过漆酶进行去除桉木硫酸盐浆CEH漂白废水时发现,它可以把废水中有毒物质去除掉40%以上。造纸废液中有机氯化物用漆酶处理,具有高效能的催化作用,反应条件温和,对反应设备和反应条件要求也不高。谢益民等[22]采用杂色云芝发酵产生的漆酶液深度处理造纸厂二沉池出水,结果表明,经催化氧化作用,漆酶及其介体体系可氧化聚合废水中的大部分残余木素。在最佳实验处理条件下,木素、CODCr和色度的去除率分别达到82. 0%、76. 9% 和84. 9%。同时,纸浆生物漂白上的研究热点也包括漆酶。通过酶法漂白纸浆,脱氯效果更好[23],相对于传统的氯气漂白法所产生的有毒的氯酚类化合物而言,其避免了对环境的污染。
3.3 生物固定化技术
微生物固定化技术是通过化学或物理的方法,把游离酶或细胞限定在一定的空间区域内,使其能反复利用且保持活性,利于除去高浓度有机物或某些难降解物质。Messner等[24]利用生物滴滤器原理而开发的MYCOPOR反应器,在多孔的载体填料上把白腐菌固定好,废水由从顶部到载体的这个过程就能够得到净化了。处理6~12h,87%、80%和40%的色度、AOX和COD可去除。李朝霞等[25]采用一种新型海藻酸钠/壳聚糖/活性炭生物微胶囊固定化白腐菌和悬浮态白腐菌,在不同接种量下降解造纸废水。结果显示,白腐菌在不同的两种状态下均能对造纸废水进行降解,不过在代谢稳定性和降解木质素能力等方面,固定化白腐菌比悬浮态白腐菌明显要强。刘帅等[26] 用固定漆酶和游离漆酶对造纸废水进行深度处理。通过对废水处理的效果对比,固定漆酶的优点在于达到最佳效果的反应时间短, 酶的稳定性高, 温度耐受性强,pH适应性显著增强。
4 结语
作为一种处理难、成分复杂的工业废水,通过传统的处理技术造纸废水已很难满足如今的排放要求。因此,要实现极大减少造纸废水的排放或者实现零排放,需大力发展微生物处理技术。使微生物与处理技术相结合,为造纸业的绿色发展铺平道路。
参考文献
[1] 王晖,付斌.造纸废水处理方法现状及展望[J].中国资源综合利用,2005(2):21- 24.
[2] 洪卫,刘勃,等.制浆造纸废水深度处理技术解析[J].中华纸业,2009,30(7):76-81.
[3] 闫一野,乔丽洁.新型分离方法在造纸污水处理中的应用[J].环保与节能,2012 (2):30-33.
[4] 崔延瑞,胡兰群,等.序批式活性污泥法处理碱法草浆造纸废水的研究[J].河南师范大学学报(自然科学版),2003,31(4):61-64.
[5] 张述林,罗启芳,赵金辉,等.混凝与低氧―好氧两段活性污泥法处理造纸废水的研究[J].同济医科大学学报,1998,27(3):196- 198.
[6] Chandler H, Cornelis D. Treatment of recycle paper mill wastewater in moving bed biofilm reactors[C].TAPPI Proceedings Environmental Conference & Exhibition v 2.TAPPI Press, 1997.
[7] 张苗,黄少斌.混凝协同好氧生物膜技术深度处理造纸废水的实验研究[J].造纸科学与技术,2010,29(1):84-88.
[8] 殷承启,洪建国.上流式厌氧污泥床处理造纸工业废水的研究[J].南京林业大学学报(自然科学版),2004,28(5):41-44
[9] 刘峰,杨平,方治华等.预酸析-厌氧流化床处理碱法草浆黑液的研究[J].环境科学学报.1999,19(2):214-217
[10] 丁志芬.厌氧-好氧组合生物技术在废水处理中的应用[J].化工设计.2003,13(5): 26-28.
[11] 李巡案,贺延龄,等.厌氧-好氧工艺处理造纸废水工程实例及清洁生产[J].环境工程学报.2012,6(8):2595-2599.
[12] 王海磊,李宗义.三种重要木质素降解酶研究进展[J].生物学杂志,2003,20(5):9-
11.
[13] 黄丹莲,曾光明,等.白腐菌的研究现状及其在堆肥中的应用展望[J].微生物学通报,2004,31(2):112-116.
[14] 李慧蓉.白腐真菌的研究进展[J].环境科学进展,1996,4(6):69-77.
[15] Andre F, Jaime R, Juani ta F, et al. Biodegradation of Pinus radiate softwood by white- and brownrot fungi[J]. World Journal of Microbiology & Biotechnology2001, 17: 31-34.
[16] Pavel K, Alena K, J aroslav V, et al. Degradation of polychlorinated biphenyls by extracellular enzymes of Phanerochaete chrysosporium produced in a perforated plate bioreactor[J]. World Journal of Microbiology & Biotechnology1999, 15: 269-276.
[17] 吴涓,肖亚中,等.挂膜生长的白腐真菌处理草浆造纸黑液废水[J].应用与环境生物学报.2004,10(3):370~374.
[18] 李雪芝,赵健,等.白腐菌处理草浆造纸废水研究[J].中国造纸学报,2005,20(1):
88-91.
[19] 路忻,等.木质素真菌降解造纸废水的试验研究[J].河南科学,2008,26(12):
1550-1554.
[20] Munoc C. Laccase isoenzymes of Pleurotus eryngii:characterization,catalytic properties,and participation in activation of molecular oxygen and Mn2+oxidation [J].Appl Environ microbiol,1997,63:2166-2174.
[21] 林鹿,陈嘉翔,等.白腐菌对纸浆CEH漂白废水的脱色、消除毒性和芳香化合物的降解[J].中国造纸学报,1996,11:69
[22] 谢益民,瞿方,等.制浆造纸废水深度处理新技术与应用进展[J].中国造纸学报,2012,27(3):56-61.
[23] 宋美静.纸浆氯漂废水的处理[J].纤维素科学与技术,1999,(2):22- 25.
[24] Messner K,et al.Treatment of bleach plant effluents by the MYCOPOR system [M]. Biotechnology in pulp and paper manufacture Butterworth -Heninemann.1990: 245.
关键词:计算机应用;中文信息处理;生物信息学;文本挖掘;信息抽取;机器学习
中图分类号:TP391 文献标识码:A
1 引言
当前,生物医学领域的研究正在飞速发展,大量的生物医学知识以非结构化的形式存在于各种形式的文本文件中。国际上生物医学领域的权威数据库MEDLINE(Medical Literature Analysis and Retrieval System Online)的文献总数目前已达到1600万篇,近年来年均发表文献超过60万篇。如何才能有效地利用这些文本中所蕴含的生物医学知识无疑对分析海量的生物医学数据是非常重要的。常用方法是通过关键词在MEDUNE中或者互联网上进行检索,但是这只能从大量文档集合中找到与用户需求相关的文件列表,而不能从文本中直接获取用户感兴趣的事实信息。因此,提供从大规模生物医学文献中自动获取相关知识的有效工具是一项迫在眉睫的任务。
文本挖掘技术在文本知识自动获取中起到了重要作用。文本挖掘通常包括信息检索、信息抽取、数据挖掘三个步骤。其中信息检索(Information Retrieval,IR)用于识别相关文本,信息抽取(Information Extraction,IE)用于识别实体、关系、事件等信息,数据挖掘(Data Mining,DM)则从结构化信息中识别出相互间的关联。生物医学文本挖掘的研究重点主要由信息抽取和数据挖掘两方面的研究组成。具体来说,包括生物医学领域命名实体识别、同义词和缩写词识别、关系抽取、利用推理进行关系抽取的假设生成、文本分类以及上述工作的集成框架等。该领域研究的主要方法是通用的机器学习方法、领域知识、面向任务的前处理和后处理技术的相互结合。
文本挖掘在生物医学领域中的应用,可以提高生物医学信息建设和管理的效率。生物医学数据库的建设是最早推动生物医学文本挖掘的动力。通过信息抽取技术可以建设以疾病诊断、药物设计为目的的专用蛋白质作用关系数据库。例如建设特定疾病如乳腺癌、老年痴呆症的蛋白质作用关系相关数据库。通过数据库描述的蛋白质作用网络,将极大地有利于疾病诊断、药物设计,促进相关生物医学研究的进展。近年来文本挖掘技术在生物医学领域中的应用多是通过挖掘文本发现生物学规律,例如基因、蛋白质及其相互作用的关系,进而对大型生物医学数据库进行自动注释。例如:现有研究成果已经可以对蛋白质数据库加注功能关键词,并利用这项功能发现大分子问的相互作用关系。使用标准词汇对实验数据统一标注,架起了生物医学文献与生物医学实验数据的桥梁。借助生物医学文本挖掘技术进行数据标注的方法,广泛应用在功能基因组学数据上。经过人手工核对,正确的标注信息将赋予实验数据,有效的文献信息也将作为标注依据链接到实验数据。
生物医学文本挖掘的更大意义在于可以通过对文本分析研究帮助人们发现在文本中隐含的知识,从文献中挖掘出来实验假设和实验建议,以便生物学家验证得到新的科学发现,从而提高人们对生物医学现象的认识。例如,运用分子生物学文献的信息抽取技术来分析海量的生物医学数据,可以帮助分子生物医学专业人员理解分子生物学实验数据,研究分析实验结果。
生物医学文本挖掘是生物信息学研究的分支之一,是生物学研究中不可缺少的环节,它汇集着具有不同专业背景研究者的共同努力,推动和促进了生物医学的发展,对实现疾病的辅助诊断、预防和治疗,新药的辅助发现等起到了重要的作用,为人类对生命的探索做出了重要贡献。生物医学为文本挖掘技术提供了大量的验证数据,对文本挖掘技术起到了反推动作用。这是一种跨学科性研究,涉及到自然语言处理、机器学习、生物信息学等方面的技术,非常具有挑战性。目前,该研究领域吸引了来自计算语言学、生物信息学、机器学习等方面研究者的广泛关注,本文侧重介绍生物医学命名实体识别、缩写词和同义词识别、生物医学实体关系抽取、建立相关资源以及技术评测等。
2 命名实体识别
生物医学文本挖掘的基本任务之一是生物医学命名实体识别(Biomedical Named:Entity Recognition,Biomedical NER),其目的是从生物医学文本集合中识别出指定类型的名称,如蛋白质、基因、核糖核酸、脱氧核糖核酸等。这是进一步抽取关系和其他潜在信息的关键步骤。
生物医学领域的命名实体具有如下特点:新的命名实体不断出现,目前并不存在一个完整的包含各种类型的生物医学领域命名实体的词典,所以简单的文本匹配算法已经失去了作用;很多生物医学命名实体都是多词短语,有些有前置修饰语,例如:activated B cell lines,有些名称很长,例如:47kDa steroI regulatory element binding factor,这些特点给确定命名实体的边界带来了很大的困难;相同的词或者短语可以表示不同类别的生物医学命名实体,要依据上下文才能推断出来,例如:IL-2既表示蛋白质名称,又表示DNA名称;很多生物医学命名实体拥有多个不同的书写形式,例如:N-acetyl-cysreine,N-acetylcysteine,NAcetylCysteine等表示同一命名实体;很多生物医学命名实体是用“and”或者“or”连接的并列结构,它们共享同一个中心名词,例如:91 and 84 kDa proteins,这样的命名实体也很难正确识别;生物医学命名实体还存在着嵌套现象,例如:<PROTEIN><DNA>kappa 3</DNA>binding factor</PROTEIN>,因此还要解决候选命名实体的重叠问题;缩写词占有较高的比例,例如:IFN,TPA等等。很多缩写词的形成是没有规律可言的,并且缩写词还具有高度的歧义性,一般情况下,扩展形式比缩写词形式有更多的证据确定它的类别,缩写词形式和它的扩展形式相比更难分类。总之缩写词的识别很大程度上依赖于上下文,而不能依赖于现存的生物词典。因此,生物医学命名实体识别是富有挑战性的一项研究。
目前,生物医学命名实体识别的方法分为以下 三类:基于启发式规则的方法,基于字典的方法和基于机器学习的方法。基于规则的方法需要耗费大量人力建立识别规则库,而基于字典的方法存在着名称冲突和覆盖率受限的不足。目前研究的重点主要是基于机器学习的方法。
机器学习方法是从样例数据集合中统计出相关特征和参数,以此建立识别模型。目前已经有很多机器学习方法应用到生物医学命名实体识别当中,如贝叶斯模型、隐马尔可夫模型(HMM)、支持向量机(SVM)、条件随机场(CRFs)、最大熵(ME)等。基于机器学习的方法依赖于大量的标注语料,因此所面临的问题是如何获得廉价的大量训练数据。
支持向量机方法是一种比较有效的学习方法,已经成功应用到自然语言处理的多项任务中。Ka-zama等应用支持向量机来识别生物医学命名实体并使用GENIA语料作为训练语料。Lee等提出了一种基于支持向量机和查找字典的两阶段生物医学命名实体识别的方法,在第一阶段,使用SVM分类器识别命名实体并且用简单的字典查找作为后期处理来校正由SVM模型识别带来的错误;在第二阶段,把识别后的命名实体用SVM划分成语义类。该方法把任务划分成以上两个子任务,能够针对每一个任务选择更相关的特征,选择更为合适的分类方法,减轻了不平衡的类分配问题所产生的影响,提高了整体任务识别的精确率。AbGene系统是比较成功的生物医学命名实体识别系统之一,曾被多个研究者作为命名实体识别组件用于关系抽取研究当中。该系统使用7 000个手工标注命名实体类别的句子作为贝叶斯模型的训练语料,并采用手工统计规则作为后处理,同时使用命名实体所在的上下文来帮助校正识别错误。该系统达到了85.7%的精确率和66.7%的召回率。Chang等设计的GAPSCORE系统考虑到单词的出现次数、词形和上下文并以此为句子中每个词分配一个得分,然后使用基于词形和上下文等特征来训练N-gram模型,具有高分的单词更可能是基因和蛋白质名称。Zhou等人使用基于丰富特征集合的方法训练隐马尔可夫模型,他们在GENIA语料上获得了66.5%的精确率和66.6%的召回率。Yi-Feng Lin等使用基于特征的最大熵模型并结合后处理过程,在分类为23个实体类别的genia语料上获得了72.9%的精确率和71.1%的召回率。Tzong-hanTsai等使用条件随机域模型结合丰富的特征集合和后处理过程在BIONLP2004测试语料上获得了69.1%的精确率和71.3%的召回率。
近两年来,生物医学领域命名实体识别的研究不断扩展和深入。一是命名实体识别扩展到新的语义类型,如临床术语、化学名词语义类等。二是各种新方法的应用,如自动构建训练语料的bootstrapping方法,多分类器结果的重新排序(reranking)方法等。此外还有嵌套命名实体识别。
目前性能最好的生物医学领域NER系统的F测度已经达到80%以上,但与通用领域NER结果(90%以上)还存在一定差距,还需要研究人员的进一步努力。
3 缩写词和同义词的识别
很多生物医学命名实体存在多个名称和缩写形式,因此必须有效地识别这些同义词和缩写词,目前大部分研究工作都集中在未登录的基因名同义词和命名实体缩写词的识别上。
抽取生物医学命名实体缩写词及其全称形式,所用方法依赖于全称和缩写词的接近程度。一般而言,全称或者缩写词通常在括号里,因此,识别缩写词被简化为寻找最佳的缩写词和对应全称的对齐过程,这样的对齐过程在很大程度上依赖于上下文。
大部分缩写词的识别方法属于以下三种方法之一:首字母匹配法、首字母和其他字母匹配法、特定模式匹配法。首字母匹配法最简单,即匹配缩写词每一个字母和周围文本中若干词的首字母。第二种方法是放宽条件,即允许匹配首字母之外的其他字母,这种方法一般使用启发式规则进行识别。第三种方法是识别那些后面还添加一定模式的缩写词,这也需要手工建立一些规则。
Liu和Friedman在大量MEDLINE文本中统计缩写词和全称的搭配,以此作为规则来检测缩写词与全称的配对,取得了96.3%的精确率和88.5%的召回率。在应用手工规则识别缩写词和全称的研究中,Yu等获得了95%的精确率和70%的召回率,Schwartz和Hearst在1000篇MEDLINE摘要的集合上识别与酵母有关的缩写词,获得了96%的精确率和82%的召回率。Chang使用缩写词特征训练逻辑回归模型,并且用这些特征评价缩写词的候选全称形式,在Medstract语料上获得了80%的精确率和83%的召回率。就目前识别精度来看,在单篇文章中自动识别生物医学缩写词和相应全称的问题已经基本解决,上述识别系统都取得了较高的精确率和召回率。今后的研究将把缩写词识别与其他文本挖掘任务结合,并应用到实际的生物医学文本挖掘系统当中。
同义词识别是建立一个能自动更新的同义词词表的基础,具有重要的应用价值。虽然从在线数据库中能获得基因名称的同义词列表,但这些数据库中多数为基因的正式名称,因此相对于文献中的实际基因名称,其数据并不完整。为了建立出现在文献中有代表性的基因和蛋白质名称同义词列表,需要从生物医学文本中自动抽取基因和蛋白质名称同义词。
Yu等人结合了AbGene基因命名实体识别系统,采用统计方法、基于支持向量机的分类器、基于自动生成模式和手工生成规则等算法相结合,同义词识别的召回率为80%,精确率为9%。Cohen采用自动模式抽取方法对MEDLINE摘要进行同义词抽取,通过分析同义词共现网络结构选取最佳同义词模式,获得的精确率为23%,召回率为21%,该系统可以根据文本中出现的词间的明确逻辑关系来推断它们是否为同义词,与没有类似推断的系统相比,召回率提高了10%。
基因和蛋白质名称的同义词抽取研究结果的精度普遍还较低,因此更具挑战性。目前,一种新的基因蛋白质名称的标准化工作正在开展,其研究步骤是首先进行基因和蛋白质名称的识别,然后再进行基因名称的规范化(Gene Name Normalization)。此外,使用Ontology方法用于同义词识别也是最新的研究趋势。
4 关系抽取
生物医学文本中关系抽取的目的是从多个给定类型的命名实体如基因、蛋白质和药物名称等当中检测是否存在预先指定类型的关系,如蛋白质之间的抑制关系,实体之间的从属关系等。大多数生物医学命名实体关系抽取系统主要抽取特定命名实体之间的二元关系,即两类命名实体之间的关系。
生物医学文本中的关系抽取还存在相当的困难,主要原因包括:文本中陈述同一事实有多种不同的陈述方式;文本中并不仅仅是简单的语法类型; 文本中包括很多未登录命名实体;关系信息存在于多个句子之中;存在很多不能抽取出任何关系信息的句子。
目前生物医学领域命名实体关系的抽取主要使用了以下方法:共现方法、关键词方法、机器学习方法和自然语言处理方法。
共现方法认为离得越近的命名实体越可能相关,越经常一起出现的命名实体越可能相关。PubGene系统使用共现方法建立了一个包含基因和基因交互关系的数据库,实验结果达到了60%的精确率和51%的召回率。当仅考虑出现在5篇或5篇以上文章中的基因对关系时,精确率上升到72%。还有研究者在同一个短语中或者同一个句子中查找共现的基因对。Ding等做了一项全面的量化研究实验,发现用共现方法识别关系在同一摘要中得到的精确率为57%,召回率为100%;而在同一句子中精确率为64%,召回率为85%;在同一短语中精确率为74%,召回率为62%。
为了识别关系的类型,识别算法必须检验相关的信息。一种简单的推断方法是识别那些可以区分特定类型关系的关键词或者短语,这就是关键词方法,其具体应用是使用词模式。在此方法中,研究者给出了一些生物医学命名实体模式和区分特定类型关系的常用词。这些模式通常比较简单,不需要更多的词性信息或者复杂的语义信息,如<protein A><action><proteinB>,这里的<action>是由14个词及其变体组成的词表;Ono等的方法中则使用了20个模式。
在基于机器学习方法的关系识别中,把句子中的关系共现表示成向量空间模型,然后使用分类器给句子中可能存在的关系打分。Eskin和Agichtein使用SVM算法和基因序列kernel来预测蛋白质在细胞质中的位置,其性能达到87%的精确率和71%的召回率;而预测蛋白质在过氧化物酶体中的位置,其精确率为44%,召回率为21%。JuanXiao等使用基于特征的最大熵模型识别蛋白质的交互作用关系(Protein-Protein Interaction,PPI)获得了88.0%的精确率和93.9%的召回率。Ameet SoniC343使用条件随机域模型识别PPI并和基于规则的系统作了对比,实验证明基于CRFs的系统比基于规则的系统识别性能有很大的提高。
用于关系抽取的自然处理方法一般要使用领域Ontology和句法结构分析。简单的方法可以只考虑词性,如在识别蛋白质和蛋白质的关系中,句子中的蛋白质名称都必须是名词。Thomas等仅使用词性作为是否存在关系的评分标准。句法分析器是生物医学文本中进行关系抽取的有利工具。如使用浅层句法分析器(Shallow Parser)确定已知动词的主语和宾语,使用完全句法分析器(Full Parser)确定句子中所有组成部分的关系。Park等使用句法分析器,使关系抽取结果达到了80%的精确率和48%的召回率。Zhongmin Shi等使用统计句法分析技术同时识别生物医学命名实体及其间的功能关系,通过使用有噪音标注数据的半指导学习方法获得了83.2%的F测度值。
Stephens等提出了使用向量空间模型从文本中识别基因对关系及其共现强度的方法,使用了TF-IDF计算公式和用户定义的阈值来挖掘命名实体之间的关系。文献中提出一种无指导的关系抽取方法,该方法使用了类似于互联网页面重要性评价HITS算法的思想,称为基于图的交互增强方法。
5 语料库建设和领域本体知识库
统计机器学习方法需要大量的已标注文本数据作为学习器的训练语料,所以,生物医学文献语料库的标注成为相关研究的基础。生物医学文本标注的内容主要包括命名实体、命名实体关系。目前国际上可以公开获取的生物医学文本挖掘的标注语料库有:GENIA语料库、GENETAG语料库(也是BioCreAtlve Task 1A的评测语料)、Medstract语料库、Yapex语料库、Protein Design Group(PDG)语料库和University of Wisconsin语料库等。表1中列出了每个语料的发行时间,语料内容的切分单位(以句子或摘要为单位),语料的大小(以词为单位)。表2中列出了各个语料可以应用的文本挖掘任务。
GENIA语料库是标注规模最大、语义分类最多、应用最广泛的标注语料库。该语料库标注包括词切分、句子切分、词性标注。语料中标注了关于人类血细胞转录因子领域的基因和基因产物命名实体,由2000篇MEDLINE摘要组成,共有18545个句子,39373个命名实体,36个语义类。它也是JNLPBA语料库的母语料库。需要指出的是:PDG和Wisconsin语料库中只列出所包含的命名实体,但没有指出所在文本中的位置,无法实现正确的评价,因此较难应用于一般的命名实体识别任务。Medstraet是这些语料中唯一有指代消解标注的,并且给出了缩写词的扩展形式。
上述语料库的原始语料皆出自国际权威的生物医学数据库MEDLINE,信息检索和文本挖掘研究主要集中在该数据库上。MEDLINE中生物医学文献数量目前已超过1 600万篇文献,其中超过300万篇文献是近5年内出版的。美国国立医学图书馆的Entrez-PubMed提供了免费的MEDLINE检索服务,是世界最著名和使用最广泛的MEDLINE网上检索系统,于1995年7月推出,已经成为科研人员获取医学文献信息的首选。PubMed提供了主题词检索和自由词检索。
MeSH(Medical Subject Headings)是美国国家医学图书馆(NLM)用以分析生物医学期刊文献等资源的主题内容的控制语汇表,也是NLM出版的MEDLINE数据库主题检索的索引词典。MeSH由22 995个主标题(Descriptors,main headings)组成,分为15个层次。MeSH主标题层级结构安排的目的是为信息检索提供服务。生物信息学中最具有权威性的本体论是基因本体论(Gene Ontology,GO),由基因本体论协会建立。其目标是建立一套结构化的、精确定义的、通用的控制性词汇,使其在任何生物体内都能描述基因和基因的产物所表现的角色。GO构建了3个相对独立的本体,即生物过程(Biological Process)、分子功能(Molecular Function)和细胞成分(Cell),它们是基因和基因产物的所有属性。
6 评测会议和相关学术会议
文本信息处理技术的评价通常包含两个部分:标准的评测数据集和评价标准。标准评测数据集一般由领域专家通过手工标注相关文本来获得,这样的数据集通常称为金标准(Golden Standard)。其中比较流行的金标准语料库是GENIA语料库。将 自动识别结果与标准数据集相比较,就可以评价某个文本挖掘技术目前所达到的水平。
生物医学文本挖掘评价标准与通常的文本挖掘评价标准类似,也是由精确率(Precision),召回率(Recall)和F测度(F-score)来评价的。
近年来出现了很多公开评测生物医学文本挖掘算法的国际会议,对本领域研究的发展起到了重要推动作用。表3列出了当前国际上主要的评测会议。
在近年来举行的竞赛和评测中,最有影响力的是TREC Genomics Track,该评测由美国国家技术标准局(National Institute of Standards andTechnology)支持。Genomics Track从2003年开始,以后每年一次,评测任务主要为分子生物学领域的文本检索和分类。2004年有29个研究组参加,2005年有41个研究组参加。我国大陆有复旦大学、清华大学、大连大学等几家单位先后参加这两届评测。
JNLPBA/BioNLP 2004(Joint Workshop onNatural Language Processing in Biomedicine andits Applications)评测是与国际计算语言学会议同时召开的研讨会,其主要评测任务是生物医学命名实体识别,共有八个参赛系统参加评测。BioNLP 2007的评测任务是临床医学文本多标记分类,共有50个参赛系统参加评测。BioCreAtlve(Critical AssEssment of Information Extractionsystems in Biology)也是一个重要的生物医学文本挖掘评测会议,由西班牙国家癌症研究中心CNIO、美国MITRE公司、美国生物技术信息中心NCBI等5个机构负责组织。该评测包括两个任务:其一是识别文本中的基因和蛋白质名称,除了识别命名实体外,各参评系统还要识别出这些命名实体的同义词;其二是用GeneOntology codes注释蛋白质,识别出蛋白质的功能。目前该评测已经举行了两届,2004年评测包括多种文本挖掘任务,共有10个国家的27个研究组参加了此次评测。2006年评测的总结会议在ACL2007上进行。
KDD(Knowledge Discovery and Data Mining)挑战杯是一个公开评测数据挖掘算法的竞赛。尽管KDD的传统任务既和文本无关也和生物医学领域应用无关,但是从2002年已经开始了生物医学文本挖掘任务的评测,这也是最早的关于生物医学文本挖掘的评测。KDD竞赛包括两部分:第一部分是识别基因功能;第二部分是预测基因对信号传输路径的影响。第二个任务可以作为一个统计分类问题来处理,其中涉及到基因功能信息、蛋白质定位以及蛋白质交互等。参赛者所建立的系统用来帮助FlyBase数据库管理。
生物医学文本挖掘是一个跨学科的交叉领域,自然语言处理、生物信息学、机器学习领域都召开了关于这个主题的学术研讨会(Workshop),在自然语言处理领域已经发展成为一个相对独立的研究分支。表4给出了各领域中相关学术会议情况。2000年以来,国际计算语言学界的两个主要学术会议ACL(Annual Meeting of the Association for Computational Linguistics)和COLING(InternationalConference on Computational Linguistics)的每届会议都有相关文章发表;从2003年起,每届会议均设有一个相关主题研讨会(Workshop)。生物信息学领域与生物医学文本挖掘相关的学术会议主要有从1996年开始每年一月在夏威夷举行的Pacific Symposium on Biocomputing(PSB)会议和始于1993年Intelligent Systems in MolecularBiology(ISMB)年度会议。从PSB2000开始,该会议几乎每届都把文本挖掘作为会议主题之一;PSB2007则提出了“New Frontiers in BiomedicalText Mining”的主题。和PSB差不多同时,ISMB也在每届会议发表了这方面的文章,并且近几年把文本挖掘和信息抽取列为会议主题之一。国际生物信息学杂志Bioinformatics近年来开辟了数据和文本挖掘专栏,每期均有此类文章发表。
国际机器学习研究领域也对生物医学文本挖掘表现了很大兴趣,2005年国际机器学会ICML(International Conference on Machine Learning)的一个Workshop是LLL05(Learning Language inLogic),其主题为:Challenge task:Extracting Relations from Bio-medieal Texts。会议为关系抽取提供了训练和测试语料、评测程序,有5个国家的6个研究小组参加了评测。
7 国内相关研究
目前国内在生物医学文本挖掘领域的研究相对还比较少,主要有清华大学和哈尔滨工业大学,均取得了一定成果。清华大学研究者在蛋白质关系抽取方面做了深入研究,其主要工作包括:基于动态规划算法的模式匹配方法,用于抽取蛋白质交互作用关系,取得了80%的召回率和精确率;在此基础上采用最小描述长度原理进行模式优化,进一步提高了抽取精度。他们还将模式匹配与浅层句法分析结合起来,通过句法和语义约束,很好地识别了生物医学文本中的同位和并列句,将原模式匹配方法的精确率和F测度提高了7%。哈工大研究人员主要致力于生物医学命名实体识别和关系的识别的研究,先后尝试了多种机器学习方法。先后应用SVM算法、Generalized Winnow、CRF等方法进行命名实体识别,在实现中选择了丰富特征并结合后处理过程,在相同测试集上取得了优于国际同类研究的结果。目前,他们在综合多种统计学习方法进行多分类器融合的研究上取得了一定的成果,进一步提高了生物医学命名实体识别的精确率和召回率。在关系识别的研究上主要应用基于特征的机器学习方法并取得了一定的成果。
8 结论与展望
关键词:肽类毒素 脂多糖内毒素 霉菌毒素 检测方法
项目类别:农业科技 项目编号:XF11C004 项目名称:徐州市乳品质量安全检测技术
生物毒素主要指微生物在生长代谢过程中产生的有毒化学物质,微量毒素侵入机体后即可引起生物机能破坏,使人畜中毒。包括肽类毒素、脂多糖内毒素、霉菌毒素等。
肽类毒素主要有溶血素、肠毒素等,其中产生溶血素的细菌主要有单核细胞增生李斯特菌、霍乱弧菌等。溶血素的致病机理是作用于细胞膜,造成其结构和功能的紊乱,使大量细胞内的成分泄漏,导致细胞死亡。产生肠毒素的细菌主要有金黄色葡萄球菌、大肠杆菌和蜡样芽孢杆菌等。肠毒素是细菌外毒素,通过吸收或在肠内产生,作用于肠黏膜,通常引起腹泻等不适症状。
脂多糖内毒素是革兰氏阴性菌细胞壁的主要组成成分。研究表明,过量的脂多糖内毒素可引起机体严重的病理生理反应,表现为发热、低血压、休克、器官功能衰竭甚至死亡等。
霉菌毒素是霉菌产生的一种有毒的次级代谢产物,它是主要的真菌毒素,多数具有致癌作用。霉菌毒素主要有:黄曲霉素、赭曲霉素、单端孢霉烯族毒素等。目前为止,黄曲霉毒素有 B 1、B 2、M 1、M 2、G 1、G2 等几种,其中黄曲霉素B1的毒性和致癌性最强,被称为第一大类致癌物。赭曲霉素有 A、B、C、D 共4 种,其中毒性最大的是赭曲霉素A。单端孢霉烯族毒素中比较常见的是A 类单端孢霉烯族毒素,它主要包括T-2 毒素和HT-2 毒素。
目前,生物毒素的检测技术已得到越来越多的重视,国内外学者对这些毒素也研究颇多。传统的检测技术以检测致病菌为主,需要培养,检测时间长。现代检测技术简便、快速、灵敏度高,且能达到微量检测的目的。本文对这些生物毒素的检测技术进行较为详细的阐述并对这些方法的特点进行总结。
1、肽类毒素的检测
肽类毒素传统的检测方法主要有:酶联免疫检测技术、聚合酶链反应技术和生物传感技术等。近年来产生了一些新兴检测技术,如:悬浮芯片技术等。
1.1 酶联免疫检测技术
酶联免疫检测技术是利用酶标记物同抗原抗体复合物的免疫反应与酶的催化放大作用相结合,当偶联物与固相载体上的抗原或抗体反应和酶的相应底物,即起催化水解或氧化还原反应而呈颜色。所生成的颜色深浅与待测标本含量成比例,由此进行定性或定量分析。酶联免疫检测技术是一种敏感、快速、简单的方法,应用较广,但是利用酶联免疫检测技术检测食品中金黄色葡萄球菌肠毒素时,会因为假阳性或假阴性影响检测结果。
1.2 聚合酶链反应技术
聚合酶链反应技术是一种在体外模拟DNA 复制过程,对特定的DNA或DN段进行快速扩增的方法。聚合酶链反应技术具有灵敏度高、检测时间短等优点。目前常用的聚合酶链反应种类有定性聚合酶链反应和荧光定量聚合酶链反应。荧光定量聚合酶链反应是把荧光基团加入普通聚合酶链反应技术反应体系中,利用荧光信号积累检测整个聚合酶链反应反应的进程,通过标准曲线对未知物进行定量。荧光定量聚合酶链反应比常规聚合酶链反应技术自动化程度更高、特异性更强,其应用也更广泛。根据报道已有包括葡萄球菌各型肠毒素,大肠杆菌毒素等30多种毒素可以应用聚合酶链反应来检验。
1.3 生物传感技术
生物传感技术是以酶的催化或者抗原抗体结合等特异反应,通过换能器将反应结果输出为可检测的信号通过信号分析定性或定量待测物质。生物传感器检测法具有分析速度快、检样微量、生物功能膜可反复多次使用等特点,可用于许多物质的检测。
1.4 悬浮芯片技术
悬浮芯片技术具有操作简便、重复性好、灵敏度高以及线性范围宽等优点。国外已经有利用悬浮芯片技术检测的报道。国内孙肖红等利用悬浮芯片系统建立检测模型,检测不同浓度金黄色葡萄球菌肠毒素B,其线性范围为0.2~1653.4ng/mL,最低检测值为203pg/mL均优于酶联免疫检测技术(最低检测质量浓度为60ng/mL),除与2.μg/mL金黄色葡萄球菌热休克毒素有交叉反应外,和其他几种细菌、毒素、蛋白均无交叉反应。实验证明悬浮芯片定量检测方法对于模拟添加的金黄色葡萄球菌肠毒素B 具有良好的检测效果。这比国外报道的荧光免疫层析法、磁免疫层析法、芯片传感器等方法的灵敏度都要高,与生物传感器- 质谱联用技术、毛细管芯片技术等在同一数量级。综合国内外对悬浮芯片的研究来看,该技术应用前景十分广阔,但是悬浮芯片能否从粉末样品中直接检测毒素和病原,尚缺乏模型和评价。
2、脂多糖内毒素的检测
1968年,国外研究人员Levin等建立了利用鲎实验检测脂多糖内毒素的方法。近几十年来,脂多糖内毒素的检测方法已有很大进展,实验简便、经济、准确性高,但是由于费时、响应慢、自动化程度低等原因已限制了其应用。近十年来出现了利用生物传感技术和气相色谱-质谱联用仪检测细菌内毒素的报道。国外研究人员Goh等用增强型绿色荧光蛋白固定在传感器上制成了荧光内毒素生物传感器,根据脂多糖内毒素与之结合时荧光强度的衰减检测细菌内毒素的含量。此荧光生物传感器存在非分析物产生的荧光干扰问题,是近年来发展较快的一类光学生物传感器。国内岳丽娜等利用气相色谱-质谱联用仪联用技术,对脂多糖内毒素标准品所含的3-羟基脂肪酸种类进行检测,用于分析脂多糖内毒素标准品菌种来源的纯度。结果表明脂多糖内毒素工作标准品中含有非肠道细菌,因此会出现误差,对检测结果产生影响。气相色谱-质谱联用仪联用法检测脂多糖内毒素,不受其标准品及细菌的生物活性的限制,可用于细菌内毒素标准品菌株来源的辅助监控及应用中的异常情况的研究分析。
此外,检测脂多糖内毒素也有酶联免疫检测技术、流式细胞术、化学发光测定法等方法,这些方法特异性、准确性高,但需要专业人员操作,步骤多,必须在实验室完成,其应用需要大量实际操作验证。
3、霉菌毒素的检测
检测霉菌霉素的常规方法由经典的薄层色谱法发展到高效液相色谱法、酶联免疫检测技术、免疫亲和层析法等。现在,质谱分析已被引入毒素分析中并衍生出各种质谱方法,如高效液相色谱法-常压化学电离质谱测定法、液质连用法、电喷雾-质谱法、液相串联质谱法、超高压液相联合三重四极杆质谱仪法,及同时测定上百种样品的高效液相色谱法-串联质谱-电喷雾阳离子等技术。随着这些新方法、新手段的发展,为霉菌毒素的检测提供了比较广的选择,适应了不同的检测目的和要求。
3.1 薄层色谱法
薄层色谱法是测定食品中霉菌毒素的经典方法,该方法操作简便、费用低、能同时定性定量霉菌毒素。其检测过程是:提取、柱层析、洗脱、浓缩、薄层分离。由于此方法操作繁琐、灵敏度低,现在的研究重点是改进样品的提取和净化方法,因此建立了薄层扫描法来测定霉菌毒素,进而提高薄层色谱法的精度。国内张寰等报道了利用薄层扫描法,在扫描仪上绘制黄曲霉毒素扫描图谱,并由此分辨出黄曲霉素种类,然后定量分析,从而得到样品的黄曲霉毒素含量。鉴于此方法的灵敏度低、安全性差等缺点,已越来越不适用现代分析的要求。
3.2 高效液相色谱法
高效液相色谱法具有高效、快速、灵敏度高、重现性好、检测限低、定量准确的特点,是定性定量霉菌毒素的常用方法,其中应用最广的是反相高效液相色谱法。国外研究人员Sobolev等利用高效液相色谱法,以新研发的氧化物质Al2O3作为流动相,对农产品的甲醇 ― 水提取液进行净化处理,样品中加标品2.5~7.5ng/g,结果表明:AFBl、AFB2、AFGl、AFG2 的回收率为 80%~87%,最低检测限为1.0ng/g,此方法与商业检测黄曲霉素方法相比,净化设备费用更低。国外研究人员Razzazi-Fazeli等利用高效液相色谱法-质谱联用仪检测单端孢霉烯族毒素,检测限为 5 0~8 5 n g / g,回收率为77%~101%。鉴于高效液相色谱法的这些优点,其在霉菌毒素检测中的应用越来越多,但是由于样品前处理较复杂,设备昂贵,操作时需专门人员等问题,难以满足快速检测的目的,限制了其应用。
3.3 酶联免疫检测技术
酶联免疫检测技术法灵敏度高、特异性强、操作简便,适宜大量样品的快速筛选,且设备费用比高效液相色谱法低,因此广泛用于霉菌毒素的检测。利用此方法检测霉菌毒素可以达到定性定量的目的。此外,根据酶联免疫检测技术开发的毒素试剂盒实现了快速检测霉菌毒素的目的。国外Saha等利用基于酶联免疫检测的流动装置检测红辣椒中黄曲霉素B1与赭曲霉毒素A,检测限分别为2ng/g 和10ng/g,结果证明此方法准确性高,与单独酶联免疫检测相关性良好,并且为欧盟的法定标准提供了简单、快速、有效的检测方法。酶联免疫检测测定结果易出现假阳性问题,且只能测定单一毒素。目前的一项研究是将酶联免疫检测技术和胶体金技术与噬菌体展示技术相结合,此方法可以显著提高检测限,缩短检测时间,同时可以减少毒素测定中所使用的毒素标准品对实验人员及环境的危害,这种结合技术应用前景广阔[ 31]。
3.4 免疫亲和柱法
免疫亲和柱是以单克隆免疫亲和柱为分离手段,根据单克隆抗体与载体蛋白偶联后将其填柱形成免疫亲和柱,并与霉菌毒素抗原产生一一对应的特异性吸附关系。免疫亲和柱法包括免疫亲和柱-荧光光度法和免疫亲和柱-高效液相色谱法。裴道国等采用改良型免疫亲和柱净化- 荧光光度检测技术检测花生及花生制品中的黄曲霉毒素。结果表明:改良后的方法具有更好的准确性和精密度,检测技术操作更简便,检测时间由传统的25min缩短至10min,大大提高了检测效率。免疫亲和柱-高效液相色谱法用于检测霉菌毒素在国内外的报道中也比较多。陈新等利用免疫亲和柱-高效液相色谱法分别定量地检测饲料中的黄曲霉毒素B1、B2、G1 和G2,在黄曲霉毒素B1为0~50μg/kg 测定范围内其线性相关系数为0.91,检测灵敏度为1μg/kg,可以作为测定饲料及饲料原料中的黄曲霉毒素B1的定量确认法。国外研究人员Aksenov等利用免疫亲和柱-荧光-高效液相色谱法检测了赭曲霉素,将检测限提高至0.5mg/kg,优化了其检测方法。免疫亲和柱法简便快速、灵敏度极高,一个样品只需10~15min,比传统方法快。特别是免疫亲和柱-高效液相色谱法可以特效性地将霉菌毒素或其他真菌毒素分离出来,分离效率和回收率高,比高效液相色谱法更有优势和应用前景。
4、结论
生物毒素的检测方法多种多样,但其灵敏度、精度、适用条件各不相同。近几年来,检测肽类毒素切实可用的检测方法主要是荧光定量聚合酶链反应技术和酶联免疫检测技术,生物传感器技术因其分析速度快、检样微量等特点,可用于许多物质的检测,但在国内的使用情况来看,由于成本高而不能被广泛采用。悬浮芯片技术由于操作简便、灵敏度高以及线性范围宽等优点,未来的应用前景将十分广阔。利用气色谱法-质谱联用仪检测脂多糖内毒素的技术相对比较成熟,而免疫学方法在我国还处于理论阶段,未来还需要大量的实践验证及优化。检测霉菌毒素较常用的检测方法是酶联免疫检测技术法和免疫亲和柱法。酶联免疫检测技术法法操作简便,成本比较低,适合大量样品的快速筛选,且设备费用较低,因此在我国已广泛应用。免疫亲和柱法快速简便、灵敏度极高,分离效率和回收率高。另外,国外一些新技术的发现和使用,在我国是值得引进且具有推广价值的。
参考文献
[1] 郭萌, 李冠民, 黄清泉. 细菌内毒素研究进展[J]. 中国实验动物学报2009, 17(5): 397-401。
[2]何健, 李艳霞. 发酵肉制品中生物胺研究进展[J]. 肉类工业, 2009(2):47-50。
[3]志军, 吴永宁, 薛长湖. 生物胺与食品安全[J]. 食品与发酵工业,2004, 30(10): 84-91。
[4]孙肖红, 王静, 姜永强, 等. 建立金黄色葡萄球菌肠毒素B悬浮芯片定量检测方法[J]. 中国食品卫生杂志, 2009, 12(6): 485-488。
关键词:榉树;生物学特性;繁殖;栽培
中图分类号 S79 文献标识码 A 文章编号 1007-7731(2017)11-0122-03
Advances in Biological Characteristics and Propagation of Zelkova schneideriana
Wang Xiaoli1 et al.
(1Teaching and Research Room of Garden,School of Civil Engineering,Suqian College,Suqian 223800,China)
Abstract:Zelkova schneideriana is a wide range of broadleaf timber species,often used in landscaping,is China's key protection of one of the endangered plants. In this paper,the latest progress of the recent research on beech was summarized from the aspects of morphological characteristics,biological characteristics,natural distribution,seed propagation,cutting propagation technology,graft propagation,tissue culture,propagation and cultivation techniques of Zelkova schneideriana species. And developing prospects were also outlined.
Key words:Zelkova schneideriana;Biological Characteristics;Propagation;Cultivation
问鳎Zelkova schneideriana),又被称作大叶榉、红榉、黄榉、毛脉榉等,属于榆科(Ulmaceae)榉树属(Zelkova)植物,是我国特有植物物种资源,国家重点保护二级植物[1]。榉树作为亚热带常绿阔叶林的组成树种,在生态环境的保护与维持具有十分重要的作用[2]。因其株形高大、枝干优美,丰富的叶色变化,榉树是优良的园林观赏树种[3]。木材致密、坚硬,质感美观,是家具、装饰物品等上好的用材原料[4]。近年来,由于环境不断遭到破坏以及榉树林木资源的过度采伐,榉树野生资源已经非常稀缺,因此对于榉树的保护、开发、利用显得尤为重要[5]。本文总结了榉树的生物学特性、榉树在国内的自然分布、繁殖培育技术等研究现状,为进一步研究、开发、利用榉树资源提供指导。
1 榉树的生物学特性及自然分布
1.1 植物学特征 榉树为落叶乔木或小灌木,植株高大,树皮灰色而且光滑,呈现鳞片状剥落。榉树叶片为单叶,交互着生,叶片较厚,叶形为卵形、椭圆形或披针形等,叶片表面比较粗糙,叶片边缘有锯齿,背面密生绒毛;有托叶,托叶离生,托叶披针形。雌雄同株,夹杂完全花。雄花生长在嫩枝下部的叶腋处,花被片4~5裂,雄蕊4~5枚;雌花或者为两性花,花单生或数朵着生在上部叶腋内,子房1心室,具2个花柱。果实为小核果,有宿存花被和花柱,种胚弯曲[6]。
1.2 榉树的生理、生化特性 榉树喜爱光照,适于在气候温暖、湿润、土壤肥沃的环境下生长。沈建军等对榉树幼苗的生长发育规律进行研究,结果发现:榉树幼苗生长发育规律,基本符合典型的植物“快-慢-快”的生长模式,在年净生长量中,1―7月逐渐递增,8月份最大,以后逐渐递减,直至停止[7]。张日清等对榉树实生苗生长状况与植株四种内源激素的关系进行了分析,发现吲哚乙酸、玉米素、赤霉素和脱落酸四种激素在年周期上,处在不断的变化中,脱落酸和赤霉素,吲哚乙酸和玉米素含量的比值呈现“高-低-高”的变动规律,一年中,榉树出现两个生长高峰,分别在5月份和8月份[8]。张日清的这一结果和沈建军的研究结果相一致。通过对榉树在生长季节中日光合速率研究发现,榉树也存在着光合午休现象,上午08:00左右为第1个光合高峰,为全天净光合速率的最高峰。以后有所下降,13:00左右,光合速率有所下降,直至达到最低点,然后又有所升高,但第二个高峰不及早上08:00光合速率的水平。榉树虽然存在光合午休现象,但榉树日净光合速率水平很高,平均为8.99μmolCO2/(m2・s),表明榉树光合能力较强,同化速度快,外在表现是榉树具有有较快的生长性[9]。某些植物可以耐受一定量NaCl盐的胁迫,原因在于植物本身具有强大的抗氧化系统,通过调节抗氧化系统的各种酶活性,来抵御外界的不良环境。榉树幼苗也可以通过增加SOD,POD等的抗氧化酶的活性,来降低盐胁迫产生的影响。低盐处理下,植株生长正常,随着NaCl浓度的升高以及胁迫时间的延长,死亡率逐渐提高,抗氧化系统酶活性也减弱[10]。但研究发现,榉树种子萌发时对NaCl胁迫较为敏感[11]。曹娴等对同一区域内的23株榉树,根据榉树叶片颜色的差异,利用简单序列重复区的DNA序列进行分子标记,分析榉树遗传差异,结果发现,榉树有较高的遗传多样性,从而榉树进化研究和人工选择培育榉树资源在遗传背景上提供了基础[12]。
1.3 分布范围 榉树在我国主要分布在华中至西南以东广泛地区[13],在我国大部分省均有分布等[14]。
2 榉树的繁殖技术
2.1 种子繁殖技术
2.1.1 采集 以健壮树作为母树进行采种。采种时间一般为10月中下旬,种子采后,去杂质,在室内自然阴干[15]。榉树种子采收后,当年很难萌发。研究发现种子有休眠。现发现用湿沙和种子混匀,用塑料袋包装置于低温下进行层积处理,贮藏至第二年春季3月播种,则发芽率可提高4~5倍[16]。
2.1.2 预处理与播种 榉树种子处理有助于萌发。湿沙低温贮藏再结合赤霉素浸泡处理,效果更好,发芽率则提高到61.67%[17]。播种(南方)以雨水至惊蛰时节当气温升至12℃以上,地表温度在10℃时为最好。加磷肥拌种,一般采用条播(条距25cm)的方式。
2.2 扦插技术 榉树现无性繁殖的主要方式是扦插繁殖,以沙子与黄心土(体积比1∶4)混合物作为扦插基质,扦插时间一年可两次,分别为3月和9月。扦插选材以生长健壮的直立、嫩枝为宜。插穗截好后,可用适当浓度生根粉浸泡插穗下部以促使生根。扦插后覆膜、保温、遮阳,定期浇水,定期检查生根情况[18]。有学者研究发现,榉树扦插插穗选择以选用直径大于0.8cm的枝条为宜,下切口适当浸泡ABT,扦插季节以春季最好,生根率高[19]。张春桃等发现扦插选材与母树树龄相关,随着母树树龄增加,扦插生根率明显下降,扦插的采穗母树以幼龄树为好[20]。
2.3 嫁接技术 嫁接砧木以1~2年生白榆实生苗为宜、白榆地径在1.5~2cm。榉树接穗以选择1~2年生的嫩枝。榉树嫁接可分为枝接和芽接。枝接在每年的4月进行,嫁接时间过早会导致成活率较低,嫁接时间过迟则会影响新梢的生长发育,所以要把握好嫁接时间。枝条嫁接法可以采用劈接法、皮下接法。应用芽嫁接一般在集中在每年7月下旬到8月中旬进行,用方块形芽接后,绑扎好,使接穗芽部的内皮层与砧木密接,有利于接穗和砧木之间的物质交流与愈合,提高嫁接成活率[21]。
2.4 组织培养研究 组织培养技术是植物快速繁殖的有效手段。钟飞霞通过种子萌发小苗后的植株嫩茎、嫩叶作为接种材料,结果在WPM培养基上诱导出愈伤组织[22]。金晓玲等以一年生嫩枝作为诱导芽外植体,接种于MS基本培养基上,外加不同浓度与种类的外源激素进行培养,筛选出了诱导榉树芽萌发最佳培养基[23]。刘雪梅等以器官发生的途径对榉树进行无性繁殖技术试验,发现适合不定芽诱导的培养基为MS基本培养基,外加一定浓度的BA[24];刘海龙等研究榉树叶片器官再生植株技术,以叶片作为材料,诱导愈伤组织,结果发现幼嫩叶片诱导愈伤组织最佳[25]。
3 栽培与管理养护
榉树在幼苗期生长迅速,1年生苗株高可达1.5m。立春前后栽植,移栽时穴施有机肥。适当密植,以培育通直干形苗木。经间伐后,可以培育大苗[26]。沙壤土透气性好,是适宜榉树生长的土壤条件。榉树的造林模式现多为榉树纯树林或同其他乔木的混交林[27]。大苗移栽宜在秋季落叶后进行,此时树液流动减弱,生理活动微弱,抗性增强,较容易成活,移栽后加强管理养护也是提高成活率的有效手段[28]。
4 展望
榉树资源具有广泛的用途,但现今由于各种因素的影响,榉树资源日趋枯竭。因此,今后应着重加强以下几个方面的工作:(1)继续加强榉树生物学特性基础研究,进行榉属树种遗传多样性的保护;(2)重点培育榉树新品种,建立榉树种质资源库。加强筛选株形美观,叶色鲜艳的新品种。培育快速生长,品质优良的用材新品种;(3)加强榉树无性繁殖技术研究,建立榉树快速无性繁殖体系;(4)开展榉属生态系统效应研究,为提高经济和生态效益,走可持续发展之路奠定基础。
参考文献
[1]中国树木志编委会.中国主要树种造林技术(上册)[M].北京:农业出版社,1976:580-583.
[2]中国科学院中国植物志编辑委员会.中国植物志(第二十二卷)[M].北京:科学出版社,1999:382-386.
[3]茹雷鸣,张燕雯,姜卫兵.榉树在园林绿化中的应用[J].广东园林,2007(6):50-52.
[4]江苏省植物研究所.江苏植物志:下册[M].南京:江苏科学技术出版社,1982:63-64.
[5]汪灵丹,张日清.榉树的研究进展[J].广西林业科学,2005,34(4):188-191.
[6]蒋华伟,姜红卫,李静会,等.榉树的研究进展[J].江苏林业科技,2012,39(5):51-54.
[7]沈建军,冯小燕,柏明娥,等.榉树温室育苗试验及苗期生长规律研究[J].山东林业科技,2012(1):15-17.
[8]张日清,杨婕,金晓玲,等.榉树实生苗苗期内源激素含量的动态变化[J].经济林研究,2011,29(4):1-5.
[9]王旭军,吴际友,唐水红,等.红榉光合生理特性日变化规律[J].湖南林业科技,2012,39(1):10-13.
[10]窦全琴,焦秀洁,张敏,等.土壤NaCl含量对榉树幼苗生理特性的影响[J].西北植物学报,2009,29(10):2063-2069.
[11]焦秀洁,何开跃,窦全琴.NaCl胁迫对榉树种子萌发及幼苗生理指标的影响[J].林业科技开发,2009,23(4):55-58.
[12]曹娴,罗玉兰,崔心红,等.榉树遗传变异分析及优良单株选择[J].上海交通大学学报:农业科学版,2010,28 (6):499-503.
[13]Chen C J,Fu L K,Zelkova.In Chen H,Huang C J(eds.),Reipublicae Popularis Sinicae[M].Beijing:Science Press,1998,22:334-4l3.
[14]萨仁,苏德毕力格.榆科榉属的植物地理学[J].云南植物研究,2003,25(2):123-128.
[15]舒三洪,梅小华,谢禄山.榉树播种育苗技术[J].湖南林业科技,2013,40(6):47-49.
[16]沈建军,黄旭波,柏明娥,等.榉树种子形态特征与萌发特性研究[J].浙江林业科技,2011,31(6):56-59.
[17]李铁华,张伟,文仕知,等.贮藏温度与时间对榉树种子活力及抗氧化特性的影响[J].中南林业科技大学学报,2012,32(9):1-5.
[18]胡红泉,崔同林.珍贵树种榉树的生物学利用价值及繁育技术[J].安徽农学通报,2011,17(15):79-80.
[19]刘德良,张琴,陈志阳.榉树扦插繁殖试验[J].中南林学院学报,2001,21(1):93-94.
[20]张春桃,胡希军,罗雪梅,等.榉树的扦插繁殖技术[J].经济林研究,2011,29(2):108-110.
[21]奚钊,韦新和.榉树的繁殖技术[J].吉林农业,2012,265(3):165.
[22]钟飞霞.榉树无性繁殖技术研究[D].长沙:中南林业科技大学,2010:33-35.
[23]金晓玲,何平,张日清.榉树茎尖的培养[J].中南林学院学报,2005,25(1):38-41.
[24]刘雪梅,罗雪梅,王征,等.直接器官发生途径的榉树微繁体系建立[J].湖南范大学自然科学学报,2014,37(2):17-21.
[25]刘海龙,张日清,汪灵丹,等.榉树叶器官再生植株技术[J].广西林业科,2013,42(3):231-233.
[26]罗明芳,李家平,管朝华,等.榉树苗木培育技术[J].江苏林业科技,2009,36(3):38-39.
[27]何平,金晓玲,盛卫平,等.立地条件和营林模式对榉树生长的影响[J].中南林业科技大学学报,2010,30(12):11-16.
关键词 高尔夫 挥杆 生物力学
高尔夫球运动是一项以球杆击球入洞的体育运动,被公认为世界上可接触时间最长、温和而智能的运动。高尔夫球曾作为正式的比赛项目参加了1900年和1904年两届奥运会,1904年之后由于场地和水质标准的限制,高尔夫球退出了奥运会的赛场。2009年国际奥委会宣布高尔夫球将作为正式的比赛项目回归2016年里约热内卢奥运会,高尔夫回归奥运会的决议无疑是对高尔夫球运动在全球发展的一次巨大的推动。挥杆技术是高尔夫球的基本动作,技术水平高低决定成败,因此运用运动生物力学研究高尔夫球的挥杆技术将成为国内外科研的重点之一。
一、高尔夫球挥杆技术运动生物力学研究现状
国外学者利用红外线捕捉、高速摄像等采集到的运动学数据进行分析,做成高尔夫自动分析软件、模拟软件,使技术动作得到极大的改进。我国对高尔夫球挥杆技术研究起步较晚。
(一)高尔夫球挥杆技术生物学分析
肌电是生物学研究的重要手段,肌电图能够分析人体完成运动动作时肌肉参与活动的强度、参与工作时间的顺序及相互协作的关系。刘新明通过肌电测试仪和环节受力分析法进行实验,对全挥杆技术动作肌肉工作特征进行了比较,得出全挥杆动作肌肉最大用力时刻的出现晚于击球时刻。
(二)高尔夫球挥杆技术运动学分析
国内对高尔夫挥杆技术运动学分析较为常用的是APAS艾利尔运动技术分析软件及DLT生物力学三维录像分析方法。张吾龙等[1]对我国高尔夫职业选手张连伟短推技术进行了分析,得出挥杆是由肩膀与两臂做动作,上杆轨迹略带弧度,下杆时击球加速,左手引导下杆动作,右手在后辅助向前推。阮哲[3]通过对梁文冲等四名国际优秀高尔夫选手的挥杆技术的三维录像和解析,得出挥杆过程中髋关节率先启动与加速,并引导肩部迅速向旗杆方向加速直至击球瞬间,上肢关节完成类似鞭打动作击球。车旭升等[6]对不同水平的高尔夫球员的木杆挥杆技术动作进行分析,得出高水平高尔夫球运动员的上、下杆挥杆节奏用时比例接近于80:20,击球瞬间高水平球员的身体重心都非常接近原点。孙胜[5]运用三维技术动作分析系统对职业男子高尔夫运动员的推杆技术动作进行了研究,进而揭示推杆头部在时间和空间上整个动作没有像钟摆一样摆动,但像钟摆一样有节奏的摆动推杆的训练会有很大帮助。李淑媛等[9]对男子高尔夫运动员全挥一号木杆技术动作进行信息采集、量化分析:以最大杆头线速度高低划分组别,得出各组上杆阶段用时都在1s左右;下杆阶段高速组比低速组用时更短;高速组上杆过程中,保持右膝关节角基本不变,而低速组则呈现增大趋势;高速组躯干角由瞄球准备到击球几乎保持不变。毛建勋[8]利用二维摄像法和人体录像解析系统对一名高尔夫教练挥杆动作进行了正面的定点拍摄,对所得运动参数进行量化与分析,得出挥杆时要放松肌肉,挥杆时肩部以及挥臂的力量要与转体的力量保持平衡状态;下杆击球时手腕的力量要保留到最后再进行释放。
(三)高尔夫球挥杆技术动力学分析
目前应用于动力学参数的测量手段主要有三维测力台。叶强等[4]对技术定型期球手进行试验,得出上杆初期、后期和下杆初期时间比为7:6:3,通过使用压力板观测击球过程中重量转移的变化,得出杆顶点时刻双足维持均衡,身体扭转相对更充分。
(四)高尔夫挥杆技术运动生物力学理论分析
李睿[2]用运动生物力学的碰撞理论和鞭打原理纠正了挥杆击球中的技术错误,得出高尔夫球的击打特点:击球时杆头速度越大,给予球的初速度越大。挥杆时手臂摆动若要兼具“环绕”的力量和“鞭抽”的力量。
二、趋向预测
随着高尔夫球运动技术研究工作的进展,将运动生物力学的方法手段同现代科技手段结合,采用多机同步测试、录像视频分析系统进行适时的监控和反馈技术动作的研究将会越来越多。可以预见的是,对高尔夫球运动发展的研究将达到一个前所未有的高度。
参考文献:
[1] 张吾龙,陈观云.我国高尔夫职业选手张连伟短推技术的运动学分析[J].武汉体育学院学报.2006.40(3).
[2] 李睿.高尔夫挥杆技术常见错误分析[J].长治学院学报.2008.25(2).
[3] 阮哲.世界高水平高尔夫运动员挥杆动作中肩髋关节生物力学分析[J].北京体育大学学报.2010.33(11).
[4] 叶强,曹全军.高尔夫球挥杆击球过程中重量转移的足底压力分析[J].南京体育学院学报(自然科学版).2012.11(5).
[5] 孙胜.职业高尔夫球运动员推杆技术动作的运动学分析[J].中国体育科技.2012.48(1).
[6] 车旭升,金春光.高尔夫木杆挥杆技术动作的运动力学分析[J].河北体育学院学报.2012.26(4).
[7] 叶强,曹全军.高尔夫球挥杆击球过程中重量转移的足底压力分析[J].南京体育学院学报(自然科学版).2012.11(5).