前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇神经网络的反向传播范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
[关键词]有机碳含量评价 神经网络
中图分类号:TP183 文献标识码:A 文章编号:1009-914X(2015)45-0356-01
1 BP神经网络基本原理
BP神经网络,即误差反传误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。
2 BP神经网络工作机理
2.1 正向传播
图中,表示神经元的输入,表示输入层与隐含层之间权值,为隐含层与输出层之间的权值,f()为传递函数,为第k个神经元输出。假设BP神经网络输入层有n个节点,隐含层有q个节点,输出层m个节点。
隐含层第k个神经元的输入:
经过传递函数f()后,则隐含层第k个神经元的输出:
其中f()为单调递增且有界,所以一定有最大值。
输出层第j个神经元输出:
2.2 反向传播
输入P个学习样本,通过传入网络后,输出,第P个样本误差:
式中:期望
全局误差E:
输出层权值的变化,通过调整,使得全局误差E最小,得出输出层神经元权值调整公式:
隐含层神经元的调整公式:
3 应用实例
选择AC,DEN,CNL,GR,PE,RD作为输入曲线。XX井的53个点的岩心数据,从中选出30个点作为训练样本,23个点作为预测,构建网络,对全井段处理。结果对比(如图3-1),发现神经网络计算的TOC比传统的法计算的TOC效果好。其中TOC_NN为神经网络预测TOC,TOC_DaltalogR_AC为法计算的TOC。
4 结论
BP神经网络预测TOC克服了常规解释模型的缺陷,不用选择解释参数,计算结果与解释人员经验无关,预测结果精度有较大幅度的提高。利用多种测井解释数据及岩心分析资料作为网络训练样本,通过网络的训练、学习,建立了BP网络TOC模型,并利用该模型预测该地区新井的TOC值,实验证明用该模型进行TOC预测是可行的。
参考文献
[1]杨斌.神经网络及其在石油测井中的应用[M].北京:石油工业出版,2005:111-115.
[2]罗利,姚声贤.神经网络及模式识别技术在测井解释中的应用[J].测井技术,2002.
【关键词】 图像识别技术 神经网络识别
模式识别研究的目的是用机器来模拟人的各种识别能力―比如说模拟人的视觉与听觉能力,因此图像识别的目的是对文字、图像、图片、景物等模式信息加以处理和识别,以解决计算机与外部环境直接通信这一问题。可以说,图像识别的研究目标是为机器配置视觉“器官”,让机器具有视觉能力,以便直接接受外界的各种视觉信息。
一、图像识别系统
一个图像识别系统可分为四个主要部分:被识图像、图像信息获取、图像预处理、图像特征提取、分类判决。
二、图像识别方法
图像识别的方法很多,可概括为统计(或决策理论)模式识别方法、句法(或结构)模式识别方法、模糊模式识别方法以及神经网络识别方法。重点介绍神经网络识别方法。
2.1神经网络识别方法
2.1.1人工神经网络的组成
人工神经网络(简称ANN)是由大量处理单元经广泛互连而组成的人工网络,用来模拟脑神经系统的结构和功能。而这些处理单元我们把它称作人工神经元。
2.1.2人工神经网络的输出
2.1.3人工神经网络的结构
人工神经网络中,各神经元的不同连接方式就构成了网络的不同连接模型。常见的连接模型有:前向网络、从输入层到输出层有反馈的网络、层内有互联的网络及互联网络。
2.1.4 学习算法
1)感知器模型及其算法
算法思想:首先把连接权和阈值初始化为较小的非零随机数,然后把有n个连接权值的输入送入网络中,经加权运算处理后,得到一个输出,如果输出与所期望的有较大的差别,就对连接权值参数按照某种算法进行自动调整,经过多次反复,直到所得到的输出与所期望的输出间的差别满足要求为止。
2)反向传播模型及其算法
反向传播模型也称B-P模型,是一种用于前向多层的反向传播学习算法。
算法思想是:B-P算法的学习目的是对网络的连接权值进行调整,使得调整后的网络对任一输入都能得到所期望的输出。学习过程包括正向传播和反向传播。正向传播用于对前向网络进行计算,即对某一输入信息,经过网络计算后求出它的输出结果;反向传播用于逐层传递误差,修改神经元之间的连接权值,使网络最终得到的输出能够达到期望的误差要求。
B-P算法的学习过程如下:
第一步:选择一组训练样例,每一个样例由输入信息和期望的输出结果两部分组成;第二步:从训练样例集中取出一样例,把输入信息输入到网络中;第三步:分别计算经神经元处理后的各层节点的输出;第四步:计算网络的实际输出和期望输出的误差;第五步:从输出层反向计算到第一个隐层,并按照某种原则(能使误差向减小方向发展),调整网络中各神经元的权值;第六步:对训练样例集中的每一个样例重复一到五的步骤,直到误差达到要求时为止。
3)Hopfield模型及其学习算法
它是一种反馈型的神经网络,在反馈网络中,网络的输出要反复地作为输入再送入网络中,使得网络具有了动态性,因此网络的状态在不断的改变之中。
算法思想是:
(a) 设置互连权值
其中xis是s类样例的第i个分量,它可以为1或0,样例类别数为m,节点数为n。
(b) 未知类别样本初始化。 Yi(0)=Xi 0≤i≤n-1
其中Yi(t)为节点I在t时刻的输出,当t=0时,Yi(0)就是节点I的初始值,Xi为输入样本的第I个分量。
(c) 迭代直到收敛
(江苏科技大学电子信息学院,江苏镇江212003)
摘要:在实际交通环境中,由于运动模糊、背景干扰、天气条件以及拍摄视角等因素,所采集的交通标志的图像质量往往不高,这就对交通标志自动识别的准确性、鲁棒性和实时性提出了很高的要求。针对这一情况,提出一种基于深层卷积神经网络的交通标志识别方法。该方法采用深层卷积神经网络的有监督学习模型,直接将采集的交通标志图像经二值化后作为输入,通过卷积和池采样的多层处理,来模拟人脑感知视觉信号的层次结构,自动地提取交通标志图像的特征,最后再利用一个全连接的网络实现交通标志的识别。实验结果表明,该方法利用卷积神经网络的深度学习能力,自动地提取交通标志的特征,避免了传统的人工特征提取,有效地提高了交通标志识别的效率,具有良好的泛化能力和适应范围。
关键词 :交通标志;识别;卷积神经网络;深度学习
中图分类号:TN911.73?34;TP391.41 文献标识码:A 文章编号:1004?373X(2015)13?0101?06
收稿日期:2015?01?09
基金项目:国家自然科学基金面上项目(61371114)
0 引言
随着智能汽车的发展,道路交通标志的自动识别[1?3]作为智能汽车的基本技术之一,受到人们的高度关注。道路交通标志识别主要包括两个基本环节:首先是交通标志的检测,包括交通标志的定位、提取及必要的预处理;其次是交通标志的识别,包括交通标志的特征提取和分类。
如今,交通标志的识别方法大多数都采用人工智能技术,主要有下述两类形式[4]。一种是采用“人工特征+机器学习”的识别方法,如基于浅层神经网络、支持向量机的特征识别等。在这种方法中,主要依靠先验知识,人工设计特征,机器学习模型仅负责特征的分类或识别,因此特征设计的好坏直接影响到整个系统性能的性能,而要发现一个好的特征,则依赖于研究人员对待解决的问题的深入理解。另一种形式是近几年发展起来的深度学习模型[5],如基于限制波尔兹曼机和基于自编码器的深度学习模型以及卷积神经网络等。在这种方法中,无需构造任何的人工特征,而是直接将图像的像素作为输入,通过构建含有多个隐层的机器学习模型,模拟人脑认知的多层结构,逐层地进行信息特征抽取,最终形成更具推广性和表达力的特征,从而提升识别的准确性。
卷积神经网络作为深度学习模型之一,是一种多层的监督学习神经网络,它利用一系列的卷积层、池化层以及一个全连接输出层构建一个多层的网络,来模仿人脑感知视觉信号的逐层处理机制,以实现视觉特征信号的自动提取与识别。本文将深层卷积神经网络应用于道路交通标志的识别,通过构建一个由二维卷积和池化处理交替组成的6层网络来逐层地提取交通标志图像的特征,所形成的特征矢量由一个全连接输出层来实现特征的分类和识别。实验中将加入高斯噪声、经过位移、缩放和旋转处理的交通标志图像以及实际道路采集交通标志图像分别构成训练集和测试集,实验结果表明,本文所采用的方法具有良好的识别率和鲁棒性。
1 卷积神经网络的基本结构及原理
1.1 深度学习
神经科学研究表明,哺乳动物大脑皮层对信号的处理没有一个显示的过程[5],而是通过信号在大脑皮层复杂的层次结构中的递进传播,逐层地对信号进行提取和表述,最终达到感知世界的目的。这些研究成果促进了深度学习这一新兴研究领域的迅速发展。
深度学习[4,6?7]的目的就是试图模仿人脑感知视觉信号的机制,通过构建含有多个隐层的多层网络来逐层地对信号特征进行新的提取和空间变换,以自动学习到更加有效的特征表述,最终实现视觉功能。目前深度学习已成功地应用到语音识别、图像识别和语言处理等领域。在不同学习框架下构建的深度学习结构是不同的,如卷积神经网络就是一种深度的监督学习下的机器学习模型。
1.2 卷积神经网络的基本结构及原理
卷积神经网络受视觉系统的结构启发而产生,第一个卷积神经网络计算模型是在Fukushima 的神经认知机中提出的[8],基于神经元之间的局部连接和分层组织图像转换,将有相同参数的神经元应用于前一层神经网络的不同位置,得到一种平移不变神经网络结构形式。后来,LeCun 等人在该思想的基础上,用误差梯度设计并训练卷积神经网络[9?10],在一些模式识别任务上得到优越的性能。
卷积神经网络本质上是一种有监督的深度学习算法,无需事先知道输入与输出之间精确的数学表达式,只要用已知的模式对卷积神经网络加以训练,就可以学习到输入与输出之间的一种多层的非线性关系,这是非深度学习算法不能做到的。卷积神经网络的基本结构是由一系列的卷积和池化层以及一个全连接的输出层组成,可以采用梯度下降法极小化误差函数对网络中的权值和阈值参数逐层反向调节,以得到网络权值和阈值的最优解,并可以通过增加迭代次数来提高网络训练的精度。
1.2.1 前向传播
在卷积神经网络的前向传播中,输入的原始图像经过逐层的卷积和池化处理后,提取出若干特征子图并转换成一维特征矢量,最后由全连接的输出层进行分类识别。
在卷积层中,每个卷积层都可以表示为对前一层输入图像的二维卷积和非线性激励函数,其表达式可用式(1)表示:
式中:Yj 表示输出层中第j 个输出;Y l + 1i 是前一层(l + 1层)
的输出特征(全连接的特征向量);n 是输出特征向量的长度;Wij 表示输出层的权值,连接输入i 和输出j ;bj表示输出层第j 个输出的阈值;f (?) 是输出层的非线性
1.2.2 反向传播
在反向传播过程中,卷积神经网络的训练方法采用类似于BP神经网络的梯度最速下降法,即按极小化误差的方法反向传播调整权值和阈值。网络反向传播回来的误差是每个神经元的基的灵敏度[12],也就是误差对基的变化率,即导数。下面将分别求出输出层、池采样层和卷积层的神经元的灵敏度。
(1)输出层的灵敏度
对于误差函数式(6)来说,输出层神经元的灵敏度可表示为:
在前向传播过程中,得到网络的实际输出,进而求出实际输出与目标输出之间的误差;在反向传播过程中,利用误差反向传播,采用式(17)~式(20)来调整网络的权值和阈值,极小化误差;这样,前向传播和反向传播两个过程反复交替,直到达到收敛的要求为止。
2 深层卷积神经网络的交通标志识别方法
2.1 应用原理
交通标志是一种人为设计的具有特殊颜色(如红、黄、白、蓝、黑等)和特殊形状或图形的公共标志。我国的交通标志主要有警告、禁令、指示和指路等类型,一般采用颜色来区分不同的类型,用形状或图形来标示具体的信息。从交通标志设计的角度来看,属于不同类型(不同颜色)的交通标志在形状或图形上有较大的差异;属于相同类型(相同颜色)的标志中同类的指示信息标志在形状或图形上比较接近,如警告标志中的平面交叉路口标志等。因此,从机器视觉的角度来分析,同类型中同类指示信息的标志之间会比不同类型的标志之间更易引起识别错误。换句话说,相比于颜色,形状或图形是正确识别交通标志的关键因素。
因此,在应用卷积神经网络识别交通标志时,从提高算法效率和降低错误率综合考虑,将交通标志转换为灰度图像并作二值化处理后作为卷积神经网络的输入图像信息。图2给出了应用卷积神经网络识别交通标志的原理图。该网络采用了6层交替的卷积层和池采样层来逐层提取交通标志的特征,形成的特征矢量由一个全连接的输出层进行识别。图中:W1i(i=1,2,…,m1),W1(j j=1,2,…,m2),…,W1k(k=1,2,…,m(n?1))分别表示卷积层L1,L3,…,Ln - 1 的卷积核;Input表示输入的交通标志图像;
Pool表示每个池采样层的采样池;map表示逐层提取的特征子图;Y 是最终的全连接输出。
交通标志识别的判别准则为:对于输入交通标志图像Input,网络的输出矢量Y = [y1,y2 ,…,yC ],有yj = Max{y1,y2 ,…,yC},则Input ∈ j,即判定输入的交通标志图像Input为第j 类交通标志。
2.2 交通标志识别的基本步骤
深层神经网络识别交通标志主要包括交通标志的训练与识别,所以将交通标志识别归纳为以下4个步骤:(1) 图像预处理:利用公式Gray= 0.299R +0.587G + 0.114B 将彩色交通标志图像转换为灰度图像,再利用邻近插值法将交通标志图像规格化,最后利用最大类间方差将交通标志图像二值化。
(2)网络权值和阈值的初始化:利用随机分布函数将权值W 初始化为-1~1之间的随机数;而将阈值b 初始化为0。
(3)网络的训练:利用经过预处理的交通标志图像构成训练集,对卷积神经网络进行训练,通过网络前向传播和反向传播的反复交替处理,直到满足识别收敛条件或达到要求的训练次数为止。
(4)交通标志的识别:将实际采集的交通标志图像经过预处理后,送入训练好的卷积神经网络中进行交通标志特征的提取,然后通过一个全连接的网络进行特征分类与识别,得到识别结果。
3 实验结果与分析
实验主要选取了我国道路交通标志的警告标志、指示标志和禁令标志三类中较常见的50幅图像。考虑到在实际道路中采集到的交通标志图像会含有噪声和出现几何失真以及背景干扰等现象,因此在构造网络训练集时,除了理想的交通标志以外,还增加了加入高斯噪声、经过位移、旋转和缩放处理和实际采集到的交通标志图像,因此最终的训练样本为72个。其中,加入的高斯噪声为均值为0,方差分别为0.1,0.2,0.3,图像的位移、旋转、缩放的参数分别随机的分布在±10,±5°,0.9~1.1的范围内。图3给出了训练集中的交通标志图像的示例。图4是在实际道路中采集的交通标志图像构成的测试集的示例。
在实验中构造了一个输入为48×48个神经元、输出为50 个神经元的9 层网络。网络的输入是像素为48 × 48 的规格化的交通标志图像,输出对应于上述的50种交通标志的判别结果。网络的激活函数采用S型函数,如式(2)所示,其输出范围限制在0~1之间。
图6是交通标志的训练总误差EN 曲线。在训练开始的1 500次,误差能迅速地下降,在迭代2 000次以后是一个平稳的收敛过程,当迭代到10万次时,总误差EN可以达到0.188 2。
在交通标志的测试实验中,为了全面检验卷积神经网络的识别性能,分别针对理想的交通标志,加入高斯噪声、经过位移、旋转和比例缩放以及采集的交通标志图像进行实验,将以上测试样本分别送入到网络中识别,表2给出了测试实验结果。
综合分析上述实验结果,可以得到以下结论:(1)在卷积神经网络的训练学习过程中,整个网络的误差曲线快速平稳的下降,体现出卷积神经网络的训练学习具有良好的收敛性。
(2)经逐层卷积和池采样所提取的特征具有比例缩放和旋转不变性,因此对于旋转和比例缩放后的交通标志能达到100%的识别率。
(3)与传统的BP网络识别方法[11]相比较,卷积神经网络能够达到更深的学习深度,即在交通标志识别时能够得到更高的所属类别概率(更接近于1),识别效果更好。
(4)卷积神经网络对实际采集的交通标志图像的识别率尚不能达到令人满意的结果,主要原因是实际道路中采集的交通标志图像中存在着较严重的背景干扰,解决的办法是增加实际采集的交通标志训练样本数,通过网络的深度学习,提高网络的识别率和鲁棒性。
4 结论
本文将深层卷积神经网络应用于道路交通标志的识别,利用卷积神经网络的深层结构来模仿人脑感知视觉信号的机制,自动地提取交通标志图像的视觉特征并进行分类识别。实验表明,应用深层卷积神经网络识别交通标志取得了良好的识别效果。
在具体实现中,从我国交通标志的设计特点考虑,本文将经过预处理二值化的图像作为网络的输入,主要是利用了交通标志的形状信息,而基本略去了颜色信息,其优点是在保证识别率的基础上,可以简化网络的结构,降低网络的计算量。在实际道路交通标志识别中,将形状信息和颜色信息相结合,以进一步提高识别率和对道路环境的鲁棒性,是值得进一步研究的内容。
此外,本文的研究没有涉及到道路交通标志的动态检测,这也是今后可以进一步研究的内容。
参考文献
[1] 刘平华,李建民,胡晓林,等.动态场景下的交通标识检测与识别研究进展[J].中国图象图形学报,2013,18(5):493?503.
[2] SAHA S K,DULAL C M,BHUIYAN A A. Neural networkbased sign recognition [J]. International Journal of ComputerApplication,2012,50(10):35?41.
[3] STALLKAMP J,SCHLIOSING M,SALMENA J,et al. Man vs.computer:benchmarking machine learning algorithms for traf?fic sign recognition [J]. Neural Network,2012,32(2):323?332.
[4] 中国计算机学会.深度学习:推进人工智能梦想[EB/OL].[2013?06?10].http://ccg.org.cn.
[5] 郑胤,陈权崎,章毓晋.深度学习及其在目标和行为识别中的新进展[J].中国图象图形学报,2014,19(2):175?184.
[6] FUKUSHIMA K. Neocognition:a self ? organizing neural net?work model for a mechanism of pattern recognition unaffectedby shift in position [J]. Biological Cybernetics,1980,36(4):193?202.
[7] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient ? basedlearning applied to document recognition [J]. IEEE Journal andMagazines,1989,86(11):2278?2324.
[8] LECUN Y,BOTTOU L,BENGIO Y,et al. Backpropagationapplied to handwritten zip code recognition [J]. Neural Compu?tation,1989,1(4):541?551.
[9] CIRESAN D,MEIER U,MAsci J,et al. Multi?column deepneural network for traffic sign classification [J]. Neural Net?works,2012,32(2):333?338.
[10] NAGI J,DUCATELLE F,CARO D,et al. Max?pooling con?volution neural network for vision?based hand gesture recogni?tion [C]// 2011 IEEE International Conference on Signal andImage Processing Application. Kuala Lumpur:IEEE,2011,342?347.
[11] 杨斐,王坤明,马欣,等.应用BP神经网络分类器识别交通标志[J].计算机工程,2003,29(10):120?121.
[12] BUVRIE J. Notes on convolutional neural networks [EB/OL].[2006?11?12]. http://cogprints.org/5869/.
[13] 周开利,康耀红.神经网络模型及其Matlab 仿真设计[M].北京:清华大学出版社,2005.
[14] 孙志军,薛磊,许阳明,等.深度学习研究综述[J].计算机应用研究,2012,29(8):2806?2810.
[15] 刘建伟,刘媛,罗雄麟.深度学习研究进展[J].计算机应用研究,2014(7):1921?1930.
【关键词】短期负荷预测;BP神经网络;模拟退火算法
0 引言
电力的短期负荷预测是电力系统的一项重要工作,是实现供电可靠、经济管理的基础。由于电力负荷受到很多因素的影响,负荷预测方法发展至今,虽然已经积累了很多经验,但是还没有一种可靠的模型实用于不同地区。本文针对某市电力负荷的特点,提出了模拟退火BP神经网络电力短期负荷预测模型。经验证,该模型在实现负荷预测方面的可行性。
1 BP神网络
人工神经网络理论的研究始于1890年美国著名心理学家W.James关于人脑结构与功能的研究,至今已提出过许多网络模型,其中用于预测的网络主要是BP神经网络。这是因为BP神经网络主要有以下特点:(1)较强的非线性映射能力;(2)很好的泛化能力;(3)很强的容错能力和学习能力。
D.E. Ru melhart和J.L. Mc Cella nd及其研究小组于1986年研究并设计出来BP神经网络(Back-propagationN eutralN etwork)是一种基于误差反向传播(BP算法)的多层前向神经网络,采用有导师的训练方式。BP算法的学习过程包括信号的正向传播与误差的反向传播两个过程。三层BP网络是一种应用很普遍的神经网络,它包括输入层、隐层和输出层,如图1所示,输入层神经元的个数为输入信号的维数,隐含节点的个数视具体情况而定,输出层神经元的个数为输出信号的维数。BP网络的工作流程见图2所示。
图1 BP神经网络
误差的反向传播是BP网络的一大特点,但是,该网络也存在以下一些主要缺陷:(1)训练次数太多,效率较低;(2)易于陷入局部极小而不能实现全局最优。针对这些缺点,本文利用模拟退火算法对BP网络进行改进。
2 模拟退火算法
1953年Metropolis等提出的模拟退火算法 (Simulated Annealing,简称SA)能够近似求解具有NP复杂性的问题,可以避免陷入局部极小的问题。模拟退火算法主要包括状态产生函数、状态接受函数、温度更新函数、内循环终止准则和外循环终止准则。
其工作过程如图3所示。
图2 BP网络的工作过程
图3 模拟退火算法的流程图
3 神经网络负荷预测模型
本文设计的预测模型中BP神经网络的输入层共有8个输入端,分别用来输入待测日前四天对应时刻的负荷,以及天气因素中的最低温度、最高温度、降雨量和日期类型;因为本模型的输出为对应时刻的负荷,故输出层只有一个输出端;隐含节点的最佳个数现在没有一个具体的方法或者公式来确定,通过实验,本文最终取9个隐含节点。该模型工作流程见图4所示。
4 验证
本文利用该模型及单一的BP神经网络模型来预测某市的负荷。由于预测过程中所用的数据性质不同,大小差别很大,因此在使用之前,需要对数据进行归一化处理,对预测结果需要进行还原。本文所用的转移函数均为单极性Sigmoid函数。利用历史数据,进行预测,预测结果见图5所示。预测误差分布见图6所示。
图4 预测模型工作流程
图5 预测结果
图6 预测误差
通过以上预测结果可知,利用该模型在预测结果的准确性方面,比单一BP神经网络具有很大的优势,同时也验证了该模型的可行性。
5 结论
针对单一的BP神经网络的缺点,本文利用模拟退火算法来优化BP神经网络,经验证,该方法是可行的。
【参考文献】
[1]朱兴统.基于SA-LSSVM的电力短期负荷预测[J].科学技术与工程,2012,12(24):6171-6173.
[2]师彪,李郁侠,于新花,等.基于改进粒子群模糊神经网络的短期电力负荷预测[J].系统工程理论与实践,2010,30(1):157-166.
[3]李慧,王来运.基于混沌蚁群算法的电力短期负荷预测[J].北京信息科技大学学报,2011,26(4):40-43.
关键词:BP神经网络;土壤重金属污染
中图分类号:TP183 文献标识码:A DOI:10.11974/nyyjs.20170533219
1 材料与方法
1.1 研究区概况
以宜宾市翠屏区宋家乡洋坪村万宜粮油专业合作社粮食生产功能区252.07hm2农用地为研究区,该区地处中纬度北亚热带季风气候区,在地质构造上位于川东褶皱带永川帚状褶皱带的帚部;全区基岩广布,地层结构、岩石特性形迹明显,其中紫色岩层更是遍布于丘谷地区,多为侏罗系各组紫色岩层,岩层倾角10~30°,切割浅,田多土少。本区为川南丘陵区地貌形状,海拔340~400m,由于受四川盆地地质构造的影响,形成红色泥岩、沙质泥岩和沙岩互层沉积,主要土壤类型有:红棕石骨土、灰棕紫沙土、棕紫泥田、黄紫沙田、红紫沙田等,土壤质地沙壤-壤土,砾石含量较低,土壤耕性较好,经检测:土壤pH值5.94~8.40,微酸性-微碱性;有机质含量10.09~32.6g/kg、全氮0.71~1.86g/kg、有效磷0.4~17mg/kg、碱解氮74~151mg/kg、速效钾93~214mg/kg,耕地土壤养分含量中等丰富,水田地力多为2~3级,旱地多为3~4级。
1.2 土样采集与处理
土样采集按照《农田土壤环境质量监测技术规范》(NY/T395-2000)的要求,于2015年9月在作物收获后秋耕前,根据研究区土地利用现状划分取样单元,每13.3~20hm2取一个样点,共采集耕层土壤样品10个,耕层按0~20cm,亚耕层按20~40cm用不锈钢土钻采集土样,每个土样均采用“S”法随机采集15~20个点,经充分混合后,用四分法留取1kg,重点点位留取1.5kg,装入土袋标明,样品取回在实验室荫干、碾碎备用。
1.3 测定项目及方法
土铀退拇ㄊ∨圃和寥婪柿涎芯克化验室进行,对农产品质量安全有重要影响的Pb、As、Cr、Hg和Cd共5个重金属元素的化验分析,分析方法根据《农田土壤环境质量监测技术规范》(NY/T395-2000)要求确定:As、Hg采用原子荧光光谱法测试,Cd、Cr、Pb采用等离子体质谱法测试。
1.4 评价方法
1.4.1 传统指数评价法
污染指数法是检测评价土壤重金属污染中最常用的一种方法,主要包括2种,分别为单因子和多因子污染指数法,多因子指数法是内梅罗指数法使用最多的一种方法。内梅罗指数法可以计算污染指数的平均值以及最高值,通常在实际的应用过程中,重金属污染因子个数减少的情况比较适合应用该方法,加权有效地规避了权系数确定过程中的各种主观因素,当前该方法的应用比较广泛。但是,这种方法同时也存在不足之处,因为将土壤重金属污染评价化由复杂变得过于简单,过分强调了环境质量影响中最高值的作用。一般情况下,对土壤进行环境质量评价时,会按照中国土壤环境质量标准(GB15618-1995)中二级标准来确定研究的评价标准(表1)。
1.4.2 BP神经网络
1.4.2.1 BP神经网络原理
BP算法训练的神经网络,称之为BP神经网络,这种神经网络是目前应用最多的一种,按照误差逆传播算法进行训练,属于多层前馈网络。BP神经网络的学习功能比较强,输入―输出模式映射关系的存贮量也比较大,不必对描述该映射关系的数学方程进行揭示。梯度下降法是主要的学习规则,网络的阈值和权值可以通过反向传播得到适当的调整,最终得出的最小的误差平方和。BP神经网络模型拓扑共包括3层,分别是输入层、隐层和输出层。
1.4.2.2 BP神经网络算法
BP算法是目前最广泛用的神经网络学习算法之一,其反向传播包括2个步骤,分别是正向传播以及反向传播。
正向传播就是样本从输入层开始经过隐单元进行层层处理,之后传到输出层中;经过这个过程的层层处理,每层中神经单元的状态都只会影响到下一层神经元的状态。比较输出层中的现行输出以及期望输出,当现行输出跟期望输出不同时,则进行反向传播过程。
反向传播就是将误差信号按照原路返回,从输出层开始经过隐含层对神经元的权系数进行逐步修改,以最大化的减少误差信号。
采用非线性S型对数传递函数logsig函数应用到模型的输入层到隐含层的过程中,可以有效保证BP神经网络模型的非线性,线性函数 purlin 函数应用到隐含层到输出层中,trainlm函数为网络采用的训练函数。通过反复迭代运算,达到误差允许范围为止,最后固定权值系数及阀值,学习训练过程结束,模型建立。
2 基于BP神经网络的土壤重金属评价模型
2.1 学习样本的选取
选取BP神经网络训练样本可以确定模型,如果采用累加样本数量或者反复训练网络的方法,会耗费大量的时间,不利于提高网络的预测精度。因此只有在充分考虑样本的整体内在特征以及规律的基础上才能选定样本。
本文学习样本选用《成都耕地》中耕地重金属评价土壤样点数据100个,检验样本20个。样本中土壤等级采用传统内梅罗指数评价法得出(表3)。
2.2 神经网络预测模型的建立
3层前向BP神经网络能够实现随意精度接近任何一个非线性函数,而且过程中不需要建立数学模型,只要存在输入以及目标输出即可。赋予一个输入模式给网络,经过输入层―隐蔽层―输出层层层处理之后,产生一个输出模式。当实际输出跟期望输出不同时,则进行反向传播,误差值会沿着原路返回进行逐层修改。只有每个训练模式都满足特定要求,学习过程才能结束。
图1为本研究中的土壤重金属污染评价的BP神经网络预测模型,该模型共分为3层,7-6-1为该模型的神经网络结构,输入层共包括7个神经单元。分别是对土壤耕地有重要影响的Pb、As、Cr、Hg和Cd共5个元素,2个限制条件:土壤类型(水田或旱地)和土壤pH值,对土壤类型(水田、旱地)字符作对应性数字映射为水田-0,旱地-1;线性传递函数(purelin)为传递函数;隐蔽层共包括6个神经元,传递函数为s型传递函数(1ogsig);输入层包含一个神经元,和土壤重金属污染评价等级对应,传递函数也是线性传递函数(purelin)。
网络学习过程中或者网络预测的过程中要实现更好的训练,就要进行输入矢量分量预处理以及输出适量分量预处理,使用permnmx函数对网络进行归一化处理,以使样本输出和输入范围维持在[-1,1]之间。仿真后的数据通过postmnmx函数进行反归一化处理。
本研究中有100个已知的土样点参数数据可以当做学习样本的输出节点值,在神经网络学习模型中带入5个影响参数和2个限制参数的输入节点值,可以自动生成样本群知识库以及项目区土壤重金属污染评价等级与7个特征⑹的非线性计算关系,结果为:R?=0.99998;RMSE=0.01。
在神经网络推理机中带入学习样本以及验证土样点的7个参数标准值,利用知识库将各单元的评价等级求出,然后与已知结果进行比较,如果误差≤10%,再将其与传统内梅罗指数评价结果进行比较,2个结果非常贴合。(表4)。
2.3 基于BP网络的翠屏区土壤重金属污染评价
在BP神经网络预测模型被验证可用后,本文运用该模型,对宜宾市翠屏区宋家乡洋坪村万宜粮油专业合作社粮食生产功能区10个耕地土壤样点进行评价,将其作为仿真部分输入值代入网络程序,即可评价出本区域耕地土壤重金属污染等级,对该区域现代农业规划中土壤适宜性和农产品质量安全溯源提供科学依据。
3 结论
本文主要对研究区域中的5种重金属内梅罗指数综合评价以及神经网络综合评价的结果进行对比分析,对于该地区的污染水平和趋势,两者反映的基本一致,神经网络综合法评价结果对细小区域的评价更加适合,如土样1根据内梅罗指数法的结果显示,该区域评价等级为2级、尚清洁,但应用BP神经网络评价为1级、清洁,这个评价结果比较符合当地的污染状况。
借助BP神经网络方法建立起土壤重金属污染等级与区域种植业适宜性和农产品质量安全溯源之间构建起直接的联系,管理决策部门可以从这个方向出发制定现代农业规划的应对措施,从而更好的协调社会经济活动跟土壤环境之间的关系,从而有效的预防土壤重金属污染,进而保障农产品的质量安全。
参考文献
[1]李向.基于BP神经网络的土壤重金属污染评价方法――以包头土壤环境质量评价为例[J].中国农学通报,2012,28(02):250-256.