前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇神经网络评估范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
锂离子宽的电压平台和严重的两端极化不利于SOH的估算,但电池的健康状态对电池寿命有着重要的影响。为了解决锂离子电池寿命预测困难的问题,通过对锂离子电池外特性进行的分析,在安时积分法的基础上,采用BP神经网络算法对锂离子电池进行建模,并将此模型带入K-均值算法中。系统的实现功能是对电池健康状况进行准确的评估。经过实验数据的验证,证明了这种算法的准确度,为电池管理系统稳定工作提供保证。
关键词:
电动汽车;锂离子电池;健康状态;K-均值算法
随着世界汽车人均持有量的不断攀升,能源危机越来越威胁着人类,巨大的环境问题和能源问题已成为世界关注的焦点。为了解决这些问题,世界各国特别是汽车工业发达的国家,正致力于“零污染交通工具”的开发,最终电动汽车被推向了历史的舞台。然而电动汽车能否得到大力的推广,很大程度上受到了动力电池的限制[1]。SOH(state-of-health)是用来描述电池寿命的重要参数之一,进而,电池健康状态的预测则是其中一个非常重要的部分。为了在使用安全性的基础上,充分发挥出动力电池的动力性能[2],因此研究锂离子电池的健康状态具有十分重要的意义。近年来,我国也在积极开展汽车锂离子电池的研究,且在电池研制和电池评估方面取得了一定的成果。本文将分为5个章节来阐述对电池健康状态的预测。
1K-均值算法
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类生成的一组数据对象的结合被称为簇[3]。这些对象不同于其他簇中的对象,但是和同一个簇中的对象彼此相似。K-均值(K-Means)聚类算法是著名的划分聚类分割方法[4]。划分的原理是:随机从数据集中选取K个点,每个点初始的代表每个簇的中心,然后计算剩余各个样本到聚类中心的距离,将它赋给最近的簇,随后重新计算每一个簇的平均值,不断重复,直到相邻两次调整没有明显变化,此时聚类形成的簇已经收敛。算法终止条件:①没有对象被重新分配给不同的聚类。②聚类中心不在变化。③误差平方和局部最小如式。
2建立电池的BP人工神经网络模型
国内外对锂离子电池的阻抗状态也有相关研究。电池的老化过程伴随着电池内阻的变化,一般认为电池由于在充放电的过程中发生不可逆的化学变化导致反应的锂离子损失,再加上内部结构的钝化,比如说SEI膜的形成并且增厚,正极和负极的变换等等。因此本文可以通过预测内阻来估算电池的健康状况如式。
2.1神经网络模型的建立人脑中有1000亿个神经元,结构异常复杂。正因为人脑结构错综复杂才使得被抽象出来的人工神经网络具有信息并行处理的能力,自学能力和推理能力。人工神经网络由大量的神经元连接而成,通过模拟人的大脑神经处理信息的方式,进行信息平行处理和非线性转换的网络系统。在其多重分类当中,BP人工神经网络(BPArtificialNeuralNetworkAlgorithm)是一种多层前馈神经网络,它的名字源于网络训练中,通过调整网络训练权值的训练算法是反向传播算法(BP神经网络学习算法)。神经网络模型的结构一般分为输入层(输出实验数据)、输出层(输出预测数据)以及隐含层(对实验数据的加权处理)。上下层之间实现全连接,在相同层直接无连接,介于输入层于隐含层神经元之间为网络的权值,表现为两个神经元的链接强度。通常还在整合信息的过程中添加一个阀值,主要模仿生物必须达到一定的阀值才能被触发的原理,然后将整合过的信息作为该神经元的输入。当样本被提供给神经元后,神经元的输出值从输入层经过中间层(隐含层)向输出层传播,在输出层各个神经元获得输入响应,遵照减少网络输出与实际输出样本之间的误差的方向,从输出层反向经过各个中间层回到输入层,逐步修正各个链接权值,这种算法被称为“误差反向传播算法”,也叫做BP神经网络算法[7]。通过以上介绍,本文建立一个典型的3输入2输出的人工神经网络。如果利用电池的外特性参数来充当输入层,则可以得到基于人工神经网络的锂离子电池BP神经网络模型。如图1所示为建立的BP神经网络拓扑结构[8]。
2.2BP人工神经网络模型的特点BP人工神经网络充分利用了神经网络的非线性,自学习性等特点,结合实验数据来建立各种参数之间的关系。BP神经网络的训练机制,不仅适用于机器学习的算法方面,在众多其他领域也有重要应用,比如用BP网络解析个人成才历程,有利于多角度思考问题,避免思维狭隘和定势,在知识点交叉的十字路口,甚至有意想不到的收获。
3锂离子电池的健康评估
根据对锂离子电池所做的实验数据,再根据安时积分法算出SOC值,导入到算法中去得到输出值。然而任何方法得到的结果都会与实际健康状态结果存在的差距就是预测误差,预测误差应该反应出结果的准确性。
3.1锂离子电池输入参数的确定对锂离子电池进行如图2放电实验,以5A左右的电流进行放电试验。利用安时积分法如式(3),算出电池的SOC如图3。得到电池外特性数据后进行建模。其中,SOC0为充放电起始状态;CN为电池的额定容量;I为电池电流;η为充放电效率,根据经验公式,此处取1。
3.2BP人工神经网络建模结果将电流(I)、SOC、放电深度(DOD)输入建好的神经网络模型中预测出开路电压(OCV)和电池电阻r如图5-图10所示。可以观测到预测输出和期望输出的开路电压(OCV)和内阻误差都很小。当电池老化以后,安时积分法的试用范围没有变化,但是对于BP神经网络算法的影响较大,因为所建立的电池模型参数随着电池老化的改变而改变,尤其是成组的实验电池模型产生的累积误差会使得实验准确性下降。
3.3利用K-均值算法进行预测将建模以后的输出开路电压值和内阻阻值带进已经编好的K-均值算法里得到如图11。得到两个聚类点ctrs1(0.006246,3.2293)和ctrs2(0.006278,3.2343)。
4检验预测精度
取100组实验获得的内阻数据,利用得到的聚类点放入实验数据中。观察聚类的准确度,结果如图12所示。通过放入的实验数据和预测的聚类点的组合,发现聚类点可以精确聚类出所要得到的两个簇。
5结论
针对电池的健康状态难以评估这个问题,本文设计开发了电动汽车健康评估系统。运用神经网络建立电池模型,K-均值进行预测。可为目前电动汽车基于外特性来评估健康状况提供更为准确的条件,从而有效的解决了健康状态难以评估的问题,同时提供了准确快速的预测方法。①随着电池不断地放电实验,内阻不断的增大,SOH不断增大。为了得到准确的SOH值,可以通过预测内阻的变化来预测SOH。②我们观察到神经网络建立电池模型误差能达到0.2%,所以运用神经网络可以很准确的建立电池模型。③通过实验数据对得出聚类值的检验可以得出,运用K-均值算法可以对电池SOH进行准确预测。
参考文献:
[1]陈三省.基于动态贝叶斯网络的锂离子电池SOH估计[D].杭州电子科技大学,2014.
[2]Zou,Zhongyue,Xu,Jun,Mi,Chris,Cao,Binggang,Chen,Zheng,“EvaluationofModelBasedStateofChargeEstimationMethodsforLithium-IonBatteries”,ENERGIES,5065-5082,Aug2014.
[3]陶新民,徐晶,杨立标,刘玉.一种改进的粒子群和K均值混合聚类算法[J].电子与信息学报,2010,01:92-97.
[4]刘靖明,韩丽川,侯立文.基于粒子群的K均值聚类算法[J].系统工程理论与实践,2005,06:54-58.
[5]卓金武MATLAB在数学建模中的应用[M].二版.北京:北京航天航空大学出版社,2014.
[6]ZhengChen,BingXia,ChrisMi,andRuiXiong,“LossMinimizationBasedChargingStrategyResearchforLithium-ionBattery”,IEEETransactionsonIndustryApplications,Mar.2015.
[7]谭晓军电动汽车动力电池管理系统设计[M].广州:中山大学出版社,2011.
关键词:方法;维修性评估;BP神经网络
1 概述
维修性是现代航空武器装备重要的设计特性,是影响其使用可用度和作战效能的重要因素。定型试飞阶段是装备维修性评价的重要环节,其目的是验证装备的维修性水平是否达标,为改进装备维修性设计提供重要参考,提高装备的维修性水平。试飞阶段的维修性评价主要是通过试飞阶段产生的维修信息,验证装备的维修性水平。维修性评估除了有量化指标要求外,还有很多是一些非量化和无法量化的要求和指标。对这些非量化的指标和要求进行评价是非常困难的,往往不易下结论或者结论不够准确。目前,人们一般采用层次分析法(AHP)、模糊综合评判法或灰色评价法进行评价,但这些方法具有较强的主观性,缺乏自学习能力,实际评判中易受判定随机性、参评人员主观不确定性及认识模糊性等诸多因素的制约。针对以上情况,文章在建立维修性定性评估指标体系的基础上,采用目前比较成熟且最常用的一种神经网络方法,即BP神经网络,建立了评价模型,并给出了评价结果。
2 BP神经网络方法
人工神经网络是在现代神经生理学和心理学的研究基础上,模仿人的大脑神经元结构特性而建立的一种非线性动力学网络系统,它由大量简单的非线性处理单元(类似人脑的神经元)高度并联、互联而成,具有对人脑某些基本特性的简单的数学模拟能力。
2.1 BP网络结构
BP神经网络是一种单向传播的多层前馈神经网络,由一个输入层、一个输出层和若干中间层(隐层)构成。每层由若干神经元组成,不同层次的神经元之间形成全互连接。层内神经元相互独立,不同层次之间的神经元以权值W单向连接。每层神经元在节点接受前一层的输出,同时进行线性复合和映射(线性或非线性),通过复合反映不同神经元之间的耦合和映射对输入信息作出反应。
BP神经网络对于输入值要先向前传播到隐层节点,经作用函数运算后,再把隐层节点的输出信息传播到输出节点,最后给出输出值。文章采用一种具有个n2输入节点、n1个隐层节点和单个输出节点的三层BP神经网络,它的数学模型是:
Y=f(WijX+?兹1) (1)
Z=f(WjY+?兹2) (2)
其中,X,Y,Z分别为输入层、隐层和输出层矢量(节点向量);Wij,?兹1和Wj,?兹2分别表示输入层与隐含层以及隐含层与输出层之间的连接权和阈值,i=1,2,…,n2;j=1,2,…,n1;f(x)为网络激活函数或传递函数,通常采用S形函数,即f(x)=■,如果整个网络的输出要取实数域内任何值,则网络输出层可以采用线性函数作为传递函数,即f(x)=x,其结构如图1所示。
图2 图1中神经元j的结构模型
图1中Xk=(xp1,xp2,?撰,xpn2)为评价指标属性值,k=1,2,…,s,其中s是输入样本量;Z为样本模式P的输出。B=[b1,b2,?撰,bs]T=[bp]s×1为与样本模式P对应的评价结果,也是神经网络的期望输出值。实际输出Z与期望输出bp的误差函数Ep定义为Ep=(bp-Z)2/2。
对于图1中隐层的神经元j,其结构模型如图2。
神经元j模型可以表示为:
(3)
2.2 BP网络学习过程
BP神经网络的学习过程由正向传播和反向传播两部分组成,在正向传播过程中,输入模式从输入层经过隐层神经元的处理后,传向输出层,每一层神经元的状态只影响下一层神经元状态。如果在输出层得不到期望的输出,则转入反向传播,此时误差信号从输出层向输入层传播并沿途调整各层向连接权值和阈值。以使误差不断减小,直到达到精度要求。该算法实际上是求误差函数的极小值,它通过多个样本的反复训练,并采用最快下降法使得权值沿着误差函数负梯度方向改变,并收敛于最小点。
3 维修性定性评价指标体系
根据GJB 368B装备维修性通用工作要求中维修性定性评价内容可确定维修性定性评估的指标体系如图3所示。
图3 维修性定性评价指标体系
维修性评价的最主要目的就是得出分析对象的维修性好坏。对于二级指标,这里为了方便现场操作人员评价打分,每个指标又细化为多个评价准则。这里给出了互换性与标准化评价准则表,见表1。操作人员只需对评价准则进行回答,即可得出每个指标的评价值。文章以可达性中视觉可达为例介绍专家打分方法和评价过程。由于影响视觉可达的条件不同,因此具体项目和分值应根据实际操作进行调整。打分共有好、中、差等3项指标,“好”指标对应分值为80~100分,“中”指标对应分值为60~80分,“差”指标对应分值为60分以下,满分100代表最好的视觉可达状况。为了便于神经网络训练,对得到的百分制评价结果进行了处理,即每个分值除以100得到神经网络输入向量的元素,例如,如果专家对视觉可达的最终打分结果是85分,对应文章的输入向量的元素值为0.850。
附表1 互换性与标准化评价准则表
4 维修性BP神经网络评估模型
文章利用MATLAB实现BP神经网络的编程。将维修性定性评估指标体系中的16个指标作为神经网络的输入向量,将其评估结果作为唯一输出,建立一个如图1的16×midnote×1的3层BP神经网络。
其中16是输入样本的维数;
midnote是隐层节点数,隐层节点数目太多会导致学习时间过长、误差不一定最佳,也会导致容错性差、不能识别以前没有看到的样本,因此一定存在一个最佳的隐层节点数。以下3个公式可用于选择最佳隐层节点数时的参考公式:
(1)■C■■>k,其中k为样本数,n1为隐层节点数,n2为输入节点数。如果i>n1,C■■=0;
(2)n1=■+a,其中m为输出节点数,n2为输入节点数,a为[1,10]之间的常数;
(3)n1=log2n2,其中,n2为输入节点数。
1 是输出层节点数。
网络输入层与隐层之间的传递函数f(x)为tansig,即S型的双曲正切函数;隐层与输出层之间的传递函数f(x)为purelin,即f(x)=x;网络训练函数为traingd,即梯度下降BP算法函数;对于BP网络创建函数newff,其性能函数默认为“mse”,即均方误差性能函数,其权值和阈值的BP学习算法默认为“learngdm”。下面将介绍学习步长、初始权值和目标精度的选取要求。
4.1 学习步长、初始权值、目标精度的选取
学习步长是在学习过程中对权值的修正量,与网络的稳定性有关。步长过短,则学习效率低,步长过长,则网络稳定性差,学习步长一般取0.05。
初始权值选取和输出结果是否最接近实际,是否能够收敛,学习时间的长短等关系很大,由于MATLAB仿真软件会根据初始化函数自动生成相应的初始权值和阈值。
目标精度是确定神经网络的精度标准,当误差达到目标精度要求后网络停止。目标精度的确定是根据实际情况对精度的要求而定。
4.2 实例验证
训练根据实际数据和专家评定,选定用于训练和测试的10组样本数据,其中X矩阵的前9行,即9组训练样本,X矩阵的第10行为1组测试样本,B为10组样本的目标输出矩阵,Q为待估样本矩阵。
(1) 学习样本矩阵、目标输出矩阵、待评估矩阵的数据输入
(2)BP神经网络模型程序代码设计:
net=newff (min max(X(1:9,inf)'), [midnote 1], {'tansig','purelin'},'traingd')%创建网络并初始化
net.trainparam.show=50 显示训练状态间隔次数
net.trainparam.lr=0.05 学习步长
net.trainparam.epochs=500 仿真次数
net.trainparam.goal=0.001 目标精度
[net,tr]=train(net, X(1:9,inf)',B') 网络训练
Zsim=sim(net, X(10,inf)') 仿真计算
(3)仿真结果输出及分析
待评估矩阵的仿真结果为:Zsim=0.762066,它表示的意义是在16个二级评估指标能力值分别为待评估矩阵所给定值时,该维修性的评估结果是0.762066。图4为BP神经网络训练图。从图中可以看出,训练仿真到351次时,达到设定的目标精度0.001,训练停止。文章只对BP神经网络解决维修性评估的方法上进行了初步的探索,随着装备维修性研究的不断深入和神经网络技术的发展,BP神经网络方法在维修性评估中的应用将更加广泛。
图4神经网络训练误差曲线
5 结束语
文章将BP神经网络方法应用于对航空维修性的评价,意在建立更加接近于人类思维模式的定性与定量相结合的综合评价模型。通过对给定样本模式的学习,获取评价专家的经验、知识、主观判断及对目标重要性的倾向,当需对有关对象作出综合评价时,便可再现评价专家的经验、知识和直觉思维,从而实现了定性分析和定量分析的有效结合,也较好地保证了评价结果的客观性,此外仿真结果精确度高,可信性强。
参考文献
[1]黄书峰,端木京顺,唐学琴,等.航空维修保障能力的神经网络评估方法与应用[J].航空维修与工程,2008.
[2]GJB 368A-1994.装备维修性通用大纲[S].
关键词:赊销风险度;客户信用;BP神经网络;风险评价
引言
赊销风险就是基于信用销售以后所产生的对未来的不确定性风险,表现为赊销客户由于各种原因,不愿意或无力偿还赊销货款,使企业货款无法回收,形成呆账的可能性[1]。在赊销过程中,客户一般并不提供实质性担保,因此,企业面临的赊销风险也随之增加。近年来,一些企业经营陷入困境而使得供应链上的其他企业因赊销货款无法正常回收也相继陷入停产和破产危机,这些实例就是最好的佐证。因此,探寻和建立行之有效的赊销风险评估方法就彰显出其重要意义。
本文从赊销风险评价的目的出发,提出了基于赊销风险度的赊销风险度量标准。同时,将BP神经网络引入赊销风险评价,建立了基于BP神经网络的企业赊销风险评价模型。实证分析结果表明,该模型是有效可行的。
一、赊销风险的度量标准及评价指标体系
1.基于赊销风险度的赊销风险度量标准。在综合考虑赊销风险的实质和不确定性的基础上,本文提出将“赊销风险度”作为一种新的赊销风险衡量标准。赊销风险度是一种以测度赊销风险暴露程度(赊销货款安全系数)为核心的赊销风险衡量标准,它是指对客户开展赊销业务中,在特定的交易方式下,该客户由于各种原因,不愿意或无力偿还赊销货款而使货款将来形成呆死账的可能性。具体计算公式为:
di=1-rt
其中,di为某一客户i进行赊销的赊销风险度;rt为客户i的当期货款回收率;m为考核的回收期 [2]。这一标准的优越性可见文献[2] 。
2.基于赊销风险度的赊销风险等级划分。鉴于目前银行业中运用比较成熟的五级信用分类制度在国内经济生活中的普及性,论文根据赊销风险度的大小将赊销风险分为5个等级,各等级对应的标准及赊销客户特征(见表1) [3]。
3.赊销风险评价指标体系。论文采用理论与实证相结合的方法确定赊销风险评价指标体系,首先结合相关文献和作者赊销实践,提出17项初始指标,然后用专家打分法和实证分析两种方法对初始的指标体系进行筛选,最终确定12项指标(见下页表2),具体分析过程略。
二、基于BP神经网络的赊销风险评价模型
目前对于赊销风险评价研究尚少,且赊销风险评价是复杂非线性的多因子综合系统,具有模糊、不确定等特性,适合采用结构简单、具有非线性拟合能力的神经网络。基于以上考虑,论文将比较成熟的BP神经网络用于赊销风险评价,构建神经网络五级分类风险评价评估模型,为赊销风险管理提供一个全面的视角。
本文建立的BP神经网络模型(如图1所示)[4]。
图1BP神经网络模型
该模型分为两大模块:前一部分是归一化模块,这一部分主要核心技术是将原始数据转化为[0,1]区间的标准化数据;后一部分是BP神经网络(BPNN)模块。上述模型中的BPNN模块采用三层BP神经网络。该网络包括三层:输入层、隐层和输出层。
应用上述模型进行赊销风险评价的步骤为:
1.指标归一化。由于神经网络的输入要求在[0,1]区间,因此,在网络学习训练前首先要将各评价指标的原始数据进行归一化。由于论文本文中的12个评价指标既有定量指标,也有定性指标,它们的标准化方法是不同的。
定量指标的标准化:
定量指标分为两类:成本型(越小越好)和效益型(越大越好)。对于指标Fi,设其论域为di=[mi,Mi],其中mi和Mi表示Fi的可能最小、最大值,Si∈[0,1]是定义在论域di上的标准化函数。以下是两种指标的标准化函数[5]:
成本型:Si=0xi≤mixi∈di1xi≥Mi
效益型:Si=1xi≤mixi∈di0xi≥Mi
定性指标的标准化:
根据定性指标取值,其标准化规则(见表3)。
2.网络训练。原始数据经过预处理后送入归一化模块,根据输入信号按上一节的规则进行归一化,得到12个归一化值,然后,这些归一化值被送入BPNN模块。由以上分析可知,BPNN模块输入层的神经元数为12,即输入信号x1,x2,…,x12对应于12个归一化值;输出神经元数为1,即输出量O对应于赊销风险水平。
神经网络的学习过程也就是网络参数修正的过程,本系统的网络学习采用有教师的方法,网络参数的修正采用梯度法实现。设现已有p个系统样本数据[6~7]:
{a,Oa},(a=1,2,…,p)
式中,上标a表示样本序号;a为样本输出,Oa为实际输出。xai(i=1,2,…,12)为输入变量,则输入变量将按下式分配到隐层的第m个神经元,作为其输入x′m
转贴于
x′m=wimxai (1)
式中,wim是输入层神经元i与隐层神经元m的权值。隐层神经元m的输出O′m是其输入x′m的函数,即:
O′m=F(xai)(2)
BP神经元的传递函数F(x)通常为对数Sigmoid函数。同理也可以计算输出层各个单元的输入和输出,这里不作详细叙述。
通过一定数量的网络训练过程,实际是修正网络参数以确定最适宜的权值使对全部n个样本的输入,按式(1)、(2)的正向运算得到的实际输出Oa与a期望输出(样本输出)的残差达到最小,即:
E=(Oa-a)2最小 (3)
权值及阀值的修正通过反向传播算法的梯度法实现,具体过程略。
3.模型验证。将n-p个验证样本的输入矢量x*v=(x*p+1,x*p+2,…,x*n)置于网络中,进行仿真预测,得到预测输出矢量,检验与输出矢量与实际结果的差异以检验网络推广能力。
4.模型确定。如果验证通过,说明所建网络泛化能力较强,可用于未来赊销企业风险评级;否则,通过调整训练样本P的大小、隐节点数、训练周期、目标误差等重建网络。
5.训练结果分析。评级模型确定后,就可以直接用于企业赊销风险评价输出衡量企业赊销风险等级的评价值α,该值的范围为[0,1],按照设定赊销风险等级,各个等级输出分值范围为:
一级:分值范围为0
二级:分值范围为0.05
三级:分值范围为0.15
四级:分值范围为0.3
五级:分值范围为0.5
这样可以从网络输出值中明确得出企业赊销风险等级。
三、实证分析
选取东、中和西部地区赊销客户五级分类样本426家,这些样本的数据是2007年度的相关数据。从每个风险等级样本中随机选取290家企业作为模型训练样本,其余的136家企业作为检验样本。
将训练样本按照标准化准则进行标准化,建立Matlab训练模型。模型输入神经元个数为12,输出为5,规则层神经元采用tansig型函数,而输出层神经元则采用purelin型函数。经过7614步迭代,BPNN模型收敛,误差最小。将136家五级分类检验样本输入到以上训练好的神经网络中进行判别,模型总体预测精度(见表4)。从表4可以看出,模型的总体正确率为88.23%,这表明该模型是有效的。
表4模型对检验样本总体判断结果
注:括号外的数字为被错误分为该类的样本数,括号内的数字为该正判样本数占所属类样本总数的百分比。
结论
当前提出的许多衡量赊销风险的方法,都缺乏可操作性,因此不能应用企业数据进行验证分析,这也就失去了研究的现实意义。为此,本文提出了一种基于“赊销风险度”的赊销风险度量标准,并在此基础上将企业赊销风险划分为5个等级,并建立了基于BP的企业赊销风险评价模型。实验结果表明,该模型是有效且可行的。
参考文献:
[1]文彬.民营企业商业交易中的赊销制度研究[J].学术研究,2009,(4):40-45.
[2]吴玉萍,基于支持向量机的企业赊销风险评估模型[J].软科学,2009,(6):130-133.
[3]薛锋,柯孔林.粗糙集神经网络系统在商业银行贷款五级分类中的应用[J].系统工程理论与实践,2008,(1):40-45.
[4]蔡秋茹,罗烨.企业资信的BP神经网络评估模型研究[J].计算机技术与发展,2009,(10):117-119.
[5]徐泽水.不确定多属性决策方法及应用[M].北京:清华大学出版社,2004.
关键词:小额信贷;信用风险;BP神经网络
中图分类号:F830.51 文献标识码:A 文章编号:1009-9107(2012)02-0078-06
引言
农户小额信贷是指农村信用社基于农户的信誉,在核定的额度和期限内向农户发放的不需抵押、担保的贷款。1993年,中国社科院农村发展研究所将小额信贷项目第一次借鉴到中国,我国政府给予了大力支持。自2000年开始,为加大支农力度,缓解农户贷款难问题,在中国人民银行推动下,农村信用社作为正规金融机构全面试行并推广农户小额信贷。据有关数据显示,截至2009年3月末,全国农户小额信用贷款余额2518.6亿元,同比增长17.5%,增速同比增加1.9个百分点;农户联保贷款余额为2006.3亿元,同比增长33.6%,增速同比增加13.4个百分点。农户小额信贷在解决农户贷款难问题、促进农民增收、支持农村经济发展等方面发挥了重要作用。
然而,由于农民控制风险能力有限,农村信用基础薄弱,农户小额信贷不需抵押、担保的特点使得农村信用社在小额信贷实施过程中面临较大的信用风险。农户违约现象时有发生,导致农户小额信用贷款的不良率居高不下,影响农村信用社的整体贷款质量,阻碍了农村信用社的健康发展和小额信贷的可持续发展。银监会监管部主任杨家才在“2009中国农村金融论坛”上指出,目前涉农贷款不良率是7.4%,工业贷款不良率是2.29%,大企业贷款不良率是1.15%,中小企业贷款不良率是4.5%,涉农贷款的不良率大大高于其他类贷款。另有资料显示,截至2009年初,庐江农村信用合作联社农户小额信用贷款余额1941万元,不良贷款金额719.8万元,不良率达37.1%。因此,有效控制农户信用风险、提高信贷质量已成为农村信用社面临的重要任务。
目前,农户小额信用贷款采取“等级管理,分级定额,随用随贷,余额控制,周转使用”的管理办法。在农户资信等级评定时,一般是通过信贷员、村委会的主观意见或使用评分表打分来确定。这些方法虽简单易行,但主观性大且执行过程不规范,没有借助量化的数学模型,容易导致农户信用状况评价不准,不能完全满足农村信用社信用风险管理的需要。本研究尝试利用BP神经网络建立农户信用风险评估模型,以此来识别农户在小额信贷中的信用风险,严把贷款出口关,提高农户小额信贷质量,促进小额信贷的可持续发展。
一、BP神经网络介绍
人工神经网络(Artificial Neural Network,简称ANN),是一种旨在模仿人脑结构及其功能的脑式智能信息处理系统,是由大量处理单元相互连接构成的高度并行的非线性系统,具有高度的非线性映射能力,良好的容错性和联想记忆功能,自适应能力较强。神经网络特有的这些性能,加之其对数据分布没有严格要求,也无需详细描述自变量和因变量间的函数关系,并且分类精度较高,使其在信用风险分析领域得到广泛应用。神经网络对信用风险的评估是通过其分类功能实现的,即先找出一组对信用分类有影响的因素作为网络输入,再通过有教师或无教师训练建立信用风险评估模型,当输入新样本时该模型即可对其信用风险进行判别分类。
Rumelhart和Mc Celland于1986年对具有非线性连续变换函数的多层感知器的误差反向传播(Error Back Proragation,BP)算法进行了详尽的分析,实现了多层感知器的设想。采用BP算法的多层感知器是至今为止应用最广泛的神经网络,通常将其称为BP网络。BP网络是一种单向传播的多层前馈网络,由输入层、隐含层和输出层组成,一个三层的BP网络可完成由任意n维输入空间到m维输出空间的非线性映射。BP算法的思想是,学习过程由信息的正向传递和误差的反向传播这两个过程组成。在正向传递过程中,输入样本信息从输入层经隐含层逐层计算后传向输出层,若输出层实际输出和期望输出不符,则计算输出层误差值,然后转入误差的反向传播阶段。在误差反向传播过程中,输出误差经隐含层向输入层逐层反传,并将误差摊分给各层所有单元,各层单元的误差就作为修正其权值的依据。这种不断调整权值的过程,即是网络的训练学习过程。当达到规定的误差或一定的训练次数,训练结束。其网络结构如下图1所示。
二、实证研究
(一)样本选择与分组
本研究所用样本来自2009年陕西省杨凌区3家农村信用社提供的资料。按照五级分类标准,逾期3个月以上的贷款为不良贷款,本研究也按此标准来确定农户是否违约。在样本选择过程中考虑到样本类别的均衡,尽量使违约类样本数量和不违约类样本数量大致相等,在按时还贷的农户中随机挑选了112户,在未按时还贷的违约农户中随机挑选了106户,总计218户。删除24个部分数据有缺失值的不合格样本后,最终确定有效样本为194个,其中不违约样本有102个,违约样本92个。
BP神经网络分为训练和工作两个阶段,网络模型性能的好坏主要看其是否具有较好的泛化能力,即对新样本正确处理的能力。一般将总样本随机分成训练集样本和测试集样本两部分,对模型泛化能力的测试应当用测试集样本数据进行检验。有的资料认为训练集样本规模一般应达到有效样本的75%-80%,本研究将194个样本分成训练样本和测试样本两组:利用SPSSl6.0软件在102个不违约样本中随机抽取78个,在违约样本中随机抽取72个,将这150个样本数据作为训练样本集,而将其余的24个不违约样本和20个违约样本共44个样本作为测试样本集。
(二)指标确定
本研究初始选取的指标来自农村信用社农户小额信用贷款资信等级评定表和农户借款申请书等档案,选取了户主年龄、户主性别、家庭人口数、家庭劳动力数、耕地面积、农业收入、非农收入、年总支出、信用社入股金额、房屋价值、机械价值、其他资产价值、贷款数额、贷款用途、贷款月利率共15个指标。在以上指标中,户主的性别和借款用途两个变量是语言变量,需要转换为离散的数值量。在本研究中,户主的性别为男时赋值为0,性别为女时赋值为1;当贷款用途为用于种植业、养殖业等农业基本生产时赋值为1,用于加工、运输、经商等个体经营时赋值为2,用于生活用品、建房、治病、上学等一般消费时赋值为3。
为了选择对违约农户和非违约农户区分能力最
强的指标变量以及消除变量间的多重共线性问题,对以上所选取的15个指标用SPSSl6.0软件分别进行正态性检验、参数及非参数检验和指标变量之间的多重共线性检验。
1.正态性检验。在进行样本差异性检验之前,采用单样本K-S检验即Kolmogorov-Smirnov检验法,对每一个变量分别进行正态性检验。检验结果表明,在0.05的显著性水平下,变量户主年龄的概率P值为0.179,大于0.05,而其余14个变量的概率P值均为0,说明除变量户主年龄服从正态分布以外,另外14个变量都不服从正态分布。
2.差异性检验。两独立样本T检验。两独立样本T检验的前提是样本来自的总体应服从或近似服从正态分布,本研究对服从正态分布的变量户主年龄采用两独立样本T检验。T检验结果的F统计量观察值的概率P值为0.098,大于显著性水平0.05,认为两总体方差无显著差异;对应的T统计量观察值的概率P值为0.027小于0.05,认为两总体均值存在显著差异。
两独立样本K-S检验。对除变量户主年龄外的其他不服从正态分布的变量采用两独立样本K-s检验。在K-s检验结果中,耕地面积、农业收入、非农收入、年总支出、房屋价值、贷款数额、贷款用途几个变量的概率P值小于0.05,认为这几个变量在两总体的分布间存在显著差异,其他几个变量在两总体间则不存在显著差异。因此可以认为户主年龄、耕地面积、农业收入、非农收入、年总支出、房屋价值、贷款数额、贷款用途这8个变量在违约组和非违约组之间的差异显著,在模型建立过程中可只保留差异显著的8个变量,而将其他7个变量予以易II除。
3.共线性检验。BP神经网络具有很强的非线性映射能力和自适应能力,输入变量之间是否存在共线性问题对网络的处理结果影响不大,但为使网络的训练效果更佳,本文使用方差扩大因子法进行变量问的多重共线性检验。VIF值越大,多重共线性问题就越严重,一般认为VIF值不应大于5,但也可适当放宽标准至不大于10。当VIF值大于10时,可认为变量之间存在严重的共线性。检验结果显示,变量非农收入的方差扩大因子VIF值最大,但也仅为2.974,小于5,表明所选择的8个变量之间并不存在多重共线性问题,可以将这8个变量直接作为建立BP网络模型的输入变量。
(三)数据处理
为消除数据量纲和变量自身变化大小的影响,加快网络训练的收敛速度,在模型建立之前,采用最小一最大标准化法对变量进行归一化即标准化处理,将网络的输入、输出数据限制在[0,1],从而使各输入分量在网络训练开始时处于同等重要的地位。计算公式如下:
(四)BP神经网络信用风险评估模型的实现
1.BP网络结构设计。(1)隐含层确定。单隐层BP网络能完成由任意n维到m维的映射,与一个隐层相比,采用两个隐层并无助于改善网络性能,但随隐层层数的增加,训练时间将急剧增加,且在训练过程中往往容易陷入局部最小误差而无法收敛。通过调节网络隐层神经元数目可提高其误差精度,且训练效果也比增加层数更明显。因此本研究以一个隐层建立单隐层的三层BP神经网络。(2)输入层和输出层确定。输入参数的合理与否对网络的性能有重要影响。选择输入量的基本原则一是变量对输出有较大影响且能够提取或检测,二是各变量之间互不相关或相关性很小。输入层节点数目取决于输入数据的维数。通过前述指标筛选,最终有8个指标对农户是否违约影响较大且变量间不存在相关性,可以作为建立BP网络模型的输入变量,因此本研究确定BP网络输入层的神经元个数为8个。输出层的选择相对容易,其节点数取决于输出数据类型和表示该类型所需数据的大小两个方面。当BP网络用于模式分类问题时,可用二进制数表示输出结果,其节点数可根据待分类类别数确定。本研究将农户信用风险分为违约和不违约两类,因此可定义1个输出节点,用1表示违约类农户,0表示不违约类农户。(3)隐层节点数的确定。隐层节点数太少,网络提取样本信息的能力差,将不足以反映训练集的样本规律。若隐层节点数太多,又可能会提取出样本中非规律性的内容如噪声等,造成“过度吻合”,降低网络的泛化能力,另外还会增加网络的训练时间。对于隐层节点数的确定,至今没有准确的理论和规则,需要的往往是更多的经验。在具体设计时,可先根据经验公式初步确定隐含层节点数,然后通过对不同节点数的网络进行训练对比,再最终确定节点数。本研究采用公式作为计算隐层节点数的参考公式,得出隐节点数为17个。在网络训练过程中不断改变隐层节点数,通过比较不同隐节点数下网络的训练误差精度及对两类样本的判别准确率,在满足网络的训练误差精度的前提下,选取判别准确率最高时的节点数作为网络模型最终的隐层节点数。经过多次测试,最终确定隐层的节点数为14,由此构成了一个8-14-1型的BP神经网络模型,在满足误差精度的情况下,此时模型对两类样本的判别准确率最高。(4)传递函数的选取。BP网络常用的传递函数有对数S型logsig函数、双曲正切S型tansig函数和线性函数purelin。由于BP神经网络的非线性映射能力是通过S型传递函数所体现的,所以隐层一般采用S型传递函数,而输出层传递函数可以采用s型或线性。当用s型传递函数作为输出层的传递函数时,其非线性逼近速度快于线性传递函数。本研究将隐层传递函数确定为tansig函数,从而将隐层输出值控制在(-1,+1)之间;因为网络的输出值为0或1,所以输出层传递函数采用iogsig函数。(5)训练函数的确定。对网络的训练本研究采用L-M改进算法和批处理的训练模式。L-M改进算法的收敛速度最快,并且适用于中小型网络。对于L-M算法,MATLAB神经网络工具箱提供了批处理模式下的训练函数trainlm。本研究将选择trainlm作为网络的训练函数。
2.训练参数设置。(1)学习率。学习率决定网络每一次训练中所产生的权值变化量,其选择合理性是网络稳定的关键,太大可能导致系统不稳定,太小会导致收敛速度慢、训练时间过长,不过能保证收敛于某个极小值。一般情况下,倾向于选取较小的学习速率以保证网络系统的稳定性,其选取范围通常在0.01-0.8之间。当前都是根据经验来选择,并没有合理的解释与推导。可以通过观察网络训练的误差变化曲线来判断选取的学习率是否合理.曲线下降较快说明学习率比较合适,若出现较大的振荡则说明学习率偏大。经过反复测试,本研究最终确定学习率为0.4。(2)训练次数。训练次数将直接影响网络的准确性和泛化能力,次数过小不能完成训练所设定的目标误差,次数过大则容易造成“过度学习”现象,使得网络在对测试样本进行仿真测试时的准确度不高。本研究将最大训练次数确定为10000,当训练时间超过该设定时,学习过程自动终
止。(3)训练目标误差。MATLAB中默认目标误差为0,但实际情况中训练样本集很难达到。本研究输出值设为0和1两种情况,属于二分类问题,对训练精度要求不是特别高,将目标误差设为0.001。
3.网络训练。在网络训练时需要注意的是将两类样本交叉输入,因为集中输入同一类样本将使网络在训练时只建立与该类样本相适应的映射关系,而集中输入另一类样本时,网络权值的调整又转向新的映射关系而否定前面训练的结果。当网络的隐含层节点数为14时,网络根据训练样本进行训练的误差变化曲线图如图2所示。
BP网络模型对训练集样本的判别分类准确率达到100%,判定结果如表l所示。
4.网络测试。在训练误差达到要求后,根据测试集样本的网络模型输出与期望输出的误差,判断网络的泛化性能。当网络的隐含层节点为14时,测试集样本的网络模型输出见表2。
BP网络模型对测试集样本的分类准确率如表3所示。
通过测试样本集网络输出结果表2可以看出,1号、5号、10号、11号、29号、30号及31号样本的网络输出结果与期望输出不符,判别分类出现错误。通过对测试样本的判别分类表3可以看出,BP网络模型对违约样本分类识别的正确率达到了90%,对不违约样本分类识别正确率为79.17%,整体的分类识别正确率为84.09%,取得了较好的评估结果,证明了所建BP网络模型的精确性和有效性。
本研究将违约类农户误判为非违约类农户称为第一类错误,将非违约类农户误判为违约类农户称为第二类错误。显然,对于金融机构来说,第一类错误的危害性远比第二类错误严重,犯第二类错误顶多是没有将贷款发放出去而损失一笔利息收入,而犯第一类错误则会造成贷出的款项无法收回而形成果账。Ahman曾经得出这样一个研究结论,犯第一类错误造成的损失是第二类错误造成的损失的20倍至60倍。因此,应尽量避免第一类错误的发生。本研究所建立的BP网络模型对违约类样本识别的准确率达到90%,犯第一类错误的概率仅为10%,能够较好的避免第一类错误的发生,因而可认为是一个较好的信用风险评估模型,可以将其作为农村信用社识别农户信用风险的工具。
三、结论及政策建议
(一)结论
随着小额信贷的发展,如何有效控制农户信用风险、提高信贷质量以促进小额信贷的可持续发展已成为农信社面临首要任务。农户小额信贷信用风险的评估研究对于完善农户小额信贷业务,实现小额信贷的可持续发展有着重要的意义。
1.本文利用陕西省杨凌区3家农村信用社提供的数据资料,借助SPSSl6.0软件对样本数据分别进行正态性检验、参数及非参数检验和多重共线性检验,选择出对违约农户和非违约农户区分能力最强的指标变量,消除变量间的多重共线性问题,在信息量不减少的情况下减少变量的个数,从而减少了神经网络模型的输入单元个数,降低网络模型的复杂程度,提高了训练速度。
2.利用MATLAB7.0软件对农户小额信贷信用风险进行实证研究,建立了8-14-1结构的BP神经网络模型。模型对训练集样本的识别正确率达100%,对测试样本集违约类农户的识别正确率达90%,总正确率达84.09%,虽然网络模型对测试样本集未违约类农户的识别准确率只有79.17%,但农村信用社在一定程度上可以容忍此类错误发生所带来的机会损失。因而,BP网络模型能够为农村信用社识别和预测农户信用风险提供较好的依据。
3.BP神经网络是一种非参数模型,具有较强的非线性映射能力、容错能力和鲁棒性,对数据的分布要求不严格,分类精度较高,并且可以很容易地继承现有领域知识,不断接受新样本、新经验对模型进行调整。另外,BP神经网络模型中的权重通过网络对样本训练形成,不需要对各项指标确定权重,克服了由人工评价带来的主观性及模糊随机性的影响,保证了结果的准确性和客观性。
(二)政策建议
【关键词】神经网络;三电平逆变器;故障诊断
【Abstract】Based on analyzing the fault type of a main circuit of a three-level inverter, the paper utilizes a fault diagnosis method for three-level inverter by BP neural network, that is to diagnose non-typical fault of three-level inverter by three-level BP network; thus a three-level inverter experimental platform is designed and established; various faults of main circuit power switch tubes of the three-level inverter is simulated based on this platform; and the feasibility and validity of the fault diagnosis method based on BP neural network is validated.
【Key words】Neural network; Three-level inverter; Fault diagnosis
0 引言
逆变器中的功率元器件及其控制电路是最易发生故障的薄弱环节,功率变换器工作在高频状态,损耗较大,发热严重,发生故障的概率最大,而最新研究也表明:变频调速系统中功率变换器的故障占整个驱动系统故障的80%以上。功率变换器发生故障会使电动机在非平衡供电状态下工作,长期下去会使电动机受到严重损坏。在三电平逆变器系统中,主电路功率开关器件是其中最易于发生故障的薄弱环节[1-3]。因此,针对三电平逆变器产生的故障波形进行故障诊断具有很好的实用价值。本文利用神经网络方法对三电平逆变器故障诊断问题进行了研究。
1 三电平逆变器故障诊断分析
常见的三电平逆变器的主电路故障模式可分为以下几种[4]:(l)任一功率开关管基极驱动电路故障;(2)任一功率开关管短路故障;(3)任一功率开关器件管间歇性断路故障;(4)任一逆变桥臂几个功率开关管同时断路故障;(5)任一逆变桥臂几个功率开关管同时短路故障;(6)交叉两逆变桥臂几个功率开关管同时断路故障;(7)无源元件失效故障。在实际运行中,更多关注的是功率开关管的短路和开路故障。因为这两种故障最为常见,所带来的损失也比较严重。其中,短路故障发生时,若系统中有电流传感器过流保护,会很快引发过流保护。短路故障由于存在时间比较短,若要求在线实时的诊断和检测可能难度会很大,并且短路故障最终还是会表现为开路故障。考虑以上原因,本文主要研究三电平逆变器主电路中功率开关管的开路故障,即以上的(1)、(4)和(6)诊断问题。
2 基于神经网络的三电平故障诊断方法
由于BP神经网络简单实用、理论成熟,便于工程应用。因此,本文选用BP网络作为三电平逆变器故障诊断网络。图1为基于BP网络的三电平逆变器故障诊断流程图。
3 实验结果及其分析
图2为三电平逆变器工作示意图,供电回路为典型的交-直-交变换电路。三相交流电通过三相桥式整流后得到直流电,三电平逆变器再将直流电变成三相交流电后给负载供电。图3为硬件实验台。
图4为无故障时三电平逆变器主电路输出电压波形,三电平逆变器输出的线电压从波谷到波峰之间的电压等级数为5,输出的相电压从波谷到波峰之间的电压等级数为9,这些波形经滤波后即为所要求的正弦波形。
在故障诊断时,人为将三电平逆变器中功率IGBT的驱动信号去掉,来模拟各类开路故障状态。首先,制造25种IGBT典型故障。图5为A相Sa1开关管故障时逆变器输出电压波形。图中看到,Sa1管故障时,逆变器输出相电压在负半周正常,而在正半周相电压幅值只有正常工作时的1/2。
实验中采样三电平逆变器系统的三相输出电压波形,在一个周期20ms内连续采样128点,将采样数据存入缓冲区。先对各种典型故障波形用逻辑规则进行判断,然后查询典型故障表进行故障定位,最后给出正确诊断结果。采用用神经网络对逆变器的非典型进行诊断时,将电压信号经过d-q变换后,对这些数据进行归一化处理,并作FFT分析,得到8个特征信号数据:d和q分量各自的直流分量、基波幅值、基波相位、二次谐波相位。将特征信号输入已学习好的待诊神经网络,在神经网络输出层的6个输出节点可得到其输出结果,进行四舍五入取整后,就得到最后诊断结果表示的故障代码。根据故障诊断得到的故障代码与故障编码表进行比较得到诊断是否正确,若完全相符,则表明诊断正确。为了完备的实验验证,通过改变负载和输入电压大小,对3组144个非典型故障样本进行诊断,有125个故障被正确诊断,正确率为87%。
4 结论
本文设计了基于神经网络的三电平逆变器的故障诊断实验平台,构建了三电平逆变器的主电路,设计了DSP的电路,包括信号缓冲保护电路、驱动电路、电压电流检测电路、辅助电源等。编写了三电平逆变器的SVPWM信号发生程序和故障诊断程序等。实验结果表明,本文提出的基于BP神经网络的三电平逆变器故障诊断方法具有一定的可行性和实际应用价值。
【参考文献】
[1]安群涛,孙力,孙立志.三相逆变器开关管故障诊断方法研究进展[J].电工技术学报,2011,26(4):135-144.
[2]汤清泉,颜世超.卢松升.三电平逆变器的功率管开路故障诊断[J].中国电机工程学报,2008,28(21):26-32.