前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇神经网络方向范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
【关键词】 图像识别技术 神经网络识别
模式识别研究的目的是用机器来模拟人的各种识别能力―比如说模拟人的视觉与听觉能力,因此图像识别的目的是对文字、图像、图片、景物等模式信息加以处理和识别,以解决计算机与外部环境直接通信这一问题。可以说,图像识别的研究目标是为机器配置视觉“器官”,让机器具有视觉能力,以便直接接受外界的各种视觉信息。
一、图像识别系统
一个图像识别系统可分为四个主要部分:被识图像、图像信息获取、图像预处理、图像特征提取、分类判决。
二、图像识别方法
图像识别的方法很多,可概括为统计(或决策理论)模式识别方法、句法(或结构)模式识别方法、模糊模式识别方法以及神经网络识别方法。重点介绍神经网络识别方法。
2.1神经网络识别方法
2.1.1人工神经网络的组成
人工神经网络(简称ANN)是由大量处理单元经广泛互连而组成的人工网络,用来模拟脑神经系统的结构和功能。而这些处理单元我们把它称作人工神经元。
2.1.2人工神经网络的输出
2.1.3人工神经网络的结构
人工神经网络中,各神经元的不同连接方式就构成了网络的不同连接模型。常见的连接模型有:前向网络、从输入层到输出层有反馈的网络、层内有互联的网络及互联网络。
2.1.4 学习算法
1)感知器模型及其算法
算法思想:首先把连接权和阈值初始化为较小的非零随机数,然后把有n个连接权值的输入送入网络中,经加权运算处理后,得到一个输出,如果输出与所期望的有较大的差别,就对连接权值参数按照某种算法进行自动调整,经过多次反复,直到所得到的输出与所期望的输出间的差别满足要求为止。
2)反向传播模型及其算法
反向传播模型也称B-P模型,是一种用于前向多层的反向传播学习算法。
算法思想是:B-P算法的学习目的是对网络的连接权值进行调整,使得调整后的网络对任一输入都能得到所期望的输出。学习过程包括正向传播和反向传播。正向传播用于对前向网络进行计算,即对某一输入信息,经过网络计算后求出它的输出结果;反向传播用于逐层传递误差,修改神经元之间的连接权值,使网络最终得到的输出能够达到期望的误差要求。
B-P算法的学习过程如下:
第一步:选择一组训练样例,每一个样例由输入信息和期望的输出结果两部分组成;第二步:从训练样例集中取出一样例,把输入信息输入到网络中;第三步:分别计算经神经元处理后的各层节点的输出;第四步:计算网络的实际输出和期望输出的误差;第五步:从输出层反向计算到第一个隐层,并按照某种原则(能使误差向减小方向发展),调整网络中各神经元的权值;第六步:对训练样例集中的每一个样例重复一到五的步骤,直到误差达到要求时为止。
3)Hopfield模型及其学习算法
它是一种反馈型的神经网络,在反馈网络中,网络的输出要反复地作为输入再送入网络中,使得网络具有了动态性,因此网络的状态在不断的改变之中。
算法思想是:
(a) 设置互连权值
其中xis是s类样例的第i个分量,它可以为1或0,样例类别数为m,节点数为n。
(b) 未知类别样本初始化。 Yi(0)=Xi 0≤i≤n-1
其中Yi(t)为节点I在t时刻的输出,当t=0时,Yi(0)就是节点I的初始值,Xi为输入样本的第I个分量。
(c) 迭代直到收敛
Abstract: From the perspective of developer, and on the basis of analyzing the risk factors of real estate project prophase, this paper builds a index system and establishes the risk assessment model based on BPNN, then selects several sets of samples as the training set and trains the model in the MATLAB7.0, finally verifies the feasibility of the model in the risk evaluation of real estate project prophase by using the test set.
关键词: 房地产项目前期;BP神经网络;风险评价
Key words: real estate project prophase;BP neural network;risk assessment
中图分类号:F293.3 文献标识码:A 文章编号:1006-4311(2014)03-0159-02
0 引言
房地产业作为国民经济的重要组成部分,具有建设周期长、投资金额大、影响因素多、涉及范围广的特点。房地产风险是客观存在的,它贯穿于房地产开发的整个过程,其中前期阶段未知因素最多,对整个投资过程的影响程度高达90%以上。而开发商作为房地产投资的主体,面临的不确定性、风险性最大。随着项目的进行,开发商对可能发生的结果掌控愈多,则风险发生的概率越小。因此,对于房地产项目前期风险管理的研究很大程度上决定了该项目的成败。
1 房地产项目前期风险及评价指标体系
房地产项目前期风险复杂多变,开发商倘若对此决策不慎,将对整个地产项目的开发造成不可估量的后果。本文在借鉴前人研究成果的基础上将房地产前期风险按风险来源划分为政策、技术、财务、社会、自然、管理六个方面,并建立指标体系,如表1。
2 BP神经网络
2.1 BP神经网络简介 BP(Back Propagation)神经网络是一种信息按正向传递和误差沿反向传播的多层前向网络学习过程,一般由输入层、隐含层(一层或多层)和输出层构成。与以往的风险预测方法相比BP神经网络具有很大的优势,它有效削弱了评价人员主观因素的影响,对数据的关联性要求不高,而且具有强大的非线性映射能力、容错能力等优点。
2.2 BP神经网络的学习过程 ①初始化,给各连接权及阀值赋予[0,1]内的随机数,分别设定误差函数e、计算精度值和最大学习次数M;②随机选取k个输入样本及对应期望输出计算隐含层、输出层各单元输出;③计算输出层单元的误差;④若误差满足要求,训练结束。不满足要求,则反向修正返回第2步反复训练直到输出误差达到要求为止结束训练。
3 基于BP神经网络的房地产项目前期风险评价模型
本文采用由输入层、隐含层、输出层组成的三层网络拓扑结构模型,具体步骤如下:
3.1 输入层 输入层是外界信号与BP神经网络衔接的纽带。其节点数取决于数据源的维数和输入特征向量的维数。由表2可知指标层有16个风险因子,即输入层有16个神经元。首先选取10家有代表性的房地产企业利用问卷调查法和专家打分法,按风险评定等级{较低风险、低风险、一般风险、较高风险、高风险},然后对各风险指标Uij进行打分。为了减小权值的调整幅度,加快网络的收敛性,训练开始前对收集的数据进行归一化处理,使输入向量和输出向量的取值到[0,1]范围内。样本数据见表2。
3.2 隐含层 隐含层层数不宜过多,否则会降低训练速度增大局部最小误差,一般取一层即可。隐含层单元数参考公式:n1=■+a,其中n1为隐含层单元数,n为输入单元数,m为输出单元数,a为[1,10]之间的常数。经计算隐含层单元数为10。
3.3 输出层 输出层节点数取决于输出数据类型和表示该类型所需的数据大小。本文输出结果是一个数值,即节点数为1。评价结果取值在[0,1]范围内,其中[0,0.2]、[0.2,0.4]、[0.4,0.6]、[0.6,0.8]、[0.8,1]分别代表低风险、较低风险、一般风险、较高风险、高风险。风险值越大,表明风险等级越高。因此建立的神经网络模型为16-10-1,即输入层16个神经元、隐含层10个神经元、输出层1个神经元。
3.4 网络训练 ①网络参数的选取。本文将表2中前9组数据作为训练集,最后一组作为测试集。训练次数、训练目标、学习速率分别设定为10000次、0.00001、0.3,训练函数、学习函数、性能函数分别采用Traingdm、leamgdm、Mse,其它参数为缺省值。网络训练结果,见图1,经过943次训练,总体误差为9.94958e-006,网络收敛达到预定的学习精度0.00001,训练结束。②模型检验。将表2中最后一组数据输入训练好的模型进行检验。可得,实际输出为0.3142,在区间[0.2,0.4]内,即第10家房地产项目前期的风险等级低。这与期望输出结果0.32基本一致,较好的满足了设计要求。
4 结束语
综上所述,用MATLAB7.0编写的基于BP神经网络模型在房地产前期风险预测方面准确度较高,具有较强的实用性,丰富和发展了前期风险预测的方法,为开发商进行前期决策提供了有力的依据。不足之处,指标的选取有待改进和完善。
参考文献:
[1]陈小花.基于神经网络的房地产投资项目风险评价模型研究[J]现代经济信息,2011(3):172-173.
[2]柳海龙.房地产开发项目前期阶段风险测评研究[D].成都:西南石油大学,2012(6).
[3]张墨林.房地产项目前期风险管理[D].西安:西安建筑科技大学,2004(6).
关键词:仿生算法;神经网络;遗传算法
中图分类号:TP183文献标识码:Adoi: 10.3969/j.issn.1003-6970.2011.03.017
An Improved Algorithm of Bionic Research and Analysis
Yue Tong-sen, Wang Da-hai
(XinXiang Vocational and Technical Collage, Xinxiang 453000,Henan,China)
【Abstract】In this paper the bionic algorithm of neural network and genetic algorithm were analyzed and summarized, aimed at slow speed of neural network training, recognition efficiency low, and genetic algorithm the optimum choice premature convergence problem, combined with neural network method and genetic algorithms of their respective characteristics, puts forward the improved algorithm.Without the destruction of single neurons based on input weights, adopt data pretreatment methods to reduce the number of input layers, so as to improve the ability of evolutionary learning.
【Key words】Bionic algorithm; Neural network; Genetic algorithm
0引言
人工神经网络[1]和遗传算法[2]是仿生算法[3]的典型方法,它们的优化问题一直是众多研究者所倍为关注的研究热点之一。在人工神经网络和遗传算法结构的研究中发现,人工神经网络具有很好的模式分类的特性,遗传算法有很好的动态变更权值的特性,基于此,本文提出了一种改进的基于人工神经网络和遗传算法的算法。本章的改进算法,就是对人工神经网络和遗传算法进行了变换,增强了对输入权值的变化速度,并提出用减少输入层个数的方法是加快神经网络学习的有效方法,取得了良好的实验效果。
1神经网络和遗传算法的特究点
1.1神经网络和遗传算法的不同点
1.神经网络是多层感知机,而遗传算法是单层感知机。神经网络是由输入层,隐含层和输出层够成,但遗传算法的基因组是一个数组,不管基因的长度有多长,其结构仍然是一个单层感知机。
2. 神经网络的隐含神经元个数是不确定的,而输出层和输入层的个数是可以确定的。我们希望输入层的个数用新的方法得到降低,这样神经网络的训练速度就可以提高。同时对于隐含层的层数,一般情况设为1。每层的神经元个数也并不是越多越好,是要根据问题的情况而变动的。但神经网络的隐含层是不确定的,而且隐含层的个数也是不确定的。对于遗传算法,它的二进制的长度是可以确定的,但是交叉和变异的比例是变动的。对于单点交叉比例,我们可以设定为黄金分割点。虽然设定为黄金分割点作为单点交叉比例没有用数学方法严格的证明,但是,大量的实验表明,选择黄金分割点往往可以得到较好的结果。对于变异比例,没有交好的方法确定,只能设计交互式的实验来调试决定。
3.权值的更新方式不一样。神经网络的权值的更新方式是时时的,而遗传算法权值的更新方式是批量的。
4.两者应用的范围不一样。神经网络主要应用于模式匹配,错误诊断,监视病人的状态,特征提取,数据过滤。而遗传算法主要应用在计算机辅助设计,日程安排,经济学的投资研究等。
1.2神经网络和遗传算法的相同点
1.有教师的学习。神经网络的输出是有目标的,当然是确定的。同时对于遗传算法的目标也是确定的。所以两者都是有目标的,也就是有教师的学习。
2.随机近似优化过程。神经网络中,如果把网络的权值初始化为接近于0的值,那么在早期的梯度下降步骤中,网络将表现为一个非常平滑的函数,近似为输入的线性函数,这是因为sigmoid函数本身在权值靠近0时接近线性。同样,遗传算法的初始个体都是随机产生的,它的交叉和变异都是一个不断近似的过程。
3.并行化。神经网络的每个神经元是独立的,如果把每个神经元分配一个处理器,那么就可以采用并行的方式。同样,遗传算法很自然地适合并行实现,有粗粒度并行方法和细粒度并行方法。有粗粒度并行方法就是把群体细分成相对独立的个体群,称为类属,然后为每个类属分配一个不同的计算节点,在每个节点进行标准的GA搜索。细粒度并行方法就是给每个个体分配一个处理器,然后相邻的个体间发生重组。
2算法的研究及改进
结合人工神经网络和遗传算法的研究的本质,通过两种算法结合的研究及改进,提高算法的收敛速度,从大量的数据中模拟生物的特性来完成特定的任务和解决问题的方法和方向。由于遗传算法是单层感知机,而神经网络是多层感知机,所以可以从多层感知机的多层性,我们想象为遗传算法是单层感知机作为神经网络是多层感知机的输入层。这样,我们就可以采用遗传算法的动态变更权值的特性来对神经网络输入层有效性的遗传和变异。这种算法适合与没有输入,只有输出的应用,就像无人驾驶技术中控制行驶的速度和方向的控制一样。基本的框架如图1:
图1结合人工神经网络和遗传算法的框图
Fig.1 Combined with artificial neural network and genetic algorithm diagram
最上面的是智能体,神经网络的输出来控制智能体,控制中心将神经网络的权值用遗传算法的初始体来提供。
2.1遗传算法的基因作为神经网络的权值变量
遗传算法的基因的初始化必须要满足神经网络的输入要求,一般遗传算法的基因都是0,1编码。但是为了达到神经网络的输入要求,是要在(-1,+1)之间随机产生。
2.2遗传传算法中杂交点选择
遗传算法中,一般都是采用随机平均变异[4][5]的方式,但是如果输入是由遗传算法的基因提供的话,为了保证在变异的时候,采用标记变异的方法。我们可以首先根据图2的神经网络来考虑:
图2遗传算法作为人工神经网络和的权值图
Fig.2 Genetic algorithm as artificial neural network and the weights of figure
很显然,(0.3,-0.8,-0.2)是神经元1的权值 ;(0.6,0.1,-0.1)是神经元2的的权值;(0.4,0.5) 神经元3的权值。为了在遗传算法中的杂交过程中,不破坏每个神经元的权值个数,特意标记(3,6)所在的箭头。
2.3引入神经网络输入层的数据预处理
神经网络的计算问题是神经网络应用中最为关键的问题。如何提高网络的训练速度是算法研究的重点。我们在思考问题的时候,总是希望问题越简单越容易解决。同样,我们也可以通过对数据的预处理,来降低问题的难度。
为了减少输入层的个数,我们可以先对数据进行预处理。预处理的方法为如下流程:
(1).计算机器人前进方向Position(x,y)和目标的所在的位置Location(x,y)。
(2).归一化Position(x,y) 和Location(x,y)。
(3).用点乘的计算公式计算两者点乘。
(4).用符号重载的方式计算是顺时针还是相反。
(5).计算角度=第3步的结果*第4步的结果。
3实验结果及分析
3.1实验框架
将本算法应用于扫雪机器人的智能控制中,设计的主要模块:
3.1.1神经网络部分的设计
神经网络的输入由四个变量组成:扫雪机器人方向向量(由两个变量组成,即在X和Y的分量),发现目标,即雪的向量(由两个变量组成,即在X和Y的分量)。神经网络的隐含层由一层组成,而且由10个神经元。神经网络的输出由两个变量组成,V1和V2,分别作用在机器人的左轮和右轮上。神经网络的响应函数采用SIGMOD。
3.1.2遗传算法部分的设计
遗传算法的初始化是为神经网络提供权值,所以是由[-1,1]随机数产生。遗传算法的变异是采用随机变量的变异,选择采用轮转法。
3.1.3扫雪机器人
扫雪机器人用神经网络来控制,当找到目标后,它的适值就加一。这样就随着发现目标越多,它的适值就越大。学习能力是通过不断的学习后,它的适值就会加强。如果直接采用机器人前进方向和目标的所在的位置,那么神经网络的输入为四个变量。
3.2结果与分析
如果直接采用机器人前进方向和目标的所在的位置,那么神经网络的输入为四个变量。通过对扫雪机器人的学习过程,没有进行预处理的数据,即四个变量输入神经网络后的参数设定:神经网络的输入为4,神经元为6个,输出个数为2个,如图3所示:
图3网络的参数设定图
Fig.3 Network parameters set figure
我们设定初始的适值为0,如果发现一个目标后,它所对应的适值就加上1,这样经过50次的进化后,没有进行数据预处理的最大值是25,平均值是10.1333。如表1所示:
将50次的统计结果用柱状图进行对比,如图4所示。
图4进化50代后的加入数据预处理和没有加入预处理的对比图
Fig.4 After 50 generation data preprocessing and did not join joined the pretreatment of contrast diagram
为了减少输入层的个数,我们可以先对数据进行预处理下面,用统计的方法对数据进行的结果分析,如表2所示。
将进化100代后,对比两者的对比柱状图如图5所示。
图5进化50代后的加入数据预处理和没有加入预处理的对比图
Fig.5 After 50 generation data preprocessing and did not join joined the pretreatment of contrast diagram
实验结果表明,为了减少输入层的个数,先对数据进行预处理。通过对扫雪机器人的过程的数据分析进行分析,数据预处理后的智能进化学习能力相对于原始数据的智能进化学习能力有明显的提高。
4结束语
本文提出了基于神经网络和遗传算法结合的改进算法,对于遗传算法的变异操作进行改进,不会破坏单个神经元的输入权值的基础上,采用数据预处理的方法来减少输入层的个数,从而提高进化学习的能力。从实验数据中可以看到,本章提出的改进算法加快了学习速度,达到了提高智能学习的预期
目的。
参考文献
[1] 乔俊飞,韩桂红.神经网络结构动态优化设计的分析与展望[J].控制理论与应用,2010,3(13):350-357.
[2] 葛继科,邱玉辉,吴春明,等.遗传算法研究综述[J].计算机应用研究,2008,10(9):2911-2916.
[3] 丁建立,陈增强,袁著祉.智能仿生算法及其网络优化中的应用研究进展[J].计算机工程与应用,2003,12(3):10-15
[4] 巩敦卫,等.交互式遗传算法原来及其应用[M].北京:国防工业出版社,2007.
关键词:ELMAN神经网络;定时控制;交叉路口
中图分类号:TP183文献标识码:A文章编号:1009-3044(2012)23-5682-03
Research of the Fuzzy Signal Control Based on Elman
MAO Hong-ge, HUANG Guo-fan
(School of Software, Nanyang Normal University, Nanyang 473061, China)
Abstract:Dynamism of signal control decide the delay of car on single intersection., this paper takes a single intersection as research object, as a target the delay of car decreased. based on fixed time control ,it use ELMAN neural control the signal, the result indicate that delay of car decrease effectively.
Key words: ELMAN neural network; fixed control; single intersection
交通拥挤是城市交通的重大问题之一,在大城市尤其明显。交叉路口信号的有效控制是解决交通拥堵问题的关键因素,目前,国内各大城市交通信号灯控制是基于定时的,定时控制在有些交通流量情况是有效的,但遇到大量车流量的、繁忙的交叉路口已不能满足实际需要;有些路口车流十分稀少的时候,驾驶员可以看到另一绿灯相位没有车辆通过,仍然要等待转换相位才能通行。这种信号控制方法增加了车辆在交叉路口的延误时间,对于交通拥堵问题没有得到有效解决,为了缓解交通拥挤、减少污染和提高能源利用率等问题,这就需要寻找智能的信号控制方法,我国的交通研究者最近几十年也做了大量有关的研究,其中徐冬玲、刘智勇[1, 2]等学者提出了模糊神经网络控制方案,在模糊控制中,模糊规则一旦给出,运行过程中是一成不变的,不具备学习能力,神经网络具有自适应学习能力,目前大多研究是基于BP算法的。BP算法是静态前馈神经网络,是将动态的交通问题变为静态空间建模问题,ELMAN神经网络具备映射动态特征的功能,从而使系统具有适应时变特性的能力。因此,考虑到交叉路口的动态特性,采用ELMAN神经网络进行信号控制。
1 ELMAN神经网络
Elman网络是J. L. Elman于1990年首先提出来的,它是一种典型的局部回归网络。Elman网络可以看作是一个具有局部记忆单元和局部反馈连接的前向神经网络。Elman神经网络一般包括:输入层、中间层(隐含层)、承接层和输出层,其结构如图1所示。输入层起信号传输作用,输出层起线性加权作用。在这种网络中,除了普通的隐含层外,还有一个特别的隐含层,称为承接层;该层从隐含层接收反馈信号,每一个隐含层节点都有一个与之对应的关联层节点连接。承接层的作用是通过联接记忆将上一个时刻的隐层状态连同当前时刻的网络输入一起作为隐层的输入,相当于状态反馈。
Elman神经网络具有BP神经网络的优点,同时它是通过一种承接层的延迟和存储连接到隐含层的输入的自连方式,这就增加了网络动态处理信息的能力,从而可以动态的自适应的处理交叉路口复杂路况的事物。
2基于ELMAN神经网络模糊信号控制
文中以单交叉路通信号控制为研究对象,在图2中,有东、西、南、北四个车流方向,每个相位只考虑直行的情况,其它的忽略不计。
车辆的延误模型采用的是希腊学者C.P.PAPPIS[3]提出的单路口两相位模糊控制算法。此模糊算法是根据红灯方向的车辆等待数,与绿灯方向检测到达的车辆数,决定当前方向绿灯在7秒,17秒,27秒,37秒,47秒的延时是否进行、或转向。
引入模糊变量T,A,Q,E,分别表示时间、绿灯方向车辆的到达数、红灯方向车辆的等待数、绿灯延时。模糊变量的赋值表见文献[3].
2.1网络的创建
2.1.1网络的输入
神经网络中,输入的元素分别是时间T、绿灯方向车辆的到达车辆A、红灯方向车辆的等待数Q、当前绿灯时间G(第7、27、37、47秒分别为0.1、0.2、0.3、0.4)。
2.1.2网络的输出
网络有一个输出,是第n秒的绿灯延时隶属度。将从检测器得到的10秒数据分别输入网络就可得到10秒的绿灯隶属度,根据最大隶属度对应的时间决策延长时间。
2.1.3样本的选取
模糊控制算法使用了25条规则进行模糊推理,并且在考虑不同车流情况下均衡的选择样本。例如,在27秒准备实施控制时,上个10秒的第9秒红灯方向的车辆等待数是8,绿灯方向的车辆等待数是7,则神经网络输入为P=[9,7,8,0.4],输出为,T=[0,1,1, 0,1,1, 0,1,1, 0,0.9,1, 0,0.9,1],输出为T=[0.9]。这样,可以得到不同车流情况下的若干个样本。
由于文中研究对象一个隐含层足以够用,所以,这里采用单隐层的神经网络。根据Elman网络的特性和交叉路口的实际情况,将隐含层神经元的个数设定为30。传递函数为S函数tansig(),输出层有一个神经元,传递函数为线性函数logsig()。训练函数采用默认值traingdx(),下面创建一个Elman网络:
Net = newelm(minmax(P),[30 1],{tansig, lgsig});
2.2网络的训练
使用MATLAB工具进行仿真,代码如下:
net.trainParam.epochs=10000;
net.trainParam.goal=0.1;
net=train(net,P,T);
3 MATLAB车辆延误仿真
交叉路口的路况是动态分布的,因此,泊松分布用来仿真交通流量较小的情况,二项分布用来仿真流量较大的情况,车辆的延误使用C.P.PAPPIS文中公式计算,因此可以得到不同车流情况下的车辆平均延误。
4结束语
从实验结果可以得知,使用ELMAN神经网络对交叉路口进行控制可以有效减少车辆的平均延时,提高交叉路口的通行能力,在实际的应用中,文中的实验条件存在局限性,例如交叉路口的车流情况比文中比较的交通量要复杂及神经网络也存在不足之处,可以寻求更好的方法实现各种方法之间的互补,减少车辆的延误时间。
参考文献:
[1]徐冬玲,方建安,邵世煌.交通系统的模糊控制及其神经网络实现[J].信息与控制,1992,21(2):74-78.
[2]刘智勇.智能交通控制理论及其应用[M].北京:科学出版社,2003
[3] Pappis C P,Mamdani E H.A Fuzzy logic controller for a traffic junction[J].IEEE Transactions on systems,man,and cybernetics,1977,7: 707-717.
[4]周开利.MATLAB基础及其应用教程[M].北京:北京大学出版社,2007
关键词:BP神经网络;Adaboost算法;遗传算法
中图分类号:F832.332文献标识码:A文章编号:1008-2670(2012)02-0012-08
收稿日期:2011-12-11
基金项目:国家社科基金资助项目“企业金融衍生业务风险测度及管控研究”(10BGJ054)。
作者简介:宿玉海(1964-),男,山东潍坊人,经济学博士,山东财经大学金融学院教授,研究方向:国际金融;彭雷(1986-),男,山东潍坊人,山东财经大学金融学院硕士研究生,研究方向:国际金融;郭胜川(1990-),男,山东安丘人,山东大学数学学院学生。
一、引言
商业银行的信用风险管理一直是人们关注的焦点,在引入工程方法进行信用风险的度量后,BP神经网络信用风险模型以其较强的逼近非线性函数的优势从众多方法中脱颖而出,其对于历史数据的模拟仿真和预测能力也显示出了独特的优势。但是,BP神经网络信用模型在处理较为复杂的财务数据时,对于数据指标在模型中获得的权值没有一个明确的标准,而是特别依赖于对于历史数据指标的选择,使得模型对于新样本的考察缺乏一个有效的动态权值变动,这就造成了模型在使用过程中的困难。
随着BP神经网络信用风险管理模型应用的增多,许多学者逐渐认识到BP神经网络信用风险模型在处理财务数据时存在的问题,采取一系列的措施对BP神经网络信用风险模型进行了改进,特别是对于权值设定的改进做了大量的工作。Back等[1]建议将遗传算法与神经网络结合起来协同工作,但没有实际讨论引入遗传算法后带来的实际效果;Piramuthu等[2]采用符号特征样本的技术处理输入数据取得了较为明显的效果,但是符号特征样本技术则存在较为主观的人为因素影响。国内学者在引进神经网络以后,也为神经网络模型的优化进行了卓有成效的努力。如许佳娜、西宝[3]采用层次分析法对神经网络模型的改进,以及郭英见、吴冲[4]采用DS证据理论将神经网络和SVM的输出结果进行的融合,都在一定程度上增强了神经网络模型的判别准确率,但他们在神经网络的权值修改上仍然没有找到很好的设定规则。
可以看出,许多学者在神经网络良好的泛化能力和模式识别能力上达成了共识,但对于神经网络中占有重要地位的连接权值的修正,没有给出一个较为恰当的标准。本文在探讨改进这一问题时,将遗传算法与Adaboost算法分别引入到BP神经网络信用风险模型中,通过两种模型对于相同的训练样本和预测样本的考察分析,比较两种方法的优劣,从而为BP神经网络信用风险模型的改进提供一定的参考。
本文结构安排如下:第一部分为引言;第二部分介绍BP神经网络信用风险模型并评价其缺陷;第三部分使用Adaboost算法以及遗传算法对BP神经网络信用风险模型进行算法寻优;第四部分则通过Matlab的模拟进行实证分析并比较实证结果;第五部分根据实证分析的结果得出相应的结论并探讨商业银行在应用过程中应注意的问题。
二、现有BP神经网络信用风险模型介绍