前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇神经网络常用算法范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
随着4G时代的到来,电信行业的得到了空前的发展,用户数量快速增长,同时,电信各运营企业之间的竞争也日益激烈。面对激烈的电信市场竞争环境,以及日趋饱和的电信市场,获取新客户的成本比保持在网客户要昂贵得多。加之电信技术、法律法规、携号转网以及竞争对手等动态市场的变化,使客户流失到对手运营企业也更加容易。数据挖掘,作为一种新兴技术手段,可以高效、低成本的实现客户的流失预测,现已在电信、金融等行业得到了广泛应用。
【关键词】
数据挖掘;客户流失;算法
1、引言
流失客户,即是不想或不再使用其服务的企业原有客户。根据流失程度可分为两类:离网流失和业务流失,或称为显性流失和隐性流失。在我国,电信行业竞争日益激烈,市场容量逐渐饱和,在终端产品以及通信资费相对平稳的情况下,用户成为电信运营商激烈竞争的焦点。如何有效地防止用户流失、降低流失率成为各个运营商急需解决的难题。客户流失给运营商带来了巨大损失,而成功挽留一个即将流失的客户比重新发展一个客户节约大量成本。因此,利用数据挖掘技术,预测客户流失、减少客户流失的发生成为当下电信行业研究的重点。
2、客户流失预测常用算法及比较
客户流失预测常用算法。目前,常用的挖掘算法有很多,但客户流失分析较为常用的有三种算法,分别是决策树算法、支持向量机算法、神经网络算法。
(1)决策树算法当前最有影响的决策树算法是Quinlan于1986年提出的ID3和1993年提出的C4.5。ID3只能处理离散型属性,它选择信息增益最大的属性对训练样本进行划分,目的是进行分枝时,使系统的熵最小,从而提高算法的精确度。C4.5是ID3算法的改进算法,不仅可处理离散型属性,还能处理连续性属性。C4.5采用信息增益比作为选择分枝属性的标准,弥补了ID3算法的不足。决策树的优点在于,它可以生成可以理解的规则,计算量相对较小,可以处理连续和种类字段,并且可以清晰地显示哪些字段比较重要。但决策树对连续性的字段比较难预测,这是决策树的一个不足。
(2)支持向量机算法支持向量机(SupportVectorMachine,SVM)由Vapnik领导的AT&TBell实验室研究小组于1963年提出,当时的研究尚不十分完善。直到90年代,统计学习理论的实现和由于神经网络等较新的机器学习方法的研究在如何确定网络结构、过学习与欠学习、局部极小点等问题时遇到一些重要困难,这个阶段SVM的理论技术得到迅速发展与完善,它在解决小样本、非线性以及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等问题中,是一项有潜力的分类与回归技术。SVM也存在自身不足,SVM算法对大规模训练样本难以实施,同时,对于多分类问题存在困难。
(3)神经网络算法人工神经网络(ArtificialNeuralNetworks,ANN),也简称神经网络,它是由大量简单处理单元以某种方式互相连接而成,通过调整内部这些大量处理单元之间相互连接的关系,从而达到处理信息的目的。神经网络中,神经元处理单元可表示为特征、字母、概念或某些有意义的抽象模式等不同的对象。神经网络中处理单元类型可以分为三类:输入层单元、输出层单元和隐藏层单元。输入层单元负责接受外部世界的数据或信号;输出层单元实现网络处理结果的输出;隐藏层单元处于输入层和输出层单元之间,不能由系统外部观察的单元。神经元间的连接权值反映单元间的连接强度,信息的表示和处理体现在网络处理单元的连接关系中,可对连续的或非连续的输入做出状态相应,能实现复杂的逻辑操作和非线性关系信息的动态处理,因而神经网络具有很强的逻辑运算和数值运算能力。神经元网络的优点在于有无指导的情况下都能够进行学习;缺点是神经网络很难解释而且会学习过度,另外神经网络建模通常较费时,需要的准备工作量很大。神经网络的著名算法是基于误差学习的后向传播算法,即BP算法。
3、电信客户流失预测研究展望
以下几方面在未来的研究中值得考虑:(1)对现有指标体系还需要进一步研究与完善,尤其是随着4G业务的发展,指标应该进一步调整。(2)现在国内的流失预测分析,大都以“月”为单位,如果能以“周”或者“日”为单位,可以更加及时的发现流失客户。(3)用于流失预测的算法各有利弊,找出一个在各方面性能都很好的分类算法仍然需要进一步研究。
【参考文献】
[1]肖水清.基于CRM探讨电信业的客户流失问题[J].现代计算机,2006(1)
[2]陈晋苏,郑惠莉.电信行业流失客户挽留价值综合评价研究[D].南京邮电大学,2005
[3]仲继.电信企业客户流失预测模型研究[D].西安科技大学,2014
关键词:神经网络;数据挖掘;算法
1.数据挖掘过程及常用的神经网络模型
1.1数据挖掘过程
数据挖掘是一个由诸多步骤共同组成的具有反复特性的迭代过程,其最主要的目的是从海量的数据当中,找出人们最感兴趣的信息。大体上可将数据挖掘过程分为3个阶段,即数据准备、模式提取以及结果的解释与评估。
(1)第一个阶段为准备所需的数据,具体可将这个阶段细分为数据清洗、数据选取以及数据预处理和数据表示四个步骤。数据是数据挖掘过程中不可或缺的重要前提和基础,但大量的实践表明,只有数据是很难进行挖掘工作的,必须在对数据进行挖掘前,做一些相应的准确工作,这些工作也成为数据挖掘的重要环节。
(2)第二阶段为模式提取。该阶段是数据挖掘的核心环节,需要先明确数据挖掘的任务及目标,并在正式确定目标之后,选择合适的算法或工具,开始对数据进行挖掘操作。在这个环节当中,算法是关键,即可选择单一的算法,也可多种方法联合使用,具体的选择应视挖掘的任务而定。
(3)第三阶段为解释与评价。挖掘过程中发现的模式应当以最容易理解的形式呈现给用户,其间要对发现的模式进行比较、校验,看是否与用户的要求相符,进而确定出挖掘效果。
1.2神经网络模型
现阶段,已知的人工神经网络模型有40多种,较为常用的有以下几种:
(1)BP神经网络。BP是误差反向传播的简称,这种神经网络归属于前馈网络的范畴,其具有多层映射的特征,该网络所采用的主要学习方式为最小均差,结构简单、学习训练算法成熟、工作状态稳定是BP模型的3大特点,正因如此使得该模型获得了非常广泛的应用。由于BP算法对误差函数有着一定的要求,即误差函数必须可微,故此,为了有效克服局部极小的问题,多以全局优化算法为主,如遗传算法等。
(2)RBF神经网络。RBF是径向基函数的简称,该网络与BP网络在归属的范畴上相同,也属于前馈网络。RBF网络在激活函数方面有多种可选择,最常用的是高斯函数,因为这种函数具有很多显著的特点,如形式简单、径向对称、容易解析等等。由于RBF网络是一个多层前馈网络,故此只要隐单元足够多,便可达到任意给定精度,其在逼近目标时,采用的化整为零的思想,即将目标分解成为若干个局部对象。
(3)混合型神经网络。这是―种将其它方法有机融合到―起构成的神经网络模型,它与传统网络模型的拓扑结构相同,但学习机制却有所不同。常用的混合型神经网络有模糊和进化2种。
2.基于神经网络的数据挖掘方法
2.1神经网络在数据挖掘中的应用优势
神经网络是一门实用性较强的科学技术,其集多种现代技术于一身,有诸多并行分布的处理单元连接而成。从系统的角度上讲,神经网络归属于动态系统的范畴,具有自适应和非线性的特征,对噪声数据有着非常强的容错和承受能力。由于神经网络所具有的这些特点,使得基于神经网络构建的数据挖掘模型具备了与之相同的特点,这样便可以适应数据环境的不同变化,由此进一步提升了数据挖掘模型的准确性。可见,神经网络十分适用于数据挖掘领域。
2.2基于神经网络的数据挖掘过程
由上文分析可知,在数据挖掘领域中,神经网络具有较高的适用性,以此为基础的数据挖掘过程分为以下几个阶段。
2.2.1数据的选择及预处理阶段
数据选择的主要目的是为神经网络的构建提供相应的数据支撑,这个过程可以细分为以下2个环节:(1)对数据进行训练,(2)对数据进行测试。观察和理解是选择数据时必须做的工作,当样本数据集确定之后,便可按照挖掘目标,并结合挖掘方法,对数据进行编码处理。
2.2.2网络训练与剪枝
当数据选择和处理工作完成之后,数据挖掘人员需要选用一个神经网络模型,同时确定相应的网络训练算法,通过该算法对神经网络进行训练。剪枝的主要作用是以神经网络的准确性为前提,去除掉没有意义和价值的冗余结点由此会使网络模式更加简练,也更容易理解。
2.2.3规则的提取与评估阶段
经过以上2个阶段后,神经网络当中便会蕴含着学习到的规则,也就是常说的知识,但是此时的规则由于存在形式的原因,不容易理解,所以需要对规则进行提取。提取规则的主要目的在于将规则的形式转化为容易理解的形式,如模糊逻辑、决策树等,然后再借助测试样本对规则的可靠性进行测试、评估。
2.3基于RBF神经网络的数据挖掘模型设计
下面本文以RBF神经网络为依托,对数据挖掘模型进行设计,其整体框架结构如图1所示。
整个系统由以下模块构成:数据获取、数据处理、数据分类与评估、控制与干预、GUI人机交互、知识库。系统模块的设计情况如下。
2.3.1数据准备
①数据选择。在数据选择中,让用户利用数据访问接口对数据集进行自行选择,进一步确定数据集类型、数据集名称及数据集处所位置。数据访问接口为对象模型,该模型覆盖了数据访问的各个层面,具体可使用的接口包括ADO,DAO和ODBC三种,本系统采用的数据库访问方案为DAO/ODBC,选择该方案的主要原因是DAO既能够与Microsoft Jet数据库引擎并用,还可借助ODBC Direct选项不与其并用。同时,通过DA0对Jet进行访问更加简单、便捷,并且使用DATE控件和DAO,能够创建出与数据库本身无任何关联性的虚拟代码。②数据清理。该环节的主要目的是将不希望包括在内的观测值筛选掉,操作过程既可借助SQn吾句实现,也可借助相关程序予以实现。③数据合成。该环节是将独立的数据合成数据集,操作过程较为简单,只要规则确定便可利用sQL语句或相关程序来实现。
2.3.2数据挖掘
(1)挖掘方法的选择与管理。该环节在系统中具有重要的作用,与系统的可扩充性和最佳挖掘方法的选择有关。挖掘方法管理可对系统中使用的全部方法所产生的接口信息进行保存,如对文本文件分词方法、Web日志的Session戈0分方法等挖掘方法中产生的特定数据信息予以保存,粗糙集、决策树属于通用的挖掘方法。在对该模块进行设计的过程中,针对分类预测问题,使用了聚类和神经网络以及统计学等方法。选择方法的主要目的是几乎所有的方法都是数据依赖,并没苻一种方法能够在所有的数据上表现良好。因此在方法选择的初始阶段,通过专家的人为干预是有必要的。经过对前人的研究成果进行总结后发现,将多种不同的方法联合运用可大幅度提升运用效果。对于本文构建的数据挖掘系统而言,其核心部分为数据挖掘模块,该模块的设计分为3个方面:①训练模块,以训练RBF网络为主,采用数学模型方法构建网络分类模型;②预测模块,在分类实际数据的基础上,将分类产生的数据结果快速传递到评估模块;③重构模块,该模块地能够确保数据挖掘模型具有―定的可扩展性和自适应能力,按照具体需要对模型进行重新构建。(2)结果显示。该环节以多种形式显示数据挖掘结果,如列表、树、图等是最为常见的显示方式。本文采用了可视化的方法进行数据挖掘结果显示,这样能够使用户对挖掘结果的了解更加直观、具体。(3)结果评估。在评估中,采用数据挖掘评价方式,通过比较分析不同模型下产生的数据挖掘效果,从而得出各类型分析工具的最终结果,再配以相应的标准图标进行直观显示,方便用户利用相关数据信息开展定量评价。在结果评估中,强调获取规则的价值评定,其评价关键点为查看数据挖掘结果与用户期望的符合程度,并对挖掘结果的可靠性和价值性进行评价,将其作为知识库是否纳入规则的重要评判依据。在GUI交互界面上,数据挖掘系统与用户可以进行交互操作。
2.4安全性保障措施
基于RBF神经网络的数据挖掘系统在使用过程中,安全性非常重要,为此,本文提出几点安全性保障措施,以此来确保数据挖掘的安全。
(1)采用登录机制确保数据安全。所谓的登录机制主要是针对客户端的一种安全控制措施。由于用户与服务器端需要通过网络的方式进行数据传输,为了进一步提高数据传输的安全性,可对数据进行加密处理,并将用户挖掘到的数据结果存储在服务器上,由此在不同的计算机上使用客户端均可对之前挖掘到的数据结果进行利用。
(2)设置权限。可以通过用户管理来完成用户的注册、登录以及使用权限管理。当用户需要使用数据挖掘系统进行数据挖掘时,要先进行账号注册,并在使用前通过注册的账号和密码进行登录,从而保证每个用户的数据安全。此外,用户管理能够实现分级管理,赋予不同用户不同的权限,这使安全性获得了进一步提升。
Abstract: Neural network is widely applied for character recognition. Through the analysis of the problems, this paper recognizes character by the application of improved BP neural network, so as to improve recognition rate. This method has high recognition rate, fast speed, strong practicability, and can be applied to various high noise environment.
关键词: 神经网络;图像预处理;特征提取;字符识别
Key words: neural network;image preprocessing;feature extraction;character recognition
中图分类号:TP301.6 文献标识码:A 文章编号:1006-4311(2014)10-0206-02
0 引言
字符识别是指采用扫描仪、数码相机等输入设备,把英文字母、数字、条形码等特殊字符的图形文件输入计算机,由识别软件对图片信息上的字符信息进行识别并变换成可编辑文档的识别技术。主要有光学字符识别(Optical
Character Recognition,OCR)、图像字符识别(Image Character Recognition,ICR)和智能字符识别(Intelligent Character Recognition,ICR),实际上这三种自动识别技术的基本原理大致相同。
1 常用字符识别方法
字符识别方法基本上都是为了区分结构识别、统计识别以及两者相结合的三大类方法,这三大类方法都包含具体的识别方法。
1.1 结构识别 结构识别是早期字符识别的研究的主要方法,我们也可以称之为句法结构识别。其思想是提取含有一定规律的结构信息,作为识别的依据。识别过程类似一个逻辑推理过程。结构识别的优点在于对字符变化的适应性强,区分相似字符能力强。但是在实际获取字符图像的过程中,由于存在着很多扭曲、倾斜等因素,就导致不能够准确地提取结构特征,后面的识别过程就成了无源之水。此外,结构识别的算法描述也较为复杂,匹配过程的复杂度也很高,因此,我们原有的句法识别就受到新的挑战。
1.2 统计识别 统计决策论的发展相对较早而且成熟,是为了提取待识别字符的一组统计特征,然后按照一定的准则进行决策函数的分类判决的。而统计识别是将字符点阵看作是一个能够经过大量统计数据得到的整体,是以后所用的特征都需要经过的。统计特征主要是以抗干扰能力强为主要特点,以实现匹配与分类的算法简单,且容易实现的。不足之处在于细分能力较弱,区分相似字的能力差一些。
1.3 结构识别与统计识别相结合 上述方法各有优缺点,而随着研究的深入,这些方法逐渐得到融合。网格化特征就是结合的产物。特征的统计以网格为单位,即使个别点的统计有误差也不会造成大的影响,增强了特征的抗干扰性。这种方法正得到日益广泛的应用。
字符的结构特征直接反映了字符的特有属性,而用字符的统计特征进行字符识别则是利用了计算机软件善于处理数字的特点。虽然近几年流行的神经网络方法主要采用的是局部特征,但其分类机理也与传统的统计识别方法相类似,优点是灵活性强。
2 字符识别流程
字符识别技术在当今社会的许多领域都有着广泛的商业应用前景。常见应用有条码识别、车牌识别、盲人的辅助阅读设备和邮包自动分检等。本文以车牌识别为例说明字符识别的应用以及识别流程。车牌识别系统的工作流程如图1所示。
经过字符分割后,得到可以进行字符识别的图像。本文采用神经网络方法进行字符识别,识别的具体过程如图2所示。
3 基于改进型BP神经网络的字符识别算法
3.1 BP神经网络简介 神经网络最早的研究是20世纪40年代,由心理学家Mcculloch和数学家Pitts合作提出的,由此拉开了神经网络研究的序幕。人工神经网络是通过对人脑生物神经机理进行简化,抽象和模拟之后建立起来的一种计算模型,属于机器学习的重要研究领域。人工神经网络可以应用于字符识别、人脸识别等领域。
随着神经网络的威力逐渐显现以及付诸应用的现实性,大量的学者对此进行了深入研究,出现了多种神经网络,如径向基神经网络和Hopfield网络等。1986年科学家Rumelhart和McCelland提出了BP(Back Propagation)神经网络,是一种按误差逆传播算法训练的多层前馈网络,是目前在字符识别中应用最广泛的神经网络模型之一。BP网络能学习和存储大量的输入输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
BP神经网络的结构如图3所示。从左至右分别是输入层、隐含层和输出层。
从图3可以看出,某一层的输出就是下一层的输入,即:am+1=fm+1(Wm+1am+bm+1),m=0,1,…M-1……
这里,M为神经网络的层数。第一层的神经元的输入为a0=p,最后一层神经元的输出是a=aM,即为整个神经网络的输出。BP神经网络虽然在字符识别领域有着重要的应用价值,但其存在如下问题:①进行字符识别时存在局部极小值问题;②算法通常需要迭代几千步甚至更多,收敛速度慢;③隐含层和隐含层节点的数量难以确定。要解决上述问题,就需对BP神经网络算法进行改进。
3.2 基于改进型BP神经网络的字符识别
3.2.1 图像预处理 在字符图像采集、输入的过程中由于受到多种噪声的干扰,会使图像质量下降,为字符识别工作带来困难,因此需要对初始图像进行必要的预处理。图像预处理的具体步骤如下:①选取合适的阈值进行图像二值化;②灰度变换增强对比度,改善视觉效果;③选取合适的方法去除噪声,常用的有中值滤波、均值滤波、高通滤波等方法;④图像分割,即将图像中的字符独立的分割出来。
3.2.2 字符特征值的提取 如果直接采用分割后的字符进行对比,那么需要对比的信息量很大,程序运行的时间也会大大增加。所以需要对分割后的字符进行特征提取,本文使用了类似九宫格的方法进行特征提取,即在字符图像的水平方向上将图像均匀分成三部分,在每一部分用一条水平方向的扫描线从左至右穿过字符,进行查找;垂直方向上原理相同,扫描线从上到下穿过字符,进行查找。取这六条线上的特征作为字符图像的特征,这样就得到了每个字符的六个特征值。
3.2.3 改进型BP神经网络 针对BP神经网络的局限性,为了避免落入局部极小值点,提高网络训练的精度和速度,对其算法进行了改进,常用的方法有:①优化初始权重。由于BP网络的误差曲面存在多个局部最小点和算法采用误差梯度下降的方法调整网络权重,因此导致了网络的训练结果极容易落入局部极小点。所以,网络的初始权重对网络的最终训练结果影响非常大,它是影响网络最终能否达到需求精度的重要因素之一。②调整自适应学习率。学习率η也称步长,在标准的算法中为常数。BP算法的收敛特性和收敛速度很大程度上取决于学习率,对于不同的问题,其取值范围也会不同。η取值过大可以加快学习速度,但会导致学习过程不收敛;η取值过小,则迭代次数明显增加,导致学习速度过慢。为了加速收敛的过程,可以自适应改变学习速率。③附加动量法。动量法是指在反向传播的基础上,在每个权值调整值上加上一项正比于前次权值变化的值,并根据反向传播法来产生新的权值变化。
本文为了简单起见,采用附加动量法只对数字和英文字母进行字符识别,利用梯度下降法,使权值沿函数的负梯度方向改变。提高了学习速度,增加了算法的可靠性。
带有附加动量项的权值调节公式为:
Wij(k+1)=Wij(k)+η[(1-α)D(k)+αD(k-1)]
其中,α是附加的动量项,取值范围为0
3.2.4 设计改进型BP神经网络进行字符识别 本系统采用了两个BP网络来进行数字和字母的识别。BP神经网络的建立主要是三个层的神经元数目的确定。①输入层节点数。此节点个数即为图像预处理后所输出的特征的维数。本系统输入层节点数为24×48。②隐含层节点数。确定隐含层节点数的基本原则是:在满足精度要求的前提下取尽可能紧凑的结构,即取尽可能少的隐含层节点数。本系统的两个神经网络,可以根据输出层神经元的多少来确定其个数,即输出层神经元越多,其隐含层神经元个数也越多。③输出层节点数。用于识别数字的BP网络,由于只有10个数字,所以采用了8421码进行编码,输出层的神经元数目为4。而识别26个字母的BP网络,其输出层的神经元数目为5。待识别的字符图像和训练好网络后识别的结果分别如图4和图5所示。
4 结束语
在字符识别的过程中,每一步都会有不同程度的误差,本文神经网络经验证后识别率可达95.1%,平均识别时间为0.6s。影响识别成功率的主要因素是训练样本的数量和训练次数,要保证一定数量以上的训练样本和训练次数,以保证识别率。另外,神经网络的层数和各层神经元的个数,对神经网络算法的运行速度和识别率也有着直接的影响,其数量越多,识别率越高,但也制约着识别速度,因此,如何处理好两者关系很重要。
参考文献:
[1]关学忠,刘勇智.基于数字图像处理的车牌定位及字符分割方法[J].装备制造,2010(01).
[2]武桐.基于图像匹配的汉字识别系统研究与实现[D].上海:上海交通大学,2010.
关键词 压力传感器;温度漂移;温度补偿
中图分类号:TP212 文献标识码:A 文章编号:1671-7597(2014)10-0038-02
压力传感器的输出结果精度容易受到多种因素的影响,其中,唯独是影响传感器输出精度的最主要因素。目前,国内经常使用硬件补偿和软件补偿两类方法对压力传感器进行温度补偿。硬件补偿方法调试难度较高、精度低、通用性也较差,在实际工程中应用时,难以去得较好的效果;而软件补偿方法有效弥补了硬件补偿的缺点,其中BP神经网络补偿在实际工程中运用十分广泛,但是典型BP神经网络补偿法虽然精确度高,但是整个流程过于复杂、整个过程耗时较长,因此,本文提出了一种基于主成分分析的BP神经网络补偿方法,希望对提高补偿效率和准确性起到一定的作用。
1 典型BP神经网络补偿原理分析
BP神经网络是目前研究中应用范围最广的神经网络模型之一,BP神经网络术语单向传输网络结构,整个信息传输的过程呈现出高度的非线性特点。典型的BP神经网络结构包括输入层、隐含层和输出层3层结构。通常情况下BP神经网络只有这3层结构,这主要是由于单隐层的BP神经网络既可以完成从任意n维到m维的映射。其典型结构如下图所示。
BP神经网络结构模型
BP算法设计到了信息的正向传播以及误差的反向传播,信息首先从输入层传入,然后经过隐含层的处理传入输出层,最终输出的信息可以用下面的形式进行表示:
其中:、分别代表了隐含层及输出层的权值;
n0、n1分别对应了输入节点数及隐含层节点数。
输出层神经元的激励函数f1通常呈现出线性特点;而隐含层神经元的激励函数f2通常采用如下所示的形式在(0,1)的S型函数中进行输出:
由于BP神经网络隐含层采用的传递函数为对数S型曲线,其输出范围在(0,1)之间。为了避免节点在短时间之内饱和而无法继续进行训练,需要在训练开始之前利用下面公式对样本数据进行预处理:
,
其中:Ui、Pi均为训练数据的标定值;Uimin、Uimax分别表示输出电压的标定极值(最小和最大);Pimin、Pimax分别表示压力的标定极值(最小和最大)。
当目标矢量为T,信息通过正向传递,可以得到误差函数,具体如下所示:
如果输出结果无法达到要求的误差范围,则返回误差信号并按照一定的权值对公式中的各层权值进行修正,直到输出结果达到期望值。
在利用典型BP神经网络进行压力传感器温度补偿的过程中,算法过于复杂,而且非常耗时,因此,需要对其进行改进,以提高补偿效率。
2 BP神经网络法的改进
2.1 改进原理
基于典型的BP神经网络,利用以下方法进行改进。
1)利用小波神经网络的思想对神经元的激励函数进行改进,从而实现小波特性与BP神经网络自学功能的充分结合,提高激励函数的逼近能力。以Morlet函数作为小波函数的母函数,可以降低不同层面神经元之间的影响,提高网络的收敛速度。以Morlet函数作母函数的小波函数属于幅值小波,其信号中包含了复值和相关信息,改进后的函数具体如下所示:
在本次研究中,我们选取了R个输入样本和N个输出节点,则可以利用下面的公式对第l个样本的第n个节点的输入进行表示:
其中:K表示神经网络隐含层的单元数量;M表示神经网络输入层的单元数量;ωn,k表示神经网络隐含层第k单元与输出层第n单元的连接权值;ak-小波伸缩因子;bk-平移因子;Sl(xm)―输入信号。
2)在计算过程中通过,附加动量法的应用可以有效改实现梯度方向的平滑过渡,使得计算结果更具稳定性。该方法以BP法为基础对权值进行调节,具体公式如下:
其中:t表示样本的训练次数;η表示学习速率;σ表示动量因子;σΔωki(t)表示附加动量项,它能够有效降低不同神经元之间的影响,提高网络的收敛速度。
2.2 主成分BP神经网络算法的实现
步骤1:按照典型BP神经网络数据预处理方法对样本数据进行预处理。
步骤2:利用主成分分析法对预处理后的样本数据进行分析,降低输入向量之间的影响,使各个输入变量的协同方差趋于统一,从而使各权值具有相同的收敛速度,并以此确定神经网络的输入节点。
步骤3:对神经网络进行初始化,并对其中的部分关键变量进行设置。
步骤4:为神经网络选取一组学习样本,以输入节点作为网络的输入向量,并输入期望fn,l,n=1,2,…,N;l=1,2,…,R。
步骤5:利用输入的网络参数计算网络的实时输出能力,当输出误差在允许范围之内时,停止训练;而当输出误差超过允许范围 ,则将误差信息进行反向传播,使权值沿误差函数的负梯度方向发生变化,然后利用梯度下降法计算出变化后的网络参数,然后再重复进行第4步的操作。
步骤6:BP神经网络在训练合格之后,对其进行样本补偿。
步骤7:对补偿后的样本进行反标准化处理,然后与实测数据进行误差比较,判断出网络改进之后的变化。
2.3 压力传感器温度补偿
根据前文提供的BP神经网络算法实现步骤,可以利用Matlab编程语言来实现。在实现该算法之后,我们通过在压力传感器量程范围内确定n个压力标定点,同时确定m个温度标定点。标准值发生器会根据每个标定点的信息产生对应的标定输入值。然后输入样本数据,样本数据按照目标值要求的±20%范围进行选择,然后以误差目标小于10-3进行训练,当达到误差目标之后,网络的收敛速度得到有效的提升。
3 结论
通过研究结果发现,利用主成分分析法对信息进行补偿之后,再利用BP神经网络对这些信息进行训练,其学习速度相对直接利用BP神经网络进行训练更高。同时,通过改进典型的BP神经网络,利用小波函数作为激励函数,并应用动量附加发对网络敏感性进行控制,可以有效避免网络发生局部极小问题。通过基于主成分的BP神经网络温度补偿方法可以使压力传感器受环境温度变化而发生的误差问题得到高效、精确的解决。
参考文献
【关键词】双目视觉;神经网络;摄像机标定
1.引言
双目测距技术在非接触式测量,机器人视觉等领域都有广泛引用。本文研究的是被动式远距离目标的距离测量系统中系统的标定技术研究,双目测距系统标定方法研究对计算机视觉技术发展有重要意义。摄像机标定的目的在于确定摄像机的位置,以确定物体在空间坐标系与成像平面之间相应的位置关系。
这些位置关系以及摄像机光学和几何参数在一些场所并不需要一一解出,而只需要构建二维成像平面上像点坐标与三维空间坐标投影点之间的一种映射关系。而神经网络有非常强的非线性映射能功能,因此我们可以通过采用神经网络对摄像机进行标定。
2.基于神经网络的摄像机的标定方法
2.1 神经网络、双目视觉神经网络摄像机标定
人工神经网络也称神经网络,是一门新兴技术,用以处理一些难以用标准数学模型描述的系统,模拟人类大脑的一些机理,实现某些特定功能。它具有很强的自学习及自适应能力,而其中可自由设定隐层节点的多层前馈神经网络,可以完成任意精度近似任意连续函数[1,2]。
由于网络由相连的非线性单元组成,因此就具有了学习非线性过程的能力。与摄像机标定工作机制相似,神经网络可以从一些已知数据通过计算得到未知参数。而神经网络标定的畸变模型有任意性,可以避免传统标定方法非线性标定可能无解、标定精度低等多种问题。本文通过运用神经网络学维平面图像像点与三维空间物点坐标之间的关系,提出了改进神经网络双目摄像机的标定方法。
本文双目视觉神经网络摄像机标定具有的优点是不用假设初始值,也不用建立精确的标定模型,只要输入三维空间中物体在两个图像上的像点坐标,神经网络便可输出物体在的三维空间的世界坐标。进行多次的神经网络学习、训练,最后可得到相对理想的输入、输出非线性映射关系。
2.2 改进的RBF神经网络
径向基函数(Radial Basis Function, RBF)神经网络是一种三层前向神经网络,它结构简单,训练简洁,学习收敛速度快,能够以任意精度逼近任意连续函数,广泛应用于众多领域[3,4]。RBF网络模拟了人脑中局部调整、相互覆盖接收域的神经网络结构,是一种局部逼近网络。并且RBF神经网络在逼近能力、分类能力及学习速度等多方面都优于BP神经网络,
遗传算法是模拟生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟生物在自然进化过程中形成的一种自适应全局优化搜索最优解的方法[5]。
本文提出了一种基于改进的RBF神经网络的摄像机标定方法,引入了遗传算法,优化了径向基函数网络的学习算法。
2.2.1 RBF网络的结构
RBF网络是一种三层前向网络,三层分别是输入层,隐藏层和输出层。输入层由信号源节点组成;输出层是对输入作出响应;隐藏层中节点数由需要而定,其中的径向基函数是局部响应函数。
从输入空间到隐含层空间的变换是非线性的,而从隐含层空间到输出层空间是线性的。RBF网络是局部逼近网络,三层组成(m个输入、h个隐节点、n个输出),常用的径向基函数是高斯函数,因此径向基神经网络的激活函数可表示为:
(1)
式中:是欧式范数;X是输入样本,;是高斯函数的中心,也是网络隐含层节点的中心;为高斯函数的方差;i是隐含层节点数。
RBF网络的结构输出为:
(2)
式中:wij是隐含层到输出层的连接权值;yj是第j个输出节点的实际输出。
假设d是样本的期望输出值,则基函数的方差为:
(3)
式中:P是样本总数。
RBF网络学习方法求解需要的参数:基函数的中心、方差以及隐含层到输出层的权值。RBF网络的输出是隐单元输出的线性加权和。本文采用的是自组织选取中心法。
2.2.2 优化的RBF神经网络
本文加入遗传算法用以优化已有的神经网络,用全局搜索找到最优网络结构,确定较理想非线性映射关系,进而达到双目视觉的标定。采用实数编码、最佳保留(elitist model)选择机制,交叉概率采用自适应方式,再对数据做归一化处理。
2.3 整体算法步骤
用遗传算法对神经网路的参数进行优化,得到权值与偏差值范围。再用RBF网络在局部搜索得出最优网络结构标定系统。
1)将多组对应的双目视觉系统图像像点坐标作为输入的训练样本,组成群体;
2)采用梯度下降法学习样本网络个体基函数的中心、方差;
3)采用最小二乘法学习隐含层到输出层的线性权值;
4)采用遗传算法优化隐含层中节点数;
5)通过循环交替学习、训练,得到相对理想的RBF网络标定系统。
3.实验说明
分别采用线性标定、标准BP网络、和改进的RBF网络做双目视觉标定,后两种做非线性函数逼近,对测试结果进行比较。得出结果:较其他两种,改进的RBF网络测试误差最小。
表1 测试结果比较
隐节点数 训练误差 测试误差
线性标定 * * 0.2945
标准BP 26 0.0935 0.0356
改进RBF 13 0.0576 0.0123
4.结论
在不考虑镜像畸变及环境等因素的形象下,将基于改进的RBF神经网络应用于双目视觉摄像机标定方法中,提高了测量精度,减少了因传统标定方法建立的模型不完善而带来的误差,为双目视觉测量应用于精密测量提供了一种新的有效方法。标定后的测量系统在双目视觉空间具有很高的测量精度。
参考文献
[1]阎平凡,张长水.人工神经网络与模拟进化计算[M].清华大学出版社,2000:410-420.
[2]钱光耀,杨入超,赵光兴.基于人工神经网络的压力传感器三维数据融合[J].传感器与微系统,2007,26(2):79-81.
[3]Liu Hongmei,Ouyang Pingechao,Wang Shaoping.Fault detection based on RBF neural network in a hydraulic position servo system[A].The 6th World Congress on Control and Automation[C].Dalian, China,2006:5708-5712.
[4]杨耀华,李昕,江芳泽.基于OLS算法的RBF神经网络高速公路事件探测[J].系统仿真学报,2003,15(5):709-712.