前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇人工神经网络的优缺点范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
【关键词】 图像识别技术 神经网络识别
模式识别研究的目的是用机器来模拟人的各种识别能力―比如说模拟人的视觉与听觉能力,因此图像识别的目的是对文字、图像、图片、景物等模式信息加以处理和识别,以解决计算机与外部环境直接通信这一问题。可以说,图像识别的研究目标是为机器配置视觉“器官”,让机器具有视觉能力,以便直接接受外界的各种视觉信息。
一、图像识别系统
一个图像识别系统可分为四个主要部分:被识图像、图像信息获取、图像预处理、图像特征提取、分类判决。
二、图像识别方法
图像识别的方法很多,可概括为统计(或决策理论)模式识别方法、句法(或结构)模式识别方法、模糊模式识别方法以及神经网络识别方法。重点介绍神经网络识别方法。
2.1神经网络识别方法
2.1.1人工神经网络的组成
人工神经网络(简称ANN)是由大量处理单元经广泛互连而组成的人工网络,用来模拟脑神经系统的结构和功能。而这些处理单元我们把它称作人工神经元。
2.1.2人工神经网络的输出
2.1.3人工神经网络的结构
人工神经网络中,各神经元的不同连接方式就构成了网络的不同连接模型。常见的连接模型有:前向网络、从输入层到输出层有反馈的网络、层内有互联的网络及互联网络。
2.1.4 学习算法
1)感知器模型及其算法
算法思想:首先把连接权和阈值初始化为较小的非零随机数,然后把有n个连接权值的输入送入网络中,经加权运算处理后,得到一个输出,如果输出与所期望的有较大的差别,就对连接权值参数按照某种算法进行自动调整,经过多次反复,直到所得到的输出与所期望的输出间的差别满足要求为止。
2)反向传播模型及其算法
反向传播模型也称B-P模型,是一种用于前向多层的反向传播学习算法。
算法思想是:B-P算法的学习目的是对网络的连接权值进行调整,使得调整后的网络对任一输入都能得到所期望的输出。学习过程包括正向传播和反向传播。正向传播用于对前向网络进行计算,即对某一输入信息,经过网络计算后求出它的输出结果;反向传播用于逐层传递误差,修改神经元之间的连接权值,使网络最终得到的输出能够达到期望的误差要求。
B-P算法的学习过程如下:
第一步:选择一组训练样例,每一个样例由输入信息和期望的输出结果两部分组成;第二步:从训练样例集中取出一样例,把输入信息输入到网络中;第三步:分别计算经神经元处理后的各层节点的输出;第四步:计算网络的实际输出和期望输出的误差;第五步:从输出层反向计算到第一个隐层,并按照某种原则(能使误差向减小方向发展),调整网络中各神经元的权值;第六步:对训练样例集中的每一个样例重复一到五的步骤,直到误差达到要求时为止。
3)Hopfield模型及其学习算法
它是一种反馈型的神经网络,在反馈网络中,网络的输出要反复地作为输入再送入网络中,使得网络具有了动态性,因此网络的状态在不断的改变之中。
算法思想是:
(a) 设置互连权值
其中xis是s类样例的第i个分量,它可以为1或0,样例类别数为m,节点数为n。
(b) 未知类别样本初始化。 Yi(0)=Xi 0≤i≤n-1
其中Yi(t)为节点I在t时刻的输出,当t=0时,Yi(0)就是节点I的初始值,Xi为输入样本的第I个分量。
(c) 迭代直到收敛
关键词:神经网络 ;BP网络; 优缺点; 改进算法
【中图分类号】 TP183 【文献标识码】 B【文章编号】 1671-1297(2012)09-0196-02
思维学普遍认为,人类大脑的思维分为抽象(逻辑)思维、形象(直观)思维和灵感(顿悟)思维三种基本方式。
人工神经网络(Artificial Neural Networks,NN)就是模拟人思维的第二种方式。这是一个非线性动力学系统,其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络系统所能实现的行为却是极其丰富多彩的。人工神经网络系统从20世纪40年代末诞生至今仅短短半个多世纪,但由于它具有信息的分布存储、并行处理以及自学习能力等优点,已经在信息处理、模式识别、智能控制及系统建模等领域得到越来越广泛的应用。
神经网络拓扑结构的单隐层前馈网络,一般称为三层前馈网或三层感知器,即:输入层、中间层(也称隐层)和输出层。它的特点是:各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之间无反馈连接,够成具有层次结构的前馈型神经网络系统。单计算层前馈神经网络只能求解线性可分问题,能够求解非线性问题的网络必须是具有隐层的多层神经网络。
一 BP网络
1986年,Rumelhart和Hinton提出了误差反向传播神经网络(Error Back Propagation Neural Network),简称BP网络。它是一种能向着满足给定的输入输出关心方向进行自组织的神经网络。
1. BP网络的原理
输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。
2. BP网络的特点
(1)输入和输出是并行的模拟量。
(2)网络的输入输出关系是各层连接的权因子决定,没有固定的算法。
(3)权因子是通过学习信号调节的,这样学习越多,网络越聪明。
(4)隐含层越多,网络输出精度越高,且个别权因子的损坏不会对网络输出产生大的影响。
3. BP网络的优点
(1)网络实质上实现了一个从输入到输出的映射功能,而数学理论已证明它具有实现任何复杂非线性映射的功能。这使得它特别适合于求解内部机制复杂的问题。
(2)网络能通过学习带正确答案的实例集自动提取"合理的"求解规则,即具有自学习能力。
(3)网络具有一定的推广、概括能力。
4. BP网络的缺点
BP算法的学习速度很慢,其原因主要有:
(1)由于BP算法本质上为梯度下降法,而它所要优化的目标函数又非常复杂,因此,必然会出现"锯齿形现象",这使得BP算法低效;
(2)存在麻痹现象,由于优化的目标函数很复杂,它必然会在神经元输出接近0或1的情况下,出现一些平坦区,在这些区域内,权值误差改变很小,使训练过程几乎停顿;
(3)为了使网络执行BP算法,不能用传统的一维搜索法求每次迭代的步长,而必须把步长的更新规则预先赋予网络,这种方法将引起算法低效。
网络训练失败的可能性较大,其原因有:
(1)从数学角度看,BP算法为一种局部搜索的优化方法,但它要解决的问题为求解复杂非线性函数的全局极值,因此,算法很有可能陷入局部极值,使训练失败;
(2)网络的逼近、推广能力同学习样本的典型性密切相关,而从问题中选取典型样本实例组成训练集是一个很困难的问题。
难以解决应用问题的实例规模和网络规模间的矛盾。这涉及到网络容量的可能性与可行性的关系问题,即学习复杂性问题。
网络结构的选择尚无一种统一而完整的理论指导,一般只能由经验选定。为此,有人称神经网络的结构选择为一种艺术。而网络的结构直接影响网络的逼近能力及推广性质。因此,应用中如何选择合适的网络结构是一个重要的问题。
新加入的样本要影响已学习成功的网络,而且刻画每个输入样本的特征的数目也必须相同。
二 BP网络的改进算法
BP算法最优化的方向主要有权值调整、自适应学习速率调整、网络结构调整等。常用的改进方法有以下几种:
1.加入动量项
利用附加动量的作用则有可能滑过局部极小值。该方法所加入的动量实质上相当于阻尼项,它减小了学习过程的振荡趋势,改善了收敛性,这是目前应用比较广泛的一种改进算法。
2.自适应学习速率调整
对于一个特定的问题,要选择适当的学习速率并不是一件容易的事情。对训练开始初期功效很好的学习速率,不一定对后来的训练合适。为了解决这一问题,人们自然会想到在训练过程中自动调整学习速率。
3.共轭梯度算法
在各种改进算法中,共轭梯度法(Conjugate Gradient)是非常重要的一种。其优点是所需存储量小,具有N步收敛性,稳定性高,而且不需要任何外来参数。
4.Levenberg-Marquart算法(最小二乘拟合算法)
除了改进算法以外,通过改变神经网络结构(隐层结点数和网络层数)、调整误差等方法,也能加快BP算法的收敛速度。
参考文献
关键词:切削数据库;数据寻优算法;实例推理;粒子群算法;神经网络算法
中图分类号:TG506 文献标志码:A 文章编号:1007-2683(2013)01-0001-06
0.引言
近年来,随着数控机床及切削刀具技术的不断发展,切削数据在机械制造领域中越来越显示出其重要性,并且已经成为一种极为重要的资源。
数据库是集中、保存和管理某一领域内所有这些信息的集合,是管理信息系统的核心。切削数据库是切削加工技术与计算机技术相结合的产物。切削数据库最初只是管理加工中出现的切削数据,随着神经网络算法、粒子群算法等优化算法的应用,切削数据库中添加了优化切削数据和切削数据的智能化评价等功能,使得切削数据库系统得到了很大的发展并已受到各相关行业的高度重视。选择合理的优化算法建立切削数据库,可以合理地选择切削参数,对提高生产率、降低生产成本有着非常重要的意义。对于解决某一类问题,可以通过多种算法来实现但并不是每一种算法都能找到最优解,需要根据每个算法自身的优缺点、适合的领域、优化方式等来选择合适的算法,从而使寻优路径达到最短,优化效果达到最好。但是传统的优化算法也存在一定的弊端,为此提出了算法的改进算法,在很大程度上增强了算法的寻优能力。
1.数据获取技术在切削数据库中的应用
1.1神经网络推理技术
神经网络算法是指模拟生物的神经结构以及其处理信息的方式来进行计算的一种算法。神经网络可以处理例外及不正常的输入数据,这对于很多系统都很重要。黄传真等研究的汽车覆盖件模具钢高速切削数据库将分别基于MATLAB神经网络和基于指数函数的刀具磨损预报模型的拟合误差相比较,优选出基于MATLAB神经网络的刀具磨损预报模型,并将.NET框架和MATLAB环境引入到刀具磨损集成预报系统中,实现了模具钢精加工过程中对刀具磨损的在线预报,实现了对高速切削加工技术的合理应用。
为了实现神经网络模型的智能寻优,将其与蚁群算法相结合使用,用蚁群算法的启发式寻优和全局优化的特点来训练神经网络的权值即用蚁群算法来训练神经网络,最终解决寻优问题。如詹晓娟等研究的基于蚁群神经网络铣削数据库系统就是利用蚁群算法优化神经网络的方法,使系统在切削参数的选择具有一定的智力水平,实现了切削参数的合理选择。这种智能寻优的方法不仅避免了以往算法收敛速度慢易陷入局部最优等缺陷,提高了系统的运行速度和运算效率,还能够通过自学习提高自身决策能力,使决策结果更趋合理。
神经网络在解决非线性映射问题如切削用量选择上可达到良好的效果,在机械工程领域具有很高的利用价值。但是当前的神经网络仍普遍存在收敛速度慢、计算量大、训练时间长和不可解释等缺点。
1.2动力学仿真优化技术
切削参数数据库的数据主要来源于切削手册、生产实践和切削实验,传统来源的切削参数难以完全满足切削加工的要求。为了存储优化型仿真切削数据,保证切削加工稳定性,赵海洋等在平台下开发了基于B/S数据库结构的动力学仿真优化型切削数据库系统。该系统通过动力学仿真优化方式获取优化型切削参数,实现了高速加工过程中的稳定高效切削。
将动力学仿真优化技术引入到切削数据库及其应用系统中,不仅能使系统具有良好的结构和可扩展性,还能提供工艺人员合理的切削参数,大大减少了以往试切所带来的经济和时间上的浪费,从而提高了生产效率,降低了生产成本。
1.3实例推理技术
1982年Schank通过研究人和机器学习的动态存储理论,提出了基于实例的推理(case-based reason-ing,CBR)其本质是利用旧问题的解决方案来解决新问题,并且具有自学习功能,CBR原理如图1所示。
利用实例推理技术,将其与规则推理相结合使用,把以往取得的经验应用于新问题的解决上,减少知识获取的工作量,不仅可以为建立切削参数数据库提供一个有效可行的方法,还可以为新的工件加工问题提供参考解决方案,对切削技术的推广应用具有非常重要的意义。
CBR是一种人工智能的推理方法,广泛应用于问题求解领域,在一定程度上突破了知识获取的瓶颈问题。由于CBR中实例都是以往问题的优化结果,因此其本身就包含了大量的设计经验知识,不仅避免了在获取知识上的时间的浪费,而且设计结果的实用性也很强。CBR为快速设计新的工艺提供了依据。
2.切削数据优化算法分析对比
2.1多目标优化算法的比较
从古老的时代开始,人们就力求在解决一个问题的众多方案中寻求一种最优方案,因此实际中优化问题大多数是多目标优化问题,它也是一类普遍存在的问题。基于群体智能进化的群体智能优化算法在解决多目标优化问题上提高了人们解决和处理优化问题的能力。但是粒子群算法等群体智能优化算法在解决多目标优化问题时有着各自的优缺点,需要对它们进行比较以选择合适的算法。表1是几种智能优化算法的比较。
通过表1中几种算法的对比可以看出,每种优化算法都有自己独特的优缺点,但是在处理高维复杂问题时都出现易陷入局部最优、收敛效果不好的问题。粒子群算法和遗传算法都属于全局优化算法,利用目标函数来衡量个体的优劣程度,粒子群算法计算复杂度比遗传算法低,可以短时间内找到最优解,但粒子群算法在搜索性能上好于混洗蛙跳算法。可以将几种算法结合使用或者对某种算法进行改进,弥补以往算法的缺点,从而达到更好的解决多目标优化问题的目的。
2.2知识获取的推理方式比较
规则推理、人工神经网络、实例推理、模糊逻辑、遗传算法和混合推理等智能推理方法被普遍应用在工程中。实例推理作为基于规则推理技术的一个重要补充,已受到人们越来越广泛的关注。但目前比较常用的智能推理方法有规则推理、神经网络和实例推理,它们在解决不同问题上表现出各自的优缺点,如表2所示。
根据表2列出的3种智能推理方式的比较可以看出,在总体上来看实例推理表现最好,但在解决复杂知识获取问题上仍表现出明显的不足。针对这一问题研究人员将实例推理、规则推理、人工神经网络三者结合,产生了各种各样的混合推理,这些推理不仅结合了它们各自的优点,而且很大程度上克服了单个方法的缺点,可
以很好的解决复杂问题,如高速切削数据库系统的建立就是采用规则推理和实例相结合的混合推理方式,通过这一方式使该系统的数据采集和知识更新变得简单易行。
2.3数据查询优化算法比较
随着现代切削数据库规模的不断扩大,高效率的信息提取技术逐渐成为人们研究的热点。高效的查询被用来体现一个系统性能的好坏,查询的效率也就成为了评价切削数据库系统的重要指标。提高查询效率是建立一个系统首要解决的问题之一,因此对作为有效手段的查询优化的研究就显得尤为重要。但是一个较好的优化算法,并不是通用和万能的,根据不同的环境不同的优化算法适用于不同的的问题及用户。目前常用的数据查寻优化算法有启发式搜索算法又称为A算法,它是在贪婪算法的基础上提出的一种基于人工智能理论的改进算法;基于Agent的分布式查询优化算法,它结合了分布式人工智能与切削数据库管理系统两个领域;遗传算法,它是模拟生物在环境中遗传和进化过程而形成得一种自适应的全局优化概率搜索算法;全局查询优化算法如模拟退火算法、快速分解模拟退火等,能够找出全局最优解;等联结操作结果估算模型,它是一种改进算法,能保证优化方法在一定条件下生成的任意两个相邻的操作次序是最优的;分裂大表算法即将大表分成若干个子表和一个索引表,将子表放在不同的逻辑设备上,各子表的名称和分裂条件存放在索引表里来提高查询速度;神经网络技术的异构数据库集成,它可以通过将全局查询快速地分解为各个子查询,来进行优化操作;多元连接查询优化算法,针对远程网和局域网这两种不同的网络,提出了最小生成树算法和改进的最小生成树算法两种全局优化算法,反复使用此算法可使预先估计的总代价最小;分布式查询优化算法,它的核心是SDD-1查询优化算法,该算法在一定程度上可以使整个网络上的传输量保持最小。对数据库进行查询时,可供选择查询优化算法很多,需要根据一定的标准来评价各算法是否适用于此环境,以提高效率的目的。为此研究人员提出了评价算法的4个标准:一是否适用于大数据量;二是否能应付异构数据库的要求;三是局部优化还是全局优化;四是算法的效率是否满足大数据量、高复杂性的要求。表3是几种数据查询优化算法的比较。
由表3可知,对数据库进行查询时,对查询优化算法的选择需要考虑很多因素,不能通过一个固定的原则来评价优化算法的优劣,需要根据当时的系统环境来选择合适的优化算法,这样才能充分利用算法的优点。
3.数据寻优算法的改进
目前许多数据优化算法被广泛应用在机械加工领域,在一定程度上达到了数据寻优的目的,提高了系统的寻优能力,但是面临一些复杂的问题时一些算法表现出收敛速度慢、陷入局优等问题,为了解决这一问题,对一些算法提出了改进,下面介绍了几种算法的改进算法。
3.1变形遗传算法
变形遗传算法是从简单遗传算法发展而来的,是对其运算因子的扩展和补充。简单遗传算法存在许多的不足之处,变形遗传算法在此基础上进行了一些改进:改进编码方式,改进初始群体的生成方式,改进适应度函数的定义方式,改进选择算子操作方式,改进变异算子操作方式,改进算法终止条件。这些算法增强了变形遗传算法搜索过程的方向性,从而增强了算法搜索寻优的方向性。图2为切削用量优化的变形遗传算法的流程图。
变形遗传算法有两个优点:一是具有局部的随机搜索能力;二是可维持群体多样性,防止出现未成熟收敛现象,从而使收敛概率达到大值。
3.2改进的粒子群算法
粒子群优化算法在函数优化等领域蕴涵了广阔的应用前景,利用粒子群优化参数原理(如图3),并与局部搜索算法混合,可以提高了算法在局部区域内进行精细搜索的能力。寻找到最优化的加工参数。目前针对粒子群算法存在的问题,已提出了多种粒子群算法改进算法,并且这些改进的算法广泛应用于函数优化,神经网络训练,模式分类等领域。其中一种改进的粒子群算法是针对粒子群算法在求解高维函数时易陷入局部最优的问题提出的,该算法通过对粒子的速度和位置更新公式进行改进,使粒子在其最优位置的基础上进行位置更新,从而增强算法的寻优能力。如图4为改进的粒子群算法流程图。
另外两种典型的粒子群算法的改进算法为:①全局邻域模式和局部邻域模式粒子群优化算法,前者收敛速度快,但易陷入局部极小值;后者收敛速度慢,但能在较大程度上避开局部极小值;②混沌粒子群优化算法,它不但具有混沌的随机性、遍历性、规律性等特性,还能引导粒子及其组成的群落搜索全局最优解。
3.3协同优化算法的改进
协同优化算法(eollaborati Veoptimization,CO)是多学科设计优化方法中应用最广、效果最好的算法,但是在应用中存在计算困难的问题,根据这一问题提出了改进的协同优化算法一ICO(Improvedeollaborati Veoptimization)多学科设计优化方法。
ICO多学科设计优化方法保持了CO算法模块化和学科自治性的优点,以新的表达方式来克服CO算法的计算困难。ICO算法利用快速启动方法提高了计算速度,使得ICO算法比标准CO算法更加稳定、可靠,计算效率明显提高。以往协同粒子群算法不能保证全局收敛,易产生伪最优值的问题,根据这一问题提出改进的协同粒子群优化算法,它将混沌理论引入协同粒子群算法中,改善了协同粒子群算法的性能,使其具备了求解高维优化问题的优越性。但是IC0算法还需要在大型复杂工程系统设计优化中进行应用、检验及进一步完善。
Matherton提出Kriging数学理论之后,Kriging技术在许多领域得到应用,研究人员以此为基础并基于统计学理论提出了Kriging模型,Kriging模型被视为一种最优的线性无偏估计。对于计算量大的问题可以利用基于Kriging模型的改进协同优化算法(Kriging-CO算法)来提高系统的优化效率,该改进算法的原理如图5所示。Kriging-CO算法适用于解决共享变量多、子模型复杂的问题,应用该算法减少迭代次数,提高运算效率。
虽然一些改进算法弥补了以往算法一些不足,但切削数据库技术的发展越来越快,对切削数据库性能的要求越来越高,出现的问题也会越来越多,因此对算法的研究也必须更加深入。
4.结语
关键词:SOM神经网络;负荷特性曲线;聚类分析
中图分类号:TM7 文献标识码:A 文章编号:1007-0079(2014)33-0204-03
在国家提出建设坚强智能电网的背景下,提高电力营销服务水平和智能用电技术已成为电网企业关注的焦点。电力营销服务水平与智能用电技术的提升离不开在对电力用户用电行为特征的准确、全面、及时地掌握,而从海量负荷数据中提取用户日负荷特征曲线并进行深入分析成为研究用户用电行为特征的一种有效方式。
从研究对象层面来看,以往相关研究侧重专线用户(负荷数据来源为SCADA系统)和专变用户,并以传统意义上的行业分类作为提取负荷特征曲线时聚类的依据。从研究方法层面来看,电力用户日负荷特征曲线的提取多使用聚类算法,主要有统计方法、机器学习方法、人工神经网络方法和面向数据库的方法。人工神经网络因具有大规模的并行协同处理能力、较强的容错能力、联想能力、学习能力和自适应能力,故能够较好地适应海量数据背景下的数据挖掘。应用较多的典型的神经网络模型包括BP网络、Hopfield网络、ART网络和Kohonen网络。[1-3]BP网络属于有监督学习的神经网络,需要提供聚类对象类别数量的先验知识,而公变用户缺乏传统意义上类似专变用户的行业分类,故不适合采用BP网络。Hopfield网络、ART网络和Kohonen网络都属于无监督学习的神经网络,在解决聚类问题上有其各自的优缺点。
本文提出采用SOM神经网络[4-6]聚类算法提取公变用户日负荷特征曲线,用MATLAB软件进行仿真,输出可视化聚类结果,并对聚类结果进行分析,验证了采用SOM神经网络聚类算法提取出的公变用户日负荷特征曲线能够较好地显示不同类型公变用户用电行为特征上的差异,具备良好的聚类效果,同时为电网企业优化电力营销服务提供参考和指导。
一、SOM神经网络
SOM(Self-Organizing Map,自组织映射)神经网络是较为广泛应用于聚类的神经网络。它是由Cohonen提出的一种无监督学习的竞争型神经网络模型,通过不断缩小获胜神经元的邻域来达到聚类的目的。主要功能是将输入的高维空间数据映射到一个较低的维度,通常是一维或者二维输出,同时保持数据原有的拓扑逻辑关系。
SOM神经网络由输入层和输出层两层组成,输入层中的每一个神经元通过权与输出层中的每一个神经元相连,如图1所示。输入层的神经元以一维的形式排列,输入神经元的个数由输入矢量中的分量个数决定,输出层的神经元一般以一维或者二维的形式排列,计输入层的神经元数量为m,输出层神经元数量为c。输入的样本总数为n,第i个输入样本用矢量表示为,每个输出神经元的输出值记为,。与第j个输出神经元相连的权用矢量表示为:。
Kohonen算法是无教师示教的聚类方法,它能将任意维输入模式在输入层映射成一维或二维离散图形,并保持其拓扑结构不变,即在无教师示教的情况下,通过对输入模式的自组织学习,在输出层将聚类结果表示出来。此外,网络通过对输入模式的反复学习,可以使连接权矢量空间分布密度与输入模式的概率分布趋于一致,即连接权矢量空间分布能反映输入模式的统计特性。该算法往往在完成极高维数、超大量数据和高度非线性问题的聚类,模式表征和数据压缩,分类等任务时是一个很有效、很简便,且快速、稳健、泛化性好的算法。
Kohonen的学习算法如下:
(1)初始化:将整个输入向量存储在矩阵p中,对权值w进行初始化,权值向量的每一维的取值范围同输入向量每一维的取值范围。
(2)选择一个输入向量,提供给网络输入层。
(3)按照下式计算输出层每一个神经元 j 的权值与输入向量之差:,其中,。
(4)按照“胜者为王”的原则,对每一个神经元j,以minDist中的最小值所对应的神经元 k作为胜者,对它和它的邻域内的神经元的权值进行调整,假设当前处于学习的第l步,权值的修正按照下式进行:
其中,lr表示学习速率,br表示邻域调整率;表示获胜神经元的邻域,即:。
(5)选择另一个输入向量,返回(3),直到所有的输入向量全部提供给网络。
(6)返回(2),直到达到最大训练步数。
二、MATLAB仿真算例
1.MATLAB仿真实现
对于日负荷特征曲线的提取,负荷曲线的采样点越多,曲线越精细,越容易进行分类,研究数据来自于电力用户用电信息采集系统,从中提取公变用户每15分钟采集一次的有功功率构成其日负荷曲线,一天共96个采样点。从某省电力用户用电信息采集系统中随机抽取1000台公用变压器,选取其2012年7月10日(工作日,该省全年负荷最高日)作为典型日进行日负荷特征曲线提取和分析。每台公变日负荷曲线由96个有功采样点组成。由于每台公变额定容量大小不等,为了有效聚类,首先需要对负荷数据进行归一化处理。
本文采用聚类SOM神经网络,在MATLAB环境下,对这些数据进行聚类仿真。聚类SOM神经网络的MATLAB实现步骤如下:(1)准备数据源。首先从原始数据库读取相关数据(输入样本总数70,每一个样本有96个采集时点)作为输入矢量,并将其以二维数组70×96形式输入。(2)确定参数。输入神经元个数为采集时点的个数96;输出神经元以二维数组3×3形式呈现。(3)运用rand( )函数产生[0,1)之间的随机数作为权值。(4)调用SOM创建函数newsom( ),创建自组织映射网络net=newsom( )。(5)对迭代次数net.trainParam.epochs赋值2000;对net.trainParam.show赋值20,表示每20次显示一下误差变化情况。(6)运用网络训练函数train( )训练上述初始化后的网络net=train( )。(7)调用plot( )画输入点; plotsom( )作训练后的权值点及其与相邻权值点的连线。
2.仿真结果分析
经MATLAB仿真运行后得到聚类结果图2所示:
图2所示为SOM神经网络聚类结果,将样本公变用户分为7个类别,为便于后文描述,不妨按照行优先的顺序为各激活的优胜神经元标识聚类编号,依次分别为为:公变用户第一类(包含13个样本用户)、公变用户第二类(包含12个样本用户)、公变用户第三类(包含5个样本用户)、公变用户第四类(包含10个样本用户)、公变用户第五类(包含10个样本用户)、公变用户第六类(包含10个样本用户)、公变用户第七类(包含10个样本用户)。
每个竞争层神经元与各输入神经元之间的连接权构成的向量代表了该优胜神经元所标识类别的聚类中心即日负荷特征曲线,竞争层神经元邻域权值距离如图3所示,颜色越深表示领域神经元间的权值距离越远,即邻域神经元的聚类中心距离越远、提取的日负荷特征曲线差异越大。
图4所示为通过SOM神经网络聚类算法提取的七大类公变用户日负荷特征曲线。日负荷特征曲线较为明显地反映了不同类型公变用户在该典型日的用电行为。
第一类公变日负荷特征曲线呈现出明显的午高峰和晚高峰特征,且晚高峰明显高于午高峰。推测此类为城镇居民生活的典型日负荷特征曲线,可能由于部分居民上班因素造成晚高峰高于午高峰;第二类公变日负荷特征曲线走势同全网负荷基本一致,呈现出明显午高峰和晚高峰,但午高峰一枝独秀,可能该公变下的用户类型较多,包括居民用户和一般工商业用户,由于各类用电特征比例与全网比例类似,形成具有全网负荷特征的曲线;第七类公变日负荷特征曲线与前六种主要集中在白天用电不同,主要在天黑时间段内(晚上7点左右至第二天早上6点)用电,推测这类用户主要集中在市政工程类。
三、总结与展望
本文将SOM神经网络聚类算法应用到电力用户日负荷特征曲线提取的研究中,选取某省公变用户作为分析样本,通过MATLAB仿真计算将样本公变用户分为七个类别,以优胜神经元与输入神经元之间连接权向量作为聚类中心即该类别用户的日负荷特征曲线。根据提取出的日负荷特征曲线,结合电力用户用电信息采集系统中的营销档案分析了不同类别公变用户的用电特征与习惯。分析表明,采用SOM神经网络聚类算法提取日负荷特征曲线具有良好的效果,提取出的日负荷特征曲线能够较好反映该类型用户的用电行为与特征,为电力企业了解用户用电习惯、细分电力市场、调整定价策略和实施需求侧管理提供了有益参考。
下一步研究将考虑采用电力用户全年负荷数据进行聚类分析,验证小样本下的聚类结果、发现新的用户类型;同时改进SOM神经网络算法,使其适应海量数据下的负荷曲线聚类分析,并通过调整竞争层神经元个数与抑制权值使训练结果更加稳定,得到更好的聚类效果。
参考文献:
[1]马玉梅,马志超.基于人工神经网络的手写阿拉伯数字识别[J].中央民族大学学报(自然科学版),2007,(4).
[2]刘小波,李亚玲,赵景涛,等.基于KOHONEN神经网络的电压控制分区[J].浙江电力,2007,(3).
[3]莫礼平.基于Kohonen神经网络的故障诊断方法[J].成都大学学报(自然科学版),2007,(1).
[4]李培强,李欣然,陈辉华,等.基于模糊聚类的电力负荷特性的分类与综合[J].中国电机工程学报,2005,(24).
关键词:人工神经网络;SOM;城市分类
一、引言
城市分类不仅便于我们对各个城市的发展进行评估,并且为我们制定城市的发展决策提供了依据。然而,如何能够进行科学的城市分类一直备受关注。而基于近些年来人工神经网络的飞速发展,它帮助我们解决了许多棘手的难题,其中的自组织特征映射网络(SOM)具有强大的聚类功能,利用它可以帮助我们根据各个城市的特点从而进行科学分类,为加速我国城市的发展和城镇化建设有着重要的意义。2005年吴聘奇、黄民生利用SOM网络对福建省城市进行了职能分类,同年,刘耀彬、宋学锋又基于SOM人工神经网络对长江三角洲地区城市职能分类做了研究。从而可见,基于人工神经网络的自组织特征映射网络(SOM)在城市的分类问题确实可以发挥强大的作用。
评价一个城市的各个行业的发展,有许多指标。其中行业就业人口是评价一个城市该行业的发展的基础指标。本文对山东地区城市的分类实证分析中,对各个城市的各行业就业人口数量进行了采集,其中包括农林牧渔业,采矿业,制造业,电力、煤气及水的生产和供应业,建筑业,交通运输、仓储和邮政业,信息传输、计算机服务和软件业,批发和零售业,房地产业,住宿和餐饮业,金融业,租赁和商务服务业,水利、环境和公共设施管理业,居民服务和其他服务业,教育,科学研究、技术服务和地质勘查业,卫生、社会保障和社会福利业,文化、体育和娱乐业,公共管理和社会组织等19个行业的从业人员数。然后,通过MATLAB软件进行编程构建,成功地将山东省的17个城市进行了分类,从而说明了SOM网络在城市分类方面的确有优于其他传统方法的优点。
二、SOM网络的基本原理
(一)SOM网络简介
自组织特征映射网络也称Kohonen网络,或者称为Self-OrgnizingFeatureMap(SOM)网络,它是由芬兰学者TeuvoKohonen于1981年提出的。该网络是一个由全连接的神经元阵列组成的无教师自组织、自学习网络。Kohonen认为,处于空间中不同区域的神经元有不同的分工,当一个神经网络接受外界输入模式时,将会分成不同的反应区域,各区域对输入模式具有不同的响应特征。
SOM网络的一个典型特征就是可以在一维或二维的处理单元阵列上,形成输入信号的特征拓扑分布,因此SOM网络具有抽取输入信号模式特征的能力。SOM网络一般只包含有一维阵列和二维阵列,但也可以推广到多维处理单元阵列中去。
(二)SOM网络学习算法
1、初始化。对N个输入神经元到输出神经元的连接权值赋予较小的权值。选取输出神经元j个“邻接神经元”的集合Sj。其中Sj(0),表示时刻t=0的神经元j的“邻接神经元”的集合,Sj(t)表示时刻t的“邻接神经元”的集合。区域Sj(t)随着时间的增长而不断缩小。
2、提供新的输入模式X。
4、给出一个周围的邻域Sk(t)。
7、提供新的学习样本来重复上述学习过程。
三、基于SOM网络的城市分类实证分析
城市分类可以便于我们了解各个城市的发展状况,从而为我们制订城市的发展决策提供依据。现在人工神经网络已经得到了很大的发展,它为我们研究此类问题提供了一种新的工具和思路。所以基于这个问题,我们尝试利用SOM网络来进行城市分类。SOM网络是一种具有聚类功能的神经网络,并且它是无教师训练方式,我们只需要采集输入样本,而不必如入目标值就可以得到我们想要的结果,可见SOM网络使用也十分方便。
(一)网络样本设计
从山东省统计局网站,我们得到了山东省17个地级市城市的样本。从中我们看出,原始指标数据波动较大,而一般来说,神经元的输出函数在0-1之间最为灵敏,为了提高训练的效率,所以要把数据进行归一化处理。归一化处理方法为:找出每个指标数据中的最大和最小值,利用(x-min)/(max-min)公式把所有数据归一化为0到1之间的数。
(二)网络设计
本文利用MATLABR2008进行编程构建。确定网络的输入模式为:
Pk=(P1k,P2k,…pkn),k=1,2,…17,n=19
即一共有17组城市样本向量,每个样本中包括19个元素。
1、首先利用函数newsom创建一个SOM网络。根据实际情况本文创建网络的竞争层分别选用3、4、5、6层的结构。然后经过实验,分别观察其性能,从而选取分类效果最好的一组。
2、利用函数train和仿真函数sim对网络进行训练并仿真。仿真的步数大小同样影响网络的聚类性能,这里我们设置步数为1000。
最后经过分类结果如表1所示。
(三)实验结果分析
最后经过分析筛选,发现当这17个城市被划分为6类时和现实情况较为符合。分类情况如表2所示。
第一类:从表中看出,济南和青岛被归为了一类,并且在分类数为3、4、5、6时,济南和青岛都被列为了一类。从表中我们可以看到济南、青岛在各方面都优于其他城市,尤其是制造业、教育、以及公共管理和社会组织方面。济南是山东省省会,是全省、文化、经济,金融,教育中心,也是国家批准的沿海开放城市和十五个副省级城市之一。青岛是全国70个大中城市之一,全国五个计划单列市之一。工业有纺织、机车车辆、机械、化学、石油化工、钢铁、橡胶、家用电器、啤酒、卷烟等。有驰名中外的青岛啤酒、海尔集团、海信集团等大企业集团。并且,二者都有丰富的教育资源,全省大多高校均聚集在此。
第二类:淄博、泰安、德州、聊城在发展方面,各个方面较为均衡,没有特别显著的特点。四者的制造业、建筑业和教育大约位于全省中间地位。
第三类:枣庄、东营属特殊职能类型城市。两个城市相对其他城市来说,采矿业较为发达。枣庄境内已探明地下矿藏36种:煤、铁、铜、铝、金、银、锶(天青石)、石膏、萤石、水泥原料灰岩等。其中煤、石膏地质储量为15.4亿吨和4.1亿吨。而东营又称“石油之城”,丰富的石油、天然气资源。但是,两个城市的制造业相对薄弱,其他产业大约处于平均水平。
第四类:烟台在此被单独分成了一类,其具有自身的特色,并且发展潜力巨大。烟台的制造业和交通运输业位于全省前列。烟台的工业主要以造船、轻纺、机械、建材、电子、冶金、医药等行业为主,并且还有张裕葡萄酒、三环锁等烟台的传统产品。近年来,锦纶、白卡纸、电子网目板等技术水平较高的项目相继投产。烟台在地理位置上东连,西接潍坊,西南与毗邻,北濒、,与对峙,并与隔海相望,共同形成拱卫首都的海上门户。所以,烟台的交通运输业较为发达。另外,烟台的招远金矿为烟台采矿业也提供了大量了就业机会。
第五类:潍坊、临沂、济宁和菏泽在教育和公共管理和社会组织方面处于全省前列地位,其他方面稍稍逊色一些。
第六类:威海、日照、莱芜、滨州这四个城市各个方面表现均不太突出,但是,这些城市的发展潜力很大。威海、日照属沿海城市,交通便利,可以重点发展交通运输业。莱芜、滨州虽地处内陆,但也可依附内陆的经济中心——济南来发挥特色经济。