首页 > 文章中心 > 人工神经网络基本功能

人工神经网络基本功能

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇人工神经网络基本功能范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

人工神经网络基本功能范文第1篇

关键词:神经网络 BP网络

中图分类号:TP3 文献标识码:A 文章编号:1672-3791(2014)01(c)-0240-02

神经网络是一门发展十分迅速的交叉学科,它是由大量的处理单元组成非线性的大规模自适应动力系统。神经网络具有分布式存储、并行处理、高容错能力以及良好的自学习、自适应、联想等特点。该模型对于拟合现实复杂世界有着重要的实用价值。

1 神经网络简介

人工神经网络(Artificial Neural Network,ANN),亦称神经网络(Neural Network,NN),是一种应用类似于大脑神经突触连接结构进行信息处理的数学模型,它是在人类对自身大脑组织结合和思维机制的认识理解基础之上模拟出来的,它是根植于神经科学、数学、统计学、物理学、计算机科学以及工程科学的一门技术。心理学家Mcculloch,数学家Pitts在20世纪40年代第一次提出了神经网络模型,从此开创了神经科学理论的研究时代,此后半个世纪神经网络技术蓬勃发展。神经网络是一种计算模型,由大量的神经元个体节点和其间相互连接的加权值共同组成,每个节点都代表一种运算,称为激励函数(activation function)。每两个相互连接的节点间都代表一个通过该连接信号加权值,称值为权重(weight),神经网络就是通过这种方式来模拟人类的记忆,网络的输出则取决于网络的结构、网络的连接方式、权重和激励函数。而网络本身通常是对自然界或者人类社会某种算法或函数的逼近,也可能是一种逻辑策略的表达。神经网络的构筑理念是受到生物的神经网络运作启发而产生的。人工神经网络则是把对生物神经网络的认识与数学统计模型向结合,借助数学统计工具来实现。另一方面在人工智能学的人工感知领域,我们通过数学统计学的方法,使神经网络能够具备类似于人的决定能力和简单的判断能力,这种方法是对传统逻辑学演算的进一步延伸。

2 神经网络模型及训练

2.1 生物神经元模型

人脑是自然界所造就的高级动物,人的思维是由人脑来完成的,而思维则是人类智能的集中体现。人脑的皮层中包含100亿个神经元、60万亿个神经突触,以及他们的连接体。神经系统的基本结构和功能单位就是神经细胞,即神经元,它主要由细胞体、树突、轴突和突触组成。人类的神经元具备以下几个基本功能特性:时空整合功能;神经元的动态极化性;兴奋与抑制状态;结构的可塑性;脉冲与电位信号的转换;突触延期和不延期;学习、遗忘和疲劳;神经网络是由大量的神经元单元相互连接而构成的网络系统。

2.2 人工神经网络模型

人工神经网络,使通过模仿生物神经网络的行为特征,进行分布式并行信息处理的数学模型。这种网络依靠系统的复杂度,通过调整内部大量节点之间相互连接的关系,从而达到信息处理的目的。人工神经网络具有自学习和自适应的能力,可以通过预先提供的一批相互对应的输入输出数据,分析两者的内在关系和规律,最终通过这些规律形成一个复杂的非线性系统函数,这种学习分析过程被称作“训练”。神经元的每一个输入连接都有突触连接强度,用一个连接权值来表示,即将产生的信号通过连接强度放大,每一个输入量都对应有一个相关联的权重。处理单元将经过权重的输入量化,然后相加求得加权值之和,计算出输出量,这个输出量是权重和的函数,一般称此函数为传递函数。

2.3 神经网络的训练

当神经网络的结构确定以后,接下来的工作就是训练和学习。神经网络不是通过改变处理单元的本身来完成训练和学习过程的,而是依靠改变网络中各神经元节点的连接权重来完成的。因此若处理单元要学会正确的处理所给定的问题,唯一用以改变处理单元性能的元素就是连接权重。

2.4 神经网络的分类

神经网络按照不同的结构、功能,以及学习算法,对网络进行分类,可以分为:(1)感知器神经网络:最简单的神经网络类型,只有单层的神经网络结构,采用硬限值作为网络传递函数,主要适用于简单的线性二类划分问题,在此类问题中处理的效率较高。但不适合本论文的课题。(2)线性神经网络:单层结构的神经网络,采用线性函数作为网络的传递,主要也是用于解决线性逼近问题。

3 BP神经网络

目前应用最为广泛的网络,具有多层网络结构,可以由一个或者多个隐含层。BP网络采用Widrow―Hoff学习算法和非线性传递函数,典型的BP网络采用的是梯度下降算法,也就是Widrow―Hoff算法所规定的。BP,即Back Propagation,就是指为非线性多层网络训练中梯度计算是采用信号正向传播、误差反向传播的方式。通过采用非线性传递函数,BP网络能够以仁义的精度逼近任何非线性函数,由于采用隐含中间层的结构,BP网络能够提取出更高阶的统计性质,尤其是当输入规模庞大时,网络能够提取高阶统计性质的能力就显得非常重要了,结合本文的课题,将采用BP神经网络及其改进算法进行组合集成实验,用以解决财务预警的实际问题,在后面的章节会采用相关实验证明组合集成的BP神经网络的优势。

4 径向基神经网络

径向基神经网络又称为RBF网络,它与BP网络同为多层前向网络,也能够以任意的精度逼近任何非线性函数,只是它与BP网络采用的传递函数不同,BP通常采用的是Sigmoid函数或线性函数作为传递函数,而RBF网络则采用径向基函数作为传递函数。本文后面将采用径向基函网络与BP网络进行对比。

5 竞争神经网络

竞争神经网络的特点是它的各个神经元之间是相互竞争的关系,众多神经元之间相互竞争以决定胜出者,或胜神经元决定哪一种原模型最能代表输入模式。

6 反馈神经网络

BP神经网络(Fredric M.Ham Ivica Kostanic Principles of Neurocomputing for Science―Engineering 2007)BP神经网络具有sigmoid隐含层以及线性输出层,具有很强的映射能力,本节我们对BP网络神经元和网络结构进行介绍。神经网络方法的具体步骤是:向网络提供训练例子,即学习样本,包括输入和期望的输出。确定网络的实际输出和期望输出之间允许的误差。改变网络中所有连接权值,使网络产生的输出更接近于期望输出,直到满足确定的允许误差。下图给出了一个具有N个输入的基本的BP神经元模型结构。途中每一个输入都被赋予一定的权值,与偏差求和和后形成神经元传递函数的输入。

我们来看看三层BP神经网络模型的数学表达,首先我们来确定途中各个参数所代表的涵义:

(1)输入向量:X=(x1,x2,…,xi,…,xn)T;

(2)隐层输出向量:Y=(y1,y2,…,yj,…,ym)T;

(3)输出层输出向量:O=(O1,O2,…,Ok,…,Ol)T;

(4)期望输出向量:d=(d1,d2,…,dk,…,dl)T;

(5)输入层到隐层之间的权值矩阵:V=(V1,V2,…,Vj,…,Vm);

(6)隐层到输出层之间的权值矩阵:W=(W1,W2,…,Wk,…,Wl)。

BP神经网络就是通过构建上述变量来完成网络的描述。

我们从上至下,从输出层开始看BP网络的工作原理,对于输出层:

k=1,2,…,l (1)

k=1,2,…,l (2)

对于隐层:j=1,2,…,m (3)

j=1,2,…,m (4)

其中的是传递函数我们可以采用单极性Sigmoid函数: (5)

(1)网络误差与权值调整

输出误差E定义:

(6)

(7)

在这一步的基础上,进一步展开至输入层:

(8)

j=0,1,2,…,m;k=1,2,…,l (9)

i=0,1,2,…,n;j=1,2,…,m (10)

式中负号表示梯度下降,常数η∈(0,1)表示比例系数。在全部推导过程中,对输出层有j=0,1,2,…,m;k=1,2,…,l,对隐层有i=0,1,2,…,n;j=1,2,…,m

(2)BP算法推导

对于输出层,式(9)可写为:

(8)对隐层,式(9)可写为:(10),对于隐层,利用式(7):

可得: (11)

将以上结果代入式(8),并应用式(5):,得到:

(12)

(13)

至此两个误差信号的推导已完成。将式(12)代回到式(8),得到三层前馈网的BP学习算法权值调整计算公式为:

(14)

人工神经网络基本功能范文第2篇

关键词:心理学;效度;一般能力倾向成套测验(GATB);人工神经网络(ANN)模型;大学生

一、问题提出

一般能力倾向成套测验(General Aptitude Test Battery,GATB)是美国劳工部就业保险局历时50年,耗资数亿美元,研究了美国上万种职业后编制而成的著名测验。这套测验应用较广,已被大量研究证明具有良好的信效度,能够很好地预测职业成功和学术成就。GATB是适用于初三以上年级的中学生及成年人的团体测验,包含15种分测验(11种纸笔测验,4种操作测验),可在120~130分钟内测量9种与职业关系密切并有代表性的能力因素。这9种能力倾向因素为:一般智力、言语能力、数理能力、空间关系理解力、形状知觉能力、文书知觉能力、动作协调能力、手指灵活性及手部灵巧性。Hammond1984年对GATB的结构进行因素分析发现,GATB测量的其实是4种更普遍、更高层次的能力:言语能力、数理能力、工具组合能力和空间能力[1]。GATB在国外应用广泛,是升学、就业指导以及人员选择与安置的重要工具。而Droege等研究发现:GATB的一般智力、言语能力、数理能力和书写知觉测验可以作为预测学业成绩的良好工具[2]。R.L.Thorndike和E.P.Hagen报告,用GATB预测工程学校学生的专业成绩的R2最低0.46,最高0.58[3]。

个体在大学期间的专业学习将奠定他们一生职业生涯的基础。在美国,大学生入学之初,要进行一项学术能力测验(SAT),通过这种学术能力测验,可以预测大学生在大学期间的专业学习成绩。也有研究者应用一般能力倾向成套测验(GATB)来预测大学生的专业成绩。在预测方法方面,以前的研究大都是运用传统的多元回归算法。如果应用神经网络模型新技术,效度是否会有提高呢?这值得我们来探索一番。

人工神经网络(Artificial Neural Network, ANN)是近年来发展起来的一门新兴学科、新技术。它应用了一种信息处理系统或计算机模仿大脑的结构和功能,可称之为人脑处理信息方式的简化模型[4]。ANN今天已经成为世界关注的热点,引起各国政府与军界的高度重视。

目前人工神经网络(ANN)的算法基本成熟。人工神经网络包括三部分:输入层(input layer),隐藏层(hidden layer),输出层(output layer)。输入的数据显示在第一层,其值从每个神经元传播到下一层的每个神经元,最终从输出层输出结果。ANN是功能强大的函数估计器,只需基本的统计或数学知识就能够进行训练,并加以应用[4]。特别值得注意的是,它是一种非线性系统,具有一个隐藏层的神经网络算法,可以拟合输入和输出之间的任意非线性关系,而不要求资料满足正态分布或其他特殊分布,可以自由估计模型(即非参数模型)。因此,神经网络具有很强的综合能力,输入和输出间的联系可由训练习得,再运用于计算中[5]。

BP(back propagation)神经网络是ANN的一种,由James McClelland和David Rumelhart在1986年提出[6]。它是一种典型的前馈神经网络,其权重的调整采用反向传播的学习算法,神经元的变换函数是S型函数,输出量是0~1之间的连续量,可以实现从输入到输出的任意非线性映射[7]。通过对网络参数的选取,在确定了网络层数、隐含层神经元数、初始权重、学习速率、期望误差及最大步长后,构建神经网络模型。确定网络的结构后,利用输入输出样本进行训练,也就是对网络进行调整,多次反复,直到样本收敛,使网络实现给定的输入输出映射关系,从而获知最重要的影响因素。

从ANN诞生之日起,它与心理学就有着千丝万缕的联系。神经网络的灵感来自于神经元的信息处理功能,神经网络的训练则可以反映感觉、记忆、学习等认知过程[8]。ANN已被研究者广泛应用于视知觉识别[9]、技能培养[10]、语言发展[11]等认知领域。研究者发现,ANN对于内隐记忆、内隐学习等无意识认知过程有着极强的适应性[12,13],对神经网络来说,外界环境的每一次输入都可能会引起网络结构的重新调整(权重变化),从而改变该网络下一次的加工模式。

社会认知与ANN有着类似的信息加工过程。社会认知过程中,人们会按照某种规则对所经验的事件进行组织,从而影响他们在类似环境下对待相似对象的印象与态度。因此,许多研究者针对印象形成[14]、归因[15]、认知矛盾[16]、群体印象[17]等建立了各具特色的神经网络模型。

由于ANN的模仿对象是人脑神经系统的处理方式,因此,它在功能上也具有某些智能的特点。神经网络主要有以下几个基本功能:非线性映射、分类识别、知识处理。目前,神经网络已经广泛应用于信息领域、自动化领域、工程领域、医学领域、经济学领域等各知识领域中,其智能化的特征解决了许多传统信息处理方法无法解决的问题[18]。目前,学术界已经普遍认同,人工神经网络方法是一种有效的研究工具,能够代替传统的回归分析方法,并可以在不同的领域进行广泛应用。然而,心理测量学领域内运用人工神经网络方法的研究还相当少见。

本研究将使用神经网络算法,取代传统的回归分析,尝试检验一般能力倾向成套测验预测不同学科大学生的专业成绩的效度。

二、研究方法与研究过程

1.研究工具

以戴忠恒等修订的一般能力倾向成套测验(GATB)为研究工具,该测验共包括15种分测验,其中11种为笔试,分别为: 圆内打点测验、记号记入测验、形状相配测验、名称比较测验、图案相配测验、平面图判断测验、计算测验、词义测验、立体图判断测验、句子完成测验、算术应用测验;4种为器具测验:插入测验、转动测验、组装测验、拆卸测验。

本研究采用团体施测方式,每次施测有2名以上熟悉本测验所有项目的主试,最多对38名被试同时施测。首先由主试朗读指导语,在所有被试明白测验的要求和具体做法后开始测验。因11项纸笔分测验均为速度测验,所以由主试使用秒表准确计时。

2.研究对象

在江苏、安徽、上海等省市的7所院校对在校大学生进行团体施测。共施测1022人。其中男生521人(51.0%),女生501人(49.0%);“211工程”院校569人(55.7%),普通本科院校453人(44.3%);大一464人(45.4%),大二104人(10.2%),大三321人(31.4%),大四133人(13.0%);文科446人(43.7%),理科221人(21.6%),工科355人(34.7%)。

3.数据收集

随机选取其中652名大学生,对他们期末考试中的专业课成绩求出平均分并以班级为单位进行标准化,以此标准分作为衡量其专业成绩的标准。在652名大学生中,文科专业268人,占41.1%;理科专业218人,占33.4%;工科专业166人,占25.5%;年龄17~24岁,平均20±1岁;男生320人,占46.3%,女生371人,占53.7%。

三、构建神经网络模型

使用专业软件Clementine12.0构建神经网络模型。首先对样本数据进行归一化处理,以便更好地对数据关系进行映射,从而使其参数都落在(0,1)之间。归一化选用以下公式:

P=(p-pmin)/(pmax-pmin)

公式中,pmin,pmax分别表示归一化之前的最小值和最大值,P为归一化值,p为归一化之前的值。经过归一化转换的结果在本研究中以P表示,例如P专业课均分。

经过归一化处理后,开始正式建模。在Clementine中应用神经网络进行能力倾向对专业成绩预测的过程如下:首先选择数据源,将GATB的7项能力倾向数据选为输入变量,将标记专业课均分项选为输出变量。然后在字段选项中选择其中的分区节点,设置训练、测试、验证区域样本比例,这是构建神经网络模型所需要的一个设置。总体挖掘过程如图1 所示。

图1 数据挖掘过程

接着在模型里选择神经网络模型的训练方法。Clementine提供了快速、动态、多重、修剪、RBFN和穷举型修剪六种用于构建神经网络模型的训练方法(Silverston,数据模型资源手册)。选择快速的训练方法,即使用数据的简明规则和特征来选择适合的网络形状(拓扑)。

此后在模型中设置预防过度训练,将数据随机分割为训练集合和检验集合两部分,设置70%的样本为训练集合,并将随机种子设置为18。特定的随机种子通常会生成相同的随机值序列,产生相同的生成模型,从而使结果模型具有精确的可再现性。本研究中的预防过度训练与随机种子设置见图2。

图2 模型设置结果

四、结果分析

1.文科大学生一般能力倾向对专业成绩的预测模型

本模型显示出模型在生成前的选项和生成后的统计情况。结果显示模型对建模数据估计的准确率达90.247%,其中输入层有7个神经元,隐藏层有1∶3个神经元,输出层有1个神经元。

对各输入点的敏感度进行分析显示,各输入字段的相对重要性参数,按重要性排序为言语能力、一般智力、形状知觉、运动协调、数理能力、书写知觉、空间判断能力,其敏感性系数依次为0.523、0.191、0.09、0.053、0.05、0.047、0.045。

将Neural Net结果结点连接在数据流中的分区结点后,向数据流中增加分析节点,模型分析结果见图3,由图可知,文科学生一般能力倾向对专业成绩模型的平均预测误差在-0.004到0.036之间,绝对平均误差在0.103到0.105之间,该模型的预测误差在可以接受的范围之内。

图3 文科大学生一般能力倾向对专业成绩的预测模型分析结果

再向数据流中增加导出结点。将导出结点连接到Neural Net结果结点。设置该结点属性,将增添的字段的值设置为【abs(P专业课均分 - '$N- P专业课均分') / P专业课均分】 * 100,其中$N- P专业课均分是由神经网络生成的预测结果,如图4所示。该图形的横坐标为导出值,纵坐标表示一共有多少个样本的导出值落在相对应的横坐标上。由导出的定义公式可知,导出值越小,则表明预测值与实际值的差别越小。由输出图形可以看出,该模型已达到一定的精度。

图4 文科大学生一般能力倾向对专业成绩的预测模型精度直方图

2.理科大学生能力倾向对专业成绩的预测模型

理科大学生一般能力倾向对专业成绩预测模型显示模型对建模数据估计的准确率达90.979%,输入层、隐藏层、输出层的神经元个数与文科大学生模型的数量相同,分别为7个、1∶3个、1个。

理科大学生一般能力倾向对专业成绩预测的各输入点的敏感度分析显示:按重要性排序为数理能力、一般智力、空间判断能力、书写知觉、言语能力、形状知觉、运动协调,其敏感性系数依次为0.471、0.233、0.132、0.073、0.046、0.042、0.003。

图5 理科大学生一般能力倾向对专业成绩的预测模型分析结果

模型分析结果见图5,由图可知,理科学生一般能力倾向对专业成绩模型的平均预测误差在-0.022到0.006之间,绝对平均误差在0.091到0.097之间,结合图6可知,模型达到了一定的精度。

图6 理科大学生一般能力倾向对专业成绩的预测模型精度直方图

3.工科大学生能力倾向对专业成绩的预测模型

工科大学生一般能力倾向对专业成绩的预测模型显示模型对建模数据估计的准确率达90.381%,输入层、隐藏层、输出层的神经元个数与之前相同,分别为7个、1∶3个、1个。

工科大学生一般能力倾向对专业成绩预测的各输入点的敏感度分析结果显示:按重要性排序为空间判断能力、一般智力、言语能力、书写知觉、形状知觉、数理能力、运动协调,其敏感性系数依次为0.594、0.202、0.084、0.048、0.035、0.029、0.008。

模型分析结果(见图7)显示,工科学生一般能力倾向对专业成绩模型的平均预测误差在-0.044到0.008之间,绝对平均误差在0.106到0.115之间。模型精度直方图(见图8)显示,由图可知,导出值集中在一个很小的范围之内,模型达到了一定的精度。

图8 工科大学生一般能力倾向对专业成绩的预测模型精度直方图

五、讨论

神经网络具有的非线性映射、自适应学习、并行性、知识分布存储、逼近任意复杂连续函数等信息处理能力,克服了传统预测方法对于数据处理方面的缺陷,使神经网络能够在心理测量领域发挥重要作用。值得注意的是,回归分析要求数据正态分布、线性,以及连续变量这些比较严苛的条件,在神经网络模型中却不需要这些前提条件。也就是说,神经网络的算法具有非线性的特点。这可以大大弥补传统统计方法的线性模型的局限。

本研究以人工神经网络建模为统计手段,分别建立文、理、工三类大学生一般能力倾向对其专业成绩的预测模型,由建网信息和模型分析结果可知,三个模型对建模数据估计的准确率均达到90%以上,预测的平均预测误差在0.091到0.115之间,三个模型均达到了一定的精度。

首先, GATB的7项能力倾向对文科专业成绩的影响按重要性排序依次为言语能力、一般智力、形状知觉、运动协调、数理能力、书写知觉、空间判断能力,这一结果也可与文科专业大学生优势能力倾向互为佐证。言语能力的敏感性系数达到0.523,是影响文科专业成绩表现的关键能力,这一结果也符合我们研究前的假设和实际情况。文科类专业的学生通常对文字、语言更有兴趣,拥有较好的文字功底,将来所从事的职业多以文字工作为主,专业课程的设置与考核也是以此职业方向为导向,因而言语能力上得分突出的学生更有可能在文科专业的课程学习中达到优秀水平。

其次,对理科大学生而言,数理能力、一般智力和空间判断能力对其专业成绩预测的敏感性系数分别为0.471、0.233和0.132。数理能力是利用算术知识解决实际问题的能力,一般智力则是需要根据原理进行推理和判断的能力,而空间判断能力是要求在心理空间进行图形转换进而进行推理、判断的能力,这三类能力对学生的逻辑思维能力有较高要求,理科类专业侧重于理论研究和科学培养,尤需学生的理性思维、逻辑思维能力,因此,数理能力、一般智力和空间判断能力是理科学习关键之所在,理科专业要求报考者在这些能力上的发展达到一定的水平,而在这些能力倾向上得分较低的被试可能需要付出相当的努力才能够胜任理科专业的学习。

最后,工科类专业学生的专业成绩7项能力倾向按重要性排序依次为:空间判断能力、一般智力、言语能力、书写知觉、形状知觉、数理能力、运动协调。另外,空间判断能力也是工科类大学生的优势能力倾向,以往相关研究也表明,空间想象和空间思维能力对于工科学习是不可或缺的[19],尤其是机械制图等相关专业。工科专业侧重技术应用,学生动手能力较强,心理空间的运动能力依赖于实际动手能力的发展,动手能力的锻炼也会促进其空间想象能力的发展。值得注意的是,空间判断能力对于工科学生专业成绩的预测敏感性系数达到了0.594的水平――该项能力对工科学习十分重要,若发展良好,更可能在工科学习中脱颖而出。

纵观三类专业大学生一般能力倾向对其专业成绩的预测情况,不难发现,一般智力对于任何一类专业来说都是基础性的能力倾向。国外相关研究结果也发现,人们的智力和知识只要达到一定的水平,人们智力的高低差异对于工作效率不再有明显的影响,然而与专业紧密相关的能力倾向与工作效率之间始终有显著的正相关。本研究的结论在一定程度上验证了这一观点:对于不同的专业方向来说,每种专业类型都各有其关键的能力倾向。该专业的潜在报考者能否胜任该专业的学习和考核,关键能力倾向是至关重要之因素。

总而言之,人工神经网络模型对三类专业的专业成绩预测都具有较高的准确性,说明本研究整体的技术路线可行,GATB所测得的7项能力倾向的不同组合可以用来预测不同专业学生的专业成绩。通过人工神经网络模型,中学生可以根据自己在GATB的7项能力倾向上的得分情况预测自己报考三类专业的成绩水平,从而判断自己适合报考的专业方向。如能早日实现推广,将是教育界及广大学子喜闻乐见之事。

项目基金:全国教育规划课题(DIA080131)

[1] Hammod, M.. An investigation into the factor structure of the General Aptitude Test Battery[J]. Journal of Occupational Psychology,1984,57(1):4348.

[2] Droege, R. C.. GATB aptitude intercorrelations of ninth and twelfth garders: A study in organization of mental abilities[J]. Personnel & Guidance Journal, 1968,46(7):668672.

[3] 桑代克, R.L.,哈根, E.P.. 心理与教育的测量与评价[M]. 叶佩华,等,译. 北京:人民教育出版社,1985.

[4] 林耀斌,杜友福.基于Clementine神经网络的商品促销效果预测模型应用[J].电脑知识与技术,2009,5(34):90-92.

[5] 张菊英,韦健,杨树勤.神经网络模型在住院费用影响因素分析中的应用[J].中华医院管理杂志,2002,18(3):143-145.

[6] 严武.基于BP算法的住院天数神经网络模型建模研究[J].中国病案, 2009,10(11): 38-40.

[7] 易东,王文昌.回归分析的人工神经网络算法模型研究[J].中国卫生统计,1998,15(5).

[8] 郭秀艳,朱磊,魏知超.内隐学习的人工神经网络模型[J].心理科学进展,2006,14(6):837-843.

[9] Martin, G. L.. Encoder: A connectionist models of how learning to visually encode fixated text images reading fluency[J]. Psychological Review, 2004,111(3):617639.

[10] Berthier, N.E., Rosenstein, M. T., & Barto, A.G..Approximate optimal control as a model for motor learning[J]. Psychological Review, 2005,69(2):329346.

[11] Seidenberg, M. S..Connectionist models of word reading[J]. Current Directions in Psychological Science, 2005,14(5):12381242.

[12] 郭秀艳,邹玉梅,李强,孙怡.中学生颜色内隐学习特征的实验研究[J].心理与行为研究, 2003,1(2):122-127.

[13] 郭秀艳,朱磊.神经网络模型对内隐学习的探索[J].心理科学,2006,29(2):410-415.

[14] Kashima,Y., Kerekes, & Andrew. R.Z.. A distributed memory model of averaging phenomena in person impression formation[J]. Journal of Experimental Social Psychology, 1994,30(5):407-455.

[15] Read, S. J., & Montoya, J. A.. An auto associative model of causal reasoning and causal learning: Reply to Van Overwalle’s critique of Read and Marcus-Newhall[J]. Journal of Personality and Social Psychology,1996, 76(5):728742.

[16] Shultz, T., & Lepper,M.. Cognitive dissonance reduction as constraint satisfaction[J]. Psychological Review,1996, 103(2): 219240.

[17] Gureckis, T.M., Love, B.C.. Common mechanisms in infant andcategory learning[J]. Infancy, 2004,5(2):173198.

人工神经网络基本功能范文第3篇

关键词:认知雷达;发展前景

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2014)20-4720-02

Introduction to Cognitive Radar

ZHANG Qi-wen, LIU Zhong-yi

(Radar Department of Navy Submarine Academy, Qingdao 266042,China)

Abstract: Cognitive radar is a new concept of radar, in this paper the development of cognitive radar, definitions, and the development direction of the future are expounded.

Key words: Cognitive radar; development trend

大脑视觉是一个强大的并行化信息处理机,具有完成某些任务如高可靠的目标检测和高精度的目标跟踪、其运行速度远超任何传统雷达系统的内在能力。尽管大脑视觉和传统雷达之间存在许多不同之处,但他们共享同一特征:他们都是外部世界(环境)的观察者,雷达是一个通过发射探测信号给环境的主动感知器,然后基于雷达回波进行决策处理得到环境场景[1]。作为一个主动感知器,雷达用于认知雷达回波,并据此发射相应的雷达探测信号。关键问题是:我们如何学脑视觉来显著地增强传统雷达的信息处理能力这个基本问题的答案在于认知,因此认知雷达(CR)的创新理念源于蝙蝠回波定位系统。注意力集中在大脑视觉己有大量地神经科学方面的视觉系统的文献[2]。

1 发展历程

从传统雷达到认知雷达(CR),最初的进化过程的描述是Kershaw和Evans[4]。在这篇论文中, 增加了从接收机到发射机的链接,虽然是离线方式,则系统转变为一个闭环雷达反馈系统,此后这种雷达看成一类提前主动雷达(FAR)[3]。

由此雷达可以分为三类:

传统主动雷达(TAR), 工作在前馈方式;TAR包括接收机中使用自适应滤波器(卡尔曼滤波器) 进行迭代状态估计,及与发射波形匹配的接收处理。

提前―主动雷达(FAR), 区别在于使用了连接接收机到发射机的反馈链路, 在雷达文献中, 这种雷达定义为完全自适应, 它的全局反馈, 包括环境在内的反馈环路, FAR包括接收机中使用自适应滤波器和发射机中自适应波束形成。在控制理论方面, 反馈便于智能化;因此也可以认为完全自适应雷达是一个受限的智能系统, 它是向认知雷达迈出的切实可行的第一步。

认知雷达(CR),它既不同于TAR, 也不同于FAR。主要表现在它能从与环境反复作用所获取的经验中进行自组织的学习能力,该能力必将发挥重要的作用。

有表1可以看出,大型脑网络的认知,人类认知传统观点,人脑看成模块化范式,被认定为执行各个专门功能的独立处理器。然而,认知神经科学发现了大脑区域的功能是相互作用的,它以一种大型网络的方式工作在一起。大脑皮层在认知的信息处理中发挥关键的作用, 皮层微柱是皮层的基本功能单元, 感知的任务是在整个皮层区域完成的。Fuster 提出了大脑皮层中用于知识表示的“认知”的概念,此外, 进一步提出了认知的抽象模型,即感知、记忆、注意力、智力和语言。后来,Sporns 等考虑到涉及多个学科的脑网络的复杂性, 扩展了脑区的功能的新范式。这里涉及的学科从生物到物理、社会学到信息学[6]。基于此,强调了如何研究复杂网络的结构和动力学才会有助于理解大脑和认知功能, 并尝试确定未来的信息处理领域实验与理论探讨。

控制论是研究调节系统的基础结构,主要是信息、控制和系统方面的理论,适用于闭环反馈调节系统,其因果循环关系是控制论的基本特征。1948年,维纳对控制论进行了描述,主要研究动物(人)和机器方面的控制和通信。McCulloch发展了控制论,1953年,提出了人工神经网络。Walter实现了初期的自适应机器人,能简单地模仿动物和人的大部分基本行为。

人工神经网络,长期与外部世界相互作用中进行学习的能力是大脑的一个鲜明特征。为了建立模仿人的学习模型,一种常用的方法是训练一个人工神经网络,它是由一组称之为神经元的计算单元组成。对于给定的神经网络,利用监督学习或无监督学习,算法上模仿其学习过程。

受大脑视觉启发,我们提出了一种新的将认知可控的传感引入雷达系统的途径。认知雷达的构建是基于感知―执行周期,它是认知的初始阶段。感知部分基于贝叶斯滤波器和寻求贝叶斯最优性;执行部分基于贝尔曼动态规划下的最佳控制器。将记忆和注意力加入到感知―执行周期中,雷达能够达到的性能水平可以理解为真正意义上体现了智能行为。

2 认知雷达的定义

具有感知周围环境能力的智能、动态闭环系统。其通过先验知识以及对环境的交互学习来感知环境,在此基础上,实时的调整发射机和接收机适应环境的变化,以有效地、可靠地、稳健地达到预定的目标。其主要包括三个基本要素:

1) 智能信息处理。它的主要任务是通过与环境的不断交互,获得并提高雷达对环境的认知;

2) 接收机到发射机的信息反馈。接收机截获雷达信号,经智能信息处理得到目标信息,然后将其反馈给发射机,使得发射机能够自适应调整发射信号,以期望提高整机性能;

3) 雷达回波数据的存储。通过更多雷达回波的积累效果,以提高雷达认知环境的精确程度。

3 认知雷达的未来发展方向

尽管对认知雷达的研究取得了一定的进展但至今还没有认知雷达的问世,编者认为网络化是未来雷达发展的重要方向。多部雷达互相合作可实现远程感知能力。认知雷达网络、可采用分布式(每部雷达都有认知功能)或集中式(设有中心基站,只有该中心基站具有认知功能),将认知雷达和传统雷达组网概念结合,即可充分利用传统雷达组成网络的节点,提高雷达系统的综合能力的同时降低了成本,而网络节点上的单部雷达可以是传统雷达,也可以是具有接收系统的被动雷达[5]。

参考文献:

[1] B. R. Frieden, Science From Fisher Information: A Unification. Cambridge, U.K.: Cambridge Univ. Press, 2004.

[2] S. Haykin, Cognitive radar: A way of the future, IEEE Signal Process. Mag., vol. 23, no. 1, pp. 30-40, Jan. 2006.

[3] S. Haykin, New generation of radar systems enabled with cognition, presented at the IEEE Radar Conf., Arlington, VA, May 2010, Keynote Lecture.

人工神经网络基本功能范文第4篇

关键词 人工神经网络 供暖热网预测 外时延 内时延 反馈型BP网络 Elman网络

一些复杂的生产过程,如热网供热,由于其反应机理非常复杂,具有很强的非线性、大滞后、时变性和不确定性,难以建立被控对象的数学模型,至今仍很少实现闭环控制,只好有经验的操作人员进行调节。操作人员虽然没有被控对象的数学模型,但是由于他们比较熟悉供暖热网和设备,且在长期的现场工作中积累了丰富的操作经验,他们通过观察仪表指示的变化,如热网的从、回水温度、室外温度等参数,并且预估某些参数将要发生的变化,然后调整供热负荷,以保证热网供暖正常。这种人工控制方式一般也能达到较好的控制效果,但是由于操作人员的经验与能力的不同,或由于人的疲劳、责任心等原因,也时常会因操作不当造成热网供暖不正常,或在产生突发事件时,不能预测将会发展或延续扩大的严重故障,而引发更大的故障。

预测对于提供未来的信息,为当前人人作出有利的决策具有重要意义。现有的预测方法如时间序列分析中的AR模型预测方法,只适用于线性预测,而且,还需要对所研究的时间序列进行平稳性、零均值等假定,其适用范围受到一定的限制。近年来,人工神经网络以其高度的非线性映射能力,在某些领域的预测中得到广泛的关注。本文利用神经网络技术辨识供暖热网动态预报系统的模型,并对其进行了实际训练和测试,分别建立了外时延反馈型BP网络模型和内时延反馈型Elman网络的预测模型。

1 外时延反馈BP网络

多层前向网络是研究和应用的最广泛也是最成功的人工神经元网络之一。多层前向网络是一种映射型网络。理论上,隐层采用Sigmoid激活函数的三层前向网络能以任意精度逼近任一非线函数,神经元网络可以根据与环境的相互作用对自身进行调节即学习,一个BP网络即是一个多层前向网络加上误差反向传播学习算法,因此一个BP网络应有三项基本功能:(1)信息由输入单元传到隐单元,最后传到输出单元的信息正向传播;(2)实际输出与期望输出之间的误差由输出单元传到隐单元,最后传到输入单元的误差反向传播;(3)利用正向传播的信息和反向传播的误差对网络权系数进行修正的学习过程。目前,多层前向网络的权系数学习算法大多采用BP算法及基于BP算法的改进算法,如带动量项的BP算法等。BP网络虽然有很广泛的应用,但由于它是一个静态网络,所以只能用于处理与时间无关的对象,如文字识别、空间曲线的逼近等问题。热网供暖的各项参数都是与时间有关系的,而且我们即将建立的供暖热网预报模型必须是一个动态模型。为此,必须在网络中引入记忆和反馈功能。可以有两种方式实现这一功能,一是采用外时延反馈网络,即反输入量以前的状态存在延时单元中,且在输入端引入输出量以前状态的反馈,如图1所示;另一种方式是采用内时延反馈网络,既在网络内部引入反馈,使网络本身构成一个动态系统,如下面将要介绍的Elman网络。

图1 处延时反馈网络

2 Elman网络

如前所述,在BP网络外部加入延时单元,把时间信号展开成空间表示后再送给静态的前向网络作为一类输入,从而实现时间序列建模和预测。然而,这种方式大大增加了输入节点个数因而导致了网络结构膨胀,训练精度下降,训练时间过长。

Elman动态网络是动态递归网络中较为简单的一种结构,如图2所示。

图2 Elman网络

由输入层、隐含层、结构层(联系单元层)和输出层组成,结构层记忆隐含层过去的状态,并在下一时刻与网络的输入,一同输入隐含层,起到一步延时算子作用。因此,Elman动态递归网络具有动态记忆的功能,无需使用较多的系统状态作为输入,从而减少了输入层单元数。

3 供热网络预报模型

根据研究问题的性质不同,选择不同的网络结构和激活函数,以便建立准确的神经网络预报模型。外时延反馈网络和内时延反馈网络都将其时延单元和反馈单元视为BP网络的输入参数,因此可以应用BP算法训练网络,其隐含层和输出层的节点激活函数可选择tansig、purelin函数,表达式为:

tansig函数:

purelin函数: f2(x)=kx

输出:

其中:xi----热网输入;

wji----由输入层节点i隐层节点j之间的权值;

θj----隐层节点j的阈值;

wkj----由隐层节点j至输出层节点k之间的权值;

θk----输出层层节点k的阈值。

从成因上分析供暖热网的影响因子,运用相关图法或逐步回归分析法等对初选影响因子进行显著性分析和检验,剔除不显著因子。在此基础上,研究基于人工神经网络的供暖热网实时预报模型的建模和预报问题。本文选用牡丹江西海林小区锅炉房2000年11月~2001年4月的部分测量数据进行建模及测试,预测在相应时刻的热网供水温度、回水温度及室外温度值。

3.1 模型I:外进延反馈网络

输入参数为当前时刻与过去时刻的①室外温度(i)(i-1)(i-2)(i-3)(i-4); ②供水流量(i)(i-1)(i-2)(i-3)(i-4);③补水流量(i)(i-1)(i-2)(i-3)(i-4); ④供水温度(i)(i-1)(i-2)(i-3)(i-4);⑤回水温度(i)(i-1)(i-2)(i-3)(i-4);,共二十五个输入量。输出量为未来时刻的①室外温度(i +1)(i+2);②供水温度(i +1)(i+2);③回水温度(i +1)(i+2);共六个输出量。其中每一周期间隔15min。训练样本为前2000个数据组,测试样本为后2000个数据组。输出曲线有训练样本与计算数据比较曲线和测试样本与计算数据比较曲线。

网络结构共三层,输入层节点25个,隐层节点25个,输出层节点6个。取学习率η=0.7,动量因子a=0.3,训练精度ε=4.5e-3,经过1000次正反向传播和学习,网络训练满足设定条件,此时训练计算的均方差为0.00449767。将检验样本输入训练好的网络模型,其检验结果如图3、图4(因篇幅所限仅给出回水温度预报值)所示。

图3 回水温度一步预报曲线

实线:计算数据;虚线:实际数据

图4 回水温度二步预报曲线

实线:计算数据;虚线:实际数据

3.2 模型II:内时延反馈Elman网络。

输入参数为当前时刻的①室外温度(i); ②供水流量(i));③补水流量(i); ④供水温度(i);⑤回水温度(i);,共五个输入量。输出量为未来时刻的①室外温度(i +1)(i+2);②供水温度(i +1)(i+2);③回水温度(i +1)(i+1);共六个输出量。其中每一周期间隔15min。训练样本为前2000个数据组,测试样本为后2000个数据组。输出曲线有训练样本与计算数据比较曲线和测试样本与计算数据比较曲线。

网络结构共三层,输入层节点25个,隐层节点25个,输出层节点6个。取学习率η=0.7,动量因子a=0.3,训练精度ε=4.5e-3,经过1000次正反向传播和学习,网络训练满足设定条件,此时训练计算的均方差为0.0044999。将检验样本输入训练好的Elman网络模型,其检验结果如图5、图6(因篇幅所限仅给出回水温度预报值)所示。

图5 回水温度一步预报曲线

实线:计算数据;虚线:实际数据

图6 回水温度二步预报曲线

实线:计算数据;虚线:实际数据

人工神经网络基本功能范文第5篇

关键词:农村电力系统;继电保护;新技术;应用;分析

Abstract: with the rapid development of electric power industrialization, to push for the power system protection the improvement of new technology, this paper briefly reviews the development course of the electric protection technology, and introduced the relay protection to the development of new technologies, features, including computers, networks, intelligence and protection, control, measurement and data communications integration, and its application in electric power system in rural areas are analyzed.

Key words: the rural power system; The relay protection; New technology; Application; analysis

中图分类号:G812.42文献标识码:A 文章编号:

继电保护技术是随着电力系统的发展而发展起来的。从2O世纪50年代开始到目前为止,继电保护已经历了从电磁式保护装置到晶体管式继电保护装置、到集成电路继电保护装置、再到微机继电保护装置4个发展阶段。近年来,随着计算机技术、通信技术和网络技术为代表的现代信息技术的迅猛发展,继电保护技术得到快速发展。农村电力系统相对于城市电力系统,其继电保护的性能和水平、信息化的发展、运行的安全、稳定和可靠等方面还存在一定的差距。本文对近年来继电保护新技术的发展趋势及其在农村电力系统中应用加以介绍,以对我国农村电力系统的发展提供借鉴。

1 电力系统继电保护的计算机化

电力工业化的不断发展,继电保护装置除了具有继电保护的基本功能外,还应具备有大容量故障信息和数据的长期存放空间功能、数据快速处理功能、强大的通信功能和全系统数据共享功能等。因此,要实现这些功能,继电保护计算机化是继电保护技术发展的必然趋势。

继电保护计算机化是以数字式计算机为基础而构成的继电保护。一整的微机保护装置主要由硬件和软件二部分构成:硬件指模拟和数字电子电路,提供软件运行的平台,并且提供微机保护装置与外部系统的电气联系,具体包括数据采集系统、CPU主系统、开关量输出、输入系统及设备等;软件指计算机程序,由它按照保护原理和功能的要求对硬件进行控制,有序地完成数据采集、外部信息交换、数字运算和逻辑判断以及动作指令执行等各项操作。

从20世纪7O年代末,华中理工大学、东南大学、华北电力学院、西安交通大学等高等院校和科研院所即已开始了计算机继电保护的研究,相继研制了不同原理、不同型式的微机保护装置。随着微机保护装置的研究,在微机保护软件、算法等方面也取得了很多理论成果。从20世纪90年代开始,我国继电保护技术已进入了微机保护的时代。由于计算机继电保护与传统保护装置相比具有灵活、可靠、稳定,且可方便地扩充其他辅助功能。因此,随着近年来农网改造的逐步深入,计算机继电保护在农网中将得到广泛应用。

2 电力系统继电保护网络化

继电保护装置的作用不只限于切除故障元件和限制事故影响范围,还要保证全系统的安全稳定运行。目前,继电保护装置除了纵差动保护和纵联保护外,都只能反应保护安装处的电气量,继电保护的作用也只限于切除故障元件和缩小事故影响的范围。因此,如果每个保护单元都能共享全系统的运行和故障信息的数据,并在此基础上协调动作,将可确保系统的安全稳定运行。网络计划技术就是利用网络图表达计划任务的进度安排及其各项作业之间的相互关系,进而对网络进行分析并计算网络时间值,确定关键工序和关键路线并运用一定的技术组织措施对项目进行优化的方案。继电保护网络化技术通过计算机网络将全系统各主要设备的保护装置联接起来,即实现微机保护装置的网络化。其基本系统是一个基于B/S模式的三层结构系统(见图1)。

图1 基于B/S模式的三层结构系统

系统由5大功能子系统构成,子系统完成自己特定功能并处于不同物理位置提供服务。这种用计算机网络实现的分布式母线保护原理,比传统的集中式母线保护原理有较高的可靠性,可大大提高保护性能,用户能够利用该系统通过计算机网络进行继电保护相关的各种业务,包括保护配置管理、参数管理、实验记录管理、安全措施管理和运行指标管理等。

农网继电保护系统由于工作地点分散,人员之间的协调、沟通难度大,值班调度人员难以及时了解和记录继电保护设备的运行情况,现场的操作人员也不能够及时地得到调度人员的传票进行现场调整,采用计算机网络系统,将可有效解决这些问题。

3 电力系统继电保护智能化

近年来,人工智能技术如神经网络、遗传算法、进化规划、模糊逻辑等在电力系统各个领域都得到了应用,在继电保护领域也开始得到应用。在电力系统里存在很多非线性问题,用传统的方法,难以得到满意的解决,而应用人工神经网络理论,则能够迎刃而解 。例如在输电线两侧系统电势角度摆开情况下发生经过渡电阻的短路就是一种非线性问题,距离保护很难正确作出故障位置的判别,从而造成误动或拒动。如果用神经网络方法,经过大量故障样本的训练,只要样本集中充分考虑了各种情况,则在发生任何故障时都可正确判别 。这些人工智能方法在农村复杂的电网中得以应用,一方面在管理上使得电力系统减少了不必要的资源浪费,另一方面在其它各项技术的运用方面为工作人员提供了广阔的技术空间,具有广阔的发展前景。

4 继电保护、控制、测量和数据通信一体化

在实现继电保护的计算机化和网络化条件下,继电保护装置是整个电力系统计算机网络上的一个智能终端。一方面它可以从网上获取电力系统运行和故障的任何信息。同时,也可将自身所获得的被保护元件的任何信息传送给网络控制中心或任一终端。因此,每个计算机保护装置不但可以完成继电保护功能,而且可控制、测量和数据通信,达到实现保护、控制、测量、数据通信一体化。华中科技大学石东源等开发了电网继电保护分析计算及管理一体化系统,其同时可实现整定计算、故障计算、在线校核、故障信息远传、故障综合分析、运行管理、参数管理、设备管理和图档管理等多重任务。该一体化系统已经在国家电力调度通信中心投入运行,在实现整定计算和故障计算等分析计算自动化的同时,还实现了对6个500kV发电厂和变电站内主要继电保护装置和故障录波装置的远程在线监测,并在故障情况下能够实现故障信息的准实时上送,从而实现调度端对故障的及时准确处理。

农网为了测量、保护和控制的需要,各个地点的室外变电站的所有设备,如变压器、线路等的二次电压、电流都必须用控制电缆引到主控室。这不仅要铺设大量的控制电缆,而且使二次回路非常复杂。如果采用保护、控制、测量和数据通信一体化计算机装置,则可有效解决以上问题。

5 结束语

农网继电保护方面是我国电网继电保护的薄弱环节,许多新技术在农网继电保护上的应用还较少,农网继电保护新技术的应用是一项极具挑战性和战略性的事业,开展多领域跨学科的合作是提升农网继电保护水平,实现农村电网安全、稳定和可靠地运行,对我国新农村建设具有重要意义。

参考文献

[1]孙丽萍.继电保护原理最新研究进展[J].煤炭技术,2009(2):46—48.

[2]马顺绪.浅谈电力系统继电保护技术的发展趋势[J].科技经济市场,2010(4)27—28

[3]李任种,田有文.信息技术在农网继电保护中的应用[J].农机化研究,2008(2):175—176.

[4]胡乃有,李辉.配电网网络化继电保护[J].农村电气化,2006(12):29—30.

[5]丁锋.基于网络信息平台的继电保护管理系统研究[J].内蒙古科技与经济,2007(4):99—102.

[6]杜万秋.继电保护技术的发展历程及人工神经网络的应用[J].哈尔滨职业技术学院学报2005(4)

[7]唐蕾,陈维荣.神经网络在电力系统自适应单相重合闸中的应用[J].继电器,2003,31(8):26—29.