首页 > 文章中心 > 对神经网络的认识

对神经网络的认识

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇对神经网络的认识范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

对神经网络的认识

对神经网络的认识范文第1篇

关键词:人工智能;深度学习;教学建议

0 引言

传统的人工智能课程主要包括人工智能导论、模式分析、机器学习、数据挖掘等。这些课程由各个院校根据专业情况不同而选择,课程的内容也有较大差别,但是,基本上都涉及人工神经网络的内容。然而在人工神经网络的教学内容上,一般只讲解经典的多层感知器和反向传播算法,或再加入一些反馈网络的内容,这种教学内容设计的一个不足是忽视了人工智能领域的最新发展——深度学习,它是近几年人工智能领域最具影响力的研究主题,并在大规模语音识别、大规模图像检索等领域取得突破。

北京邮电大学计算机学院开设人工智能科学与技术的本科专业,笔者从事深度学习的研究工作,同时承担了本科生和研究生人工智能类课程的教学工作,因此产生了将深度学习内容引人人工智能类课程的想法。本文先介绍深度学习的背景,说明深度学习在人工智能发展中的地位,之后分析了将深度学习基本内容引入人工智能类课程的必要性和可行性,最后给出了一些实施建议供探讨。

1 深度学习背景

2006年,加拿大多伦多大学的GeoffreyHinton教授与Salakhutdinov博士在美国《科学》杂志发表了题为“Reducing the Dimensionality ofDatawith Neural Networks”的论文,该文提出一种学习多层神经网络的方法,并将这种具有多层结构的学习方法命名为深度学习(Deep Learning),而这成为深度学习研究的一个导火索,从此深度学习的研究与应用蓬勃发展起来。

深度学习在语音识别与生成、计算机视觉等应用领域取得了突出进展。近几年的国际机器学会(International Conference on MachineLearning,ICML)、神经信息处理大会(AnnualConference On Neural Information Processing Systems,NIPS)、计算机视觉大会(InternationalConference on Computer Vision,ICCV)、

声学语音与信号处理大会(International ConferenceOn Acoustics,Speech,and Signal Processing,ICASSP)、计算语言学大会(Annual Meeting of the Association for Computational Linguistics.ACL)、计算机视觉与模式识别(InternationalConference on Computer Vision and P atternRecognition,CVPR)等都有不少相关的研究论文、会议教程和小组研讨会(Workshop)。美国国防高级研究计划(DARPA)也提出了关于深层学习的研究项目。此外,2013年6月《程序员杂志》的封面故事,采访了周志华、李航、朱军3位国内的机器学习专家对于深度学习的看法,他们一致肯定了深度学习在机器学习领域的贡献。

工业界对深度学习也寄予了很高期望。2012年6月,《纽约时报》报道了斯坦福大学计算机科学家AndrewNg和谷歌公司的系统专家JeffDean共同研究深度神经网络的机器学习模型在语音识别和图像识别等领域获得的巨大成功。2012年11月,微软公司在天津公开演示了一个全自动的同声传译系统,其关键技术也是深度学习。2013年1月,百度公司首席执行官李彦宏先生宣布建立深度学习研究院(Institute of Deep Learning)。2013年3月,谷歌公司收购了由深度学习创始人Geoffrey Hinton创立的公司。

从学术界与工业界的研究态势看,深度学习已经成为机器学习与模式识别,乃至人工智能领域的研究热点。正是在这样一个背景下,人工神经网络重新回到人们的视野。此前人工神经网络的发展大致可以分为两个时期,1943年,McCulloch和Pitts提出了最早的人工神经元,这种神经元具有学习能力,这是人工神经网络的发端,也可以被认为是人工智能的发端(当时还没有人工智能这个术语)。1949年,Hebb提出了Hebbian学习算法。1957年,Rosenblatt提出了感知器的神经网络模型。1969年,Minsky和Papert分析了这种感知器神经网络模型的局限性。然而,很多研究者认为,感知器的这种局限性对于所有的神经网络模型都适用,这使人工神经网络的研究很快暗淡下来。1980年代中期,诺贝尔奖得主John Hopfield提出了Hopfield神经网络模型,这种Recurrent神经网络具有的动态性有可能用于解决复杂的问题。同时,多层前向神经网络的后传算法也被重新发现,这两个工作使人工神经网络得到重生。这时,人工神经网络已经成为人工智能的一个重要组成部分。但是,在随后的研究中,人们发现,当学习多层神经网络包含更多的隐藏层时,后传算法并不能学到有效的网络权值,这使得神经网络的研究再次陷入低潮。此次以深层神经网络为代表的深度学习重新回到研究的舞台,其中一个重要因素是Hinton提出的逐层预训练神经网络方法治愈了多层神经网络的一个致命伤。

2 必要性与可行性

深度学习的发展使得从事教学一线的教师也无法忽视这个颇具影响力的研究主题。为此,我们提出将深度学习这个主题引入到人工智能类课程中,将它作为课题教学的一部分。

2.1 必要性

将深度学习这个主题引入到人工智能类课程中的必要性主要包括如下4点。

1)深度学习是人工智能的前沿。

2006年以来,深度学习的研究席卷了整个人工智能,从机器学习、机器视觉、语音识别到语言处理,都不断涌现出新的研究工作和突破性进展。深度学习不仅在机器学习领域成为研究热点,同时在多个应用领域也成为有力工具,而且,在工业界的系统应用中,深度学习成为其中的关键解决技术。

2)深度学习是人工智能的突破。

深度学习的发端是神经网络。关于神经网络的论述,在人工智能类常见教科书中还停留在多层神经网络,即神经网络的第二阶段,它们大部分描述多层结构无法训练的现象。但是,从深度学习的角度看,深层神经网络不仅可学习,而且有必要,这与第二代神经网络的观点是完全不同的。深度学习突破了原有人工神经网络的认识,超越了人工智能神经网络教科书中的原有内容,因此,有必要将多层神经网络结构的可学习性告知学生,从新的视角纠正原有的观点。

3)深度学习是人工智能的延伸。

深度学习不仅提供了一种可以在深层神经结构下训练网络的方法,也包含了不少新的内容,是人工智能的新发展,为人工智能补充了新的内容。到目前为止,深度学习至少包括:从生物神经网络与人类认知的角度认识深层神经网络的必要性;如何构建和学习深层学习网络;如何将深层结构用于解决视觉、语音、语言的应用问题;如何看待深度学习与原有的机器学习方法,如流形学习、概率图模型、能量模型的直接关系;深度学习与其他学科的关系等。

4)深度学习是学生的潜在兴趣点。

大学生对知识有着强烈的好奇心,加之当前信息技术的发达,部分对智能感兴趣的学生可以从其他途径了解到这个学科发展的前沿。因此,顺势而为,将深度学习这个主题做具体讲解,满足学生的好奇心,培养他们对学科前沿与发展的认识,是十分必要的。对高年级的学生而言,了解深度学习的基本知识,是他们全面认识人工智能与发展前沿的一个途径,而对于研究生,较多地了解和掌握深度学习的基本知识有助于他们研究工作的开展。

基于以上几点,笔者认为,将深度学习这个主题引入到人工智能类课程中非常有必要。深度学习作为人工智能的前沿,既是对人工智能原有理论和技术的一个突破和补充。

2.2 可行性

将深度学习引入到人工智能类课程中的可行性主要包括如下3点。

1)深度学习与现有人工智能联系密切。

深度学习并不像突兀的山峰拔地而起。而是深深植根于原有的人工智能理论与技术。深度学习是以神经网络为出发点,这正是深度学习教与学的切入点。比如,可以通过对多层感知器隐藏层的增加和后传算法的失效来讲解深度学习是如何解决这个问题的。再者,深度学习的一个核心构建“受限波尔兹曼机(Restricted Boltzmann Machine)”,可以被认为是一种能量模型,而这种模型与Hopfield网络都可以从物理学的能量模型角度分析,RBM可以认为是Hopfield网络的随机扩展。总之,深度学习与现有人工智能的联系,使学习深度学习变得容易。

2)深度学习的基本内容并不深。

深度学习有个很好的名字,这个名字恰当地描述了特定的学习结构。比如,深度学习的核心部件受限于波尔兹曼机RBM,其结构非常简单。从神经网络的角度,受限波尔兹曼机是一种随机的双向连接神经网络,信号可以从可见层传递到隐藏层,也可以从隐藏层传递到可见层。网络中每个节点是具有特定结构的神经元,其中的神经元具有典型的包含自身偏置的Logistic函数的随机单元,能够依Logistic函数计算得到的概率输出0状态或1状态。概括地说,深度学习的基本内容在高年级阶段较易掌握。

3)深度学习的资料容易获得。

当前的信息资讯非常发达,有相当多的资料可以通过互联网等多种途径获得,这使学习深度学习成为可能。近期,中国计算机学会主办了多个技术讲座均涉及深度学习的部分;深度学习的创始人Hinton教授的主页也有很多资料;Coursera网站有免费的Hinton教授的神经网络课程;斯坦福大学的Ng教授提供了很多的在线教程;蒙特利尔大学Bengio教授发表的题为“Learning Deep Architectures for AI”的论文也是这领域的优质资料。

3 实施建议

在具体的教学过程中,笔者建议适当安排深度学习的最基本内容,内容不宜过多,也不宜占用过多的学时,可以根据教学对象的不同进行调整。比如,本科生的高年级专业课可以安排1学时的教学量,介绍层次训练的基本算法;也可以在高年级前沿讲座中安排2学时,内容覆盖面尽可能广泛。在研究生的教学中,可以根据教学的课程主题安排内容与学时。比如,神经网络主题的课程可以安排4-6学时的教学内容,包括波尔兹曼机及学习算法、深层信念网络与学习算法、深层波尔兹曼机与学习算法卷、积神经网络、自动编码器等。结合应用,课程还可以包含MNIST数字识别的应用、人脸识别的应用、图像检索的应用、语音识别中的应用等。另外,深度学习是一个实践性很强的研究,随机性:大规模(意味着数据不宜可视化,程序运行时间长)等多种因素混合,使深度学习在学习中不容易理解。为此,可以在条件允许的前提下,增加小规模的实验,辅助理解。最后,课件可以通过对优质资料做修改得到。

对神经网络的认识范文第2篇

经过长期不懈努力,科学家认为可以从仿制人脑神经系统的结构和功能出发,研究人类智能活动和认识现象。然而,客观现实世界是纷繁复杂的,非线性情况随处可见,人脑神经系统更是如此。为了更好地认识客观世界,我们必须对非线性科学进行研究。人工神经网络作为一种非线性的、与大脑智能相似的网络模型,就这样应运而生了。因此,首先对人工神经网络进行了概述;而后重点描述BP网络模型,对其基于弹性BP算法的BP网络设计与实现;最后,对网络的训练和测试进行了简单的分析。

关键词:

人工神经网络;数学模型;策略

神经系统,是人体器官的一种较为复杂的系统。人工神经网络是对人脑的神经结构与机制进行模拟,是一种区别于符号推理以及逻辑思维的人工智能技术。人工神经网络是基于现代神经生物学和认知科学对人类信息处理研究成果的基础上研发的,用来模拟生物神经系统对真实世界的物体来做出反应。除此之外,它还属于一种大规模自适应的非线性动力学系统,具备非常强的联想记忆和自主学习能力。人工神经网络具有非线性映射、模式识别、函数逼近、聚类分析、数据压缩以及优化设计的功能,并且在稳定性、收敛性等方面都有良好的性质,被广泛应用于信息处理、模式识别、计算机视觉、优化计算、智能控制等各个领域中。

一、人工神经网络

人工神经网络,可以称之为神经网络或者链接模型,是属于一种对人脑或者自然神经网络的若干个基本特性进行抽象和模拟的网络。现阶段人工神经网络的研究成果基础是对大脑的模拟研究,是为了模拟大脑当中的某些机理与机制,实现某个方面的功能而进行专项研究的。人工神经网络具有可以充分逼近任意复杂的非线性关系,对于定量或者定性的信息会采用并行分布的处理方式,使其可以大量并且快速进行运算、适应不确定的系统和对定量以及定性信息进行同一时间的处理。人工神经网络的优越性表现在三方面,具有自主学习的能力,具有联想存储的能力,具有高速寻找并且寻找优化方式的能力。对人工神经网络的研究,可以分为理论研究和应用研究两个方面的研究。在理论研究中,可以利用神经生理与认知科学对人类的思维以及智能机理进行相关研究,还可以利用人脑神经的基础理论研究成果,用数理方法对神经网络模型进行更加完善、更加优越的探索。在应用研究方面,神经网络可以实现对软件的模拟和对硬件的科学研究。而且,神经网络在各个领域中也都得到了广泛的研究,例如模式识别、信号处理、知识工程、专家系统、优化组合以及机器人控制等领域。

现行的数理知识是建立在集合论的基础上的,随着数学阶段的发展,对于人类系统的行为,或者对于人类复杂系统,比如航天系统、人脑系统以及社会系统等方面,其中的参数和变量有很多,各种因素也是相互交错的,因此,系统是相当复杂的,相对的模糊性也会显得非常明显。就认识方面来讲,可以用模糊性这个词语来概括概念外延的不确定性。因此,模糊数学的概念应运而生,主要的研究内容包括三个方面。首先,可以对模糊数学的理论进行精确研究,其中包含着与精确数学以及随机数学的关系;其次,还需要研究模糊语言学和模糊逻辑,人类的自然语言都是具有模糊性的,人们经常会接收到迷糊语言和模糊的信息,并且可以对其做出正确的判断和辨别。因此,为了可以使得自然语言和计算机语言的直接对话,就必须把人类的自然语言和思维的过程提炼成为数学模型来对计算机进行指令,这样就可以建立模糊数学的模型样本,通过运用此种方式,建立的就是模糊数学的模型,也是运用数学方法的关键之所在。最后,研究模糊数学的应用,模糊数学的研究对象通常是以不确定的事物为主的。模糊的集合通常都是通过数学来适用描述的复杂的事物,将研究的对象数学化,将其中的不确定性很好地和抽象的数学沟通起来,达到形象生动直观的效果。

二、BP网络模型

1.BP网概述BP算法,是由PallWerbas博士在1974年首次提出的,即为误差逆传播学习算法,而对于此算法完整的提出是在1986年由Rumelhart和McCelland为首的科学家小组提出来的。后来,人们把BP算法在进行训练之前的前馈型的神经网络称之为BP网络,逐渐以其简洁、实用和高度的非线性映射能力成为流行的网络模型,在信号处理、模式识别、系统辨识以及数据压缩中都有广泛的应用。在人工神经网络的实际应用过程当中,大部分的模型会采用BP网络或者它所拥有的变化形式,属于前向网络中的基础核心部分,属于人工神经网络中的精华部分。2.BP网络拓扑结构BP网络属于一种前向型神经网络,其中的神经网络具有三层或者三层以上,可以对上下层之间的神经元进行全部的连接,也就是说下层的每一个神经元可以和上层的每一个神经元实现连接,但是在同层之间的神经元是没有办法相连的。3.BP网络的工作原理以及过程对于BP网络的学习可以有两个阶段。首先,需要学习信号的正向传播过程。当一对学习的模式进行网络提供之后,神经元的激活值就会从输入层当中的各隐含层向输出层中进行传播,并且在输出层的各个神经元内会相应地输入响应值。其次,是对正方向的传播过程进行误差的修正,如果在输出层中的输出值和预期的有偏差,就会对实际输入与期望输出之间的误差进行逐层递归的计算,计算方向会按照减小期望输出和实际输出之间的误差方向。对输出层之间的各个隐含层进行每一层的连接权进行逐层的修正,最后再回到输入层,这个循环的过程就称之为“误差逆传播学习算法”。现阶段,这种误差传播的修正方式在不断地进行创新修正,网络对应的输入模式相应的正确率也会随着算法的不断发展得到相对应地提高。4.算法流程BP的算法流程如图2。

三、基于弹性BP算法的BP网设计与实现

1.BP网络结构的设计在1989年,RobertHecht-Nielson证明了在任何一个闭区间当中的一个连续的函数都可以用一个隐含层的BP网络来进行逼近,这就导致了用一个3层的BP网络可以完成任意的从N到M维的映射。输入层节点的点数是根据样本的输入特征项来决定的,而输出的节点数是根据样本的期望输出项来决定的。在隐层节点当中,由于隐层节点的数目过多,平均的收敛速度就会变慢并且速度是极其不稳定的,这样就会增加初始权值的敏感度,网络的泛化能力也会随之降低,在对隐层节点数进行计算的时候。其中,h代表的是隐层节点数,nin代表的是输入层的节点数,则nout则代表的是输出层的节点数。当因为网络发生误差产生下降的时候,也就是E(网络误差)下降的速度非常缓慢的时候,这个时候网络的收敛水平还需要进一步提高的时候,就会增加一个隐层节点。如果遇到相反的情况,则就会减少一个相应的节点。对于BP网络的优化,主要包括以下几个步骤。首先,利用弹性BP算法来对网络的权值和偏差进行修正,利用此种算法,在很大程度上避免了使得学习(是学习)陷入局部狭小的现象,这样可以加快学习收敛的速度;其次,对于隐含的节点数可以进行随意的设定;而后,在对隐含层和输出层的激活函数之间可以在给定的5种畅通的函数当中进行随意的选择,最后就需要对输入向量的归一化了。

四、网络的训练与测试

1.训练样本的声场以及网络的构造如果采用100个样本对来进行声场训练样本对,这里的样本数据采用LINSPACE(X1,X2,N)的函数生成。在本文当中,BP网络有三层构造。在这三层构造当中,第一层采用tansig激活函数;第二层采用logsig激活函数,在第三层则需要采用purline激活函数来进行。在网络训练当中需要用Matlab神经网络工具箱当中的L-M法的trainlm这个函数来进行计算。2.网络学习以及等级的评价通过MATLAB的神经网络工具箱上建立的模型,需要将学3.网络测试成效从评价的结果上来看,运用人工神经网络的评价方法最大限度地减少了人为因素的影响,在这其中可以在很大程度上减少因为传统方式而在设计权重过程当中的不确定性,通过这种方式来对评价的对象进行自动评价。同时,BP的神经网络这种评估方式本身也具有一定的局限性,例如对网络当中的隐层节点个数难以确定,在学习训练的过程当中最容易陷入局部最优的问题,在很大程度上会影响评价结果的精准性。

五、结束语

运用人工神经网络方式有效解决多源、多类型以及多属性地址处理和分析问题,在很大程度上突破了统计数学模型对预测的约束力和限制力。应用人工神经网络进行复杂的地址信息的非线性整合处理,可以精准的对各类资料进行综合分析和归类。

参考文献:

[1]李传杰.基于模糊数学及神经网络的心理评估模型[D].山东大学,2008

[2]徐振东.人工神经网络的数学模型建立及成矿预测BP网络的实现[D].吉林大学,2004

[3]邓丽琼,朱俊.基于BP神经网络的教师课堂教学评价模型[J].国土资源高等职业教育研究,2013

对神经网络的认识范文第3篇

80年代初,在美国、日本、接着在我国国内都掀起了一股研究神经网络理论和神经计算机的热潮,并将神经网络原理应用于图象处理、模式识别、语音综合及机器人控制等领域。近年来,美国等先进国家又相继投入巨额资金,制定出强化研究计划,开展对脑功能和新型智能计算机的研究。

人脑是自生命诞生以来,生物经过数十亿年漫长岁月进化的结果,是具有高度智能的复杂系统,它不必采用繁复的数字计算和逻辑运算,却能灵活处理各种复杂的,不精确的和模糊的信息,善于理解语言、图象并具有直觉感知等功能。

人脑的信息处理机制极其复杂,从结构上看它是包含有140亿神经细胞的大规模网络。单个神经细胞的工作速度并不高(毫秒级),但它通过超并行处理使得整个系统实现处理的高速性和信息表现的多样性。

因此,从信息处理的角度对人脑进行研究,并由此研制出一种象人脑一样能够“思维”的智能计算机和智能信息处理方法,一直是人工智能追求的目标。

神经网络就是通过对人脑的基本单元---神经元的建模和联结,来探索模拟人脑神经系统功能的模型,并研制一种具有学习、联想、记忆和模式识别等智能信息处理功能的人工系统。本文介绍神经网络的特点以及近年来有关神经网络与混沌理论、模糊计算和遗传算法等相结合的混合神经网络研究的动态。

一.神经网络和联结主义

回顾认知科学的发展,有所谓符号主义和联结主义两大流派。符号主义从宏观层次上,撇开人脑的内部结构和机制,仅从人脑外在表现出来的智能现象出发进行研究。例如,将记忆、判断、推理、学习等心理活动总结成规律、甚至编制成规则,然后用计算机进行模拟,使计算机表现出各种智能。

符号主义认为,认识的基本元素是符号,认知过程是对符号表示的运算。人类的语言,文字的思维均可用符号来描述,而且思维过程只不过是这些符号的存储、变换和输入、输出而已。以这种方法实现的系统具有串行、线性、准确、简洁、易于表达的特点,体现了逻辑思维的基本特性。七十年代的专家系统和八十年代日本的第五代计算机研究计划就是其主要代表。

联接主义则与其不同,其特点是从微观出发。联接主义认为符号是不存在的,认知的基本元素就是神经细胞(神经元),认知过程是大量神经元的联接,以及这种联接所引起的神经元的不同兴奋状态和系统所表现出的总体行为。八十年代再度兴起的神经网络和神经计算机就是这种联接主义的代表。

神经网络的主要特征是:大规模的并行处理和分布式的信息存储,良好的自适应、自组织性,以及很强的学习功能、联想功能和容错功能。与当今的冯.诺依曼式计算机相比,更加接近人脑的信息处理模式。主要表现如下:

神经网络能够处理连续的模拟信号。例如连续灰度变化的图象信号。

能够处理混沌的、不完全的、模糊的信息。

传统的计算机能给出精确的解答,神经网络给出的是次最优的逼近解答。

神经网络并行分布工作,各组成部分同时参与运算,单个神经元的动作速度不高,但总体的处理速度极快。

神经网络信息存储分布于全网络各个权重变换之中,某些单元障碍并不影响信息的完整,具有鲁棒性。

传统计算机要求有准确的输入条件,才能给出精确解。神经网络只要求部分条件,甚至对于包含有部分错误的输入,也能得出较好的解答,具有容错性。

神经网络在处理自然语言理解、图象模式识别、景物理解、不完整信息的处理、智能机器人控制等方面有优势。

符号主义和联接主义两者各有特色,学术界目前有一种看法:认为基于符号主义得传统人工智能和基于联接主义得神经网络是分别描述人脑左、右半脑的功能,反映了人类智能的两重性:精确处理和非精确处理,分别面向认识的理性和感性两个方面,两者的关系应该是互补而非互相代替。理想的智能系统及其表现的智能行为应是两者相互结合的结果。

接下去的问题是,符号AI和联接AI具体如何结合,两者在智能系统中相互关系如何?分别扮演什么角色?目前这方面发表的文献很多,大致有如下几种类型:

1.松耦合模型:符号机制的专家系统与联接机制的神经网络通过一个中间媒介(例如数据文件)进行通讯。

2.紧耦合模型:与松耦合模型相比较,其通讯不是通过外部数据进行,而是直接通过内部数据完成,具有较高的效率。其主要类型有嵌入式系统和黑板结构等。

3.转换模型:将专家系统的知识转换成神经网络,或把神经网络转换成专家系统的知识,转换前的系统称为源系统,转换后的系统称为目标系统,由一种机制转成另一种机制。如果源系统是专家系统,目标系统是神经网络,则可获得学习能力及自适应性;反之,可获得单步推理能力、解释能力及知识的显式表示。当然,转换需要在两种的机制之间,确定结构上的一致性,目前主要问题是还没有一种完备而精确的转换方法实现两者的转换。有待进一步研究。

4.综合模型:综合模型共享数据结构和知识表示,这时联接机制和符号机制不再分开,两者相互结合成为一个整体,既具有符号机制的逻辑功能,又有联接机制的自适应和容错性的优点和特点。例如联接主义的专家系统等。

近年来神经网络研究的另一个趋势,是将它与模糊逻辑、混沌理论、遗传进化算法等相结合,即所谓“混合神经网络”方法。由于这些理论和算法都是属于仿效生物体信息处理的方法,人们希望通过她们之间的相互结合,能够获得具有有柔性信息处理功能的系统。下面分别介绍。

二.混沌理论与智能信息处理

混沌理论是对貌似无序而实际有序,表面上看来是杂乱无章的现象中,找出其规律,并予以处理的一门学科。早在七十年代,美国和欧洲的一些物理学家、生物学家、数学家就致力于寻求在许许多多不同种类的不规则性之间的联系。生物学家发现在人类的心脏中有混沌现象存在,血管在显微镜下交叉缠绕,其中也有惊人的有序性。在生物脑神经系统中从微观的神经膜电位到宏观的脑电波,都可以观察到混沌的性态,证明混沌也是神经系统的正常特性。

九十年代开始,则更进一步将混沌和神经网络结合起来,提出多种混沌神经网络模型,并探索应用混沌理论的各种信息处理方法。例如,在神经元模型中,引入神经膜的不应性,研究神经元模型的混沌响应,研究在神经网络的方程中,不应性项的定标参数,不定性时间衰减常数等参数的性质,以及这些参数于神经网络混沌响应的关系,并确定混沌---神经网络模型具有混沌解的参数空间。经过试验,由这种混沌神经网络模型所绘出的输出图形和脑电图极为相似。

现代脑科学把人脑的工作过程看成为复杂的多层次的混沌动力学系统。脑功能的物理基础是混沌性质的过程,脑的工作包含有混沌的性质。通过混沌动力学,研究、分析脑模型的信息处理能力,可进一步探索动态联想记忆、动态学习并应用到模式识别等工程领域。例如:

对混沌的随机不规则现象,可利用混沌理论进行非线性预测和决策。

对被噪声所掩盖的微弱信号,如果噪声是一种混沌现象,则可通过非线性辨识,有效进行滤波。

利用混沌现象对初始值的敏锐依赖性,构成模式识别系统。

研究基于混沌---神经网络自适应存储检索算法。该算法主要包括三个步骤,即:特征提取、自适应学习和检索。

模式特征提取采用从简单的吸引子到混沌的层次分支结构来描述,这种分支结构有可能通过少数几个系统参数的变化来加以控制,使复杂问题简单化。自适应学习采用神经网络的误差反传学习法。检索过程是通过一个具有稳定吸引子的动力学系统来完成,即利用输入的初始条件与某个吸引子(输出)之间的存在直接对应关系的方法进行检索。利用这种方法可应用于模式识别。例如黑白图象的人脸识别。

三.模糊集理论与模糊工程

八十年代以来在模糊集理论和应用方面,也有很大进展。1983年美国西海岸AI研究所发表了称为REVEAL的模糊辅助决策系统并投入市场,1986年美国将模糊逻辑导入OPS---5,并研究成功模糊专家系统外壳FLOPS,1987年英国发表采用模糊PROLOG的智能系统FRIL等。除此通用工具的研制以外,各国还开发一系列用于专用目的的智能信息处理系统并实际应用于智能控制、模式识别、医疗诊断、故障检测等方面。

模糊集理论和神经网络虽然都属于仿效生物体信息处理机制以获得柔性信息处理功能的理论,但两者所用的研究方法却大不相同,神经网络着眼于脑的微观网络结构,通过学习、自组织化和非线性动力学理论形成的并行分析方法,可处理无法语言化的模式信息。而模糊集理论则着眼于可用语言和概念作为代表的脑的宏观功能,按照人为引入的隶属度函数,逻辑的处理包含有模糊性的语言信息。

神经网络和模糊集理论目标相近而方法各异。因此如果两者相互结合,必能达到取长补短的作用。将模糊和神经网络相结合的研究,约在15年前便已在神经网络领域开始,为了描述神经细胞模型,开始采用模糊语言,把模糊集合及其运算用于神经元模型和描述神经网络系统。目前,有关模糊---神经网络模型的研究大体上可分为两类:一类是以神经网络为主,结合模糊集理论。例如,将神经网络参数模糊化,采用模糊集合进行模糊运算。另一类以模糊集、模糊逻辑为主,结合神经网络方法,利用神经网络的自组织特性,达到柔性信息处理的目的。

与神经网络相比,模糊集理论和模糊计算是更接近实用化的理论,特别近年来美国和日本的各大公司都纷纷推出各种模糊芯片,研制了型号繁多的模糊推理板,并实际应用于智能控制等各个应用领域,建立“模糊工程”这样一个新领域。日本更首先在模糊家电方面打开市场,带有模糊控制,甚至标以神经---模糊智能控制的洗衣机、电冰箱、空调器、摄象机等已成为新一代家电的时髦产品。我国目前市场上也有许多洗衣机,例如荣事达洗衣机就是采用模糊神经网络智能控制方式的洗衣机。

四.遗传算法

遗传算法(GeneticAlgorithm:GA)是模拟生物的进化现象(自然、淘汰、交叉、突然变异)的一种概率搜索和最优化方法。是模拟自然淘汰和遗传现象的工程模型。

GA的历史可追溯到1960年,明确提出遗传算法的是1975年美国Michigan大学的Holland博士,他根据生物进化过程的适应现象,提出如下的GA模型方案:

1.将多个生物的染色体(Chromosmoe)组成的符号集合,按文字进行编码,称为个体。

2.定义评价函数,表示个体对外部环境的适应性。其数值大的个体表示对外部环境的适应性高,它的生存(子孙的延续)的概率也高。

3.每个个体由多个“部分”组合而成,每个部分随机进行交叉及突然变异等变化,并由此产生子孙(遗传现象)。

4.个体的集合通过遗传,由选择淘汰产生下一代。

遗传算法提出之后,很快得到人工智能、计算机、生物学等领域科学家的高度重视,并在各方面广泛应用。1989年美国Goldberg博士发表一本专著:“GeneticAlgorithmsinSearch,OptimizationandMachineLearning”。出版后产生较大影响,该书对GA的数学基础理论,GA的基本定理、数理分析以及在搜索法、最优化、机器学习等GA应用方面进行了深入浅出的介绍,并附有Pascal模拟程序。

1985年7月在美国召开第一届“遗传算法国际会议”(ICGA)。以后每隔两年召开一次。近年来,遗传算法发展很快,并广泛应用于信息技术的各个领域,例如:

智能控制:机器人控制。机器人路径规划。

工程设计:微电子芯片的布局、布线;通信网络设计、滤波器设计、喷气发动机设计。

图象处理:图象恢复、图象识别、特征抽取。

调度规划:生产规划、调度问题、并行机任务分配。

优化理论:TSP问题、背包问题、图划分问题。

人工生命:生命的遗传进化以及自增殖、自适应;免疫系统、生态系统等方面的研究。

神经网络、模糊集理论和以遗传算法为代表的进化算法都是仿效生物信息处理模式以获得智能信息处理功能的理论。三者目标相近而方法各异;将它们相互结合,必能达到取长补短、各显优势的效果。例如,遗传算法与神经网络和模糊计算相结合方面就有:

神经网络连续权的进化。

传统神经网络如BP网络是通过学习,并按一定规则来改变数值分布。这种方法有训练时间过长和容易陷入局部优化的问题。采用遗传算法优化神经网络可以克服这个缺点。

神经网络结构的进化。

目前神经网络结构的设计全靠设计者的经验,由人事先确定,还没有一种系统的方法来确定网络结构,采用遗传算法可用来优化神经网络结构。

神经网络学习规则的进化。

对神经网络的认识范文第4篇

人工神经网络属于一种对人脑结构及功能进行反映的数学抽象模型,对人的思维以及存储知识等功能进行模拟,从而完成某项工作。对于岩土工程来说,主要包括岩体和土体两项内容,且这两项内容均具备很高的复杂性。在岩土工程研究过程中,有必要借助人工神经网络,从而使岩土工程的研究得到有效进步发展。本文在分析人工神经网络的基础上,进一步对人工神经网络在岩土工程中的应用进行分析,以期为岩土工程研究的进展提供一些具有价值的参考建议。

关键词:

人工神经网络;岩土工程;应用

岩土工程的研究对象分为两大类:其一为岩体;其二为土体。岩土工程涉及的介质存在两大特性,即模糊性和随机性,这两大特性又统称为不确定性。近年来,不少学者在岩土工程研究过程中,提出了人工神经网络这一概念,即利用人工神经网络,将其应用到岩土工程研究领域当中,从而为深入了解岩土工程的某些介质特征奠定有效基础[1]。从岩土工程研究的优化及完善角度考虑,本文对“人工神经网络在岩土工程中的应用”进行分析意义重大。

1人工神经网络分析

1.1人工神经网络概念

对于人工神经网络来说,是一种对人脑结构与功能进行反映的数学抽象模型;主要通过数理策略,经信息处理,进一步对人脑神经网络构建某种简化模型,进一步采取大量神经元节点互连,从而形成复杂网络,最终完成人类思维及储存知识的能力的模拟。神经网络无需构建反映系统物理规律的数学模型,与别的方法比较,在噪声容忍度方面更强[2]。与此同时,还拥有很强的非线性映射功能,对于大量非结构性以及非精准性规律存在自适应能力,具备超强的计算能力,可完成信息的记忆以及相关知识的推理,且其自身还具备自主学习能力;与常规算法相比,优势、特点突出。

1.2BP网络简述

从研究现状来看,基于实际应用过程中,人工神经网络模型大多数采取BP网络。BP网络即指的是多层前馈网络,因多层前馈网络的训练通常使用误差反向传播算法,所以将BP网络称之为属于一类误差反向传播的多层前馈网络。对于其网络而言,具备输入节点和输出节点,同时还具备一层隐层节点与多层隐层节点,基于同层节点当中不存在耦合状态。其中的输入信号从输出层节点依次传过各个隐层节点,进一步传输至输出节点,每一层节点的输出只对下一层的节点输出产生影响。

2人工神经网络在岩土工程中的应用分析

在上述分析过程中,对人工神经网络的概念有一定的了解,由于其模型算法的优越性,可将其应用到岩土工程研究领域当中,从而为解决岩土工程问题提供有效凭据。从现状来看,人工神经网络在岩土工程中的应用主要体现在以下几大方面。

2.1在岩石力学工程中的应用

岩石力学工程是岩土工程中尤为重要的一部分,将神经网络应用到岩石力学工程当中,主要对岩石非线性系统加以识别,同时还能够为工程岩体分类提供有效帮助,此外在爆破效应预测方面也具备一定的应用价值。对于人工神经网络来说,存在从有限数据中获取系统近似关系的优良特性,而岩石当中的各项参数之间又存在很复杂的关系,并且难以获取完整的参数集。在这样的情况下,使用人工神经网络技术,便能够使岩石非线性系统识别问题得到有效解决[3]。此外,有研究者将岩石抗压强度、抗拉强度以及弹性能量指数等作为岩爆预测的评判指标,进一步对岩爆预测的神经网络模型进行构建,然后预测了岩爆的发生与烈度。通过计算得出结论:采取人工神经网络方法进行岩爆预测行之有效,值得采纳借鉴。

2.2在边坡工程中的应用

对于岩土工程中的边坡工程来说,边坡失稳状况突出,且是由多因素造成的,比如边坡失稳的地质形成条件、诱发因素的复杂性以及随机性等。与此同时,由于边坡动态监测技术从目前来看尚且不够成熟,因此边坡失稳在岩土工程研究领域一直视为是一项难以解决的工程项目。而对于神经网络方法来说,因其具备非常好的预测功能,因此相关岩土工程研究工作者通常会采取人工神经网络对岩土工程中的边坡工程问题进行求解。并且,从现有研究成果来看,将人工神经网络应用于岩土工程的成果突出。有学者对影响岩质边坡的稳定性的相关因素进行了分析,包括地形因素、岩体因素以及外部环境因素等,并构建了边坡稳定性分析的BP网络模型[4]。此外,还有学者将大量水电边坡工程的稳定状况作为学习训练样本及预测样本,对以人工神经网络技术的边坡岩体的稳定性进行了研究,结果显示,采取人工神经网络对边坡岩体的稳定状况进行预测可行性高。

2.3在基坑工程中的应用

采取人工神经网络对基坑变形进行预测主要分为两种情况:其一,对会影响基坑变形的各大因素及位移的神经网络模型加以构建;其二,把变形监测数据作为一个时间序列,以历史数据为依据,将系统演变规律查找出来,进一步完成系统未来发展趋势的分析及预测。有学者针对基坑变形利用了人工神经网络方法进行预测,结果表明:对前期实测结果加以应用,使用此方法能够对后续阶段的基坑变形实时预测出来,并且预测结果和实测结果保持一致性。此外,还有学者根据具体工程项目,采取人工神经网络,对深基坑施工中地下连续墙的位移进行了深入分析及预测,结果显示:使用人工神经网络方法进行分析及预测,在精准度上非常高,值得在深基坑工程相关预测项目中使用[5]。

2.4在地铁隧道工程中的应用

在地铁隧道施工过程中,存在地表变形和隧道围岩变形等状况,为了深入了解这些状况,可将人工神经网络应用其中。有学者在对地层的影响因素进行分析过程中,列出了可能的影响因素:盾构施工参数、盾构物理参数以及地质环境条件,进一步利用人工神经网络,构建了人工神经网络模型,进一步针对盾构施工期间的地层移动进行实时动态预测,最终得到了不错的预测成果。此外,还有学者对BP网络算法进行改进,然后对某地铁工程中隧道上方的地表变形进行了未来趋势预测,结果表明:和其他地表变形预测方法相比,人工神经网络预测方法的应用价值更为显著。

3结语

通过本文的探究,认识到基于人工神经网络模型的算法具备很高的优越性,由于岩土工程地质条件复杂,为了深入研究岩土工程,可将人工神经网络应用其中。结合现状研究成果可知,人工神经网络在岩石力学工程、边坡工程、基坑工程以及地铁隧道工程中均具备显著应用价值。例如:将人工神经网络应用于岩石力学工程当中,能够预测岩爆的发生与烈度;应用于边坡工程当中,能够边坡工程的稳定性进行精准预测;应用于基坑工程当中,实现对基坑工程变形的实时动态监测;应用于地铁隧道工程当中,能够进一步了解地铁工程中隧道上方的地表变形情况。

总而言之,人工神经网络在岩土工程中的应用价值高,值得相关工作者采纳应用。

作者:张洪飞 单位:山东正元建设工程有限责任公司

参考文献

[1]郑惠娜.章超桦.秦小明.肖秀春,等.人工神经网络在食品生物工程中的应用[J].食品工程,2012(01):16-19.

[2]邹义怀.江成玉.李春辉,等.人工神经网络在边坡稳定性预测中的应用[J].矿冶,2011(04):38-41.

[3]曹建智.张健.人工神经网络在白洋淀水质评价中的应用[J].电子技术与软件工程,2016(08):261-262.

对神经网络的认识范文第5篇

关键词:竞争型神经网络;离散化;粗糙集;“死”点

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2013)25-5708-03

目前土壤分类研究已经由单纯的形态描述向指标化和数量化方向发展[1-2]。土壤分类在中国土壤科学的发展和土壤资源的开发利用的作用是不言而喻的。随着各种相关技术的不断发展,土壤规划开始广泛的引入了地理信息系统技术、计算机技术和数学模型方法来解决很多实际问题,极大地提高了规划的科学性、工作效率和精确度[3]。但在实践过程中,也暴露出其不足之处,诸如缺乏定量指标,难以输入计算机,不能建立信息系统,更不能进行分类的自动检索,与现代信息社会难以适应[4-5]。

河南省是农业大省,不但要满足自身的粮食需求,还要为国家提供商品粮,因此针对本省土壤的特点和分类情况进行详细的研究,对农业发展和农民收入显得至关重要。对因土施肥、合理种植、调整农业结构,保护和利用土壤资源,进行土壤资源动态变化监测,实现土壤资源信息共享具有重要的现实指导意义。

LVQ神经网络通过寻找输入/输出数据之间的关系,来实现特征提取和统计分类等模式识别任务。经过几十年的发展,LVQ神经网络已经奠定了在模式识别领域不可或缺的地位。BP网络是一种最为普遍的网络,其缺点在于用了基于梯度下降的非线性优化策略,有可能陷入局部最小问题,不能保证求出全局最小值。其他一些优化策略如遗传算法、模拟退火法等,虽然可以求得全局最小,但是计算量很大,有时候会出现效率问题。另外也有一些利用SOFM网络的一些算法[6-8],该文尝试利用改进型的LVQ神经网络来对河南省部分地区出去的土壤样本进行分类。

2 以河南部分地区土壤抽样为例的聚类分析

2.1样本来源

选择本省主要土类:潮土、褐土、砂姜黑土、黄棕壤、水稻土等,主要分布在豫东的商丘、开封;豫北的安阳市、南东县;豫西(西南)洛阳市、洛宁县、三门峡市的陕县,平顶山市的舞钢市、宝丰县、南阳市郊;豫中南漯河市、临颖县、周口市,驻马店地区的汝南、遂平、确山、信阳市、罗山县等地(市县)。按照 Portch PPI/PPIC,Hunter(ASI,1984)的方法程序进行,如表1所示。

2.2对样本数据进行离散化处理

我们首先判定各个属性的重要性,并且通过引入阈值学习来对竞争型神经网络进行改进,然后利用竞争型神经网络的分类功能,将每一个连续属性分割成若干类,分割连续属性也就等于找到了一个断点集合。这样对每个连续属性离散化完毕之后,我们再次利用改进后的竞争型神经网络检测离散化后的属性是否仍然满足决策一致性,若满足就说明离散化成功,否则重新寻找断点集合,直到满足决策一致。

2.3利用改进后的LVQ神经网络进行聚类分析

糙集对数据的属性进行约简,用约简后的数据集作为竞争型神经网络的设计依据及训练数据。这样得到的训练数据表示清晰,从而使得两种方法进行互补,既能利用粗糙集简约数据,减少竞争型神经网络训练时间,又能利用竞争型神经网络降低噪声影响。

参考文献:

[1] 刘兴久.模糊聚类分析在土壤分类中的应用[J].哈尔滨:东北农学院学报,1988,13(2):125-126.

[2] 谢季坚,刘承平.模糊数学方法应用 [M]. 2版.武汉:华中理工大学出版社,2000:81-106.

[3] Goodehild M F. Geographie Information Seienee. IJCIS,1992,6(1):235-243.

[4] 龚子同,陈志诚. 中国土壤系统分类参比[J] .土壤,1999,31(2):57-63.

[5] 周慧珍. 对土壤制图中应用《中国土壤系统分类(首次方案)》的认识.中国土壤系统分类进展,北京:科学出版社,1993:367-371.

[6] 赵娟,李国昌,张玉彬,等.SOM神经网络数据融合技术的诊断系统的研究[J].河北工业业科技,2010,27(6):378-380.