首页 > 文章中心 > 神经网络的认识

神经网络的认识

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇神经网络的认识范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

神经网络的认识

神经网络的认识范文第1篇

关键词:人工神经网络;教学实践;教学方法;生物信息学

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2014)17-0208-03

人工神经网络是在神经生理学、生物学、数学、计算机学等学科发展的基础上提出的,模拟人类大脑的结构和思维方式处理、记忆信息的一门学科。具体来说,早在20世纪40年代,随着医学、生物学家们对人脑神经的结构、组成以及信息处理的工作原理的认识越来越充分,有学者提出以数学和物理方法对人脑神经网络进行抽象,并建立简化的模型,用以进行信息处理,这种应用类似于大脑神经突触联接的结构进行信息处理的数学模型,称之为人工神经网络ANN(Artificial Neural Network)[1]。

在人工神经网络中,各种待处理的对象(数据、特征、字符、抽象的模式等等)都可用神经元处理单元表示。这些神经元主要可以分为输入神经元、隐含神经元和输出神经元三大类。其作用各不相同,作为输入神经元的处理单元用来与外界产生连接,接收外界的信号输入;隐含神经元处于中间层,为信息处理的不可见层;输出神经元主要实现结果的输出。神经元之间相互连接,连接的权重反映了各神经元之间的连接强度,神经元之间的连接关系中蕴含着信息的表示和处理。人工神经网络主要是在不同程度、不同层次上模拟大脑处理信息的风格,具有非程序化、较强的适应性、自组织性、并行分布式等特点,其实现主要是通过网络的变换和动力学行为,涉及数学、生物学、人工智能、计算机科学、非线性动力学等多个学科[1]。作为一门活跃的边缘叉学科,在处理信息方面,相比于传统人工智能方法具有非线性适应性,成功地应用于神经专家系统、模式识别、组合优化、预测等多个领域,尤其在生物信息学领域得到了广泛的应用。生物信息学是20世纪末发展起来的一极具发展潜力的新型学科。人类的基因中蕴含着大量有用信息,利用神经网络可以对这些海量的信息进行识别与分类,进而进行相关的生物信息学分析。如利用神经网络分析疾病与基因序列的关系,基于神经网络对蛋白质结构的预测,基因表达谱数据的分析,蛋白质互作位点的预测等等,都取得了很好的效果[2]。

因此,在生物信息相关专业的本科生中开设人工神经网络课程尤为重要。经过多年的研究发展,已经提出上百种的人工神经网络模型,这就需要教师针对不同的专业背景,不同层次的学生,讲授不同模型的核心思想、推导过程、实际应用等等。本文主要根据人工神经网络在生物信息学相关专业的教学实践,从以下几个方面进行探讨。

一、引导式教学,激发学生的学习积极性

神经网络作为一门偏于理论分析的学科,传统的教学模式,即首先讲解模型的起源,接下来介绍模型的核心思想,然后就是一连串的数学公式推导,面对满黑板的公式,学生很难提起兴趣去认真学习相应的模型。所以,如何激发起学生的学习积极性,让学生重视这门课程,更好地掌握课程内容,掌握相关的模型理论基础、核心思想,更好地服务于本专业,是人工神经网络教学者亟待解决的问题。

首先,在导课的时候要生动,以引起学生对将要学习的内容的好奇心,让学生有兴趣投入到课堂学习内容中去。布卢姆说过:“最大的学习动机莫过于学生对所学知识有求知的兴趣。”只有在这种动机下的学习,才会提高自身的主动性与自觉性,达到提高教学质量的目的[3]。例如,在讲解hopfield神经网络的时候,通过举例对苹果、橘子的质地、形状、重量等特征的描述,运用“0,1”进行量化描述,然后应用神经网络就可以进行有效地分类;对于旅行商TSP问题,也可以通过hopfield神经网络寻找到最优路径。那么,这些问题是如何解决的呢?就需要大家来一起揭开hopfield神经网络的神秘面纱。其次,由于神经网络涉及大量的数学公式与数学方法,学生往往会有畏惧的心理,这就需要教师帮学生澄清思想误区,现在很多用于数据分析与计算的软件,如matlab工具箱、R软件里面都有很成熟的人工神经网络软件包,所以,学生只需要理解其工作原理、核心思想,学会使用现成的人工神经网络软件包处理数据,在熟练应用程序包的基础上,对相应的神经网络模型进行优化,改进,并且与其他的人工智能算法相结合,更好地为本专业服务。第三,在讲授人工神经网络理论内容的时候,要摒弃传统的呆板式的推导过程,以往的神经网络教学方法注重理论分析,通常是一连串的公式推导,公式中又涉及大量的符号,计算起来复杂又烦琐,学生会觉得索然无趣,厌学情绪严重。在教学过程中,教师要精心设计,创设出特定的问题环境,将所学内容与本专业相结合起来,多讲应用,启发和诱导学生选取合适的神经网络模型来解决本专业的实验数据分析与处理等问题。

二、理论教学与实验教学相结合

除了在理论课堂上将基本的理论知识传输给学生,教师还应该安排若干实验教学内容,让学生以实验为主,将理论课上所学的知识运用到解决实际问题中来,理论联系实际,主动操作思考,观察,分析,讨论,以培养学生解决问题的能力。一旦学生自己动手处理一些问题后,很自然地就会对人工神经网络产生一种亲切感,并能强烈激发起学生继续探究下去的兴趣。对于同一问题,可以让学生选取不同的网络模型,设置不同的参数,甚至可以让学生自己动手编写相应的网络模型程序,并且给予改进,根据得出的结果来评价模型在解决实际问题时的好坏,以及模型改进的效果。作为授课教师,需要不断优化实验教学内容,在生物信息学专业开设人工神经网络课程,实验教学主要是针对生物信息专业的海量生物数据处理与分析的实际需要,培养学生综合运用人工神经网络方法和生物信息学知识,进行信息的分析与处理。除了在实验课堂上给学生最大的自由发挥空间外,课后作业也尽量以开放式问题的形式给出,比如,可以让学生选取相应的网络模型处理本专业的一些实际问题,例如,数据的分类、聚类等等,其中,数据来源可以不同,类型也可自由选取,最后给出相应的模型参数设置、方法的改进、实验结果,也可以安排学生自己查询文献进行学习,并安排学生作报告。这样,学生可以在世界范围内了解神经网络的在本专业的应用情况,又能提高英语的读写能力,还能锻炼学生做科研报告的能力。

三、加强师资队伍建设以及其他基本条件的建设

由于生物信息学是一门新兴的交叉学科[4],这就要求人工神经网络的授课教师要熟练掌握生物信息相关专业的知识,教师的业务水平必须得到充分保证,才能给学生以全面透彻的指导。学院应该本着自主培养与重点引进的原则,优化教师队伍的专业结构和学历结构,提高教师的自身修养。授课教师要将课堂的理论知识联系实际生物问题进行讲授,让学生感受到人工神经网络在本专业的应用,提高学生的学习效率,同时也需要阅读大量的专业文献,提高编程技巧和数据库应用能力,让自己成为一名合格的复合型教师。同时,人工神经网络课程的实验,高度依赖于计算机网络等设备,因此,相关的软硬件设施的建设也必不可少,由于,基因组测序技术的发展,目前生物信息学研究所用的数据都是海量的,神经网络训练起来所需时间太长,不能用普通的电脑完成,需要专门的服务器来处理,学校有关部门应在条件允许的情况下,配备机房,购买服务器,以及相关的软件,为学生创造良好的环境,让学生完成课程内容。

最后,人工神经网络涉及数学、计算机、人工智能和神经学等专业知识,因此,需要授课教师加强与其他相关专业教师的交流与合作,并渗透到授课过程中去,让学生在学习人工神经网络网络时能将各专业联系起来,更好地解决生物信息学中的问题,要想成为一名合格的人工神经网络课程教师,首先要成为一名复合型的教师,不仅要具备教学和科研能力,同时也要具备计算机、生物学、信息学等多学科的知识。

参考文献:

[1]朱大奇,史慧.人工神经网络及其应用[M].北京:科学出版社,2006.

[2]朱伟,史定华,王翼飞.人工神经网络在蛋白质二级结构预测中的应用[J].自然杂志,2003,(3):167-171.

[3]赵俊,李晓红.趣味教学法在预防医学教学中的运用[J].现代医药卫生,2005,21(15):2089-2090.

神经网络的认识范文第2篇

关键词:人工神经 网络之下 建筑施工 安全评价

前言

建筑施工,在整个城市发展过程当中占据着非常重要的地位的,并且也是推动一个国家城市化的重要基础,但与此同时,建筑施工领域本身也是具有较强的危险性,并且,自身还具有生产流动性大以及产品形式光,施工技术比较复杂等等特点,所以,定期定时的对建筑施工采取合理有效的安全评价,不光是能够在很大程度上提升了建筑施工作业的全面管理水平,还是能够为整个建筑施工的安全性,打下结实的基础保障。

一、训练人工神经网络

训练人工神经网络,其实主要是就通过使用BP算法的神经网络,也是当前被我国各个领域所广泛使用到的一种神经网络,主要是由众多的神经元所组合而成的,包括了输入、隐含、输出等层,其在实际工作运行的过程当中,主要是分成以下步骤:1.学习期。对于此状态下的各个计算单元自身的状态值是不发生任何改变的,但是,在对其网络的连接权进行修改的过程当中,也使得系统的输入、输出之间的呈现出一种映射的关系,也即为函数关系,其主要的目的也是为了能够在最大限度上保证,整个系统实际的输出则是为期望输出。2.工作期,此时各个连接权是被固定的,然后计算单元状态变化以求达到稳定[1]。

在整个模型的输入层单元数即是对安全评价指标数目,则是根据前面分析的建筑施工现场自身的安全评级指标,在其的输入层当中的节点数则是设定在了20,那么对于中间层则是要确认为隐含层,其层数与之所相对应的节点数的选取则是为一个非常具有复杂性的问题,这里主要是因为,在采用不同的内部表象的过程当中,其所需要的内部单元数上,是完全不相同的,所以,这也就意味着,综合评价结果对应的是很安全、较安全、合格、较危险、危险等几种不同的程度的,这里对于输出层的节点数则设定在5,那么其标准的输出模式则是分别在了(1,0,0,0,0)、(0,1,0,0,0)、(0,0,1,0,0)、(0,0,0,1,0)、(0,0,0,0,1)[2]。

二、实力分析

依照于我国某个建筑施工的安全评价指标体系,所选取出二级指标的16个指标,作为整建筑施工事故可能会发生的一些潜在患,然后在对其进行全面综合的分析,以此来有效的判断出,整个建筑施工自身的安全状况[3]。

(一)样本数据的离散化和约简

本文主要重点阐述在使用运用BP进行样本数据的约简,从而通过使用Boolean Reasoning Algorithm的方式,来对整个样本的数据进行离散化,然后在合理的通过使用Genetic algorithm的方式来对整个样本数据,进行属性上的约间,从而使得约简出来的总共多达1700度条规则,然后在以此依照于BP人工神经自身的约减规则,从而有效的选择出了关于LHA自身的覆盖率以及RHS自身的覆盖率等指标,然后在对整个数据集,合理的进行规则上的提取,从而有效的到了30条规则。在通过对于提取规则进行进一步的研究分析,在优先参考我国相关建筑施工人员自身的意见,从而才能够最终的确定好几项指标,是在整个建筑施工安全当中的关键核心要素,即U12U24U32U42U43.在针对于约简前的评价指标当中,主要是存在大约16个左右,在对于训练样本上则是分成了14组,在通过对样本数据离散化以及属性的约简以后,就能够将原本众多的评价指标,逐渐的变为5个,这样也是在最大限度上降低了整个输入空间,也是便于之后简化神经网络结构的展开以及运行,以此提升训练的效率强度[4]。

(二)约简后的样本数据进行预测概述

在这里主要是按照已经被约简之后所得到的属性集,剩下的U12U24U32U42U43这五列数据,便能够很好得的得出了约简以后的神经网络训练的样本。对于这五列数据,均采用三层的BP神经网络结构,在输入层为5个神经元上,在合理的采用以上几种方式,估计出其中所隐含的层节点数为3.以此,有效的计算出其中所隐含的层节点数的设置,在将这些数值求出总体的平均值。

三、结果

在合理的通过对于建筑施工安全相关的指标体系的研究,并且,主要依照于建筑施工自身的实际,在合理的通过使用安全系统的整体工程原理,在立足于人、机器、环境、管理等几方面上,对其更进一步的研究,从而有效的确定出了建筑施工安全的16个评价指标。在基于人工神经网络之下的建筑施工安全评价模型,也主要是将粗糙集作为整个神经网络自身的前段处理器,主要将其应用在了有效缩减整个神经网络学习过程当中的一些学习样本,这样做也是为了能够在最限度上满足于简化神经网络结构所对其提出的各种要求,不仅如此,还合理的利用BP神经网络,并且,自身也是具有较强的预测精准度的。在利用人工神经网络下的建筑施工安全评价模型当中,也是对我国各个实际建筑施工工程自身的安全状况,进行了及时有效的安全评价,其所显示出来的结果也是完全与建筑施工工程自身的实际情况所想符合[5]。

四、结论

只有真正的增强人工神经网络下的建筑施工安全评价的重视度,才能够在最大限度上提升我国建筑施工的安全以及稳定性。

参考文献:

[1]袁宁,杨立兵.基于粗糙集-人工神经网络的建筑施工安全评价及应用[J].安全与环境工程,2012,01:60-64.

[2]张文博,宋德朝,郑永前.基于人工神经网络的建筑施工安全评价[J].工业工程,2011,02:

75-79.

[3]宋飞,许程洁,吴红霞. 基于改进BP神经网络的建筑施工安全评价[J].工程管理学报,2011,

06:629-632.

[4]徐平. 基于BP神经网络的建筑施工现场安全评价研究[J].江苏建筑,2013,02:63-64+69.

神经网络的认识范文第3篇

关键词:人脸识别;人脸检测;神经网络

中图分类号:TP18文献标识码:A 文章编号:1009-3044(2011)04-0862-02

The Research and Improvement of the Face Recognition Method Based on the BP Neural Network

FANG Xu

(PLA Chongqing Communication College, Chongqing 400035, China)

Abstract: The recognition of human faces is an important subject in the area of the computer pattern recognition, which has a wide range of applications. And the key is face detection and feature extraction. In this paper, we use BP neural network for the feature extraction and recognition, the choosing principle of the number of hiding layer cells are proposed, the initial values setting principle are also discussed. And the BP algorithm is improved. It improves the precision, reduces the training time and the calculation.

Key words: face recognition; face detection; neural networks

近年来,在计算机视觉和模式识别领域中,对人脸识别系统的研究变得非常活跃。作为人类几个重要外在鉴别特征之一,人脸识别对自动鉴别和人类自动分辨有着重要的意义。相对于指纹识别和虹膜识别来说,人脸识别有着其特殊性,即人脸图象受其成象角度、光照条件等外界因素的影响较大,所以人脸识别起来难度也较大。

现阶段的人脸自动识别系统包括两个主要技术环节:一是人脸的检测与定位,即判断一幅图像中是否有人脸。如果有,定位每张人脸具置。二是人脸特征的提取与识别。包括对人的眼睛,鼻子,嘴部区域的定位以及对人脸图像轮廓线的提取。研究表明,用BP神经网络进行特征的提取和识别,由于其良好的速度,识别率,容错能力和并行计算能力,得到了广泛的应用。

1 BP神经网络

BP神经网络是一种按反向传输算法(Back Propagation)训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。它是一种能向着满足给定的输入输出关系方向进行自组织的神经网络。当输出层上的实际输出与给定的输入不一致时,用最速下降法修正各层之间旧的结合强度,直到最终满足给定的输出输入关系为止。由于误差传播的方向与信号传播的方向正好相反而称为误差反向传播神经网络。

识别过程就是根据特征向量进行分类的过程,识别器实际上就是分类器。针对人脸图像识别问题,选用BP网络模型来设计分类器。理由如下:第一,人脸模式输入向量的维数经过特征提取之后已经不是很高。第二,BP算法成熟简单,可选择的余地比较大。最后输入样本空间经过特征提取后其聚类性能已经有所改善,对BP算法进行适当改进,则会使得训练时间不长。

2 BP算法

2.1 BP网络的输入与输出

BP 网络由输入层,隐含层和输出层构成,相邻层之间用神经元权互联,同一层内的神经元无连接。

对于输入层来说,输出与输入相同,即Oi= Xj。隐含层和输入层的输入输出关系特征为:

Netj = ∑WjiOi

Oj = f(Netj)

其中,Wji表示前一层的神经元i到本层的神经元j的连接权值,Oj为神经元j的输出,Netj表示神经元j接收到的总输入,在函数f的作用下产生输出Oj,f常取sigmoid函数:f(x)=1/(1+e-x)

2.2 隐含层神经元数的选择

通过输入层与隐含层之间的连接权值的“自组织化”,隐含层起到对输入模式进行特征提取的作用,然后将提取的特征传给输出层。隐含层神经元数目过少不能使得网络建立复杂的判断界,过多则使得学习时间过长,影响效率,所以采用如公式(1)求出隐含层神经元数:

(1)

其中m为输出神经元数,n为输入神经元数,a为1―10之间的常数。

2.3 BP网络的学习算法

BP网络的学习算法为:

1)初始化权值,每个权值的初始化值设置为为(0,1)之间的随机数。

2)输入训练样本及期望输出值。

3)逐层计算各层的输出。

4)从输出层开始,调整权值,并反向传播误差值。

5)如果误差小于设定的值,则算法结束。如果大于所设定的值,则转向3, 继续学习。网络训练结束达到稳定状态后,保存网络的连接权值,以用于后面的识别。

其中,学习速率决定每一次循环训练中所产生的权值变化量。大的学习速率有可能会导致系统的不稳定,但是小的学习速率导致较长的训练时间,可能收敛很慢,不过这样能保证网络的误差值不跳出误差表面低谷而趋于误差最小值。所以一般情况下倾向于选择较小的学习速率以保证系统的稳定性。学习速率的范围是0.01-0.8。

3 BP算法的改进

虽然BP网络得到了广泛的应用,但是它并不是十分完美的网络,主要包含以下一些缺陷:

1)由于学习速率是固定的,因此网络的收敛速度慢,需要较长的训练时间。而这种长时间和不确定的训练过程,对于一个比较简单的问题,有的时候需要几百甚至上千次的学习才能收敛。对于复杂的问题,可能需要更长的时间来训练这个网络。

2)BP算法可以使权值收敛到某个值,不能保证收敛到全局最小值,容易陷入局部极小值。

3)网络麻痹现象。在训练过程中,加权调得较大时,可能迫使所有的或大部分节点的加权和输出较大,从而工作在S型激发函数的饱和区,此时激发函数的导数处于非常小的区域。由于在计算权值修正量的公式中,各层误差正比于激发函数的导数,当导数趋于0时,各层误差趋向于0,相当于调节过程停滞。容易造成网络达不到指定的误差,训练不出来 。

4)网络隐含层的层数及每层的节点数的选取尚无理论上的指导,而是根据经验 确定。因此,网络往往有很大的冗余,无形中增加了网络学习时间。

5)网络的学习、记忆具有不稳定性。一个训练结束的BP网络,当给它提供新的记忆模式时,将使已有的连接权打乱,导致已经记忆的学习模式的信息消失。要避免这种现象,必须将原来的学习模式连同加入的新模式一起重新进行训练,而且要求新加入的模式的特征数目与原模式特征数目相同。

为了拟制迭代过程的振荡,可以在每次对连接权进行校正时,按一定比例加上前一次学习时的校正量,即增加附加动量项。这样连接权变为:

Wij(N+1)=Wij(N)+ β*ejk*αik+η*ΔWij(N)

式中β为学习速率,η为动量因子,ΔWij(N)为第N次迭代时权值变化量。由上式可知,N+1次迭代时,权值的调整量与第N次迭代相关,由于样本群的各样本间相关性很强,前一个样本的学习结果为下一个样本所用,这样可以加快收敛速度。

连接权校正量与中间层的输出有关。因此,当中间层的输出为0或1时,连接权校正量为0,不起校正作用。中间层的输出是由S函数的输出所决定的,由S函数的饱和非线性输出特性可知,当其输入小于或大于某一数值后,其输出接近于0或1。因而在相当次数的学习过程中,真正的校正量很小,校正速度十分缓慢。为此,要限制S函数的输出,当S函数的实际输出小于0.01或大于0.99时,将其输出值直接取为0.01或0.99。这样保证了每次学习都能进行有效的校正,从而加快收敛速度,可以很大程度避免网络的麻痹现象。

4 结论

人脸识别是一个困难的研究课题, 目前还处于探索阶段。本文利用BP神经网络学习能力强、分类能力强的优点, 实现了人脸特征提取和识别。虽然BP网络在实际应用过程中存在一定的缺陷,但是对BP算法的改进则进一步加快了收敛速度,提高了识别的正确率。

参考文献:

[1] 周志华,曹存根.神经网络及其应用[M].北京:清华大学出版社,2004.

[2] Bledsoe W W.The Model Method in Facial Recognition[C].Tech. Rep. PRI:15,Panoramic Research Inc.,Palo Alto,CA,1964.

神经网络的认识范文第4篇

关键词:BP神经网络;三维加速度;特征值提取

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)51-0197-02

随着物联网的高速发展,智慧医疗的应用也越来越广泛,人体行为识别作为智能监测中一个重要的研究方向,也逐渐受到各国学者的广泛关注。随着我国人口老龄化不断加剧,老年人意外摔倒问题受到人们关注,而人体行为识别方法的研究将推进更有效更准确的跌倒检测算法研究。按照信号的获取方式,可将现有的人体行为识别方法分为以下两种:基于计算机视觉的方法和基于传感器的方法。基于三轴加速度信号的识别方法属于第二种,第二种方法相较于第一种具有低功耗、高精度、携带方便等优点。目前BP神经网络是目前人工神经网络中研究最深入、应用最广泛的一种。本文选用已有的三轴加速度信号数据集,在MATLAB仿真环境下,基于BP神经网络设计并实现人体行为识别算法。

一、数据预处理

本文选用的三轴加速度数据来源于南加州大学人体行为数据集,这个数据集包括了对14名受测者的12种动作的三轴加速度信号采集。采集过程中,三轴加速度传感器位于受测者右前臂;采样频率为100Hz;12种动作每种动作由每名受测者做5次,即对每种动作采集70个样本,每个样本采集时长不定但是足够捕获动作的所有信息。考虑实际意义,本文只选取上述14名受测者的7类动作,共计490个加速度数据样本。在特征值提取前需要对滤波得到的加速度数据再进行加窗处理。选用窗口长度N为512的矩形窗,则结合采样频率可得窗口时间跨度为5.12秒,足够包含单个完整动作。经过预处理后的数据才可以用于后续的特征值的提取,并用来训练和测试所建立的BP神经网络。

二、BP神经网络的建立

BP神经网络由输入层、输出层和隐含层组成,其中输入层与输出层各为一层,隐含层可以有多层。在网络中,相邻两层间实现全连接,而处于同一层的神经元之间无连接。BP学习算法需要提供教师信号。BP网络的学习过程包括工作信号的正向传播和误差信号的反向传播,并通过修改连接两个神经元的边的权值来使得误差函数达到最小。①工作信号的正向传播。设X■■表示第k层神经元i的输入总和,Y■■为输出,第k-1层神经元j到第k层神经元i的权值为Wij,则有如下函数关系:Y■■=f(X■■)X■■=■W■Y■■ (1)

称f激励函数,通常取f为非对称Sigmoid函数,即 f(X■■)=■ (2)

②误差信号的反向传播。设输出层为第m层,则输出层第i个神经元的实际输出为Y■■,设对应的教师信号为Yi,定义误差函数e为 e=■■(Y■■-Y■)■ (3)

定义d■■表示误差函数e关于U■■的偏导数,可推得 当k=m时,有d■■=Y■■(1-Y■■)(Y■■-Y■)(4)

k

③权值的修正。设某一次学习权值的修改量为ΔWij,考虑两次学习的相关性,可定义权值修改量如下:

ΔWij(t+1)=-μ・d■■・Y■■+γ・ΔWij(t)(6)

其中,γ为表示两次修正间的相关程度的系数, μ为学习速率。综上,BP神经网络的学习目标就是:找一组最合适的边的权值Wij,使得误差函数满足 e=min■■(Y■■-Y■)■ (7)

三、BP神经网络结构设计

1.输入层。BP神经网络的输入即为各种行为的特征向量,因此首先需要选取合适的特征值构建特征向量。根据统计学原理和所选加速度信号数据集的特征,选取5个特征值:均值、方差、相关系数、偏度和峰度。5个特征值均以窗长N为提取单位,特征值的计算直接使用MATLAB已有的函数。以窗长为单位,分别计算三个轴的加速度信号的上述5种特征值,一次特征值提取可得到一个15维的特征向量,将此向量作为BP神经网络的输入,则输入层可有15个神经元。

2.隐含层。隐含层待定的系数包括隐含层的层数和每个隐含层包含的神经元个数。为提高学习速率,通常选用单隐层的神经网络,但为获得更好的学习效果,本文考虑单隐层以及双隐层的BP神经网络。

关于隐含层神经元的个数n1选取,本文参考公式如下:n■=■+p (13)

其中,n0为输入层神经元个数,nm为输出层神经元个数,p为[1,10]之间的一个常数。在利用上述公式估算的基础上,根据网络学习的结果对隐含层神经元个数再做调整,以达到最好的学习效果。

3.输出层。神经网络的输出层表示人体行为识别的结果,即判断该动作属于哪一类。根据所研究的7类动作,可以构造一个7维的输出向量。每一个输出向量对应每一次输出,向量的每一维对应每一类动作。若输入特征值来源于第Z类动作,则期望的输出向量为第Z维置“1”,其余维置“0”,而实际的输出向量的7个维度的数值分别代表属于7种动作的可能性大小,取数值最大的维度为分类结果。

神经网络的认识范文第5篇

【关键词】美尔倒谱特征;BP神经网络;说话人识别

1.引言

说话人识别技术是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。说话人识别技术的核心是通过预先录入说话人声音的样本,提取说话人的语音特征并保存在数据库中,应用时将待验证的声音与数据库中的特征进行匹配,从而决定说话人的身份。

说话人特征主要有美尔倒谱系数(MFCC),线性预测系数(LPC),线性预测倒谱系数等(LPCC),识别模型主要有矢量量化技术(VQ),动态时间规整模型(DTW),隐马尔科夫模型(HMM),和人工神经网络(ANN)。它们用于语音识别的不同场合,各有所长。NN就是模仿人脑工作方式而设计的一种机器,可以用软件在计算机上仿真;NN能够通过学习,获取知识并解决问题。BP算法成为目前应用最为广泛的神经网络学习算法BP网络在函数逼近、模式识别、数据压缩等领域有着广泛的应用。

2.MFCC特征提取

人的听觉系统是一个特殊的非线性系统,他对不同频率信号的响应基本上是一个对数关系,美尔倒谱系数应够充分利用人耳这种感知的特性。实验发现,在1000Hz以下,感知能力与频率成线性关系,但在1000Hz以上时,主观心理感知能力与频率成对数关系,Mel频率和普通频率的对应关系是:

MFCC参数的提取分为预处理(采样/量化、数字滤波、预加重处理、加窗)和特征提取(包含求倒谱),流程图如图1所示。

图1 MFCC特征提取流程

其算法流程为:

(1)首先确定每一帧语音采样序列的点数,本文取N=256点。对每帧序列进行预加重处理后再经过离散FFT变换,取模的平方得到离散功率谱。

(2)计算通过M个带通滤波器后所得的功率值,即计算和在各离散频率点上乘积之和,得到M个参数:

(3)计算自然对数,得到:

(4)对离散余弦变换,得到。

(5)舍去代表直流成分,取作为MFCC参数,本文中K=16。

语音的信息大多集中在低频部分,而高频部分容易受到环境噪声的干扰。MFCC参数强调语音的低频信息,从而突出了有利于识别的信息,屏蔽了噪声的干扰。

3.BP神经网络的建立和训练

设计一个三层BP神经网络,如图2所示。其中Input表示网络的输入,网络输入的个数是语音帧的MFCC特征向量(输入向量)P,本文MFCC特征取16,P的维数为40*16。Layer是输入层到隐含层和隐含层到输出层各神经元的权值矢量,表示输入与神经元间的连接强度;第一层(隐含层)神经元的数目设计为37;第二层(输出层)神经元的个数根据待识别说话人数设计。

图2 识别神经网络的结构

对设计好的网络进行识别时,要考虑到以下几点:(1)使网络具有较强的泛化能力,应对说话人语音帧进行过零率检测,将MFCC特征进行归一化;(2)对同一人的不同发声语音段进行训练,提高神经网络的识别能力;(3)对噪声的稳健训练,为了提高神经网络抑制噪声的能力,应采用理想样本数据和含有不同程度噪声的样本数据同时对网络进行训练。

设置网络的性能函数和主要训练参数:网络训练目标误差为0.1,训练步数为5000;显示训练结果的间隔步数为50。图3是某次训练的训练误差变化曲线,由图3可知,该次训练中,当网络训练到520步时,网络性能达标,即目标误差达到0.1,训练停止,此时网络的权值和阈值调节到了最佳状态。分别用同一说话人的含有不同程度噪声的训练样本对网络进行训练,每次训练网络都有很好的收敛性。

图3 训练误差变化曲线

对训练好的网络进行仿真识别,将测试语音段输入,即可得出结果。表1是网络经过多次训练识别,对3说话人3位输出,8说话人8位输出,8说话人3输出说话人进行识别的仿真结果。

表1 Matlab识别仿真结果

说话人数 输出层神经元个数 识别率

3说话人 3 99.75%

8说话人 8 95%

8说话人 3 85%

4.结论

(1)MFCC特征提取和BP神经网络相结合,是可以实现说话人识别的。

(2)降低训练样本维数的措施,对训练样本进行主元分析,可以有效地降低训练样本的维数。

(3)随着说话人数量的增多,识别效果有一定的下降。识别人数相同,输出层神经元个数也影响识别效果。

(4)由于说话人的语音样本不充足和样本录制时噪音干扰,对识别效果有一定影响。

参考文献:

[1]徐波.语音识别技术与应用的发展趋势[J].中国计算机协会通讯,2008,2:54-57.

[2]张军英.说话人识别的现代方法与技术[M].西安:西北大学出版社,1994.