前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇人工神经网络的起源范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
关键词 BP网络;客车备件;需求预测
中图分类号 F426 文献标识码 A 文章编号 1673-9671-(2012)102-0195-01
客车备件需求是售后服务的基础和重要组成部分。产品备件准备的是否合理,不仅关系到售后服务的质量,而且也关系到企业的经营效率。然而,准确的备件预测是相当困难的。一方面,影响备件需求量的因素很多,例如产品的市场保有量、产品的地理分布及使用状态、备件的生命周期、备件通用度等等。另一方面,需求预测具有很强的时效性和复杂性,各种因素的影响力随环境变化而变化。
目前国际上采用多种方法进行需求预测的应用研究,如增量法、回归法、季节指数法、时间序列法等。但在备件需求预测方面的实际效果却不尽如人意。起源于二十世纪八十年代的人工神经网络(ANN)属于人工智能技术之一,突破了传统技术的局限,在诸多领域取得了成功。近年来,ANN技术已经成为经济预测、管理决策领域的研究热点,并已经成功的运用在非线性领域以及识别、智能传感器等工程领域。
但在汽车和客车备件需求预测领域,很少见到采用该方法进行研究的案例,因此,本文着重研究神经网络在客车备件需求预测领域的应用。
1 人工神经网络基本理论
1.1 人工神经网络概述
人工神经网络(Artificial Neural Network,简称ANN)的研究始于20世纪四十年代初期。经过半个多世纪的兴衰,经历了从兴起到又到萧条最终走向稳步发展的艰难路途,如今人工神经网络已经是一门比较成熟的学科了。特别是经过最近将近20年的发展,目前的人工神经网络是一门融汇了神经学、信息学、计算机科学、工程学等为一体的边缘交叉学科,是一种大规模、并行、复杂的非线性系统。人工神经网络具有高度并行的处理机制,高度灵活的拓扑结构,以及强大的自组织、自学习、自适应能力和处理非线性问题的能力。因此,人工神经网络在预测科学领域得到了高度重视。
至今为止,人工神经网络技术的发展大致经历了五个阶段,其研究集中在三个方面:开发现有模型的应用,并在应用中根据实际运行情况对模型、算法加以改造,以提高网络的训练速度和运行的准确度;希望在理论上寻找新的突破,建立新的专用或通用的模型和算法;进一步对生物神经系统进行研究,不断的丰富对人脑的认识。
人工神经网络模拟人脑的功能,虽然只是低级近似,但区别于一般的人工智能和其他计算机智能程序,它表现出的许多特质与人类的智能相似。同人类的大脑类似,单个神经元功能很弱,但是当成千上万的神经元组合起来所表现出的活动处理功能却十分强大。
1.2 人工神经网络模型
人工神经网络是由大量的神经元按照层内连接、循环连接和层间连接等模式相互连接起来而构成的。将一个神经元的输出送至另一个神经元作为输入信号称之为连接,每个连接通路对应一个连接权值,神经元的连接方式不同会生成具有不同特性的神经网络。经过几十年的探索,目前已经提出了上百种人工神经网络结构,但大部分都是几种典型网络的组合和变形。
根据神经元的连接方式不同这一特点,可将神经网络分为两大类:分层网络和相互连接型网络。分层网络的代表是BP网络、RBF网络和Hopfield网络。
1.3 BP神经网络
目前应用最为广泛的神经网络结构是多层前馈神经网络。由于采用的网络结构、传递函数和学习规则的不同,前馈网络主要有感知神经网络、BP网络(Back Propagation Network)、RBF网络等不同网络模型。上述三种网络各有其优缺点,经对比得知,BP网络相比其他网络具有算学习精度高、运行速度很快、网络具有一定的推广能力和概括能力等多方面优点。
因此,我们决定采用BP网络作为客车备件需求预测的神经网络模型。
2 基于BP网络的客车备件需求预测设计
2.1 客车备件需求预测方法设计
2.1.1 模型输入和输出设计
本文选取对配件需求量影响程度大的三个因素即近期实际需求量(6个月的实际需求值)、季节性因素以及客车保有量作为网络的输入,分别将其量化后得到8个点作为神经网络的输入向量。显而易见,目标向量Y就是某配件预测月当月的需求量。
2.1.2 数据归一化
在本研究过程中,除了季节性因素值X7已经提前设置在0~1之间,其余各变量都应按照上式进行归一化处理;在网络训练完毕进行测试时,还要将预测输出结果进行反归一化处理并与实际值进行比较来对网络进行评价。
2.2 BP网络结构设计
本研究选择三层BP网络即单隐层的BP网络进行设计仿真。本文使用Kolmogorov定理和试凑法相结合的方法,经多次试验和结果比较,选择网络误差最小和训练速度最快时对应的隐层节点个数,最终确定隐层神经元个数为17。
针对本文研究的问题,按照BP网络的一般设计原则,中间层神经元的传递函数设定为S型正切函数tansig()。由于网络的输出向量值已经被归一化到区间[0,1]中,因此,输出层神经元传递函数设定为 S型对数函数logsig()。
网络的训练算法对网络收敛速度、泛化能力、网络性能等有很大影响。经过对几种改进的BP算法进行实验对比,观察各算法的收敛速度和网络误差,最终确定最适合本研究的训练算法为“拟牛顿算法”。
2.3 预测实现和结果对比
本文选取某大型客车制造企业的售后备件进行研究,选取高频需求备件中的两种数据归一化后作为样本数据进行实验。根据设计好的网络结构方案进行网络创建和训练仿真。使用train()函数对两种备件分别进行训练。经过35次和44次训练后,网络目标误差达到要求。
使用训练好的模型开始对其余样本数据进行预测,实际结果说明,网络的预测误差范围在±7%之内,已达到客车领域备件需求预测预期目标。
在将网络测试结果与实际值比较的同时,我们也将它与该企业目前采用的时序预测方法进行对比,结果说明利用神经网络进行备件需求预测的效果明显好于传统方法。
参考文献
[1]张立明.人工神经网络的模型及其应用[J].复旦大学出版社,1993:5.
[2]丁杏娟.基于人工神经网络的产品需求预测研究[J].上海交通大学硕士学位论文,2006:1.
[3]王万森.人工智能原理及其应用[J].电子工业出版社,2000:27-51.
33岁的加拿大发明家黎忠(Le Trung),花光自己所有积蓄,制造了一个名为“爱子”的女性机器人。黎忠称,“爱子”是科技与美丽邂逅的产物,她“年方”20多岁,正值青春妙龄,身材苗条,相貌姣好。她总是乐于打扫房间,帮助黎忠记账,而且知道他爱喝什么。每天早上,“爱子”都为黎忠读报,开始新的一天。她可以用女性温柔的声音告诉黎忠当天的天气状况,比如:“户外是零下2℃”。“爱子”全身关键部位布满传感器,脖子上还有一个摄像头,这样她就可以具备触觉、视觉和听觉。爱子可以对挠痒和触摸做出反应,能够认人。可以用英语和日语说1.3万句话。她可以点头,手也可以动。如果有人粗鲁地触碰她,她就会愤怒地大声叫喊。即使黎忠轻轻地拍她的头,她也会说:“摸女孩的头可不好,摸你自己的头。”她甚至会扇“骚扰者”的耳光。很有趣,对吧?看来找个机器人做女友并非遥不可及。
虽然这个“爱子”还没有“智能”到《i,Robot》中的Sunny或《Wall・E》中的瓦力那样具有情感并自主思考,但她所具备的功能却足以让人大吃一惊了。那么,她为何会具有这些看起来非常“人性化”的特征呢?这一切还得从人工智能说起。
关于人工智能
人工智能(ArtificialIntelligence,AI)是计算机学科的一个分支,二十世纪七十年代以来被称为世界三大尖端技术之一(空间技术、能源技术、人工智能)。人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。人工智能将涉及到计算机科学、心理学、哲学和语言学等学科。可以说几乎是自然科学和社会科学的所有学科,其范围已远远超出了计算机科学的范畴。从思维观点看,人工智能不仅限于逻辑思维,要考虑形象思维、灵感思维才能促进人工智能的突破性的发展,数学常被认为是多种学科的基础科学,数学也进入语言、思维领域,人工智能学科也必须借用数学工具,数学不仅在标准逻辑、模糊数学等范围发挥作用,数学进入人工智能学科,它们将互相促进而更快地发展。近年来人工智能技术获得了迅速的发展,在很多学科领域都得到应用和发展。
随着计算机及网络技术的不断发展,许多原来无法完成的工作现在已经能够实现。目前人工智能研究的未来发展方向是智能接口、数据挖掘、主体及多主体系统。其中多主体(Multi-Agent)技术是近年来发展迅猛并在科研和工程技术领域不断取得应用成果的重要研究方向。主体(Agent)与多主体(Multi-Agent System,MAS)系统的概念起源于人工智能领域,是分布式人工智能的主要方向之一。Agent具有自治性、可通信性、反应性、面向目标性和针对环境性等特性。
咱治性:即对自己的行为或动作具有控制权,无须外部干预,自主地完成其特定的任务;
・可通信性:每个Agent在有组织的群体中,通过相互通信接受任务指派和反馈任务执行的信息;
・反应性:Agent应具备感知环境并做出相应动作的能力;
・面向目标性:对自己的行为做出评价并使其逐步导向目标;
・针对环境性,Agent只能工作在特定的环境中。
典型的智能控制系统通常采用分层控制结构,对整个系统进行分散递阶控制,它将整个系统分为组织层、协调层和响应层。每层均由完成相应任务的Agent组成。响应层Agent对自的子系统进行控制,并向协调层反馈信息;协调层则根据反馈的信息和组织层的指令协调响应层Agent的执行过程;组织层从全局的角度对整个系统进行分析,并向低层Agent发送指令。常见的MAS的体系结构主要有Agent网络、Agent联盟以及“黑板”结构。Agent的任务执行机制是指系统对每个Agent分配了不同角色,各自独立地执行一定的任务,Agent之间遵循民主协商原则和独立自治的原则。
MAS是在单Agent理论的基础上发展起来的,它由一组具有自主性、适应性、反应性和社会性的Agent组成,拥有较单Agent更多的资源和知识以及更强的处理能力,是分布式人工智能(Distributed Artificial Intelligence,DAI)在最近的研究中提出的一项新技术。主要应用在对现实世界和社会的模拟、机器人以及智能机械等领域。
机器人的历史其实并不算长。1959年美国英格伯格和德沃尔制造出世界上第一台工业机器人,至此机器人的历史才真正开始。近百年来发展起来的机器人,大致经历了三个成长阶段,即三个时代。第一代为简单个体机器人,第二代为群体劳动机器人,第三代为类似人类的智能机器人,它的未来发展方向是有知觉和思维,能与人对话。第一代机器人属于示教再现型,第二代则具备了感觉能力,第三代机器人是智能机器人,它不仅具有感觉能力,而且还具有独立判断和行动的能力。当机器人与人类生活接触更多时,我们可以发现机器人已渐渐摆脱冰冷的机械外观,研究人员也正设法让机器人具有人类般的感知能力,如视觉、听觉、触觉甚至情绪传感,并能有相对应的回应等。除TX形机器人,机器人的发展方向更将无限广阔。
智能机器人未来还能朝模仿生物的形态与功能的“仿生学”方向发展。譬如,美国国防先进研究计划局赞助航空环境公司研究“黑寡妇”机器人,希望利用15公分长的小型仿真蜘蛛飞行器侦测到卫星也无法拍摄到的细节,伯克利大学正在研究灰尘般大小的微形机器人,只要散布在空气中就能让一个个微小感应器串联成网络;黏在指尖上,不用键盘就可直接操作计算机的机器人,以及撒在冰箱内就能监控食物新鲜程度的“智能型灰尘”。
展望未来,机器人将不只是劳工、手术助理、指挥家、清洁人员和宠物,只要人类的想像力源源不绝,智能机器人也将为我们的生活带来无限惊喜。
什么技术让机器人更智能?
1 模式识别
所谓模式,从广义上说,就是事物的某种特性类属,如:图像、文字、语言、符号等感知形象信息;雷达、声纳信号、地球物探、卫星云图等时空信息动植物种类形态、产品等级、化学结构等类别差异信息等等。模式识别是研究如何使机器具有感知能力,主要研究视觉模式和听觉模式的识别。如
识别物体、地形,图象、字体(如签字)等。在日常生活各方面以及军事上都有广大的用途。近年来迅速发展起来应用模糊数学模式,人工神经网络模式的方法逐渐取代传统的用统计模式和结构模式的识别方法。特别神经网络方法在模式识别中取得较大进展。代表性产品有光学字符识别系统(Optical CharacterRecognition,OCR)、语音识别系统等。计算机识别的显著特点是速度快、准确性和效率高。识别过程与人类的学习过程相似。
最近我国研制成功的无人驾驶系统,就标志着我国研制高速智能汽车的能力已达到当今世界先进水平。汽车自主驾驶技术是集模式识别、智能控制、计算机学和汽车操纵动力学等多门学科于一体的综合性技术,代表着一个国家控制技术的水平。自主驾驶系统采用计算机视觉导航方式,并采用仿人控制,实现了对汽车的操纵控制。
除此之外,指纹识别系统也是模式识别技术的一个具体应用。利用模式识别技术已成功建立了利用指纹灰度图像计算纹线局部方向、从而提取指纹特征信息的算法,这一研究成果不仅适于民用身份鉴定也适用于公安刑事侦破的指纹鉴定。目前各地已经建立指纹库,而检索一枚现场指纹仅需4分钟时间。
2 专家系统
专家系统是依靠人类专家已有的知识建立起来的知识系统,目前专家系统是人工智能研究中开展较早、最活跃、成效最多的领域,广泛应用于医疗诊断、地质勘探、石油化工、军事、文化教育等各方面。它是在特定的领域内具有相应的知识和经验的程序系统,它应用人工智能技术、模拟人类专家解决问题时的思维过程,来求解领域内的各种问题,达到或接近专家的水平。随着计算机科学技术整体水平的提高,分布式专家系统、协同式专家系统等新一代专家系统的研究也发展很快。在新一代专家系统中,不但采用基于规则的推理方法,而且采用了诸如人工神经网络的方法与技术。
根据专家系统处理的问题的类型,把专家系统分为解释型、诊断型、调试型、维修型、教育型、预测型、规划型、设计型和控制型等10种类型。为了实现专家系统,必须要存储有该专门领域中经过事先总结、分析并按某种模式表示的专家知识库,并拥有解决实际问题的推理机制。系统能借此做出决策和判断,其解决问题的水平达到或接近专家的水平,因此能起到专家或专家助手的作用。例如血液凝结疾病诊断系统、电话电缆维护专家系统、花布图案设计和花布印染专家系统等等。
3 人工神经网络
人工神经网络(Artificial NeuralNetwork,简称ANN)是模拟生物神经元的结构而提出的一种信息处理方法。它是一种非线性映射的方法,很多难以列出方程式或难以求解的复杂的非线性问题,应用神经网络方法则可迎刃而解。在人工神经网络中,信息的处理是由神经元之间的相互作用来实现的,知识与信息的存储表现为网络元件互连间分布式的物理联系,网络的学习和识别取决于和神经元连接权值的动态演化过程。人工神经网络由大量简单的基本元件一一神经元(neuron)相互连接而成的自适应非线性动态系统,神经元是神经网络的基本处理单元,它一般是一个多输入单输出的非线性动态系统,其结构模型如所示。其中为神经元内部状态,为阈值,为输入信号,表示从输入到的联结权值。
一个人工神经网络的神经元模型和结构描述了一个网络如何将它的输入矢量转化为输出矢量的过程。这个转化过程从数学角度来看就是一个计算的过程。也就是说,人工神经网络的实质体现了网络输入和其输出之间的一种函数关系。通过选取不同的模型结构和激活函数,可以形成各种不同的人工神经网络,得到不同的输入/输出关系式,并达到不同的设计目的,完成不同的任务,所以在利用人工神经网络解决实际应用问题之前,必须首先掌握人工神经网络的模型结构及其特性以及对其输出矢量的计算。
多年来,人工神经网络的研究取得了较大的进展,成为具有一种独特风格的信息处理学科。当然目前的研究还只是一些简单的人工神经网络模型。要建立起一套完整的理论和技术系统,需要做出更多努力和探讨。然而人工神经网络已经成为人工智能中极其重要的一个研究领域。在人工神经网络的实际应用中,绝大部分的神经网络模型是采用反向传播(BP)网络和它的变化形式,它也是前向网络的核心部分,并体现了人工神经网络最精华的部分。多层BP网络结构包括输入节点、输出节点,一层或多层隐节点。
BP网络适宜于处理具有残缺结构和含有错误成分的模式,能够在信源信息含糊、不确定、不完整,存在矛盾及假象等复杂环境中处理模式。网络所具有的自学习能力使得传统专家系统技术应用最为困难的知识获取工作转换为网络的变结构调节过程,从而大大方便了知识库中知识的记忆和抽取。在许多复杂问题中(如医学诊断),存在大量特例和反例,信息来源既不完整又含有假象,且经常遇到不确定信息,决策规则往往相互矛盾,有时无条理可循,这给传统专家系统应用造成极大困难,甚至在某些领域无法应用,而BP网络技术则能突破这一障碍,且能对不完整信息进行补全。根据已学会的知识和处理问题的经验对复杂问题作出合理的判断决策,给出较满意的解答,或对未来过程作出有效的预测和估计。这方面的主要应用是:自然语言处理、市场分析、预测估值、系统诊断、事故检查、密码破译、语言翻译、逻辑推理、知识表达、智能机器人、模糊评判等。
人工神经网络是未来人工智能应用的新领域,情感是智能的一部分,而不是与智能相分离的,因此人工智能领域的下一个突破可能在于赋予计算机情感能力。情感能力对于计算机与人的自然交往至关重要。
目前AI研究出现了新的,这一方面是因为在人工智能理论方面有了新的进展,另一方面也是因为计算机硬件突飞猛进的发展。随着计算机速度的不断提高、存储容量的不断扩大、价格的不断降低以及网络技术的不断发展,许多原来无法完成的工作现在已经能够实现。目前人工智能研究的3个热点是:智能接口、数据挖掘、主体及多主体系统。
毋庸置疑,未来的机器人与人类社会的生活更为密切地结合起来,以为人做出更多的服务作为要素。研究内容主要包括餐饮服务多机器人系统、竞技与娱乐多机器人系统、家庭生活支援多机器人系统及其关键技术的研究、系统集成试验验证和示范应用。
1 餐饮服务多机器人系统
设计规划智能餐饮服务模式、研究和突破机器人自动烹饪工艺及烹饪方法、智能餐饮多机器人间的交互及安全操作等关键技术,研制开发由迎宾/点菜、烹饪、送菜机器人组成的智能餐饮服务多机器人系统,实现以机器人为主的餐厅服务系统集成和示范应用。这样,我们通过点菜系统输入喜欢的菜品。就可以在家里尽享五星级服务了。
2 竞技多机器人系统
研究竞技与娱乐机器人的复杂动作的运动规划与控制、高速视觉识别与伺服控制、多机器人间的协调控制等关键技术,研制以仿人机器人为核心的武术,足球等竞技与娱乐多机器人系统,实现多机器人的协同武术表演与足球比赛、机器人与人的互动娱乐(图9)。足球机器人就由四个部分组成,即视觉系统、通讯系统、计算机系统及移动装置等,在赛场上可以实现自主踢球,不受外界控制。
3 家庭生活支援多机器人系统
研究基于网络的机器人远程监测与遥操作、自主导航与规划技术、家政多机器人协调作业等关键技术,构建面向家居监控、家庭辅助作业等家庭生活支援多机器人系统,实现家庭设备的远程遥控与监测、家庭辅助作业等功能。未来家庭机器人正朝着实用型的方向发展,一个合格的家庭机器人,还应当具备多项技能。例如检测到家中有异常情况时,可将住宅内的情形通过图片形式发送到主人手机或个人电脑上。并能兼保姆和秘书,早上叫醒你,提醒你一天的日程安排,并转达当天的电话留言等等。你将再也不必因为忘了老婆的生日或结婚纪念日而挨训了。
Abstract: The factors influencing the sports scores are a lot. The traditional sports predicted method is difficult to obtain satisfactory results. According to the correlation between specific performance and quality training level of long jumper, based on the powerful nonlinear mapping ability of BP neural network, the paper builds the neural network model of long jumper's specific performance. The model makes up for the deficiency of traditional forecasting methods, and makes full use of the information contained in the data, and compared with the traditional prediction method, the accuracy of the prediction results have greatly improved. The paper puts forward a new thought and method to solve the problems that is difficult to solve by using traditional mathematical methods, providing a theoretical basis for scientific training for athletes.
关键词: BP神经网络;跳远运动员;专项成绩;预测精度
Key words: BP neural network;long jump athletes;special scores;prediction accuracy
中图分类号:TP31 文献标识码:A 文章编号:1006-4311(2013)03-0178-03
0 引言
影响体育竞赛成绩的因素很多,最主要的是运动员的体质,但同时运动员的体形、技术特点、心理状态及外界环境等都会在一定程度上影响运动员的竞技成绩[1-2]。传统的预测方法虽然在一定程度上能够利用运动员个人的训练指标对专项成绩进行预测,从而指导运动员的日常训练,但是这些模型都有比较苛刻的条件限制和使用范围,如在利用多重线性回归模型进行预测时,专项成绩与各相关因素之间需要服从正态性、方差齐性、多重线性关系等严格的条件,而灰色系统预测模型属于线性建模,在短期预测精度上有一定效果,而对于复杂的非线性关系时,单纯的灰色预测就很难获得一个可接受的预测误差[3]。但是,实际上专项成绩与各素质训练水平之间可能存在复杂的非线性函数关系,很难满足传统预测模型的条件限制,因此,使用多重线性回归或灰色系统等传统模型对运动员的专项成绩进行预测可能会存在较大误差,导致模型的预测精度降低,从而显示出不合理的特征[4-6]。
与传统的预测方法相比,BP神经网络的应用没有严格的条件限制,变量间不需要满足线性、独立性、正态性、方差齐性等条件,该网络具有自组织、自适应及容错性强等特点,从而可以有效的进行数据间的非线性映射,当传统预测模型无法达到目的或者预测效果不好时,使用此模型往往会达到很好的预测效果。
1 研究对象
部分国内一流水平的跳远运动员,国家健将。
2 研究方法
人工神经网络是由大量的处理单元相互连接而组成的信息处理系统,具有非线性、自适应等特点。神经网络起源于现代神经科学的研究成果,其主要目的是尝试通过模拟大脑神经网络处理及记忆信息的方式来进行信息处理。人工神经网络是并行分布式系统,采用了与传统人工智能和信息处理技术完全不同的原理,克服了传统的基于逻辑符号的人工智能在处理直觉、非结构化信息方面的缺陷, 具有较好的容错和抗干扰能力以及具有记忆、联想、自适应和良好的鲁棒性等一系列优点[7]。
BP神经网络,即反向传播,是目前应用比较多的一种。其基本思想是使用梯度搜索理论,使网络实际输出与期望输出的差值的均方达到最小。输入变量Xi通过中间节点影响输出节点,经过复杂的非线性变换过程,生成输出变量Yk,当反应变量与模型的输出变量之差大于事先设定的误差标准时,模型重新设置各层的权值,重新建立模型,直到误差值小于事先设定的误差时训练停止。BP神经网络的计算流程图如图1所示。
3 预测专项成绩的BP神经网络模型
3.1 模型自变量的筛选 由于各项素质训练指标与专项成绩之间的关联强度不同,对于专项成绩预测的影响系数也会不同。需要筛选出对运动员专项成绩影响较大的素质训练指标。利用2008-2009年国家体育总局收录的跳远运动员历史数据信息,对跳远运动员各素质训练指标与专项成绩做相关性分析,计算出各自相关系数(r),结果见表1。由表1可知,运动员的立定三级跳、30米跑、离板瞬间重心腾起初速度、最后5米助跑速度及100米跑等五项素质训练指标与专项成绩之间的相关系数均较大,选取这五项素质训练指标作为运动员专项成绩的预测因子。
3.2 BP神经网络预测模型的建立
3.2.1 网络结构的确定 建立神经网络模型的基础是确定神经网络的结构。Kolmogorov定理指出[8-9],给定任一连续函数f:[0,1] IRJ,f可以精确地用一个三层BP神经网络来实现,此网络的输入层有I个神经元,中间层有2I+1个神经元。本研究选取五个与运动员专项成绩关系密切的预测因子,需要设定五个输入神经元,按照Kolmogorov定理,选用一个隐含层,设定其神经元的个数为11个。输出层为收录的专项成绩数据。
3.2.2 网络的学习 以选定的五项素质训练指标以及专项成绩数据作为训练样本(数据见表2),其中五项素质训练指标数据作为预测因子进行输入,对应的专项成绩作为输出数据。由于BP神经网络模型对(0,1)之间的数最敏感,因此需要将原始数据进行归一化处理,将其归一化到(0,1)范围。具体处理方式如下:x■■=■
其中,xi为原始值,x■■为归一化后的值,Xmin和Xmax分别表示最小值和最大值。把归一化后的数据输入BP神经网络,对训练样本进行学习,使网络输出误差减少到可接受的程度,从而最好的形成训练素质指标与专项成绩之间的映射,以实现对跳远用动员专项成绩的精确预测。由于神经网络要解决的是一个复杂的非线性化问题,学习的计算过程相当复杂,本研究中运用SPSS19.0统计软件对BP神经网络实现训练学习。
3.2.3 BP神经网络模型的结果 选择跳远运动员2008年- 2009年的素质训练指标数据,首先进行归一化处理,之后将其代入训练好的神经网络模型中,通过软件的分析处理,得到了专项成绩的预测值。2008年-2009年的素质训练指标与专项成绩采用多元线性回归模型表达时,利用最小二乘法来拟合,获得的数学模型为:
y=0.35X1+0.2X2-0.18X3-0.26X4+0.29X5+7.68
X1、X2、X3、X4、X5分别代表了前面选定的素质训练指标,即跳远运动员的立定三级跳成绩、30米跑成绩、最后五米助跑速度、100米跑成绩及离板瞬间重心腾起初速度。
利用上述多重线性回归模型,计算得出2008年- 2009年运动员的专项成绩预测值。计算结果见表3。
由表3中的误差一栏可见,BP神经网络预测模型的预测误差远低于多元线性回归模型的预测误差。通过计算各种方法的误差值求出BP神经网络模型的平均相对误差为0.048,而多重线性回归模型的平均相对误差为0.188。说明神经网络模型的预测效果优于多重线性回归模型,BP神经网络模型更适于进行跳远运动员专项成绩的预测。
4 结束语
本文提出的基于BP神经网络的跳远运动员专项成绩预测方法,具有强大的非线性映射能力和泛化能力,克服了现有跳远运动员专项成绩预测方法的不足,即主观性、随意性,以及要事先确定预测模型的数学表达形式和苛刻的使用条件,具有较高的预测精度。为运动员安排合理科学的训练计划和运动员的选材提供依据,值得进一步探讨和研究。
参考文献:
[1]徐向军.对青少年田径运动员运动能力发展的影响因素探讨[J].首都体育学院学报,2001,13(2):60-62.
[2]FOREMAN K. The use of talent-predictive factors in the selection of track and field athletes [J] . In Gambetta V (Ed.) ,The Athletic Congress' s T rack and Field Coaching Manual , Champaign, IL: Leisure Press , 1989: 31-36.
[3]孙莉,翟永超.基于BP神经网络的服装面料规格参数预测[J].计算机应用与软件,2012,29(17):154-155.
[4]袁磊.世界优秀男子跳高运动员身体素质与专项成绩相关关系的递归神经网络模型构建[J].北京体育大学学报,2008,31(2):202-204.
[5] Guoli Wang, Jianhui Wu, Jianhua Wu, et al .A Comparison between the Linear Neural Network Method and the Multiple Linear Regression Method in the Modeling of Continuous Data[J]. Journal of computers, 2011,6(10):2143-2148.
[6]Jianhui Wu, Qi Ren, Houjun Xu, et al. Comparison of Modeling of Data with Different Variation Degree with BP Neutral Network[J]. Journal of Convergence Information Technology,2012,7(13):180-188.
[7]季苏,李晓新.基于神经网络模型的田径比赛预测[J].运动,2012(14):21-22.
关键词:计算智能 神经网络 模拟退火 模糊逻辑
1 概述
什么是计算智能,并没有确切的定义。如同人工智能一样,不同的人对计算智能有不同的理解。我们不必急于为计算智能下定义,更不必像争论“智能计算机”一样在名词上浪费时间,重要的是弄明白“计算智能”究竟包含哪些新思想。广义地讲,人工智能也是试图用计算机来实现人的智能,所以人工智能也可以看作计算智能。当加拿大的学者创办“计算智能”学术刊物时,人们只觉得增添了一种人工智能学报,并未仔细考虑这两者的区别。随着人工神经网络、遗传算法、进化程序、混沌计算等研究逐渐兴旺,而每年召开的人工智能学术会议,如AAAI(美国人工智能协会)等,又不太乐意接受这方面的论文与产品演示,从事上述研究的学者逐步组织自己的有相当规模的国际学术会议,取名为计算智能,似乎造成一种与人工智能分庭抗礼的局面。但从学术上讲,把计算智能看成人工智能研究的新方向也许更恰当[1]。
计算智能是在1994年IEEE举办的首届计算智能世界大会上提出的,它以连接主义和进化主义思想为基础,计算智能中的主要算法自适应的结构、随机产生的或指定的初始状态、适应度的评测函数、修改结构的操作、系统状态存储器、终止计算的条件、指示结果的方法、控制过程参数等共同要素,具有自学习、自组织、自适应的特征和简单、通用、鲁棒性强、易并行处理等特点,这些特征已被用于信息安全、模式识别、数据分类与挖掘、优化设计、故障诊断、机器学习、联想记忆和控制等领域[2]。本文从计算智能主要算法的角度来对计算智能的研究现状作分析。[2]
2 计算智能的主要算法
计算智能的主要算法有神经网络、模拟退火、模糊逻辑、遗传与演化算法、禁忌搜索算法、DNA软计算、人工免疫系统、蚁群算法、粒子群算法、多(Agent)系统等。
计算智能的算法虽然有很多种,但它们多是受自然或生物界规律的启迪,根据其原理、思想来模仿求解问题的算法。这样它们也就具有自然界或生物界的一些特性,同时它们通过长时间的发展变化,逐渐成熟,形成了自己独有的特点。下面对它们的共同特点作一个介绍:(1)它们大都引入了随机因素,具有不确定性。很多计算过程实际上是在计算机上作随机过程的模拟。比如著名的蒙特卡罗模拟。(2)它们大多具有自适应机制的动力体系或随机动力体系,并且在计算过程中体系结构还在不断作自我调整。(3)它们都是针对通用的一般目标而设计的,它们不同于针对特殊问题而设计的算法。(4)一些算法在低维或简单的情况下显得很笨,但是到了高维复杂的情形下具有很强的竞争力。[3]
3 主要的计算智能算法
3.1 人工神经网络
神经系统的基本构造是神经元(神经细胞),它是处理人体内各部分之间相互信息传递的基本单元。据神经生物学家研究的结果表明,人的一个大脑一般有1010―1011个神经元。每个神经元都由一个细胞体,一个连接其他神经元的轴突和一些向外伸出的其它较短分支――树突组成。轴突的功能是将本神经元的输出信号(兴奋)传递给别的神经元。其末端的许多神经末梢使得兴奋可以同时传送给多个神经元。树突的功能是接受来自其它神经元的兴奋。神经元细胞体将接受到的所有信号进行简单处理(如加权求和,即对所有的输入信号都加以考虑且对每个信号的重视程度――体现在权值上――有所不同)后由轴突输出。神经元的树突与另外的神经元的神经末梢相连的部分称为突触。
“人工神经网络”(artificial neural network:简称ANN)是在对人脑组织结构和运行机制的认识理解基础之上模拟其结构和智能行为的一种工程系统,是对人大脑神经细胞的简单近似的模拟。大量的神经元广泛互连而成的系统,它的这一结构特点决定着人工神经网络具有高速信息处理的能力。人脑的每个神经元大约有103―104个树突及相应的突触,一个人的大脑总计约形成1014―1015个突触。用神经网络的术语来说,即是人脑具有1014―1015个互相连接的存储潜力。虽然每个神经元的运算功能十分简单,且信号传输速率也较低(大约100次/秒),但由于各神经元之间的极度并行互连功能,最终使得一个普通人的大脑在约1秒内就能完成现行计算机至少需要数10亿次处理步骤才能完成的任务。
因为人工神经网络的结构特点和其信息存储的分布式特点,使得它相对于其它的判断识别系统,如专家系统等,具有另一个显著的优点:健壮性。生物神经网络不会因为个别神经元的损失而失去对原有模式的记忆。最有力的证明是,当一个人的大脑因意外事故受轻微损伤之后,并不会失去原有事物的全部记忆。人工神经网络也有类似的情况。因某些原因,无论是网络的硬件实现还是软件实现中的某个或某些神经元失效,整个网络仍然能继续工作。
因此ANN具有快速、并行处理、容错性强和自学习能力强等特点。几种典型的ANN为:多层感知网络、竞争型神经网络、Hopfield神经网络。
3.2 模拟退火
模拟退火(SA,simulated annealing)算法来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。根据Metropolis准则,粒子在温度T时趋于平衡的概率为e-ΔE/(kT),其中E为温度T时的内能,ΔE为其改变量,k为Boltzmann常数。用固体退火模拟组合优化问题,将内能E模拟为目标函数值f,温度T演化成控制参数t,即得到解组合优化问题的模拟退火算法:由初始解i和控制参数初值t开始,对当前解重复“产生新解计算目标函数差接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解,这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制,包括控制参数的初值t及其衰减因子Δt、每个t值时的迭代次数L和停止条件S。
模拟退火是一种全局优化方法,就是人为地引入噪声,使得当某算法陷入局部最优的陷阱时,而造成从该陷阱中逃脱的条件,进而再逐步减小噪声,以使得算法能停留在全局最优点。其实早在1965年,Khas就提出了这一想法,不过并未受到计算机科学与优化应用领域的足够重视。直到1983年,Kirkpatrick提出模拟退火算法,才引起了优化应用领域的重视,成为热点流行起来。它的特点主要有以下几个方面:(1)以一定的概率接受恶化解,在迭代过程中不仅接受使目标函数变“好”的试探点,而且还能以一定的概率接受目标函数值变“差”的试探点,迭代中出现的状态是随机产生的,并且不强求后一个状态一定优于前一个状态,即以一定的可能容忍的退化状态的出现;(2)引进算法控制参数T,它将优化过程分为各个阶段,并决定各个阶段下随机状态的取舍标准,接受函数由Metropolis算法给出一个简单的数学模型,接受概率随着温度的下降而逐渐减小;(3)使用对象函数值(即适应值)进行搜索,它仅使用由目标函数变换来的适应度函数值,就可确定进一步的搜索方向和搜索范围,无需其它一些辅助信息[4]。
3.3 模糊逻辑
模糊逻辑(FUZZY,fuzzy logic system)自提出以后,特别是在人工智能和控制等领域得到较好的应用之后,已经引起研究人员的浓厚兴趣。进入20世纪90年代,模糊逻辑无论在理论上还是在应用方面都得到了较快地发展。
模糊逻辑本身并不模糊,而是用来对“模糊”进行处理以达到消除模糊的逻辑。其最大特点是用它可以自然地处理人类的概念。由于输入、输出均为实型变量,所以特别适用于工程应用系统,FUZZY提供了一种描述专家组织的模糊“If-then”规则的一般化模式,模糊产生器、模糊推理机和反模糊化的选择也有很大的自由度。FUZZY的知识表达易于理解,但难于利用数值信息,自学习能力较差。
3.4 遗传算法
遗传算法(Genetic Algorithms)是基于生物进化理论的原理发展起来的一种广为应用的、高效的随机搜索与优化的方法。其主要特点是群体搜索策略和群体中个体之间的信息交换,搜索不依赖于梯度信息。它是在70年代初期由美国密执根(Michigan)大学的霍兰(Holland)教授发展起来的。1975年霍兰教授发表了第一本比较系统论述遗传算法的专著《自然系统与人工系统中的适应性》(《Adaptation in Natural and Artificial Systems》)。遗传算法最初被研究的出发点不是为专门解决最优化问题而设计的,它与进化策略、进化规划共同构成了进化算法的主要框架,都是为当时人工智能的发展服务的。迄今为止,遗传算法是进化算法中最广为人知的算法。
遗传算法是解决搜索问题的一种通用算法,对于各种通用问题都可以使用。在遗传算法中,基于染色体群的并行搜索,带有猜测性质的选择操作、交换操作和突变操作。这种特殊的组合方式将遗传算法与其它搜索算法区别开来。
遗传算法具有以下几方面的特点:(1)遗传算法从问题解的串集开始嫂索,而不是从单个解开始。这是遗传算法与传统优化算法的极大区别。传统优化算法是从单个初始值迭代求最优解的;容易误入局部最优解。遗传算法从串集开始搜索,覆盖面大,利于全局择优。
(2)许多传统搜索算法都是单点搜索算法,容易陷入局部的最优解。遗传算法同时处理群体中的多个个体,即对搜索空间中的多个解进行评估,减少了陷入局部最优解的风险,同时算法本身易于实现并行化。
(3)遗传算法基本上不用搜索空间的知识或其它辅助信息,而仅用适应度函数值来评估个体,在此基础上进行遗传操作。适应度函数不仅不受连续可微的约束,而且其定义域可以任意设定。这一特点使得遗传算法的应用范围大大扩展。
(4)遗传算法不是采用确定性规则,而是采用概率的变迁规则来指导他的搜索方向。
(5)具有自组织、自适应和自学习性。遗传算法利用进化过程获得的信息自行组织搜索时,硬度大的个体具有较高的生存概率,并获得更适应环境的基因结构。
3.5 禁忌搜索算法
Tabu Search是由美国科罗拉多州大学的Fred Glover教授在1977年左右提出来的,是一个用来跳出局部最优的搜寻方法。
禁忌搜索是对局部邻域搜索的一种扩展,是一种全局逐步寻求最优算法。禁忌搜索算法中充分体现了集中和扩散两个策略,它的集中策略体现在局部搜索,即从一点出发,在这点的邻域内寻求更好的解,以达到局部最优解而结束,为了跳出局部最优解,扩散策略通过禁忌表的功能来实现。禁忌表中记下已经到达的某些信息,算法通过对禁忌表中点的禁忌,而达到一些没有搜索的点,从而实现更大区域的搜索。
禁忌搜索算法算法具有以下几方面的特点:(1)从移动规则看,每次只与最优点比较,而不与经过点比较,故可以爬出局部最优。
(2)选优规则始终保持曾经达到的最优点,所以即使离开了全局最优点也不会失去全局最优性。
(3)终止规则不以达到局部最优为终止规则,而以最大迭代次数、出现频率限制或者目标值偏离成都为终止规则。
所以禁忌搜索算法是一种局部搜索能力很强的全局迭代寻优算法。
3.6 DNA软计算
DNA软计算是一种基于DNA汤(种群)和生物进货机制的随机搜索算法,其设计变量服从均值和方差进化过程变化的正态分布,不必预先设定其取值范围,且算法引导种群逐步向优化区域搜索,确保其全局收敛能力[5],它的特点主要有以下几个方面:首先,DNA具有不可估量水平的并行性。其次,DNA软计算有很高的能量效率和存贮容量。此外,尝试开发实际的DNA软计算能促进生物学和生物化学获得更灵活的操作和更可靠的技术[6]。
3.7 人工免疫系统
人工免疫系统(AIS,artificial immune system)是研究借鉴和利用生物免疫系统的信息处理机制而发展的各类信息处理技术、计算技术及应用的总称,用于复杂问题的解决。AIS结合了分类器、神经网络和机器推理学习系统的优点,是一种突现计算,但也存在收敛速度慢等缺点。1994年以来,AIS成为国际上新的研究热点。目前这一领域还处于起步阶段[2]。
3.8 蚁群算法
蚁群算法是人们通过对自然界中蚁群群体行为的研究而提出的一种基于种群的模拟进化算法[7]。该算法通过模拟蚂蚁搜索食物的过程来求解一些实际问题。蚂蚁能够在没有任何可见提示下找出蚁穴到食物源的最短路径,并且能随着环境的变化而变化,然后搜索新的路径,产生新的选择。受蚂蚁觅食时的通信机制的启发,90年代Dorigo提出了蚁群优化算法。由于这个算法利用了正反馈机制,使得较短的路径能够有较大的机会得到选择,并且由于采用了概率算法,所以它能够不局限于局部最优解。
3.9 粒子群算法
粒子群算法(PSO,particle swarm optimization)是一种进化计算技术(Evolutionary Computation),有Eberhart博士和Kennedy博士发明。源于对鸟群捕食的行为研究。PSO同遗传算法类似,是一种基于叠代的优化工具。系统初始化为一组随机解,通过叠代搜寻最优值。但是并没有遗传算法用的交叉(crossover)以及变异(mutation)。而是粒子在解空间追随最优的粒子进行搜索。同遗传算法比较,PSO的优势在于简单,容易实现并且没有许多参数需要调整。目前已广泛应用于函数优化、神经网络训练、模糊系统控制以及其他遗传算法的应用领域。粒子群优化算法(PSO)也是起源对简单社会系统的模拟,最初设想是模拟鸟群觅食的过程,但后来发现PSO是一种很好的优化工具。
3.10 多(Agent)系统
多Agent系统(Multi-Agent System,MAS)是指由多个自主构件组成的所有类型的系统,它是一个松散耦合的问题求解器网络,其目标是为了解决那些超出每个问题求解器的单独能力或知识的问题。这些问题的求解器就是Agent,它们是自主的,并可能是异构的。
多Agent系统的表现通过Agent的交互来实现,主要研究多个Agent,为了联合采取行动实际系统时,多Agent系统通过各Agent间的通信、合作、协调、管理及控制来表达系统的结构、功能及行为特性。多体系中,知识具有局部性,而问题具有全局性,在大多数情况下,需要同其他的联合解决一个问题,这样间的信息传递不可避免,因此需要有通讯语言(ACL)。
结束语
本文对主要的计算智能算法及各自的特点作了一个介绍,这些算法在解决实际问题中都发挥了相当的作用,当然也有待我们进一步研究、改进和提高。计算智能是一个发展潜力巨大的方向,未来的发展一定会越来越智能化,个性化的倾向越来越浓,目的性变得日益明确,应用的领域也会越来越广。
参考文献:
[1]李国杰.计算智能:一个重要的研究方向[A].
[2]苏建元.计算智能主要算法的比较与融合[J].中国电子科学研究院学报,2007.2,(1):52-56.
[3]钱敏平,龚光鲁.从数学角度看计算智能[J].科学通报,1998,(16):1681-1695.
[4]项宝卫,凌塑勇.计算智能算法的研究现状[J].台州学院学报,2006.6,(3):22-25.
[5]黄自元,师黎等.一类自适应范围DNA软计算模型.控制理论与应用,2004.12,(6):889-992.
现代等离子体物理第一卷,湍流等离子体物理动理学
数值相对论计算机求解爱因斯坦方程
物理学家的随机过程理解噪声系统
量子信息和纠缠性的哲理
环境流体力学进展
聚合物的粘弹性力学基础分子理论、实验和模拟,第2版
天文问答指南
利用双筒望远镜探索太阳系的奥秘
药物设计
生态恢复
花图式
大脑中的语言
利用人工神经网络模拟感知
自然资源保护与管理中的分子方法
美容的神经生物学
空间认知与空间感知
评估自然资源
多媒体检索数据管理
Event—B语言的建模
算法语言Scheme的第6次修订报告
量子计算中的语义学技术
机械臂的自适应控制统一无回归矩阵方法
稀疏图像信号处理
机械和电子工程
伟大的工程师们
随机调度
复值数据的统计信号处理
移动机器人分析学的更多的进展 第5届国际ISAAC会议论文集
分析学的进一步进展 第6届国际ISAAC会议论文集
线性算子方法 逼近与正则化
2008年Isehia群论会议文集
应用数学和计算数学的前沿
计算科学的最近进展
超流宏观理论
高等凝聚态物理
量子杂谈 微观世界的魅力
从π介子到夸克 20世纪50年代的粒子物理学
非线性振动
非线性波
时间序列分析 社会科学家用的全面介绍
时间,空间,星系与人类 关于宇宙大爆炸的故事
彗星和生命起源
发现宇宙大爆炸)膨胀宇宙的发现
环境科学中的机器学习方法 神经网络与核方法
世界上最大的湿地 生态与保护
有害污染物的科学管理
达尔文的短篇出版物1829—1883
物理生物学 从原子到医学
达尔文笔记1836—1844
诺贝尔生理医学奖专题讲座2001—2005
陆蟹生物学
无标记生物传感技术以及应用
传感器与微系统 第13届意大利学术报告会论文集
传感器与微系统 第12届意大利学术报告会论文集基本泛函分析
物理学及有关领域大学生用数学方法
伽罗瓦理论 第二版
变分法中的重积分
数论概要
解Pell方程
复杂的非线性 混沌、相变、拓扑变化和路径积分
量子位势论
导电物质量子理论 超导
自旋 Poincare研讨会2007
结构系统的现代试验技术
结构力学中的混沌
物质结构
激光材料加工原理 现代传热与传质技术
超快强激光科学的进展 第四卷
相变材料 科学和应用
分析系统动力学 建模与仿真
微极亚塑性颗粒状物体中的剪切局部化
天线和望远镜的建模与控制
将无人飞机系统集成到国家空域系统
动力学系统中的模型提取 用于移动机器人控制
临床核磁共振成像及其物理学 指南
胶原蛋白 结构和力学
大型涡流模拟的质量及可靠性
信息系统开发、
移动多媒体广播标准 技术与实践
计算系统中的安全性