首页 > 文章中心 > 神经网络的局限性

神经网络的局限性

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇神经网络的局限性范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

神经网络的局限性

神经网络的局限性范文第1篇

关键词:期货价格预测BP神经网络遗传算法

引言及文献综述

20世纪以来,我国期货市场得到了长足发展,但相对而言,由于我国期货市场仍处于低级阶段,市场操纵严重,投资者投资理念不科学等问题使市场风险事件不断发生,直接阻碍了中国期货市场走向成熟。诸多风险事件归根结蒂,就是期货价格的波动问题,故分析与预测期货价格变化趋势自然成为期货市场风险控制研究的重中之重,与此同时,了解期货价格走势也有助于帮助投资者降低风险、提高收益,实现金融市场的整体稳定与协调。

国外期货市场起步较早,在期货市场预测的研究和实践方面开展了大量有价值的工作,Shaikh A.Hamid,Zahid Iqba(2004)用神经网络预测标普500指数期货价格的波动;Shahriar Yousefi,Ilna Weinreich等(2005)提出一种基于小波变换的预测程序并用来对原油期货进行预测。在我国,学者们也试图通过计量模型对期货价格进行预测:张方杰、胡燕京(2005)的ARMA模型,王习涛(2005)的ARIMA模型,刘轶芳、迟国泰(2006)的GARCH―EWMA的期货价格预测模型、杨熙亮、朱东华、刘怡菲(2006)的BP神经网络模型等都在期货价格预测中得到应用。

总结国内外对期货价格的预测研究,可以发现对期货的预测存在一系列问题,比如:期货数据具有高噪声;各因素之间的相关性错综复杂;期货价格具有非线性特征等等。在这种情况下,人工神经网络方法就显示出其特有的优势,因此本文选择了BP网络模型作为期货短期预测的基本因果模型,并根据实际应用的需要做了创造性的改进。

实证分析

1.变量的选取及数据来源

本文选择大连商品交易所的大豆期货合约为研究对象,作为比较稳定的交易品种,它的走势一定程度上可以反映所在交易所的交易状况,对它的预测情况在一定程度上也可以反映对其交易所其他期货预测的可行性。综合考虑数据可得性、完整性等因素,本文选取2009年1月5日~10月29日的大豆期货主力A1001合约共200个交易数据作为训练数据,10月30日~11月12日的10个数据为测试数据。数据来源于大连商品交易所。

由于期货价格变化受许多因素的影响,为了尽可能提高预测的准确性,输入变量选择为当日开盘价、当日最高价、当天最低价、当日收盘价、结算价、当日成交量、成交金额以及当日持仓量,总共8个输入量。

2. BP神经网络模型的建立及实现

误差反传模型(BP神经网络模型)可任意逼近非线性函数,其运行过程分为信号的正向传播和误差的反向传播两阶段:第一阶段,将样本从输入层传入,经各隐层处理后,传向输出层。若输出层的实际输出与期望的输出不符,则转入第二阶段,将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,并以此来修正各单元权值。

根据kolmogorov定理,一个三层的BP神经网络足以完成任意的n维到m维的映射,即一般只需要采用一个隐层就足够。隐层节点个数本文采用试凑法确定为20个。为使提高训练精度,本文将初始学习率定为0.05,并采用自适应调节学习率功能,在以后的训练过程中根据训练误差来自动调节学习率。同时,本文选取连续可微的S型正切函数即tansig函数作为传导函数,该函数的可微分性与饱和非线性特性,增强了网络的非线性映射能力。

依据以上模型与参数设定,在matlab中予以实现,结果图1所示,从图中可以看出,对大豆期货价格预测的走势是大致相同的,但是整体误差较大。虽然利用自适应调节学习率来改善收敛情况,但梯度下降的BP算法仍存在较大的局限性。为了改善神经网络的权值调整,所以用遗传算法对BP神经网络进行优化。

3.模型的改进及实现

遗传算法是一种全局优化搜索算法,其基本思想是首先将问题求解表示成基因型,通过选择,交叉,变异从中选取适应环境的个体,求得问题最优解,有较好的全局搜索性能。将遗传算法运用到神经网络模型,实现了两者的优势互补,发挥了神经网络的广泛映射能力和遗传算法的全局搜索能力,也加快了网络的学习速度,综合提高了整个学习过程中模型的逼近能力和泛化能力。

在MATLAB中运行结果如图2所示,从中可以看出,加入遗传算法对权值和阈值进行优化以后的GA-BP模型结果能更好的贴近真实值,更准确的拟合。在本例中GA-BP模型的优势突出的表现在收敛速度快,周期短上面。相对于传统的BP算法减少了权值阈值初始化的随机性,GA-BP就可以大大缩短收敛时间。收敛情况如表1所示:

表中以前200次迭代为例,遗传算法可以将mse缩减到e-5数量级,而简单的BP神经网络却只能达到e-3,并且迭代的后期下降的幅度越来越不明显。

结论

基于BP神经网络模型进行实证分析,从预测的结果来看,预测值和实际值的走势是一致的,但预测值和实际值具有较大的偏差,这是由于BP神经网络自身存在的问题所导致的。

为解决BP神经网络模型不能精确预测的价格的问题,考虑到是由于BP算法调整权值的局限性,本文用遗传算法进行优化模型。利用遗传算法可以对权值进行全局搜索,避免了BP算法的局限性。从结果来看,预测值和实际值误差较小,能够精确的预测期货价格。

神经网络的局限性范文第2篇

【关键词】BP神经网络;变形检测;沉降预报最佳值为7;输入层和隐层的传递函数(Tfi)用缺省的正切S形函数(tansig),输出层用线形函数(purelin);网络训练函数(BTF)使用动量批梯度下降函数(traingdm),它具有更快的收敛速度,而且引入了一个动量项mc,避免了局部最小问题的出现;网络权值、阈值学习函数(BLF)和性能函数(PF)采用MATLAB缺省值;对输入数据、目标数据、输出数据的处理,使用MATLAB提供的归一化函数(premnmx)和反归一化函数(postmnmx)。运行程序时先用训练样本对网络进行训练,然后利用训练好的网络对预报样本进行预报。灰色理论GM(1,1)模型同样利用MATLAB编程实现。

2.3结果分析

首先用MATLAB编写的灰色理论GM(1,1)模型和BP神经网络模型分别处理训练样本,得到相应的拟合误差。其中GM(1,1)相对模型拟合误差主要为18.97、4.48、9.07、33.71、7.63、4.08、9.50等,等维BP网络模型拟合误差主要为6.66、0.97、0.29、6.16、2.06、4.44.并且通过之前得到的模拟数据可以得出BP神经网络模型拟合的平均误差以及GM(1,1)模型拟合的平均误差为11.82%。BP神经网络模型拟合的误差小于GM(1,1)模型拟合的误差为3.10%,其拟合精度高于灰色理论GM(1,1)模型。为了进一步检测灰色理论GM(1,1)模型和BP神经网络模型的预报精度,再分别用两种模型对监测点的沉降数据的预报样本进行预报,并可从中得出BP神经网络模型的预报精度远高于灰色GM(1,1)模型的结果。

三、结论

本文引入灰色理论中新陈代谢思想构造神经网络的学习样本,建立BP神经网络预测模型,并用该模型进行了实际的沉降预测。工程模拟实例表明:用等维BP神经网络模型进行沉降预测是可行的,预报精度远高于灰色GM(1,1)模型。为了提高BP神经网络模型的预测精度,一方面需要有足够的观测数据序列,以保证神经网络学习所需的样本数。另一方面需要恰当地确定输入层神经元的个数,目前尚无据可依,只能通过根据试算确定。

参考文献

神经网络的局限性范文第3篇

关键词 BP神经网络 房地产市场 预警研究

中图分类号:F293 文献标识码:A

一、房地产市场预警评价指标的构建

本着全面性、重要性、可测性、独立性的房地产预警指标选取原则,笔者选取了房地产行业的发展协调度、和谐稳定度、和未知风险度三个一级指标以及12个二级指标作为警兆指标,如表1所示:

二、BP神经网络预警模型的构建

(一)神经网络结构的构建。

BP神经网络模型拓扑结构一般包括输入层(InPutLaver),隐含层(HideLaver)和输出层(outPutLayer)三个方面。

由于任意一个连续函数都可以准确地用一个三层向前神经网络来模拟。故本文采用只含有一个隐含层的三层神经网络作为预警系统。

其中房地产市场警兆指标为输入层,本文输入层节点数X=12。相对应的警情为输出层,本文警情采用三维向量的模式,故输出层节点数Y=3。隐含层神经元数目N的确定,本文采用公式N=+C,其中,C 为 1 ~10 的常数。通过训练,发现当N=8时,神经网络的收敛效果最好。

(二)神经网络的训练方法。

1、信号向前传输。

首先,计算隐含层各单元的净输入Ij:

其中wij是输入层第i单元与隐含层第j单元间的权重; j是隐含层第j单元的偏置值,p为隐含层单元总数。

第二,计算隐含层各单元的输出yj:

第三,计算输出层的实际输出,计算方法与隐含层相同。

2、误差反向传输。

通常用网络实际输出与目标输出之间的方差ei来度量误差。

其中di表示目标输出,yi表示实际输出。

(三)预警时差和警情的设定。

由于目前我国房地产发展不成熟以及相关警兆指标的局限性。本文将预警时差设定为2年,通过对上一年的警兆数据的分析来预测下一年的警情,即通过2011年的数据来预测2013年的警情。并将警情划分为 “冷”、“正常”、“热”三级,分别用三维向量(1,0,0)、(0,1,0)、(0,0,1)表示。

(四)神经网络的预警过程。

将经过归一化处理后的房地产市场警兆指标数据作为网络系统的输入,经过训练好的神经网络处理,输出房地产市场的警情,实现评价指标与警情的非线性映射。

三、基于沈阳市房地产市场的实证研究

本文选取了沈阳市2004年到2011年的预警指标数据,其中2004年到2009年作为神经网络的训练样本,2010年作为检验样本,2011年作为预测2013年警情的基础数据。其中根据相关专家的分析,给出2006年到2009年沈阳市房地产市场地警情。

(一)神经网络的训练。

为了使神经网络获得较好的训练效果,本文运用MATLAB软件对其进行训练。其中中间层的激励函数为正切s型激励函数,输出层的激励函数为对数s型激励函数。学习训练率为0.06。经过342次迭代,网络训练误差情况如图迭代次数所示。

(二)神经网络的检验。

为了使训练好的神经网络能够更精确的预测警情,本文将2010年的相应指标数据输入到已经训练好的网络中,对网络进行检验。检验结果如下表所示。

由表结果可知,神经网络输出结果与目标输出结果吻合度较好,故可以作为预测警情的模型。

(三)神经网络的市场预警。

将2011年的相关指标数据输入到BP网络中去,得到结果表所示:

由网络输出可得出目标输出为(0,1,0)。即2013年沈阳市房地产市场处于正常状态。

四、结语

神经网络的局限性范文第4篇

关键词:风险预警模型 主成分分析法 人工神经网络

商业银行风险预警模型就是在分析商业银行经营状况的基础上,通过观察一系列统计指标和统计数据(预警指标)的变化,运用经济计量或其它模型,对商业银行可能或将要面临的风险危机进行识别,及时向决策部门发出预警信号,使决策部门能够及时进行调控,以最小的成本来达到控制风险的最大效益,从而减轻其损失的负担,获得整体安全保障的管理方法。本文在预警模型的算法选择上,避免了仅依靠单个预警指标识别风险的局限性,排除了传统模型加权平均算法的人为因素,提出采用主成分分析法和人工神经网络方法相结合的算法,并对模型进行了实证性研究。

一、引言

综观国内外研究现状,目前银行风险预警的研究大部分是针对宏观金融环境的,对于其构成细胞――商业银行这一微观主体的预警研究尚不多见。尽管如此,国内仍有不少学者在这方面进行了有益的探索。本文在银行业现有研究的基础上,将部分敏感因素加入到风险管理的动态监测中,进一步完善商业银行风险预警指标体系。模型的主要特点在于其算法选择上,提出采用主成分分析方法对商业银行风险状况进行评价,运用独立样本T检验进行解释变量的筛选之后,根据几个关键指标建立BP神经网络预警模型,并按照上述方法进行了实证分析,验证了模型的准确性。

二、风险预警的指标体系构架

(一)商业银行预警指标的选择原则

指标体系的构造,是建立我国银行风险预警系统的基础。银行风险的数量变动特征,无不通过统计指标(变量)的数量变动特征表现出来,因此,统计指标作为测定银行风险的指示器,在银行风险监测预警分析中有着至关重要的作用。为了满足预警指标体系所应具备的完备性和最小性的特征,预警指标的选择应符合下列标准:

1 全面性。指标体系的选择应既包括各种定量指标,也包括反映银行管理水平和内控水平的定性分析指标;既注重风险的安全性指标和流动性指标,又注重银行效益的盈利性指标。

2 敏感性。所选择指标能灵敏地反映银行风险产生变化的情况,应将能够反映银行业目前所处环境或阶段特征的变量及时纳入指标体系,更好地体现模型的适时性。

3 可控性。选择指标必须充分考虑到统计现状,所选指标应是各分(支)行自身可以掌握和调控的。

4 数据的可靠性和充分性。预警指标的数据要可靠,一是要求数据的准确性,二是要求统计口径的一致性。充分性则要求该指标的统计样本区间有足够长度,能够反映各种可能发生的情况。

(二)指标体系的内容

商业银行引进境外战略投资的预警模型指标体系如表1所示。

三、商业银行引进境外战略投资的风险评估

风险评估是风险预警的基础,风险预警是对风险评估结果的补充和完善,风险评估是银行工作者掌握风险趋势变动的依据,是进一步做出风险预警的前提。目前,由于我国金融统计数据的缺乏,通过对破产银行和稳健银行的数据特征对比建立风险预警模型缺乏可行性;此

(三)解释变量的筛选

构建银行风险预警模型的关键之一,是找出反映银行风险状况的关键指标。因此我们首先对用于主成分分析的反映银行风险状况的19个主要预警指标进行考察。为了降低主观判断因素的影响,归纳出一套较强敏感性的指标体系,对上一节通过主成分分析得到的6个高风险季度和6个稳健季度,将采用独立样本T检验对影响银行风险状况的19个指标逐步进行筛选。目的是得到使总体风险在两类银行中存在显著性差别的指标。对19个指标进行独立样本T检验得到风险季度和稳健季度在流动性比率、流动性缺口率、不良贷款率、累计外汇敞口头寸比例、外资控制权比率、不良贷款迁徙率、资本收益率、自主创新贡献度、损失准备充足率、资本充足率、公司治理结构、管理层评价12个指标上的数字特征是存在显著性差别的。我们将用这12个指标来构建商业银行引进及国内外战略投资的风险预警神经网络模型。

(四)基于BP神经网络的风险预警模型实证检验

1 输入节点的选择。通过上一节解释变量的筛选后,我们选取在两类银行中存在显著差异的12个指标来构建BP神经网络风险预警模型,因而该模型的输入节点数为12。我们对选择的12个指标进行归一化处理,将它们转化为闭区间[0,l]上的无量纲性指标值。

2 输出层和隐层节点数的选择。根据主成分分析法的综合评分得到的4种预警结果,我们将定义预警信号为红色预警信号(0 0 0 1),橙色预警信号(0 0 1 0),蓝色预警信号(0 1 0 O)和绿色正常预警信号(1 0 0 0)。分别对应于主成分得分表中的4种不同的风险状态:F∈(一∞,0)较大风险,F∈(0,4)风险,F∈(4,8)基本安全,F∈(8,+∞]安全,因此输出节点数确定为4。隐层节点数的多少与输入输出层节点数有直接关系,根据公式,p=m+n/2+a(a为1-10间的常数),我们确定隐层节点数为10。

3 神经网络预警模型的训练与检验。如前所述,本文建立的BP神经网络模型共有12个输入神经元,10个隐层神经元和4个输出神经元。下面将使用MATLAB7,0软件中自带的神经网络工具箱来完成模型的建立,并利用前11个季度进行网络训练,对最后一个季度的数据做出仿真检验。

通过网络参数设置和算法的选择,利用神经网络工具箱对11个季度的训练结果如表3。

神经网络模型在经过了74次学习训练后达到误差要求。

(五)神经网络风险预警模型的检验

利用2006年第4季度数据对模型进行仿真检验,模型检验的输入、输出如表如表4、表5。

检验结果表明,模型的实际输出与主成分分析结果完全一致,误差满足要求。可以证明该神经网络模型对商业银行金融风险的预警非常准确。因此,将该模型应用于对商业银行初步引进境外战略投资者的风险预警,具有很高的可行性,可以对中资银行对外资开放过程中的风险管理工作提供重要的参考依据。

神经网络的局限性范文第5篇

原理与方法

神经网络是一个具有高度非线性的超大规模连续时间动力系统。是由大量的处理单元(神经元)广泛互连而形成的网络。它是在现代神经科学研究成果的基础上提出的,反映了脑功能的基本特征。但它并不是人脑的真实描写,而只是它的某种抽象、简化与模拟。网络的信息处理由神经元之间的相互作用来实现;知识与信息的存储表现为网络元件互连间分布式的物理联系;网络的学习和计算决定于各神经元连接权系的动态演化过程。因此神经元构成了网络的基本运算单元。每个神经元具有自己的阈值。每个神经元的输入信号是所有与其相连的神经元的输出信号和加权后的和。而输出信号是其净输入信号的非线性函数。如果输入信号的加权集合高于其阈值,该神经元便被激活而输出相应的值。在人工神经网络中所存储的是单元之间连接的加权值阵列。

神经网络的工作过程主要由两个阶段组成,一个阶段是工作期,此时各连接权值固定,计算单元的状态变化,以求达到稳定状态。另一阶段是学习期(自适应期,或设计期),此时各计算单元状态不变,各连接权值可修改(通过学习样本或其他方法),前一阶段较快,各单元的状态亦称短期记忆(STM),后一阶段慢的多,权及连接方式亦称长期记忆(LTM)〔1〕。

根据网络的拓扑结构和学习规则可将人工神经网络分为多种类型,如不含反馈的前向神经网络、层内有相互结合的前向网络、反馈网络、相互结合型网络等〔2〕。本文的人工神经网络模型是采用BP算法的多层前馈网络。

该模型的特点是信号由输入层单向传递到输出层,同一层神经元之间互不传递信息,每个神经元与邻近层所有神经元相连,连接权用Wij表示。各神经元的作用函数为Sigmoid函数,设神经网络输入层的p个节点,输出层有q个节点,k-1层的任意节点用l表示,k层的任意节点用j表示,k+1层的任意节点用l表示。Wij为k-1层的第i个神经元与k层的第j个神经元相连接的权值。k-1层的节点i输出为O(k-1)i,k层节点j的输出为:

k层节点j的输出为:

Okj=f(netkj)

设训练样本为(X,Ye),X为p维向量,加到输入层;Ye为q维向量,对应于期望输出;网络的实际输出Y也是q维向量。网络在接受样本对的训练过程中,采用BP算法,其权值调整量为:

ΔWij=-ηδkjO(k-1)i

其中,对于输出层为:

δkj=yj(1-yj)(yej-yj)

对于非输出层为:

η为训练步长,取0<η<1。

用样本集合反复训练网络,并不断修改权值,直到使实际输出向量达到要求,训练过程结束〔3〕。

上述人工神经网络可以完成多种信息处理任务,如从二进制数据中提取相关知识,完成最近邻模式分类,实现数据聚集等。而本文要用的是其极强的数学逼近映射能力,即开发合适的函数f:ARnBRn,以自组织的方式响应以下的样本集合:(x1,y1),(x2,y2)…,(xm,ym),其中yi=f(xi)。这里描述的是一般的数学抽象,像识别与分类这些计算都可以抽象为这样的一种近似数学映射。

所谓诊断,实质上是一个分类问题。即根据候诊者的症状,医学检查结果(如体温、心跳等)等一些情况,它们可以用一向量(e1,e2,…,em)来表示,将其归类为病人或非病人。这也可以转化为寻找一差别函数f使得:

(1)f(e1,e2,…,em)>ε, (e1,e2,…,em)∈T

(2)f(e1,e2,…,em)>ε, (e1,e2,…,em)T

其中集合T表示患病。

因此,病情诊断最终也可作为一类函数的逼近问题。

而许多研究已表明,前向神经网络可作为非线性逼近的标准型。对于实数空间的任一函数,只要它满足一定的条件,一定存在唯一的具有单一隐层的前向网络作为它的最优最佳逼近。而含有两个隐含层的前向网络可在任意的平方误差内逼近某一实函数〔3〕。

诊断步骤

肺癌病例数据选自1981~1994年在某医院住院的病人,共计551例。其中486例(88%)经病理学、细胞学诊断证实为肺癌。每一病例都包括多项数据,其中用于诊断的数据项有:病人的一般情况(如年龄、性别等),家族史、既往史、吸烟史、术后病理、X射线检查、CT检查、纤维支气管镜检查、PAT痰检等多达58项。因此,原则上 58项数据应作为神经网络的输入项,而神经网络的输出值就是病人是否患肺癌的结果。

1.网络训练集的确定:在最原始的551例病人数据中存在着各种各样的差别,如性别差异(419例男性,132例女性),诊断结果的差异(486例经证实为肺癌),所患肺癌种类的差异(鳞癌、小细胞癌、大细胞癌等),患病程度上的差异(早、中晚期的不同)等等。显然,训练数据集应最大限度地保证兼顾各种病例情况。经过仔细筛选,选择了含有460个病例的集合作为肺癌诊断用的网络的训练集。

2.神经网络输入和输出数据的预处理

按照人工神经网络的理论,神经网络的输入输出数据都应该属于(0,1)区间的实数,为此我们需对原始数据进行如下的规一化处理:

其中xi为原始数据项,而Max=max{xi∶xi∈X},Min=min{xi∶xi∈X}。这里X为原始数据集。经过(7)式变换后,yi将在(0,1)区间。因此,可作为神经网络的输入输出。

3.应用神经网络进行肺癌诊断

将描述病人各种情况的数据作为前向网络的输入数据加到其输入端,并按(1)~(6)式计算各神经元的输入和输出,同时调整神经元之间的连接权值以使网络的输出和实际的病例情况相符。即当病人确实患肺癌时网络的输出结果也恰好指示为肺癌,反之亦然。如果对所有的训练样本集网络的输出基本上(95%或更高)能保证与实际结果一致,则训练过程结束。我们认为神经网络已建立起病人的各种因素与他是否是肺癌患者之间的函数映射关系。对于一个新的候诊病人来说,只要将他的情况输入到训练好的神经网络中去,根据网络的输出结果就可以知道他是否已患肺癌。

表1 基于不同发病因素的诊断网络模型

型 训练集精度 测试集精度

基于遗传因素的诊断网 53.8% 46.3%

基于个人生活习惯的诊断网 57.1% 44.9%

基于病症的诊断网 89.4% 83.3%

基于医学检查结果的诊断网 98.5% 92.6%

上述结果表明不同类型的因素应分开来考虑。于是我们将58项输入数据分成四类,这四类有各自的BP诊断网,依次称为诊断一、诊断二、诊断三、诊断四。它们先单独测定,然后再将它们各自的结果综合起来得出最后的判断。

上述四种诊断网络所得结果的可靠性各不相同。其中,根据医学检查结果所作的诊断准确性最高,因此在最后的综合分析中要重点考虑它的诊断结果,我们给它设一个相对最高的权值。其次,根据病人的症状所作的诊断往往也具有较高的准确性,因此给它的权值也较高,但比医学检查结果的稍低。其他两类因素在有关肺癌的诊断中仅具参考作用,因而所设的权值相对较小。

最后的结果O为:

O=a1.O1+a2.O2+a3.O3+a4.O4

a1+a2+a3+a4=1

其中Oi,ai,i=1,2,3,4分别为各诊断网的输出及其对应的权值。

当O>0.5时最后的诊断结果为患肺癌,反之则正常。对所有的病例数据经上述方法的诊断结果见表2。

表2 神经网络对肺癌诊断结果分析

神经网络

诊断结果 训练数据 测试数据

肺癌患者 非肺癌患者 肺癌患者 非肺癌患者

+ 460 2 25 3

- 0 38 1 22

其中对于训练集,肺癌病人的正确检出率为100%,非肺癌病人误诊率为5%。对于测试集,肺癌病人的正确检出率为96.2%;非肺癌患者正确检出率为88%,误诊率为12%。

讨 论

1.本研究所采用的人工神经网络的肺癌诊断方法的结果较好地符合了已知数据,具有较高的准确性,特别是对于肺癌患者一般都能准确地做出诊断,有利于肺癌的早期发现和治疗。

2.要想进一步提高该方法的准确性,应该注意收集更多更全面的病例数据。人工神经网络主要是利用它能自动从数据集中抽取函数的关系的功能。如果我们所使用的数据越多越全面,则其中所蕴含的事物本身的规律性就越强,利用人工神经网络从中所抽取的函数关系就越具有普遍性,因而就更准确。

3.实现对肺癌的诊断的关键在于准确找到罹患肺癌的判定函数,可利用前向网络的函数逼近功能来实现。但是这里涉及到两个问题。首先,由于差别函数和预测率函数都是利用人工神经网络从已知的病例数据集中抽取出来的,它实际反映的是这些数据集中输入输出对的映射关系。因此要想保证诊断具有较高的准确性,就应该使用来建立函数关系的这些数据集(称训练集)具有充分的代表性,即这些数据应基本蕴含肺癌诊断的医学原理。这就涉及到如何选择网络合理的训练集及关键的输入项。另一个问题涉及到神经网络本身的要求,即网络的输入输出数据值都应在区间(0,1)中。这可以通过数据的编码和归一化来实现。

4.由于某些原因有些病人的病例数据不完整,约占总病例数据的10%左右。显然,如果按照传统的方法来建立肺癌病人的诊断模型〔4〕,这些有缺项的数据是不太好处理的,但是由于人工神经网络有较强的容错性,输入数据在某些项上的错误对网络最终结果的正确性影响不大。

参考文献

1.焦李成.神经网络系统理论.第1版.西安:西安电子科技大学出版社,1995,3

2.Wang Zhenni,Tham Ming T,Morris A.Multilayer Feedforward Neural Networks:A Canonical form Approximation of Nonlinearity,Int J.Control,1992,56(3):655~672.