首页 > 文章中心 > 神经网络过拟合的表现

神经网络过拟合的表现

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇神经网络过拟合的表现范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

神经网络过拟合的表现

神经网络过拟合的表现范文第1篇

关键词 经济活动 预测模型 人工神经网络

经济活动诸如商品价格走势、生产活动的产量预测、加工的投入产出分析、工厂的成本控制等方面都是重要的技术经济层面。定量化的经济活动分析是经济学研究的必由之路,而建模是量化分析的基础,这是因为模型为科学分析和质量、成本等控制提供了理论依据。本文针对经济活动中大多数研究对象都具有的非线性特点,给出了用人工神经网络(Artificial Nerve Network)模型建立经济活动的预测模型的原理和方法,并描述了神经网络与各种先进的建模方法相结合的模型化方法,为经济活动的分析、预测与控制提供了理论基础。

1 神经网络模型方法

现实的经济系统是一个极其复杂的非线性系统,客观上要求建立非线性模型。传统上使用回归与自回归模型刻画的都是线性关系,难于精确反映因变量的变化规律,也终将影响模型的拟合及预报效果。为揭示隐含于历史记录中的复杂非线性关系必须借助更先进的方法———人工神经网络(ANN)方法。

人工神经网络具有并行处理、自适应、自组织、联想记忆及源于神经元激活函数的压扁特性的容错和鲁棒性等特点。数学上已经证明,神经网络可以逼近所有函数,这意味着神经网络能逼近那些刻画了样本数据规律的函数,且所考虑的系统表现的函数形式越复杂,神经网络这种特性的作用就越明显。

在各类神经网络模型中,BP(Back-Propagation误差后向传播)神经网络模型是最常用的也是最成熟的模型之一。本质上,BP模型是对样本集进行建模,即建立对应关系RmRn,xk∈Rm,ykRn。数学上,就是一个通过函数逼近拟合曲线/曲面的方法,并将之转化为一个非线性优化问题来求解。

对BP神经网络模型,一般选用三层非循环网络。假设每层有N个处理单元,通常选取连续可微的非线性作用函数如Sigmoid函数f(x)=1/(1+e-x),训练集包括M个样本模式{(xk,yk)}。对第P个训练样本(P=1,2,…,M),单元j的输入总和记为apj,输出记为Opj,则:

apj=WQ

Opj=f(apj)=1/(1+e-apj)

(1)

对每个输入模式P,网络输出与期望输出(dpj)间误差为:

E=Ep=((dpj-Opj)2)

(2)

取BP网络的权值修正式:

Wji(t+1)=Wji(t)+?浊?啄pj+?琢(Wji(t)-Wji(t-1))

(3)

其中,对应输出单元?啄pj=f’,(apj)(dpj-Opj);对应输入单元?啄pj=f’,(apj)?啄pkWkj;

?浊是为加快网络收敛速度而取值足够大又不致产生振荡的常数;?琢为一常数项,称为趋势因子,它决定上一次学习权值对本次权值的影响。

BP学习算法的步骤:初始化网络及学习参数;提供训练模式并训练网络直到满足学习要求;前向传播过程, 对给定训练模式输入,计算网络的输出模式,并与期望比较,如有误差,则执行下一步,否则返回第二步;后向传播过程,计算同一层单元的误差?啄pj, 按权值公式(3)修正权值; 返回权值计算公式(3)。BP网络的学习一般均需多周期迭代,直至网络输出与期望输出间总体的均方根误差ERMS达到一定要求方结束。

实践中,BP网络可能遇到如下问题:局部极小点问题;迭代收敛性及收敛速度引起低效率问题。此外还有,模型的逼近性质差;模型的学习误差大,记忆能力不强;与线性时序模型一样,模型网络结构及节点作用函数不易确定;难以解决应用问题的实例规模与网络规模之间的矛盾等。为克服这样的一些问题,同时为了更好地面向实际问题的特殊性,出现了各种基于神经网络模型或与之结合的模型创新方法。

2 灰色神经网络模型

灰色预测和神经网络一样是近年来用于非线性时间序列预测的引人注目的方法,两种方法在建模时都不需计算统计特征,且理论上可以适用于任何非线性时间序列的建模。灰色预测由于其模型特点,更合用于经济活动中具有指数增长趋势的问题,而对于其他变化趋势,则可能拟合灰度较大,导致精度难于提高。

对于既有随时间推移的增长趋势,又有同一季节的相似波动性趋势,且增长趋势和波动性趋势都呈现为一种复杂的非线性函数特性的一类现实问题,根据人工神经网络具有较好的描述复杂非线性函数能力特点,用其对季节性建模;最后根据最优组合预测理论,建立了兼有GM(1,1)和ANN优点的最优组合预测模型。该模型能够同时反映季节性时间序列的增长趋势性和同季波动性的双重特性,适用于一般具有季节性特点的经济预测。

首先,建立GM(1,1)模型,设时间序列x(0)=(x(0)(1),x(0)(2),?撰,x(0)(n)),作一阶累加生成:

x(1)=(x(1)(1),x(1)(2),?撰,x(1)(n))  (4)

其中x(1)(k)=(x(0)(i),k=1,2,?撰,n

构造一阶线性灰色微分方程并得到该方程的白化微分方程:

+ax=u

用最小二乘法求解参数a,u,得到x(1)的灰色预测模型:

(1)(k+1)=(X(0)(1)-u/a)e-ak+u/a,(k=0,1,2,?撰)

(5)

其次,根据上节方法建立BP人工神经网络模型。

第三,将两模型优化组合。设f1是灰色预测值,f2是神经网络预测值,fc是最优组合预测值,预测误差分别为:e1,e2,ec,取w1和w2是相应的权系数,且w1+w2=1,有fc=w1f1+w2f2,则误差及方差分别为ec=w1e1+w2e2,Var(ec)=w21Var(e1)+w22Var(e2)+2w1w2cov(e1,e2)

对方差公式求关于w1的极小值,并取cov(e1,e2)=0,即可得到组合预测权系数的值。

2 基于粗糙集理论的神经网络模型

粗糙集理论与模糊集理论一样是研究系统中知识不完全和不确定问题的方法。模糊集理论在利用隶属函数表达不确定性时,为定义一个合适的隶属函数,需要人工干预,因而有主观性。而粗糙集理论由粗糙度表示知识的不完全程度,是通过表达知识不精确性的概念计算得到的,是客观的,并不需要先验知识。粗糙集通过定义信息熵并进而规定重要性判据以判断某属性的必要性、重要性或冗余性。

一般来说,BP神经网络模型对模型输入变量的选择和网络结构确定等都基本凭经验或通过反复试验确定,这种方法的盲目性会导致模型质量变差。用粗糙集理论指导,先对各种影响预测的因素变量进行识别,以此确定预测模型的输入变量;再通过属性约简和属性值约简获得推理规则集;然后以这些推理规则构造神经网络预测模型,并采用加动量项的BP的学习算法对网络进行优化。有效改善了模型特性,提高了模型质量。其建模步骤为:由历史数据及其相关信息历史数据构造决策表; 初始化; 对决策表的决策属性变量按划分值域为n个区域的方式离散化;采用基于断点重要性的粗糙集离散化算法选择条件属性变量和断点(分点),同时计算决策表相容度,当决策表相容度为1或不再增加时,则选择条件属性变量和分点过程结束;由选择的条件属性变量及其样本离散化值构造新的决策表,并对其约简,得到推理规则集;由推理规则集建立神经网络模型; 对神经网络进行训练; 若神经网络拟合误差满足要求,则结束, 否则,增加n。必须指出,区间分划n太小,会使得拟合不够,n太大,即输出空间分得太细,会导致过多的区域对应,使网络结构过于复杂,影响泛化(预测)能力。

3 小波神经网络模型

人工神经网络模型存在的网络结构及节点函数不易确定问题,结合小波分析优良的数据拟合能力和神经网络的自学习、自适应特性建模,即用非线性小波基取代通常的非线性S型函数。

设非线性时间序列变化函数f(t)∈L2(R),定义其小波变换为:

Wf(a,b)==f(t)?渍()dt

(6)

式中,?渍ab(t)称为由母小波?渍t(定义为满足一定条件的平方可积函数?渍(t)∈L2(R)如Haar小波、Morlet小波、样条小波等)生成的依赖于参数a、b的连续小波,也称小波基。参数a的变化不仅改变小波基的频谱结构,还改变其窗口的大小和形状。对于函数f(t),其局部结构的分辩可以通过调节参数a、b,即调节小波基窗口的大小和位置来实现。

用小波级数的有限项来逼近时序函数,即:

(t)=wk?渍()

(7)

式中(t),为时间序列y(t)的预测值序列;wk,bk,ak分别为权重系数,小波基的平移因子和伸缩因子;L为小波基的个数。参数wk,bk,ak采用最小均方误差能量函数优化得到,L通过试算得到。

4 模糊神经网络模型

模糊集合和模糊逻辑以人脑处理不精确信息的方法为基础,而人工神经网络是以大量简单神经元的排列模拟人脑的生理结构。二者的融合既具有神经网络强大的计算能力、容错性和学习能力,又有对于不确定、不精确信息的处理能力,即同时具有底层的数据处理、学习能力和高层的推理、思考能力。

一种应用模糊理论的方法是把模糊聚类用来确定模糊系统的最优规则数,从而确定模糊神经网络的结构。这样确定的网络结构成为四层:第一层为直接输入层;第二层为模糊化层,对输入做模糊化处理;第三层为模糊推理层,对前层模糊结果做模糊推理;第四层为非模糊化层,可以采用重心非模糊化法,产生网络输出。该网络采用动态处理法,增强了其处理能力,且适用性强、精度高。

5 结语

除上述几种结合式神经网络方法之外,人工神经网络模型在算法设计方面一直在取得巨大的进步。神经网络模型方法是一种先进的具有智能的非线性建模方法,其在自然科学、经济现象、社会活动等方面的应用正在不断深化,把神经网络方法引入经济活动的分析和预测中,并紧密联系诸多先进的建模方法,是使工业经济、商业经济及其对经济本质规律的研究等各项工作推向前进的重要理论武器。

参考文献

神经网络过拟合的表现范文第2篇

以上文章都结合卷积神经网络模型对交通标志分类做了大量的研究,避免了复杂的人工特征提取算法的设计,研究结果具有一定的参考性。在现有卷积神经网络模型的启发下,以上文章都采用分类器。而训练分类器需要大量样本,因而在小样本数据下,采用分类器容易造成过拟合,降低网络的泛化性。同时,由于SVM分类器在小样本数据集上具有出色分类性能,本文提出一种基于卷积神经网络和多类SVM分类器[[4]的交通标志识别模型。此模型利用卷积神经网络强大的特征提取和泛化能力,使得算法在复杂环境中依然具有可靠的识别结果。  首先,本文通过迁移学习策略「51L61对AlexNet网络[7]特征提取部分进行微调,并将微调结果作为本文的特征提取器。然后将卷积神经网络提取的特征作为多类SVM分类器的输入。同时为了进一步防止过拟合现象的发生,本文在SVM分类器中加入dropout层,利用随机置零策略进行参数选择。最后,文章通过实验结果证实本文提出的分类模型相比于采用softmax分类器有更好的准确率、在复杂背景中具有较高的识别率和较强的鲁棒性棒。1卷积神经网络和SVM

1.1  AlexNet网络    

AlexNet网络是著名的卷积分类网络,可成功实现对1000类别物体的分类。其结构可以分为特征提取器和分类器两部分。    

特征提取器主要由卷积层、池化层、激活函数组成。卷积层由大小不同的卷积核组成,卷积核类似于传统视觉中的特征提取算子。但区别于传统视觉算子,卷积核参数由网络自己学习得到,可以提取图像从底层到高层的不同特征信息。池化层常连接在卷积层之后,一般常用最大池化操作。池化层可以加强网络对平移变化的鲁棒性。激活函数为网络引入非线性因素,使得网络可以逼近任意函数形式。    

分类层主要由全连接层和多类逻辑回归函数组成。全连接层学习用合理的方式组合特征,可以看为函数映射。逻辑回归函数进行类别概率判别,逻辑回归判别见公式。同时,为了防止全连接层过拟合,AlexNet网络引入dropout层,dropout[9]采用随机置零的方式,防止神经元以特定的方式组合工作,从而防止深度网络的过拟合。p}Y}}}=j1二(‘);B)=艺  e醉x})丫‘eBTx}' }e'  j代表类别,二(i)为输入,k代表类别总数,8,表示将样本x}')映射到j类的参数,B代表er,r=i,z,~…  ,,组成的矩阵,p(少‘)=j}x(仍表示x}'}属于j类的概率。1.2标准SVM    SVM是基于结构风险最小化理论的有监督学习算法,通过寻找最优分割超平面来实现分类[}10}。相比于神经网络,SVM在小样本数据集上也能表现出良好的分类效果,因而得到广泛使用。标准的SVM通过寻求公式(2)的最优解来找到最优超分割平面。minw,b含,,w,,(2)yc> (w·二(‘)+b) >_ 1,i=1, 2,……,m尹)代表第i个样本标签,x}'}代表第i个样本特,m为训练集大小。分类模型设计    

本文提出的分类模型主要分为两部分,特征提取部分和多类SVM分类器。整体结构如图1所示。    

图1中,特征提取器主要对输入图片进行特征提取和融合,最终得到图像的高阶特征并将提取到的信息特征送入多类SVM分类器。dropout层进行参数随机丢失步骤,此步骤通过随机失活神经元可有效防止过拟合的发生;然后结合不加正则化项的SVM算法进行分类,得到最终输出结果。

2.1特征提取器    

神经网络过拟合的表现范文第3篇

关键词: 经验模态分解; 时间序列; 因子分析; 神经网络

中图分类号: TN711?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)05?0130?04

Abstract: The sports result prediction is the key to formulate the scientific sports training plan. Aiming at the low prediction accuracy of the current models, a sports result prediction model fusing the factor analysis with neural network is put forward. The self?similarity regression model was constructed according to the sports result apriori information. And then the empirical mode decomposition and factor analysis were conducted for the sports result data. The BP neural network is used to establish the sports result prediction model. The performance of the model was tested with simulation experiments. The results show that the model has higher precision of sports result prediction, and good convergence property.

Keywords: empirical mode decomposition; time series; factor analysis; neural network

0 引 言

体育成绩是反应体育训练水平的重要表现,通过对体育成绩的准确预测能挖掘出人体训练的规则性因子和特征,从而促进运动训练和体育教学的改进。因此,研究体育成绩的预测模型在促进科学训练、提高运动成绩方面具有重要意义。

体育成绩的预测准确度受到的约束因素较多,如人体特征的变化、性别、年龄、天气、运动场馆以及各种环境因素。对体育成绩的预测模型是一个多变量和多参量的统计分析过程,涉及的学科有统计学、信息处理学和现代数学[1]。传统方法中,对体育成绩的预测方法有基于AR模型估计的体育成绩预测算法[2]、特征空间分解方法[3]、经验模态分解方法[4]、基于小波分析的体育成绩时间序列预测方法等[5]。建立体育成绩的线性拟合特征空间,采用多参量约束重构方法构建预测模型,具有较好的预测效果。但这些方法存在计算开销大、预测过程中对参量的自适应抗干扰性差等问题,导致预测的精度低。

针对上述问题,本文提出基于因子分析和神经网络相融合的体育成绩预测模型。对统计的体育成绩先验信息构建自相似回归模型,在自相似回归模型中对体育成绩时间序列进行经验模态分解和因子分析,采用BP神经网络分类模型进行体育成绩的特征信息聚类和信息融合处理,实现预测模型优化。最后通过仿真实验进行测试,得出有效性结论,展示了本文预测模型在提高预测精度方面的优越性。

1 体育成绩预测的数学模型

1.1 体育成绩统计参数分析

w育成绩数据可以看作是一组非线性时间序列。采用非线性时间序列方法分析体育成绩的走势,统计分析体育成绩,采用一个多元统计特征方程描述体育成绩的拟合状态模型为:

最后得到的[ykN-1k=1]是一个具有可预测性的体育成绩时间序列。在BP神经网络中通过对体育成绩的信息属性分类,进行体育成绩的特征信息聚类和信息融合处理,实现预测模型优化设计。

3 结果与分析

采样样本来自于某高校大一和大二学生的体育成绩,包括的体育项目有3 km长跑、100 m短跑、游泳等。对采集的体育成绩进行统计分析和最小二乘拟合,并在Matlab仿真软件中分析数据。神经网络采用的是三层网络结构,学习训练参数为[NEj*(t)=1+9e-t1 024=12,]体育成绩测试集中,码数为1 024个,环境信息对预测模型的干扰强度设定为13 dB,数据采样的时间间隔为1.5 d,迭代次数为10 000次。

根据上述仿真设定,设计体育成绩预测模型,得到样本数据时域波形描述如图2所示。

以上述采集的体育成绩统计样本为测试集,进行体育成绩预测模型仿真分析,得到不同方法的预测误差对比结果如图3所示。

根据上述仿真结果,得出如下结论:

(1) 随着迭代步数的增多,预测误差降低,这是因为通过多次迭代,使用体育成绩的先验信息较多,使得预测精度提高。

(2) 利用本文模型进行体育成绩预测的误差小于传统方法,相差的最大幅度达到35.98%。由于本文方法使用因子分析和神经网络训练,进行体育成绩的数据信息聚类和融合,提高了预测精度,在收敛性和稳健性方面具有较好的表现。

4 结 语

为了提高体育运动训练的科学指导性,进行体育成绩预测,提出了因子分析和神经网络相融合的体育成绩预测模型。并对本文提出的模型进行性能测试,结果表明,本文模型提高了体育成绩预测的精度,而且预测误差可以满足实际应用的要求。

参考文献

[1] 赵波.十项全能世界顶尖男子运动员成绩分析及预测研究[J].体育文化导刊,2013(3):76?79.

[2] 赵丙军.运用多元回归方法建立我国男子跳远项目训练模型的研究[J].西安体育学院学报,2011,18(1):81?82.

[3] 魏春玲.我国十项全能运动成绩的因子分析及灰色系统回归预测研究[J].体育科学,2004,24(11):51?53.

[4] 刘国璧,袁宏俊,孙群,等.基于模糊神经网络的刘翔110 m栏成绩预测[J].安徽电子信息职业技术学院学报,2011,10(1):16?18.

[5] 龙斌.基于支持向量机的刘翔110m栏成绩预测[J].天津体育学院学报,2009,24(4):330?333.

[6] 王宗平,孙光.应用BP神经网络算法对运动成绩预测的实证研究[J].南京体育学院学报,2006,20(4):109?111.

[7] 庄冲,王宗平.灰色系统模型与BP神经网络模型在体育成绩预测方面的比较研究[J].南京体育学院学报,2006,20(6):134?135.

神经网络过拟合的表现范文第4篇

关键词:深度学习;行为识别;神经网络

1 概述

动作行为识别是计算机视觉领域中的一个研究热点,已经广泛应用于智能监控、人机交互、视频检索等领域中[1]。动作行为识别技术是通过对视频或者图像中人体动作行为做出有意义的判断。有效表达图像(视频)中的实际目标和场景内容是最基本,最核心的问题。因此,对于特征的构建和选择得到广泛关注,例如STIP、SIFT、MSER等。但是,能通过无监督方式让机器自动从样本中学习到表征样本的特征,会让人们更好地利用计算机来实现人的视觉功能。而深度学习作为神经网络的延伸和发展,是通过逐层构建一个多层网络来使得机器自动学习到隐含在数据内部的关系,从而让学习到的特征更加准确性。

文章旨在探讨深度学习与机器学习(神经网络)之间的关系,并且介绍深度学习的由来、概念和原理;同时介绍目前深度学习在计算机视觉中的应用。最后提出深度学习目前发展所面临的问题,以及对未来的展望。

2 深度学习

2.1 深度学习概述

深度学习源于人工神经网络的研究,是机器学习的拓展。深度学习是经过组合低层特征来形成更加抽象的属性类别和特征,从中发现原始数据的特征表征[2]。现在用于动作行为识别的技术是通过“动作表征”+“动作分类器”的框架来进行行为识别的。其中“动作表征”是人们手动设计特征获取到的,也就是在目前识别框架内存在一个对动作图像(视频)的预处理过程。

深度学习和浅层学习相对。目前许多学习算法是浅层网络学习方法,具有一定的局限性,例如在样本有限的状况下,表示复杂函数的能力有限制,且对复杂分类问题的泛化能力也会受到一定约束[3]。而深度学习通过学习深层非线性网络结构,达到复杂函数逼近,又能在样本少的情况下学习原始数据的特征。BP算法作为传统神经网络的典型算法,虽然训练多层网络,但仅含几层网络,训练方法很不理想[3]。因为其输入和输出间非线性映射让网络误差函数形成含多个极小点的非线性空间,因而经常收敛到局部最小,且随着网络层数的增加,容易过拟合。而深度学习可以获得分布式表示,通过逐层学习算法来得到原始输入数据的主要变量。通过深度学习的非监督训练完成,同时利用生成性训练避免因函数表达能力过强而出现过拟合情况。

2.2 深度学习原理

传统机器学习仅含单层非线性变换的浅层网络结构,而且浅层模型单一。这对于深度网络来说易造成陷入最优或产生梯度分散等问题。因此,Hinton等人在基于深度置信网(DBNs)的情况下提出非监督贪婪逐层训练算法,随后提出了多层次自动编码器深层结构,这给解决深层网络结构相关的优化难题带来了希望。此外Lecun等人提出的卷积神经网络是第一个多层次结构的学习算法。同时深度学习还出现了许多结构:多层感知机、去噪自动编码器、稀疏编码等。

卷积神经网络是第一个真正采用多层次网络结构,具有鲁棒性的深度学习算法,通过探究数据在空间上的相关性,减少训练参数的数量。而且卷积神经网络(CNN)适应性强,善于发现数据的局部特征。它的权重共享结构降低了网络模型的复杂度,减少了权值的数量,使得卷积神经网络在模式识别中取得了很好的结果。

自动编码器的核心关键是将原始图像(视频)输入信号进行编码,使用编码后的信号来重建原始信号,使得两者之间的重建误差最小。通过将原始信号编码成另一形式,能够有效地提取信号中的主要信息,能够简洁地表达原始图像(视频)的特征。

3 深度学习的应用

3.1 语音识别

从2009年开始,微软研究院语音识别专家通过与Hinton合作,首先将RBM和DBN引入到语音识别声学模型训练中,使得语音识别的错误率相对减低30%,这彻底改变了语音识别原有的技术框架。在国际上,IBM、google等公司都快速进行了DNN语音识别的研究,并且速度飞快。国内方面,阿里巴巴,科大讯飞、百度、中科院自动化所等公司或研究单位,也在进行深度学习在语音识别上的研究。

3.2 视频中的动作行为识别

准确迅速识别视频中人的动作行为对于视频搜索和视频监控具有划时代的意义。最近几年,深度学习技术被应用于视频动作行为识别中。如Ji等人[4]提出多层网络的3D卷积神经网络来学习视频中的时空特征,并通过卷积来实现对整个视频特征的学习,从而代替之前的时空兴趣点检测和特征描述提取。在TRECVID数据库上进行的实验取得了不错效果。

4 结束语

文章对深度学习的主要概念进行了全面阐述,包括其由来、原理、研究进展和相应的应用等。在很多领域中,深度学习都表现了潜在的巨大价值,但深度学习作为浅层学习的延伸,仍处于发展阶段,还有很多问题值得我们深入探讨:

(1)我们需要了解深度学习的样本复杂度,需要多少训练样本才能学习到足够的深度模型。

(2)在推进深度学习的学习理论和计算理论的同时,我们是否可以建立一个通用的深度学习网络模型,作为统一的框架来处理语音、图像和语言。

(3)神经网络具有前馈性连接和反馈性连接,可是我们研究的深度网络中还没有加入反馈连接,这些都给深度学习的研究带来了严峻的挑战。

参考文献

[1]王亮,胡卫明,谭铁牛.人运动的视觉分析综述[J].计算机学报,2002,25(3):225-237.

[2]余凯,贾磊,陈雨强.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804.

神经网络过拟合的表现范文第5篇

关键词:价值投资;聚类分析;RBF神经网络

1. 引言

随着我国股票市场的不断发展,越来越多的投资理念充斥着市场,成为投资者进行投资决策的依据,但其中的许多投资理念来自国外比较成熟的证券市场。这些理念对于中国的股票市场是否有效呢?本文试图运用RBF神经网络理论检验价值投资理念在中国股票市场的有效性。

1.1价值投资理念

价值投资理念,就是通过对股票内在价值的分析,与股票目前的价格相比较,从而决定买卖股票的一种投资理念。价值投资的实质就是通过对公司基本面的分析而采取相应投资策略的一种投资决策方法。

1.2 国内外研究动态

国外对价值投资理论研究的主要是对价值投资能否取得超额收益与超额收益的来源,而由于这一理念在国外提出的较早,并且价值投资的理念在实践中已被广大的投资者所接受并认可,甚至已经创造出惊人的成绩,所以,在国外,对价值投资理念在股票市场的有效性研究很少。

而在国内,对于价值投资理念在中国股市是否适用的问题上,形成了两种相反的观点。孙友群等人分析了我国的宏观经济状况和上市公司的微观状况,认为价值投资在中国股市具有极大的应用可能性和可行性。林斗志认为我国股市股票内在价值对股票价格的决定作用呈增强趋势,价值投资理念在市场中逐步形成,但市场还不够稳定,受非理性因素的冲击较大。但是同时也有部分学者认为价值投资理念在中国行不通。

本文利用神经网络这一研究非线性问题的工具来研究价值投资理念在中国股票市场的有效性问题。

2. 股票市场的非线性特征与RBF神经网络的适用性

2.1 股票市场的非线性特征

股票市场是一个混沌的市场,具有很强的非线性特征:(1)对影响股市波动相同的因素来说,根据其对股市造成影响的时间不同,每次该项因素对股市影响的程度也不同,这与线性系统的特征是不相符的,这也就说明了股票市场的非线性性。(2)股票市场波动的突发性和剧烈程度,足以说明股票市场的非线性性。

通过以上可以看出股票市场存在非线性的特征,利用一般的线性分析工具来研究股票市场对研究结果将会造成很大的偏差,但神经网络理论作为一种处理非线性问题的,以其自身的特点,可以很好的将其运用于解决此类问题。

2.2 RBF神经网络适用性

2.2.1 人工神经网络的特点

人工神经网络是由大量神经元的信息处理单元构成,其主要原理是模拟生物神经元之间的激励过程,通过这一复杂的过程来完成一系列的相关任务。神经网络具有以下显著特点:

(1)、具有自适应性,有强大的自主学习能力,可以通过训练样本并根据样本信息及周围环境变化改变自身的网络结构,从而使自身能够以最有效的形式来模拟训练样本所隐含的环境。

(2)、能从训练样本中获取知识,并具有很好的记忆特征,可以用于处理一些环境复杂,推理并不明确的问题。

(3)、在非线性时间序列预测中,人工神经网络实现了非线性关系的隐式表达,不需要建立复杂系统的显示关系式,这也就是说我们可以在不知道具体函数关系式的前提下运用人工神经网络进行预测。

(4)、神经网络的容错性强,可以处理信息不完全的预测问题。

(5)、由于神经网络具有一致逼近的能力,训练后的神经网络在样本点上输出期望值(误差在允许范围内),在非样本点上表现出神经网络的联想记忆功能。

2.2.2 RBF神经网络的原理

RBF是一种三层前向网络,包括输入层、隐含层和输出层,它的主要特点是隐含层神经元的输出函数是具有径向基对称的基函数。第一层为输入层,由大量输入数据组成,第二层为隐含层,隐含层由许多类似高斯函数的函数构成,对输入端进行加工,而输出层一般是简单的线性函数。

RBF网络一般采用Gause函数作为基函数,被定义为:

其中,Ci和σi(i=1,2,……n,n为隐含层节点个数)分别是隐含层第i个单元径向基函数中心和宽度。

由以上可知,神经元的权值Ci确定函数的中心,例如,当输入X与Ci重合时,函数输出达到最大值,当输入X距离Ci越远时,输出就越小。σi决定了函数的宽度,当σi越 大,则输入X在远离Ci时衰减的速度就越快。Gause函数这样的结构也就意味着只有当输入接近RBF网络的接受域时,网络才会作出响应。

在RBF网络中,输入层至输出层所有权重固定为1,隐含层RBF网络的中心及半径通常是先确定,只有隐含层和输出层之间的权重值可调。RBF网络的隐含层执行一种固定不变的非线性变换,将输入空间的Rm映射到新的空间Rn,输出层在新的空间实现线性组合。这就是RBF网络的主要工作原理,其实质就是把在原来空间的非线性问题通过空间变换,转换成在一个新的空间里的线性问题。

由于RBF网络的这种组织结构以及其能够很好解决非线性问题等特征,决定了RBF网络不但具有一般神经网络可以以任意精度逼近任意函数这样的一个特点,而且,它还具有很强的聚类分析能力,这一点是本文之所以选用该网络研究股票市场有效性的原因所在。

3. 实证研究

3.1 数据的选取

本文选取了在我国沪市和深市上市的商业百货行业的企业作为研究对象,选取了该行业全部的26家上市公司,分别搜集它们2004年1季度到2010年1季度的各个季度的财务报表。

为了能对上市公司做出整体的价值评估,本文分别从五个方面对上市公司作出评价,包括从盈利能力、营运能力、成长能力、偿债能力和现金流量获取能力这五个方面做出评价。分别用净资产收益率来衡量企业的盈利能力,总资产周转率衡量企业的营运能力,净利润增长率衡量企业的成长能力,速动比率衡量企业的偿债能力,每股现金净流量衡量企业的现金获取能力。本文之所以选取这些数据作为研究对象基于以下几点原因:

首先,选取商品百货行业是由于该行业的上市公司在财务指标方面有较大的共性,各个公司的差距不是特别明显,这就有利于下面RBF网络对它们的处理,提高了研究的准确度。

其次,关于财务指标的选取方面我们除对现金流量的衡量外全部采用比率指标去衡量,这也就避免了因不同公司的规模大小有区别而产生较大的差异。而对于每股现金净流量这一指标,由于商品百货行业自身的经营特点,它们的现金流量一般相对于其它行业来说都是比较大,并且在该行业内由于上市公司的经营状况基本类似,该行业的现金流量的状况在很大程度上和整个国家的宏观经济状况有关,所以每股的现金净流量在该行业的上市公司之间差别不大。

以上所有财务数据均由新浪财经提供,对于获取的数据,我们进行相关整理,对由于不同原因缺失的相关数据利用插值法填充,保证数据的完整性,为进行下一步的分析做好基础。

3.2 数据的聚类分析

在利用RBF网络训练过程中,要求训练的数据量较大。一般来说,参加训练的数据量越大,所得到的训练后的网络模拟的效果就越好。所以,为了满足预测效果的要求,必须寻找多个公司作为训练样本,要求进行训练的上市公司的财务数据必须十分相似,这才能保证结果的准确度。为此,我们采取聚类分析的方法,从这26家公司当中选出相似程度最大的4家公司作为最终的研究样本。

通过利用SPSS统计软件,按照上述方法对这26家公司的每季度的5种财务指标和股票收盘价的均值进行聚类,其结果如图1所示:

从图1中可以看出,新世界、百联股份、南京新百、大连友谊这四家公司在第一步聚类的过程中就被归为同一类,所以它们的相似程度最大,并且这四家公司同属于国内二线城市的大型商业百货集团,可见我们聚类分析的结果是成功的。

3.3 RBF的网络训练

在研究中我们已获取的数据是根据聚类的结果得出的这四家公司的季度财务指标,还有我们根据计算所得到的这些上市公司每个季度股票收盘价的平均值,而我们的目标是利用训练好的网络对股票的价格进行预测。如果我们的预测值与实际值的误差在可以接受的范围之内,则说明利用财务数据对股票价格进行预测是可行的,也就说明了价值投资理念在我国股票市场是行之有效的;反之,则得出相反的结论。

根据我们已知的信息和需要解决的问题,我们分别把每个季度的5个财务指标作为网络的输入端,相对应的输出端为该公司下一个季度股票收盘价格的平均值,这样我们就做到了用当期的财务状况去判断该公司的股票价格对这些信息反应的有效性,并且利用了RBF网络的“黑箱型”这一功能,可以很好地模拟财务状况和股票价格这二者之间的关系。

在确定了最基本的输入与输出端之后,再来看一下调用RBF网络的函数,本文采用的是newrb(P,T,goal,spread,MN,DF),其中P代表输入,T代表输出,goal是为训练精度,也就是我们所允许的最大误差。为了使模拟的效果尽可能达到最好,本文设定为0.00001,spread为径向基层的散布常数,本文设定为4。而newrb这一函数的最大特点是可以根据所设定的训练精度,通过添加隐含层的神经元个数循环训练,直到训练的结果达到我们的要求为止,这是本文选取该函数最为重要的原因。

通过以上的说明,RBF的基本网络结构已经形成,利用已获取的85组数据作为我们的研究对象,从中随机挑选82组数据作为训练样本,剩余3组数据用于预测与检验。图2和图3就是我们的训练样本的情况。

由图2所示,纵轴表示对神经网络训练的误差精度,横轴表示网络中样本的数量,所以从图2中可以看出,对样本训练的结果达到了我们对训练精度的要求,训练后的网络误差在0.00001以下。由图3所示,横轴代表训练样本的个数(或者我们可以认为是训练样本的编号),纵轴代表训练样本的数值,其中绿色的圆圈代表的是每一个训练样本的实际值,而红色的线代表的是对神经网络进行训练后所得到的预测线(拟合曲线),从图中可以看出样本的真实值基本上都在拟合曲线上,所以网络的拟合效果较好,训练的结果满足我们的要求。在得到了训练好的神经网络之后,接下来所要做的就是对网络的具体运用,也就是利用神经网络对没有参与训练的样本进行预测。

4. 结论

利用随机抽取的三组数据进行预测,并将其预测值与实际值进行比较,结果如下表所示:

由上表可知,预测的误差在3%左右,这就说明了利用当期的财务指标去判断未来的股票走势是比较准确的,同时也显示出了价值投资理念对我国股票市场带来的重要意义:

首先,说明了价值投资理念对于我国的股票市场来说是有效的,即广大的投资者在可以根据上市公司公开的各种财务报表来判断这一个公司的投资价值,从而对自己的买卖行为进行决策。

其次,价值投资理念为广大的投资者提供了一个行之有效的投资方法,避免了投资者在投资于股票市场的盲目性。

最后,价值投资理念在我国股票市场的推行有利于我国股票市场的发展,进一步降低了我国股票市场的投机性,对形成一个真正稳定、有效的投资市场有着重要的意义。

参考文献:

[1]孙友群,陈小洋,魏非.价值投资与中国股市对接的思考[J]. 财经理论与实践,2002(2)

[2]林斗志.价值投资在我国股市表现的实证分析[J]. 财经科学,2004(1)

[3]李雪婷.论价值投资理论的原理及在中国股市的应用合理性分析[J].中国商界,2009(11)

[4]任秋娟.基于巴菲特投资理论的中国证券市场价值投资研究[J].现代商贸工业,2010(4)

[5]苑迪.基于动态神经网络的股价预测模型研究[D].湖南大学,2009

[6]庞素林.信用评价与股市预测模型研究及应用[M].北京:科学出版社,2005