首页 > 文章中心 > 多元统计分析

多元统计分析

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇多元统计分析范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

多元统计分析

多元统计分析范文第1篇

关键词:财务分析;聚类分析;因子分析;财务指标;上市公司

中图分类号:F23文献标识码:A

一、财务状况评价指标体系的确定

单个指标只能揭示出公司财务状况的某一方面,无法反映出财务状况全貌。为了全面、完整地评价上市公司的财务状况全貌,本文按照《企业财务通则》和《工业企业财务制度》的规定,选取一套财务比率作为财务综合评价指标体系,包括以下4大类8个财务指标变量。获利能力指标:净资产收益率、加权平均净资产收益率;偿债能力指标:流动比率、速动比率;经营能力指标:应收账款周转率、总资产周转率;发展能力指标:营业利润增长率、净利润增长率。

二、多元统计分析方法进行财务综合评价

(一)样本的确定和数据来源。从中国上市公司资讯网中选取了60家上市公司在2007年的有关数据,这些是实证研究的重要数据来源。为了保证研究数据的客观性和有效性,在确定研究范围时考虑到以下几点:(1)本文仅以工业类上市公司的财务指标作为研究对象,这样能体现较大的可比性;(2)我们数据用的是2007年的,没有用2008年的数据。我们知道,2008年美国次级债危机导致上市公司财务数据的大幅变动,这样处理使数据更加有参考性。

(二)因子分析的主要步骤。样本的数据矩阵为:

X=

其中,p表示财务指标的变量数;n表示上市公司的样本数。主要步骤如下:(1)由样本矩阵X计算样本均值、样本离差阵及相关矩阵;(2)求R的特征值和方差贡献;(3)确定公共因子的个数m。通常要选取的主因子数所反应的信息量占原始数据总信息量的85%以上,即选取m个因子使累积方差贡献达到85%; (4)因子载荷矩阵方差最大旋转,因子分析的目的不仅是求出公共因子,更主要的是应该知道每个公共因子的实际意义,但是初始载荷矩阵并不满足“简单结构准则”,因而容易使公共因子的实际意义含糊不清,不利于对因子进行解释。为此,必须对因子载荷矩阵施行旋转变换,使得各因子载荷矩阵的每一列各元素的平方按列向0或1两级转化,达到其结构简化的目的。得到最终旋转因子的载荷矩阵为A;(5)对m个公共因子做解释。求出载荷矩阵A后,即得到p个可测变量由m个不可测的公共因子及各自特殊因子的表达式,并解释这m个公共因子表示的经济意义;(6)样本的因子得分。在因子载荷矩阵A和特征因子方差已知的情况下,使用加权最小二乘法得到每个样本的各个因子得分:F=ARX;(7)样本的综合得分SWF(i=1,2,…,n)。其中,W为各主因子权重,由旋转后主因子所解释的方差求得,F为每个样本的各主因子得分;(8)综合排名。根据求得的上市公司综合财务指数得分数按从大到小的顺序进行排名。

(三)财务综合评价实证分析

1、根据上述步骤及有关数据,应用SPSS统计分析软件进行因子分析

(1)得到因子特征值。从中选取4个特征值大于1的因子,其累积方差贡献率达85.021%,可以解释9个财务指标的大部分差异。特征值碎石图的“陡坡检验”证明4个因子是决定9个财务指标的主要因子。(图1)

(2)对因子载荷矩阵施行旋转变换,得到各主因子旋转成分矩阵。旋转成分矩阵,在各主因子上选取载荷大于0.5的财务指标对各主因子做比较明确的解释。第一个因子F1∽0.986(净资产收益率)+0.990(加权平均净资产收益率),该因子可以解释为盈利能力因子,它主要解释了财务指标中载荷高的净资产收益率和加权平均净资产收益率;第二个因子F2∽0.950(流动比率)+0.913(速动比率),该因子可以解释为偿债能力因子,它主要解释了财务指标中载荷高的流动比率和速动比率;第三个因子F3∽0.908(营业利润增长率)+0.927(净利润增长率),该因子可以解释为发展能力因子,它主要揭示了财务指标中载荷高的营业利润增长率和净利润增长率;第四个因子F4∽0.845(应收账款周转率)+0.606(总资产周转率),该因子可以解释为营运能力因子,它主要解释了财务指标中载荷高的应收账款周转率和总资产周转率。

综上,可以验证与财务分子中衡量各项能力的指标一致。

(3)旋转平方和载入。可以计算出四个因子的权重,第一个因子权重:

w==0.296

同理可得第二个因子权重:

w=0.286;w=0.234;w=0.165

(4)得到各个样本的因子得分系数矩阵。因子得分系数和原始变量的标准化值可以计算每个观测值的各因子的得分数:

F=0.490X+0.494X+0.080X-0.110X-0.018X+0.000X+0.001X-0.015X

F=-0.006X-0.029X-0.143X+0.202X+0.489X+0.480X+0.015X+0.055X

F=-0.004X-0.004X-0.102X+0.065X-0.004X+0.048X+0.524X+0.558X

F=0.014X+0.000X+0.779X+0.518X+0.052X-0.119X+0.049X-0.123X

再根据所求因子权重可得到各公司综合财务指数S:

S=WF=0.296F+0.286F+0.234F+0.165F(j=1,2,…,n)

(5)得到部分上市公司财务状况排名(限于篇幅,结果略)。

2、应用SPSS统计分析软件进行系统聚类分析。通过分析,了解到各个公司的优势,认为因子得分较相似的样品有一定的相似性,通过聚类分析验证。通过系统聚类法,选择离差平方和法,用欧式距离定义样品之间的距离。限于篇幅我们只将30家上市公司进行系统聚类,所得聚类谱系图(结果从略),从聚类谱系图可以看出,金柴动力和新华医疗首先聚在一起,它们在偿债能力方面和综合排名很相似。通过对图标的进一步分析会发现,结果和因子得分的排名之间的关系很相符。另外,在有了聚类分析的前提下,我们可以进一步依靠聚类分析的分类结果建立判别函数,将我们所希望了解的公司的各个方面的指标带入进行判别归类,从而可以使投资决策更加方便快捷。

通过上述分析,我们发现多元统计分析中的因子分析、聚类分析、判别分析等都可以运用到财务分析中,为分析指标的选择,综合因子得分函数的确定,将具有相似性的企业聚成一类,建立判别函数,为以后评价企业的类型提供依据。但是,由于企业经营环境及资本结构、竞争对手等不断改变,建立的判别函数需根据情况的变化而进行不断地调整。

(作者单位:福建农林大学计算机与信息学院)

主要参考文献:

[1]张学谦等.企业财务报表分析原理与方法.北京:清华大学出版社,2007.

[2]葛文雷.现代公司财务学.上海:中国纺织大学出版社,1997.

[3]陈文浩.公司财务.上海:上海财经大学出版社,2003.

多元统计分析范文第2篇

关键词:财务危机原因多元统计分析危机预警作用

国内学者对于公司财务危机预警的研究也越来越多,然而学者们大多数只针对纯财务指标构建财务危机预警模型,却忽略了非财务信息的作用。很显然,单一的财务数据所能体现的信息还不够完整,很难反映公司的真实情况,难免会造成预警的偏差,而非财务信息能够对财务信息进行有效地补充,因此,引入非财务指标构建预警模型是非常有必要的。

一、企业财务危机产生的原因

许多现代企业面临着危及生存的问题,财务危机是企业的一大重要问题,许多企业管理不得当,财务环节控制不到位,并且缺少有效的监管机制,造成企业财务管理混乱。企业财务危机是法律意义上对企业破产的定义,企业破产是用来衡量企业财务危机最常用的标准。企业财务危机有负债危机、市场危机、收益质量危机,除此之外,长短期资产配置不当、企业财务机制不健全、管理层的财务管理素质低下、企业本身的风险意识薄弱等都会造成企业财务危机的发生,由于企业更倾向于通过负债来获取收益,因而当风险意识不强时极易形成高度负债,在企业出现入不敷出的财务危机时便会导致破产。

二、多元统计分析

(一)多元统计分析概述与作用

多元统计分析是一种综合分析方法,能够在多个对象和多个指标互相关联的情况下分析它们的统计规律。多元统计规律包含很多内容,主要包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、主成分分析和因子分析、判别分析和聚类分析、直线回归与相关、多元线性回归与相关。多元统计分析可以对许多数据进行观测以及预测,多元统计分析即为分析多元数据的统计方法。根据统计规律性对未来企业财务情况做出预测,根据多元的数据对财务情况进行多方面的设想与观测,预测企业未来发展过程中可能会发生的财务危机情况以及危机程度,让企业提早知晓可能发生的财务危机,并做好全方面的应对措施。

(二)多元统计分析在企业财务危机预警中的主要方法

多元统计分析主要是使用判别分析和主成分分析建立企业财务危机预警模型。首先,在建模的过程中利用随机抽样和对应样本法在企业中进行选择,选取各类指标来反映企业的财务情况,变量越多企业财务危机预警模型就建立的越好。其次,利用抽样选取法抽选出样本和变量,依据这些样本和变量使用判别分析法建立企业财务危机的预警机制。第三,将企业中抽取出来的多个变量通过线换选出较少的数量并且是重要的变量,由于变量之间都存在着一定的相关关系,而且要以最少的变量来建立模型,所以要将相关重复的变量除去,最后剩下各不相关的变量,全方面分析企业中存在的问题,这就是主成分分析。

三、多元统计分析在企业财务危机预警中的作用

(一)对财务危机进行分析和预测

多元统计可以通过抽取变量建立预测模型对企业未来的财务危机进行分析和预测,从各个不同的角度预测企业未来可能发生的财务危机,并且经过验证判断企业是财务危机公司,或是非财务危机公司,或是中间状态公司。这种方法的正确率十分高,但是如果预测的年份越远,预测的准确率就会越低;反之年份越近预测的精确度就越高。因此,企业需要及时更新企业的财务危机预测模型,根据不断变化的数据和指标对企业财务危机进行分析,提高预测的准确率,对未来所可能出现的危机做出适应的措施。

(二)减小财务危机对企业的影响

多元统计分析可以减小财务危机对企业的影响,可以通过多元统计分析对企业进行分类,依据采集到的数据建立的模型,辅助分类企业判断是否处于财务危机状态。如果预测结果为财务危机企业,必定会引起相关部门对企业发展的重视,以及采取各类的方法对企业未来可能会发生的财务危机进行合理地防范,企业会谨慎对待发展的每一个步骤,加强风险意识,减小负债率,减小财务危机对企业的影响。

(三)促进市场经济健康发展

以多元统计分析对各个企业进行财务危机预警,使我国的每个企业都能够划分清楚,并且采取最全面、有效的体系适应国内企业的发展,在一定程度上减少了财务危机带来的影响,促进了市场经济的健康发展,提高我国的经济发展水平。

四、结束语

多元统计分析是一项对研究企业财务危机十分有效的方法,在其他领域的应用也十分广泛,多元统计分析可以为企业带来完善的财务预警体系,使企业预测未来可能会发生的财务危机,对未来发生的财务危机采取适当的、避免发生的措施,促进了企业经济的健康发展。

参考文献:

[1]李杰,王蔚佳,刘兴智.多元统计分析在企业财务危机预警中的应用[J].重庆建筑大学学报,2004

[2]付娟,刘延平.运用多元统计分析综合评价我国西部各省市自治区域经济效益[J].中国高新技术企业,2007

多元统计分析范文第3篇

文章编号:1671-489X(2015)08-0084-02

随着现代计算机技术和网络技术的发展,医疗卫生领域逐步完善生命健康相关信息登记的数据库,各类数据库之间相互链接形成医药卫生行业的海量信息。面对海量信息,如何透过数据的表面现象抓住其本质?如何通过众多的数据挖掘出有关生命健康的科学规律?迫于此形势的需求,各医学院校纷纷开设医用多元统计分析课程,培养医学研究工作者将各种多元统计分析方法应用到医药卫生领域数据中的能力。

医用多元统计和基本卫生统计构成医药卫生领域内处理数据的有力工具,两者都用到数理统计和概率论的知识,故在教学方法上医用多元统计有许多可以借鉴基本卫生统计的教学经验。医用多元统计分析处理多变量数据,相对于处理单变量数据基本卫生统计方法而言,医用多元统计又呈现出众多自己的特点,比如繁琐的矩阵、复杂的建模、庞大的运算、抽象的概念[1]等。因此,在借鉴基本卫生统计教学方法的同时,还必须依据本课程的特点认真考虑如何增强该课程教学效果的问题。笔者在几年的医用多元统计分析教学中有四点体会与大家分享。

1 通过教学环节培养实践能力

医用多元统计分析属于应用性的方法学科,课程性质要求学生在学习多元统计方法之后,要具备将各种多元统计分析方法应用到医疗卫生领域数据中的能力。培养学生的实践能力,仅从理论授课上下功夫提高学生实践能力是远远不够的,必须在理论授课、实验教学和课程考核等各个教学环节中都不脱离实践能力培养的主线。在理论课上讲授的内容一般包括原理方面的知识和如何分析实际数据两个方面。提高学生实践能力要求教学过程中淡化数学原理方面的知识,而将重点放置在如何分析实际数据上,即该多元统计分析方法使用的前提条件是什么,如何使用该方法以及分析结果如何解读,在具体研究的医学问题中此结果具有什么样的意义。

尽管在现代教学方法中有体验式教学的渗入[2],但相对于实验课的实际体验来讲,学生对于数据何时采用、如何采用某种多元统计分析方法,还是保持在似乎知道,但又不完全明确的模糊阶段。很多原理方面的知识,尽管不是重点,但也需要学生了解一下,才能有助于把握整体脉络、合理应用,通过实验课的亲身体验,能直观观察到相对模糊的原理知识得到验证的过程,从而心服口服地从心底接受没有经过手工计算而呈现的分析结果。并且多元统计分析的实验课本身就是让学生去体验各多元统计分析方法怎样应用于实际数据的过程,从而使学生实践能力大大提高。

一般课程考试比较侧重理论原理的考核,而医用多元统计分析授课的目的就是给学生讲授多元统计方法应用于医药卫生领域数据的实践过程,学习课程之后学生必须具备这种实践能力,否则就根本没有实现开设这门课程的初衷,没有达到教学目的。因此,课程考试也应侧重在学生实践能力的考核上。课程考核一般有试卷考核、平时实验成绩和上机考核三种形式,而以试卷考核的形式居多。对于医用多元统计分析课程,平时实验成绩考核和上机考核也应该是必须选择的考核形式,除此以外,在试卷考核中也可通过适当的题型体现对学生实践能力的考查。比如,将多元数据分析的结果展示在试卷上,让学生回答此分析结果对于研究目的反映出什么;或者指出研究目的,让学生回答选用何种多元统计分析方法,为何选用这种方法;或者从展现的结果让学生判断是否适用某种多元统计分析方法等多种题型来考查学生的实践能力。通过考核反馈出实践能力欠缺的部分,从而给予相应的应对措施。

2 通过教学软件提高教学效率

多元统计分析建模一般都要经过逆矩阵、相关系数矩阵的计算,求解特征根与特征向量等过程,这些过程没有扎实的数学功底是根本不可能完成的。即便能完成这些运算,但也是相当耗时的过程。就运算相对简单的多元统计分析方法而言,如果采用人工计算器计算的话,也需要大约五个学时的时间才能完成,复杂的多元统计方法需要学时数就更多了。假定学校能够安排充分的学时数,学生也必须有足够的能力和耐心去完成这些运算。可见,统计软件和多元统计分析方法教学的结合是非常必要的。

目前,常用的统计分析软件有SAS、SPSS和STATA。对于医学专业本科生和研究生的统计分析要求来讲,简单掌握每个软件基本功能就可以满足数据分析的需求,但对统计学专业的研究生而言,一般需要用到可编写程序的SAS软件,并且要深入学习,进行数据的模型拟合分析。各医学院校可根据自己的办学条件、师资力量、教材的情况、授课对象等因素综合考虑本院校采用医用多元统计分析的软件。借助软件在很短的时间能完成模型的建立、模型拟合检验等分析过程,通过分析结果中呈现的模型建立中间步骤,了解矩阵运算,求解特征根与特征向量的信息,把握前因后果、各步骤间的相互关系,大量时间的节余可用在多元统计分析方法的专业应用上。

3 通过适宜教材激发学习兴趣

多元统计分析原理部分的繁琐复杂性对该课程的学习形成很大阻碍,且原理部分又不是医学专业学生学习的重点,这提示了教材选择的重要性。合适的教材不应该花费很大的篇幅在理论推导和模型建立的过程上,否则只会增加学生对该课程的畏惧心理。教材应当侧重于多元统计方法的应用部分,应用部分和学生专业的相关性越强,就越容易激发学生学习兴趣。

上文中提到学习医用多元统计分析教学要结合统计分析软件,因此,教材中最好在每个多元统计方法的介绍之后都安排一个章节,说明这种多元统计方法通过统计分析软件如何实现,以及软件运行结果如何解读。医学各专业学生一般都未经过系统的统计软件的学习,因此,教材中软件相关内容的安排就尤其重要,不仅要有这样的章节,而且要通俗易懂,适合医学专业学生的初次统计软件学习,在每一种多元分析方法数据集的录入、软件实现的步骤、一些常用选择项的介绍、软件运行结果的每个部分的解读以及结合专业知识后的结论等各个方面都要有详尽的解释。

医学可以划分成很多不同的专业,如公共卫生、医药和临床专业等,就公共卫生专业又可以进一步详细划分成劳动卫生、儿少卫生和营养等专业。目前的医用多元统计分析教材没有具体针对各个专业的多元统计分析教材,能选择到和医学专业接近的教材充其量也就是医用多元分析的教材了,因此,通过教材提高学习的积极性还是存在一定的局限性,但这种局限可以通过案例教学来弥补。在授课过程中,授课教师可能通过案例式教学[3],选择和授课学生专业休戚相关的例子来进行讲解,就格外能吸引学生的注意力。

4 通过教学设计引导学生主动学习

多媒体技术在教学中的应用极大优化了教学过程[4]。随着多媒体技术的发展,教学过程中“传统的PPT教学”逐渐形成新的多媒体教学形式――微课件。微课件是指使用多媒体技术在五分钟内就一个知识点进行针对性讲解的一段视频或音频[5]。基于教学设计,微课件可用于难点讲解、内容小结等各个环节。如在教学导入阶段,教师根据新课知识点设计新颖的问题,通过简短的视频的形式展现。微课件以视频的形式吸引学生的注意力的同时,将教学问题引入,让学生带着问题去听完一堂课,从而起到引导学生主动学习、增强听课效果的作用。

多元统计分析范文第4篇

【关键词】教学质量;评估;主成分分析

教学评价是系统地收集教学信息,基于所获得的信息,确定培养目标和要求对教学过程与结果进行衡量和价值判断,为教学决策提供依据,从而实现对教学活动的宏观调控,来达到预期结果的过程。对教师教学过程、教学水平进行科学合理的评价能够显示教师教学质量所达到的指标,亦能不断给对教学提供反馈信息。

根据学校的教师教学质量评价细则,调查了我校不同年级的部分学生。除去外出或拒绝回答等因素外实际调查人数153,应答率为85%。

主要是通过教学态度、教学技能、教学效果三方面来,确定了7个指标,公平对待每位学生鼓励学生对学习负责;上课准备充分、熟悉教学内容并注重课堂纪律;讲课条理清楚、层次分明、重点突出程度;积极开展教学改革不断改进教学;按要求完成教学任务,实际预期教学目标;学生能掌握或理解大部分教学内容;善于引导我们深入思考,课堂互动气氛浓厚,最后对教师的教学质量做一个总评价。教学质量评价(10分制):优秀:8.5分以上;良好:7.5分以上;合格:6.5分以上;基本合格:5.5分以上;不合格:5.5以下。

根据采集的100多份数据,利用excel录入数据,通过加权平均处理分析得到样本数据。论文根据多元统计分析建立了模型,应用了SAS软件和MATLAB神经网络环境分析处理。

在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

从上文中确定评价指标有7个,按顺序分别编为,代表学生对教师上课评价满意程度。我们将评价指标的取值范围定为[0,10],表格通过随机的153名同学评价,经过EXCEL处理得到数据,如表1所示。

将表1的组数据全部导入SAS中,调用主成分分析过程,编写程序如下:

提交运行,完成相关性分析。从结果中得到各个变量之间的相关性,如表2所示。

从表2中可以看出,于的相关关系最为显著,依次为0.6888,0.6550,0.5451,0.4496,0.4182。同时可以看到与的相关系数为0.6343;与的相关系数为0.6000。这些预测因子之间的相关系数较大,因此,需对预报因子做主成分分析,以提高评价准确性。

主成分分析将研究对象的多个相关变量指标化为少数几个不相关变量的一种多元统计方法,而且这些不相关的综合变量包含了原来变量提供的大部分信息。直接调用上面的SAS的主成分分析主程序,可以得到8个主成分的贡献率和累积贡献率如图1所示,同时可以得到其主成分的相关负荷表如图2所示。

从图1中可以看出前5个主成分的特征值的累积贡献率达到了91.18%,因此可以认为,用前面5个就足以获取原始数据的方差结构了。在看对主成分分析的解释,图2中给出了主成分与各变量的相关系数(即因子负荷)。从因子负荷中我们可以看到第一主成分中和的相关系数比较高;而在第二主成分明显的是由所支配的;同样可得到第三主成分是,第四主成分中和特征向量系数比较大,第五主成分中是。综述所述,可以得出特征性比较显著。

本文主要是对目前我院教学质量效果评价进行了研究。基于多元统计分析的教学质量评价,在主成分分析基础上建立教学质量评价模型。以主观评价试验和统计分析为基础,SAS和MATLAB为运行环境,得到结果。通过试验分析验证了该方法的可行性和有效性,完成了研究工作,并得出结果,即影响教学质量评价的主要因素和因素对教学质量评价影响程度。

参考文献

多元统计分析范文第5篇

关键词:大学生;信用评估;主成分分析;因子分析;聚类分析法

引言

本文在国内外个人信用评价相关理论和生活经验的基础上,结合大学生相关特质,确定各指标的重要程度,并用层次分析方法确定各指标的评分值,构建大学生信用评价指标体系,通过对湖南农业大学本科生进行问卷调查,获得客观的原始数据;将多元统计分析中的主成分分析、因子分析和聚类分析作为主要研究方法,构建大学生信用评估模型,运用SPSS统计软件进行相关操作来评估大学生信用好坏情况,并验证所建指标体系的可行性。

一、研究方法

1.主成分分析。主成分方法由Hotelling于1933年提出,是利用降维的思想将多指标转化为少数几个综合指标的多元统计分析方法。主成分分析是对原有所有变量进行简化,建立尽可能少的新变量,使得这些新变量两两不相关,并在反映研究的信息方面尽可能保持原有的信息。

2.因子分析。因子分析是用于数据化简和降维的多元统计分析方法,是在主成分分析的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别,主要研究的是相关阵或协方差阵内部依赖关系。

3.聚类分析。聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。目标是在相似的基础上对收集的数据进行分类。

利用系统聚类与主成分分析和因子分析相结合的思想,分别将通过主成分分析和因子分析得到的各位同学的最终得分进行聚类,将聚类结果进行比较分析,得到大学生中信用度的集中趋势并进行深入研究。

二、大学生信用评估体系的建立

1.数据选取与处理。本文数据通过网上调查的方法获得,对湖南农业大学各年级本科生进行《大学生诚信情况调查问卷》随机问卷调查,共发放问卷126份,收回有效问卷126份,有效回收率达100%。通过调查问卷收集了大学生学习、经济、社会实践、生活、就业等六大方面诚信情况的数据。

将研究的六大因素作为一级指标、并设置具体问题作为二级指标,建立大学生信用评估体系,在此基础上借鉴国内外个人信用评价指标体系的研究成果和专家评分,同时根据生活实际,对各级指标的重要程度以0~10(分值越高,表示该因素对诚信更重要)进行评分,并赋予相应分值。

2.实证研究过程。首先用主成分分析法对19个变量信息提取主成分解释总方差百分比达到90%的前n个主成分,在操作过程中,发现抽取特征值大于0.6时,主成分解释总方差百分比达90.964%,满足原定的期望值,此时共提取了15个主成分,将得到的因子载荷矩阵复制到数据库中,用依次命名,再将ai对应的特征向量zi计算出来,从而计算各主成分yi,最后计算得到每位同学的综合得分y。再用因子分析来对数据进行处理。选择降维――因子分析,同样抽取特征值为0.6,得到90.964%的方差累积贡献率。

在运行后得到15个公共因子的得分,最后通过公式:

F=(8.359*FAC1_1+6.708*FAC2_1+6.459*FAC3_1+6.41*

FAC4_1+6.363*FAC5_1+6.246*FAC6_1+5.973*FAC7_1+5.777*

FAC8_1+5.725*FAC9_1+5.72*FAC10_1+5.503*FAC11_1+5.472*

FAC12_1+5.422*FAC13_1+5.414*FAC14_1+5.413*FAC15_1)/90.964

计算得到每位同学的因子得分F。用系统聚类法分别将主成分分析法和因子分析法得到的每位同学的因子分F分成三类:第一类,信用度高;第二类,信用度中等;第三类,信用度偏低。再对各类别中男女组成及年级组成进行分析,得到相关结论。

三、结果分析

模型的调试:

考虑到问卷调查是随机的,在男女及各年级的比例上存在较大的差距,得出的结果可能与实际情况不相符,因此,对实验结果进行进一步分析前,先要使这两组定性变量构成比例各自相同。

在调查的126份问卷中,参与调查的性别组成为男生57人、女生69人。因此,在调试时需将实验结果性别组成中的男生乘上126/114、女生乘上126/138,使男女总比例为1∶1,得到最终结果。

参与调查的年级组成为大一21人、大二39人、大三57人、大四9人。因此,需将实验得出的各类别在大一、大二、大三、大四数分别乘上126/84、126/156、126/228、126/36进行调整,得到最后的结果。

四、结果分析与讨论

表1 主成分分析调试后性别分析的结果

由表1可得,类别1是诚信度高的,有40人,类别2是诚信度中等的,有51人,类别3是诚信度较差的,有35人。其中,类别1和2共91人,占总体的70%,可见大学生中诚信度较高的人还是居多。在诚信度较高的人群里,男性占43人,女性占48人,可见女性诚信度要高于男性。

根据表2计算得,大一中类别1和2占大一总体的62.5%,大二中的类别1和2占大二总体的77.4%,大三中的类别1和2占大三总体的74.2%,大四中的类别1和2占大四总体的78.1%。可见,大学生的诚信水平是普遍较高的,诚信水平大致上随着年级的升高而增加,且大四学生的诚信水平最高。

因子分析法的结果研究的实验结果:

表3 不同分类下的人数

由表3可知,第三类为诚信度最低的,占总人数的80.2%;第二类为诚信度中等的,占总人数的9.5%;第一类为诚信度最高的人,仅占总人数的10.3%。运用因子分析得到的结果与主成分分析结果差异较大,且与现实不符,因此舍弃运用因子分析得到的结果。

结语

本文根据主成分分析与因子分析两种方法对大学生的诚信调查问卷进行分析,经对比可知,主成分分析的新变量是原始变量的线性组合,每个主成分都是由原有所有变量线性组合得到,但是因子分析不是对原始变量的重新组合,而是对原始变量进行分解,利用少数几个公共因子去解释较多个案观测变量中存在的复杂关系。最终发现主成分分析的结果更符合实际情况,从而剔除因子分析的结果,保留主成分分析计算的结果,得到大学生群体中女性的诚信度要高于男性,同时随着年级升高大学生的诚信度也逐渐增高的结论,这一结论与事实吻合,一般来说,女性比男性更有还贷意识,而且随着年级的升高学生的阅历也逐渐增加,使他们更有责任感。最后给银行发卡部门提出了有建设性的建议,即银行发卡时可注重向女性或者高年级学生多发卡,可减少男性或低年级学生的发卡数。

参考文献:

[1] 王莉.基于SOM自组织神经网络的企业信用评估模型[D].太原:太原理工大学计算机应用技术学院硕士学位论文,2005.