前言:本站为你精心整理了多元统计聚类应用探讨论文范文,希望能为你的创作提供参考价值,我们的客服老师可以帮助你提供个性化的参考范文,欢迎咨询。
摘要:随着市场经济的发展和竞争的日益激烈,如何运用科学的分析方法对收集到的数据做出准确、及时的分析并制定正确的决策,已成为企业极为关注的问题。本文重点介绍了多元统计分析方法中的聚类分析、判别分析、主成分分析、因子分析及其在企业经营管理中的应用。
关键词:多元统计聚类分析判别分析主成分分析因子分析应用
1、引言
多元统计分析是统计学中一个非常重要的分支。在国外,从20世纪30年代起,已开始在自然科学、管理科学、社会和经济等领域拉开了多元统计分析应用的帷幕,20多年来在多元统计分析的理论研究和应用上取得了很显著的成绩。
在商业企业经营过程中,往往需要对诸如产品销售收入、产品销售成本、产品销售费用、产品销售税金及附加、产品销售利润、管理费用、利润总额、利税总额等变量进行分析和研究,如何同时对多个变量的观测数据进行有效的分析和研究,这就需要利用多元统计分析方法来解决,通过对多个变量观察数据分析,来研究变量之间的相互关系以及揭示这些变量之间内在的变化规律。实践证明:多元统计分析是实现定量分析的有效工具。
2、多元统计分析研究的主要内容
在当前科技和经济迅速发展的今天,在国民经济许多领域中,特别是对社会现象的分析,只停留在定性分析的基础上是不够的,为提高科学性、可靠性,通常需要定性和定量的分析。如果说一元统计方法是研究一个随机变量统计科学的规律,那么多元统计分析方法是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。同时,利用多元统计分析中不同的方法可以对研究对象进行分类和简化。
多元统计分析包括的主要内容有:聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析等。
3、多元统计分析方法在商业企业中的应用
在这里,重点研究聚类分析、判别分析、主成分分析、因子分析方法及其在商业企业中的应用。
3.1聚类分析随着生产技术和科学的发展,人类的认识不断加深,分类越来越细,要求也越来越高,光凭经验和专业知识是不能确切分类的,往往需要定量和定性的分析结合起来去分类,于是数学工具逐渐被引进分类学中,形成了数值分类学。后来随着多元分析的引进,聚类分析逐渐从数值分类学中脱离出来形成一个相对独立的分支。
聚类分析又称群分析,它是研究分类问题的一种多元统计方法。所谓类,通俗地说,就是指相似元素的集合。聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类,并计算新类与其它类之间距离,再选择近似者并类,每合并一次减少一类,继续这一过程,直到所有样本都合并成为一类为止。所以,聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果,聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。
在企业销售领域,销售商需要考虑对不同生产企业生产的同名称商品的分类问题。例如:某商场对销售的20种啤酒进行分类,以便对不同的类别的啤酒采用不同的销售策略,变量包括啤酒名称、热量卡路里、钠含量、酒精含量、价格。根据以上指标,利用聚类分析可以实现把同一类型的啤酒企业归到同一类别。再如商业企业制定商品销售价格时,需要对某个大城市的物价指数进行考察,而物价指数很多,有农用生产物价指数、服务项目物价指数、食品消费物价指数、零售价格指数等,因而要先对这些价格指数利用聚类分析方法进行分类。
3.2判别分析在生产、科研和日常生活中经常需要根据观测到的数据资料,对所研究的对象进行分类。判别分析是判断样品所属类型的一种多元统计分析方法,其目的是对已知分类的数据建立由数值指标构成的分类规则,然后把这样的规则应用到未知分类的样本中去分类。
判别分析与聚类分析不同,判别分析是已知研究对象分成若干类型并取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析。判别分析按判别的组数来区分,有两组判别分析和多组判别分析;按区分不同总体所用的模型来分,有线性判别和非线性判别;按判别式所处理的变量方法不同,分逐步判别和序贯判别等。判别分析可以从不同角度提出问题,因此有不同的判别准则,如马氏距离最小准则、Fisher准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等。
商业企业在市场预测中,往往根据以往所调查的种种指标,用判别分析方法判断下季度是畅销、平销或滞销。当然,判别分析经常与聚类分析联合起来使用。在聚类分析中,某商场对销售的20种啤酒进行分类,假定分类结果为一级品、二级品和三级品,现在判断新商标的啤酒属于哪个级别的产品就需要用判别分析。
3.3主成分分析在实际问题中,研究多指标(变量)问题是经常遇到的,然而在多数情况下,不同指标之间有一定相关性,由于指标较多,再加上指标之间有一定的相关性,势必增加了分析问题的复杂性。主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标,同时根据实际需要从中可取几个较少的综合指标,尽可能多反映原来指标的信息,这种将多个指标化为少数相互无关的综合指标的统计方法,叫做主成分分析或主分量分析。超级秘书网
在商业经济中用主成分分析可以将一些复杂的数据指标综合成几个商业指数形式,如物价指数、生活费用指数、商业活动指数等。在市场研究中,常常需要分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。顾客偏好分析时常常用到主成分分析。例如:某汽车销售商在商业竞争对手中选择了销售的17种车型,访问了25位顾客,要求他们根据自己的偏好对17种车型打分,打分范围0~9.9,9.9分表示最高程度的偏好,
3.4因子分析因子分析的形成和发展有相当长的历史,最早用以研究解决心理学和教育学方面的问题,由于计算量大,又缺少高速计算的设备,使因子分析的应用和发展受到了很大的限制,甚至停滞了很长时间。后来,由于计算机技术的发展,才使因子分析的理论研究和计算问题有了很大的进展。目前这一方法的应用范围十分广泛,在经济学、社会学、医学等各个学科都取得了显著的成绩。因子分析是主成分分析的推广和应用,它是将错综复杂的随机变量综合为数量较少的随机变量去描述多个变量之间的相关关系,以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类,使类似指标相关程度高,不同类的相关程度低。因子分析分R型因子分析(从相关系数矩阵出发)和Q型因子分析(从相似系数矩阵出发)。
例如:某销售企业对100名招聘人员的销售策略知识和能力进行测试,出了50道题的试卷,其内容包括的面较广,但总的来说,通过应用因子分析方法可以归纳为六个方面:语言表达能力、逻辑思维能力、判断事物的敏锐和果断程度、思想品德、兴趣爱好、生活常识等,我们将每一个方面称为因子。显然,这里所说的因子不同于回归分析中的因素,因为前者是比较抽象的一种概念,而后者有极为明确的实际意义。因子分析在市场调查分析中也有广泛的应用。例如:对30个调查区的商业网点数、人口数、金融机构服务数、收入情况等20个指标进行因子分析,如果按照一般的分析方法,我们就需要处理20个指标,并给它们以不同的权重,这样不仅工作量变大,而且由于指标之间存在比较高的相关性,会给分析结果带来偏差。另外,给具有较高相关性的众多指标设置权重系数也是一件非常复杂的事情。于是可以考虑采用因子分析的方法,从而减少分析变量的个数,然后再给它们以不同的权数,从而计算出各个调查区平均综合实力得分,以便决定在某个调查区拟建何种类型的销售点。
4、结束语
综上所述,多元统计分析方法的应用均需借助统计分析软件,目前较多使用的有SAS、SPSS等统计分析软件,这些软件均提供了多元统计分析功能。
参考文献
[1]于秀林,任雪松,多元统计分析,中国统计出版社,1999.8