前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇农业统计分析报告范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
>> 我国近年莎士比亚研究论文统计分析 近年来我国关联数据的研究进展与分析 近年来我国财商教育研究述评 我国近年来政治生态研究综述 近年来我国农业(村)信息化研究热点述评 我国近年来信息系统安全的发展方向与研究热点 我国保险公司近年来资产配置变化的分析和未来趋势研究 我国媒介融合研究统计分析 近年来我国地价上涨的成因及对策分析 天然气发电在我国近年来应用情况的分析 我国近年来施工伤亡事故的成因分析和对策 我国近年来的“高铁”与“高铁经济”发展问题分析 近年来我国高职教育研究的关注点 近年来我国出版学学科定位问题的研究进展 近年来我国对于美国学前教育的研究述评 关于近年来我国跨境电商业的情况研究 近年来我国农村社区建设的研究述评 我国近年来的公共危机管理研究 我国档案信息服务研究论文统计分析 我国能源结构的统计分析 常见问题解答 当前所在位置:,2012-09-03.
[18]新浪博客.陕西省安监局长杨达才“傻笑门”和“名表门”事件舆情分析报告[EB/OL].,2012-09-05.
(本文责任编辑:王涓)RFID技术在我国图书馆的应用知识图谱
收稿日期:2013-04-03
第一条为了保护农业机械使用者和农民的合法权益,更好地为农机购买者、使用者和农民解决农机产品质量、作业质量、服务质量(以下统称"农机质量")方面的投诉。根据《中华人民共和国产品质量法》、《中华人民共和国消费者权益保护法》、《关于进一步改进和加强监督站、投诉站管理工作的通知》(苏消协[*]第30号)及有关规定,制定本办法。
第二条本办法所称分站是指在各市、县(市)农机主管局或其直属事业单位设立的*省消费者协会农机投诉站分支机构:*省消费者协会农机投诉站××市、县分站。
第三条根据维权工作的新形势、新要求,设立分站的目的是要进一步方便广大消费者投诉,把大量的投诉受理工作落实在基层。
第二章管辖
第四条分站按地域管辖受理农机投诉。
第五条省站在省消费者协会、省农机管理局领导下,按照规定的职能,负责全省农机投诉受理业务指导工作。
第六条分站在市、县农机主管部门的行政领导下,在同级消费者协会和省站的业务指导下,按照规定的职能,负责本行政区域内的农机投诉受理工作。
第三章机构性质
第七条分站行政上由同级农机主管局领导,业务上接受省站的指导。
第八条分站原则上应设在主管局科教质量部门或农机市场整顿("打假")办公室。
第四章职责
第九条省站职责
(一)受理重大、典型投诉。
(二)受理分站转上来的涉及面广、跨地区或性质严重的投诉。
(三)受理上级消协、有关部门、中消协农机投诉站和外省市农机投诉站转来的农机投诉。
(四)负责全省农机投诉受理业务指导、培训、督促检查工作。
(五)负责投诉受理统计,编写统计分析报告。
第十条市、县分站职责
(一)直接受理所辖范围内的农机投诉。
(二)受理由省站按地域范围转来的农机投诉。
(三)外市、县(市)分站要求处理或协助处理的农机投诉。
(四)负责本地农机质量投诉统计,编写投诉分析报告。
(五)负责本地投诉统计上报。
第五章其它
第十一条各级农机主管局要加强组织领导,明确机构,充实业务能力强、有经验的工作人员。各市、县(市)消协和农机主管部门履行对本市、县(市)农机投诉站的监督管理职责。
关键词:统计教学;实际运用;教学改革
中图分类号:G642.0 文献标志码:A 文章编号:1673-291X(2012)19-0270-02
随着经济和科技的发展,统计学已经在经济、军事、医疗、农业、气象、文化、公安及人才管理甚至家庭生活等诸多领域运用,尤其是在经济中的重要性不断增强,统计学已被教育部列为经济管理类各专业的必修课程之一。统计学一方面用来培养学生的逻辑思维能力,另一方面培养学生们的实际运用能力。其中第一方面的能力融汇于整个教学过程,但是经济管理费非统计专业的培养目的不同于统计专业,非统计专业中统计作为专业通用能力开设的,其目的是学以致用,使得学生能够学会一种解决实际问题的方法和手段,掌握并运用它,为自己将来从事的专业服务,学生们最终的目的是将学到的东西运用于实际。所以笔者认为在经济管理类非统计专业的统计教学应该加强以实际运用为导向的教学模式。
为了实行以实际运用为导向的统计学教学模式,笔者认为我们要从教学思想、教学内容、教学方法和考核形式四个方面着手改进,来探讨以实际运用为导向的统计教学模式。
一、树立以实际运用为导向的统计教学思想
经济管理类学生培养目标对应的岗位多是金融、会计、营销等行业。它的培养目标不同于统计专业,非统计专业中统计课程是作为专业通用能力课程开设的,其教学的目的不是要把学生培养成统计学家,而是要使学生在实际的生活和工作能够有意识的加以运用,在学习中获得应用统计方法解决实际问题的技能,为自己将来要从事的专业服务。所以在教学过程中要树立以实际运用为导向的教学思想。
1.应遵循“服务专业、突出应用”的原则。在统计学教学实践中,未考虑专业特点,存在着“以不变应万变”的情况,但是,与相关专业课程融合不够,难以让非统计的学生体会到统计学在本专业的运用价值,在实际需要运用时没有运用统计来解决问题的意识,更不用说运用能力。所以在统计教学中应加强“服务专业、突出运用”的原则。
在经济管理类的统计教学中应根据各个专业的需要展开教学,突出其实际运用能力的提高。设计教学大纲、教学方法和教学内容时,增加统计方法在各个专业领域的内容。例如会计专业在设计教学大纲时可以运用案例教学增加一个课时,专门来讲解统计学在财务分析、成本预测、销售预测等方面的运用。在金融专业的教学过程中,可以教授学生利用学过的统计方法搜集、整理、分析金融数据,并利用一定的预测方法来进行经济的预测等等。在市场营销专业学习指数时,可以模拟一个完整的企业的销售情况,让学生们利用不同的指数分析其销售额增长的情况,以加强其实际运用的意识并提高运用能力。通过这样的教学,加强学生们在各个专业可能遇到的实际事例,体现教学与该专业的结合,注重帮助学生树立统计意识、培养统计思想,使学生明白统计理论与方法如何在该专业领域得到应用。实践教学要组织学生学会统计手段去设计,收集、整理与专业有关的数据,用所学的统计方法去分析、解决问题。
2.应引导学生认识统计是从事一切社会经济活动不可缺少的有效手段。在教学过程中积极引导学生认识统计的重要性及其作为一种搜集、整理、分析、描述的行之有效的手段。在教学过程中,从统计的发生、发展已经运用的过程中,从广泛的实段引导学生通过初步的现象透过数据进行深层分析,进而挖掘其数据本质,发掘经济活动现象发展过程中的规律。经常引用是发生在身边的实例就会更吸引学生的注意力和关注度,从而提高学生的学习兴趣,提高教学效果。
3.应注重提高学生对统计数字的敏感性,提高统计素养。在经济管理类非统计专业学生在日常生活或者工作过程中中,经常会有很多数据。这些数据都会或明或暗地表现为某些问题显现出来,一名大学生,能否意识到这些信息,并进行合理的理解和解释。当面对各种各样的统计数据的时候,除了读出数据的表面信息外,能否进一步思考获取隐性的经济信息?例如2011年物价上涨感觉很明显的时候,为什么国家统计出的CPI只有4.4%?为什么一个在抽样质检过程中,明明有不合格产品,但是总体质量过关?这些都是需要具备一定的统计意识和统计敏感性才能认识并解释的,能够从统计的角度去认识、判断、分析和解决实际问题,能用统计思想指导工作实践,从而提高学生的统计素养。因此,应注重对非统计专业毕业学生统计学习过程中统计意识和统计敏感性的培养,这是培养和提高学生统计素养的关键所在。
二、设计以实际运用为导向的统计教学内容
1.将统计教学和统计分析软件有机结合。现代统计教学以一般教学为主,学生们在简单理解的基础上进行记忆并进行相对比较机械而烦琐的计算,而在有限课时的情况下,学生就变成了机械地记忆和不断重复的计算。未能将教学与统计分析软件运用结合起来,不会利用现代的手段来处理统计数据和分析,既不利于培养其逻辑思维能力,又使学生望而生畏,越来越与社会和科技脱节。所以以实际运用为导向的统计教学内容要与现代科技想结合,将统计分析软件加入教学内容中,不仅使得学生能简化机械的计算过程,而且增加其趣味性和实用性,同时也赢得更多的理解时间。例如现在的统计软件就有Excel、SPSS、Maple等,具体的说可以将Execl纳入统计教学内容的一部门,通过上机来学习对统计的实际运用。也可以增加一定量的课时来考虑将专门统计分析软件纳入统计学的教学内容。
2.增加统计实习教学环节,精心规划“第二课堂”。安排一定量的课时或者利用课余时间,组织学生进行一些针对各个专业的统计调查研究并进行统计分析,从选题的确定、问卷调查、样本的设计及容量的确定、调查与整理、资料的搜集、有关软件在上机的分类汇总、分析及描述,并最终形成调查分析报告。通过该实习环节,可以让学生们在统计内容上有一个整体的认识。
三、寻找以实际运用为导向的统计教学方法
1.案例教学。案例教学源于哈佛商学院,在长期的教学实践中得到不断地推广,成为一种不可替代的重要方法,在统计学的教学过程中依旧实用。
首先,在进行案例教学时要精心选择案例,既可以选择社会热点,例如在通货膨胀的时候,可以选择CPI的计算方法作为案例,既可以让大家更好的了解社会时事又可以增加趣味性和知识性。也可以针对不同的专业来选择,例如金融行业的学生可以选择不同的股票指数的计算方法来讲解指数,而会计学生则可以假设一个企业,通过对成本的分析来进行讲解,以加强专业针对性,从而提高学生们的兴趣,提高教学效果。其次,案例教学与理论教学相比,理论教学是基础,案例教学是行之有效的手段。可采用案例先行,用具体的案例引出理论讲授的重点、难点,也可在理论讲授后安排具体的案例,对教学内容中的重点和难点展开深入分析。既可以在讲解某一个知识点时运用小的案例,也可以运用一个大的案例贯穿整个多个知识点,充分发挥案例教学的作用,使案例教学对理论教学形成积极的促进作用。
2.“灌输式”教学变为“互导式”教学。注重学生统计意识、统计能力培养。在统计学教学中,既要发挥教师的主导作用 又要充分调动学生的积极性和主动给学生留下充分的思考空间,使教学单向的“灌输式”教学过程转变为“互导式”教学过程,将知识的传授与能力的培养有机的结合起来,从而提高学生们的创新能力和意识,加强其使用意识和运用能力。
四、探寻以实际运用为导向的统计考查方式
积极探寻考核形式和方法。现行统计教学中,以试卷考试为主,对学生在认识统计的实际作用上起到一定的误导,对学生的理解和运用能力都有一定的压制,所以在最终考核时应增加综合分析和统计软件的运用考核,在条件允许的情况下还可以单独组织统计实践性考核项目,要求学生自己搜集、整理、分析资料,并撰写统计分析报告。
参考文献:
[1] 宁瑄.以就业为导向探讨统计教学模式[J].内蒙古统计,2010,(4).
关键词: 多元统计分析 案例教学 教学方法
一、多元统计分析课程的特点
多元统计分析是近几十年来从经典统计学中迅速发展起来的一个分支,是一种综合分析方法,它能够在多个对象和多个指标互相关联的情况下分析它们的统计规律。随着计算机的广泛应用及统计软件的普及,多元统计方法已被广泛应用于自然科学、工程技术、生命科学、经济管理和社会科学领域,同时也促进了理论的发展。
多元统计分析属于是概率统计的一部分,复杂的数学推导、论证,繁琐的矩阵、线代计算,深奥的概率知识、抽象的概念和理论是这门课程的特点。如果有的学生学习在高等数学和概率统计的过程中没有打好基础,在最初看到该课程中大量的数学符号、公式推导时,就很容易产生畏难情绪。因此,我们在教学过程中需要配合各种统计软件包如SAS,SPSS的操作,通过简单的操作和计算,可以使学生利用多元统计分析方法解决实际问题更为简单方便,而适合的案例教学更能够将多元统计的理论和方法呈现于学生面前,加深学生对分析方法的认识和理解。
二、案例教学的特点
案例教学是由美国哈佛法学院前院长克里斯托弗·哥伦布·朗代尔于1870年首创的教学方法,后经哈佛企管研究所所长郑汉姆推广,并从美国迅速传播到世界许多地方,被认为是代表未来教育方向的一种成功教育方法。在20世纪80年代,案例教学引入我国,逐渐应用于教学过程中,并被广大教师认可。
案例教学是一种通过模拟或者重现现实生活中的一些场景,让学生把自己纳入案例场景中,通过讨论或者研讨的方式来进行学习的一种教学方法。学生在教师的指导下,根据教学目的要求,对案例进行调查、阅读、思考、分析、讨论和交流等活动,通过实例学习分析问题和解决问题的方法或道理,进而提高分析问题和解决问题的能力。一般来说,案例教学具有以下几个特点。
(1)案例的目的性。教师在教学中通过选择具有代表性的问题,让学生在案例的阅读、分析、讨论中,建立起一套适合自己的逻辑思维方法和思考问题的方式,以提高学生分析问题、解决问题的能力。
(2)案例的真实性。案例所描述的问题应是真实、客观的,不应加入编写者的主观想法。通过对真实案例的认识,学生根据自身对问题的理解,自觉利用所学的知识,得出自己的结论。
(3)案例的综合性。教学中应用的案例应具有丰富的内容,需要学生综合运用各种知识和灵活的技巧来处理。例如,教师可以通过分析、比较,研究各种各样的成功的和失败的管理经验,抽象出某些一般性的管理结论或管理原理,让学生通过自己的思考或者他人的观点来拓宽自己的视野,加深对基本原理和概念的理解。
(4)案例的实践性。通过教学案例,学生可以在课堂上接触并学习到社会实际问题,实现从理论到实践的转化。在案例分析中,不存在所谓的标准答案,学生可以独立思考,建立独特的、适合于自己的思维方式。
(5)教学的互动性。在案例教学过程中,教师引导学生参与到案例中,教师与学生之间、学生与学生之间的交流、互动贯穿其中,促使每个学生主动地探索知识,寻求规律,自觉地将所学知识转化为解决问题的能力。
综上所述,与传统教学方式相比,案例教学可以很好地鼓励学生进行独立思考。在案例教学中,学生拿到案例后,先要进行消化,然后查阅必要的理论知识。这不仅加深了对知识的理解,还加快了知识向能力的转换,在能力培养上起到了积极的推动作用。
三、案例教学在多元统计分析教学中的应用
多元统计是一门应用性很强的学科,因此,在教学中只有密切联系实际,学生所学的知识才能得以巩固和加深。由于学生平时很少有参加实践的机会,因此理论和实践难以紧密结合,更谈不上用所学的知识和方法去解决实际问题。案例教学则以学生为中心,通过对实际问题的研究、思考、剖析和辩论等一系列交互式探索,对分析问题做出明智判断,同时加深对学习内容的理解。
例如,在学习聚类分析时,老师布置学生从自己感兴趣的问题出发采集数据,要求样本量不低于30个,指标不低于5个。有人收集学生在某学期的各科考试成绩,有人收集学生的日常消费数据,还有人收集学生使用网络的相关数据,等等。根据收集到的数据特点进行聚类分析,在聚类中可以考虑不同的类的个数(如三类或四类),也可以考虑不同的聚类算法(系统聚类法或快速聚类法)进行聚类操作,还可以考虑使用不同的距离公式来计算,从而得到多组分析结果。在此基础上,通过对不同方法得到的聚类结果进行分析,可以比较出究竟是哪一种方式最适合实际数据,得到的分类结果最理想,从而引导学生理解聚类的原理和思想,掌握各种算法的异同。在这个过程中,会涉及指标的选择、问卷的设计、数据的收集、数据的整理、方法的选择、结果的分析与比较。各组学生通过合作和讨论,加深了对学习内容的理解,提高了学习的兴趣。
在学习因子分析方法时,老师给出的案例是根据上市公司的财务数据进行评价。上市公司的年报数据可以通过上网查找获得,使用十分方便。在初始分析时,老师使用统计软件SPSS的默认设置进行操作,通过得到的结果引导学生思考:按照默认操作得到的两个因子能否涵盖原有内容的大部分信息,满足分析要求?每个因子代表哪些原始指标,是否具有可解释性?如果不能得到满意的结果,就可以使用软件再次计算,并根据需要修改设置,比如提取因子的个数、旋转的方法、因子的得分,等等。对于新的结果再次进行分析,特别是根据公因子所代表的原始指标考虑其命名,使因子具有可解释性,比如体现资金实力的因子、体现盈利能力的因子、体现管理能力的因子。通过深层次的分析,学生能够熟练掌握软件的操作方法和分析实际数据的能力。
在案例分析的基础上,老师可以提出类似的问题让学生自己分析,达到举一反三的目的。具体做法是将学生分成若干小组,每组由3至5人组成,要求各小组仿照教学案例自主选题,从实际问题出发,学会应用多元统计方法来分析和处理问题。通过这种方式,学生能够分工合作,共同完成数据收集、选取、整理、计算、分析、决策,最终形成分析报告,这种练习既锻炼了学生团队合作精神,又培养了撰写报告的能力。
四、结语
多元统计分析的教学过程是一项复杂的系统工程,通过实践我们发现,案例教学是一种行之有效的教学方式,非常适合于该课程的教学。通过具体案例的分析,学生摆脱了理论学习的困惑,自觉地将所学知识应用于实际问题,真正做到了理论联系实际。在教学过程中,如何将学生的被动学习变为主动学习,如何在教学过程中有效地开展研究性学习、协作性学习、探索性学习,是教学中需要进一步探讨的重要内容。案例教学对案例资源的选择、实验设计、考核方式等均有较高的要求,在应用中还存在一些问题有待改进,我们只有总结经验,不懈努力,才能争取更大的进展。
参考文献:
[1]刘琳,丁琨.案例教学在多元统计分析课程中的应用研究[J].农业与技术,2009(6):129-131.
[2]薛薇.统计分析与SPSS的应用[M].中国人民大学出版社,2011,1.
[3]刘银萍,安丽微.多元统计分析课程教学的探索与实践[J].吉林师范大学学报(自然科学版),2011(8):96-97.
在农业经济发展领域,信息已成为一个不可或缺的因素,成为推动农业经济发展的主要动力,农村信息化水平每增加%l就可以导致产出平均增加0•735%。[1]贵州省通过前期农业经济信息化建设,已建立了完善的农业经济数据采集体系,积累了大量的数据,这些数据对于农业政策的制定,农业状况的监控,农业发展的引导,市场商机的把握,经济问题的研究来说是一笔无价的财富。但是,限于前期OLTP(联机事务处理)系统的固有局限性,无法有效利用这些丰富宝贵的数据。系统虽然对农业经济数据进行了获取,却未进行有效整合,提供的信息服务仍停留在基于网站市场信息的简单与查询阶段,人们面对的是眼花缭乱的数据,无法获取真正想得到的信息。而通过贵州省农业经济智能信息系统的建设,可以提供面向OLAP(联机分析)的服务,并进一步对数据进行挖掘,实现对贵州省农业经济数据真正有效地利用,完成从数据到信息再到知识的一个自动化过程,使得用户得到经过智能化分析处理的有用信息。对比目前的农业经济信息系统其具体有如下优点:
(一)数据的可靠性的确保
对于信息用户来说,信息首要保证的是真实。否则,即便使用了再优秀的分析方法,也是“垃圾入垃圾出”。而农业经济商业智能信息系统的建设确保了数据的正确性。首先,农业经济商业智能信息系统的数据主要源于OLTP(联机分析)系统,而OLTP的数据直接生成于业务处理时原始的数据,而非经过了处理加工了信息。其次结合技术手段,每一个通过ETL(抽取、转换、加载)的数据都能回寻到其原始数据源,使得每一个来到数据仓库的数据都有据可查,增加了数据的可信度。
(二)提供实时、多维分析服务
相比较OLTP系统,农业经济智能系统能提供面向用户的分析服务。原有信息系统只能基于固定周期向用户推送分析报告,无法实现实时信息分析。例如政府决策者临时对于某个农业经济问题进行讨论,需要相关的信息分析进行支持,原有的信息系统无法在短时间内提交用户定制的信息分析,而智能信息系统可以提供基于web的实时的分析服务。其次,原有信息用户对于信息只是被动地接受,无法根据自己感兴趣的维度(dimension)观察分析数据,而智能信息系统提供了多维分析联机分析(OLAP)服务,信息用户可以根据自己的需要动态更改分析维度,满足定制分析的需要。
(三)提供基于历史的数据分析
原有的系统,例如农经网系统,为了平衡系统效率,只能提供给用户6-12个月的数据,之前的信息被闲置,而这些信息对于经济分析,趋势预测十分重要。农业经济商业智能系统的一大优点就是通过对于历史数据的清理整合,使得用户能够获取长期(超过5年)的历史数据,实现进行基于历史的分析。
(四)面向不同的用户
农业经济信息的用户范围十分广泛,从政府政策制定者到个体农户、农产品经营者都需要农业经济信息,但之前的分析服务用户面狭窄,其分析只能事先设计、定期推送,局限了用户群体。而农业智能信息系统却可以提供面向不同用户的差异服务。(五)开放性贵州省农业经济智能系统提供了一个开放的平台。首先,其预留了未来与其他数据仓库整合的可能,例如与贵州省的气象数据、地理信息数据的整合,以及通过web数据抓取整合web上的信息,例如其他省份的农业经济数据,农业期货数据等。而这些信息的加入,能大大扩充数据以及信息观察的角度,满足更多分析需求。
二、贵州省农业经济智能信息系统的设计
(一)数据源特点
贵州省农业经济智能信息系统的数据源主要基于贵州农经网系统,该系统以“天”为时间粒度记录了贵州省各地区农产品商品价格,并基于地理区域、产品类别对数据进行了划分。其信息数据采集站点遍布贵州省各地农产品市场,并通过在线系统每天上报,迄今已记录了6年的贵州省农产品价格。以2006年为例,农经网系统共记录了贵州省471个农产品市场的1830266条农产品价格记录。基于农经网数据的真实性、充足性,十分适合作为数据仓库的数据来源。
(二)需求分析
1.用户划分。通过实际调查分析,发现潜在信息用户可以分为一般信息分析人员、相关商业用户(农产品公司、个体农户等)、农业政策决策者(相关政府部门)、农产品价格研究人员(高校、研究所等),各类用户对于信息分析有不同的需求。例如对于信息分析粒度、信息分析的周期、是否需要预测都存在不同的要求。由于一般信息分析人员需要每周或每月提交文字型的分析报告,其需要的是详细的数据分析支持功能,并以周或月为时间单位分析农产品走势。而作为农业政策的决策者,其感兴趣的是以年为时间单位的农产品经济数据的分析,需要的是已经过统计处理的概括数据,更多使用图表作为分析工具。作为研究人员,其对于长时间的数据(例如2003年到2009年)的统计分析和未来的信息预测更感兴趣,并且也希望获得概括性的统计数据、图表。当然政策决策者对于数据挖掘也有需求。而对于商业用户,他们对于基于时间段的不同地区农产品价格的对比、最新的数据实时分析,以及农产品价格走势预测抱有兴趣,而对于历史数据分析兴趣不大。
2.功能分析。综上所属,不同类型的用户需求虽有差别,但是也存在共通点。通过需求分析,最终贵州省农业经济智能信息系统计划实现以下功能:
对农产品价格数据进行旋转、切片、切块、向上综合和向下钻取等多维分析,以获得多角度、多粒度历史数据;
进行多种农产品价格指数的计算;
实现对于农产品价格的数据挖掘,并实现对于农产品价格的预测;
实现分析数据的可视化展示平台。
(三)后台数据仓库的概念设计
数据仓库是贵州省农业经济信息系统的核心,也是信息分析以及数据挖掘的基础。数据仓库的概念模型设计必须基于实际调查,结合实际信息分析需要以及数据源的结构,设计错误的数据仓库模型将会导致整个智能信息系统的失败,产生错误的信息。数据仓库模型的概念设计主要涉及设计维度表、事实表以及维度表与事实表、维度表之间的关系。
1.关键维度
(1)地理维。地理维(Geographydimension)以“市场”为粒度,记录了与农产品价格相关联的贵州省地理信息,是数据仓库的关键维度之一,也是数据分析中最常用到的维度,并且也是与其他事实表、维度表联系最多的维度。其结构为:(主键:Geog-raphyKey;候选键:GeographyAlternatekey;地区名:GeographyDistrictName,县、市名:GeographyCoun-tyName…)。其中GeographyKey为维度表主键,Ge-ographyAlternateKey为候选键,通过该字段可以回溯数据源,增加数据仓库的可信度。该纬度在设计时考虑到了贵州省农业经济实际情况,设计地区(例如黔西南地区)到县、市(例如安龙)到市场(例如新桥农贸市场)的层次结构(hierarchy),而不直接套用通用的地理信息,否则无法满足实际分析的需要。
(2)时间维。时间维(timedimension)是数据分析最常用到的维度,其结构为:(主键:Time-Key;年:year;月:Month;日:day;年中文名:Chinese-YearName;节日:DayOMfonth;特殊事件:SpecialEv-en;t本日对应月第几天:DayOMfonth….)。其中年、月等的中文名属性的设置是为了后期分析时便于展示,DayOfYear,DayOMfonth属性的设置是为了便于实现农产品同期价格的对比计算。因为业务主题是时间序列的。农业经济数据仓库中时间维度以“天”为粒度记录了时间描述信息。在设计时间维时必须考虑到后期数据分析以及数据挖掘的需要,而不是单纯地从已有OLTP系统进行抽取,例如考虑到农产品价格波动与节假日关系很大,故在时间维设计时应加入“节假日指示”属性,考虑到贵州为少数民族集聚区这一特点,在填充该属性时候不但应记录“春节”、“中秋”等较普通的节日,而且还应记录“地戏节”、“三月三”等各个地区少数民族特有的节日。同样考虑到特殊因素,例如“甲型H1N1型流感”对农产品价格的影响,应设置“特殊事件”属性。最后,还应添加“节气”,“季节”这两个对于农产品价格关系较大的属性。
(3)产品维度。产品维度以“产品”为粒度记录了农产品信息,其结构为:(产品名:ProductName;产品子类别外键:ProductSubCategoryKey;单位:Uni;t渐变维度开始时间:StartDate;渐变维度结束时间:EndDate….)。农产品的产品纬度设计较为复杂,特别是结合贵州省的实际情况,一些农产品归类与通用归类不同,例如“菜籽”标准分类应该是“食用油”,但由于贵州省主要将菜籽用于副食品加工,故也可将其归位“副食品”,这主要取决于最终用户的分析角度,但也必须考虑未来与其他数据源的接口,过于特殊化的设计不利于与其他数据源的统一,不利于数据仓库的扩充。产品维度表也是所有维度表中变化最频繁的维度表,随着时间推移不断改变,属于渐变维度(SCD,slowlychangingDimension)。例如“产品名称”属于1SCD(changing),对于历史的产品名称不做保存而直接更改。而“产地”属性,由于后期数据分析对于历史产地感兴趣,故将其设置为2SCD(histori-cal),当进行数据加载时不更新原有数据信息,而是新添加一行以保持历史数据。StartDate与EndDate相结合标示目前数据行是否失效,或者说其是否是历史数据。
(4)信息提供者维。它主要记录了各个市场的信息提供者的相关信息,该维度与地理维相链接。主要用于支持后期对信息提供点贡献度的分析,与绩效考核的计算。
2.事实表的分析设计
相对而言事实表的设计较为简单,但是由于事实表的数据量远远大于维度表(仅2006年数据就达到百万级),对于事实表属性的数据类型设计显得十分重要,好的设计可以大大缓解数据仓库的爆炸性增长情况。根据业务主题的特点,分别用与之对应的度量值对其事实表进行填充。
3.农产品交易事实表(FactTrading)
主要记录了农产品的价格信息,来源于多个数据库,对于其的数据清理与转换工作量较大,由于存在多数据源,原有的价格记录主键(OriginalID)出现了重复,失去了唯一标示的意义。跨越时间为2003—2009年。其结构为:(产品单价:UnitPrice;地理维外键:GeographyKey;产品维外键:ProductKey;信息提供者维外键:InformationProviderKey;时间维外键:TimeKey;原有价格记录号:TradeOriginalId….)其中,地理维、时间维、产品维度等外键构成了事实表的联合主键。
(四)数据仓库总体结构设计
数据仓库的设计常常采用的是星型模型和雪花模型。但应尽可能采用星型模型,这是由于维度表的作用是提供便利分析的角度,雪花模型虽然可以减少维度表空间,但增加了通过维度分析数据的难度,并使得数据仓库结构变得更为复杂。[2]故在数据仓库设计时,只在产品维(Productdimension)的设计上采用了雪花结构,这是由于产品维中包含了“类别属性”,“子类别属性”,“产品名”等通过字符描述的属性,如果采用星型结构,以上属性重复将过多,数据不一致可能性较大,故采用雪花结构避免这种情况的发生。如前文所述,农业经济智能信息系统的一大优点就是其开放的结构,可以通过网络数据抓取、接入新的数据源等方式获得新的信息,构建新的事实表,例如上图中的产品库存事实表、气象信息事实表、期货交易事实表等。并且由于新的事实表与原有事实表可以共享维度,使得分析者可以在结合共同维度对不同的信息进行分析,例如结合农产品价格事实表数据与农产品库存事实表数据以及气象信息,并以时间和地理作为分析维度进行多维分析,能发现出这三类信息间的潜在关系,并以直观分析报表形式展现。
三、贵州省农业经济智能信息系统的初步利用
最终设施阶段,首先基于上述数据仓库模型设计对应ETL程序,导入相关的数据,并利用MDX作为多维数据查询语言实现分析,并在SqlServer2008下AnalysisService进行部署,利用.net技术实现前台的web展现,最终实现了贵州省农业经济智能信息系统的实施,达到以下功能。
(一)多维分析功能的实现例如,图2演示了通过结合地理纬、时间维对于多维数据进行切块,然后对数据进行下钻(drilldown)得到详细信息,同时通过图表进行同步展示,最终直观的得到两地区(毕节、铜仁)在对应时间段上对于农副产品的价格走势对比。
(二)价格统计分析功能的实现在结合下钻,上钻,切块等多维分析的同时,还可以根据已有的对农产品的分析方法,例如定基价格指数、同比指数、环比指数等对数据进行统计分析。
(三)KPIs功能的实现如需求分析中所述,农业政策决策者需要的是一种高度概括性的状况信息,而不是繁琐的数据,理想的状况是通过对于状态的一览,就可以了解目前农产品价格是否出现了异常。通过对于关键业绩指标(KeyPerformanceIndicators)的实现,可以很便捷地达到这一目标。例如,首先通过实际调查了解到,决策者认为农产品价格上涨或下跌某百分比值便认为出现了价格异常。在智能信息系统开发中结合MDX语言,编写相应代码,实现KPIs对应的报警功能,最后再实现对用户友好的、直观的前台展现(十字形为异常,三角形为可接受,圆形为正常)。
(四)农产品价格预测功能的实现如前文所述,信息用户不但对于已有历史数据的分析感兴趣,他们更想得到农产品价格等数据的未来走势预测,而这正是数据挖掘的任务。数据挖掘指的是分析数据,使用自动化或半自动化的工具来挖掘隐含的模式,预测正是数据挖掘的一项重要的部分[3]。贵州省农业经济智能信息系统中利用了相应的时序算法,利用智能信息系统内数据仓库中时间序列数据集,结合连续的观测值,进行一般的趋势分析、周期性分析和噪声过滤,得到对于农产品价格的趋势预测。