前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇农业预测方法范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
为切实改变五华县特色农业发展有产品无品牌的现状,我们加大了对特色品牌创建的扶持和奖励力度,积极引导企业转变发展方式,充分认识品牌也是企业的无形资产,树立现代经营理念,规范企业管理,提高产品品质,鼓励企业、合作社积极开展“三品”认证,培育创建特色农业品牌。至目前,全县已培育创建茶叶、大米、柿花、腐竹等省级名牌农产品8个,无公害农产品认证33个,认证面积453.33多hm2(6800多亩),在名牌农产品创建上取得不断突破。
2发展特色休闲农业的必要性
2.1有利于农村经济发展
一是通过发展特色休闲农业加强基础设施建设,改善农业生产条件,提高生产能力,进一步增强农业生产地位,加快农业和农村经济发展步伐。二是通过发展特色农业建设一批规模化、标准化的农产品生产基地,打造一批农业品牌,形成区域性支柱产业,将资源优势转化为经济优势,实现农业增效,农民增收。
2.2有利于农业结构调整
发展特色休闲农业是农业结构调整向深度推进的重要途径,是发展现代农业的重要方式和实现途径。利用五华县丰富的农业资源因地制宜发展“名优希特”特色农产品,打造产业群、产业带。不断培育创建特色农产品品牌,增强农产品市场竞争力,通过实现农业资源的多层次、多途径、多方面的开发利用,开辟新的市场空间,促进山区农业结构优化升级。
2.3有利于保护生态环境
发展特色休闲农业是从遵守自然规律和经济规律的要求出发,发展既能合理利用和有效保护资源,又具有显著经济效益的产品,调动农民进行生态建设的积极性,为农业和农村经济持续稳步快速发展提供生态安全保障。
3发展特色休闲农业的对策
3.1抓基地扩规模
在稳定粮食生产,推进国家级粮食主产区建设的同时,加大政府扶持奖励力度,以耕山致富为抓手,扎实推进“一镇一品”、“一村一品”建设,围绕巩固提高老基地,开发建设新基地的发展思路,不断扩大特色农业基地规模和管理水平。3.2抓园区强示范围绕生态休闲旅游农业的要求,充分整合各级各部门的资源和资金,突出重点、分步实施,建设河东茶亭岗金柚公园、广东清闲农业、松岗嶂生态茶园和转水益塘水库、兴鸿润农业、热矿泥山庄三位一体的“山、水、泥”特色休闲农业旅游区。
3.3扶龙头促加工
加大农业龙头企业扶持力度,大力发展农产品精深加工,重点扶持云溪圣峰、登云嶂建设茶叶加工厂;建设双华镇竹山村板栗保鲜、加工厂,推动板栗专业镇建设;大力发展优质米加工,努力打响“真田牌”有机米品牌;主动与广州市番禺区的对接和争取支持,规划建设一个较具规模农产品冷藏库,切实解决我县水果、蔬菜丰产期贮藏问题。
3.4抓特色创品牌
在全面完成特色农产品展示中心建设,扩展建立农电商务平台,拓宽销售渠道,提升品牌效应的同时,围绕具有我县特色的名优农产品,引导企业建立从生产、加工、销售等环节的质量标准体系,抓好产品分级、包装设计、商标注册,积极开展无公害、绿色、有机食品认证,力争培育创建更多
3.5抓项目强基础
积极实施项目带动战略,重点抓好高标准基本农田建设、农业综合开发等农业基础设施项目建设,努力改善农业生产条件,提高综合生产能力。
3.6抓改革促发展
关键词:玉米;总需求预测;需求结构预测;误差;方差分析
中图分类号:F326.11 文献标识码:A 文章编号:0439-8114(2017)13-2597-04
DOI:10.14088/ki.issn0439-8114.2017.13.048
A Comparison of Accuracy Between Total Forecast and Structure Prediction
of Corn Demand
YUAN Meng-ye1,2, LI Xiao-yun1, HUANG Ma-lan1
(1.College of Economics & Management, Huazhong Agricultural University, Wuhan 430070, China;
2.Jiyang College,Zhejiang A&F University,Zhuji 311800,Zhejiang, China)
Abstract: Based on analysis of representative domestic literatures related to the corn demand forecast, the deviations between predicted and observed values were emphatically calculated, and the errors between total demand forecast and structure demand prediction were compared with ANOVA. The results showed the accuracy of structure forecast was higher than that of total forecast. The forecast of corn demand structure could not only more directly present its tendency in China, but also clearly reflect the values of each error. So it would be favorable for the future adjustment of forecast method, so as to enhance prediction accuracy.
Key words: corn; demand structure; forecast; error; analysis of variance
玉米自2012年以来成为中国第一大粮食作物,随着人们生活水平的提高以及对高蛋白食品需要的增加,在未来一个较长时期内其需求都将保持较快增长。玉米不仅是重要的口粮,更是畜禽的主要饲料之一。学者们认为未来中国粮食需求增长主要是饲料粮需求的增加,粮食问题主要是饲料粮问题[1]。同时,近年来美国等发达国家大力发展燃料乙醇的生产及应用,中国大多数生物燃料乙醇以玉米为原料[2]。随着时代的发展,玉米消费结构发生了变化,单纯地判断未来玉米的总需求趋势已不能很好地把握玉米的发展方向,只有将玉米需求进行细分并预测,才能为中国玉米及相关产业的发展提供更准确的依据,为中国粮食供需平衡对策研究提供帮助。
粮食需求预测的文献不胜枚举,玉米需求预测的文献也较多。随着玉米需求的不断增加,预计未来玉米需求预测和分析的方法会层出不穷,审视不同方法之间的准确性差异及导致差异的原因,可榻窈蟮髡预测方法、提高预测精度奠定基础。本研究在有关玉米需求预测的近百篇文献中挑选了9篇有代表性且有具体预测值的文献,对其预测值与实际观测值进行比对,并利用SPSS软件对预测误差进行方差分析,从而分析玉米总需求预测和玉米需求结构预测两种方法的准确度。并对其产生误差的原因进行分析,为今后预测方法的选择及实施提供依据。
1 数据与方法
1.1 数据来源
本研究从有关粮食需求预测、玉米需求预测的近百篇文献中挑选了数篇有代表性且有具体预测值的文献,并按总需求预测方法和需求结构预测方法进行归类。此外,所有的玉米实际消费数据均来自布瑞克大宗农产品数据库。
1.2 预测准确度分析方法
1.2.1 指标选取与计算 将学者预测所得的历年玉米需求预测值与布瑞克大宗农产品数据库中的历年实际观测值进行比对后,利用公式(1)算得预测误差。
预测误差=■×100% (1)
1.2.2 误差比较方法 方差分析(ANOVA,Analysis of Variance)是通过分析数据的误差来源检验多个总体的均值是否相同,用于两个及两个以上样本均数差别的显著性检验。由于本研究只涉及一个控制变量,即预测方法对预测误差的影响,因此选择单因素方差分析。
方差分析原假设H0:用两种方法预测玉米需求所产生的误差的平均值无显著性差异。方差分析采用的检验统计量是F统计量,数学定义为:
F=■=■ (2)
给定显著性水平为α=0.05,与检验统计量的概率P值进行比较,如果概率P值小于显著性水平α,则应拒绝原假设,认为预测方法对预测误差产生了显著影响;反之,则应该接受原假设,认为预测方法对预测误差没有产生显著影响。
2 结果与分析
2.1 中国历年玉米消费变化
中国玉米消费需求目前主要分为口粮、饲用粮、工业用粮、种用、耗损等5个方面,消费量呈上升趋势。2015年玉米总消费量增长至19 233.0万t,较1991年的9 574.3万t翻了一番。自1985年以来,随着中国经济的持续发展和人民收入的不断提高,国民对粮食需求不断增加的同时,食物消费结构也发生了较大的改变。城乡居民对玉米口粮的直接消费逐年减少,对畜禽产品的需求不断增加,玉米作为主要的饲料粮,其需求也随之增加。
由图1可见,玉米作为口粮的消费量逐年减少,1991年占玉米总消费的近20%,到2015年仅占消费总量的5.7%。饲料消费是玉米消费需求的主要部分,是目前玉米消费的最大渠道,也是中国玉米消费增长的重要因素。口粮消费量的减少和饲料粮消费量的增加反映了中国食物膳食结构不断优化。中国玉米加工业起步于20世纪80年代后期,已经发展了20多年,加工能力不断提高[3]。1991~2015年玉米工业用粮量增长了5 000万t,年均增长率达10.1%,是中国玉米消费中增长势头最快的部分。玉米工业加工消费所占比重越来越高,已达19.1%,有效缓解了玉米增产带来的过剩问题,同时也调节了中国玉米市场供求关系。近年来,受玉米加工业的影响,饲用玉米量虽稳步增长,其占总消费量的比重却由1995年的76.9%下降到2015年的62.4%。科技的进步、配套设施的完善使玉米种植效率不断提高,每公顷玉米地的种子用量由1991年的56.5 kg下降到2014年的31.5 kg。在收获、运输、贮藏、加工过程中,不可避免地会有损耗,但由于计算方式不同,玉米损耗的估计存在很大差异。从1991~2015年的损耗情况看,每年的损耗约在2%。
2.2 预测误差计算
本研究比较玉米总需求预测方法和需求结构预测方法之间的准确度,对各学者的预测按不同预测方法进行了归类,将学者们的历年预测误差通过误差方程计算,并进一步算得历年平均误差、历年平均绝对误差以及误差的标准差,见表1。
由于误差存在正负,平均误差不能很好地代表误差的总体情况,因此选用平均绝对误差对各学者的预测误差进行分析。观察表1发现,总需求预测的平均绝对误差均大于10%;而需求结构预测的平均绝对误差除孙月新的低产低销方案外均低于10%。由此可粗略判断,总需求预测方法的准确度低于需求结构预测方法的准确度。
标准差能反映一个数据集的离散程度。总需求预测误差的标准差普遍大于需求结构预测误差的标准差,这表明两者相比,需求结构预测误差更稳定。由于廖永松[4]对全球2010、2020、2030、2040年共4年的玉米需求量进行了预测,有效数据只有2010年,无法计算误差的平均值及标准差。但计算其对2010年全球、美国、中国、巴西、墨西哥、日本、印度的玉米需求预测误差发现,其误差平均值为-19.42%,标准差为0.170 9,误差较大。
同时,将使用总需求预测方法的历年预测误差和使用需求结构预测方法产生的误差制得图2,由两条预测误差线和零误差线分别进行对比。由图2可以看出,从整体上看,总需求预测误差线偏离零误差线,且偏离程度较大,这说明对玉米总需求进行预测存在较大误差且不稳定。而需求结构预测误差线在零误差线上下波动,只有个别点偏离零误差线程度较大,说明按需求结构对玉米未来需求量进行预测产生的误差较小且较稳定。图2和表1只呈现了误差的大致情况,两种预测方法产生的误差之间是否存在明显差异,需要进一步通过方差分析来判断。
2.3 误差方差分析
使用SPSS软件对预测误差进行单因素方差分析,其中控制变量为预测方法(总需求预测方法和需求结构预测方法)。
表2是对样本的描述性统计,其中总需求预测方法的样本量为8,误差均值为-17.00%,标准差为9.09;需求结构预测方法的样本量为33,误差均值为-6.21%,标准差为7.19。从误差均值来看,需求结构预测方法的误差比总需求预测方法的误差小10.79个百分点。
方差分析的F检验,是以各个实验组内总体方差齐性为前提的,因此应该在方差分析之前,对各个实验组内的总体方差进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致。样本方差齐性检验结果见表3。从显著性概率上看,P=0.221,大于0.05,说明各组的方差在α=0.05水平上没有显著差异,即方差具有齐性,可以进行方差分析。
从表4可以发现,方差来源包括组间离差、组内离差和总离差。预测误差的离差平方总和为2 983.672,在预测误差的总变差中,不同预测方法可解释的变差为749.425,抽样误差引起的变差为2 234.247,它们的方差分别为749.425和57.288,相除所得的F统计量的观测值为13.082,对应的概率P值为0.001,小于0.05。针对原假设H0,组间均值无显著性差异(即用两种方法预测需求后产生的误差平均值无显著性差异),在显著性水平α为0.05r,由于概率P值小于0.05,因此拒绝原假设H0,表明总需求预测误差和需求结构预测误差之间有显著差异。
综合以上图表,玉米总需求预测误差和需求结构预测误差之间有显著差异。需求结构预测方法比总需求预测方法更稳定,准确度更高。
2.4 预测误差原因分析
对玉米进行总需求预测的学者都产生了较大误差,究其原因后发现,廖永松[4]利用WATER-SIM模型预测的结果偏低且误差较大,主要原因是其假设各国工业用粮不会大幅增长,低估了工业生产对玉米的需求,仍将玉米需求增长归因于饲用消费的增长。陈永福[5]用线性回归模型对玉米总需求进行预测,其变量只涉及人均纯收入(或人均可支配收入)和食品价格,在饲料用粮和工业加工用粮快速增长的时代,仅仅涉及收入和价格两个因素是不够的。
对玉米的需求结构进行预测虽也存在一定误差,但与总需求预测误差相比,其误差较小,且更容易判断误差来源。具体以2010年的预测值为例,综合各误差项后发现,学者们均低估了玉米总需求量,其中饲料用粮、种用误差较低,而食用、工业用粮和耗损的预测误差普遍偏高(表5)。
玉米用作口粮和饲料粮的部分,主要与人口总量、居民收入水平等因素有关,随着人们饮食结构的改变而变化。口粮与饲料消费预测偏差的主要原因是学者们低估了人民收入水平提高的速度,以及收入对食品消费结构造成的影响。玉米工业用粮的预测值存在较大误差,主要原因是低估了工业加工需求量的增长速度。一方面中国各种玉米变性产品的生产刚刚起步,产量也很小,学者们很难把握其发展进度;另一方面在分析玉米需求影响因素时重点提及人口、收入、城市化三大因素,而这三大因素主要影响的是口粮和饲料消费,对工业用粮的影响相对较小,而学者们并没有提出针对工业用粮的影响因素,从而导致了较大误差。玉米种用量的预测依赖于单位面积用种量以及播种面积的准确估算,而耗损的预测误差则与库存量和运输量有较大关系。虽然学者们对损耗部分的预测误差都很大,对种用量的预测误差也不小,但是由于损耗和种用占总需求的比重甚小,因此其对总需求的预测误差影响也很小。相比之下,食用、饲用、工业加工的相对误差虽不及损耗大,但对总需求的影响却非常大。由此可见,食用、饲用、工业加工作为玉米消费的主要部分,对玉米总需求的预测准确度具有根本影响,如何准确把握它们的变化趋势及未来消费量,对玉米需求预测具有重要意义。
3 结论与讨论
玉米消费结构中的每一个部分都对玉米及其相关产业的发展具有重要意义。食用、饲用玉米量的多少直接反映了中国居民膳食结构的变化,用种量反映了中国育种技术、栽培技术等农业技术的水平。玉米加工产业的发展有效缓解了玉米增产带来的过剩问题,调节了中国玉米市场供求关系,玉米的应用价值被不断开发利用。
研究发现,总需求预测误差和需求结构预测误差之间有显著差异。需求结构预测的误差明显小于总需求预测的误差,两者相差10.79个百分点,且需求结预测方法比总需求预测方法更稳定。此外,分用途对玉米需求进行预测,在呈现未来玉米需求走势的同时,更直观地反映了中国玉米需求的组成及变化趋势。同时,该方法明晰了各部分预测误差的大小,便于日后调整预测方法,从而提高预测精度。在未来的需求预测研究中,若是能准确细分需求结构,并运用合理方法对各个部分进行预测,从而把握总需求的变化趋势,定能提高预测的准确度。
参考文献:
[1] 廖永松,黄季j.21世纪全国及九大流域片粮食需求预测分析[J].南水北调与水利科技,2004(1):29-32.
[2] 郎晓娟,郑风田,崔海兴.中国燃料乙醇政策演变[J].林业经济,2009(3):29-33.
[3] 王 江,谷凤久,景 波,等.国内外玉米加工产业发展比较研究[J].经济视角,2007(2):32-34.
[4] 廖永松.全球玉米需求增长趋势与预测[J].农业展望,2009(8):30-33.
[5] 陈永福.中国粮食供求预测与对策探讨[J].农业经济问题,2005(4):8-13,79.
[6] 陆文聪,黄祖辉.中国粮食供求变化趋势预测:基于区域化市场均衡模型[J].经济研究,2004(8):94-104.
[7] 冯 敏.中国玉米需求分析[D].西北农林科技大学,2011.
[8] 翁凌云.基于生物质能源背景下我国玉米供需平衡分析[D].中国农业科学院,2010.
[9] 刘笑然.中国玉米中长期供求分析及调控研究[J].粮食与油脂,2001(2):16-21.
[10] 孙月新.我国的玉米经济:供给与需求分析[D].北京:中国农业科学院,2007.
关键词:电网规划;电力负荷预测方法;分析;比较
中图分类号:F470.6 文献标识码:A
由于电力市场的逐步完善以及电力改革的进一步深入,对于自负盈亏和自主经营的电力企业来说,电力负荷预测在电网运行和电网规划中的重要性不言而喻。当前电网负荷预测方法有很多种,选择最恰当的方法来提升电网负荷预测准确率是电网运行的重要内容之一,因此必须要对电网负荷的变化规律和影响因素做细致分析。
1电力负荷预测的实施基础
1.1资料收集和整理
要对电力负荷进行预测就要对电网运行的历史数据、国民经济的发展状况、地区城乡发展规划和国民经济整体计划等资料进行收集整理。然而,一些与电网负荷预测有关的资料由于各种原因很难完整收集起来,即使收集到资料,某些数据可能并不准确。因此电网运行资料收集之后还需要对这些资料进行分析和筛选。要想对一个地区的电网运行作出预测,就需要全面收集该地区的发电量以及电网直供量等资料,注意避免出现遗漏或者重复情况,以免影响最终的预测结果。
1.2电力负荷发展分析
电网预测区域越大,供电负荷增长变化较大,必须分析出现这种情况的根本原因。如果条件充分,要对电网预测区域内的主要供电区域和用电量大的用户分别预测和计算,做单独的分析和研究。
1.3协调规划
根据现阶段我国经济发展的情况来看,当前我国经济具有较快的增长率,尤其是第二产业和第三产业增长情况更为突出,经济的发展必定带动城镇的建设和工业的建设,做好电网规划对加快地区经济的发展具有十分重要的作用。省级电网规划要以市县级电力负荷预测分析为基础,协调规划市县级电网规划。
2电力负荷预测的原理
建立电力负荷模型是开展电力负荷预测最有效的方法,电力负荷模型包含电力负荷的时空特性、负荷电压和频率特性。电力负荷的时空特性是指电网会随着空间分布和时间变化而产生不同的负荷,这种负荷模型通常情况下比较复杂,一般采用负荷时间曲线来描述这种时空特性,负荷曲线以时间来划分可以分为年度负荷、季度负荷、月度负荷和日负荷;按照负荷的性质可以分为生活负荷、农业负荷、工业负荷和市政负荷等。
负荷预测模型不仅需要对电网进行实时或者短期的负荷预测,还需要对电网规划和发展做长期的负荷预测,通常采用概率统计来预测负荷,需要注意的是,预测电网未来的负荷,在客观上必定存在一定的误差,产生误差的根源是存在一些影响电网运行的不确定因素以及与电网负荷变化规律不相符合等情况,总体来说,负荷预测模型的准确性还是很高。
3电力负荷预测方法分析
3.1单耗法
单耗法是按照电力负荷量的单耗来推算出全面的用电量的方法,这种预测方法通常运用在部分农业或者有单耗指标的工业电力负荷预测方面,是一种直接有效的预测方法。进行具体单耗指标预测时,必须结合地区经济发展的实际情况以及发展目标,通过分析单耗指标在规划期内的产值指标,同时统计过去一定阶段内的单位耗电量,按照产业调整和发展规律,进而测算出单耗。这种方法的优点是预测方法比较简单,对于短期内的负荷预测效果最佳,缺点是预测精度较差,并且整个预测过程需要耗费大量的人力和财力。
3.2趋势分析法
趋势分析法又称为曲线回归法、曲线拟合法或者趋势曲线分析法,这也是当今应用最多和研究成果最丰富的定量预测方法。趋势分析法是根据以前的相关资料来拟合一条曲线,并且这条曲线能够反映出负荷的增长和发展趋势,然后根据曲线的增长趋势来估算未来某一个时间段的负荷值。常用的趋势模型有多项式趋势模型、线性趋势模型、冥函数趋势模型、对数趋势模型、指数函数趋势模型、龚波茨模型和逻辑斯蒂模型等。选择趋势模型比较简单,在拟合曲线的过程中需要精确度同拟合区间的一致性,选择合适的趋势曲线模型能够得出较好的预测结果,不同的曲线模型其误差也比较大,关键是结合区域电网发展情况,选择合适的曲线模型。分析1995年以来广东省惠州市的用电量,具有明显二项式曲线模型的特征,利用该曲线模型预测惠州市2012年的用电量为8.63TWH。
3.3回归分析法
回归分析法又称为统计分析法,其应用也比较广泛,需要确定影响因子之间的关系以及预测值。电力负荷预测的回归分析法主要是对该区域的用电量的历史资料和影响因子进行统计分析,确定影响因子和用电量之间的函数关系,从而实施电力负荷预测,是一种具体的、行之有效的预测方法。但是回归分析中,选用的影响因子和因子的表达方式都是一种推测,因而回归分析法受到一定的限制。对惠州市的国民生产总值和用电量以及人口等数据进行分析,得出惠州市用电量回归方程为W=-0.984+0.0727V+0.103N,V表示惠州市当年国民生产总值;N表示当年常住人口。通过该预测模型,珠海市2010年的用电量为7.594TWh。回归分析法是对过往的历史数据进行分析以及研究影响因子同电力负荷的内在联系,通过预测该地区经济发展情况来预测未来电力负荷,因此这种预测方法不仅需要准确的预测模型,还需要准确的影响因子参数。
3.4灰色模拟法
灰色理论是由我国邓聚龙教授提出,主要用于研究信息不完备时进行模拟的数学方法。我们将部分信息未知和部分信息已知系统称为灰色系统,灰色模拟法是运用模糊控制的观点,将运筹学和自动控制相结合的数学分析方法。对历史数据的不同选择和数据处理方法不同都会影响负荷预测的结果。该预测方法的优点是计算简单,对样本需求量比较小,精确度较高。
3.5负荷密度法
不同功能的用电区域,其负荷的密度也存在明显的差异。负荷密度法是将待预测的区域分为若干个不同功能的用电区域,例如商业区、工业区、生活区等,然后结合该区域的经济发展、居民收入和人口发展规划等情况,结合国内外相似区域的用电量水平,估算出合适的密度指标,进而得出该区域的用电负荷,计算公式为:W=Ad,A表示土地面积,d表示该区域的用电密度。该方法适合于土地规划比较明确的城镇区域,对于人口分布比较分散和用电类型混乱的地区不适用,负荷密度法通常用于城市新区的负荷预测,因为这些区域的城市功能划分比较细致和明确,干扰因素比较少。
4电力电荷预测方法分析与比较
通过以上的分析可以看出,不同预测方法从建模的出发点、所需要的数据样本和适用条件都有所不同,要想在同一评判尺度下进行比较是不科学的。
从适用条件来看,趋势分析法和回归分析法主要用于统计规律的描述和研究,适合于大样本,能够对历史、现在和未来发展情况进行同时预测。单耗法需要依据历史统计数据,分析影响单耗的因素的基础上,确定单耗指标,结合区域经济的发展来预测负荷。灰色模拟法是对原始数据进行整理和分析,主要适合于信息条件比较贫乏的预测和分析。
5总结
电力负荷的各种预测方法都具有各自的适用范围和优缺点,必须结合区域实际状况,从预测目标、预测花费和预测精确度等方面选择合适的预测方法。预测过程中要根据实际情况评估预测的准确性,以便及时调整预测方法,提高精确度。
参考文献:
[1] 鲍建飞.电力负荷预测方法在配网规划中的应用[J].仪器仪表用户,2008(5):126-127.
Abstract: The grain output of Guangdong Province has been declining in recent successive years, and the situation of grain security is becoming increasingly serious. In order to make effective grain security countermeasures and facilities planning, it is of vital importance to accurately forecast the grain production and other indicators. After studying the commonly used forecasting methods of grain production, such as exponential smoothing and grey system, finding that the prediction results of these methods cannot meet the needs of the research. Considering the changing characteristics of grain production in Guangdong Province, the paper attempts to combine factor analysis and support vector machine to construct a FA-SVM combined forecasting model of Guangdong Province. The results show that compared with the other single forecasting models, the new combined forecasting model has better prediction accuracy and generalization ability.
关键词: 广东省;粮食产量预测;支持向量机;因子分析
Key words: Guangdong Province;grain output forecast;support vector machine(SVM);factor analysis(FA)
中图分类号:F326.11 文献标识码:A 文章编号:1006-4311(2015)12-0253-04
0 引言
广东省作为中国改革开放的排头兵,是经济、文化最发达的地区之一。然而,由于大量流动人口的存在,导致粮食需求量激增;另一方面,经济的迅速发展占用了大量土地,导致粮食产量年下降率达到5%(1997-2006,近年来才有所回升),粮食缺口逐年拉大,粮食安全形势非常严峻。在这种人多地少的现状下,如何有效地满足人们对粮食的需求、保证粮食的充足性与稳定性是广东省需要解决的首要难题。
在全面解决粮食安全问题的规划中,粮食产量的准确预测是重要的前提。
目前,针对粮食领域的预测方法大致可以分为三类[1]:一类是以统计学理论为基础的传统回归预测方法,如逐步线性回归、指数平滑法、自回归滑动平均等[2],这些方法依托专门的统计软件如Minitab、SPSS等,具有计算简便、预测速度快的优点,但是预测精度差,只能针对一些有明显趋势的简单系统使用。
另一类是以灰色理论为基础的灰色预测方法,对于小样本、贫信息的系统预测具有明显的优势,但是,依据原始数据得到累加生成序列应具有明显的指数增长趋势,否则会有较大的预测误差。
最后一类以神经网络、支持向量机为代表的机器学习法,神经网络需要满足“大样本”条件时,才能够表现出明显的拟合效果和预测能力,否则,易出现所谓的“过拟合”难题[3,4];而支持向量机在解决小样本、非线性及高维模式识别中具有特有的优势,且能保证所得到的解是全局最优解[5,6]。例如,李建伟、周洪[7]等人运用支持向量机对中国农业机械总动力进行预测,其预测精度明显高于普通的BP神经网络和改进的BP神经网络;彭望蜀[8]采用支持向量机对股票指数进行预测,其预测精度、收敛时间等方面均优于基于BP神经网络预测模型;孙涵、杨普容、成金华[9]等人基于Matlab支持向量回归机进行中国能源需求预测,结果表明支持向量机模型具有更高的预测精度。
鉴于此,本文尝试采用支持向量机建立模型进行广东省粮食产量预测。考虑到粮食产量受到多种因素的影响,为了简化模型输入,提高预测精度,在采用支持向量机来建立预测模型的同时运用因子分析提取主要因子,作为模型输入变量,进行广东省粮食产量的预测尝试。
1 因子分析及支持向量机
1.1 因子分析
因子分析[10],是由英国心理学家C.Spearman最早提出的,是一种从诸多变量中提取公共因子的统计技术。它的主要目的是在尽可能不损失信息或少损失信息的前提下,用少数潜在的两两正交因子去替代原始变量,因而,可以简化指标,降低模型的复杂度,为后续研究做好准备。其基本的算法过程如下:
设有k个变量,X=[x1,x2,…,xk]T,每个变量都可以用m(m
该模型的求解关键是确定因子载荷矩阵,其具体步骤如下:
①根据相关指标体系,建立原始数据矩阵Z=(zij)m×n;
③计算矩阵X的相关系数矩阵R=(rij)n×n;
⑤根据因子载荷矩阵计算因子分值系数矩阵B=A′*R-1;
⑥最后根据因子分值系数矩阵B,计算因子得分矩阵Y=X*B′。
据此得到主要因子。
1.2 支持向量机的基本原理
支持向量机[11](SVM,Support Voctor Machine)是由Vapnik于1995年首先提出的,基于统计学习理论,其主要思想是通过建立一个分类超平面作为决策曲面,使得正例和反例之间的隔离边缘被最大化,以实现结构风险最小化。与人工神经网络相比,它克服了神经网络所固有的局部极小点、过学习现象以及结构和类型的选择过于依赖经验等缺陷[12]。
由于其具有模型的自由选择(参数、基函数的位置等)、全局最优以及良好的泛化能力等特性,因此在小样本、高维、非线性预测领域具有很好的应用效果。其基本原理是:
假定根据某种概率分布P(x,y)(x∈Rn,y∈R)生成的样本(x1,y1),……(xl,yl),支持向量回归(support vector regression,SVR)的目的就是希望找到适当的实值函数
2 FA-SVM粮食产量组合预测模型
2.1 原始数据收集
遵循指标的综合性、可比性、可获取性原则,根据广东省历年统计年鉴,收集1990-2012年广东省粮食产量y、第一产业从业人员x1、有效灌溉面积x2、农业机械总动力x3、化肥施用量x4、农药用量x5、旱涝保收面积x6、粮食播种面积x7八个指标的数据[13-15],进行预测研究。具体数据见表1。
2.2 公共因子的提取
运用SPSS软件对表1中7个影响因素数据进行因子分析。首先进行数据的相关性检验,计算得到的KMO值为0.788大于0.5,且Bartlett的球形度检验为显著性水平0.000,两个指标共同表明这7个影响因素数据指标之间有一定的相关性,因而可以进行因子分析。对7个数据指标进行基于最大方差法的因子分析,结果如表2。
由表2的分析结果可以看出,当提取前2个因子时,其累积贡献率已达到89.615%,因而提取这两个因子,并得到因子载荷及因子分值系数见表3。
由表3因子载荷栏可以看出,因子1主要与第一产业从业人员x1有效灌溉面积x2、旱涝保收面积x6、粮食作物播种面积x7有关,它们主要与粮食生产的规模有关,可以称之为规模因子;因子2主要与农业机械总动力x3、化肥施用量x4、农药施用量x5有关,这3个因素主要与农业技术有关,可以把它称为技术投入因子。
最后根据Y=X*B′公式,计算出因子得分值作为模型最终训练及检验数据,数据结果见表4。
2.3 FA-SVM建模过程
2.3.1 数据的预处理
由于提取的公共因子量纲不同,如果直接用来进行建模预测,可能使预测精度降低,因此,需要通过下式进行数据归一化,使其归一化结果全部落在[0,1]之间,其数据结果见表4。
2.3.2 确定模型结构
建立因子1、因子2与粮食产量的支持向量机模型,即因子1与因子2为输入向量,粮食产量为输出向量。为检验模型的有效性,选取1990~2007年18个样本作为训练样本,2008~2012年5个样本作为检验样本。
2.3.3 核函数K(xi,x)及参数的确定
在多次实验结果的基础上,选取径向基RBF核函数,其表达形式如下。由于RBF核函数和SVM模型自带的参数σ和c在取不同值的情况下会对预测结果产生较大影响,因此需要对其寻优。本文选取网格算法进行参数寻优,当σ=g=2.8284时,预测效果较好。
2.3.4 建立模型并运算
基于Matlab 中的SVM预测模块,训练学习样本,带入寻优到的参数,建立预测模型。将测试样本数据带入模型运算,得到的预测结果见表5。
为对比预测结果,表中还分别列出了利用单一的灰色GM(1,1)模型和双指数平滑方法进行分析预测的结果。
3 结果分析与讨论
由表5可以看出,双指数平滑法的MAE、MPE、MSE值较大,分别为124.75、9.20%、146.63;灰色GM(1,1)模型三个指标有所减小,分别为74.28、5.63%、88.49,但这两种方法得到的预测值均呈现下降的趋势,与实际产量近期缓慢增长的趋势不符;而FA-SVM模型得到的三个评价指标不仅明显降低,而且与实际粮食产量趋势一致,相对于双指数平滑法和灰色GM(1,1)模型,平均相对误差(MPE)分别下降了71.52%和53.46%,充分说明本文方法的优势所在。
研究结果表明,基于因子分析和支持向量机的组合预测模型相对于单一预测方法,有较高的拟合能力和预测精度。由于影响粮食产量的因素众多,组合预测模型未能全数考虑,特别是一些难以量化的因素。
如何将不能量化的因素如粮食政策、农业生产组织与经营制度等因素反映到模型中,将是本文下一步的研究方向。
参考文献:
[1]聂韶华.基于灰色关联支持向量机的粮食产量预测[J].计算机仿真,2012,29(9):220-223.
[2]张文英,彭海城,李月英,等.河北省小麦产量灰色理论分析与预测[J].河北农业科学,2008,12(3):22-24.
[3]S.Amari,S.Wu.Improving support vector machine classifiers by modifying kernel functions[J].Neural Networks,1999,12(6):783-789.
[4]N.Li,R.Zhou,Q.H.Hu,et al.Mechanical fault diagnosis based on redundant second generation wavelet packet transform, neighborhood rough set and support vector machine[J].Mechanical Systems and Signal Processing,2012(28):608-621.
[5]HSU C W,LIN C J.A comparison of methods for multiclass support vector machines[J].IEEE Transactions on Neural Networks,2008,13(2):415-425.
[6]VAPNIK V N.The nature of statistical learning theory[M]. New York:Springer,1995.
[7]李建伟,周洪,赵汉雨,等.基于支持向量机的中国农业机械总动力预测[J].河南农业大学学报,2013,47(3):296-300.
[8]彭望蜀.基于BP神经网络与支持向量机的股票指数预测模型比较[J].南方金融,2013(1):71-73.
[9]孙涵,杨普容,成金华.基于Matlab支持向量回归机的能源需求预测模型[J].系统工程理论与实践,2011,31(10):2001-2007.
[10]马庆国.管理统计[M].北京:科学出版社,2008.
[11]邓乃扬,田英杰.支持向量机――理论、算法与拓展[M].北京:科学出版社,2009.
[12]孙煦,陆化普,吴娟.基于蚁群优化支持向量机模型的公路客运量预测[J].合肥工业大学学报,2012,35(1):124-129.
[13]王双进,李健英.基于时间序列趋势图的我国粮食产量主要影响因素分析[J].广东农业科学,2013(4):179-182.
关键词:电力负荷,预测,方法
中图分类号:F407文献标识码: A
一 研究背景及意义
电力工业与国民经济发展和人民生活水平提高息息相关,电力负荷的稳定增长是电力工业健康发展的重要指标。负荷预测是电力部门的重要工作之一,准确到位的负荷预测,可以经济合理地安排电网内部发电机组的启停,保持电网运行的安全稳定性,减少不必要的旋转储备容量,合理安排机组检修计划,保证社会的正常生产和生活,有效地电力成本,带来经济效益和社会效益。负荷预测的结果,还有利于决定未来新的发电机组的安装,决定装机容量的大小、地点和时间,决定电网的增容和改建,决定电网的建设和未来发展。可见,预测数值的准确可靠性与电力扩建规划的实施,电价政策的落实以及电力行业的经济效益紧密相关。
二 电力负荷预测方法研究概况
电力负荷预测是指在全面考虑一些重要的运行特征、增容规划、自然条件和社会影响的条件下,研究和利用一套能有效处理过去与未来负荷的数学方法,在满足一定精度要求的前提下,确定某特定时期或时刻的负荷数值。负荷预测的核心问题是预测的技术方法,或者说是预测数学模型,随着现代科学技术的不断进步,负荷预测理论技术得到了长足发展。
在美国、英国等发达国家,电力负荷预测技术发展比较成熟,尤其对新的高精度方法的研究更加深入。国内电力负荷预测技术的研究发展也很迅速,很多学者在这一领域提出了自己的研究成果,并在实际中解决了许多问题。在大量的预测方法的应用中,我们可以看出目前的研究更加关注于短期时间序列的内在规律性预测,成果比较显著。现在逐步呈现出考虑各种外在影响因素的内外结合的预测研究动态,例如在中长期预测模型中,综合考虑GDP总量,三大产业产值,居民用电,客户满意度等因素,从而有利于提高预测精度。同时,多种预测方法结合的组合预测技术得到广泛的应用,例如灰色预测与神经网络的结合,小波分析与神经网络的结合,模糊聚类同逻辑推理的结合,以及这几种方法的综合运用。
三 常用的负荷预测方法分析
目前电力负荷预测技术发展比较成熟,主要的负荷预测方法有:
(1)专家系统法。专家系统是一个用基于知识的程序设计方法建立起来的计算机系统,它拥有某个特殊领域内专家的知识和经验,并能像专家那样运用这些知识,通过推理在那个领域内做出智能决策。所以,一个完整的专家系统是由四部分组成的,即知识库、推理机、知识获取部分和解释界面。面对大量的预测模型和数据,它能够快速地做出最佳预测结果,避免了人工推理的繁琐和人为差错的出现,克服以往用单一模型进行预测的片面性缺陷。
(2)比例系数增长法。它假定今后的电力负荷与过去有相同的增长比例,用历史数据求出比例系数,按比例预测未来发展。
(3)趋势外推法。电力负荷的变化一方面有其不确定性,如气候的变化、意外事故的发生等造成对电力负荷的随机性干扰。另一方面,在一定条件下,电力负荷存在着明显的变化趋势。以农业用电为例,在气候条件变化较小的冬季,日用电量相对稳定,表现为较平稳的变化趋势;在某个时段内,又表现为线性和非线性趋势。从季度和月份用电量看,易见周期性变化趋势,习惯上称之为季节性变化趋势。当然有时可能表现为几种变化趋势的叠加。通常可用描散点图的方法定性的确定变化趋势类型。一旦找到了负荷变化趋势,按照该变化趋势就能对未来负荷情况做出判断,这就是趋势外推预测技术。
(4)回归预测法。它根据负荷过去的历史资料,建立可以进行数学分析的数学模型,对未来的负荷进行预测。从数学上看,就是用数理统计中的回归分析方法,即通过对变量的观测数据进行统计分析,确定变量之间的相关关系,从而实现预测的目的。回归预测包括线性回归和非线性回归。
(5)时间序列预测法。它根据负荷的历史资料,设法建立一个数学模型,用这个数学模型一方面来描述电力负荷这个随机变量变化过程的统计规律性,另一方面在该数学模型的基础上再确立负荷预测的数学表达式,对未来的负荷进行预报。在电力负荷预测中,针对负荷的历史资料所确立的不论是哪一类随机模型,它都应当体现出当前负荷与过去负荷以及干扰之间的关系,并能够用它来描述负荷变化过程的特性。而当讨论的负荷不同时,描述负荷变化过程所建立的随机模型往往也随之不同,但有时也允许用不同的随机模型来描述某一负荷变化过程。
(6)组合预测法。它有两类概念,一是指将几种预测方法所得的预测结果,选取适当的权重进行加权平均的一种预测方法;二是指在几种预测方法中进行比较,选择拟合优度最佳或标准离差最小的预测模型作为最优模型进行预测。
四 小结
目前负荷预测的方法有很多种,各种预测方法都有各自的优缺点,都有比较适用的应用范围。因此在实际运用中我们要从预测目标,期限,精度,地区特点等方面出发,选择合适的预测方法。随着我国电力事业的不断发展,负荷预测的对象将更加细化,在对负荷预测内在规律有更加准确的认识下,各种预测技术方法也将日趋完善和得到广泛的应用。
参考文献:
[1] 牛东晓,曹树华,赵磊等.电力负荷预测技术及其应用.北京:中国电力出版社,1998