数学建模的预测方法范例(12篇)
时间:2024-02-19
时间:2024-02-19
关键词:智能电网风电功率预测预测方法
中图分类号:TM315文献标识码:A文章编号:1007-9416(2012)09-0206-01
1、引言
智能电网在电源、电力负荷和信息流的传输方面均有区别于传统电网之处。由于传统用来发电的化石燃料储量的有限性以及传统燃料利用过程中对环境的严重危害性,智能电网需要大量的可再生能源作为新的电源。
风能因其清洁和取之不竭的特点已经被广泛应用于发电产业,随着风电的大规模发展,风电的波动性及间歇性也给风电的大规模利用带来了挑战。在实际应用中,电网必须预留大量的备用出力容量来平衡风电波动的影响,所以,必须通过风电功率预测技术逐步提高预测精度、减小风电接入对系统备用容量的需求,从而增加电网消纳风电的能力,提高系统整体运行的经济效能[1]。
2、风电功率预测方法
2.1风电功率预测分类
2.1.1按预测的时间尺度分类
风速波动在时间尺度上对风电有不同影响,风电功率预测按不同的时间尺度可以分为长期预测、中期预测、短期预测和超短期预测[2]。
长期预测以“年”为预测单位,主要用于预测风电场建成之后的年发电量,该方法是根据气象站过去几十年的长期观测资料和风电场测风塔保存的至少一年的测风数据,经过统计分析,再结合规划装设的风力发电机组的功率曲线,来测算风电场每年的发电量。
中期预测以“天”、“周”或“月”为预测单位,主要是基于数值气象预报进行预测,用于风场安排检修、风机大修或调试。
短期预测以“小时”为预测单位,一般为提前1-48小时对每小时的功率进行预测,该方法可基于数值气象报模型,也可以是基于历史数据的方法。用于电网的合理调度、保证供电质量等。
超短期预测以“分钟”为预测单位。超短期时间范围涵盖标准不一,一般采用30分钟时间跨度作为超短期预测范围,主要用于风力发电控制、电能质量评估及风电机组机械部件的设计等,一般采用持续法。
2.1.2按预测对象范围分类
按预测对象范围的不同,可以分为:(1)对单台风机的功率出力预测,主要用于研究风机出力特性;(2)对小范围内的独立风场整体出力预测,主要用于省级电网调度和市场;(3)对较大区域内多座风场的出力预测,主要针对网级调度和跨区域调度。根据气象条件不同,还可以分为陆地风场风电功率预测及海上风场风电功率预测,海上风场的变化非常复杂,预测难度也更大。
2.2风电功率预测方法
不同的风电功率预测模型对应的预测方法也不同,针对不同时间尺度进行风电预测采用的方法也不尽相同。风电功率预测的主要方法可分为物理方法和统计方法两大类[3]。
2.2.1物理方法
物理方法主要通过物理方程对风电场所在位置的地理信息和风机信息进行建模。应用物理方法进行风电预测的前提是数值天气预报系统(NWP)。NWP根据大气实际情况,在一定的初值和边界条件下,通过数值计算,求解描述天气变化过程中的流体力学和热力学方程组,预测未来一段时间的大气运动状态和天气现象。风电功率预测对预报的局部性要求很强,对预报的时空分辨率要求也较高,一般要求数值模式的水平分辨率为1km,并根据风电场风机位置进行进一步细化,对时间分辨率要求一般为1小时或更低,时间长度为提前48-72小时。利用NWP系统得到气象数据作为输入,综合物理信息,得到风机的风速风向等气象信息,最后再利用风机的功率曲线拟合得到预测的风电输出功率。
2.2.2统计方法
统计方法是在预测系统的输入(NWP、历史/实测数据)和风电功率之间建立一种映射关系。用函数表达式计算风电功率作为预测值,典型的方法有时间序列法、指数平滑法、回归分析法、卡尔曼滤波法、灰色预测法、持续法以及人工智能学习方法。时间序列法通过大量的历史数据建模,推导出一个能够描述所研究时间序列的数学模型,进而进行预测;持续法方法简单不需建模但精度较差,主要作为各种方法的对比模型。
人工智能方法通过对大量影响风电功率的输入数据(风速、风向、温度、湿度、气压、等)和输出(风电功率)进行训练和学习,得到输入和输出的非线性模型,利用该模型对已知数据进行未来风电功率的预测。该类方法有神经网络法,支持向量机、小波分析法等,其中,神经网络因其在非线性处理中的优良特性得到了较为广泛的应用,预测效果也较好。
3、预测方法分析及展望
采用统计学方法进行风电功率预测,直接针对风电功率数据建立的模型要比基于风速数据建立的模型精度更高。因为后者建立预测模型需要风电场的功率曲线,而建立风电场的功率曲线必须同时考虑单个风机的功率曲线等因素,再将风速的预测值转换为功率的预测值,这些过程中均会有误差的不断放大。由于风能本身的随机性、预测模型的误差、预测所使用的输入数据的单一性、预测输入数据采集中的不准确性等都给风电功率预测带来较大的影响,导致预测精度与实际数据误差明显,未来的风电预测系统需要降低这几方面带来的误差,逐步提高预测精度,风电才能实现较好的经济和社会效益。
参考文献
[1]杨秀媛,肖洋,陈树勇.风电场风速和风电功率预测研究[J].中国电机工程学报,2005,25(11):1-5.
【关键词】时序预测;模糊神经网络;电力负荷;预测
【Abstract】Thispaperproposesashort-termpowerloadtimeseriespredictionmethod.Themethodusinghybridpi-sigmafuzzyneuralnetwork,usingtheperiodiccharacteristicsoftheshort-termpowerload,aFuzzyneuralnetworkpi-sigmatime-seriesforecastmodelissetup,buildingforecastingsamplesandtestsamples,researchonshort-termpowerloaddatatopredictthefuture.Thefuzzyforecastmodeloffuzzysubsetmembershipcandynamicallyadjustonline.Simulationexamplesshowthattheproposedpowerloadforecastingmethodissuperiortoconventionaltemporalpredictionmethod,hastheadvantagesofhighpredictionaccuracyandpredictionstability,whichcanovercometherandomnessoftheneuralnetworkelectricityloadforecastingmethods.Thesimulationexperimentresultsdemonstratetheeffectivenessoftheproposedmethod.
【Keywords】Time-series;Fuzzyneuralnetwork;Powerload;Prediction
0引言
电力工业影响人们的生活水平和国民经济的发展,实时准确的电力负荷预测有助于电力部门经济、合理地制定各项计划,保证电网高效稳定运行,达到一定精度条件,确定将来特定时刻的负荷数据。电力负荷预测是利用电力负荷的实时信息和历史数据对未来的电力负荷进行预测,预测未来电力负荷的时空分布情况,以此来实现电力市场供求关系的均衡发展。其中负荷是指电力需求量(功率)或用电量。电力负荷预测是电力系统中一项十分重要的工作,是能量管理系统中的重要组成部分[1]。
电力负荷预测的核心工作是对大量历史数据的收集、对模型的科学建立以及对算法的合理有效采用。在以历史数据为基础的前提下进行大量的实验研究,对模型和算法加以修正,以此来反映电力负荷变化的真实规律。电力负荷一般分为城市、商业以及工业负荷等。不同负荷具有不同的特点和规律。
常用的电力负荷预测方法有:回归分析法、弹性系数法、神经网络法、专家系统法和模糊逻辑方法等。通常模糊逻辑和神经网络用于预测时会出现预测结果不确定,多次重复预测结果不同等情况。近年来,模糊逻辑和神经网络的混合得到了比较广泛的应用。
本文采用一种新型混合pi-sigma神经网络模型预测短期电力负荷。该模型有如下特点:利用新组建的时间序列样本预测电力负荷;该预测模型参数初始值是确定的;结论部分是输入变量线性组合而成;用代数计算方法取代模糊运算;并能在线调整模糊规则的隶属度函数,鲁棒性好,预测结果稳定等。
1混合pi-sigma神经网络
混合pi-sigma神经网络预测模型是与高木-关野系统类似的一种新型模糊神经网络。可在线修正前提参数和结论参数,这项工作可以靠模糊模型辨识来完成。该模糊神经网络适用于复杂系统的模糊预测和控制[2]。各模糊子集的隶属函数均取高斯函数,以方便网络的学习。其中,模糊模型可以自动更新,能动态修正各模糊子集的隶属度函数,实现自适应模糊模型的建模,从而能比较容易地确定网络结构和相关参数,使模糊建模过程更具合理性。
1.1网络结构
神经网络通常有三种结构,一种是只含有求和节点的前向型网络,另一种是可以实现联想记忆的反馈型网络,还有自组织网络。它们都很难处理一些复杂的问题。然而在混合pi-sigma神经网络中,在模糊推理过程中利用代数乘法取代取小运算,以一个多入/单出的混合型pi-sigma神经网络预测模型为例,结构如图1所示,其中,S、P和(・)分别表示相加、相乘和相乘的运算。
在图1中,每个输入变量的模糊子集均取为[PL、0、NL],即正大、零、负大,这样可简化过程,又能加快计算速度。该预测模型的输入经模糊化、模糊推理、反模糊,其输出过程物理意义清楚,即知识处理过程是透明的。
1.2模糊神经网络学习算法
设预测模型期望输出为yd,定义函数:
2短期电力负荷的预测模型
数据来源:采用欧洲人工智能组织、国际电力负荷预测的竞赛数据进行预测研究[4]。对1998年1月1日开始的500个时序数据进行试验。即按照每天24小时每隔30min采集一个数据,产生48个数据,样本时序数据结如图2所示,该数据有一定的规律性。
混合pi-sigma模糊神经网络时序预测模型的建立:时序样本组成方法:在500个数据中,取其中第1~7个数据为该预测模型的输入,第8个数据为网络输出,使其产生133个样本,训练混合pi-sigma神经网络。因此,网络输入神经元个数为7个,即图1中的n=7,输出为一个变量。表1为数据集生成方法。
模糊神经网络隐层选取依据:每个变量有3个模糊子集,每两个变量之间的模糊取小运算有9个结果,因此,网络隐层神经元个数取9个,共计有37=2187个模糊规则。
隶属度中心c0=[c01c02c03]=[-15015],灵敏度参数:b0=[b01b02b03]=[555],结论参数p(i)的初始值为p(i)=0.1*ones(9,1),i=0,1,2,…,7。
3仿真实验及结果分析
在MATLAB环境中,利用上述网络预测模型进行仿真实验。参数设置:学习速率=0.005、动量因子=0.05,实验表明,学习速率对预测结果影响比动量因子大。训练误差精度0.001。用第1个~第133个样本训练模糊神经网络,预测第141个~第188个共48个数据。图3为混合pi-sigma模糊神经网络预测结果。
图3(c)中,用平均绝对百分比误差指标评价网络性能,48个数据的平均预测精度为2.0571%,最大预测精度为7.1459%。表2给出了前12个数据预测的详细记录。
采用BP神经网络工具箱预测结果:设置精度为0.001,隐层神经元数为15,即网络结构为7-15-1。平均预测精度为2.5714%,最大预测精度为7.6062%;利用RBF神经网络工具箱预测结果:扩展因子经过调节取为26,平均预测精度为2.5193%,最大预测精度为7.2087%。比较发现,本文提出的方法均优于BP网络工具箱和RBF网络预测结果,而且本文方法的最大优势是预测结果是唯一的,即具有结果可重复性。
4结论
本文对短期电力负荷时间序列采用混合pi-sigma神经网络进行预测,得到确定性的预测结果。该模型优点是可以在线调节模糊隶属度函数和结论参数,提高预测精度。与BP网络、RBF神经网络预测结果进行对比分析的仿真结果验证了所提出方法的有效性。
【参考文献】
[1]牛|晓,曹树华,卢建昌,赵磊.电力负荷预测技术及其应用[M].北京:中国电力出版社,2009:1-6.
关键词:公路路基;沉降预测;灰色系统
中图分类号:U213.1文献标识码:A文章编号:
1.引言
公路,尤其是高速公路,对路面平整性要求很高,在技术规范中有规定:在施工过程中必须进行沉降和稳定性预测。在研究中发现,国内外公路系统中很多专家都用统计回归模型等方法来对公路的沉降进行预测研究。这些数学模型都含有统计特性,它们都建立在若干数学经济假设之上,或者建立在对公路物理力学性质的假设基础上,或者需要庞大的数据来增加模型的精确程度。故其模型精度在较大程度上取决于建模因子的选择和数据规模,故而用上述模型进行数据的拟合时一般精度不高。因此灰色理论因为其模糊性且不需要庞大的数据等优势逐渐被人们重视,在与曲线拟合、人工神经网络、遗传算法等方法相比的情况下,灰色理论依然占据了很大的优势,所以在公路路基的沉降监测、预测中灰色理论的应用越来越多,但由于传统的灰色模型仅适用于等间隔且累加生成具有明显指数规律的原始动态序列。在现实中,因为各种复杂因素的影响,对公路路基沉降的观测很难做到等间隔时序观测,所以本文提出的非等时序灰色模型改进传统灰色模型等间隔时序系统的限制,拓宽了灰色预测的应用范围。
2.公路路基沉降规律
公路路基沉降根据过程划分,可分为瞬时沉降、固结沉降和次固结沉降三种。
瞬时沉降:在荷载施加后,沉降全过程在短时间内立即发生的,与时间无关。
固结沉降和次固结沉降:随着荷载和时间变化而变化。
故从路基沉降的规律来看,我们在套用灰色模型进行公路路基沉降预测时,切不可带有简单性、盲目性,且其预测的精度与所选择的函数类型有重要的关系。在具体工程实践中,要根据工程的实际情况,合理地选择和应用模型,寻找最佳函数形式来拟合,以求最精确解。
3.公路路基沉降灰色系统理论
定义:灰色系统是指信息不完全与不确知的系统,它是一种综合运用数学方法对信息不完全的系统进行预测、预报的理论和方法。
基本思想:将与时间有关的已知数据按某种规则加以组合,构成白色模块,然后按某种规则提高灰色模块的白化度。
优点:在没有庞大的数据的情况下就能建模。
3.1等间隔的GM(1,1)模型
3.1.1建立模型
公路路基的沉降量观测及预测是以时间为变量,而对时间序列进行数量大小的预测称为数列预测。数列预测是以单一变量的GM(1,1)模型为基础的,该模型要求时序数据是平稳变化的。GM(1,1)中前一个“1”表示阶数,后一个“1”表示因素,在公路路基沉降预测中为时间。
设{x(0)}={x(0)(1),x(0)(2)),…x(0)(N))为原始数据列,所对应的时间序列为t={t1,t2,t3,…tN},该数列的一次累加数列为:{x(1)}={x(1)(1),x(1)(2)),…x(1)(N)),且满足:
x(1)(k)=x(1)(m)
对建立白化形式的微分方程:……(1)
方程的解为:
然后确定k=1,2,3,…N-1时的值:,,……进而得还原数据:
,k=1,2,3,……N
3.1.2参数估计
(1)式中的参数列为[a,u]T,,由最小二乘法得[a,u]T,=(BTB)-1BTYN
其中,B=
YN=T
3.2非等时序改进灰色模型
公路路基的沉降观测及预测是以时间为变量,因此设随时间变化而形成的序列数据为
y(ti)={y(t1),y(t2),……Y(tN)},i=1,2,3,……N
此序列的GM白化形式的微分方程为:……(2)
其数学解析式为:,其中a,b为为待辨识灰参数;m,n为待辨识灰系数;y(ti)为因变量值;ti为自变量值。
对于灰参数a,b可采用一元线性回归辨识方法进行确定:令,代入(2)式整理得:Y=ax+b,而对于灰系数可由最小二乘法求得(m,n)=(ATA)-1ATZ。
其中:A=,Z=
3.3建立模型需注意的事项.
本文提出的非等时序改进灰色模型是以随时间变化而形成的序列数据累加作为样本值,样本值对预测结果影响较大,所以进行样本选择时应该剔除变异性大的样本;另外,在公路路基沉降观测时也应该注意变异性大的观测值,控制观测质量;提高观测精度。
4预测模型的精度检验
4.1残差检验
预测的绝对误差为:,k=1,2.3……N。
预测的相对误差为:
4.2后验差检验
设为原始数列,为模型模拟预测数列,为残差数列,则
,解得:
,解得:
(1)为均方差比值,给定>0,当c<时,则模型为均方比合格模型。
(2)为小误差概率,对给定的>0,当P>时,则模型为小误差概率合格模型。
(3)外推性好的预测,c必须小,小误差概率P大,按c和P将精度分为“好”、“合格”、“基本合格”、“不合格”四个等级。列表如下:
预测精度检验表
当P、c都在允许的范围之内,则可以应用模型预测,所建立的灰色模型精度满足要求。
5.对公路路基沉降灰度检验的意义
(1)利用非等时序改进灰色模型预测公路路基沉降,所需的实测数据少,建模简单,可节省大量的人力、物力和财力,具有显著的经济和社会效益。
(2)传统的GM(1,1)模型对时序数据应有比较平稳的变化规律,但非等时序改进灰色模型突破了传统GM(1,1)模型等间隔时序系统的限制,预测精度更高。
(3)利用非等时序改进灰色模型预测公路路基沉降,将对公路路基的施工进度控制以及高速公路的监测维护起到积极作用。
5.结束语
灰色模型具有所需数据量少、计算简单、预测可靠性高等优点,非常值得在公路路基沉降预测中广泛推广,但在应用灰色模型时,有以下两点需要注意:
(1)鉴于公路路基沉降规律的复杂性,建议绘制原始数据沉降累计值曲线图,并对原始数据列进行分析,判断数据所处的沉降阶段,并根据不同的沉降阶段,对GM(1,1)模型进行不同程度的修正。在预测模型中还可以采用不同维数、等维新陈代谢等方法进行计算,并通过残差法和后验法进行精度对比,根据预测效果,以求最精确解。
(2)公路路基沉降观测数据往往提供的是沉降累积值,其已经进行了一次AGO累加生成,故在建立原始数列时,要通过累减的方法,得到时间段的沉降量,再进行计算。另外,灰色模型是正的数据列,故原始数列第一个数据不宜为零。这两点往往容易忽视。
参考文献:
[1]李亮,潘伯林.高层建筑基础设计方案的技术经济比较[J].长沙铁道学院学报,1999,17(4):41—45.
关键词ARIMA预测模型;出院人数;医院
医院统计预测是制订医院发展的中、长期规划的依据,可以与时俱进地推动医院技术、人才、设备的更新。ARIMA模型是针对有季节性变动的时间序列提出的建模方法。它对每一季节周期中相同时间点的序列值进行分析,提取季节趋势,并且针对每个季节周期内部序列值的变化提取非季节性成分,确立最优模型。ARIMA预测模型虽然计算复杂,但预测效果好,在出院人数预测方面相对误差绝对值较小,这体现在ARIMA预测模型对医院出院人数发展变化规律的分析有比较好的适应性和实用性。
本文通过对近5年某中医医院出院人数规律的查找,建立数据库,运用ARIMA预测模型,预测2015年出院人数,为医院管理者提供科学、可靠的依据。
资料与方法
资料来源:某中医医院2010年1月-2014年12月的住院工作统计报表,数据真实可靠。
建立数据库:采用Excel软件建立的由国家卫生统计信息中心编制通用的医院月报表建立的出院人数数据库。
数据处理:采用SPSS20.0统计软件处理。以平均绝对误差、平均相对误差绝对值及误差平方和作为评价指标。
结果
某中医医院2010年1月-2014年12月报表的出院人数,见表1。
ARIMA预测模型结果:根据ARIMA预测模型的建模思路,建立ARIMAA测模型,并比较实际出院人数和预测值,评价该预测模型的拟合程度。绝对误差0~180,平均52.92。相对误差绝对值0~38.63%,平均8.11%,见表2。
利用出院日期与出院人数拟合ARIMA模型,A线为实际出院人数的曲线,B线为预测出院人数的曲线,UCL为95%可信区间上限,LCL为95%可信区间下限。从图可知总体上拟合结果比较好,见图1。
以ARIMA模型来预测2015年出院人数,见表3。
讨论
医学统计学就是一门运用统计学的原理和方法,研究医学科研中有关数量的搜集、整理、分析的科学。统计、预测能够有效帮助医院判断科室接待的患者数量,根据预测的情况可以有效地对科室内人员配置、药品储备数量、设备数量以及病房数量等的分配方案进行确定。这样在疾病高发时期,医院就可以适当选择病情较轻的患者出院治疗,为可能就诊的危重症患者提供更加充足的住院空间,为患者提供更佳的医疗服务质量,使病房发挥更大的社会效益及经济效益。
关键词:灰色GM(1,1)模型;背景值;参考作物腾发量;预测模型
中图分类号:S274.4文献标识码:A
OptimizedbasedonthegraybackgroundGM(1,1)modelforreferencecropevapotranspirationpredictionresearch
ChengShi-Guo
(ShenyangWaterResourcesResearchInstitute,Shenyang110043China)
Abstract:Referencecropevapotranspirationiscalculatedcropwaterrequirementsofimportantparameters.Referencecropevapotranspirationforaccuratepredictionofthedevelopmentofrationalplanningandoptimalallocationofirrigationwaterandotherwaterresourcesofgreatsignificance.Inthisstudy,basedonthegraybackgroundoptimizedGM(1,1)predictionmodelFuxinreferencecropevapotranspirationtopredict.Theresultsshowed:improvedgrayGM(1,1)predictionmodelaccuracythantheoriginalgrayGM(1,1)predictionmodelhasbeensignificantlyimproved,asthereferencecropevapotranspirationprojectionsprovideanewapproach
Keyword:GreyGM(1,1)Model;BackgroundValue;Referencecropevapotranspiration;forecastingmodel
1引言
作物需水量是预测灌溉用水量、制定合理灌溉用水计划的基础。而参考作物腾发量是计算作物需水量的一个重要参数。故精确的预测参考作物腾发量对合理优化配置水资源具有重要的意义[[[]于淼,迟道才,等.基于灰色马尔科夫的参考作物腾发量预测[J].节水灌溉,2010(4):12--15]-[[]迟道才,曲霞,等.基于遗传算法的投影寻踪回归模型在参考作物腾发量预测中的应用[J].节水灌溉,2010(2):5--7][[]刘丽,迟道才,等.基于灰色组合模型的参考作物腾发量预测[J].人民长江,2008,39(19):32--34][[4]张展羽,王声锋,等.基于天气预报的参考作物腾发量LS―SVM预测模型[J].水科学进展,2010,21(1):63--68][[]倪广恒,李新红,等.中国参考作物腾发量时空变化特性分析[J].农业工程学报,2006,22(5):1--4]]。
影响参考作物腾发量的因素包含已知因素同时也包含一些未知因素,所以可以看作为一个灰系统。故灰色系统分析方法在参考作物腾发量的分析预测上有一定的适用性。目前,学者们已经对参考作物腾发量的预测模型进行了大量的研究。大部分的预测模型都是以历史数据为基础,对历史数据的潜在规律进行分析,同时利用数学方法建模,其中灰色预测模型就是一种很常用的数学模型[[[]徐文才.参考作物腾发量计算与预测研究现状及动态[J].现代农业研究,2009(11):62--64]-[[]谢乃明,刘思峰.灰色系统理论及其应用(第四版)[M].北京:科学出版社,2008]]。
灰色预测模型中最常用的就是常规的灰色GM(1,1)模型。大量的研究表明该方法在预测时存在一定的缺点。在求解模型参数a和b时需做紧邻均值生成序列,该模型中令,其中取=0.5,这表明新旧数据对系统发展的作用是均等的。而由新陈代谢思想可知,对于一个不断发展的系统来讲,新数据对系统发展的影响要比老数据强。取=0.5没有充分的考虑新数据对系统发展的影响,预测精度较低[[[]袁景凌,钟珞.新陈代谢GM(1,1)建模与应用[J].武汉理工大学学报,2005,27(2):168--170][[9]陈霞,邱桃荣.GM(1,1)模型和新陈代谢模型的应用比较[J].微计算机信息,2008,24(12):157--159][[10]谭冠军.GM(1,1)模型的背景值构造方法和应用[J].系统工程理论与实践,2000,20(4):98-1.3]-[[]邓奎,李龙国.灰色GM(1,1)模型及其改进方法在城市生活用水量预测中的应用[J].中国水运,2011,2(11):76-77][[]王弘宇,马放.灰色新陈代谢GM(1,1)模型在中长期城市需水量预测中的应用研究[J].武汉大学学报,2004,37(6):32--35][[]于国卿,汪自力,任红旭.新陈代谢GM(1,1)模型预测水闸垂直位移[J].人民黄河,2008,30(12):116--118][[]唐松云,陈绵云.插入值方法的灰色建模[J].武汉理工大学学报,2005,27(2):88--89]]。针对上述预测模型的不足之处,本研究尝试建立基于该背景值优化后的灰色GM(1,1)预测模型,将其应用于对阜新市参考作物腾发量的预测,表现出良好的适用性。
2基于背景值优化的灰色GM(1,1)模型
基于背景值优化的灰色GM(1,1)模型是建立在灰色GM(1,1)模型基础上的一种改进的灰色预测模型。
2.1灰色GM(1,1)模型的基本思想
灰色GM(1,1)模型具体建模步骤如下:
(1)原有的非负数据序列:,作的一次累加生成序列,其中:
(1)定义为的紧邻均值生成序列。其中
,取=0.5(2)
称(3)
根据最小二乘法基本思想,本研究采用下面的公式(4)和公式(5)可以大大的提高运算效率[[[]宋建军,李明磊,陈莉.新陈代谢GM(1,1,α)模型在数控机床热误差建模中的应用[J].机械设计,2010,27(3):32―35
]]。
(4)
(5)
(2)建立GM(1,1)模型的白化方程,也叫影子方程,是一个微分方程,如下所示:(6)
(3)该白化方程的解,也称为时间响应函数为:
,(7)
则GM(1,1)模型的时间响应序列为:
(8)
其中为一次累加值的预测模拟值,要得到原数据的预测值,需要将其还原。(9)
2.2基于背景值优化的灰色GM(1,1)预测模型
常规的灰色GM(1,1)模型在求解模型参数a和b时需做紧邻均值生成序列,该模型中令,其中取=0.5,这表明新旧数据对系统发展的作用是均等的。而由新陈代谢思想可知,对于一个不断发展的系统来讲,新数据对系统发展的影响要比老数据强。取=0.5没有充考虑新数据对系统发展的影响,导致模型的预测精度较低。本研究尝试对的生成过程进行优化,提高模型的预测精度。优化过程如下所示。
(1)按照上一节介绍的灰色GM(1,1)模型的建模过程,我们可以得到灰色模型的白化微分方程为式(9)。将式(9)在区间上积分可得:,其中(10)
由可得,
(11)
(2)设为在区间上的背景值,则有
(12)
(3)函数并不知道,但是我们知道一阶微分方程的解为指数方程,故可令:
(13)
假设该曲线通过两点、,则有
,(14)
由式(17)可解得
,(15)
由上可得背景值(16)
灰色模型中的参数和可由改进的背景值求得。
则称用改进背景值求解和所建立的灰色模型为基于背景值优化的灰色GM(1,1)模型。
2.3模型精度检验
本研究采用最常用的相对误差检验指标。
原始序列为,相应的预测模型的模拟序列为,则残差序列为其中,相对误差序列为,其中,为点的模拟相对误差,称为平均相对误差,称为平均相对精度。精度等级参照表如表1所示:
表1灰色模型预测精度检验等级参照表
Tab.1Thelevelreferencetableofgreymodelpredictionprecision-test
模型精度等级相对误差
一级(好)0.01
二级(合格)0.05
三级(勉强)0.10
四级(不合格)0.20
3灰色新陈代谢GM(1,1)预测模型的应用实例
本研究利用阜新市气象站1985~2006年的气象数据资料,采用Penman-Monteith公式计算该地区的参考作物腾发量(ET0)。阜新市1985~2006年ET0变化曲线如图1所示。
图1阜新市ET0变化曲线图
Figure1ET0changecurveinfuxin
3.1建立常规GM(1,1)预测模型
1985~2002年的ET0数据用于建模;2003~2006年的ET0数据用来检验模型的精度。经计算,灰色GM(1,1)预测模型为:
(13)
用该模型分别预测2003~2006年的ET0,结果见表2。
表2常规GM(1,1)预测模型的预测精度检验表
Tab.2OrdinaryGM(1,1)predictiveaccuracytestingtable
年份ET0实际值(mm・d-1)ET0预测值(mm・d-1)残差相对误差预测精度
20032.67612.8045-0.12864.880595.1994
20042.76082.8366-0.07582.746097.2539
20052.48092.8692-0.388215.649184.3509
20062.51092.9021-0.393215.580484.4195
平均相对误差4.4401
由表2可知,2003和2004年的预测精度均为二级,但2005年和2006年的预测精度均为四级。由此说明常规GM(1,1)预测模型预测精度高的仅仅是离现实时刻最近的几个数据,越往越来发展,预测精度就越低,模型的预测意义就越弱。
3.2建立基于背景值优化的灰色GM(1,1)预测模型
本文建立基于背景值优化的灰色GM(1,1)预测模型。经计算,灰色新陈代谢GM(1,1)预测模型一为:
(14)
用该模型分别预测2003~2006年的ET0,结果见表3。
表3基于背景值优化的灰色GM(1,1)预测模型的预测精度检验表
Tab.3TheinspectiontableofthefirstgraymetabolismGM(1,1)
predictingapredictionaccuracy
年份ET0实际值(mm・d-1)ET0预测值(mm・d-1)残差相对误差预测精度
20032.67612.8045-0.12864.880595.1994
20042.76082.7958-0.03491.266098.7339
20052.48092.8237-0.34275.815494.1845
20062.51092.8519-0.3419.316890.6831
由表3可知,2003和2004年的预测精度仍为二级,但是都较常规的灰色GM(1,1)预测模型有所提高;2005和2006年的预测精度已经从四级提高到了三级,2005年的预测精度从84.35%提高到了94.18%,2006年的预测精度从84.41%提高到了90.68%,可见其提升的幅度很大。
4结论
(1)阜新市多年参考作物腾发量值呈指数增长规律不明显,这可能是导致灰色预测模型的精度相对较低的原因之一。
(2)由本例中阜新市参考作物腾发量的预测结果可以推测出:利用基于背景值优化后的灰色GM(1,1)预测模型的精度较常规GM(1,1)预测模型有很大的提高,因此,把该模型用于参考作物腾发量的预测是可行的、有效的。
关键词:二次指数平滑法;先定线性趋势预测法;灰色预测法;组合预测
1概述
随着经济的迅猛增长,工业用电与生活用电也迅速增加,用电量成为反映经济增长情况的重要指标。实行厂网分开、竞价上网后的电力企业对经济性的要求逐渐提高,为了适应市场经济发展的要求,建立科学的市场预测管理体系、提高预测质量和准确性对于电力企业来讲是必要的。作为供电企业的一项重要工作,月度用电量预测对合理安排生产、燃煤供应计划的编制,检修计划的制订等提供了重要依据。
运用科学的预测方法,是提高预测精确度的前提条件。科学的预测一般有以下几种途径:一是因果分析;二是类比分析;三是统计分析。对用电量的预测主要是应用统计分析,运用一系列的数学方法,建立数学模型,运用数学模型获得所需要的结论。目前用电量的预测方法有很多,各自有各自的适应范围及优点。但是由于单一模型的预测结果往往存在着精度不够,准确度不高的情况,在此采用组合预测的方法,通过选取适当的权重,利用组合模型中各个模型的优点,达到提高精度准确度的目的。
在此选用河北省任丘市2013年1~12月份及2014年1~5月的用电量进行预测分析。由于月度用电量不同于年用电量,由于其数值变化间隔时间短,所以是随时间变化的时间序列,包含一定的季节性和一定的趋势规律,所以文章采用二次指数平滑法、结合二次滑动平均法的先定线性趋势预测技术与灰色预测模型模型的组合模型。
2数据的分析处理
2.1数据来源
数据采集了河北省任丘市2013年1~12月及2014年1~5月的月度用电量(见表1),文章要根据所采集的数据分别建立先定线性预测模型、灰色预测模型对该市2014年6、7月月度用电量进行预测。
2.2先定线性预测模型的建立与应用
首先应用软件SPSS进行一次平滑法,取a=0.1,0.2,0.3,进行试验,试验结果计算得:当a=0.1时,S2=10216482.63;当a=0.2时,S2=10893417.18;当a=0.3时,S2=11493723.69;所以当a=0.1时S2最小,因此选取a=0.1进行二次指数平滑。
表1
根据表1中的数据可得预测趋势为
x17+1=a17+b171=12548.75+25.40393×l;l=1,2,…
所以根据二次指数平滑法得到的预测值为
表2
2.3先定线性趋势预测模型的建立与应用
首先利用二次滑动平均法拟合一条直线,用采集的历史数据求得滑动平均预测模型
xT+k=aT+bTk
取得跨度N=4,因此取数据中的16项,应用二次滑动平均得:
M■■=1.253975,M■■=1.208975,M■■=1.160625,M■■=1.1
从而推出M■■=■[M■■+M■■+M■■+M■■]1.180894
aT=2M■■-M■■=1.327056
bt=■(M■■-M■■)=0.048721
直线趋势方程为
xT+k=1.327056+0.048721k
数据个数为17,即T=17,因此取l=0,-1,-2,…,16,可得xk(k=17,16,…1),根据Pt=Xt/Xt,计算结果分析可得:
可得I1=4.293497,I2=5.325144,I3=6.201378,I4=5.329987,
规范化处理上述数据得:
I1=0.812008648,I2=1.007119115,I3=1.172837219,I4=1.008035018
用电量模型为:■T+k=(1.327056+0.048721k)I
可得到预测值为
表3
2.4灰色预测模型
应用灰色预测模型对数据进行预测,将数据处理后编入程序利用软件MATLEB得到GM(1,1)微分方程的参数■和■。具体程序及结果如下:
得灰色预测模型为■■(0)(k+1)=77.94511(1-e-0.0140)e-1.0736k(k=0,1,2,…)
根据该模型对2011年6、7、8、9月的月度用电量进行预测可得
表4
2.5组合预测
应用等权平均组合预测法,在EW法中,设fi为第i个模型的预测值,fc为组合预测值。则模型为
fc=■?撞■■fi
根据预测模型的预测结果,应用EW方法,得到预测结果见表5
3结束语
文章采用了组合预测法对河北省任丘市2014年6、7、8、9月的月度用电量进行了预测,具有一定的现实意义。根据月度用电量的特点,在组合预测中选取了三种预测模型,分别使用二次指数平滑法,先定线性趋势预测法,灰色预测GM(1,1)。在二次指数平滑法中,应用了软件SPSS确定参数a,对数据进行了两次相应处理。在GM(1,1)中应用了软件MATLEB,对数据进行编程,输出参数,建立模型。最后在组合预测中使用EW方法,对上述三模型的预测值进行组合预测,最终形成组合预测值。文章有效使用了相应的预测软件,使得结果更准确,减少了工作量。充分利用了组合预测的优点,提高了预测精度。
参考文献
[1]刘思峰,党耀国.预测方法与技术[M].北京:高等教育出版社,2005.
[2]牛东晓,曹树华,赵磊,等.电力负荷预测技术及其应用[M].北京:中国电力出版社,1998.
[3]吕振通,张凌云.SPSS统计分析与应用[M].北京:机械工业出版社,2009.
[4]黄现代,王丰效.多变量灰色预测模型算法的MATLEB实现[J].四川理工学院学报(自然科学版),2008,21(1).
[5]蒋晓艳,何川,方蕾.基于最优组合预测法的电网用电量预测[J].中国西部科技,2010,9(14).
论文名称:基于BP神经网络的技术创新预测与评估模型及其应用研究
课题来源:单位自拟课题或省政府下达的研究课题
技术创新预测和评估是企业技术创新决策的前提和依据。通过技术创新预测和评估,可以使企业对未来的技术发展水平及其变化趋势有正确的把握,从而为企业的技术创新决策提供科学的依据,以减少技术创新决策过程中的主观性和盲目性。只有在正确把握技术创新发展方向的前提下,企业的技术创新工作才能沿着正确方向开展,企业产品的市场竞争力才能得到不断加强。在市场竞争日趋激烈的现代商业中,企业的技术创新决定着企业生存和发展、前途与命运,为了确保技术创新工作的正确性,企业对技术创新的预测和评估提出了更高的要求。
二、本课题国内外研究现状及发展趋势
现有的技术创新预测方法可分为趋势外推法、相关分析法和专家预测法三大类。
(1)趋势外推法。指利用过去和现在的技术、经济信息,分析技术发展趋势和规律,在分析判断这些趋势和规律将继续的前提下,将过去和现在的趋势向未来推演。生长曲线法是趋势外推法中的一种应用较为广泛的技术创新预测方法,美国生物学家和人口统计学家RaymondPearl提出的Pearl曲线(数学模型为:Y=L∕[1+A?exp(-B·t)])及英国数学家和统计学家Gompertz提出的Gompertz曲线(数学模型为:Y=L·exp(-B·t))皆属于生长曲线,其预测值Y为技术性能指标,t为时间自变量,L、A、B皆为常数。Ridenour模型也属于生长曲线预测法,但它假定新技术的成长速度与熟悉该项技术的人数成正比,主要适用于新技术、新产品的扩散预测。
(2)相关分析法。利用一系列条件、参数、因果关系数据和其他信息,建立预测对象与影响因素的因果关系模型,预测技术的发展变化。相关分析法认为,一种技术性能的改进或其应用的扩展是和其他一些已知因素高度相关的,这样,通过已知因素的分析就可以对该项技术进行预测。相关分析法主要有以下几种:导前-滞后相关分析、技术进步与经验积累的相关分析、技术信息与人员数等因素的相关分析及目标与手段的相关分析等方法。
(3)专家预测法。以专家意见作为信息来源,通过系统的调查、征询专家的意见,分析和整理出预测结果。专家预测法主要有:专家个人判断法、专家会议法、头脑风暴法及德尔菲法等,其中,德尔菲法吸收了前几种专家预测法的长处,避免了其缺点,被认为是技术预测中最有效的专家预测法。
趋势外推法的预测数据只能为纵向数据,在进行产品技术创新预测时,只能利用过去的产品技术性能这一个指标来预测它的随时间的发展趋势,并不涉及影响产品技术创新的科技、经济、产业、市场、社会及政策等多方面因素。在现代商业经济中,对于产品技术发展的预测不能简单地归结为产品过去技术性能指标按时间的进展来类推,而应系统综合地考虑现代商业中其他因素对企业产品技术创新的深刻影响。相关分析法尽管可同时按横向数据和纵向数据来进行预测,但由于它是利用过去的历史数据中的某些影响产品技术创新的因素求出的具体的回归预测式,而所得到的回归预测模型往往只能考虑少数几种主要影响因素,略去了许多未考虑的因素,所以,所建模型对实际问题的表达能力也不够准确,预测结果与实际的符合程度也有较大偏差。专家预测法是一种定性预测方法,依靠的是预测者的知识和经验,往往带有主观性,难以满足企业对技术创新预测准确度的要求。以上这些技术创新预测技术和方法为企业技术创新工作的开展做出了很大的贡献,为企业技术创新的预测提供了科学的方法论,但在新的经济和市场环境下,技术创新预测的方法和技术应有新的丰富和发展,以克服自身的不足,更进一步适应时展的需要,为企业的技术创新工作的开展和企业的生存与发展提供先进的基础理论和技术方法。
目前,在我国企业技术创新评估中,一般只考虑如下四个方面的因素:(1)技术的先进性、可行性、连续性;(2)经济效果;(3)社会效果;(4)风险性,在对此四方面内容逐个分析后,再作综合评估。在综合评估中所用的方法主要有:Delphi法(专家法)、AHP法(层次分析法)、模糊评估法、决策树法、战略方法及各种图例法等,但技术创新的评估是一个非常复杂的系统,其中存在着广泛的非线性、时变性和不确定性,同时,还涉及技术、经济、管理、社会等诸多复杂因素,目前所使用的原理和方法,难以满足企业对技术创新评估科学性的要求。关于技术创新评估的研究,在我国的历史还不长,无论是指标体系还是评估方法,均处于研究
之中,我们认为目前在企业技术创新评估方面应做的工作是:(1)建立一套符合我国实际情况的技术创新评估指标体系;(2)建立一种适应于多因素、非线性和不确定性的综合评估方法。
这种情况下,神经网络技术就有其特有的优势,以其并行分布、自组织、自适应、自学习和容错性等优良性能,可以较好地适应技术创新预测和评估这类多因素、不确定性和非线性问题,它能克服上述各方法的不足。本项目以BP神经网络作为基于多因素的技术创新预测和评估模型构建的基础,BP神经网络由输入层、隐含层和输出层构成,各层的神经元数目不同,由正向传播和反向传播组成,在进行产品技术创新预测和评估时,从输入层输入影响产品技术创新预测值和评估值的n个因素信息,经隐含层处理后传入输出层,其输出值Y即为产品技术创新技术性能指标的预测值或产品技术创新的评估值。这种n个因素指标的设置,考虑了概括性和动态性,力求全面、客观地反映影响产品技术创新发展的主要因素和导致产品个体差异的主要因素,尽管是黑匣子式的预测和评估,但事实证明它自身的强大学习能力可将需考虑的多种因素的数据进行融合,输出一个经非线性变换后较为精确的预测值和评估值。
据文献查阅,虽然在技术创新预测和评估的现有原理和方法的改进和完善方面有一定的研究,如文献[08]、[09]、[11]等,但尚未发现将神经网络应用于技术创新预测与评估方面的研究,在当前产品的市场寿命周期不断缩短、要求企业不断推出新产品的经济条件下,以神经网络为基础来建立产品技术创新预测与评估模型,是对技术创新定量预测和评估方法的有益补充和完善。
三、论文预期成果的理论意义和应用价值
本项目研究的理论意义表现在:(1)探索新的技术创新预测和评估技术,丰富和完善技术创新预测和评估方法体系;(2)将神经网络技术引入技术创新的预测和评估,有利于推动技术创新预测和评估方法的发展。
本项目研究的应用价值体现在:(1)提供一种基于多因素的技术创新定量预测技术,有利于提高预测的正确性;(2)提供一种基于BP神经网络的综合评估方法,有利于提高评估的科学性;(3)为企业的技术创新预测和评估工作提供新的方法论和实用技术。
四、课题研究的主要内容
以BP神经网络模型为基础研究基于多因素的技术创新预测和评估模型,并建立科学的预测和评估指标体系及设计相应的模型计算方法,结合企业的具体实际,对指标和模型体系进行实证分析,使研究具有一定的理论水平和实用价值。
1、影响企业技术创新预测和评佑的相关指标体系确定及其量化和规范化。从企业的宏观环境和微观环境两个方面入手,密切结合电子商务和知识经济对企业技术创新的影响,系统综合地分析影响产品技术创新的各相关因素,建立科学的企业技术创新预测和评估指标体系,并研究其量化和规范化的原则及方法。
2、影响技术创新预测和评估各相关指标的相对权重确定。影响技术创新发展和变化各相关因素在输入预测和评估模型时,需要一组决定其相对重要性的初始权重,权重的确定需要基本的原则作支持。
3、基于BP神经网络的技术创新预测和评估模型研究。根据技术创新预测的特点,以BP神经网络为基础,构建基于多因素的技术创新预测和评估模型。
4、基于BP神经网络的技术创新预测和评估模型计算方法设计。根据基于BP神经网络的技术创新预测和评估模型的基本特点,设计其相应的计算方法。
5、基于BP神经网络的技术创新预测和评估模型学习样本设计。根据相关的历史资料,构建基于BP神经网络的技术创新预测和评估模型的学习样本,对预测和评估模型进行自学习和训练,使模型适合实际情况。
6、基于BP神经网络的技术创新预测和评估技术的实证研究。以一般企业的技术创新预测与评估工作为背景,对基于BP神经网络的技术创新预测和评估技术进行实证研究。
1、建立一套基于电子商务和知识经济的技术创新预测和评估指标体系。目前,在技术创新的预测和评估指标体系方面,一种是采用传统的指标体系,另一种是采用国外先进国家的指标体系,如何结合我国实际当前经济形势,参考国外先进发达国家的研究工作,建立一套适合于我国企业技术创新预测和评估指标体系,此为本研究要做的首要工作,这是一项创新。
2、研究基于BP神经网络的技术创新预测和评估模型及其计算方法。神经网络技术具有并行分布处理、自学习、自组织、自适应和容错性等优良性能,能较好地处理基于多因素、非线性和不确定性预测和评估的现实问题,本项目首次将神经网络技术引入企业的技术创新预测和评估,这也是一项创新。
五、课题研究的基本方法、技术路线的可行性论证
1、重视系统分析。以系统科学的思想为指导来分析影响企业技术创新发展和变化的宏观因素和微观因素,并研究影响因素间的内在联系,确定其相互之间的重要度,探讨其量化和规范化的方法,将国外先进国家的研究成果与我国具体实际相结合,建立我国企业技术创新预测和评估的指标体系。
2、重视案例研究。从国内外技术创新预测与决策成功和失败的案例中,发现问题、分析问题,归纳和总结出具有共性的东西,探索技术创新预测与宏观因素与微观因素之间的内在关系。
3、采用先简单后复杂的研究方法。对基于BP神经网络的技术创新预测和评估模型的研究,先从某一行业出发,定义模型的基本输入因素,然后,逐步扩展,逐步增加模型的复杂度。
4、理论和实践相结合。将研究工作与具体企业的技术创新实际相结合,进行实证研究,在实践中丰富和完善,研究出具有科学性和实用性的成果。
关键词:旅游市场;需求预测;方法
一、引言
旅游需求是旅游市场形成的根本基础,没有旅游需求,旅游市场就无从谈起,旅游产品的价值也就无法实现。因此,对某地旅游产品的需求量是旅游目的地旅游管理部门、旅游企业(景区、旅行社等)和旅游从业人士都十分关切的重要问题。旅游需求的重要性说明,任何一个国家或地区在发展旅游业时,都必须以人们对该国或该地区旅游产品的需求为依据,在此基础上有针对性地开发旅游产品,合理地规划和控制旅游业的开发规模和发展速度,以实现发展区域旅游业的最佳效益。对旅游者需求研究特别是对其消费行为的研究非常重要,中国的旅游业发展需要这方面的研究来指导实践。而消费者的需求和消费行为也随着社会发展不断变化,需要业界不断地追踪研究,与时俱进。旅游者需求与消费行为将始终是中国旅游研究的前沿问题[1]。我国的学者一直以来十分重视这个问题的研究,进行不断地探索,取得了一定的研究成果。
随着我国旅游业的不断发展,旅游活动对社会的影响不断加大,关于旅游需求的研究开始向更深的层次展开,很多不同领域的学者开始介入到旅游需求的研究之中。从旅游目的地的角度研究旅游需求可以指导目的地的旅游产品的开发与规划、旅游企业经营策略,为旅游资源开发与规划等提供科学的依据。
二、旅游市场需求预测研究中的统计分析
利用中国期刊网搜索,从研究内容进行选取,共有137篇文章来探索旅游市场需求预测问题。王铁生(1984)首先发表文章探讨杭州国内旅游需求预测[2]。而1985年12月通过鉴定的《北京旅游发展战略》,其中包含了客源市场调查研究篇幅,从内容上看,包括了客源市场预测、市场发展战略、旅游者行为分析等;从方法上看,使用了大规模的问卷抽样调查,并进行了旅游市场预测研究,在全国具有领先意义[3]。从此开始,我国学者对旅游需求预测进行不断研究和探索。
(一)文献数量统计
从文献的时间动态分布统计中看出(见图1),我国学者从20世纪80年代中期开始进行旅游市场需求预测研究,在20世纪80年代仅有4篇相关文献。而持续进行此方面的研究始于20世纪90年代中期。我国学者陆续开始进行旅游市场需求预测的研究。从1996-2004年,文献数量基本持平,但总体上略有递增趋势。近几年(2005-)有关旅游市场需求预测的研究又有新的增长,而且增幅很大,尤其是2005年达到15篇,是2004年的3.75倍,2006年达到了20篇,2007年截至到7月份已经有19篇文献,可见我国对旅游市场需求预测的研究真正兴起于最近几年。
(二)研究方法分类统计
国内对旅游需求预测的研究主要是在借鉴国外旅游需求预测方法的基础上做更进一步的探索与分析,不少学者对旅游需求预测方法改进做了大量研究[4]。笔者参考了任来玲(2006)的旅游需求预测分类[5],将137篇文献按照研究方法进行分类。从传统的研究方法来看,有60.1%的文献采用,其中有15.2%的文献采用了定性研究方法,有44.9%文献采用了定量研究方法,所有的传统研究方法中回归模型的应用最多,达到了24.6%;有39.9%的文献采用了人工智能方法,在人工智能方法中,灰色系统研究方法应用最多,达到了19.6%。
三、旅游市场需求研究轨迹分析
在对137篇文献进行总体统计分析的基础上(结合表1和图1),根据我国旅游市场需求研究的具体情况,从研究发展的轨迹来看,可以划分为三个阶段:第一个阶段为20世纪80年代,我国的旅游研究起步于改革开放以后的20世纪70年代末期,这个旅游研究处于起步阶段,一直到20世纪80年代末期,我国对旅游市场需求预测的研究仅有很少的学者介入,研究成果很少;第二个阶段为20世纪90年代,我国的旅游研究蓬勃发展,有较多的学者开始对旅游市场需求预测进行研究,从内容和方法都有一定的扩展;第三个阶段为2000年以来。2000年以来,我国的旅游市场需求预测研究在数量上和研究方法上都出现了比较大的变化,虽然回归模型仍然是主要的研究方法,但是已经从简单的一元回归向多元回归、指数回归、多项式回归转变,新的研究方法引入、如神经网络、粗集理论开始应用到旅游市场需求预测之中,而且多种方法的综合应用研究也不断地增加。
(一)零散的摸索起步阶段(20世纪70年代末-80年代末)
在此期间共有5篇相关文献。从研究方法的时间演进看,我国的旅游市场需求预测研究在1990年以前,我国的学者开始进行旅游市场需求预测研究的摸索,在研究方法上主要使用传统的研究方法,虽然以定量方法为主,但是利用的定量方法比较简单,回归模型都是使用了简单的一元线性回归方法,而且都以国民人均收入为自变量。
这一阶段代表性成果有王铁生,葛立成(1984)利用铁路运输、公路运输、水运和空运发送人次对杭州旅游人次进行匡算,并指出了其中的误差。在对杭州市旅游市场需求进行预测中,认为经济发展是衡量国内旅游发展的重要因素,因此,其利用人均国民收入作为自变量用一元回归模型进行旅游市场需求预测。同时为了弥补第一种方法的不足,又使用了指数方程(时间序列)进行了预测。文章最后指出旅游增长率高于人均国民收入增长率[2]。叶涛(1986)首次提出运用计量经济学的方法进行旅游市场需求预测。文章提出了黄山客流量模型,文章使用了回归和滑动平均结合模型对黄山旅游市场需求进行了预测[6]。韩德宗(1986)首次将引力模型和旅行发生模型引入国内,并进行了介绍、分析[7]。
(二)稳定的探讨成长阶段(20世纪90年代)
在这一阶段,旅游市场需求研究文献数量相比较第一阶段有了很大的提高,在研究方法上也出现多元化,特尔菲法、ARIMA模型和灰色系统都第一次运用到旅游市场需求预测之中,但回归模型和时间序列仍然占有主导地位。研究出现了从简单单变量分析向复杂的多变量分析、静态模型向动态模型、单一方法向方法综合发展,多种学科(如数学、地理)开始介入到研究之中的变化趋势。
一些新的预测方法、模型应用到旅游市场需求预测之中。保继刚(1992)首次运用修正引力模型对北京市6月份国内游客预测模型,并指出模型的使用范围,在我国使用引力模型存在数据问题,要使用引力模型进行旅游市场需求预测必须有些解决旅游数据获取[8]。张洪明(1995)首次将灰色理论应用于旅游市场预测之中,建立了引入残差信息的灰色预测模型,指出灰色建模不需要大量原始数据,不存在误差积累,和概率统计、回归模型比较具有精度高的特点,适合用于中长期旅游市场需求预测[9]。赵西萍,王磊,邹慧萍(1996)对国际上旅游市场预测方法进行了综述,并提出了旅游需求预测的发展趋势——与经营管理过程相融合的预测方法[10]。魏启恩,刘新平(1997)引入随机时间序列ARMA,ARIMA模型分析方法,建立了西安境外游客的ARIMA动态预测模型[11]。
这一阶段一些综合性的组合方法开始出现,如周建设,刘新平(1996)选用了逻辑斯缔曲线模型,选用常规的线性回归和三次曲线模型等7种模型对昆明入境游客进行预测,通过比较分析发现带虚拟变量的线性回归模型和指数曲线模型较优。并利用7种预测模型进行了组合预测[12]管宁生,杨丽,王建平(1998)利用指数模型和特尔菲法对鹤庆县旅游市场进行了预测[13]。
(三)快速的发展整合阶段(2000年-)
2000年以来,我国对旅游市场需求预测的研究进入了新的阶段,目前有108篇成果出现,远远多于前20年的总和,由此来看,对于旅游市场需求预测的研究成为了旅游研究的热点之一。随着经济学的介入和人工智能理论的成熟以及在各行业的广泛应用,旅游研究者将计量经济方法、神经网络、灰色模型等这些方法引入旅游业,并进行了旅游需求模型和预测研究的有益探索。在旅游市场需求研究中尝试将新的研究方法于最新的研究结合和整合运用,研究方法逐渐精细化,这样得益于旅游需求理论的不断提升,旅游建模和预测方法也经历了比较大的变化。
李峰,孙根年(2006)应用旅游本底趋势线的概念和方法研究了2003年“SARS”对我国的旅游的影响[14]。吕连琴,王世文(2000)通过定性与定量相结合的方法,分析了小浪底国内客源市场的趋势和走向,还尝试采用了趋势分析法、专家咨询法、分级累计法、平均值法等多种预测方法,对小浪底旅游区国内旅游市场进行了深入的分析与预测[15]。田喜洲(2001)对重庆市美国旅游客源市场进行了详细分析,并通过建立指数方程预测模型预测了重庆市未来3年的美国游量[16]。张启敏,汪文帅(2002)采用Hammerstein模型对宁夏2006年的旅游需求量进行预测、并对该模型进行了修正,同时指出在小样本条件下Hammerstein模型是一个非线性模型[17]。吴江,黄震方(2004)运用Logistic曲线对旅游地生命周期的发展阶段进行模拟,并应用StellII语言建立了模型,代入一定的数据进行处理,模拟旅游产品生命周期曲线,并对这一曲线的主要影响因素进行了讨论,得出旅游市场预测的非线性规律,并讨论回头客对旅游地持续发展的重要性[18]。王娟、曾昊(2001)研究了人工神经网络(ArtficialNeuralNetworks)在旅游市场预测的应用及其重要性[19]。郑江华,刘平(2001)利用线性组合预测方法对新疆国际旅游客源量进行了预测[20]。张立生(2004)研究了影响旅游需求的因素,并对经济、人口和交通因素分别进行分析,建立了预测模型,预测了我国2005年和2010年的国内旅游人次和旅游收入[21]。刘颂(2003)利用GM(1,1)模型对旅游地客源市场动态预测方法进行了探讨[22]。曹霞(2006)在分析上海市2000年1月—2004年9月旅游市场动态变化时序数据的基础上,采用博克斯-詹金斯(B-J)方法预测了2004年4月—2004年9月间上海市旅游客流的发展变化趋势[23]。谭频频等(2006)建立基于月度数据的桂林漓江旅游航班、运量及游客的需求预测模型,运用指数平滑、SARIMA和Elman人工神经网络3种方法,并采用平均绝对误差(MAE)、均方差百分比误差(RMSE)和平均绝对百分比误差(MAPE)评价模型预测效果。预测实例表明Elman神经网络模型更能反映时间序列的波动性,更适合桂林漓江旅游需求预测[24]。
四、结语
综上所述,可以看出国内对旅游市场需求预测的研究具有以下特点:
第一,从研究方法来看,国内在对旅游市场需求预测的研究过程中仍然偏重于定量研究方法(模型)的使用和探索,但是,研究成果具有一定的相似性。近年,开始注重定量与定性方法相结合以及一些方法的综合运用,预测方法正由单一化逐渐向综合化方向发展。但是和国外的研究相比较,虽然研究方法日益丰富,但是研究零散,缺乏系统性,没有形成体系,因此,对于研究方法的理论探讨和体系形成需要不断地努力。
第二,从研究对象和研究内容来看,国内旅游市场需求预测研究方面着重现象的统计描述,利用模型进行过程和机制分析较少;针对某一消费者群或旅游目的地的实证分析较多,对基础理论与方法论的探索少;强调个案研究多,以个案推导整体的做法不够严谨,样本质量和代表性存在问题,研究结论不具备普遍指导意义。在研究中对于旅游市场需求预测的目的和意义认识不够,对于预测过程和结果的分析不足,致使其实用价值受到很大影响。
参考文献:
[1]范业正.旅游者需求与消费行为始终是旅游研究的前沿问题[J].旅游学刊,2005,20(3):10-11.
[2]王铁生,葛立成.对来杭国内旅游者的动态分析[J].浙江学刊,1984(4):7-13.
[4]欧阳润平,胡晓琴.国内外旅游需求研究综述[J].南京财经大学学报,2007(3):80-83.
[5]任来玲,刘朝明.旅游需求预测方法文献述评[J].旅游学刊,2006(8):90-92.
[6]叶涛.黄山旅游市场的分析和预测[J].数量经济技术经济研究,1986(2):63-68.
[7]韩德宗.旅游需求预测重力模型和旅行发生模型[J].预测,1986(6):66-67.
[8]保继刚.引力模型在游客预测中的应用[J].中山大学学报(自然科学版),1992(4):133-136.
[9]张洪明.森林旅游客流量引入残差信息的灰色预测[J].四川林勘设计,1995(4):29-33.
[10]赵西萍,王磊,邹慧萍.旅游目的地国国际旅游需求预测方法综述[J].旅游学刊,1996(6):28-32.
[11]魏启恩,刘新平.西安市境外游客动态预测模型[J].陕西师范大学学报(自然科学版),1997(2):67-71.
[12]周建设,刘新平.昆明境外游客市场预测探讨[J].陕西师范大学学报(自然科学版),1996(4):75-79.
[13]管宁生,杨丽,王建平.鹤庆县旅游市场分析与预测[J].社会科学家,1998(增刊):105-108.
[14]李峰,孙根年.基于旅游本底线法(TBLM)的旅游危机事件研究——以2003年“SARS”事件为例[J].人文地理,2006(4):102-105.
[15]吕连琴,王世文.黄河小浪底旅游开发的国内客源市场分析与预测[J].地域研究与开发,2000(4):93-96.
[16]田喜洲.重庆市美国客源市场分析、预测与开发对策[J].重庆商学院学报,2001(3):18-20.
[17]张启敏,汪文帅.宁夏旅游需求量的预测[J].信阳师范学院学报(自然科学版),2002(2):162-165.
[18]吴江,黄震方.旅游地生命周期曲线模拟的初步研究—Logistic曲线模型方法的应用[J].地理与地理信息科学,2004(5):91-94.
[19]王娟,曾昊.人工神经网络——一种新的旅游需求预测系统[J].旅游科学,2001(4):24-27.
[20]郑江华,刘平.新疆国际旅游客源量的线性组合预测[J].交通运输系统工程与信息,2001,1(2):140-143.
[21]张立生.我国国内旅游市场规模分析与预测[J].地域研究与开发,2004(1):59-61.
[22]刘颂.旅游地客源市场动态预测方法探讨[J].曲阜师范大学学报,2003(4):107-110.
目的比较时间序列分析中指数平滑法、移动平均法、自回归分析及求和自回归滑动平均法(ARIMA)在海西州地区2001年1月至2007年12月高血压发病率预测中的优劣。方法用时间序列分析各方法建模预测,比较各方法的误差平方和、赤池信息量、施瓦茨信息量、拟合优度和拟合效果,确定最佳预测方法。结果指数平滑法、移动平滑法、自回归分析法及求和自回归滑动平均法中,ARIMA模型的误差平方和、赤池信息量、施瓦茨信息量最小,拟合优度最大,拟合效果最好。结论海西州地区2001年1月至2007年12月的高血压发病率预测中,时间序列诸分析方法中求和自回归滑动平均法预测效果最好。
【关键词】ARIMA模型;预测;时间序列分析;高血压;发病率
【Abstract】ObjectiveToprovidethefittestmodelforforecastinghypertensionincidenceinHaixizhouregionbycomparingtheresultsofexponentialsmoothing,movingaverage,autoregressivemodelandautoregressiveintegratedmovingaveragemodel(ARIMAmodel)fromJanuarytoDecemberin2007.MethodsThefittingeffectsoffourstatisticalmethodswerecomparedandthefittestmodelwaschosen.ResultsAmongthefourstatisticalmethods,theeffectoffittingandpredictionofmovingaveragemodelwasthebest.ConclusionsMovingaveragemodelseemstobethefittestoneinthepredictionofhypertensioninHaixizhouregionfromJanuary,2001toDecember,2007.
【Keywords】ARIMAmodel;Predict;Timeseriesanalysis;Hypertension;Incidence
近来,时间序列分析无论在理论上还是在应用方面,都有迅速的发展,成为概率统计学中一个内容丰富的重要分支,作为一种现代数据处理方法,时间序列分析在系统辨识与系统分析中占有十分显著的地位〔1〕。由于疾病发病率是有记忆的随机过程,残差间自相关不独立,所以不能用一般线性回归建模,应当选用适当的模型描述指标变化规律,利用模型作短期预测〔2〕。高血压发病率受到许多因素的制约,且这些因素之间又保持着错综复杂的联系,因此,运用结构性的因果模型分析和预测往往比较困难。本文尝试应用时间序列分析对青海海西州地区高血压发病资料进行分析,以阐明其变化规律,达到快速有效地预测。
1资料与方法
1.1资料来源
全部发病资料取自青海海西州第一人民医院。经过核对、补漏,从而保证资料的准确和完整。运用Excel2003及EViews3.1对2001年1月至2007年12月海西州地区高血压发病资料进行整理分析,统计海西州地区2001~2007年的高血压月发病率(记为yt)。
1.2方法
根据被预测变量自身的变化规律来建立模型,然后利用这个模型来预测该变量未来的变化。时间序列分析包括指数平滑法、移动平滑法、自回归分析及求和自回归滑动平均法(ARIMA法)〔3〕。主要通过比较各方法的拟合优度、误差平方和等实现评价。分析由EViews3.0软件完成。
1.3建模、预测
1.3.1指数平滑法
用序列过去值的加权均数来预测将来的值,近期的给以更大的权数,远期的给以较小的权数。表达式为:t=ayt,+(1-a)t-1,yt是当期真实值,t是当期平滑值,t-1是上期平滑值,a是平滑系数,它的取值范围为0≤a≤1。到时期t时,只需要知道实际数值和本期预测值两个数据就可预测下一个时间的数值。
1.3.2移动平滑法〔4〕
利用一组观察值的均值作为下一期的预测值,设时间序列为y1、y2、y3…可以表示为Ft+1=1N∑tt=N+1yt,其中yt为最新观察值,Ft+1为下一期的预测值,N为一组观察值的个数。q阶移动平均模型的公式为:yt=ε1-θ1εt-1-θ2εt-2-…-θqεt-q。用自相关系数识别,它的自相关系数为:rk=-θk+θ1θk+1+L+θq-kθq1≤k≤q0k>q。时间序列相差k个时期时两项数据序列之间的依赖程度可用自相关系数rk表示为:∑nt=k+1(yt-Y)(yt-k-Y)/∑nt=1(yt-Y)2,其中n是时间序列yt的数据个数;yt-k是其滞后k期数据形成的序列。Y=1n∑nt=1yt是时间序列的平均值。rk取值范围在±1之间,|rk|与1越接近,说明时间序列的自相关程度越高。
1.3.3自回归分析〔5〕
主要是对时间序列求其本期与不同滞后期的一系列自相关系数和偏自相关系数以识别其特性的方法,主要用偏自相关系数来判定模型的阶数。p阶自回归AR(p)模型的公式为:yt=1yt-1+2yt-2+…+pyt-p+εt,它的偏自相关系数满足:kii1≤i≤p0p+1≤i≤k。偏自相关是时间序列yt在给定了yt-1、yt-2、…yt-k+1的条件下,yt与滞后k期时间序列之间的条件相关。用来度量当其他滞后1、2、…k-1期时间序列作用已知的条件下yt与yt-k之间的相关程度,用Φkk度量。Φkk=(rk-∑k-1i=1Φk-i,i×rk-i)/(1-∑k-1i=1Φk-i,i×ri),k=2、3、…其中Φki=Φ(k-1)k-Φkk×Φ(k-1)(k-i),i=1、2、…k-1。
1.3.4ARIMA模型〔6〕
首先判定数据有无随机性、平稳性、季节性,然后要在预测之前实现最优拟合、建模,最后进行预测及评价。模型ARIMA(p,d,q)的公式为:yt=1yt-1+2yt-2+…+pyt-p+εt-θ1εt-1-θ2εt-2-…-θqεt-p。其中p、q为模型的阶数;常数系数1、2、…p和θ1、θ2、…θp为模型的参数;yt-1、yt-2、…yt-p是时间序列在t-1、t-2、…t-p时刻的观察值;εt-1、…εt-q为残差序列。ARIMA模型需确定三个参数,即自回归阶数(p)、差分次数(d)、移动平均阶数(q),它首先通过差分把时间序列的季节性消除(达到数据平稳),然后建模,最后估计参数。对非季节性数据,一般求一阶差分即可。若时间序列的季节性变动周期为T,则时间序列yt的一阶季节差分序列Tyt为Tyt=yt-yt-T(t>T)。自相关分析图将自相关系数和偏自相关系数绘制成图,并标出了置信区间,利用它我们可以分析时间序列的随机性、平稳性和季节性。随机性是指时间序列各项之间没有相关关系的特性,判定准则:自相关系数基本上落在置信区间内。平稳性是指时间序列的统计特征不随时间推移而变化,判定准则:自相关系数rk在k>3时都落入置信区间内并逐渐趋于零。季节性是指在某一固定时间间隔上,重复出现的某种特性,判定准则:某一时间序列在k=2或3以后的自相关系数rk值存在周期性的显著不为零的值,则有季节性。
1.4各种方法评价
比较各方法2001年1月至2007年12月的误差平方和(SSE)、赤池信息量(AIC)、施瓦茨信息量(SC)、拟合优度和拟合效果,以SSE、AIC、SC较小者为优,拟合优度较大者为优,拟合效果较佳者为优。
2结果
2.1建模、预测
2.1.1用指数平滑法建模预测
首先通过对数据的平稳性分析,选用简单指数平滑法,确定使得SSE最小的α值为0.5(SSE=561.1475)。将α代入得:y=0.5yt+0.5yt估,y为下一月的预测值,yt为当月的真实值,yt估是当月的估计值。见表1。
2.1.2用移动平滑法建模预测
通过做自相关分析图发现偏自相关系数q取12时,拟合优度最大,故选MA(12)模型:yt=εt-0.2619εt-1-0.4516εt-2-0.5196εt-3-0.6217εt-4-0.6200εt-5-0.4500εt-6-0.3075εt-7-0.7016εt-8-0.5387εt-9-0.1144εt-10+0.0964εt-11-0.1730εt-12。见图1、表2。表1指数平滑法SSE比较,表2移动平均模型拟合优度比较(略)。
2.1.3用自回归分析建模预测由自相关分析图(图1)发现p取1、2、4、7、8比较合理,而由表3可知,当p=8时,拟合优度最大,故选AR(8)模型:yt=0.1570yt-1+0.1823yt-2+0.0841yt-3+0.2601yt-4+0.1942yt-5+0.0057yt-6-0.1532yt-7+0.2604yt-8+εt。见图1,表3。表3自回归模型拟合优度比较(略)
2.1.4用ARIMA模型建模预测
进行分析时,首先确定ARIMA模型的各阶数,模型阶数的确定通过比较不同阶数时拟合优度及分析自相关分析图和偏自相关分析图实现。如表4、图2显示ARIMA(7,1,8)较好,统计量信息包括回归标准误差(standarderrorofregression)、对数似然比(loglikelihood)、AIC、SC。见图2,表4。表4不同ARIMA模型统计量信息的比较(略)
代入公式得到预测方程,预测方程为:(1+0.4714B+0.2645B2-0.0427B3-0.4401B4-0.4024B5-0.1757B6+0.3157B7)(1-B)yt=(1+0.6031B+0.1197B2+0.4369B3+0.3045B4+0.0277B5-0.0878B6-0.2218B7+0.0658B8)εt
其中,yt为当月高血压的实际发病率值,εt为当月高血压发病率预测值的误差,B为后移算子。
2.2四种方法预测效果比较
通过比较2001年1月至2007年12月各方法的SSE值、AIC值、SC值和拟合优度来判断预测效果优劣,结果见表5。四种方法的拟合效果,见图3~图6。表5不同预测方法预测效果比较(略)
3讨论
在高血压的防治工作中,如何准确、及时地预测高血压的发病率成为卫生机构决策者的难题,目前还没有有效、成熟的方法,而系统地运用时间序列各种方法对高血压的发病率进行预测还未见报道。利用时间序列模型不需要知道影响预测变量的相关因素,这是其他预测方法所不能比拟的,可以通过既往资料快速预测。但也应看到,正是由于未考虑影响预测变量的相关因素,它也有局限性,适合于受预测变量的相关因素影响较小的试点,即相对稳定的试点,如海西州地区〔7,8〕。
时间序列分析法各有特点。指数平滑法需要通过反复试验确定使均方差最小的α值,本例确定的α值为0.5,方程为y=0.5yt+0.5yt估,它只需知道上一年的资料即可。移动平滑法有两个优点:一是计算量少;二是移动平均线能较好地反映时间序列的趋势及变化。自回归分析法依赖于样本量,必须有一组连续变量。而ARIMA法将移动平滑法、自回归分析法及数据的平稳性考虑在了一起,通过自相关系数和偏自相关系数分析确定p和q。四种方法中,理论上讲ARIMA模型更全面,综合考虑因素多,本研究也证实了这一点,但在不同的应用条件下,还要视具体情况而定〔9〕。
本课题组曾对海西州地区2001年1月至2007年12月的高血压发病率与平均气温进行分析,发现了平均气温对高血压月发病率的影响作用,但不能进行定量预测〔10〕。本研究则为定量预测提供了有效工具。时间序列模型预测的偏差大小受数据本身特点、样本量大小等因素影响。其中ARIMA模型预测效果较好。
本文数据是近7年海西州地区的资料,海西州既是我国西北高原地区,又是我国少数民族聚集的地区,尽管国家经济文化迅速发展,卫生条件得到改善,但是政府对这类疾病的预防不够重视,所以近几年来海西州地区高血压的发病率有逐年增高的趋势,提醒医疗卫生部门应加强对高原少数民族地区高血压预防和控制的宣传工作〔11~13〕。做好该地区高血压月发病率的预测对高原少数民族地区人民的健康有重要的意义。
参考文献
1杨宇.基于ARMA模型对地价指数的预测〔J〕.统计与决策,2007;5(1):401.
2曾勇红,王锡凡,冯宗建.基于混合自回归滑动平均潜周期模型的短期电价预测〔J〕.西安交通大学学报,2008;42(2):1858.
3孙玉环.ARMA模型在测算重大突发事件影响中的应用〔J〕.统计与决策,2006;7(1):246.
4胡军华,唐德善.时间序列模型在径流长期预报中的应用研究〔J〕.人民长江,2006;37(2):401.
5贾春生.ARIMA模型在马尾松毛虫发生面积预测中的应用〔J〕.安徽农业科学,2007;35(19):56723.
6李瑞莹,康锐.基于ARMA模型的故障率预测方法研究〔J〕.系统工程与电子技术,2008;30(8):158891.
7戴晓枫,肖庆宪.时间序列分析方法及人民币汇率预测的应用研究〔J〕.上海理工大学学报,2005;27(4):3414.
8吴庚申,梁平,龙新峰.基于ARMA的汽轮机转子振动故障序列的预测〔J〕.华南理工大学学报(自然科学版),2005;33(7):6773.
9易丹辉.数据分析与EViews应用〔M〕.北京:中国统计出版社,2005:10634.
10马亮亮,田富鹏.基于ADL模型的海西州地区高血压发病情况研究〔J〕.浙江万里学院学报,2009;22(5):69.
11马亮亮,田富鹏.基于糖尿病相关因素的主成分分析〔J〕.长春大学学报,2009;19(8):613.
关键词:电力需求;预测方法;比较
1、引言
1.1问题的背景
经济的增长并不必然带来电力消费的同速增长,但同时,电力消费则是促进国内生产总值增长的重要原因。这意味着为了避免电力短缺的负面影响,规划建设充足的发电能力和输送能力,合理安排好发电、输电、供电、用电整合环节的相应计划,以满足社会各方面需求是非常重要的,它决定了经济发展的速度。
解决电力短缺问题的首要问题是做好电力需求的预测。电力需求预测的重要性体现在三个方面:发电扩展计划、输电扩展计划和财务计划。
1.2预测方法简介
预测方法可以被分为定性和定量两大类。对于电力方面的预测主要是采用定量分析的方法,但必需满足以下三个条件:一是能够知道待测变量的历史数据信息;二是这些信息可以量化;三是过去的变动形式将持续到未来成为一个合理的假设。本人认为,预测方法可以分为两类:一种是传统或经典预测方法,另一种就是现代的预测方法。
2、传统预测方法
(1)指数平滑法
指数平滑法的基本思想是加权平均,选取一组时间上有序的历史数据,S1、S2、x3……St,一次指数平滑预测的迭代公式为:
St=aYt+(1-a)St-1(2.1)
式中,St--时间t的平滑值;Yt--时间t的实际值;St-1--时间t-1的实际值;
a--平滑常数,其取值范围为[0,1];
对越近期的数据加权越大,这反映了近期数据对未来负荷影响更大这一实际情况,同时能通过平滑作用消除序列中的随机波动。
电力系统的负荷在本质上是不可控的,但是具有一定的固定变化趋势,如逐步增长或减小,或者按照一定周期变化等等。但负荷具有较强的随机性,采用指数平滑法进行负荷预测实际只考虑到趋势顶,而忽略了周期性及随机波动顶。
(2)趋势外推法
就是根据负荷的变化趋势对未来负荷情况作出预测。电力负荷虽然具有随机性和不确定性,但在一定条件下,仍存在着明显的变化趋势。用时间t为自变量,时序数值y为因变量,建立趋势模型y=f(t)。优点是只需要历史数据,所需的数据量少;缺点是如果负荷出现异常变动,特别是出现较大的不符合趋势方程式的变动时,会引起较大的误差。
(3)时间序列法
时间序列法是一种最为常见的短期电力需求预测方法,它是针对整个观测序列呈现出的某种随机过程的特性,去建立和估计产生实际序列的随机过程的模型,然后用这些模型去进行预测。它利用了电力负荷变动的惯性特征和时间上的延续性,通过对历史数据时间序列的分析处理,确定其基本特征和变化规律,预测未来负荷。
(4)回归分析法
回归分析法是一种最为常见的中期负荷预测方法,它是针对整个观测序列呈现出的某种随机过程的特性,用数理统计中的回归分析法,根据历史数据的变化规律寻找自变量与因变量之间的回归方程式,建立和估计产生实际序列的随机过程的模型,然后用这些模型去预测。该方法的优势在于只需要历史地相关数据,数据收集的工作量较少,但也存在很大的不足。单纯的回归法的预测精度并不能达到需要的精度,一般只用于负荷变化比较均匀的情况。
3、现代预测方法
实际的电力预测中存在着许多不确定因素,如国家政策调整、国民经济发展的情况、人口的增长速度、城乡居民使用家用电器的情况、气候变化、国家能源政策等等,这些因素很难用确定的数学方法来表述和考虑,但是这些因素对负荷电量的影响又十分重要,在实际工作中不得不给于适当考虑。传统的常规预测方法对这些因素的考虑往往不够全面,显然这样做得到的结果与未来实际情况很可能存在较大的偏差。20世纪80年代后期,一些基于新兴学科理论的现代预测方法逐渐得到了成功应用。这其中主要有灰色数学理论、专家系统方法、神经网络理论、模糊预测理论等。
(1)灰色数学理论灰色系统理论的实质是将无规律的原始数据进行累加生成,得到规律性较强的生成数列后再重新建模。由生成模型得到的数据再通过累加生成的逆运算累减生成得到还原模型,由还原模型作为预测模型GM(1,1)。
近年来,灰色模型法在电力需求预测方面的应用取得了一定的效果。但目前GM(1,1)模型比较适用于具有较强指数规律的负荷序列,只能描述单调的变化过程,而对于特殊的负荷增长方式,例如当负荷按照“S”型曲线进行增长或增长处于饱和阶段时,若采用该灰色模型则预测误差较大,预测精度不满足实际要求
(2)专家系统方法
专家系统方法是对于数据库里存放的过去几年的负荷数据和天气数据等进行细致的分析,汇集有经验的负荷预测人员的知识,提取有关规则。专家系统是一个智能计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。专家系统的体系结构随专家系统的类型、功能和规模的不同,而有所差异。
(3)神经网络理论
神经网络理论是利用神经网络的学习功能,让计算机学习包含在历史负荷数据中的映射关系,再利用这种映射关系预测未来负荷。由于该方法具有很强的鲁棒性、记忆能力、非线性映射能力以及强大的自学习能力,解决了时间序列(平稳随机过程)预报问题,克服了传统的电力需求预测方法主要是把负荷预报的不确定性归为随机性,用线性或分段线性表达作为负荷预报函数,运用概率及数理统计方法进行处理所存在的缺点,目前在电力需求预测领域得到广泛应用。但其缺点是学习收敛速度慢,可能收敛到局部最小点;并且知识表达困难,难以充分利用调度人员经验中存在的模糊知识。
(4)模糊负荷预测
模糊负荷预测是近几年比较热门的研究方向。它不是通过对历史数据的分析去直接建立符合于其他因素的函数关系,而是考虑了电力负荷与纵多因素的相关性,将符合与对应环境作为一个数据整体进行加工,得出符合变化莫实际对应环境因素特征,从而将待预测年环境与各历史环境特征进行比较,得出所求的负荷增长率。
探讨基于IOWA算子的组合预测模型.先建立了灰色预测模型、随机游走模型和回归预测模型三种单项预测模型,在此基础上构建了组合预测模型,得到上证指数月均指数的预测情况,并对几种预测结果进行了评价.再利用IOWA组合预测得到的权重,预测我国2012年11月到2013年10月的上证指数走势.
2IOWA组合预测模型及基本预测模型的建立
随机游走模型有两种,其数学表达式为:不带漂移项的随机游走:Yt=Yt-1+et和带漂移项随机游走:Yt=α+Yt-1+et.式中:α是常数项(漂移项),Yt是时间序列(用股票价格或股票价格的自然对数表示);et是随机项,E(et)=0;Var(et)=σ2,即et为白噪声过程.则称Yt为随机游走过程.认为收盘价跟最高价,最低价,以及成交量有关,所以本文选取最高价,最低价,以及成交量作为因变量.对它们指数平滑后进行多元回归,其中成交量不显著,所以只选取最高价x1和最低价x2,以x1和x2为自变量,上证指数月均指数为因变量y,建立回归模型:y=0.5735x1+0.4259x2(6.6026)(4.8282)R2=0.9999DW=2.307模型通过检验,且拟合效果较好,运用该模型进行预测,预测结果及精度见表1.
3实证分析
本文选取2011年10月至2012年10月上证指数的月收盘价格指数作为研究样本,数据来源于锐思数据库.首先用excel表格计算出三个单项预测模型的预测值和预测精度.再利用lingo软件,计算得到基于IOWA的组合预测模型的最优权系数为:w1*=0.9964,w2*=0.0016,w3*=0.0020.根据各项预测方法的预测值和得到的权系数,计算出组合预测值并计算得预测精度.得到结果如表1所示:为能够更为全面的比较IOWA组合预测与各单项预测的预测有效性,本文选择了平方和误差(SSE),均方误差(MAE),平均绝对误差(MSE),平均绝对百分比误差(MAPE)和均方百分比误差(MSPE)五个常用的比较指标,IOWA组合预测与各单项预测法的各评价指标值见表2.从表2预测效果评价指标体系来看,基于IOWA的组合预测模型的各种误差指标值均明显的低于各单项预测的计算结果,从而表明组合预测方法优于单项预测方法,IOWA组合预测是有效的,能够有效地提高预测精度.由于未来的真实值无法得到,所以无法计算预测精度,从而也无法根据精度计算出权重.所以本文采取根据预测月份前13个月的平均权重进行赋权给每项单项预测的办法,进行预测.先将各单项预测往后预测12个月,其中在进行多元回归时,将最高价和最低价进行三阶指数平滑,从而利用估计方程,得出预测值.利用之前的办法得到预测权重,用组合预测往后预测12个月的上证指数预测值如表3所示:表3的预测结果表明,未来12个月我国上证指数的收盘价先有上升趋势,后有下降的趋势,具有一定的波动性.
4结论
关键词:负荷预测;灰色理论;电力系统
中图分类号:TM734;N941.5文献标志码:A
Loadforecastingmodelforpowersystembasedongreytheory
ZHANGXia,XIEWei,WEIWei
(LogisticsEng.College,ShanghaiMaritimeUniv.,Shanghai200135,China)
Abstract:Topredicttheloadofpowersystemconvenientlyandaccurately,thegreytheoryisusedtoestablishtheloadforecastingmodel.Thegreycreationmethodandgreymodelingprocessareanalyzedindetail.Theforecastingmodelsarebuiltseparatelyaccordingtothetypicalloaddataandtherealdatafromapowermarket.Theforecastingresultsshowthatitisfeasibletopredicttheloadofpowersystemusingthegreytheory.
Keywords:loadforecasting;greytheory;powersystem
0引言
电力系统负荷预测是电力系统规划设计与计划管理工作的1个基础项目,为制定电力工业发展规划和电力生产计划提供决策依据.[1]
负荷预测的核心问题是预测的技术方法,或者说是预测数学模型的建立.[2]本文描述灰色模型(GreyModel,GM)在电力系统负荷预测中的应用.它提出的分析方法[3]是根据因素之间发展态势的几何相似或相异程度衡量因素间的关联程度,对样本量多少没有过分要求,也不需要典型的分布规律,计算量少,尤其适合于短期负荷预测.
灰色系统理论将随机变量当作在一定范围内变化的灰色量,且把随机过程看作在一定范围内变化的灰色过程.对灰色的研究则是根据过去和现在已知的或非确定的无规律信息,用数据生成的处理办法,把无规律的原始数据序列变为规律的生成数据序列后再进行建模.[4]当原始数据序列较少时,可将杂乱的非平稳原始数据作累加变换,累加在一定程度上可增强数据的确定性而减弱数据的不确定性.1次累加后建立的预测模型被称为GM(1,1)模型.
以下介绍灰色模型的建立方法.先用1组典型试验数据建立GM(1,1)模型以证明GM(1,1)模型的可行性,然后用此方法对江西赣州某地的用电负荷进行预测.
1灰色预测模型
灰色预测模型的建立主要包括灰色生成方法和灰色模型的建立.
2.1灰色生成
所谓灰色生成即指对原始数据的变换使其具有一定的规律性进而建立灰色模型.本文以累加变换为例进行说明.
累加法的累加原理如下:
也可以对数列进行多次累加,但是由于累加次数和新数列的光滑度并不成正比,而且一般数列经过1次累加便可满足要求,所以通常进行1次累加即可.
1.2灰色建模
由于累加生成的数列具有按指数变化的规律,所以可视该数列为某一阶微分方程的解从而建立一阶微分方程.根据原始数列和累加生成数列可以确定方程因数(建立灰色模型),最后对确定后的微分方程进行求解即可获得预测值.将此值进行累减还原(累减还原是累加还原的逆运算)便可获得原始数据的预测值.
具体实现步骤如下.
假设累加生成数列满足如下微分方程:
上述方程组中,YN和B为已知量,可以由原始数列和累加数列求得,A为待定参数.由于变量只有a和u两个,而方程个数却有(n-1)个,显然有(n-1)>2,故方程组无解,但可用最小二乘法得到最小二乘近似解.因此,该式可改写为
2灰色预测算例
2.1典型负荷数据预测与分析
2.1.1预测数据
用电负荷值是有一定规律的,为使该预测模型具有一定的普遍性,首先以1组典型数据为例进行负荷预测,并将预测结果与实际测量值进行比较做误差分析.主要误差性能指标有相对误差、绝对误差及后检验误差.绝对误差较相对误差小于5%且后检验误差满足表1中标准时,可称预测模型有较好预测精度.
由表3可知预测值与实际值之间的绝对误差很小,相对误差经计算均在5%以内,所以灰色预测模型具有较高的预测精度;而由表4计算结果得P=1,C=0.00053,均达到优秀标准.由此可知,在理论分析中灰色预测模型可以用于负荷预测,且预测效果较好,可用于用电负荷预测.
2.2工程算例
2.2.1预测数据
电力是经济发展的晴雨表.近年来江西以工业化为核心,以大开放为主战略,经济驶上快速发展轨道,各地对电力的需求快速增长,部分地区和中心城市用电负荷激增.
江西赣州的经济发展在经历20世纪80年代末的辉煌和90年代初的平缓之后,在20世纪末21世纪初重新焕发活力,经济发展迅速,城市用电量基本符合指数发展规律.下面以该市某地2000―2006年的用电最大负荷为原始数据,采用GM(1,1)法对其未来几年的用电负荷进行预测,并将预测结果与实际测量值进行比较,检验预测模型的可靠性.表5为2000―2006年江西赣州某地每年的最大用电负荷值.
2.2.2预测结果与误差分析
对表5所列数据建立传统GM(1,1)预测模型,经过Matlab仿真计算得到的预测结果见图1.实线为实际测量数据,虚线为预测值.
由图1可知,预测值与实际测量值之间误差较小,7个预测数据中5个数据的预测结果相对误差图1预测负荷与实际负荷
均小于5%,最大相对误差为7.42%,而由仿真结果得P=1,C=0.1102,均达到优秀标准.由此可知模型具有较好的预测精度.
由图1可知,今后几年赣州每年的用电最大负荷将会有较大幅度上升,这也符合该地的经济发展趋势.
3结束语
通过对灰色理论与负荷预测进行具体分析和设计,并通过预测比较提出1种实用的预测模型.可以看出,虽然实际用电负荷数据建立的模型的预测精度不如典型试验数据模型的预测精度,但仍然可以获得较好的预测效果.
参考文献:
[1]吴成东,王长涛,韩凤艳.电力系统负荷建模与预测的新方法[J].沈阳建筑工程学院学报,2002,18(2):149-151.
[2]黄家圣,谢卫,李军军.电力系统短期负荷预测的多神经网络集成模型[J].上海海事大学学报,2005,26(3):64-67.
[3]邓聚龙.灰色预测与决策[M].武汉:华中理工大学出版社,1990.
[4]王成山,杨军,张崇见.灰色系统理论在城市年用电量预测中的应用[J].电网技术,1999,23(2):15-18.
下一篇:《飞鸟集》读后感范文(16篇)
热门推荐