一种短时序Kalman滤波决策优化预测新方法
A New Decision Optimization Prediction Method Based on Short-Term Time Series and Kalman Filter

作者: 陈静 :西安建筑科技大学信息与控制工程学院,陕西 西安; 李改鸽 :北京航天光华电子技术有限公司,北京; 段富海 :大连理工大学机械工程学院,辽宁 大连;兰州万里航空机电有限责任公司,甘肃 兰州; 杜东伟 :兰州万里航空机电有限责任公司,甘肃 兰州;

关键词: 决策预测方法短时间序列Kalman滤波自回归Decision Prediction Method Short-Term Time Series Kalman Filter Auto Regression

摘要: 为提升决策的敏捷性和科学性,提出了一种短时间序列和Kalman滤波相结合的决策优化预测方法TS_KF(Time Series-Kalman Filter)。此方法以提高预测准确度和减小计算复杂度为目的,采用Kalman滤波模型对预测过程进行建模,应用时间序列的自回归模型对Kalman滤波进行状态转移的更新和优化。以煤产量预测为例进行方法验证,结果表明,同其它典型的预测方法相比,TS_KF预测方法在保持低计算复杂度的前提下实现了预测准确度的大幅度提升,证明了TS_KF方法的有效性。

Abstract: In order to make scientific and agile decision, a new short-term prediction TS_KF (Time Se-ries-Kalman Filter) method is proposed based on the combination of time series analysis and Kalman Filter. Aiming to improve the prediction precision and decrease the calculation complexity, a prediction model is built using Kalman filter to describe the prediction process, and the auto regression for time series analysis is utilized to renew and optimize the state transfer matrix, which is the key parameter for Kalman Filter. A coal production prediction test is conducted by comparison with some typical time series prediction method, and the results show that the TS_KF prediction method in this paper has significantly enhanced the prediction precision while keeping the same low calculation complexity. The result gives a strong proof for the effectiveness of the new TS_KF prediction method.

1. 引言

在快变的国际化和一体化经济环境中,要保持国民经济的有序和平稳,政府和企业都需要有敏捷的信息获取能力和科学的决策能力。预测是决策的重要前提,预测的依据是预测模型。随着决策问题复杂性的增加,为提高决策的准确性和科学性,必须深入研究系统的决策预测方法 [1] 。

经过多年的研究发展,预测技术已经形成了相对完善的预测方法体系及相应的应用成果 [2] 。预测方法可分为定性判断和定量分析两大类。定性判断技术、统计时间序列模型和因果模型是三种最主要的典型预测方法 [3] ,其中后两种为定量分析方法。定性判断方法适用于数据难以获取,决策更多依赖于经验的情况,主要侧重于宏观分析和经验分析。例如文献 [4] 采用定性方法实现了宏观预测的医疗应用;文献 [5] 采用德菲尔法研究了护理实践和教育过程中与健康相关的问题;文献 [6] 采用经验曲线模式对能源需求进行预测。可见定性方法侧重于宏观和具有较大、较强趋势的预测。统计时间序列方法主要用于预测短期时间变化过程中某个指标的数量变化。该方法以时间作为自变量,寻求目标变量随着时间变化而产生的数量变化情况。例如文献 [7] 采用SVR方法对集成电路产业的输出进行预测分析。而因果预测模型适应于长期预测,主要采用各种回归模型实现回归分析,通过模型展现各种经济环境变量之间的影响关系。该方法用于在多个关注指标之间寻求因果关系,从而可以通过自变量指标预测因变量指标。例如文献 [8] 对多变量回归的模型选择和预测估计问题进行了讨论;文献 [9] 采用多变量图像分析回归模型预测了小吃行业生产分布。

基于智能算法改进定量分析模型是当前的研究热点 [10] - [16] 。例如文献 [10] 利用神经网络进行信用风险和破产预测;文献 [13] 集成神经网络、遗传算法和蚁群优化算法进行了电路负载预测;文献 [14] 通过遗传模糊推理系统对医院的来访者数量进行预测。这些基于智能方法的改进虽然能提升预测的准确度,但需要建立在大量的样本训练基础上,带来了额外的计算复杂度。从总体来看,现有大部分研究专注于模型与方法的验证,但对方法应用的时间特点没有进行归类分析,对方法的计算复杂性也较少关注。

各类预测方法的比较见表1

本文对比研究用到的移动平均预测方法(Moving Average, MA) [17] 和指数平滑预测法(Exponential Smoothing, ES) [18] 都是基于统计时间序列的短期预测方法。

本文在以上典型预测方法的基础上,为进一步增强决策者对外界环境反应敏捷性,以提高预测方法的准确度和减小计算复杂度为目的,立足于短期预测提出了一种基于时间序列模型的Kalman滤波优化预测模型(Time Series-Kalman Filter, TS_KF)。通过时间序列建立短期的自回归模型,增强预测的时效性,再将Kalman滤波融入到预测模型中。Kalman滤波对于预测过程中的数据可以实现滤波和预测双重功效,在提升预测模型的可靠性和准确性方面起到重要作用。文中对预测模型的实现原理进行了详细分析,体现了模型简洁、有效、计算复杂度低等优势。最后以煤产量预测的实例,通过与现有两种常见的时间序列预测方法——移动平均预测方法和指数平滑预测方法对比,验证了TS_KF方法在数据预测中的有效性。

2. TS_KF预测方法

2.1. 预测模型框架

TS_KF预测方法以Kalman滤波预测模型为基础,预测模型能保持Kalman滤波本身的迭代收敛特性,在使用过程中通过样本的积累实现逐步收敛。预测模型框架如图1

Figure 1. Predictive model framework

图1. 预测模型框架

Table 1. Comparison of different prediction methods

表1. 不同预测方法比较

相对于神经网络的智能方法,该预测模型具有以下特点:

• 不必进行前期大量样本值的训练,而将此过程融入到运行过程中,减少了模型应用过程中的前期准备工作量;

• 在使用过程中可以对样本值进行滤波,减小样本本身的误差,这是其它模型没有实现的。

预测模型在整个过程中以Kalman滤波作为主线,在局部通过时间序列分析模型进行建模,并采用了自回归模型来描述。在预测迭代过程中动态的更新Kalman滤波的状态转移矩阵。在较短的时间内保证了预测过程的线性特性,在整个过程中又跟踪了模型参数的动态变化。

2.2. 预测模型的构建

基于预测模型框架,下面构建Kalman滤波预测模型。Kalman滤波是一种广泛应用的线性定常系统滤波和预测方法,其数学表述为:

{ x k = A x k 1 + B u k + w k 1 z k = H x k + v k (1)

其中, x k 表示k时刻的估计值; z k 表示k时刻的测量值; w k 1 v k 分别表示系统的过程噪声和量测噪声,相互独立且都服从高斯分布,即:

{ w k 1 ~ N ( 0 , Q ) v k ~ N ( 0 , R ) (2)

在短时间段内对数据进行预测时,数据具有短时连续和平稳特性。该模型中不存在外输入,即 u k = 0 ,因此确定了A矩阵后,状态递推关系就可确定。对于量测方程,该模型的量测值就是状态向量的真值加上量测误差,因此H可取为单位阵。为简化模型和便于应用,在系统模型的矩阵参量确定之后,假设其在下一步的预测过程中保持不变。这样,得出简化的Kalman滤波和预测模型如下:

{ x k = a x k 1 + w k 1 z k = x k + v k (3)

式(3)中,状态转移矩阵A需要定期更新,当对单一变量进行预测时,可得矩阵A形如 d i a g ( a ) = a 。存在量测误差的时间序列可以看作一个随机过程的连续时间间隔的一次过程实现。这里采用时间序列分析中常用的自回归模型对目标变量建模。自回归模型可以表达为:

y ˜ t = ϕ 1 y ˜ t 1 + ϕ 2 y ˜ t 2 + + ϕ p y ˜ t p + ξ (4)

式(4)称为AR(p),即p阶自回归过程,式中将t时刻的偏差表示为前p个时刻的偏差的线性组合加上一个随机的干扰 ξ 。在实际的应用中p一般取1或2,对应于AR(1)和AR(2)。由于Kalman只需要一步递推的参数即可,因此采用AR(1)实现建模:

y ˜ k = ϕ 1 y ˜ k 1 + ξ (5)

μ y k 的期望水平的情况下,将 y ˜ k = y k μ 代入到(5),可得AR(1)的以下等效过程:

y k = ϕ 1 y k 1 + τ + ξ (6)

其中的参数根据时间序列采样数据来估计,依据最小二乘原则,具体参数可利用下式计算:

{ y ¯ = 1 S i = 0 S y k i ϕ 1 = i = 0 S 1 y k i y k i 1 ( S 1 ) y ¯ 2 i = 0 S 1 y k i 1 2 ( S 1 ) y ¯ 2 τ = ( 1 ϕ 1 ) y ¯ (7)

其中,S为预测的步长。

按照式(7)对式(3)中的Kalman滤波模型进一步调整和优化得:

{ x k = a x k 1 + β + w k 1 z k = x k + v k (8)

式中将 β = ( τ ) = τ 加入转移方程,表示目标变量的期望水平,该向量和矩阵 A = d i a g ( a ) = d i a g ( ϕ 1 ) = ϕ 1 同样需要进行不断更新。 v k 的方差可由时间序列计算,进而得到 v k 的方差阵R:

{ σ 2 = i = 0 S [ y ^ i ( ϕ 1 y ^ i 1 + τ ) ] 2 R k = d i a g ( σ 2 ) = σ 2 (9)

2.3. 算法描述

结合时间序列分析的Kalman滤波模型的运算步骤如下:

根据状态向量的时间序列计算回归参数 τ , ϕ 1 ,进而确定状态转移方程中的状态转移矩阵A和水平向量 β ,计算量测误差矩阵 R k 。初始化Kalman滤波模型时,有关参数的初始化问题,也会影响到模型的收敛速度和精度,因此参数初始化需根据实际情况酌情调整,以获取较好的收敛性能。

依据Kalman滤波模型进行状态向量k时刻的滤波和k + 1时刻的预测。在这两个过程中状态方程是保持不变的。

基于构建的Kalman滤波预测模型,形成的TS_KF预测算法流程见图2

Figure 2. Predictive algorithm flow

图2. 预测算法流程

3. 实验研究

煤资源的生产和消耗关系着整个世界能源战略目标制定与能源可持续发展计划的实施,煤资源的生产问题一直是备受关注的社会问题之一,因此基于该问题的预测研究具有的重要意义。

实验选取1975~2017年的煤生产数据为样本,进行相应的需求预测,并将预测结果与真实产量数据比对,以验证TS_KF预测模型在短期时间序列预测中的有效性。同时基于现有两种常见的统计时间序列的短期预测方法——移动平均预测方法(MA)和指数平滑(ES)预测方法,实现了模型之间的对比分析研究,证明TS_KF模型具有提升预测精度的作用。实验参数设置如表2

实验以表2中预测方法和参数设置,分别进行了煤产量的预测,记录预测结果,通过整理形成表3中的预测统计数据。

表2所示,首先利用各种方法进行了相关的时间序列预测;然后根据预测数据和真实数据,计算了预测误差。

为对预测效果具有更全面的比较,实验中对各种预测方法误差进行衡量,分别计算了相关的平均绝对误差(MAD)、均方误差(MSE)和平均百分比误差(MAPE),如表4图3给出了在MA (k = 2)、ES (ε = 0.1)及TS_KF (Step = 5)下各预测方法预测效果实验统计数据比较图。

表4图3的综合统计结果和预测曲线可见,在相同的误差计算方法下,TS_KF预测模型在计算复杂度等级相同的情况下,极大的提高了预测的准确性。

Table 2. Comparison experimental parameter setting of different prediction methods

表2. 预测方法对比实验参数设置

Table 3. A detailed list of predicted statistical data

表3. 预测统计数据详细列表

Table 4. Error statistics of different prediction models

表4. 不同预测模型误差统计

Figure 3. Comparison of forecast effect of coal yield using various predictive methods

图3. 各种预测方法煤产量预测效果比较

4. 结论

1) 综述了决策中现有的典型预测方法,阐述了不同预测方法的应用场合和相互关系。统计时间序列方法主要用于短期预测,是决策敏捷性的重要支撑,因此着重对短期时间序列预测进行了研究。

2) 为提升决策的敏捷性和科学性,以短时段数据的时间序列为研究对象,提出了将时间序列模型和Kalman滤波模型相结合的TS_KF预测方法,并从预测准确性和计算复杂度上优化预测方法。TS_KF方法具有模型简洁、有效、计算复杂度低等特点。

3) 以煤产量数据作为时间序列样本,采用与典型的时间序列预测方法(MA和ES)对比的方法,设计了实验验证算例,以验证TS_KF方法的有效性。结果表明,在保持计算复杂度同水平的前提下,TS_KF方法能极大的提高预测的准确性。

NOTES

*通讯作者。

文章引用: 陈静 , 李改鸽 , 段富海 , 杜东伟 (2018) 一种短时序Kalman滤波决策优化预测新方法。 软件工程与应用, 7, 243-250. doi: 10.12677/SEA.2018.75028

参考文献

[1] 杨庆芳, 赵小辉, 郑黎黎. 基于模型预测控制的环形交叉口信号配时方法[J]. 浙江大学学报(工学版), 2018, 52(1): 117-124.

[2] Pinto, R. and Gaiardelli, P. (2013) Setting Forecasting Model Parameters Using Unconstrained Direct Search Methods: An Empirical Evaluation. Expert Systems With Applications, 40, 5331-5340.
https://doi.org/10.1016/j.eswa.2013.03.044

[3] 埃文斯. 数据、模型与决策[M]. 北京: 中国人民大学出版社, 2012.

[4] Dunn, D.W., Buelow, J.M., Austin, J.K., et al. (2004) Development of Syndrome Severity Scores for Pediatric Epilepsy. Epilepsia, 45, 661-666.
https://doi.org/10.1111/j.0013-9580.2004.53903.x

[5] Whitehead, D. (2008) An International Delphi Study Examining Health Promotion and Health Education in Nursing Practice, Education and Policy. Journal of Clinical Nursing, 17, 891-900.
https://doi.org/10.1111/j.1365-2702.2007.02079.x

[6] Weiss, M., Junginger, M., Patel, M.K., et al. (2010) A Review of Expe-rience Curve Analyses for Energy Demand Technologies. Technological Forecasting and Social Change, 77, 411-428.
https://doi.org/10.1016/j.techfore.2009.10.009

[7] Hsu, L. and Wang, C. (2007) Forecasting the Output of Integrated Circuit Industry Using a Grey Model Improved by the Bayesian Analysis. Technological Forecasting and Social Change, 74, 843-853.
https://doi.org/10.1016/j.techfore.2006.02.005

[8] Yuan, M. and Lin, Y. (2006) Model Selection and Estimation in Regression with Grouped Variables. Journal of The Royal Statistical Society Series B-Statistical Methodology, 68, 49-67.
https://doi.org/10.1111/j.1467-9868.2005.00532.x

[9] Yu, H.L. and Macgregor, J.F. (2003) Multivariate Image Analysis and Regression for Prediction of Coating Content and Distribution in the Production of Snack Foods. Chemometrics and Intelligent La-boratory Systems, 67, 125-144.
https://doi.org/10.1016/S0169-7439(03)00065-0

[10] Atiya, A.F. (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks: A Survey and New Results. IEEE Transactions on Neural Networks, 12, 929-935.
https://doi.org/10.1109/72.935101

[11] Choi, T.M., Yu, Y. and Au, K.F. (2011) A Hybrid SARIMA Wavelet Transform Method for Sales Forecasting. Decision Support Systems, 51, 130-140.
https://doi.org/10.1016/j.dss.2010.12.002

[12] Min, S.H., Lee, J. and Han, I. (2006) Hybrid Genetic Algorithms and Support Vector Machines for Bankruptcy Prediction. Expert Systems with Ap-plications, 31, 652-660.
https://doi.org/10.1016/j.eswa.2005.09.070

[13] Sheikhan, M. and Mohammadi, N. (2012) Neural-Based Electricity Load Forecasting Using Hybrid of GA and ACO for Feature Selection. Neural Computing & Applications, 21, 1961-1970.
https://doi.org/10.1007/s00521-011-0599-1

[14] Hadavandi, E., Shavandi, H., Ghanbari, A., et al. (2012) Developing a Hybrid Artificial Intelligence Model for Outpatient Visits Forecasting in Hospitals. Applied Soft Computing, 12, 700-711.
https://doi.org/10.1016/j.asoc.2011.09.018

[15] Carpinone, A., Giorgio, M., Langella, R. and Testa, A. (2015) Markov Chain Modeling for Very-Short-Term Wind Power Forecasting. Electric Power Systems Research, 122, 152-158.
https://doi.org/10.1016/j.epsr.2014.12.025

[16] Chudik, A., Grossman, V. and Hashem Pesaran, M. (2016) A Multi-Country Approach to Forecasting Output Growth Using PMIs. Journal of Econometrics, 192, 349-365.
https://doi.org/10.1016/j.jeconom.2016.02.003

[17] 宗群, 赵占山, 商安娜. 基于季节自回归单整移动平均模型的电梯交通流递归预测方法[J]. 天津大学学报, 2008, 41(8): 653-659.

[18] 吴德会. 动态指数平滑预测方法及其应用[J]. 系统管理学报, 2008, 17(2): 151-155.

分享
Top