﻿ 基于GARCH模型对股票市场进行分析预测

# 基于GARCH模型对股票市场进行分析预测The Analysis and Forecast of Stock Market Based on GARCH Model

Abstract: This paper studies Shanghai Composite Index and Shenzhen Component Index, and finds that they have similar trends and almost identical fluctuation characteristics. In order to better predict the stock development, we make statistical analysis on the logarithmic returns of the two, and establish GARCH model. The results show that the fluctuation of logarithmic return rate of Chinese stock has high persistence, strong speculative factors and certain risks.

1. 背景

2. 预备知识

2.1. 上证综指

2.2. 深证成指

2.3. 收益率的定义以及公式

${R}_{t}=\frac{{P}_{t}-{P}_{t-1}}{{P}_{t-1}}=\frac{{P}_{t}}{{P}_{t-1}}-１$

${r}_{t}=\mathrm{ln}\frac{{P}_{t}}{{P}_{t-1}}$

3. 股票趋势研究以及Garch模型

3.1. 数据的波动特征

Figure 1. The log-return distribution of the Shanghai Composite Index distribution

Figure 2. The log-return of Shenzhen Stock Index

3.2. 正态性检验

Figure 3. Shanghai Composite Index log-return histogram

Figure 4. Shenzhen composite index log-return histogram

Table 1. Basic statistical characteristics of logarithmic returns of Shanghai and Shenzhen Stock Exchange

3.3. 自相关图和偏自相关图

Figure 5. Autocorrelation and partial autocorrelation of log- arithmic return of Shanghai Composite Index

Table 2. Autocorrelation

Figure 6. Autocorrelation and partial autocorrelation of log-return

Table 3. Autocorrelation

3.4. ARCH效应检验

ARCH LM-test; Null hypothesis: no ARCH effects

data:shangzhengzhishu$对数收益率 Chi-squared = 214.1, df = 12, p-value < 2.2e-16 分析：检验结果为卡方统计量的值为214.1，对应的 P 值几乎为0，也就是说在 1% 的显著性水平上拒绝原假设，从而拒绝不存在 ARCH 效应的假设，收益率序列存在 ARCH 效应，可以进行 GARCH 模型的拟合 [5]。 利用R中garchFit函数进行GARCH 模型的拟合得到下列结果： Error Analysis: Estimate Std. Error t valuePr(>|t|) mu 3.476e-042.499e-04 1.391 0.1643 omega6.289e-07 2.564e-07 2.453 0.0142* alpha1 6.588e-02 1.044e-02 6.312 2.76e-10*** beta1 9.330e-01 9.188e-03 101.553<2e-16*** Signif. codes:0 ‘***’ 0.001 ‘**’ 0.01 ‘*’0.05 ‘.’ 0.1 ‘ ’ 1 均值方程： ${y}_{t}=3.476×{10}^{-4}+{\epsilon }_{t},\text{\hspace{0.17em}}{\epsilon }_{t}~N\left(0,1\right)$ Garma方程： ${H}_{t}^{2}=6.289×{10}^{-7}+6.588×{10}^{-2}×{\epsilon }_{t-1}^{2}+9.330×{10}^{-1}×{H}_{t-1}^{2}$ 分析：通过运行结果可知所有系数都是显著的，说明上证指数收益率过去时刻的波动对现在的影响还是明显的，具有波动聚集现象，此外 ${\alpha }_{1}$${\beta }_{1}$ 的和约为1，说明，条件异方差序列具有长记性性，表明了收益率的波动具有较高的持续性，投机因素较强，具有一定的风险。 在拟合完GARCH模型之后，我们对模型结果的残差进行分析。 Figure 7. Shanghai composite index residuals 图7. 上证指数残差 如图所示：图7是残差序列时序图，可以看到残差序列没有明显的波动聚集效应。 如图所示：图8是残差的自相关图和偏自相关图。可以看到残差序列的ACF和PACF图大部分函数值在置信区间内(图中蓝色的虚线区域)上下跳跃，所以标准化残差序列并不具有自相关性，或者具有一定的弱相关性(PACF图结果)。结果表明此GARCH模型可以有效地解释收益率序列 [6]。 Figure 8. Autocorrelation and partial autocorrelation of residual error of Shanghai Composite Index 图8. 上证指数残差残差的自相关图和偏自相关图 同理对深证成指进行上述一系列的操作，检验发现： 1) 是否有异方差效应：检验结果为卡方统计量的值为225.02，对应的P值几乎为0，也就是说在1%的显著性水平上拒绝原假设，从而拒绝不存在ARCH效应的假设，收益率序列存在ARCH效应，可以进行GARCH模型的拟合。 2) 进行GARCH模型的拟合：均值方程： ${y}_{t}=2.170×{10}^{-4}+{\epsilon }_{t},\text{\hspace{0.17em}}{\epsilon }_{t}~N\left(0,1\right)$ Garma方程： ${H}_{t}^{2}=1.880×{10}^{-6}+5.307×{10}^{-2}×{\epsilon }_{t-1}^{2}+9.396×{10}^{-1}×{H}_{t-1}^{2}$ 通过运行结果可知所有系数都是显著的，说明深证指数收益率过去时刻的波动对现在的影响还是明显的，具有波动聚集现象，此外 ${\alpha }_{1}$${\beta }_{1}$ 的和约为1，说明，条件异方差序列具有长记性性，表明了收益率的波动具有较高的持续性，投机因素较强，具有一定的风险。 3) 残差序列的时序图：可以看到残差序列没有明显的波动聚集效应。 4) 残差相关性：从深证指数残差的自相关图和偏自相关图可以看到残差序列的ACF和PACF图大部分函数值在置信区间内上下跳跃，所以标准化残差序列并不具有自相关性，或者具有一定的弱相关性。结果表明此GARCH模型可以有效地解释收益率序列。 3.5. 预测 利用求得的模型进行对数收益率预测，所得预测值为表4上证指数预测和表5深证成指预测中的数据。 1) 上证指数预测 Table 4. Shanghai Composite Index forecasts 表4. 上证指数预测 2) 深证成指预测 Table 5. Forecast of Shenzhen Composite Index 表5. 深证成指预测 4. 结论 1) 经上证综指和深证成指的线状分布图来看，两者的收益率的分布都具有多次峰值，波动变化剧烈，具有较强的突变性，且都有明显的波动聚群现象 2) 通过上证综指和深证成指的直方图，以及偏度得到两者的分布都成左偏，且峰度系数大于3，有尖峰厚尾特征。且两者的平均值大于0，这说明我国最近的经济形式是增长状态，但标准差过低，也说明我国的股市尚不成熟 [7]。 3) 通过求得的公式分析得上证综指和深证成指过去时刻的波动大小对当前波动大小有明显的影响，具有波动聚集效应。上证综指和深证成指的收益率波动具有较高持续性，投机因素较强，总体风险较大。且我们对两股票未来发展做了预测。 5. 模型的优缺点 优点：1) 本文采用对数收益率，使数据更加平滑，更易于描绘数据的特征。 2) 本文采用GARCH模型，相较于ARCH模型，更能反映实际数据中的长期记忆性质。同时特别适用于波动性的分析和预测，这样的分析对投资者的决策能起到非常重要的指导性作用，其意义很多时候超过了对数值本身的分析和预测。 3) 本文研究数据来自专门的股票平台，数据真实，来源可靠。 缺点：1) 本文只研究了GARCH模型，没有与其他模型进行对比，无法判断模型是否是最优、最准确模型。 2) 本文只根据收盘价的起伏变化说明股市之间具有联动性，没有多因素考虑。 3) 本文采用GRACH模型，存在缺点。 6. 展望 由于对模型的了解还不够深入，分析还不够透彻，我们希望以后在以下几个方面进行优化： 1) 未来我们可以利用更加复杂的参数GRACH模型比如Beta分布，Laplace分布进行拟合，或许可以得到更优模型 [8]。 2) 未来可以考虑股票的多方面来研究股市之间联动性，比如一天中股票的最高价，最低价，寻找其中是否有某种联系。 基金项目 国家级大创项目(202012026039)。 附录 shangzhengzhishu<-read.csv(E:上证指数.csv,header=T) shenzhengchengzhi<-read.csv(E:深证成指.csv,header=T) shangzhengzhishu.shoupan<-ts(shangzhengzhishu$收盘价,start=c(2013,3),frequency=238)

shenzhengchengzhi.shoupan<-ts(shenzhengchengzhi$收盘价,start=c(2013,3),frequency=238) par(mfrow=c(1,2)) plot(shangzhengzhishu.shoupan,col=red) plot(shenzhengchengzhi.shoupan,col=blue) par(mfrow=c(1,1)) shangzhengzhishu.duishushouyi<-ts(shangzhengzhishu$对数收益率,start=c(2013,3),frequency=238)

plot(shangzhengzhishu$对数收益率,col=red,type=l) par(mfrow=c(1,2)) acf(shangzhengzhishu$对数收益率)

pacf(shangzhengzhishu$对数收益率) a<-acf(shangzhengzhishu$对数收益率)

par(mfrow=c(1,1))

hist(shangzhengzhishu$对数收益率,col=red,main=上证指数对数收益率) summary(shangzhengzhishu$对数收益率)

sd(shangzhengzhishu$对数收益率) skewness(shangzhengzhishu$对数收益率)

kurtosis(shangzhengzhishu$对数收益率) jarque.bera.test(shangzhengzhishu$对数收益率)

ArchTest(shangzhengzhishu$对数收益率) shangzhengzhishu<-garchFit(~garch(1,1),data=shangzhengzhishu$对数收益率,trace=F)

summary(shangzhengzhishu)

shangzhengzhishu.pre<-predict(shangzhengzhishu,10)

shangzhengzhishu.pre

shangzhengzhishucancha<-residuals(shangzhengzhishu,standardize=T)

shangzhengzhishucancha<-ts(shangzhengzhishucancha)

par(mfrow=c(1,1))

plot(shangzhengzhishucancha,xlab='Date',ylab='st.shangzhengzhishucancha',type='l',col=red)

par(mfrow=c(1,2))

acf(shangzhengzhishucancha,lag=24)

pacf(shangzhengzhishucancha,lag=24)

shenzhengchengzhi.duishushouyi<-ts(shenzhengchengzhi$对数收益率) plot(shenzhengchengzhi$duishushouyi)

par(mfrow=c(1,2))

acf(shenzhengchengzhi$对数收益率) pacf(shenzhengchengzhi$对数收益率)

b<-acf(shenzhengchengzhi$对数收益率) par(mfrow=c(1,1)) plot(shenzhengchengzhi.duishushouyi,col=blue) hist(shenzhengchengzhi$对数收益率,col=blue,main=深证指数对数收益率)

summary(shenzhengchengzhi$对数收益率) skewness(shenzhengchengzhi$对数收益率)

kurtosis(shenzhengchengzhi$对数收益率) jarque.bera.test(shenzhengchengzhi$对数收益率)

sd(shenzhengchengzhi$对数收益率) ArchTest(shenzhengchengzhi$对数收益率)

shenzhengchengzhi=garchFit(~garch(1,1),data =shenzhengchengzhi\$对数收益率,trace=F)

summary(shenzhengchengzhi)

shenzhengchengzhi.pre<-predict(shenzhengchengzhi,10)

shenzhengchengzhi.pre

shenzhengchengzhicancha<-residuals(shenzhengchengzhi,standardize=T)

shenzhengchengzhicancha<-ts(shenzhengchengzhicancha)

par(mfrow=c(1,1))

plot(shenzhengchengzhicancha,xlab='Date',ylab='st.shenzhengchengzhicancha',type='l',col=blue)

par(mfrow=c(1,2))

acf(shenzhengchengzhicancha,lag=24)

pacf(shenzhengchengzhicancha,lag=24)

NOTES

*通讯作者。

[1] 刘梦佳. 不同分布假设GARCH模型择优及其在股市波动溢出效应中的研究[D]: [硕士学位论文]. 南昌: 江西财经大学, 2017.

[2] 刘湖, 王莹. 股票市场波动性研究——基于ARMA-TGARCH-M模型的实分析[J]. 北京航空航天大学学报(社会科学版), 2017, 30(4): 56-66.

[3] 杨帷. 基于ARIMA_GARCH模型的上证综指实证分析[D]: [硕士学位论文]. 湘潭: 湘潭大学, 2017.

[4] 杨格. 统计金融模型及金融市场波动持续时间序列的研究[D]: [博士学位论文]. 北京: 北京交通大学, 2017.

[5] 侍成. 几种不同类型金融时间序列模型预测的比较研究[D]: [硕士学位论文]. 北京: 中国矿业大学, 2017.

[6] 郝博乾. 基于时间序列分析的股票预测模型研究[D]: [硕士学位论文]. 成都: 电子科技大学, 2011.

[7] 姜乐. 基于时间序列的股票价格分析研究与应用[D]: [硕士学位论文]. 大连: 大连理工大学, 2015.

[8] 张贵生. 数据驱动的金融时间序列预测模型研究[D]: [博士学位论文]. 太原: 山西大学, 2016.

Top