公共卫生事件信息传播规律模型
Information Propagation Model of Public Health Events

作者: 翟晴雯 , 张照都 , 张日月 , 余梦洁 , 马新新 :河南科技大学数学与统计学院,河南 洛阳; 闫书丽 :南京信息工程大学管理工程学院,江苏 南京;

关键词: 灰色预测模型加权马尔可夫链公共卫生事件Grey Prediction Model Weighted Markov Chain Public Health Events

摘要:
针对新媒体背景下突发公共卫生事件信息传播现象,通过组合预测的方法,运用灰色GM(1,1)模型和加权马尔可夫链预测理论,构建了灰色–加权马尔可夫链预测模型,对突发公共卫生事件的未来趋势进行预测,有效提高了预测精度。并以非洲猪瘟事件为例进行了比较分析,验证了模型的可行性和有效性。

Abstract: Through the method of combination prediction, this paper studies the phenomenon of information propagation of public health events under the background of new media. By using the grey GM(1,1) model and the weighted Markov chain prediction theory, the grey-weighted Markov chain prediction model is constructed to predict the future trend of public health emergencies, which effectively improves the prediction accuracy. Finally, taking CSFV in Africa as an example, the fea-sibility and validity of the model are verified.

1. 引言

数据时代新媒体的产生和发展,加快了信息传播的速度,扩大了信息传播的范围,增强了信息传播的影响。但是目前的众多新媒体平台仍然缺乏有效的管理制度,一些媒体通过报道虚假信息博取关注、制造舆论,引发公众情绪恐慌,影响社会的和谐安定 [1] [2]。

突发公共卫生事件对人体健康、环境、经济都有不可忽视的影响,一直是我国公民关注的热点话题,其信息传播已经成为足够影响社会安定,国家和谐的重要因素之一,所以,研究、探索如何引导、控制公共卫生事件信息的传播,对降低其带来的负面影响、对研究方法和应用领域的拓展与创新、为决策部门提供预警,以及提高我国政府解决突发事件的能力都具有重要的价值和意义 [3]。

目前,已有一些学者对公共卫生事件信息传播规律进行了研究,Galam运用舆情演化模型,对少数人的意见在公共争论过程中的传播路径进行了研究 [4];靳松等利用数据生成H7N9舆情信息传播网络拓扑结构对舆情传播特点进行了分析 [5];洪巍等结合Logistic多项式模型对食品安全网络舆情中网民信任网络意见领袖的影响因素进行了研究 [6];滕文杰建立了时间序列ARIMA(p,d,q)模型对2011年以来发生的典型突发公共卫生事件百度搜索指数进行了建模分析 [7];刘小洋等结合了传播动力学提出了一种动态扩散网络舆情演化模型 [8]。

本文基于灰色预测理论和马尔可夫链的理论知识,通过组合预测的方法,构建了灰色–加权马尔可夫模型,以非洲猪瘟事件为例,对突发公共卫生事件的未来趋势进行预测,帮助了解突发公共卫生事件发展和影响范围,及时辅助决策者做出科学合理的决策行为。

2. 灰色–加权马尔可夫链预测模型

2.1. 灰色预测模型GM(1,1)

定义1 记观测到的n个观测值为时间序列 X ^ ( 0 ) [9],令

X ( 0 ) = ( X ( 0 ) ( 1 ) , X ( 0 ) ( 2 ) , , X ( 0 ) (n) )

通过一次累加,得到一次累加序列

X ( 1 ) = ( X ( 1 ) ( 1 ) , X ( 1 ) ( 2 ) , , X ( 1 ) (n) )

定义2 称

X ( 0 ) ( i ) + a X ( 1 ) ( i ) = b (1)

为GM(1,1)模型的原始形式,其中,参数a为发展系数,b为灰色作用量。

建立GM(1,1)模型对应的微分方程为

d X ( 1 ) d t + a X ( 1 ) = b (2)

定义3 若 α ^ = [ a , b ] T 为参数列,且

Y = [ x ( 0 ) ( 2 ) x ( 0 ) ( 3 ) x ( 0 ) ( n ) ] B = [ 1 2 ( X ( 1 ) ( 1 ) + X ( 1 ) ( 2 ) ) 1 1 2 ( X ( 1 ) ( 2 ) + X ( 1 ) ( 3 ) ) 1 1 2 ( X ( 1 ) ( i 1 ) + X ( 1 ) ( i ) ) 1 ] i = 1 , 2 , , n

则GM(1,1)模型 X ( 0 ) ( k ) + a X ( 1 ) ( k ) = b 的最小二乘估计参数列满足

α ^ = ( B T B ) 1 B T Y (3)

微分方程的解(即时间响应函数)为

x ( 1 ) ( t ) = ( x ( 1 ) ( 1 ) b a ) e a t + b a (4)

方程(1)的时间响应序列为

x ^ ( 1 ) ( i + 1 ) = ( x ( 0 ) ( 1 ) b a ) e a k + b a ; i = 1 , 2 , , n (5)

以方程(5)作为GM(1,1)模型的预测模型,其还原值为

x ^ ( 0 ) ( i + 1 ) = x ^ ( 1 ) ( i + 1 ) x ^ ( 1 ) ( i ) = ( 1 e a ) ( x ( 0 ) ( 1 ) b a ) e a i ; i = 1 , 2 , , n (6)

2.1.1. 相对关联度检验

η ( i ) 为关联系数,根据关联系数定义可得

η ( i ) = min min | X ( 0 ) ( i ) X ^ 0 ( i ) | + ρ max max | X ( 0 ) ( i ) X ^ 0 ( i ) | | X ^ ( 0 ) ( i ) X ( 0 ) ( i ) | + ρ max max | X ^ ( 0 ) ( i ) X ( 0 ) ( i ) | (7)

ρ 为分辨率, 0 < ρ < 1 ,一般取 ρ = 0.5 min min | X ( 0 ) ( i ) X ^ 0 ( i ) | 为两级最小差, max max | X ( 0 ) ( i ) X ^ 0 ( i ) | 为两级最大差,令原始序列与预测序列的关联度

r = 1 n i = 1 n η ( i ) (8)

一般当 ρ = 0.5 时,若 r > 0.6 表示通过检验。

2.2. 马尔可夫链模型

定义4 实际值与GM(1,1)模型预测值的相对误差为 ε ( k ) ,可表示为

ε ( k ) = x ( 0 ) ( k ) x ^ ( 0 ) ( k ) x ( 0 ) ( k ) (9)

定义5 S为状态空间,对任意的 i , j S ,称 P i j ( k ) ( n ) = P { X n + k = j | X n = i } X n 在n时刻的k步转移概率, P ( k ) = ( P i j ( k ) ) 为随机序列 { X n , n 0 } 的k步转移概率矩阵 [10]。记作

P ( k ) = [ P 11 ( k ) P 12 ( k ) P 1 n ( k ) P 21 ( k ) P 22 ( k ) P 2 n ( k ) P n 1 ( k ) P n 2 ( k ) P n n ( k ) ]

根据样本数据可知转态i出现的次数为 m i ,由状态i经过k步转移到状态j的次数为 m i j ( k ) ,状态i经过k步转移到状态j概率值的近似值为

P i j ( k ) = m i j ( k ) m i (10)

2.3. 灰色–加权马尔可夫链模型

定义6 预测第n天的相对误差的状态,选取离第n天最近的m天的相对误差所处的状态作为初始状态,按离预测第n天的远近,转移步数分别为 1 , 2 , , m ;在转移步数对应的转移矩阵 P ( k ) 中,取起始状态所对应的行向量 P i k = ( p i 1 ( k ) , p i 2 ( k ) , , p i n ( k ) ) i S ,构造新的概率矩阵 [11]

P = [ P 11 ( k ) P 12 ( k ) P 1 n ( k ) P 21 ( k ) P 22 ( k ) P 2 n ( k ) P m 1 ( k ) P m 2 ( k ) P m n ( k ) ]

定义7 将状态空间其中一个状态的状态概率进行加权求和,得到该状态的预测概率,即

P i = k = 1 m w k × p i ( k ) , i S (11)

其中 w k 为马尔可夫链的权重,由下式算得

w k = | r k | i = 1 m | r k | (12)

式中m为计算所需的最大阶数, r k 为样本数据序列的第k阶自相关系数。

定义8 样本数据序列的第k阶自相关系数 [12]

r k = i = 1 n k ( x i x ¯ ) ( x i + k x ¯ ) i = 1 n k ( x i x ¯ ) 2 i = 1 n k ( x i + k x ¯ ) 2 , k = 1 , , 5 (13)

其中 x i 为第i天的样本数据; x ¯ 为样本均值。

定义9 设状态空间有n个状态 [13],若 ε ( k ) ( a i , b i ) , i = 1 , 2 , , n ;则称相对误差 ε ( k ) 处于状态Si,其中 a i , b i 分别为状态Si的下界和上界。

最后将 max { P i , i S } 所对应的状态作为第n天的相对误差的预测状态。则第n天的预测值为

Y ^ ( k ) = x ^ ( 0 ) ( k ) [ 1 + 1 2 ( b i + a i ) ] (14)

3. 案例分析

3.1. GM(1,1)模型对非洲猪瘟事件百度搜索指数的预测和状态划分

以国内2019年6月29日至7月18日的非洲猪瘟事件的百度搜索指数为原始数据,运用灰色–加权马尔可夫链模型对7月13日至7月18日搜索指数进行预测。

以6月29日至7月2日的百度搜索指数为基础,建立灰色预测模型GM(1,1)对7月3日的数据进行预测,且模型通过相对关联度检验;同理,以6月30日至7月3日的百度搜索指数为基础,可以得到7月4日的数据,以此类推,直至得到7月18日的百度搜索指数预测值。根据实际百度搜索指数和预测数据,计算相对误差。结果见表1

根据相对误差法,将马尔可夫链状态空间划分为5种状态,见表2,按照表2的划分标准得出表1中相对误差值对应的状态。

Table 1. The actual Baidu search index, predicted Baidu Index and relative error status of African swine fever from April

4 to 18

表1. 4至18日非洲猪瘟实际百度搜索指数和预测百度指数及相对误差状态

Table 2. State division table

表2. 状态划分表

3.2. 加权马尔可夫链预测

根据表1中每个数据对应的状态,可以根据式(10)求出1到5步长的概率转移矩阵。

P ( 1 ) = [ 0 1 3 1 3 1 3 0 1 3 0 1 3 0 1 3 0 1 3 0 1 3 1 3 3 5 1 5 0 1 5 0 1 0 0 0 0 ]

P ( 2 ) = [ 0 0 1 3 2 3 0 1 3 1 3 0 0 1 3 2 3 0 0 1 3 0 1 4 0 1 2 1 4 0 0 1 0 0 0 ]

P ( 3 ) = [ 2 3 1 3 0 0 0 1 3 0 0 2 3 0 1 2 1 2 0 0 0 0 0 1 4 1 2 1 4 0 0 1 0 0 ]

P ( 4 ) = [ 0 0 1 2 1 2 0 1 3 1 3 0 1 3 0 0 0 1 2 1 2 0 3 4 0 0 1 4 0 0 1 0 0 0 ]

P ( 5 ) = [ 1 2 0 0 1 2 0 1 3 0 1 3 1 3 0 0 1 2 0 1 2 0 1 3 1 3 1 3 0 0 0 0 0 1 0 ]

根据原始数据,运用式(12)和式(13)计算各阶的自相关系数和各阶权重,得到表3

Table 3. Autocorrelation coefficient and weight of each order

表3. 各阶自相关系数及各阶权重

现在以7月13日非洲猪瘟事件的百度搜索指数预测为例进行说明。由7月8日至7月12日的概率转移矩阵以及表3中的数据对7月13日的百度搜索指数进行预测。可得7月13日相对误差状态预测表,见表4

Table 4. Prediction of relative error state on July 13

表4. 7月13日相对误差状态预测

表4可以观察到,7月13日的相对误差处于S3,通过计算得该日期百度搜索指数预测值为16,458.34。以此类推计算14日至18日的预测值,得表5

Table 5. Forecast results

表5. 预测结果

根据预测结果,绘制预测结果图,见图1

根据表1表5中的相对误差值,绘制GM(1,1)模型和灰色–加权马尔可夫链模型的相对误差结果对比表,见表6

Figure 1. Forecast result chart

图1. 预测结果图

Table 6. Comparison table of relative error results

表6. 相对误差结果对比表

4. 结论

1) 对于有一定波动性的数据来说,通过传统的灰色预测模型GM(1,1)计算得到的百度搜索指数预测值相对误差较大,而马尔可夫链对于波动性大的数据预测较为准确,所以用加权马尔可夫链对模型进行优化,结果表明,构建的灰色–加权马尔可夫链模型能够有效地减小相对误差值,提高模型的精度,使预测结果更具有可信度。

2) 本文对突发公共卫生事件的未来趋势预测提供了一种预测结果较为精确的组合模型,帮助了解突发公共卫生事件发展和影响范围,描述突发公共卫生事件传播规律,对及时辅助决策者做出科学合理的决策行为具有一定指导意义。

基金项目

河南科技大学大学生科研训练计划专项基金(项目编号:2019203)。

文章引用: 翟晴雯 , 张照都 , 张日月 , 余梦洁 , 马新新 , 闫书丽 (2020) 公共卫生事件信息传播规律模型。 统计学与应用, 9, 482-490. doi: 10.12677/SA.2020.93051

参考文献

[1] 王林, 王可, 吴江. 社交媒体中突发公共卫生事件舆情传播与演变——以2018年疫苗事件为例[J]. 数据分析与知识发现, 2019(4): 42-52.

[2] 马天娇. 融媒时代突发公共卫生事件信息传播及风险沟通策略探讨[J]. 新闻研究导刊, 2018, 9(21): 85-86.

[3] 张倩生, 谢柏林, 张新猛. 网络舆情突发事件的应急群决策方法[J]. 统计与决策, 2016(10): 38-41.

[4] Galam, S. (2002) Minority Opinion Spreading in Random Geometry. The European Physical Journal B, 25, 403-406.
https://doi.org/10.1140/epjb/e20020045

[5] 靳松, 庄亚明. 基于H7N9的突发事件信息传播网络簇结构特性研究[J]. 情报杂志, 2013, 32(12): 12-17.

[6] 洪巍, 吴林海, 吴祐昕. 食品安全网络舆情中的网络意见领袖[J]. 华南农业大学学报(社会科学版), 2014, 13(4): 101-110.

[7] 滕文杰. 时间序列分析法在突发公共卫生事件网络舆情分析中的应用研究[J]. 中国卫生统计, 2014(6): 1071-1073.

[8] 刘小洋, 何道兵. 基于突发公共事件的信息传播动力学模型与舆情演化研究[J], 计算机科学, 2019, 46(5): 320-326.

[9] 李海晨, 张爱真. 基于灰色理论的科技文献增长规律研究——以微信舆情为例[J]. 情报探索, 2019(2): 7-12.

[10] 林元烈. 应用随机过程[M]. 北京: 清华大学出版社, 2002.

[11] 乔松珊, 张建军. 基于灰色马尔可夫修正模型的城市月用电需求预测[J]. 电力需求侧管理, 2013, 15(1): 11-14.

[12] 蒋峰, 王宗耀, 张鹏. 基于灰色-加权马尔可夫链的光伏发电量预测[J]. 电力系统保护与控制, 2019, 47(15): 55-60.

[13] 宋巧娜, 唐德善. 基于灰色马尔可夫模型的农业用水量预测[J]. 安徽农业科学, 2007, 36(6): 1788-1789.

分享
Top