基于AMF-HXA的长株潭空气质量指数互相关性分析
Cross-Correlation Analysis of Air Quality Index in Changsha, Zhuzhou and Xiangtan Based on AMH-HXA

作者: 王 访 :理学院/农业数学建模与数据处理中心,湖南农业大学,湖南 长沙; 范 毅 :国民经济核算与农村社会经济调查处,湖南省统计局,湖南 长沙;

关键词: 仿多重分形高度互相关分析空气质量指数PM2.5浓度NO2浓度Analogous Multifractal Height Cross-Correlation Analysis (AMF-HXA) Air Quality Index (AQI) PM2.5 Concentration NO2 Concentration

摘要:
随着我国经济的飞速发展,近年来我国的空气污染问题越来越严重。工业污染物和生活供暖产生的细微颗粒物成为了空气污染的两大源泉。如何揭露不同城市间空气质量指数(Air Quality Index, AQI)与传统空气污染因子如工业污染物NO2和细微颗粒物如PM2.5的关系,成为了我们必须考虑的关键问题。本文利用流行的仿多重分形高度互相关分析研究了长株潭每个城市的上述三个指标的无标度性、AQI与两种污染指标的波动差异性及两两城市间的PM2.5浓度与NO2浓度的互相关及其显著性、每个城市AQI与这两种污染指标在春夏秋冬四个季节里的互相关及其显著性。结果表明每个城市的AQI与PM2.5的波动情况基本吻合,而AQI与NO2的波动具有较大差异;四个季节里长株潭两两城市间PM2.5都具有极显著的互相关性,而NO2在不同季节里互相关性不同。这些结论为探寻长株潭影响空气质量的相互影响提供了一个新视角。

Abstract: As the economy soars, air pollution sweeps across the China in recent years. Industrial waste gas and life stove and heating are two main sources of the air pollution. How to uncover the relationship between the air quality index (AQI) and traditional air pollution factors, such as industrial pollutants, NO2 and fine particles, such as PM2.5 for different cities has become a key point we care about. In this paper, we apply the popular analogous multifractal height cross-correlation analysis (AMF-HXA) into investigating the air quality in neighboring Changsha city, Zhuzhou city and Xiangtan city in Central China, which includes that the scale free of AQI, PM2.5 concentration and NO2 concentration, the fluctuation difference between the AQI and PM2.5 as well as NO2, respectively, the cross-correlation of the two pollution factors in each two cities, and the cross-correlations together with the significance between the AQI and above two pollution factors in each cities. The main conclusions are: 1) the fluctuation of AQI is consistent with that of PM2.5 concentration but disagreed with that of NO2 in different seasons; 2) there is high cross-correlation significance of PM2.5 between each two cities in all of seasons but the significance of the cross-correlation of NO2 is different in different seasons. These conclusions can provide a new insight to unveil the variation tendency of air pollution between different cities.

1. 引言

随着改革开放的红利席卷整个中国大陆,近30年来中国的经济飞速发展的同时,空气污染也成为了各级政府不容忽视的问题。污染源也由传统的NO2、SO2等工业废弃排放物转化为能直接威胁人类健康的细微颗粒物,如PM2.5 (直径 ≤ 2.5 µm)、PM10 (直径 ≤ 10 µm) [1] [2] [3] 。如何正确认识空气污染,如何掌握空气污染的传播规律,最终治理空气污染是社会各界人士共同探讨的话题。其中,从统计学的视角来挖掘空气质量参数的统计规律并合理预测其运行规律是一个有趣且正确的研究方向。如Shen和Li [4] [5] 利用去趋势偏互相关分析(DPCCA)和去趋势半偏互相关分析(DSPCCA)分别研究了南京、厦门和石家庄每个城市的API(空气污染指数)与气温等6种气象因子的偏相关关系;Kang等 [6] 利用去趋势互相关分析(DCCA)研究了韩国仁川、木浦等8个城市的PM10指数与风速等4种气候因子的互相关显著性。然而,目前大多数报道都针对于各种污染物指标(如NO2、SO2、CO、PM2.5、API等)和气象因子(如温度、气压、风速等)的相关性展开研究,忽略了相邻城市间空气污染的相互影响 [4] [5] [6] 。然而由于空气的自由流动造成了某一地区的雾霾源将有可能污染其毗邻地区,导致这些地区出现空气质量统计指标联动现象的发生 [2] [3] 。因此,如何从统计学的角度挖掘相邻城市空气质量指标的互相关性将有助于为我们确定污染源并重点对其治理提供依据。

在两个时间序列的相互关系的研究中,Podobnik和Stanley [7] 提出了基于去趋势波动分析(DXA),这种方法能有效处理非平稳时序的互相关关系。随后Podobnik等 [8] 基于DXA提出了多种检测两个非平稳时序互相关关系的统计量,对人工生成的随机过程序列和真实世界的非平稳时间序列进行了检测。Zebende等 [9] 基于DXA构建了相应的相关系数,该相关系数成为检测两个非平稳时序交叉相关的重要指标。基于多重仿射分析 [10] ,Wang等在2013年 [11] 和2016年 [12] 分别报道了仿多重分形互相关分析(AMF-XA)和仿多重分形高度互相关分析(AMF-HXA)。为了定量研究两个序列互相关性的程度,一些新的互相关系数被提出 [11] [12] 。其中Wang等 [12] 提出的基于AMF-HXA的互相关系数 ρ ( L ) 能真实、准确地定量刻画两个序列之间的互相关程度。

虽然现存的文献已经证实了AQI和PM2.5序列具有多重分形特性,但很少有文献对不同城市间空气污染因子的互相关性展开研究。因此本文利用AMF-HXA重点研究长沙、株洲和湘潭三个中国中部城市间空气污染的相互影响,并分析AQI与传统工业污染物及细微颗粒物的波动变化差异。

2. 方法与数据来源

2.1. 仿多重分形高度互相关分析(AMF-HXA)

假设两个时间序列{xt}和{yt}, t = 1 , 2 , , N 。首先计算它们的累积离差:

X ( t ) = i = 1 t [ x i x ] , Y ( t ) = i = 1 t [ y i y ] (1)

这里 x y 分别表示序列{xt}和{yt}在整个时间区间上的平均值。然后定义在时滞为L下的两个累积离差序列的互增量如下:

Δ L X ( t ) Y ( t ) = [ X ( t ) X ( t + L ) ] [ Y ( t ) Y ( t + L ) ] (2)

接着,对于每个L得到考虑符号算子的q阶协方差函数:

F x y q ( L ) = 1 N L t = 1 N L sgn ( Δ L X ( t ) Y ( t ) ) | Δ L X ( t ) Y ( t ) | q / 2 (3)

这里 sgn ( Δ L X ( t ) Y ( t ) ) 表示函数 Δ L X ( t ) Y ( t ) 的符号。加入了此符号算子的优点在于:1) 如此定义的 F x y q ( L ) 不但能提供波动信息,也能提供与q阶依赖的波动函数的符号信息;2) 能得到正确的相关指数;3) 能得到两个给定序列的真实互相关性,避免伪相关。

最后一步,考虑如下的尺度关系并得到尺度指数 λ × ( q ) ,如下式所示:

[ F x y q ( L ) ] 1 / q = F x y ( q , L ) L λ × ( q ) . (4)

这里L一般取1到一个大的整数N1,使得上述关系能在双对数图上得以较好的呈现。尺度指数 λ × ( q ) 能有效描述两个分形序列的互相关特性。

注意,(4)式所示的尺度关系仅对于q > 0时成立。对于q的选取应保持谨慎,一般地,对于一个不太长的序列不能选取过大的q以免出现分叉 [13] 。对于q = 2时,称该方法为仿高度互相关分析(Analogous Height Cross-Correlation analysis AHXA),它可以用于检测两个单分形序列的长程互相关性。此外,类似于一元Hurst指数,λ × (2)以如下方式反应了两个序列的互持久性:λ × (2) > 0.5反映的互持久性从统计意义上意味着正(负)的 Δ L X ( t + 1 ) Y ( t + 1 ) 更可能出现在正(负)的 Δ L X ( t ) Y ( t ) 后。相反地,λ × (2) < 0.5则表示正(负)的 Δ L X ( t + 1 ) Y ( t + 1 ) 更可能出现在负(正)的 Δ L X ( t ) Y ( t ) 后,此时称这两个序列具有交互持久性。如果{xt} = {yt},则该方法退化成了经典的多重仿射分析 [10] ,它将产生能描述单个序列长程自相关的广义Hurst指数γxx。γxx可通过如下幂律关系得到:

F x x ( q , L ) = Δ L X ( t ) q 1 / q L γ x x (5)

这里 Δ L X ( t ) = X ( t + L ) X ( t ) F x x ( q , L ) 能通过不同阶的q值来表征原始序列{xt}不同的波动信息,较小的q对应较小的波动,较大的q表征较大的波动。一般地,q < 2扩大了小波动区间对 F x x ( L ) 的贡献,而q > 2扩大了大波动区间对其的贡献。为了定量探测两个不同序列{xt}和{yt}的波动程度的差异,我们提出了一个新的量:

Δ F ( q , L ) = log F x x ( q , L ) log F y y ( q , s ) (6)

AMF-HXA方法能准确检测两个时间序列的互相关性,然而,它不能定量的刻画这种互相关性。为了定量描述互相关的程度,基于AHXA(即取q = 2时),利用公式(3)得到的两个序列的协方差函数与由公式(5)得到的两个序列的方差函数求比值,得到了一种所谓的基于AHXA的互相关系数,如下所示:

ρ ( L ) = F x y 2 ( L ) F x x ( 2 , L ) F y y ( 2 , L ) = s i g n ( Δ L X ( t ) Y ( t ) ) | Δ L X ( t ) Y ( t ) | Δ L X ( t ) 2 Δ L Y ( t ) 2 (7)

ρ ( L ) 是一个无量纲量,且满足 1 ρ ( L ) 1

2.2. 数据来源

长沙、株洲和湘潭作为我国中部经济带崛起的三个城市,为湖南省的经济社会发展起到了决定性的作用,但同时空气污染也使得长株潭很多产业面临着极大的挑战。为了研究长株潭空气质量的统计规律、空气质量指数与传统污染因子及细微颗粒物的关系,我们选取了这三个城市近三年来(2013年12月1日~2016年11月30日)的日均AQI、PM2.5浓度(μg/m3)和NO2浓度(μg/m3)作为研究对象(数据来源于中国环保部,http://datacenter.mep.gov.cn)。上述三个指标的基本统计情况如表1所示,三年的PM2.5和NO2序列如图1所示。从图1可以看出,三个城市的两种空气污染指标存在明显的季节周期性,冬、秋季的指标值明显高于春、夏季,且三个城市的指标趋势大体相似,这预示着它们之间存在显著的相关性。然而,相比NO2,三个城市的PM2.5波动幅度更大。在后面的分析中,我们将对春夏秋冬四个季节分别考虑。从表1可以看出,AQI与PM2.5的变异系数差距较小,而与NO2的变异系数有较大差距,这表明AQI与PM2.5的相关性强于与NO2的相关性。此外,省会长沙的细微颗粒污染(PM2.5)略优于其他两个城市,但传统污染物(NO2)略差于株洲和湘潭,表明三个城市的污染来源可以存在差异。

3. 数据分析与讨论

3.1. 互相关波动函数幂律关系检测

首先,我们检测长株潭三城市间上述空气质量指标的分形无标度性。下面以PM2.5浓度为例,图2展示了上述两两城市间q阶互相关波动函数 F x y ( q , L ) 与时滞L的幂律关系(在本文中,我们以0.5的步长取q从0.5到5)。一般地,如果两个时间序列具有较好的相关性,则它们的q阶互相关波动函数 F x y ( q , L ) 与时滞L具有幂律关系,这表现为 log F x y ( q , L ) 与log(L)呈现较好的线性关系。如图2所示,在双对数图中完美的直线表示长沙、株洲和湘潭两两城市间的PM2.5浓度具有较好的互相关性。通过检验,本文所选取的三个城市间的AQI与NO2的互相关波动函数与时滞L间也都具有类似的幂律关系。下面我们将利用AMF-HXA来做进一步分析。

Table 1. General statistics of the AQI, PM2.5 and NO2 series of Changsha, Zhuzhou and Xiangtan

表1. 长沙,株洲和湘潭AQI、PM2.5浓度与NO2浓度的基本统计情况

Figure 1. The PM 2.5 index and NO2 index of Changsha, Zhuzhou and Xiangtan from Dec. 1, 2013 to Nov. 30, 2016

图1. 长沙,株洲和湘潭从2013年12月1日至2016年11月30日的PM2.5值和NO2

Figure 2. Multifractal nature in the power-law of dependence of Fxy(q, L) on L for PM2.5 concentration: (a) is for Changsha vs. Zhuzhou: (b) is for Changsha vs. Xiangtan; and (c) is for Zhuzhou vs. Xiangtan

图2. PM2.5浓度的Fxy(q, L)与L的分形幂律关系:(a) 表示长沙与株洲;(b) 表示长沙与湘潭;(c) 表示株洲与湘潭

3.2. 空气质量指数与污染因子的关系

在本节中我们关注三城市的AQI与传统污染因子NO2浓度及细微颗粒物PM2.5浓度波动趋势的关系。为此,利用式(6)定义的 Δ F ( q , L ) 来定量描述各个城市AQI序列与NO2序列及PM2.5序列的q阶波动函数的差异。我们选取了两个q值(q = 0.5和q = 4)来考察小波动区间和大波动区间的 Δ F ( q , L ) ,如图3~图5所示。在每幅图中,a、b子图表示AQI与PM2.5浓度的波动函数的差距,而c、d子图表示AQI与NO2浓度的波动函数的差距。左边两幅子图表示小波动区间的 Δ F ( q , L ) ,而右边两幅子图表示大波动区间的 Δ F ( q , L ) 。从这3幅图可以看出,无论是在大波动区间还是小波动区间,每个城市AQI与PM2.5浓度的波动函数的差距均小于0.25,说明AQI与PM2.5的波动变化规律基本吻合。与此对比,每个城市AQI与NO2浓度的波动函数的差距均大于0.5。尤其是长沙和株洲,该值间于1到2之间,说明AQI与NO2浓度的波动有着较大的差异。表明当前空气质量的评价主要受到细微颗粒物的影响。一个有趣的现象是夏季的AQI与PM2.5的波动函数差距最小,而AQI与NO2浓度的波动函数以夏季的差距最大,说明这两种空气

Figure 3. Difference of fluctuation functions between AQI and the two pollution factors, namely, PM2.5 concentration (a and b) and NO2 concentration (c and d) of Changsha. The left two panels are for smaller amplitude fluctuations and the right two panels are for larger amplitude fluctuations

图3. 长沙的AQI与两个污染因子,即PM2.5浓度(图a和图b)、NO2浓度(图c和图d)波动函数的差距。左边两幅子图表示小波动范围,右边两幅子图表示大波动范围

Figure 4. Difference of fluctuation functions between AQI and the two pollution factors, namely, PM2.5 concentration (a and b) and NO2 concentration (c and d) of Zhuzhou. The left two panels are for smaller amplitude fluctuations and the right two panels are for larger amplitude fluctuations

图4. 株洲的AQI与两个污染因子,即PM2.5浓度(图a和图b)、NO2浓度(图c和图d)波动函数的差距。左边两幅子图表示小波动范围,右边两幅子图表示大波动范围

Figure 5. Difference of fluctuation functions between AQI and the two pollution factors, namely, PM2.5 concentration (a and b) and NO2 concentration (c and d) of Xiangtan. The left two panels are for smaller amplitude fluctuations and the right two panels are for larger amplitude fluctuations

图5. 湘潭的AQI与两个污染因子,即PM2.5浓度(图a和图b)、NO2浓度(图c和图d)波动函数的差距。左边两幅子图表示小波动范围,右边两幅子图表示大波动范围

污染因子在夏季对AQI的影响是不同的。

3.3. 长株潭三城市间空气污染因子的相关性

作为我们最关心的问题,本节我们分别考察长株潭三城市间空气污染因子PM2.5浓度和NO2浓度的相关性。为此,我们首先构建一个统计量来测试两个时间序列的交叉相关是否显著。建立零假设:H0:两个时间序列不存在互相关性;H1:两个时间序列存在互相关性。然后计算得到95%置信度下的临界值 ρ 0 ( L ) 。最后再考察 ρ ( L ) ρ 0 ( L ) 的大小关系,若 ρ ( L ) > ρ 0 ( L ) 则拒绝原假设,认为两个时间序列间存在显著的交叉相关性。具体地说,为了获取不同时间尺度L下的95%置信度的临界值 ρ 0 ( L ) ,首先生成10,000对独立的来自零均值单位方差的高斯分布的随机变量,然后,使得概率分布函数位于 ρ 0 ρ 0 之间的积分结果等于0.95,并记录此时的 ρ 0 。最后,分别对于PM2.5浓度和NO2浓度序列,利用(7)式计算得到长株潭两两城市间的 ρ ( L ) ,比较其与临界值 ρ 0 ( L ) 的大小。如果 ρ ( L ) > ρ 0 ( L ) 则认为两两城市间这两种污染因子的互相关性是统计显著的,反之,它们间的互相关是统计不显著的。长株潭两两城市间PM2.5浓度与NO2浓度的相关性及其显著性分别如图6图7所示,黑色实线表示临界值,在该线上方表示具有显著的互相关性。

图6图7可以看出,长株潭两两城市间在四个季节里的PM2.5浓度的互相关性均大于0.9,表明它们之间具有高度互相关性,说明细微颗粒物覆盖了整个长株潭上空,具有充分的流动性。然而,NO2浓度只在冬秋两季中在两两城市间具有显著的互相关性。冬季的 ρ ( L ) 大于0.9,表明冬季NO2浓度污染严重,影响长株潭的空气质量。而春夏两季,株洲与湘潭间的NO2互相关性在大的时滞下不具有显著性。春季和秋季长沙和株洲的互相关性显著性明显强于其他两个城市间;而夏季只有长沙与湘潭的NO2互相关性具有显著性。上述结论表明NO2在不同季节对于长株潭的影响是不同的,也表明三个城市的NO2的排放具有显著差异,这为探寻三个城市的污染源提供了依据。

最后,我们来研究每个城市的PM2.5浓度与NO2浓度的互相关及其显著性,如图8所示。果然,对于不同的城市在不同季节里,PM2.5浓度与NO2浓度的互相关存在显著差异。对于长沙,春季里当时滞大于23天时上述两种污染源就不具有相关性了,而其余三个季节均表现出显著的相关性;对于株洲,除

Figure 6. Cross-correlation coefficients and their significances of PM2.5 concentration among Changsha, Zhuzhou and Xiangtan: (a), (b), (c) and (d) denote winter, spring, summer and fall, respectively

图6. 长沙、株洲、湘潭三市PM2.5浓度的互相关系数及其显著性:(a)、(b)、(c)和(d)分别表示冬季、春季、夏季和秋季

Figure 7. Cross-correlation coefficients and their significances of NO2 concentration among Changsha, Zhuzhou and Xiangtan: (a), (b), (c) and (d) denote winter, spring, summer and fall, respectively

图7. 长沙、株洲、湘潭三市NO2浓度的互相关系数及其显著性:(a)、(b)、(c)和(d)分别表示冬季、春季、夏季和秋季

了冬季的PM2.5与NO2具有较强的互相关性,其余三个季节均在一个月后上述两种污染因子的相关性变为不显著;对于湘潭,冬春两季的PM2.5与NO2的互相关性受到时滞的影响,而夏秋的互相关性随着时间尺度的增大而反而增强,说明这两种污染因子在这夏秋季节中相互影响程度较高。

Figure 8. Cross-correlation coefficients and their significances between the PM2.5 and NO2 of winter, spring, summer and fall for the three studied cities: (a), (b) and (c) denote Changsha, Zhuzhou and Xiangtan, respectively

图8. 三个城市冬季、春季、夏季和秋季的PM2.5浓度与NO2浓度的互相关系数及其显著性:(a)、(b)和(c)分别表示长沙、株洲和湘潭

4. 结语

为了研究长株潭三个城市空气质量与污染情况的关系,在本文中,我们选取近3年三个城市的日均AQI、PM2.5浓度和NO2浓度进行了分析。利用流行的仿多重分形高度互相关分析分别研究每个城市的上述三个指标的无标度性、AQI与两种污染指标的波动差异性及两两城市间的PM2.5浓度与NO2浓度的互相及其显著性、每个城市AQI与这两种污染指标在春夏秋冬四个季节中的互相关及其显著性。结果表明:1) AQI、PM2.5浓度和NO2浓度的波动函数与时滞均具有幂律关系,说明它们具有无标度性。2) 每个城市的AQI与PM2.5浓度的波动情况基本吻合,而AQI与NO2浓度的波动具有较大差异,而且不同季节的差异程度不同。3) 四个季节的长株潭两两城市间PM2.5浓度都具有极其显著的互相关性;而NO2浓度在不同季节里互相关性不同,表明三个城市的NO2的排放具有显著差异。4) 长株潭在不同季节里,PM2.5浓度与NO2浓度的互相关存在显著差异。这些结论为探寻长株潭影响空气质量的污染源提供了一个新视角。

基金项目

本文由湖南统计科研立项课题(2017041)和湖南省社科基金项目(15YBA204)资助。

文章引用: 王 访 , 范 毅 (2017) 基于AMF-HXA的长株潭空气质量指数互相关性分析。 环境保护前沿, 7, 443-452. doi: 10.12677/AEP.2017.76058

参考文献

[1] Chan, C. and Yao, X. (2008) Air Pollution in Mega Cities in China. Atmospheric Environment, 42, 1-42.
https://doi.org/10.1016/j.atmosenv.2007.09.003

[2] Han, L., Zhou, W. and Li, W. (2015) City as a Major Source Area of Fine Particulate (PM 2.5) in China. Environmental Pollution, 206, 183-187.
https://doi.org/10.1016/j.envpol.2015.06.038

[3] Han, L., et al. (2015) Increasing Impact of Urban Fine Particles (PM2.5) on Areas Surrounding Chinese Cities. Scientific Reports, 5, Article ID: 12467.
https://doi.org/10.1038/srep12467

[4] Shen, C., Li, C. and Si, Y. (2015) A Detrended Cross-Correlation Analysis of Meteorological and API Data in Nanjing, China. Physica A, 419, 417-428.
https://doi.org/10.1016/j.physa.2014.10.058

[5] Shen, C. and Li, C. (2016) An Analysis of the Intrinsic Cross-Correlations between API and Meteorological Elements Using DPCCA. Physica A, 446, 100-109.
https://doi.org/10.1016/j.physa.2015.11.024

[6] Du Kang, D., Lee, D.I., Kwon, B.H., et al. (2013) Features of the Detrended Cross-Correlation Analysis in the Time Series between Absorbable Particulate Matter and Meteorological Factors. Journal of the Korean Physical Society, 63, 10-17.
https://doi.org/10.3938/jkps.63.10

[7] Podobnik, B. and Stanley, H.E. (2008) Detrended Cross-Correlation Analysis: A New Method for Analyzing Two Nonstationary Time Series. Physical Review Letters, 100, 84-102.
https://doi.org/10.1103/PhysRevLett.100.084102

[8] Podobnik, B, Jiang, Z.Q., Zhou, W.X, et al. (2011) Statistical Tests for Power-Law Cross-Correlated Processes. Physical Review E, 84, Article ID: 066118.
https://doi.org/10.1103/PhysRevE.84.066118

[9] Zebende, G.F. (2011) DCCA Cross-Correlation Coefficient: Quantifying Level of Cross-Correlation. Physica A, 390, 614-618.
https://doi.org/10.1016/j.physa.2010.10.022

[10] Barabási, A.L., Szépfa-lusy, P. and Vicsek, T. (1991) Multifractal Spectra of Multi-Affine Functions. Physica A, 178, 17-28.
https://doi.org/10.1016/0378-4371(91)90072-K

[11] Wang, F., Liao, G.P., Li, J.H., Zou, R.B. and Shi, W. (2013) Cross-Correlation Detection and Analysis for California’s Electricity Market Based on Analogous Multifractal Analysis. Chaos, 23, Article ID: 013129.
https://doi.org/10.1063/1.4793355

[12] Wang, F., Yang, Z. and Wang, L. (2016) Detecting and Quantifying Cross-Correlations by Analogous Multifractal Height Cross-Correlation Analysis. Physica A, 444, 954-962.
https://doi.org/10.1016/j.physa.2015.10.096

[13] Zhou, W.X., Sornette, D. and Yuan, W.K. (2006) Inverse Statistics and Multi-fractality of Exit Distances in 3D Fully Developed Turbulence. Physica D, 214, 55-62.
https://doi.org/10.1016/j.physd.2005.12.004

分享
Top