基于机器学习订正模型的未来百年全球海表温度预估研究
Study on the Future Projection of Global Sea Surface Temperature over 21st Century Using a Biases Correction Model Based on Machine Learning

作者: 匡志远 :南京信息工程大学海洋科学学院,江苏 南京;自然资源部第一海洋研究所,山东 青岛;青岛海洋科学与技术国家实验室区域海洋动力学与数值模拟功能实验室,山东 青岛; 宋振亚 :自然资源部第一海洋研究所,山东 青岛;青岛海洋科学与技术国家实验室区域海洋动力学与数值模拟功能实验室,山东 青岛;自然资源部海洋环境科学与数值模拟重点实验室,山东 青岛; 董昌明 :南京信息工程大学海洋科学学院,江苏 南京;青岛海洋科学与技术国家实验室区域海洋动力学与数值模拟功能实验室,山东 青岛;南京信息工程大学海洋数值模拟与观测实验室,江苏 南京;

关键词: 机器学习订正模型海表面温度FIO-ESM v2.0未来预估Machine Learning Biases Correction Model Sea Surface Temperature FIO-ESM v2.0 Future Projection

摘要:
经过半个多世纪的发展,气候模式已成为理解气候变化机理和预测预估未来气候不可或缺的工具,然而由于其对气候变化的模拟能力仍存在一定的不足,这影响了气候预测预估的精准性。基于机器学习的订正模型在天气预报和气候预测预估等方面的探索性研究中表现出了较好的应用潜力。本文基于集合经验模态分解(Ensemble Empirical Mode Decomposition, EEMD)和BP (Back Propagation)神经网络发展了气候模式全球月平均海表温度(Sea Surface Temperature, SST)的订正模型,基于历史观测数据和气候模式FIO-ESM v2.0参与第六次国际耦合模式比较计划(Coupled Model Intercom-parison Project 6, CMIP6)的历史试验结果确定了模型参数,进而对该模式三种排放情景(SSP1-2.6、SSP2-4.5和SSP5-8.5)的未来百年全球月平均SST开展了预估订正。结果表明:采用本文建立的机器学习订正模型,能够有效降低历史试验的模拟偏差,均方根误差由0.401℃降至0.096℃,平均绝对偏差由0.338℃降至0.077℃,相关系数由0.33提升到了0.95。经过订正后,未来三种排放情景下的全球平均SST增温趋势分别为0.424℃/100a、1.325℃/100a和3.185℃/100a,本世纪末20年(2081~2100)年平均的全球平均SST较最近20年(1995~2014)将分别升温0.608℃、1.183℃和2.409℃。

Abstract: The climate model has become the key tool to understand climate change and predict the future climate. However, due to the simulation biases, accurate simulation and prediction is still a chal-lenge for climate models. The pilot works on the biases correction based on machine learning have shown good application potential in research on the weather forecast and climate prediction. In this paper, based on Ensemble Empirical Mode Decomposition (EEMD) and BP (Back Propagation) neural network, a biases correction model for monthly global mean sea surface temperature (SST) of a climate model is developed. The parameters of the biases correction model are determined using historical observation data and simulation results, and then it is used to project the global mean SST over 21st century under three future emission scenarios (SSP1-2.6, SSP2-4.5, SSP5-8.5) based on the sixth phase of the Coupled Model Intercomparison Project experiments conducted by FIO-ESM v2.0. The results show that the biases correction model can effectively reduce the historical simulation biases of FIO-ESM v2.0.The root-mean-square-error and absolute mean deviation decrease from 0.401˚C to 0.096˚C and from 0.338˚C to 0.077˚C, respectively, while the correlation coefficient increases from 0.33 to 0.95. The corrected trends of global mean SST under the three future emission scenarios over the 21st century are 0.424˚C/100a, 1.325˚C/100a, and 3.185˚C/100a, respectively. And the global mean SST will increase by 0.608˚C, 1.181˚C, and 2.409˚C at the end of 21st century (2081-2100) compared to the present (1995-2014).

1. 引言

海表面温度(Sea Surface Temperature, SST)处于大气和海洋的交界面,是海洋与大气相互作用的综合结果,在一定程度上表征了整个气候系统的变化特征。自工业革命以来,随着人类活动不断增加,全球气候不断增暖,全球平均SST也随之呈现了上升的趋势,过去百年(1911~2011年)上升了0.8℃左右 [1]。随之,在气候变暖的背景下,未来百年的气候将如何变化越来越受到关注。准确、合理的预估未来百年全球平均SST将不仅有利于理解不同未来情景下气候系统的变化,也将有助于应对气候变化等政策的制定。

气候变化的模拟与预测预估是当前海洋、大气领域世界性研究热点之一,备受公众和各国政府的关注。地球气候系统模式(以下简称“气候模式”)作为研究气候变化的主要手段之一,是理解和预测自然气候变率、正确评估人类对气候变化影响的基础工具 [2]。自从Manabe和Bryan在气候模式领域的开创性工作 [3] 以来,特别是在国际耦合模式比较计划(Coupled Model Intercomparison Project, CMIP)的推动下,气候模式取得了很大的发展和进步 [4] [5],已能够较好地模拟出气候系统的基本特征 [6]。然而气候模式在取得显著进展的同时,模拟结果仍存在一定的偏差,在SST方面,如热带太平洋冷舌偏冷、大洋东部近岸地区偏暖、北半球SST存在冷偏差而同时南半球西风带地区存在暖偏差等经典的模拟偏差都依然存在 [6]。这些历史时期SST模拟偏差的存在,增加了未来预估SST的不确定性,因此减少模拟偏差进而提高模式预测和预报结果的准确性具有重要的意义。

FIO-ESM v2.0 (First Institute of Oceanography-Earth System Model version 2.0)是自然资源部第一海洋研究所最新发展的地球系统模式,其参加了第六次国际耦合模式比较计划CMIP6,初步结果表明其模拟能力较上一代有了较大的改进,但在SST等方面仍存在模拟偏差 [5],这限制了其在未来预测预估中的应用。近年来,随着人工智能的发展,机器学习算法越来越受到重视,已被广泛应用于地球系统科学的多个研究领域。在数值模式结果订正方面,基于机器学习的订正模型可以捕捉数值模式模拟结果与观测之间偏差的非线性变化,建立偏差预测模型,从而得到更精准的模式订正结果。最近的一些研究如日降水量 [7]、2 m气温 [8] [9]、近地面10 m风速 [10]、海浪有效波高 [11] 等也表明了机器学习在数值模式结果订正方面的潜力。因此,基于机器学习的订正模型为提高气候模式模拟与预测能力提供了一个新的思路 [12]。

本文基于气候模式FIO-ESM v2.0的CMIP6试验结果,尝试利用机器学习订正模型,开展历史试验全球月平均SST的修正和未来百年全球月平均SST变化的预估研究,一方面有助于获取更为精准的未来预测结果,另一方面也是开展机器学习订正模型在气候变化领域方面的探索性应用。

2. 数据、方法和实验设计

2.1. 观测资料

本文选用的观测资料为美国海洋与大气管理局(National Oceanic and Atmospheric Administration, NOAA)提供的第五版本扩展重构月平均SST (Extended Reconstruction Sea Surface Temperature version 5, ERSST v5)数据集,该数据集整合了较为广泛的测量值,包括数据库ICOADS v3 (International Comprehensive Ocean-Atmosphere Data Set version 3)的船舶和浮标观测值,Argo浮标的近地表数据以及HadISST2 (Hadley Centre Sea Ice and Sea Surface Temperature 2)的海冰覆盖率估算值 [13]。数据集的时间范围为1854年1月~2014年12月,水平分辨率为 2 × 2

2.2. 模式资料

本文选用数据为第二代自然资源部第一海洋研究所地球系统模式FIO-ESM v2.0 (First Institute of Oceanography-Earth System Model version 2.0)参与CMIP6的全球SST月平均试验数据,包括历史气候模拟试验和三组未来情景试验(SSP1-2.6、SSP2-4.5和SSP5-8.5)的模拟结果。历史气候模拟试验数据(1854.01~2014.12)用于计算模式偏差并建立偏差订正模型,未来情景试验数据(2015.01~2100.12)用于SST的预估订正,水平分辨率为 1.1 × ( 0.27 0.54 ) [5]。

图1给出了观测的(图1(a))和模式模拟的(图1(b))历史时期(1854.1~2014.12)全球月平均SST的变化。从图中可以看出,FIO-ESM v2.0能够模拟出全球气候系统十九世纪末降温二十世纪增温这一基本特征,但与观测相比,在数值和变化趋势上仍存在一定的偏差(图1(c))。对于模式,FIO-ESM v2.0的变化分界点较观测1909年有所提前,大致在1884年前后,在1884年之前,模拟的全球平均SST趋势稍有下降,相对观测表现为偏低,在1884年之后,折线整体在波动中上升,多数年份相对观测表现为偏高。

Figure 1. Global mean monthly SST from historical period (1854.01-2014.12) (a) Observation (ERSST v5) (b) Model (FIO-ESM v2.0) (c) Difference between model and observation

图1. 历史时期(1854.01~2014.12)全球平均SST的变化(a) 观测(ERSST v5) (b) 模式(FIO-ESM v2.0) (c) 模式与观测的差

2.3. EEMD方法介绍

经验模态分解(EMD) [14] 对于非线性非平稳的信号分解非常适用,能将原始信号分解为从高频到低频的若干本征模函数(Intrinsic Mode Function, IMF)和一个趋势变化项或称为剩余项R,从而降低信号的非平稳性。由于模式与观测的全球平均SST信号的特征表现出了较强非平稳非线性特征,所以将EMD分解方法应用到本文的海温时间序列是可行的。

虽然EMD能很好地将某一原始信号分解为不同频率的模态分量和趋势项,但是当信号中存在间断信号、脉冲干扰和噪声时,就会使信号中的极值点在局部的分布上出现异常,出现模态混淆的现象 [15]。针对该现象,Wu和Huang在EMD基础上,对原始信号加入不同幅度白噪声后再进行EMD分解,将分解得到的IMF多次平均以抵消白噪声的影响,提出了集合经验模态分解(Ensemble Empirical Mode Decomposition, EEMD)的方法,从而解决了模态混淆的问题 [16]。近年来EEMD在降雨序列多时间尺度的分析 [17]、海平面变化多尺度分析 [18] 等领域已经有了很好的应用。鉴于EEMD分解信号的优势,本文选择EEMD方法对全球平均SST的历史试验数据和观测数据分解,各自得到9个IMF和一个趋势变化项R,每个IMF都代表着不同时间尺度的信号,模式在不同时间尺度上的偏差会有所差异,对代表不同时间尺度的IMF和趋势变化项R进行组合,采用BP神经网络模型分别对组合后的SST信号订正偏差。然后基于建立好的偏差订正模型,开展对未来情景试验SSP1-2.6、SSP2-4.5和SSP5-8.5三种典型浓度路径情景下全球平均SST的预估订正。

2.4. BP神经网络简述

BP神经网络包括输入层、隐含层和输出层,一般地,输入层和输出层只有一层,隐含层则至少有一层。网络的每一层都有一定数量的并行神经元,神经元的连接遵循不同层与层之间相互连接、同一层互不连接的规则。不同数量的神经元组成的多层网络形成了一个非线性系统,能够针对信号的复杂性自学习解决很多问题。以三层BP神经网络为例,其网络结构如图2

Figure 2. The schematic diagram of the three-layer BP neural network

图2. 三层BP神经网络结构示意图

BP神经网络在训练时,输入向量分别正向输入各自神经元中,通过激励函数对加权求和的数据做一转换之后,得到的输出结果继续作为隐含层的输入重复上述过程,直到计算出最后的输出层结果与期望结果的误差,然后开始误差的反向传递。通过误差在相反方向的传递,达到更新每一层权重的目标。网络基于更新后的权重开始下一轮向前的信号计算和向后的权重修正,通过多次重复上述正反两个方向的计算,网络输出与期望输出之间的误差会变得越来越小,直到误差降至允许的最小范围内,学习训练过程也就结束。

2.5. 实验设计

2.5.1. 全球平均SST的EEMD分解

在EEMD分解时,序列的时间长度决定了分解出的分量特征。由于本文是基于历史试验模拟全球平均SST的偏差订正模型,进而开展对未来三种排放情景下全球平均SST的预估订正,其中未来情景试验的时间长度为86年(2015~2100年),因此,在对模型训练时也选择1929~2014年同为86年长度的历史试验SST与之匹配来建立模型,以便最大程度地保证未来情景试验SST分解后各个时间尺度分量的周期与训练集相近。在对观测与模式模拟的1929年1月~2014年12月全球平均SST分别进行EEMD分解前,需要设定两个参数:第一个是添加噪声的标准差 N s t d ,第二个是添加噪声的次数 N E ,本文设置 N s t d = 0.2 N E = 200 。观测数据分解结果如图3,观测的全球平均SST分解出9个周期依次增大的IMF和1个趋势项R,其中,趋势项R反映了观测的全球平均SST随时间逐渐升高的特征,这与近年来全球气候变暖背景密切相关。与观测类似,模式的全球平均SST也分解出9个周期依次增大的IMF和1个趋势项R (图4)。

Figure 3. Global mean monthly SST decompositions of observation (ERSST v5) during the historical period (1929.01-2014.12)

图3. 历史时期(1929.01~2014.12)观测(ERSST v5)的全球月平均SST分解结果

Figure 4. Global mean monthly SST decompositions of FIO-ESM v2.0 simulation during the historical period (1929.01- 2014.12)

图4. 历史时期(1929.01~2014.12)模式(FIO-ESM v2.0)模拟的全球月平均SST分解结果

从各IMF分量的平均周期(表1)可以看出,模式与观测分解出的IMF代表的时间尺度基本一致,即都是IMF1代表季节尺度周期信号,IMF2和IMF3代表年尺度周期信号,IMF4和IMF5代表年际尺度周期信号,IMF6代表十年际的周期信号,IMF7和IMF8代表年代际尺度周期信号,IMF9代表八十年以上的年代际尺度周期信号。根据不同的时间尺度,分别将IMF2和IMF3,IMF4和IMF5,IMF7和IMF8,IMF9和趋势项R相加组合,得到6组新的时间信号,对每一组模式与观测的组合时间信号进行偏差订正。

Table 1. The mean cycle and time scale of each IMF component of model and observation (1929.01-2014.12)

表1. 模式与观测(1929.01~2014.12)各IMF分量的平均周期和时间尺度

2.5.2. BP神经网络模型的建立

为了更好地达到订正效果,本文针对每一个组合后的信号,建立一个BP神经网络模型对其进行订正。在模型建立前,将数据集随机划分为训练集、验证集和测试集,三个集合的年比例为70:8:8。由于数据量较小,本文尝试建立了含有一个隐含层的三层BP神经网络对6个代表不同时间尺度的组合信号分别进行订正,输入层输入12个神经元,每个神经元输入同一月份组成的模式向量,输出层同样输出12个神经元,每个神经元输出同一月份组成的观测向量。隐含层的神经元数目根据公式 s = m + n + a 确定,其中 m n 分别是输入层神经元数和输出层神经元数,大小均为12, a 是1~10的任一常数 [19] [20]。本研究对 s 从6~13试凑,通过计算验证集的输出向量与观测向量的最小误差来确定最终模型的隐含层节点数。

BP神经网络的训练订正过程在MATLAB环境下进行,首先对输入输出数据归一化到[−1, 1]范围内,以便加快程序运行收敛的速率。模型的参数设置为:

1) 输入层至隐含层的激励函数:选择正线性函数poslin,表达式为:

f ( x ) = { x x > 0 0 x 0

2) 隐含层至输出层的激励函数:由于最终输出SST各个分量的信号,直接选择纯线性函数purelin,数学表达式为 f ( x ) = x

3) 反向传播的训练函数:选择贝叶斯规则法trainbr,该方法是对Levenberg-Marquardt算法的修改,能够防止训练过拟合,使网络泛化能力更好;

4) 网络最大学习次数:100次;

5) 学习速率:0.01;

6) 收敛误差:0.0001;

7) 其他参数均使用网络默认参数。

3. 结果分析

3.1. 历史试验SST的订正

从1929~2014年历史试验的全球平均SST随机选取15年作为测试集,比较修正前后的模式偏差情况。由于随机分配测试集,因此只关注均方根误差和平均绝对偏差。从表2可以看出,经过BP神经网络的订正,重构后信号的均方根误差与平均绝对偏差都有了明显的下降,均方根误差由0.401℃下降至0.088℃,下降了78.1%,平均绝对偏差由0.345℃下降至0.075℃,下降了78.3%。每一个组合信号的均方根误差和平均绝对偏差都较订正前有所下降,但不同组合的下降程度有所不同。在均方根误差上,组合6、组合5在订正后有了很大程度的下降,分别降至0.002℃、0.004℃,在所有组合中下降程度最大和订正后偏差最小,几乎与观测相等,说明模型对周期较长的信号能够很好地订正;组合2在订正前误差较大,订正后也有了很大幅度的下降,幅度达到了81.7%;组合4、组合3可能由于订正前误差较小,模型的订正效果比较差,降幅在30% 以下;组合1在订正前均方根误差虽然不是最大的一项,但可能由于信号频率最高,走向和振幅复杂多变导致降幅最小,只有20%,是订正后偏差的最大来源。平均绝对偏差在6个组合的订正效果与均方根误差类似,在组合6、组合5订正较好,在组合3、组合4和组合1订正效果较差。

Table 2. The error of the combined signal of the test set and the reconstructed signal before and after the correction

表2. 测试集组合以及重构信号在订正前后的误差

经过订正后,测试集重构的全球平均SST在每个月的均方根误差和平均绝对偏差较订正前都有了大幅降低(图5),并且均低于0.2℃。就均方根误差而言,其中在1~4月和12月的误差在订正前最大,订正后改善也最明显,最大降幅出现在2月,为86.1%,平均降幅从0.552℃降至0.085℃,下降了84.6%;10月和6月下降最小,降幅只有15.6% (从0.131℃降至0.107℃)和18.6% (从0.074℃降至0.063℃),这与订正前两个月份的误差较小不无关系。平均绝对偏差的订正前后变化与均方根误差类似,在1~4月和12月下降最明显,在10月和6月下降最小。

将训练集、验证集和测试集的订正结果按照1929年~2014年的时间顺序重新排序,得到订正后的整个历史时期的全球月平均SST与观测的偏差(图6)。从图中可以看出订正后的偏差(红线)相对订正前(蓝线)得到了大幅降低,均方根误差由订正前的0.401℃减小为0.096℃,降幅达到76.1%;平均绝对偏差由订正前的0.338℃减小为0.077℃,降幅为77.2%。同时,与观测的相关系数由订正前的0.332提高到了0.952 (99%置信度)。

为更清楚地分析整个历史时期订正前后每个月的偏差变化,图7给出了12个月的均方根误差、平均绝对偏差和相关系数。与测试集类似,所有月份订正后的均方根误差较订正前均有所下降,降至0.08℃−0.12℃之间;1月~4月在订正前误差较大,降幅也最大,在81%以上,其中2月下降最大,降幅为84.5%;由于订正前的误差较小,10月和6月降幅也最小,分别为33.1%和41.9%。平均绝对偏差与均方根误差类似,在1月~4月订正明显,下降幅度最大,在10月和6月下降幅度最小。在相关系数上,各月订正后较订正前均有所提高,但由于订正前各月的相关性均在0.73以上,改善幅度较均方根误差和平均绝对偏差略小,在2%~17%之间;其中1月~2月、11月~12月订正前相关系数最小,订正后的提升幅度最大,增幅在13.2%~17.3%之间,最大月份为1月,增幅为17.3%;由于5月~10月订正前相关系数较高,订正的增幅较小,增幅普遍低于10%,8月增幅最小,仅有2.7%。

Figure 5. The monthly error of the reconstructed signal of the test set before correcting (blue) and after correcting (red) (a) root mean square error (b) mean absolute deviation

图5. 测试集重构信号在订正前(蓝色)和订正后(红色)各月误差(a)均方根误差(b)平均绝对偏差

Figure 6. The deviation of the global mean SST from the historical period (1929.01-2014.12) before correcting (blue line) and after correcting (red line) relative to observation

图6. 历史时期(1929.01~2014.12)模式订正前(蓝线)和订正后(红线)全球平均SST分别与观测的偏差

Figure 7. The statistics of the global mean monthly SST from the historical period before correcting (Blue) and after correcting (Red) (a) Root Mean Square Error (b) Mean Absolute Deviation (c) Correlation Coefficient

图7. 订正前(蓝色)和订正后(红色)的历史时期全球平均SST三个统计量的各月对比(a)均方根误差(b)平均绝对偏差(c)相关系数

综上,历史试验的结果表明,基于EEMD和BP神经网络建立的订正模型能够大幅降低FIO-ESM v2.0历史试验模拟的全球月平均SST偏差,显示出了较好的订正效果。因此,接下来将基于该模型开展模式对未来2015~2100年全球平均SST的预估订正,以得到更为合理的预估结果。

3.2. 未来情景全球月平均SST的预估

对三种未来排放情景下的2015~2100年全球平均SST 进行EEMD分解,分解得到各自9个IMF代表的时间尺度如表3。同样地,按照季、年、年际、十年际、年代际将三种排放情景下SST的9个IMF与趋势项R各自相加,组合成6个新的时间信号,其中IMF9由于周期在八十年以上,将其与趋势项相加组合成第6个时间信号。

Table 3. The mean period and time scale of each IMF component of the global mean monthly SST under three future scenarios

表3. 三种未来排放情景下全球平均SST各IMF分量的平均周期及时间尺度

将三种排放情景下的全球平均SST输入已经建立好的模型中以得到订正结果,为验证模型对未来情景试验的预估订正效果,选取2015~2019年的观测数据与订正前后模式对比,如图8所示。能够看出三种排放情景下的全球平均SST在订正后的折线走向和振幅上与观测更为贴近,但在极值点的订正上还存在一定误差。

Figure 8. Global mean monthly SST during 2015-2019 before correcting (Blue line) and after Correcting (Red line) with observation (Black line) under three future scenarios (a) SSP1-2.6 (b) SSP2-4.5 (c) SSP5-8.5

图8. 三种排放情景下2015~2019年全球平均SST订正前(蓝线)和订正后(红线)与观测(黑线)的对比(a) SSP1-2.6 (b) SSP2-4.5 (c) SSP5-8.5

表4给出了2015~2019年模式订正前后的偏差统计量。三种情景下订正后的均方根误差较订正前分别减少了78.5%、65.1%和75.1%,平均绝对偏差减少了79.5%、67.7%和77.1%,相关系数从原本较弱的负相关提升为0.9以上的正相关(99%置信度)。从以上统计量来看,模型对2015~2019年的预估订正取得了较好的效果。

订正前后的2015~2100年全球平均SST对比如图9所示,可以看到经过模型订正后,不同排放情景下的全球平均SST整体上均较订正前有所减小,并且保留了2015年至本世纪末全球平均SST一直增长的趋势。2015~2100年期间,在SSP1-2.6排放情景下,模式预估全球平均SST的增温趋势为0.513℃/100a,订正后的增温趋势降为0.424℃/100a,到本世纪末30年(2081~2100年)全球平均SST较最近20年(1995~2014年)将升温0.608℃;在SSP2-4.5排放情景下,模式预估的全球平均SST增温趋势为1.676℃/100a,订正后的增温趋势降为1.325℃/100a,到本世纪末30年全球平均SST较最近20年将升温1.183℃;在温室气体排放最高的SSP5-8.5情景下,模式预估的全球平均SST增温趋势则为4.058℃/100a,订正后的增温趋势降为3.185℃/100a,到本世纪末30年全球平均SST较最近20年将升温2.409℃。

Table 4. The statistics of global mean monthly SST during 2015-2019 before and after correcting under three emission scenarios

表4. 三种排放情景下的2015~2019年全球平均SST在订正前后的统计量

Figure 9. Global mean monthly SST during 2015-2100 before correcting (Blue line) and after Correcting (Red line) under three futures cenarios (a) SSP1-2.6 (b) SSP2-4.5 (c) SSP5-8.5

图9. 订正前(蓝线)和订正后(红线)未来三种排放情景下的2015~2100年全球平均SST对比(a) SSP1-2.6 (b) SSP2-4.5 (c) SSP5-8.5

4. 结论和讨论

利用NOAA扩展重构的全球SST数据ERSST v5,和气候模式FIO-ESM v2.0参与CMIP6的历史试验以及未来情景试验结果,采用EEMD分解和机器学习方法BP神经网络相结合的订正模型,对历史试验模式模拟的全球月平均SST开展偏差订正并评估了订正效果。在此基础上,利用建立的订正模型对SSP1-2.6、SSP2-4.5、SSP5-8.5三种典型浓度路径排放情景下的2015~2100年全球平均SST开展预估订正。主要结论为:

1) 将观测的和模式模拟的历史时期(1929~2014)全球月平均SST经EEMD分解得到的9个IMF分量,按照季、年、年际、十年际、年代际、八十年以上的时间尺度组成6个新的时间信号,对每一个组合时间信号输入BP神经网络开展偏差订正。结果显示,订正模型能够有效减小模式模拟的全球月平均SST的偏差:均方根误差由订正前的0.401℃减小为0.096℃,降幅达到76.1%;平均绝对偏差由订正前的0.338℃减小为0.077℃,降幅为77.2%;与观测的相关系数由订正前的0.332提高到了0.952。

2) 将建立的订正模型应用到SSP1-2.6、SSP2-4.5、SSP5-8.5三种排放情景下全球平均的SST预估订正,与观测的对比表明,2015~2019年的订正后结果相对订正前有显著改善;相比订正前的未来预估增温趋势,订正后的2015~2100年全球平均SST增温速度有所减缓,分别增长0.424℃/100a、1.325℃/100a和3.185℃/100a;本世纪末20年(2081~2100)平均相对最近20年(1995~2014)将分别升温0.608℃、1.183℃、2.409℃。

需要注意的是,本文对气候模式模拟的全球平均SST偏差的订正是对不同时间尺度组合信号的偏差分别订正,虽然订正后的历史试验重构结果有了很大改善,但是在高频和几个偏差较小的时间尺度信号上改善仍存在不足,特别是在未来预估的订正上,模型对极值点处的预估可能会存在一定偏差。全球平均SST的变化受到多种外强迫因子的影响,如全球温室气体浓度、大气气溶胶浓度等因子,SST的模拟偏差可以认为是模式对上述影响因子的响应问题,建立影响因子与SST偏差的关系或许也能更有效地订正全球平均SST的偏差。

本文只是对FIO-SEM v2.0单个气候模式模拟的全球平均SST开展了模式偏差订正的探索性研究,结果表明基于机器学习的订正模型有望在模式模拟偏差订正方面发挥重要作用,因此下一步将在此工作基础上探讨多个气候模式以及空间SST偏差订正与机器学习算法的结合。

致谢

感谢王刚和魏萌在EEMD方法以及金权在BP神经网络参数设置上的建议。

基金项目

自然科学基金委–山东省联合基金——海量数据驱动下的高分辨率海洋数值模式关键算法研究(U1806205)、中央级公益性科研院所基本科研业务费专项基金——地球系统模式FIO-ESM v2.0的建立及应用(2016S03)、自然科学基金创新研究群体项目——新型海洋与气候模式的发展(41821004)和自然资源部中韩海洋领域合作项目–西北太平洋气候变化预测及应用研究。

NOTES

*通讯作者。

文章引用: 匡志远 , 宋振亚 , 董昌明 (2020) 基于机器学习订正模型的未来百年全球海表温度预估研究。 气候变化研究快报, 9, 270-284. doi: 10.12677/CCRL.2020.94031

参考文献

[1] 董雷娟, 李洪平. 全球海表温度变化特征分析[J]. 地理空间信息, 2013, 11(5): 29-31.

[2] 宋振亚, 鲍颖, 乔方利. FIO-ESM v2.0模式及其参与CMIP6的方案[J]. 气候变化研究进展, 2019, 15(5): 558-565.

[3] Manabe, S. and Bryan, K. (1969) Climate Calculations with a Combined Ocean-Atmosphere Model. Journal of the Atmospheric Sciences, 26, 786-789.
https://doi.org/10.1175/1520-0469(1969)026<0786:CCWACO>2.0.CO;2

[4] 陈辉, 尹训强, 宋振亚, 宋亚娟, 鲍颖, 乔方利. 气候模式中海洋数据同化对热带降水偏差的影响[J]. 海洋学报, 2015, 37(7): 41-53.

[5] 宋振亚. 耦合海浪的地球系统模式FIO-ESM [J]. 气候变化研究快报, 2020, 9(1): 26-39.

[6] Flato, G., Marotzke, J., Abiodun, B., et al. (2013) Evaluation of Climate Models. In: Stocker, T.F. and Qin, D., Eds., Climate Change 2013: The Physical Science Basis: Working Group I Contribution to the Fifth Assessment Report of the Inter-governmental Panel on Climate Change, Cambridge University Press, Cambridge, 1-1535.

[7] 陈浩, 宁忱, 南卓铜, 王玉丹, 吴小波, 赵林. 基于机器学习模型的青藏高原日降水数据的订正研究[J]. 冰川冻土, 2017, 39(3): 583-592.

[8] Rasp, S. and Lerch, S. (2018) Neural Networks for Post-Processing Ensemble Weather Forecasts. Monthly Weather Review, 146, 3855-3900.
https://doi.org/10.1175/MWR-D-18-0187.1

[9] 门晓磊, 焦瑞莉, 王鼎, 等. 基于机器学习的华北气温多模式集合预报的订正方法[J]. 气候与环境研究, 2019, 24(1): 116-124.

[10] 孙全德, 焦瑞莉, 夏江江, 等. 基于机器学习的数值天气预报风速订正研究[J]. 气象, 2019, 45(3): 426-436.

[11] 金权. 基于机器学习算法对海浪波高的预测及优化研究[D]: [硕士学位论文]. 青岛: 自然资源部第一海洋研究所, 2019.

[12] 宋振亚, 刘卫国, 刘鑫, 苏天赟, 刘海行, 尹训强. 海量数据驱动下的高分辨率海洋数值模式发展与展望[J]. 海洋科学进展, 2019, 37(2): 161-170.

[13] Huang, B., Thorne, P.W., Banzon, V.F., et al. (2017) Extended Reconstructed Sea Surface Temperature, Version 5 (ERSSTv5): Upgrades, Validations, and Intercomparisons. Journal of Climate, 30, 8179-8205.
https://doi.org/10.1175/JCLI-D-16-0836.1

[14] Huang, N.E., Shen, Z., Long, S.R., et al. (1998) The Empirical Mode Decomposition and the Hilbert Spectrum for Nonlinear and Non-Stationary Time Series Analysis. Proceedings of the Royal Society of London. Series A: Mathematical, Physical and Engineering Sciences, 454, 903-995.
https://doi.org/10.1098/rspa.1998.0193

[15] Wang, T., Zhang, M.C., Yu, Q.H. and Zhang, H.Y. (2012) Comparing the Applications of EMD and EEMD on Time-Frequency Analysis of Seismic Signal. Journal of Applied Geophysics, 83, 29-34.
https://doi.org/10.1016/j.jappgeo.2012.05.002

[16] Wu, Z.H. and Huang, N.E. (2009) Ensemble Empirical Mode Decomposition: A Noise-Assisted Data Analysis Method. Advance in Adaptive Data Analysis, 1, 1-41.
https://doi.org/10.1142/S1793536909000047

[17] 章国勇, 伍永刚, 刘洋, 张炜博. 基于EEMD与EMD的降雨序列多时间尺度对比分析[J]. 中国农村水利水电, 2014(8): 98-103.

[18] 赵健, 樊彦国, 张音. 基于EEMD-BP组合模型的区域海平面变化多尺度预测[J]. 系统工程理论与实践, 2019, 39(10): 2713-2722.

[19] 夏克文, 李昌彪, 沈钧毅. 前向神经网络隐含层节点数的一种优化算法[J]. 计算机科学, 2005, 32(10): 143-145.

[20] 史先铭, 刘以安. MPSO算法优化BP网络的数字调制识别方法[J]. 计算机工程与应用, 2016, 52(17): 133-139.

分享
Top