摘要:本研究开发了一个预测西北太平洋及其子区域(南海,西北太平洋西部,西北太平洋东部)周际热带气旋成因的L2正则化(防止过拟合,引入参数λ控制各个量级参数的大小从而控制回归的非线性强弱)逻辑回归模型。TC成因的潜势预报模式包括气候态TC成因的时间变化,MJO,QBOW和ENSO。建立的L2回归模型中预测因子的相对重要性通过从0-7周提前期中每个区域的正向逐步选择程序来证明。
气候态TC成因一般可以提升区域模式的技巧,而季节内振荡和ENSO的重要性有区域依赖。在WNP,通过包括MJO和QBWO,模型在预测周际TC成因时的技巧比仅考虑时间变化气候态提前了4周的时间,而ENSO的影响有限。在区域尺度,ENSO和MJO及QBWO分别是在EWNP和WWNP的两个除气候态TC成因外最重要的预测因子。MJO被认为是在南海最重要的预测因子。逻辑回归模型在季节内时间尺度展示出了与EC动力模式有相当的可靠性和预测技巧得分。
重要性说明:熟练的短期到季节时间尺度的TC活动预报现已投入运行。虽然对驱使TC活动的物理机制的理解已经有了很大的进步,但是TC的季节内预报依然是重大的科学挑战。本研究发展了一个基于统计预测WNP海盆周际TC成因的季节内模式。该模式展示了直到第四周的预测技巧。我们讨论模型技术对ENSO和其他次季节气候振荡的区域依赖性。该方法为西北太平洋海盆的TC提供了有技巧的季节内预测。
结论:在该研究中,我们针对WNP TC成因使用L2正则回归方法发展了一个季节内统计预报模型。因为对TC的物理控制机制存在很大的物理控制机制,所以我们将整个WNP海盆分为三个子区域。(SCS,WWNP,EWNP)并使用相同的方法,在季节内时间尺度上针对每个子区域开发了统计预报模式。气候态TC成因,两个MJO指数,两个QBWO指数和ENSO的特征ONI(ocean nino index)指数被选为该研究中回归模型的潜在预报因子。根据每个预测因子的实时可用性,为其引入适当的滞后。我们使用向前逐步选择法评估了在整个WNP和三个子区域的潜在预报因子于0-7周时的相对重要性。为整个WNP和三个子区域开发了独立的模式。
通常来说,时变气候态TC成因一般作为最重要的预测因子并在周际TC成因预测中展现着较高的模式技巧。通过包括ISO,模式技巧得以在整个WNP海盆提升到提前4周。相比之下,由于ENSO对WWNP和EWNP的TC成因影响相反,所以ENSO对WNP海盆技巧提升影响有限。除了TC预测技巧对ENSO的区域依赖性,季节内TC成因预测也展现了对ISO很强的区域依赖。通过将ENSO纳入WWNP和EWNP,模型技巧有了很大的提高,而MJO和QBWO虽然都提高了SCS和WWNP的模式技能,但对EWNP的影响有限。对ENSO和ISO的区域依赖性可以很大程度上解释模式预测整个WNP海盆的台风和热带风暴时的差异。统计模式的性能可以与EC动力模式比拟。我们发现在第二周有可与EC动力模式比拟的可靠性和预测技巧得分,在第3-6周的预测技巧得分更高。
通过内部(1979-2009)和外部(2010-2019)验证方法评估了模式的预测技巧,我们发现了类似的结果。考虑到气候态年代际差异对模式技能的潜在影响,我们进一步比较了模式在1979-1997年气候态和1998-2009年气候态技巧的差异。我们发现,不论是在完整的WNP还是在三个子区域,两段时间的差异都很小。这些分析揭示了本研究开发的季节内预报TC成因统计模式对年代际背景状态不敏感。最后,我们使用非滤波方法通过实时MJO和QBWO指数进行了预测,发现统计模式展示了在WNP海盆上实时表示TC成因的能力。预测技巧也与使用带通滤波提取MJO和QBWO信号时相当。
尽管本文开发的模式看起来很有前景,但应考虑更多的季节内潜在预报因子,包括其他赤道波动,热带外遥相关和其他海盆的海温异常。通过系统分析和评估当前动力模式在季节内时间尺度上预测TC的技能,进一步研究关键的环境因素和大尺度环流系统对季节内时间尺度的TC预测的影响。最近,越来越多的人关注机器学习和人工智能在预测中的使用。Matsuoka等人使用二维深度卷积神经网络(CNN)模型成功的监测到了WNP上的TC成因和前兆。Ham等人也使用CNN模型更好的预测了ENSO事件。深度学习的应用可能会很大程度上的提高季节内时间尺度上对TC活动的预测技能。
引言:TC是全世界破坏性最大的自然灾害,对沿海和相邻内陆地区的生命和财产构成重大威胁。为了为TC相关的防灾减灾提供更好的指导,最近人们越来越关注TC活动的扩展时间预测的改进。在过去的几十年,在理解驱动TC活动的物理机制方面已经有了很大的进步。对TC活动从短时(每天)到季节性的熟练预报已经发布运行。
短期TC预测的技巧主要来自于初始条件,通常随着模式分辨率和数据同化系统的改进而呈现出增加的趋势。在季节时间尺度,TC预测很大程度上由缓慢变化的大尺度环境变量决定,如SSTs。统计模式,混合统计-动力模式和动力模式已成功应用于TC的季节展望。在季节内时间尺度,TC活动预报通常基于与季节内振荡、对流-耦合赤道波和SST。
季节内TC预测仍然是一个重大科学挑战,虽然一些统计、动力和混合统计-动力技术已经用于预测季节内时间尺度的TCs。为了获得一套无缝预测产品,世界天气研究署和世界气候研究署发起了一个次季节-季节(S2S)项目。其中一个关键的项目就是评估11个已投入使用的动力模式在季节内时间尺度预测极端气候和天气事件的能力,包括TC活动,由此改进扩展时间范围预报。
近些年,一些动力模式在预测MJO方面已经有了显著改善,MJO被认为是季节内时间尺度一个重要的可预报性来源。基于统计的季节内时间尺度TC预测模式展示了可与动力模式和动力统计混合模式可比拟的能力。人们认为动力模式在预测ISO和热带波时仍有可改进的空间。
在WNP海盆,大量先前的研究已经使用动力模式或统计-动力模式技术探索了季节内TC活动预报。还开发了统计模式用于熟练地TC成因季节内预测。这些统计预测关注点大多在南半球,或在东北太平洋和北大西洋海盆,据我们所知,没有研究概述WNP海盆季节内TC成因的统计预测模式。影响WNP海盆TC成因的因素与驱使南半球,东北太平洋和北大西洋TC活动的因素有所差异。本研究使用方法类似于L&W和S&M的研究,但主要关注WNP。我们建立了一个统计预测模式用于预测WNP海盆的季节内TC成因,并检验了模式的预测技巧。这里使用的统计回归模式不同于这两篇文章,使用了L2模型,很大程度上克服了潜在的过拟合问题。
第二段描述了本文使用的数据和开发的用于预测周际TC成因的逻辑模型。第三段讨论了季节内预报模式中潜在预测因子的相对重要性。第四段详细介绍了WNP TC成因的季节内预测模型的构建。第五段评估了逻辑回归模型预测周际TC成因的技巧,并与EC的模式作了对比,最后为该模式开发了一套不涉及滤波的实时预测方案。第六段总结了该研究。
数据与方法
数据:JTWC最佳路径数据集,包括经纬度,中心最低气压,6小时间隔的最大持续风速。记录1979-2019,WNP(0-40°n,100-180°E)地区扩展后北半球夏季(5.1-10.31)>34kt的TC(达到热带风暴级别)。
TC强度在生命时间中达到34kt时所在的时间和位置定义为生成时间与位置。
驱动WNP各个子区域TC生成的物理过程存在很大的差异,所以对各个子区域使用不同的预测因子可以取得更好的效果。
所以将WNP分为南海(SCS)、西西北太平洋(WWNP)和东西北太平洋(EWNP),如图1。
分界同时基于了物理和操作上的考虑,120°E为东西菲律宾岛的分界,140°E为对ENSO响应相反的区域界线。
最新的一些WNP海盆次季节模式中,EC模式在提前2-3周预测大部分海盆的TC时表现了最好的技巧。为了在次季节时间尺度上比较动力和统计模式,从S2S数据集中获取了TC成因预报的后报结果。Vitart等详细描述了S2S数据集的细节。EC模式的预测提前时间为46天(大约提前6周),并且再预报系统中有11个集合成员。从2000-2019年,这些再预报系统每周运行两次(周一到周四)。使用V和S(2001)描述的方法追踪动力模式后报结果中的TC。TC路径包括每日最大持续风速值和风暴位置。注意到EC模式产生的提前一周的后报结果包括先前已存在的风暴。因为这里使用的EC模式不能模拟最大观测TC强度,所以本研究只考虑达到热带风暴风速阈值的TC,该阈值定义为寿命最大强度累计密度分布的18%(即24kt),效仿了Lee等(2018)的研究。
对动力模式而言,TC成因的概率由11个系统成员的分数计算得到,定义为:
M为集合成员的数目,Pi,j为第j个成员的第i次成因预测,Pi,j为0表示没有成因,为1表示在预测时间中有一个或更多风暴事件形成。
为了获得ENSO指数,使用HadlSST数据集。OLR用于量化季节内模态。来自NOAA1979-2019年的日平均OLR,水平分辨率为2.5°*2.5°。
类似于之前的研究,使用EOF分析物理变量(如OLR、降水和风),使用OLR获得了两种主要的ISO模式,主要周期为10-20天的QBWO和30-60天的OLR。这些模式都会显著的影响WNP海盆的TC成因,因此被选为TC季节内预测的潜在预测因子。
L2正则回归模型
我们使用多元逻辑回归方法开发了一个统计模型用于WNP海盆的季节内TC成因预测。逻辑回归已广泛使用与物理和社会科学,并且有效应用于概率预测,因为它允许输入预测为二分法(0或1),并预测0-1之间的概率。一个二分的指数用于表示事件的发生与否,即为1(事件发生)或0(事件未发生)。逻辑回归假设函数Hβ定义为:
P尖为TC成因的预测概率,在0-1之间,X1~m为预测因子,β0~m代表预测值和历史预测值的回归系数。
回归模型趋向于建立一个假设函数,如果可能的话该函数适用于所有训练样本。如果模型训练的时间太长且训练样本集有限的话,它将开始学习噪音并过于拟合训练数据。也就是说,会成为一个过拟合的模型,仅适用于训练集而不适用于其他独立的数据。如果一个模型不能很好的概括新数据,那它也不能成功的进行实时预测。此外,如果由于模式复杂的性发生了过拟合,那么有意义的做法是减少某些确定预测因子的数目或权重。然而,很难提前知道应该移除哪些具体模型的特征。正则方法尤其可以帮助避免过拟合。该方法具体为加入一个惩罚项,如L1范数和L2范数(详见L1-norm (L1范数) L2-norm(L2范数)_w__Y__w的博客-CSDN博客),作为模型的损失函数。使用L2正则化方法的回归模型称为岭回归模型。岭回归通过对回归系数的大小施加惩罚来收缩回归系数,而不是丢弃预测因子的子集,以减小模型的预测误差。
在本研究中,开发了一个L2正则逻辑回归(为逻辑回归的损失函数加入L2范式)模型来生成后报概率。L2正则逻辑回归的损失函数表示为:
Oi为观测到气旋发生事件的概率,λ表示惩罚参数。较大的λ值将倾向于将回归系数收缩到零。等式(3)右侧的第一项是原始逻辑回归损失,第二项表示L2惩罚(即岭惩罚)。请注意,截距β0已从惩罚项中删除。通过最小化损失函数J(β)来计算回归系数。具有L2正则化的逻辑回归可以收缩回归系数以避免过度拟合,同时保留模型中的所有变量。当回归系数接近零时,变量的重要性可以忽略。
在该研究中,我们效仿L和W以及S和M使用L2正则化逻辑回归产生直到第7周(0-7周)的TC成因概率预测。为了消除潜在的模式偏差,TC在每周的一个具体时间开始形成(如周日或周一),我们使用重叠周开发模型,从每天开始。此外,W0定义为以模型初始化的每一天为中心的七天周期,它不提供可预测性,但用作比较手段。针对整个WNP海盆和分的三个子区域(如SCS,WWNP,EWNP),针对W0-W7的提前时间开发了各自的模型。
3. 预测因子选择方案
3.1 气候态TC成因
气候态TC成因的建立基于1979-2009对全部WNP海盆和三个子区域的观测,表示其对应的每周TC发生的平均发生概率。该气候态被选为描述周际TC成因季节性循环的预测因子。(图2)
因为样本相对较小,所以通过观测到每年的周际TC成因概率(二元概率)计算的原始的气候态概率有很多噪音(虚线),使用该原始气候态作为预测因子可能会影响回归模式的性能。因此,平滑后的气候态(实线)代替原始气候态作为整个WNP和三个子区域的预测因子。效仿L和W在南半球的工作,使用对原始序列低通滤波的方法得到平滑后的气候态。
3.2 ENSO
除了季节性TC成因循环,季节内TC预测也需要包括年纪时间尺度的预测因子来代表影响TC成因的大尺度环境条件的低频变化。由于对WNP区域TC活动的显著影响,选择ENSO作为季节内调制TC成因的潜在预测因子。EI Nino年较La Nina年而言,有更多的TC在WNP海盆东南部生成、路径偏西且强台风更多。如图三所示,在E年和L年,WNP海盆的气候态TC成因概率没有显著的差异。然而,当检验三个子区域气候态TC成因概率时,E年,WWNP子区域的峰值比EWNP子区域更低,反之亦然,与前人研究得到的ENSO对TC成因位置的显著影响一致。在该研究中,ENSO使用海洋NINO指数(ONI)表示,定义为Nino3.4海域(5°s-5°n,170°w-120°w)海温异常的三个月滑动平均。强E年定义为5个连续的ONI指数异常大于+0.5℃的三个月平均时段。且在这段时间该异常必须大于等于1℃至少三个连续的月。使用该定义,在1979-2019年我们找到了15个强ENSO年,包括
8个强E年:1982,1987,1991,1994,1997,2002,2009,2015
7个强L年:
1988,1995,1998,1999,2007,2010,2011。
3.3 MJO
季节内振荡(ISO)被认为是季节内预测的主要的预测来源。大量研究已经揭示了ISO对TC活动的强调制作用,在对流-活跃ISO位相有更多的TC,对流-抑制ISO位相的TC则更少。MJO模态是ISO在热带的主导模态。在北半球夏季,WNP上空的MJO展现了显著的西向或西北向传播,这与北半球冬季MJO主要向东传播不同。然而,之前的两个研究使用了实时复合(RMM)MJO指数作为开发的季节内TC成因预报模型的主要可预报性来源。虽然全年的RMM指数描述了MJO活动,但由于可能受到温带地区的影响,预计它可能不能完全代表MJO的季节性和区域性。
为了代表北半球夏季的MJO活动,本文中的MJO指数基于对0-40°N,100-180°E区域1979-2019年5.1-10.31日每天OLR异常的EOF分析构建。OLR异常在EOF之前首先进行了30-60天的兰索思带通滤波。领先的两个模态分别解释了19.8%和13.8%的30-60天带通滤波OLR异常方差。这两个EOF模态可以很好的代表北半球MJO在WNP的活动(图4),并与前人的研究结果一致。这些EOF模态的相应主成分在下文称为MJO-PC1和MJO-PC2。我们进一步检验了MJO事件对WNP TC的调制作用。MJO事件的振幅定义为MJO-PC1和MJO-PC2的平方和。如图4,在对流增强MJO位相(如4-7位相),明显有更多的TC生成,而在对流抑制的MJO位相(如位相8和1-3)则TC更少。鉴于WNP TC成因与MJO活动间紧密的关系,选择这两个指数作为复合逻辑回归模型的主要预测因子。
3.4准双周振荡(QBWO)
QBWO被认为是ISO的另一种主导模态、向西或西北方向传播并且有10-20天的周期性。研究表明QBWO拥有比MJO更强的动能方差,因此可通过改变大尺度环境来调制WNP TC。QBWO也使用EOF分解分析但是基于对OLR异常的10-20天带通滤波。前两个主导模态分别解释了10-20天带通滤波OLR的8.5%和7.4%的方差,代表了向西或西北方向传播的QBWO。类似的,QBWO对TC 成因的强调制在图5中清楚地显示,在增强的QBWO相关对流活跃地区(2-5位相)比受抑制QBWO相关对流位相(1,6-8位相)有更多的TC成因聚集。周等人也表明(2018)在对流增强QBWO位相有显著的TC生长率增长。QBWO前两个主导EOF模态的主成分(QBWO-PC1和QBWO-PC2)也作为回归模型潜在预测因子之一。
3.5 ENSO和季节内振荡联合调制TCs的重要性
就像前文提到的一样,ENSO是最重要的海气耦合模态之一,MJO和QBWO是两个最重要的季节内模态,它们都可以显著的影响大尺度环境,进而影响TC活动。TC成因很大程度上依赖于TC适合的大尺度环境条件,如低层涡度的增加、中层湿度的增加,垂直风切变的减小和SST的增加。使用Emanuel开发的成因潜势指数(GPI),赵等人表明相对湿度和低层相对涡度为两个受ISO调制的两个最重要的环境场,进而影响到WNP的TC成因。Camargo等也通过GPI分析研究了与ENSO调制TC成因相关的大尺度因素的相对重要性,发现当EI Nino发生时,相对湿度的增加和低层相对涡度的增加也是WNP TC成因位置东移的主要原因。
然而,ENSO和ISO对TC成因的影响并不是独立或线性的。之前有研究假设了ISO的两个领先模态(QBWO和MJO)通过改变对TC成因的大尺度环境条件联合调制WNP TC成因。Li和Zhou(2013)研究表明,在对流抑制的QBWO阶段,WNP主要由MJO诱导的正OLR异常控制,导致了对TC成因的显著抑制。但是,在对流抑制的MJO阶段的TC抑制通常弱于对流增强QBWO阶段,主要是由于QBWO和MJO相关的大尺度条件的平衡抵消。
此外,一些研究也提出ENSO和ISO对WNP TC成因的联合作用。例如,李等人(2012)发现ENSO可以通过改变与MJO有关对流的强度和位置来影响TCs的成因位置和成因频率,E年比中性和N年,MJO对TC成因的调制作用更强。Han等人(2019)表明QBWO和ENSO对TC成因的调制主要与大尺度环境和天气尺度涡动动能的空间变化有关,这些变化影响了与不同ENSO阶段下QBWO活跃或非活跃阶段相关的TC成因。
本文考虑了ENSO、ISO和他们的协同作用在季节内时间尺度对TC成因的不同影响。我们建立了一个季节内统计预测WNP TC成因的模型。我们发现整合了ENSO和ISO指数的统计预测模型相对于只使用ENSO或ISO指数的模型有更高的性能。此外,像3.2提到的,ENSO显著的影响WWNP和EWNP的TC 成因,但对南海TC成因的影响却很小。当MJO和QBWO的对流中心位于SCS和WWNP时,对SCS和WWNP TC的调制作用比对流驱动ISO中心位于EWNP时更强。我们将会在5.1中展示,ENSO和ISO对TC成因预测技能的区域差异有很大的影响。
4. 开发逻辑回归模型
4.1 实时预报
本文建立WNP海盆季节内TC成因逻辑回归模型的方法很大程度上遵循了L&W和S&M使用的方法。为了表示可用于实时预报的数据,所有使用的ONI数据集都滞后一个月,代表MJO和QBWO的四个指数都滞后一天。每周预报的气候态值(注意气候态是唯一的在每个提前时间都没有滞后的预报因子)和五个滞后的预测因子用于计算回归系数,接着将其输入等式(1)来产生直到提前7周的整个WNP海盆和三个子区域的预报。
4.2 预报因子的相对重要性
正向逐步选择方案一般用于提供预测因子重要性的排序。这里,我们使用该方案量化输入变量对于季节内时间尺度TC成因预测的相对重要性。为每个预测值(k)建立单独的模型,然后计算卡方统计量。在逻辑回归模型中包括具有最高卡方统计量的预测因子后,将剩余的k-1个预测因子分别添加到模型中,再计算新的卡方统计量。重复该步骤直到引入新的预测值不会显著减少误差平方和(如在cheng等人(2006)95%显著性临界值之下)。换句话说,预测因子维持一个较低的P值(<0.05)时才是对模型更有意义的补充。逐步回归方案中预测因子的相对重要性通常与在单变量分析中根据TC成因概率回归的独立预测因子的结果一致。
表1总结了向前选择方案在每个提前周于整个WNP和三个子区域的结果。在整个WNP海盆,气候态TC成因是最重要的预测因子,解释了大部分TC成因的变率。MJO(包括MJO-PC1和MJO-PC2)发现是第二重要的预测因子,尤其在提前1-5周的预测中。QBWO则在提前1-4周表现着更少的重要性,表明在季节内TC成因预报中它的相对重要性更低。ENSO对整个WNP的预测技巧影响有限,尤其在提前0-3周时,可能是由于ENSO对WWNP和EWNP子区域相反的影响。
在SCS子区域,两个ISO(MJO和QBWO)比ENSO有更重要的影响。
在WWNP子区域,MJO和QBWO在提前0-1周是最重要的因子,而ENSO在提前2-7周是在气候态TC成因后第二重要的预测因子。
在EWNP子区域,MJO和QBWO对模型技巧的影响有限,ENSO在所有提前时间都是第二重要的预测因子。
注意到逐步回归方法通过保留预测因子子集和丢弃其余部分来得到最佳模型,这会导致预测误差可能低于完整模型。然而,最佳模型通常显示很高的方差并可能会过拟合。本研究中,我们仅使用了逐步回归来得到预测因子重要性的顺序,但是我们没有使用它来产生预测概率。所有的潜在预测因子用于开发逻辑回归模式。潜在因子的相对重要性使用向前逐步回归得到,并发现与BSS得到的模型技巧提高接近一致。这种一致性对于所选预测因子的物理解释很有用。更多的分析详见5.1。
4.3 交叉验证
交叉验证方法包括内部验证和外部验证,用于生成后报概率和评估模型技能。2010-2019年的数据用于外部验证,1979-2009年的每年都用两步交叉验证方法产生后报。首先,从1979-2009年,连续省略一年(内部验证);第二,用剩下的30年(训练集)开发模型来产生删除的一年(内部验证)和2010-2019年(外部验证)的后报。注意对每个不同的训练时段都重新计算气候态气旋成因概率(Clim)。这些后报概率从5.1-10.31独立生成,导致与L&W所做的周际概率重叠。
提前一周的通过回归模型使用所有潜在预测因子得到的后报概率样本如图6所示。我们验证了强E年1997年和强L年1999年的后报概率。和预料的一样,在E(L)年,WWNP海盆的后报概率较气候态更低(高),而在EWNP正相反。由于ISO在WWNP更强的影响,在WWNP也存在比EWNP更强的季节内TC成因预报变量。此外,我们发现后报概率在整个WNP海盆和SCS子区域的两个ENSO事件中都与气候态一致。这些结果很大程度上解释了ENSO对WWNP和EWNP区域TC成因相反的影响和ENSO对SCS相对较弱的影响。
5. 模式技巧
5.1 逻辑模式可预测性评估
(a)使用布雷尔分数评估预测模式技能性能
回归模型的预测技巧使用布雷尔分数进行定量评估。布雷尔分数使用以下公式来评估概率预测的准确性
其中n是事件数,yi表示事件i的预测概率,如果事件i发生,则oi为1,事件未发生则oi为0。因为预测和观测值均以0和1为界,所以BS可以取0-1间的任何值。BS是预测概率的均方根误差,所以较低的BS意味着更好的预报。布雷尔技巧得分(BSS)是衡量预测模型的BS与参考模型相比有多好的一个指标。BSS计算公式为
BS代表后报的BS值,BSref是根据参考策略计算的BS,该策略使用气候态季节平均(如图8中的水平线所示,仅随区域变化)来产生后报概率。使用该参考策略,可以预测每天的相同概率,表明一周内发生的平均季节概率。与参考模型相比,BSS越高,后报预测模型的改进越大。
一般来说,使用所有潜在预测因子产生的BSSs比仅使用预测因子子集时更高,但是当使用预测因子子集时也偶尔发现更高的BSSs。这通常发生在前几个预测因子在TC成因的预测技巧比其他预测因子高的多的时候。为了代表技巧的提升和第0-7周预测因子的相对重要性,模型的后报BSSs使用所有的潜在预测因子,并且使用预测子集的模型如图7所示。
在WNP海盆,当考虑全部潜在预测因子时,使用内部验证的模型技巧表明,在W0-W5期间,与使用平均季节性气候态的参考模型相比,从16%提高到了24%。类似的结果可以在使用外部验证得到的模型技巧与使用平均季节性气候态的参考模型中找到(~17%-24%,W0-W7)。这些结果表明L2正则回归模型的能力是比较强的,并且在季节内WNP TC成因预测中展示强大的技巧。当在模型内部(外部)验证中仅使用时变气候态(如Clim)时,模型将展示较参考模型~16%(~17%)的提升。通过比较使用时变气候态以及ENSO的模型和使用所有预测因子模型的BSSs,我们发现几乎没有额外的提升。这一发现与ENSO对WNP东西不同的影响而导致的ENSO对整个WNP TCs的局限性一致。使用气候态和ISO的模型的BSSs(如:Clim+MJO+QBWO)产生的使用内部检验得到的提升在提前W0为大于~9%,但相对于Clim模型和Clim+ENSO模型,提前W4的技巧掉了1%。我们在使用外部检验加入ISO时也发现了类似的提升。这些结果体现了气候态TC成因和ISO对于WNP TC成因预测的重要性。
在SCS,我们发现当使用气候态TC成因和内部或外部验证时,较参考模型几乎没有明显的改进,这可能是因为南海地区较低的TC成因概率。Clim+ENSO没有增加额外的技巧甚至在一些临界提前时间有所降低,这与ENSO对该区域TC 成因有限的影响吻合。引入ISO后(C+ENSO+ISO),相对于Clim模型有了额外较大的提升。总而言之,ISO对于SCS是一个很重要的预测因子。
当使用内部验证时,Clim模型在WWNP和EWNP分别展示的较参考模型的提升为~6%和~10%,并且ENSO在所有预测提前时间上的WWNP和EWNP都比单独的Clim模型提高了~1%。加入ISO后,模型使用内部验证相对于Clim模型在第W0-W4的WWNP产生了大于~1%-3%的增长,而在W0-W1的EWNP基本上无增长。在外部验证中,ISO对WWNP提供了比ENSO更多的技巧提升,但在EWNP的前两周的提升有限。总之,气候态TC成因对WWNP和EWNP都为最重要的预测因子。在WWNP,ISO提供了比ENSO更多的技巧提升。相反的,EWNP地区预测技巧的提升主要来自于ENSO。
(b)ENSO和ISO的区域依赖的作用
WWNP和EWNP中包含ENSO时产生了较大的技巧增长,相对于Clim模型,内部与外部验证都出现了~1%的增长。如3.2提到的,在暖ENSO阶段,WWNP地区的TC成因更少,EWNP则相反。BSSs的分析也支持ENSO对WWNP和EWNP TC成因显著和相反的影响。我们进一步比较了强ENSO年的模型技巧并发现通过包括ENSO,TC成因模型的技巧有了很大的提升,使用内部验证时,WWNP大约为~3%,EWNP大约为4%(图8)。潜在预测因子的相对重要性在模型中使用内部和外部验证时结果基本相同。此外,ENSO对回归模型预测技巧的影响在强ENSO年时较全部年份更大(图7和8)。
如图4和图5,MJO和QBWO都表现着在WWNP对流调制的最大值,并且这些ISO在该区域对TC成因的有着比SCS和EWNP更重要的调制。通过加入ISO,WWNP也展示了最多的模式技巧的提升。进一步明确技巧的提升,我们选择了强MJO和QBWO事件来检验WWNP区域的模式技巧。我们定义强事件为分别的ISO振幅大于2的一天。在强MJO对流位相,在前四周(除了第二周)存在有相对于Clim模型的技巧提高。在使用内部验证的模式中,分别在W1的对流增强MJO位相(4-7位相)和对流抑制MJO位相(8,1-3位相)有着显著的9%和7%的额外提升(图9),而使用所有的ISO日数则只有6%的模型技巧提升(图7)。高振幅MJO事件对TC成因更强的调制作用也在W0的很大提升中得以反映,即使W0提供的可预报性有限。在QBWO的活跃位相,在较短的提前时间中也发现了类似的技巧提升(图9)。如预期,QBWO对模式技巧的提升没有超过W3的,主要由于QBWO更短的周期。总之,MJO和QBWO都能大量提高模型技巧,随着技巧的提高,QBWO可延长到第三周,MJO可延长到第四周。
(c)台风强度BSS
在WNP海盆,~65%的TCs会在它们生命中的某个时刻达到台风强度(>63kt)。在该节,我们检验了当预测最大生命史强度为热带风暴和台风时,模型预测整个WNP TC成因技巧差异。如图10所示,使用内部和外部验证时,使用Clim预测台风的模式分别表现出了较参考模型11%和13%的技巧提升。相反的,对于热带风暴,使用内部和外部验证时技巧提升较小,仅为4%和7%。对于台风,季节内变化提供的提升跨越W0-W3,而对于热带风暴,可扩展到W5。这种预测技巧上差异可能是由于ENSO和ISO的区域依赖导致。
如图11所示,大部分达到台风强度的TCs在120°E-150°E的区域,这与WWNP和EWNP一致,而保持低于台风强度以下的TCs主要在SCS与WWNP上形成。加入ISO后,在WWNP提前W0-W4和EWNP提前W0-W1的模型技巧得以提升,这与台风的分布一致。在SCS和WWNP的TC成因模型中加入ISO可以提升热带风暴的技巧到提前5周的时间。像之前展示的,ENSO对于整个WNP海盆季节内时间尺度台风和热带风暴强度TCs成因预报的局限性仍然在延续。
5.2 动力和统计预报的比较
接下来我们检测EC模式和本文中提出的逻辑回归模型在预测WNP TC成因时的技巧。在5.1-10.31定义的TC季,为了验证的目的,统计模型生成的后报和EC模型可用的周相同。接着,使用WNP的JTWC TC观测数据进行动力和统计模式的后报。
(a)可靠性图
我们使用可靠性图(wilks 1995)来检验动力和统计模型的可靠性。后报概率和相应的观测装入十个相同大小的组,然后对每组的后报概率和观测概率进行平均。如图12所示,我们关注季节内时间尺度的模型技巧(预测范围大于两周)并提供领先时间为W2-W5的统计和动力模式的可靠性曲线。以完美预测为中心的10%区间(实心对角线)由两条虚线对角线表示。可靠性线在10%的误差之下时认为该模型是可靠的。当可靠性线位于完美预报之下时,认为模型低估了TC成因概率,反之亦然。
在整个WNP和三个子区域,EC模式无法预测提前W2-W4的TC成因。随着预测提前时间的增加,EC模式显示了低估中低概率组的趋势。统计模型在提前W2的预测更可信,且其可靠性曲线较动力模式更靠近对角线。类似的,统计模型在SCS和WWNP也展现了可靠性。然而,在整个WNP和EWNP,统计模式也低估了提前W3-W4中低概率组的TC成因概率。在更长的提前时间预报,动力和统计模式对TC成因的低估更普遍。总之,统计预测模式比EC模式在提前W2-W4的预测表现的更可靠。
(b)概率预测技巧
EC模式的概率预测技巧使用BSSs衡量,将统计模型作为参考预测策略模式。此外,相对操作特征得分(ROC)(定义为ROC曲线下的面积),与命中率和相应的虚警率有关,也用于评估概率预报的技巧。ROC得分等于1.0为完美预报,而等于0.5则为无预测技巧。
先前的研究发现EC模式比其他统计模式在预测第一周的TC频次时有更好的技巧。在这里,我们比较了提前W2-W6的动力和统计模式预报技巧,因为很难消除先前存在的风暴的影响,包括EC模式生成的W1的后报。随着提前时间的增加,由BSSs和ROC分数衡量的EC模式技巧逐渐下降(图13)。比较参考模型,EC模式在整个WNP和EWNP的提前W2-W6显示了正的BSSs,而SCS和WWMP,除了提前W2,其他都显示了负的BSSs。在提前W2,统计模式的预测技巧接近EC模式,并且统计模式在更长时间的提前周比EC模式表现更好,BSS和ROC都有体现。
5.3 L2正则化模型的实时预测方案
这里开发的回归模型可以在WNP的周际TC成因预测中直接应用气候模式基本状态预测的ISO指数。更重要的是,为了确保开发的L2回归模型可用于实时预测,根据之前的研究通过非滤波的方法提取实时ISO指数。在本研究中,我们采取Hsu开发的非滤波方法提取MJO和QBWO信号。特别的,实时MJO(QBWO)指数可以从以下四步来获取。
首先,减去1979-2009年期间的气候态90天低通滤波分量,以从原数据中删除气候年周期。
接着,从上述异常场中减去前30(10)天的30(10)天均值,已去除较低的频率可变性。
然后应用5(3)天运行平均值,以消除MJO(QBWO)模式的更高频率可变性。
最后,通过将OLR异常场投影到从季节内时间滤波历史数据导出的每个模式上,就可以获得MJO(QBWO)模式的实时PCs。更多细节参见Hsu等人(2014)。
实时监测MJO指数和QBWO指数的示例如图14所示。MJO和QBWO模态的实时监测时间序列分别可以捕获30-60天和10-20天的ISO信号(图14a和14b),与MJO的PC1/PC2和QBWO的PC1/PC2的显著相关系数分别为0.82/0.78和0.75/0.70。较长的时期内也存在类似的一致性(表2)。在2010-2019年的5-10月,使用非滤波方法和带通滤波方法的MJO和QBWO模态的前两个主要PCs相关系数分别约为0.8和0.7,这有1979-2009年31年数据统计分析的支持。
此外,我们比较了使用带通滤波和非滤波方法得到的2010-2019年ISO指数的模型技巧。图14c展示了统计模式使用气候态和加入ISO时BSS值的差异。在整个WNP和三个子区域,使用两种信号提取ISO信号导致的模型技巧绝对差异很小,两种方法间不超过1.6%。为了进一步表现实时模型技巧,我们比较了对整个WNP和三个子区域在模型中使用两种方法得到的后报,技巧得分和可靠性图,类似的发现仅在大小上有些微的差异(补充图1-6)。总之,开发的L2回归模型可以在使用非滤波方法提取ISO信号的前提下,用于WNP的季节内实时周际TC成因预测。