回归分析
鉴于回归分析方法在气象中的广泛应用如何正确地使用它作分析与预报,有一些
问题是值得在使用过程中注意的:
(1)变量是否遵从正态分布。在回归模型建立一开始就假定预报量和线性模型误差
是遵从正态分布的,以后无论是方程的检验,回归系数的检验,均是在这一假定条件下
进行的。因而预报量是否确实遵从正态分布往往是影响预报效果的重要因素之一
文献对降水量的回归分析中提出要对预报量作正态性的检验。他们认为,资料
年代长以及长时间的累计量或平均值(例如季、月平均气象要素)易趋于正态,而带有瞬△
时性的要素往往振动很大,与正态分布距离较远。因而对于日降水量的预报往往分为二
值变量,用REEP方法作预报以克服降水量本身的变差太大的缺点。而在月降水量预
报中,可认为近似遵从正态分布,因而在回归分析中用降水量本身来作预报。
正态分布的检验方法可以用参数化方法,如第一章所述,也可以用分布函数拟合方
法(可参看文献[18])。
(2)重视回归方程的线性假设,在回归分析中,为处理方便起见,很多分析问题都把
变量之间关系处理成线性。这种处理是否合乎实际,这就需要检验。通常检验方法可使
用预报量与估计量之间的差(残差)进行(详细可参阅文献[1])。
在气象中,也存在一些特殊年份的资料影响变量之间的线性关系,也可以去掉一些
记录再进行分析(见文献[19])。
对于那些明显地与预报量不存在线性关系的因子,用非线性回归处理更好2
(3)重视因子的天气意义,要作好预报,必须选取与预报量有密切天气意义的相关
因子。例如作短期降水概率预报,可选取24小时内的数值预报某些物理量,如饱和差、降水量、相对湿度、海平面气压等(参见文献[])。而预报雷暴天气则多选取层结稳定度、垂直运动、风向切变等物理量21]。有时也可以选取组合因子来表达有关的物理意21]
义。在制作中长期预报中,大多从太阳活动、大气环流、大气下垫面(海温、地温)甚至天文因素中去寻找因子223
(4)重视回归方程的稳定性,在做气象统计分析与预报中,不单要注意所寻找的规律性是否很好的反映样本资料,即对使用的样本资料进行检验,看看是否拟合率高,亦即是否残差方差小,还要注意所得到的规律性在未来时间的样本内是否还存在。例如 BriffaA等人[24]利用树木年轮恢复英格兰历史降水量和温度时,用1830~1899年作为测度期间,求得降水量的复相关系数0.61,用190~1969年期间的资料作为验证,得到相应的复相关系数为0.76,从而说明所建立的回归方程是稳定的。
回归方程的稳定性还可以通过对相关系数或回归系数随时间变化来检验(见文献[19]和[25])。研究表明,两个气象要素在不同的历史时期的关系会发生变化,有的在某段时期是正相关,在另一段时期会变成负相关。回归系数也有类似的变化情况。这种变化原因可能与气候背景发生剧变有关。因此需要把握回归方程的有效使用期,即在比