台北是否真的出現異常暖冬現象?我們用機率分布來回答

台北是否真的出現異常暖冬現象?我們用機率分布來回答
Phote Credit: 林澤民

我們想讓你知道的是

台北市1897~2020年低溫時間序列顯示,1897年台北市的最低溫是攝氏5度。以此為資料中的第一個紀錄,124年來,有9個新的紀錄出現。這樣算是正常現象嗎?這個問題,可以用機率理論做精確的回答。

台灣這幾天比較冷,但暖冬仍然是全球暖化過程中一個明顯的趨勢。一般以為全球暖化始於19世紀末葉先進國家積極工業化的時候,然而世界各地工業化的進程不同,暖化的趨勢也會有所差異。當工業化在全球範圍內日益普及,各地暖化趨勢便益見明顯,但還要等到20世紀下半葉,這趨勢才明顯到引起各國的注意。

在美國一直要到1988年,氣候變化才正式成為官方關切的議題。這一年的6月23日,NASA太空研究所(GISS)主任James E. Hansen,在參議院能源及自然資源委員會作證指出:「全球暖化的程度,已經顯著到讓我們確信溫室效應與暖化趨勢具有因果關係。依我的意見,我們已經偵測出了溫室效應,而且這效應正在影響我們的氣候。」

以筆者居住的德州奧斯汀市而言,氣溫紀錄始於19世紀末期。我用統計學「改變點」(change point)的方法分析每年最高溫及最低溫的時間序列,檢測出年低溫最顯著的改變點在Hansen作證之後3年的1991年,而年高溫的改變點還要更後,在1998年。這與筆者個人體驗大致相符。

台北氣溫變化趨勢的「改變點」

「改變點」的檢測是時間序列分析的統計方法,它用來判定時間序列的資料產生過程,是否有不連續點的存在。它在1930年代就曾被產業界用來監控產品的製造過程,其後經過數學家的深入研究,在近20年來蓬勃發展,廣泛被應用於環保、疫情、醫療、軍事、反恐等各領域。

筆者個人就曾用類似的研究方法,發現美國歷史上選民的投票行為,在20世紀20~30年代之間,曾經發生過質性的變化。去(2020)年5月,頂級學術期刊《Science》也有研究論文檢測新冠肺炎在德國傳播趨勢的改變點,肯定了政府干預措施的有效性。CBS電視影集《數字》(Numb3rs)甚至有一集,演出「夢幻棒球」玩家用改變點方法,檢測大聯盟球員使用禁藥提高打擊率的故事。

台灣的氣溫紀錄也始於19世紀末。根據Jasmine Kuo提供的台北市年低溫歷史資料,台北市每年最低溫的改變點在1975年,而年高溫的改變點則要到2001年。台北市年低溫的改變比奧斯汀要早,這也許跟地形、地理位置、人口以及工業化程度有關。

理論上,年高溫及年低溫都不是常態分布,而是呈現所謂極端值分布(extreme value distribution)。圖一及圖二以上述改變點為斷點,分別估計年高溫及年低溫在各自改變點前、後的極端值分布。這兩張圖讓我們清楚看出改變點前後的明顯差異:改變點之後,年高溫及年低溫的分布均明顯往高溫方向移動。年高溫在2001之後的平均值增加了攝氏1.44度,而年低溫在1975之後的平均值則更誇張地增加了將近兩倍的2.81度!

1
Phote Credit: 林澤民
2
Phote Credit: 林澤民

時間序列資料產生過程的變化,除了可以用改變點的統計方法來檢測斷點以外,也可以用「紀錄」(record)發生的機率理論來分析異常現象。事實上,事件發生頻率的改變也是改變點研究的數學方法之一。本文以下即以紀錄理論,進一步探討台北市年低溫在1975年之後新紀錄節節升高的現象。

破紀錄次數的機率分布

台北市1897~2020年低溫時間序列顯示,1897年台北市的最低溫是攝氏5度。以此為資料中的第一個紀錄,124年來,有9個新的紀錄出現,分別是:1899(7.2度)、1905(7.6度)、1909(8.1度)、1912(8.2度)、1976(8.5度)、1983(9.3度)、1988(10度)、2017(10.4度),以及2019(11.6度)。(見圖三時間序列中的黑點)

3
Phote Credit: 林澤民

124年間有10個紀錄是正常現象嗎?這個問題,可以用機率理論做精確的回答。

機率理論對「記錄」的研究有很完整的系統。其數學繁複,但相當有趣,有興趣的讀者可以找相關書籍來看,例如Jiri Andel(2001)的《Mathematics of Chance》。

這個理論從一個前提出發:觀察序列中的資料是遵循相同機率分布,而且相互獨立(iid)的隨機變數。在這個假設之下,我們可以導出在n個資料點中有r個紀錄(包括第一個資料點)的機率分布。

這個前提可以說是「正常」狀況的「虛無假設」:它代表觀察序列中資料的產生過程完全相同,沒有任何異常現象或動態趨勢。如果我們的經驗資料與這個假設之下的機率分布不相諧,根據傳統次數主義(frequentist)統計推論的方法,我們可以在一定的統計水平之下拒絕虛無假設,而判定異常現象的存在。

以台北市年低溫的歷史資料來說,我們可以算出在n=124個觀察值的序列資料中,出現r(r=1,2,3,…,124)個紀錄的機率分布,然後從這分布算出r大於或等於10的右尾機率。如果這個機率小於約定成俗的顯著水平0.05,我們判定歷史資料與虛無假設不相諧,從而排除台北市年低溫變遷沒有異常現象的前提。依照傳統統計推論,我們可以做出「台北市年低溫變遷有異常現象」的結論。

以Rn代表在iid假設之下,n=124個序列資料中有r個紀錄的隨機變數,圖四便是Rn=r的機率分布。從這個機率分布我們可以算得Rn的期望值是E(Rn)=5.40,變異量是Var(Rn)=3.76,也很容易直接算得右尾機率P(Rn≥10)=0.025。因為這個機率小於0.05,單尾檢定讓我們得到台北市年低溫屢破歷史上限紀錄,是異常現象的結論。(如果一定要用雙尾檢定,這個結論就有點勉強)

32
Phote Credit: 林澤民