什麼是「抽樣誤差」?為何外國媒體報導的跟老師教的不一樣?

什麼是「抽樣誤差」?為何外國媒體報導的跟老師教的不一樣?
Photo Credit: Reuters / 達志影像

我們想讓你知道的是

華郵、ABC在描述其民調方法時特別強調其抽樣誤差是在「納入設計效應」(including design effects)之後計算所得。什麼是「設計效應」?

美國總統大選進入最後一周時,許多媒體紛紛在搖擺州進行民調,其中佛羅里達是選情極其緊繃的大州。華盛頓郵報》、ABC》於10月24日~10月29日在該州民調的結果顯示:在824位可能投票的選民中,川普領先拜登50~48個百分點,因為抽樣誤差為±4.0%,報導結論佛州選情難分難解。

《紐約時報》於10月27日~10月31日在該州民調的結果則顯示:在1451位可能投票的選民中,拜登領先川普47~44個百分點,其抽樣誤差為±3.2%。兩個民調相隔只2~3天,拜登從落後2個百分點轉為領先3個百分點,這領先程度有統計顯著性嗎?(佛州開票96%的結果:川普51.2%,拜登47.8%。)

這裡有兩個相關問題要先解決:

  • 第一、樣本數N=1451為何抽樣誤差是±3.2%?這個數字對嗎?一般民調若樣本數在N=1000左右,抽樣誤差不是大約±3%嗎?為何紐時的樣本數高達N=1451,抽樣誤差不是更低反而更高?
  • 第二、如果抽樣誤差低於±3%,那拜登在佛州領先川普超過抽樣誤差,便可以說這差距有統計顯著性嗎?
f_26032412_1
Photo Credit: MailOnline

什麼是「抽樣誤差」?

首先解釋第一個問題。所謂「抽樣誤差」(margin of error)指的是當母體比例為π時,重複抽取許多樣本所得樣本比例P的標準差乘以1.96。更詳細地說:當母體比例為π時,重複抽取許多樣本數為N的樣本會得到許多不同的P值,這些P值的分佈稱作P的「抽樣分佈」(sampling distribution)。

根據中央極限定裡,P的抽樣分佈是以π為中心的常態分佈,其變異量是π(1-π)/N。我們若以π為中心取一個區間(π-m, π+m)讓P落在區間內的機率為95%,則代表此區間寬度的m即為95%信心水平之下的抽樣誤差,其公式為:

f_26032415_1
圖片來源:林澤民

雖然這個公式可以適用於任何的π值,在沒有特別資訊的情況下,一般以π=0.5來計算MOE。

舉例來說,《聯合報》在2019年12月12日~14日實施了一個民調,它在報導中特別就調查方法報告如下:

「調查於12月12日至14日晚間進行,成功訪問1110位合格選民,另291人拒訪;在95%信心水準下,抽樣誤差正負3.0個百分點以內。採全國住宅及手機雙電話底冊為母體作尾數隨機抽樣,藉由增補市話無法接觸的唯手機族樣本改善傳統市話抽樣缺點,調查結果依廿歲以上性別、年齡及縣市人口結構加權,調查經費來自聯合報社。」

同樣的,《蘋果日報》在報導其於2019年12月27日~29日實施的民調時也提到:

「本次民調由《蘋果新聞網》委託台灣指標公司執行,經費來源是《蘋果新聞網》,調查對象為設籍在全國22縣市且年滿20歲民眾,調查期間為12月27日至29日,採用市內電話抽樣調查,並使用CATI系統進行訪問。市內電話抽樣依縣市採分層比例隨機抽樣法,再以電話號碼後2碼隨機抽出,成功訪問1069位受訪者,在95%信心水準下,抽樣誤差為±3.0%。」

依上述公式分別代入N=1110及N=1069可得MOE=2.94%、3.00%,正是報導所說的「抽樣誤差正負三點零個百分點以內」、「抽樣誤差為±3.0%」。

紐時在佛州的選前最後民調的樣本數N=1451要高出1110甚多,為何它所報告的抽樣誤差反而較大?我們若把N=1451套入上式,不是應該得到MOE=2.57%嗎?為何紐時說是3.2%?

其實不只紐時,華郵、ABC民調的抽樣誤差4.0%也超過了以N=824套入上式所算得的3.41%。為何美國媒體計算民調抽樣誤差與基本統計學教科書所教的算法不一樣?華郵、ABC在描述其民調方法時特別強調其抽樣誤差是在「納入設計效應」(including design effects)之後計算所得。什麼是「設計效應」?

什麼是「設計效應」?

這個問題牽涉到「有效樣本數」(effective sample size)的概念。所謂「有效樣本數」並不是統計分析中除去遺漏值之後的「有效N」(valid N),而是在調整受訪者代表性之後的「加權樣本數」(weighted sample size)。下面我會說明:紐時所報告的抽樣誤差其實是根據「有效樣本數」調整過的抽樣誤差,也就是納入設計效應之後算得的抽樣誤差。

一般民調樣本因為不是使用「簡單隨機抽樣」(simple random sampling)得到的結果,母體中每人被抽到的機率並不一致。因此,樣本中某些族群的代表性並不能反映它們在母體中的代表性。為了讓各族群在樣本中的代表性和母體一致,樣本必須經過加權處理。

上述《聯合報》和《蘋果日報》的報導,便報告了它們民調的抽樣設計和加權的概略步驟。一般民調機構會把加權所使用的權重存為資料中的一個變數,其數值代表樣本中每個受訪者所代表族群的權重。

例如「台灣選舉與民主化研究」2020年民調資料合併檔(TEDS2020)中,便有這樣的一個權值變數w,它的值介於0.295至3.474之間,其變異範圍反映了各族群在原樣本中的代表性,與它們在母體中的代表性差異的程度。

由於加權的關係,原來的樣本數已不能有效反映加權後的樣本數,因此有所謂「有效樣本數」(effective sample size)的概念,有效樣本數的計算方式因加權方式而異,抽樣理論大師Leslie Kish建議了一個粗略的算法:

2
圖片來源:林澤民

除非根本沒有加權,否則這個公式一定小於N,也就是加權後的有效樣本數會比原樣本數小。以TEDS2020原樣本數N=2847為例,ESS=2359,也就是加權後的有效樣本數,只有原樣本數的83%。

我們如果以加權後的有效樣本數來計算抽樣誤差,則調整後的抽樣誤差,會比根據原樣本數算出的抽樣誤差還大。這個差異,可以說是因為實際樣本之抽樣設計背離簡單隨機抽樣而造成的結果,我們定義「設計效應」(design effect)為:

1
圖片來源:林澤民

由於抽樣誤差之平方與樣本數成反比,上式也可導出:

1
圖片來源:林澤民

再以TEDS2020為例,DE=1/0.83=1.21。換算可以得到加權後的抽樣誤差,是原抽樣誤差的1.1倍。

跟據紐時所報告的加權後的抽樣誤差,以及由原樣本數所算出的簡單隨機抽樣之抽樣誤差,我們可以算出佛州民調的設計效應:

f_26032427_1
圖片來源:林澤民

這設計效應比TEDS2020要高出很多!這可能是因為TEDS採用分層隨機抽樣面訪,其設計比起新聞媒體採用電話+手機有所不同。有了設計效應的估計值,我們就可以算紐時佛州民調的有效樣本數了:它的ESS=936,只有原樣本數的三分之二。相對而言,華郵、ABC的佛州民調的設計效應是DE=1.37,其有效樣本數是ESS=600.


猜你喜歡


AWS台灣雲端高峰會8月10日登場:實體活動盛大回歸,技術開發到產業趨勢兩日全掌握

AWS台灣雲端高峰會8月10日登場:實體活動盛大回歸,技術開發到產業趨勢兩日全掌握
photo credit:AWS

我們想讓你知道的是

2022AWS台灣雲端高峰會將於8月10日在台北南港展覽二館盛大登場,聚焦雲端9大主題、超過45場產業與技術專題演講,為開發者與經理人提供深度交流機會,任何與雲端有所接觸的工作者都不容錯過。

AWS公開年度雲端技術盛會──2022 AWS台灣雲端高峰會(AWS Summit Taiwan)即將在8月10日至8月11日於台北南港展覽館二館舉行!歷經新冠疫情紛擾,睽違兩年AWS台灣雲端高峰會即將重回實體舉行,讓每位參與者走入規劃豐富的實體專區與各路開發者深度共學。立即報名點此

今年主題「佈雲今日 ‧ 決勝未來」明顯表達數位轉型已是現在進行式。隨著新冠疫情及國際局勢改變的雙重影響,全球迎來的新常態經濟模式使雲端技術不再只是企業應變關鍵,更是走向安全、永續,以及鏈結未來的必經之途。因此,2022AWS台灣雲端高峰會中將展示當代最前瞻的雲端趨勢,帶領參與者運用現代化雲端洞悉市場數據,探索商業與技術的無限可能。

聚焦九大雲端主題:基礎設施、技術開發、數位轉型到產業實務面面俱到

9大雲端主題02
photo credit:AWS

今年AWS台灣雲端高峰會不只集結領域中傑出的AWS技術專家、產業代表以及社群領袖,舉辦超過45場的產業及技術專題演講,分享最佳實踐案例、Demo 實機展演和客戶案例分析,還規劃包含證照認證、實作演練、CISO實戰工作坊等與AWS相關課程及工作坊。除此之外,會場也設置「AWS Game day & Developer Lounge」與「新創焦點」兩大專區,讓會眾能在精心規劃的空間內與其他開發者、新創公司透過高度互動的競賽與短講,深度交流彼此技術與經驗。

立即報名:2022 AWS台灣雲端高峰會

2022年,AWS台灣雲端高峰會致力打造深度交流的產業平台,聚焦雲端技術的九大面向,搭配各具特色的活動設計,從基礎設施、技術開發、數位轉型到產業實務面面俱到。不僅為 C-level 與資深技術人員、企業經營與 IT 決策與管理者精心規劃議題內容,也在特別企劃內容中,為 IT Pro、解決方案架構師、開發人員、工程師與維運管理人員提供最佳實務經驗,讓無論AWS初學使用者還是資深產業經理人,都能在高峰會中吸收新知、了解趨勢,提升自我能力與視野。

無分初學大師,只要接觸雲端,你就應該參加AWS台灣雲端高峰會

符合以下關鍵字之一,你就應該參與AWS台灣雲端高峰會:

  • 學無止盡-開發者、工程師、架構師
  • 商業創新開發-新創團隊技術團隊成員
  • 最佳化生產力- IT專業人員、技術支援經理
  • 掌握趨勢-創辦人、經營決策者
  • 自我精進-學生、教職員、研究員
  • 洞見趨勢-任何關注雲端趨勢者

AWS台灣雲端高峰會首日聚焦雲端服務、開發技術及新創,以技術相關內容為主,較適合具備初級主題知識之開發人員、工程師與 IT 專業人員;次日則圍繞產業解決方案提供、數位轉型等,以應用相關內容為主,較適合欲了解雲端技術如何為企業經營加分之經營決策者、解決方案架構師以及系統管理員。

立即報名:2022 AWS台灣雲端高峰會

如此縝密的規劃,無論是初上雲端的新手,還是乘雲縱橫產業多年的技術大師,甚至是非技術相關人士,都能在高峰會中依照自身工作職掌和興趣,安排個人化的專屬議程,從不同主題和技術能力演講中,滿足個人技術或視野的成長。

最重要的是,2022AWS雲端高峰會為免費參加,絕對是任何需要開拓雲端新經濟、自我加值的工作者不可錯過的年度盛會。

玩轉雲端核心技術!AWS DeepRacer人工智慧賽車同步登場

AWSDR
photo credit:AWS

每年與台灣雲端高峰會共同舉行的「AWS DeepRacer智慧自駕車競賽」當然也不會缺席。AWS DeepRacer是 Amazon 產品背後所運用之人工智慧和機器學習等核心技術的具體化身,不僅是全球首個以自駕車競賽為主題賽車聯盟,也是機器學習(ML)與強化學習(RL)最友善、有趣、刺激的學習課程。

競賽設計不只替雲端技術增添不少趣味,激起各方開發者爭奪獎品、獲取冠軍榮耀的鬥志,搭配AWS所提供的免費入門課程及學習資源,更創造出技術學習與推廣的友善環境,也是AWS送給所有工程師最棒的寓教於樂場域。

精彩豐富的專題講座與寓教於樂的刺激競賽還不夠嗎?活動現場還有抽獎活動、深度參會集點以及問卷好禮,提早報到者再加碼早鳥禮!

立即報名豐富有趣的 2022 AWS 台灣雲端高峰會!


猜你喜歡