讀新聞時必須留意的統計常識

讀新聞時必須留意的統計常識
Image Credit: ImageZoo / Corbis / 達志影像

我們想讓你知道的是

有說謊言有三種︰謊言、該死的謊言及統計(lies, damned lies and statistics),操縱數據之所以比「該死的謊言」惡劣,是因為以數字偽裝客觀更容易欺騙別人。現時不少新聞都跟統計有關,例如一些官方數字、民意調查及科學研究等,稍一不慎便可能被騙。

有說謊言有三種︰謊言、該死的謊言及統計(lies, damned lies and statistics),操縱數據之所以比「該死的謊言」惡劣,是因為以數字偽裝客觀更容易欺騙別人。現時不少新聞都跟統計有關,例如一些官方數字、民意調查及科學研究等,稍一不慎便可能被騙。

以下是身為一個編輯,在過去幾個月寫及讀新聞時留意到的三項重點,這些注意事項其實非常簡單,卻容易忽略。

1. 先問清楚數字

當科學家討論風險、可能性時,會使用數據分析,就算沒有確實數字,至少也要知道誤差有多少。不少報導「致癌物」的新聞基本上就是不問風險來引起恐懼(可以轉化成點擊),例如約半年前「世衛把加工肉品列入致癌物」的新聞,就是這一類。

那其實是指隸屬世衛的「國際癌症研究機構」(International Agency for Research on Cancer, IARC),把加工肉品列入其致癌物分類的第1類別,但這個分類的原意,是判斷科學界目前有多少證據去確認其致癌,跟致癌風險高低無關。

不過很多媒體自然忽略了這一點,只會說「加工肉品致癌」,而絕口不提到底患癌風險增加了多少。事實上我們不能簡單把東西分成「致癌」及「不致癌」(甚至「防癌」),必須提及劑量和風險,討論才有意義。

其實鹹魚也致癌? 分享「漢堡香腸列致癌物」的新聞前 你需要知道的事

例如你一生人只吃一次加工肉品,跟每天都吃五條香腸,患癌風險已經有別。更何況醫學界只能盡量找出增加患癌風險的因素,但癌症本來就涉及多項因素,包括環境、基因、生活習慣等,難以一概而論,我們只能夠在可做的範圍內盡量降低風險。

2. 絕對與相對數字

體育課打籃球,小明進5個三分球,小欣則進了4個;但前者射了10球,後者射了6球。兩人的入球數字是絕對數字,也就是有單位的數字(多少個三分球);而他們的命中率(分別是50%及約66.7%)則是相對數字,需要把入球數除以射球數才得出,亦不帶任何單位。

處理不同的問題,需要用不同類型的數字,假如我們想知道誰射球比較準,單看進球數字根本看不出來。這一點看起來非常簡單,不過實際應用時,可能很多人都忽略了。

早前新北市公佈離婚星座排行榜,正是使用不同星座的離婚數字——是個絕對數字——來排序,然而單看這個排行榜我們無法得悉排名較前的星座是否更易離婚,因為這需要參考離婚率——是個相對數字。

天蠍、天秤、處女座易離婚?新北市離婚統計的問題

不幸的是各大媒體都找「星座專家」去評論,下次不妨找個統計學家?

3. 跟整體比較才有意義

設想班上考試最高分的頭三位同學都戴眼鏡,我們能否推論「戴眼鏡跟考高分有關」?當然不可以,也許根本全班同學戴眼鏡的佔多數,那麼最高分的同學都戴眼鏡就沒有甚麼稀奇了。要研究兩者之間的關係,得比較戴眼鏡和不戴眼鏡兩組同學的分數如何分佈、是否有顯著差異等。由於現實世界非常複雜,在比較兩件事情是否相關之前,我們應先排除其他可能干擾結果的因素。

不少聲稱是疫苗的後遺症,通常是指接種疫苗後出現的症狀(這類通報機制對監察疫苗非常重要,只是不應曲解其作用)。人類不時誤把先後次序當成因果關係,但要確認兩者有關,我們應該要比較整體的發病率。

針對常見的「MMR疫苗導致自閉症」謠言,多項大型研究比較了接種疫苗與沒接種者的自閉症比率,當中未有找到統計上的差異,假如兩者真的有關,這是極不可能發生的事。因此,恰當的推論是︰兩者根本無關。

早前有12名日本女子聲稱接種HPV疫苗後出現後遺症,打算於6月控告日本政府及製造疫苗的藥廠。不少媒體報導均立即稱為「後遺症」,然而這類宣稱根本未經證實,亦有研究已經否定了某些聲稱的後遺症跟疫苗之關係。

稱接種疫苗後出現症狀 日本12女子控政府藥廠 默沙東︰根本沒有依據

再者,跟338萬名已接種的學生比較,報稱接種後出現健康問題的人數有2584人,佔總數佔總數約0.076%,有持續症狀者只有0.0055%的186人。雖然這個數字不代表症狀跟疫苗無關,當局應該要詳細了解有關症狀及發病率,才能作出合理判斷,但不足0.01%的比例說成是疫苗安全有問題,更像是未有證據下過份渲染。

核稿編輯:林佳賢


猜你喜歡


挖掘雲端開放架構優勢!Amazon EKS高可用性叢集快速部署容器

挖掘雲端開放架構優勢!Amazon EKS高可用性叢集快速部署容器

我們想讓你知道的是

企業如何在 Amazon EKS(Elastic Kubernetes Services)上使用 GitLab 創建自動化部署,減輕人力負擔,提升專案服務運作效率?

所謂現代化智慧 IT,所有工程師最希望的境界,莫過於只要輕鬆點幾下設定,系統就會自動跑起來,管理者再也不用隨時待命在機台旁邊,從此工作悠哉又快樂!儘管這樣情境還沒到來,但隨著敏捷式開發的流行,除了 DevOps 人員,有越來越多開發者將 CI/CD 概念融入到工作流程當中,例如從 build code、執行 unit test、到部署應用程式。

透過 AWS 增加雲端技能 在組織發揮影響力

上述種種反覆步驟自動化執行,也就能提昇服務品質、主動通知開發人員以減輕人力負擔,讓專案服務能持續運作。

其中,GitLab 是執行 CI/CD 常用的工具之一,也是開發者使用程式碼儲存庫的地方。為了讓 GitLab Runner 在雲端快速實踐 CI/CD,《AWS 開發者系列》透過影片分享,如何在 Amazon EKS(Elastic Kubernetes Services)上使用 GitLab 創建自動化部署。

以下節錄工作坊影音內容,幫助開發者快速理解如何運用 Amazon EKS 的高可用性且安全的叢集,將修補、部署節點、更新等關鍵任務,全部做到自動化設定。同時影片也會示範 Amazon EKS 搭配 GitLab 如何展開自動部署,幫助工程團隊實踐 CI/CD 價值。

Amazon EKS 對容器管理輕鬆簡單、維運省時省力

容器化服務越來越興盛,當容器(Container)越來越多,在複雜的微服務(Microservice)系統環境之下,運維團隊的管理成本可能相對會增加不少,為了有效調度容器部署, 導入Kubernetes 無疑是近年企業熱門的話題之一。

建構 Kubernetes Cluster 流主要可區分兩大塊,一是安排容器調度的Control Plane、另一則是容器運行時需要用到的 Worker Node。

Control Plane 裡面涵蓋有儲存狀態的 ETCD、CoController manager 、Scheduler 的調度管理、甚至是操作時進行互動的 APIServer,若是自己創建 的 Kubernetes Cluster ,需要自己安裝這些元件,後續仍需要對 Control Plane 進行相關管理、維護、升級工作。為了減少上述 Components 的繁複維護,在透過 AWS EKS 代管的 Kubernete Control Plane 部可以獲得以下三大好處。

Amazon EKS 一鍵式部署,展現三大優勢

第一,Amazon EKS代管的 Control Plane實踐了跨AZ的高可用部署,使用者不需要擔心單一節點故障的風險。

第二,Amazon EKS 支持至少四個 Kubernetes版本,持續跟進每季 CNCF 的發佈,同時 EKS 也完全符合上游 CNCF 規範。

第三,部署 Amazon EKS 之後,可直接使用 AWS 平台上現成的服務工具,在安全性管理、網路設定方面,可以做到無縫整合。

最後 AWS 台灣解決方案架構師也提到,若想在容器環境進行 CI/CD 及應用程式的管理,可以進一步透過 IaC 整合部署 Amazon EKS 叢集,透過使用 Console、把 EKS 變成 Cloudformation 的模板、使用 AWS 所開發出來的 eksctl.io、或指令是採用 AWS CDK 可以讓開發者用自身熟悉的語言,在 AWS 平台整合 CI/CD 工具進行維運及部署 EKS。

打造第一個在 AWS 上的應用程式

了解 Amazon EKS 整合 GitLab ,獲得三面向價值

對開發者而言,想把 Amazon EKS 整合到 CI/CD 工具之一的 GitLab 平台上,可以看到那些實際的優勢?

在 DevOps 開發者示範工作坊當中,GitLab 資深解決方案架構師指出,GitLab 使用到 Kubernetes 技術,主要有三種搭配方法,包含 GitLab Server、GitLab Runner、以及創建 Deployment Environment。

本次示範教學會主要聚焦在 GitLab Runner 如何採取 Auto-scaled 方式進行 Build、Test、Package Apps;以及在 Deployment Environment 運用 Kubernetes 技術,做到 Auto Deploy、Review App。

正因為 Amazon EKS 能夠在 DevOps 過程提供所需要的彈性計算資源,幫助開發者在 GitLab 平台上面獲得以下三個層次的優勢:

  • 在 GitLab 內建的部署工作流程當中,自動生成整套 CI/CD 最佳實踐腳本。
  • Review App 過程,從 Merge Request 中可直接訪問應用程式 /App 的 UI 介面,並且根據 Git branch 名稱、專案名稱,自動生成 Review App 的 URL,以及在 Merge 前的最後防線進行 Approval 檢查。
  • 加速 CI/CD 流水線,GitLab Runner 運行時候還可藉由 Amazon EKS Cluster 進行 Auto-scaled 的支援。

Amazon EKS 整合 GitLab ,需要兩大流程

影片最後,GitLab 資深解決方案架構師示範如何把 Amazon EKS 整合至 GitLab 執行 Auto Deploy,主要可分為兩大區塊流程,第一部分聚焦在 Amazon EKS cluster 的設置,第二部分則執行 Auto Deploy 設置。

第一塊可拆分為四個階段,首先教學怎麼創建 EC2 節點的 EKS cluster,第二階段示範把 EKS Cluster 連接到開發者的 GitLab Instance、Group 或 Project,下一步則使用 Cluster Management Project Template 創建一個 Cluster Management Project,以及最後一階段透過 Cluster Management Project 自帶的 Helm Chart,安裝在 Cluster 所需要的內建 App。

第二塊執行 Auto Deploy 設置,針對需要部署的 App 創建一個 GitLab Project,接著再把 gitlab-ci.yml 添加到 Project,並從 Web IDE 選擇及導入 Auto Deploy 的 CI 模版,讓 GitLab 自動生成最佳實踐的整套流水線。

幫助開發者更了解 Amazon EKS 整合 GitLab 的 QA 系列

Q:使用 Amazon EKS 之後,如何更有效率或優化資源去配置 Worker Node 的機器數量,以及如何有效空管開發維運的成本?

A:Kubernetes 除了本身有 HPA(Horizontal Pod Autoscaling)可根據使用程度自動調整資源流量,另外也能延伸使用 AWS Auto Scaling 方案,針對可擴展資源去設定自動擴展管理。另外在成本管控,雖然 Amazon EKS 會收取額外管理費用,但可透過 AWS 平台的 Calculato r計算每個 EKS 的價格,你會發現自動化部署及管理的費用,相對工程師人力的成本更加便宜。

Q:越來越多客戶考慮把現有 Application 變成容器部署,大多是爲了加快部署的效率,那麼變成容器模式之後,對 CI/CD 的工作流程有什麽影響嗎?

A:運用容器技術最直接的效果,可以讓應用程式的環境更一致化,例如 testing 環節、stage production,讓容器避開一些差異問題。至於 CD 部分要 delivery 一些 usage 不太一樣的時候,容器會幫忙做配置,所以 CI/CD 對容器的效益是相輔相成的。

Q: 客戶在開發流程漸漸會把 Infrastructure 變成代碼或文檔,是不是可以把程式碼跟現有的應用程式的 CI/CD 流水線整合在一起,達到一套完整的 CI/CD 部署流程?

A:觀察目前市場作法,主要分成兩個階段去做整體部署。如果規模比較小的團隊,會把 Infrastructure 代碼跟 App 代碼分開,在管理上會比較靈活;如果企業規模比較大,會有另外一個 Infrastructure 團隊來控制部署事情,這種情况之下,APP 的項目會生成一個 APP package,主要做到 delivery 這個階段爲止。而 Infrastructure 的項目會指定把需要版本的文檔,部署到他們的 Kubernetes Cluster。

填寫表單 找到適合的快速上雲服務與工具!


猜你喜歡