地理學「空間分析」的興起與發展:為何與流行病學有關?在現代又有哪些應用?

我們想讓你知道的是
除了能探查疫情熱點外,空間分析跟商店選址也很有關。你家附近的超商或超市,是怎麼決定開店地址的?
文:游博翔
炎熱的夏天又到了,而台灣的夏季也同時是登革熱發生的高峰期,過往關於登革熱爆發的新聞層出不窮,從中央到地方都為了防疫工作而焦頭爛額,但你是否曾感到疑惑,當傳染病爆發時,那些防疫專家們到底如何判斷疫情的熱區?又要怎麼合理的安排防疫工作,才能夠最有效率的阻止疫情持續擴散呢?也許大部分人優先想到的可能都是與醫學、生物學或環境工程相關的手段,但各位也許不知道,地理學中的「空間分析(Spatial Analysis)」也在流行病學史上有著舉足輕重的地位。
那到底什麼是空間分析?廣義而言,它指的是透過空間資料來運算,試圖找出各種事件在地理空間上有何種關聯性的一門科學,那為何會說他與流行病學有關?它的興起與發展對我們生活造成了什麼影響?在現代又有什麼樣的應用呢?
空間分析的興起:John Snow的倫敦霍亂分析
1854年的倫敦,各地接連爆發了零星的霍亂疫情,其中最嚴重者莫過於倫敦蘇活區(Soho)的寬街霍亂爆發事件(Broad Street cholera outbreak),從8月31號的夜晚開始,在短短三天內,寬街周圍的居民里就有127人死亡,接下來不到一周的時間裡附近四分之三的居民棄家逃離,商店關門,行人絕跡,附近所有居民都籠罩在死亡的恐懼之中。
在這場霍亂爆發時,關於霍亂的醫學研究已經相當的多,大致可以確定霍亂的症狀和死亡率,但對於霍亂的傳播途徑究竟為何,這些醫學專家們莫衷一是,在那個細菌還未被人們發現的年代,最受到推崇的理論是「瘴氣論」,認為霍亂是骯髒環境中生成的瘴氣,體質虛弱、道德敗壞的人們容易受其影響;另一小群的醫生們則主張,霍亂是透過其他尚未發現的物質,在人群中傳播造成的疾病。
內科醫生斯諾(John Snow,不是King of The North那位)便是那些少數的另類主張者之一,他早在幾年前就懷疑,霍亂是透過「水」來傳播的,受感染的人們是因為飲用了受汙染的水而染上霍亂,但當時醫界並未採信他的說法,斯諾於是著手運用統計學的方法在倫敦南部進行調查。但就在此時,在他診所幾個街區外的寬街爆發了霍亂,斯諾醫生立刻趕了回去,設法取得了附近的死亡人數和死因統計數據,並將其繪製在地圖上。他將寬街的公共水泵標註出來,並且以粗黑線標示感染者的住家位置,再透過數學上的沃羅諾伊圖與步行測試,將「步行到寬街水泵而非其他水泵最近的區域」圈出來,顯示這個範圍內的人們通常都是到寬街水泵打水,如此也證明了寬街霍亂是以這個水泵為中心,透過「飲用受汙染的水」而傳播的。這個事實在地圖上可說是一目瞭然。
斯諾醫生在商討如何抑止這場霍亂的理事會上,將這份地圖連同調查報告一同提出,當時的理事會成員在聽取了斯諾的發言後,下令拆除了寬街水泵的把手,這個舉動「堪稱是流行病學史上傳奇性的一幕」,人們第一次在與霍亂的戰鬥中,以科學為基礎,做出了明智的干預措施。而拆除了把手讓人們不再從寬街水泵取水後,霍亂也就此平息了下來。
在這個歷史性的時刻中,扮演著重要角色的這張霍亂地圖,便是最早也最廣為人知的空間分析應用實例,水泵的位置、感染者住家的位置,都是蒐集而來的空間資訊,透過地圖的呈現,再加上以數學方法圈出使用寬街水泵的家戶範圍,這整個過程都彰顯了空間分析的核心精神,也就是將「空間關係」視作分析的核心,並透過統計方法與數學模型,判斷不同事件如何在地理分布上具有關聯性。

現代空間分析的發展
空間分析在此後的流行病學、生物學、人口學等等領域都有重要的地位,在地理學1970年的計量革命後,除傳統自然/人文地理的架構外,地理學又多了以「空間資訊科學」為主軸的計量地理學發展路線。不過,當空間分析的尺度從幾個街區,擴大到一座城市、一個國家甚至全球時,幾乎不可能靠著手繪地圖的方式來進行。在電腦科學的快速發展後,空間資訊能夠被電腦紀錄、儲存與運算,才使得空間分析在大尺度的應用變為可能,空間資訊科學也迎來最為重要的3S的發展,分別是──GIS(地理資訊系統)、GPS(全球定位系統)、RS(遙測)三項重要技術。
這些技術對於目前地理資訊科學的發展有多重要?一般人或許很難想像,光是將最基本的空間位置資訊記錄下來,就是一項大工程了。過去的地圖學者們多半仰賴實地走訪測繪,費盡力氣才能夠產製出一張地圖,而為了繪製出全球地圖,除了深入各地進行測繪外,地圖學者們也發明出一系列的投影方法,讓3D的地球表面能夠被記錄在2D的平面上,到了二十世紀,則利用飛機拍攝航照圖,來增進大尺度地圖的準確度。但是,哪怕地圖的精確度有所提升,能夠記錄的依然是基礎的地理資訊,要想作為進行空間分析的工具,就必須一片片地在透明圖層上繪製所需的資訊,並進行人工疊加,不僅耗時而且效率極低,也難以進行精密的數學計算。
為了解決地圖測繪需要耗費龐大資源、又無法有效進行查詢與分析的問題,加拿大地理學者湯姆林森(Roger Tomlinson)在協助加拿大政府進行土地利用調查時,便著手開發了地理資訊系統,將空間屬性(如一個區域內的土地利用方式)與幾何性質(區域的範圍、位置),利用編碼記錄下來,這樣一來,每個圖徵內都能夠連結到特定的資料值,並且能夠任意地疊加與修改,如此一來變大大節省了製圖的時間,也讓空間數據的分析計算變得更為簡易,湯姆林森博士也因為這個創舉而被稱為「GIS之父」。
Tags:
雷亞遊戲作品下載破億的秘密,聯手Google Cloud開源又節流

我們想讓你知道的是
2011 年創立的雷亞遊戲(Rayark Inc.),從 2013 年就攜手 Google Cloud 導入相關雲端服務,雙方合作長達十年的關鍵是什麼?
2011年創立的雷亞遊戲(Rayark Inc.),秉持把感動永久留存在玩家心中的信念與堅持,不論是音樂節奏、休閒趣味、科幻動作、又或是策略RPG不同型態的作品,都希望創造出呈現時代回憶的經典製作。每回推出新款遊戲都能叫好又叫座,雷亞遊戲旗下作品的總下載數,全球上看1.3億次。
「我們的優勢,在於故事的呈現及藝術表現,創造出一個讓玩家與故事有聯結的世界觀,」雷亞遊戲技術長Alvin Chung回應。為了精進作品內涵、拓展遊戲更多可能性,雷亞遊戲從2013年就開始積極將開發架構、維運流程搬遷到雲端環境,進而讓團隊養成敏捷的協作文化。

Alvin Chung解釋,「我們希望把更多心力投入設計遊戲本身,同時優化玩家體驗服務,而不是過度分心或花太多資源去顧及底層網路架構,透過雲端工具源創造更大的效益。」若把一款遊戲從無到有,可拆分為企劃、開發、測試、上線等流程,這些不同階段的工作環境,雷亞目前是放在Google Cloud平台上運行。
完善數據治理工程,雷亞遊戲成立數據部門洞悉營運實況
一款遊戲要讓玩家感動,絕對不能只有感性要素,更需要從理性角度洞察玩家行為數據,才能讓用戶的留存保持穩定。尤其現代企業都知道,數據對於公司經營等同石油的價值,於是,雷亞決定成立數據部門,作為輔佐商業決策判斷的後勤核心團隊。
雷亞遊戲產品發行處數據分析部部長Denny Huang表示,「以前只用database,資料的細緻度不夠;打個比方,透過database只能看存摺的結餘,無法回溯歷程資訊;後來成立數據部門,把伺服器的log收進資料倉儲Google BigQuery,等於帳本的每筆明細都會留下記錄,再結合商業智慧與分析軟體Tableau,讓DAU(日活躍用戶)、MAU(月活躍用戶數)、留存率、付費率這些指標以視覺化圖表完整呈現。」

為了貼近玩家的需求、打造出更符合市場想法的作品,雷亞的營運團隊也希望藉由數據深入鞏固與玩家的黏著度,進而排除不利玩家留存的情境,就能事先透過BigQuery搭配Firebase實現A/B Testing。Alvin Chung舉例,遊戲業相當重視玩家前10分鐘的留存率,如果發現新手歷程在某一區卡關過久,他們就會調閱BigQuery內的玩家行為資料,找出用戶成長停滯的原因,進而修正遊戲的設計機制。透藉由此檢視及驗證方法,促使玩家加入遊戲的前10分鐘留存率提升50%。
盤點目前雷亞數據部門使用BigQuery的數據狀況,每天處理報表容量達9TB、單日300G流量,以及儲存操作紀錄超過300TB。如此龐大的資料量,雷亞也透過BigQuery搭配Tableau,落實更細緻的商業邏輯判斷。
Denny Huang分享其中一個情境:他們想知道玩家在特定戰場,怎麼運用卡牌的排列組合,這時候就能借助BigQuery及機器學習的運算,掌握某個關卡的通關率是否落在合理範圍。後續透過數據分析,找到禮包購買率的最佳時機點,並微調設定禮包內容物,以強化玩家購買誘因,讓特定產品付費率增加17%、 單一活動營收增加16%。
把關伺服器預算有效節流,借助BigQuery從每月縮短到每日掌握報表
如果說提升禮包購買率、留存時間拉長,對於遊戲開發商是「開源」策略,那麼透過Google Cloud來檢視整體服務的運作效率,則屬於「節流」手段。雷亞遊戲就提到,他們所部署的伺服器牽涉相當龐大的機器種類,內容涵蓋資料倉儲單元、資料庫單元、以及運算單元,運行過程勢必就會有所花費,這也是遊戲商的成本之一。
雷亞遊戲網站可靠性工程(SRE)工程師Gene Liu表示,「洞察伺服器維運數據,可以知道我們的後端服務是否有效率?服務品質如何?又或是有沒有讓玩家收到錯誤訊息狀況?透過監控整體後端服務的健康程度以及資源用量,讓我們知道研發資源需優先最佳化哪些項目。」
從上述情境可觀察到,SRE的主要工作就是要確保確保遊戲對內和對外服務的穩定,並且維持一定品質的玩家遊玩體驗。以對內服務來說,遊戲伺服器傳數據給BigQuery的過程,不但要保持通暢,而且也盡可能不會掉失任何資料。不過也因為遊戲玩家來自全球不同時區,等於系統的流量高低峰是24小時在變動;甚至若有特殊行銷檔期,玩家在同一時間大量湧入領獎勵,SRE團隊就要花更多時間在監測伺服器的運作狀態。

Gene Liu對此提到,「我們的後端服務部署於Google Kubernetes Engine之上,後端服務向BigQuery寫入資料是透過Pub/Sub,而Pub/Sub與BigQuery都是全代管的服務,可以大幅度减輕我們的工作負擔,不用手動擴展或縮減設定雲端服務所使用的資源,跟以前的維運工具相比,現在的管理模式可以節省非常多時間。」
另一方面,Gene Liu接著說,雷亞也在雲端環境架設資料視覺化網路應用程式平台Grafana,Grafana可以在網路瀏覽器內顯示資料圖表,並提供警告功能。因此一旦監測到數據峰值異常,就能立刻行動來最佳化産品的效能,或是有效排除伺服器原本不應浪費的成本。
「現在雲端服務的費用以raw data傳到BigQuery後,能透過Grafana即時檢視哪個專案的伺服器以及流量花多少錢,或發現花費異常時候,可以找到是哪個專案開的運算資源。以前要每個月收到帳單才知道費用,現在則是可以即時得知系統數據,並在數小時內掌握各項雲端服務的費用。」Gene Liu補充道。
期待以敏捷方式迭代產品,提供玩家即時又彈性服務
雷亞與Google Cloud的合作,除了上述相關應用,其他還包含Cloud Load Balancing、Compute Engine、Dataflow、Cloud Monitoring、Cloud Logging以及Google Workspace等解決方案,在其他業務及跨部門協作過程有廣泛運用。

Alvin Chung最後回應,「我們多年來觀察Google Cloud持續發布新功能,讓雷亞在做數據分析、維運上更穩定,也希望借力於雲端讓我們越來越省心,專注在遊戲的開發或加速迭代新的産品,更即時觀察市場的回應,進而縮短time to market的腳步。」
由此可見,雷亞遊戲在實現打造具時代回憶的偉大作品之際,藝術也要融合技術,除了讓玩家在遊戲過程感到幸福,同時也基於雲端應用,提供玩家快速又彈性的滿意服務。