《智慧新世界》:大數據中的小世界——連結你我的社群網路

《智慧新世界》:大數據中的小世界——連結你我的社群網路
Photo Credit: Shutterstock / 達志影像

我們想讓你知道的是

本書收錄臺大科學教育發展中心「探索基礎科學講座」的演說內容,主題圍繞「人工智慧」,將從機器學習、資料探勘、自然語言處理及電腦視覺重點切入,深入淺出人工智慧的基礎理論、方法、技術與應用,且看人工智慧將如何翻轉我們的社會,帶領我們前往智慧新世界。

文:李政德(成功大學數據科學研究所副教授)

CHAPTER8大數據中的小世界——連結你我的社群網路

(前略)

以人為主的社群網路

  • 使用者標籤預測與分類

李教授團隊所開發的此項應用,即是用已知社群網路中某些人的標籤,預測其他未知標籤者的標籤。如圖8-3,社群網路中有些使用者已確定罹患某疾病(藍色),有些則確定未罹患該疾病(綠色),透過使用者標籤預測與分類,我們能夠預測使用者6號到10號的點(黑色)是否為罹病患者。基本概念是透過擷取社群網路各種使用者特徵,例如朋友擁有各種標籤之分布,佐以機器學習中的「非監督式學習方法」後,即可以精準地判斷出哪些人確定罹患該疾病,如圖右所示,使用者6、7、9被預測為非罹病患者,使用者8與10則為罹病患者。

8-3
Photo Credit: 三民出版
  • 推薦系統

推薦系統最主要的功能,即是預測哪些「互動關係」在未來會發生。例如:Facebook朋友推薦,AI系統可準確預測出,哪些人真的是你的朋友,但你還沒有加他為好友,或者是你未來有機會能和這位朋友互動。其背後的基本想法是讓機器去學習兩位使用者為何會形成朋友關係,機器可能學到他們有許多共同朋友、經常出沒在類似的地點等特徵。

另一項與生活息息相關的例子,正是Netflix電影推薦,AI依據使用者平時觀看影片的歷史紀錄,以資料探勘中的協同過濾(註2)方式,進而預測出使用者未來可能感興趣的影片。又譬如,在網路上購物時,頁面一旁顯示著「推薦購買清單」、「猜你喜歡清單」,系統會根據使用者已購買的物品,統計比對過去購買過相同商品的消費者,又購買了哪些其他商品品項,進行對購買者進行推薦,精確地評估購買這項物品的消費者購買趨勢。

註2:此處協同過濾的應用,是以使用者對觀賞後的影片評價,來判斷及推薦未來可能感興趣的影片。

  • 假新聞偵測

社群媒體中,假新聞流竄的頻率愈趨頻繁,以假亂真、指鹿為馬的事件層出不窮,單單憑藉著人腦判斷假新聞與否,變得愈來愈困難了。例如,曾有一則新聞寫著:「美國科羅拉多州多間麥當勞,設置了大麻吸食區。」我們透過常識判斷,美國部分地區的大麻是合法的,因此這件事情看似很合理,會讓很多人會相信這件事情是真的;然而在公共場所吸食大麻仍然是違法的,因此這則新聞為真實的可能性不高。

根據研究顯示,75%使用者會對假新聞信以為真。李教授團隊所開發的AI系統,可以根據新聞擴散結構、新聞內容與用戶回覆內容來偵測此新聞為假新聞與否。AI辨識到假新聞的線索可能包含:

  1. 較為淺短的社群網路擴散結構。如圖8-4,圖右的擴散結構較為簡短鬆散,意即點與點之間的擴散連結較圖左更為稀少。
  2. 試圖讓人信以為真的用字遣詞。
  3. 使用者對該新聞的情感隨時間的變化,譬如對於假新聞的貼文,在一開始的用戶回覆多為正面支持,後來則轉為負面反駁。
8-4
Photo Credit: 三民出版
  • 病毒式行銷

病毒式行銷指的是公司透過免費試用品或折價券的行銷手法,搭配招募具意見領袖效果的種子用戶,常見如名人或網紅代言,在人際網路中向社群推薦商品,也就是所謂的口碑行銷。此一行銷方式使得商品資訊於社群網路中擴散,最大化讓對該商品感興趣且有意願購買的人,達到促銷商品的目的。李教授團隊讓AI介入病毒式行銷的方式, 是從使用者過去的貼文內容與分享歷程中,學習出每位使用者感興趣的商品主題,進而預測每位用戶的社群影響力,即能吸引多少人前來購買該商品,讓公司能在有限預算下,招募最有影響力的用戶作為種子用戶,最大化病毒式行銷的效益。

萬物皆可表示成網路

  • 恐怖分子偵測──異常行為偵測

想找出恐怖分子,必須先思考恐怖分子跟一般罪犯在行為上有何不同之處;換成另一種資料舉例,在IMDb電影資料庫網路中,知名女演員梅格.萊恩(Meg Ryan)和其他女演員比起來有何特別之處?首先,我們要視覺化梅格.萊恩的社群網路,李教授團隊透過AI分析,區分出梅格.萊恩的「正常行為」與「異常行為」,結果發現梅格.萊恩的異常行為──很喜歡演翻拍的電影。如果只憑藉肉眼觀察,我們很難發現其中的差異。

同理,在一個犯罪網路中,很可能夾帶巨量且複雜的個體行為資訊,我們可以透過AI自動辨識出個體在網路中的異常行為,若一罪犯的行為與其他人比起來很不同,那麼他是恐怖分子的可能性應該不低。

  • 共享帳號偵測

須付費線上多媒體服務,如Spotify,存在著多人共享帳號的問題,以往我們只能以帳號的角度去分析使用者的喜好,進而推薦該帳號音樂;但一個帳號下若存在多位不同音樂偏好的使用者,將使得推薦音樂至正確使用者的成功率大幅下降。李教授團隊透過AI,從每一帳號的音樂聆聽歷程中,自動偵測哪些帳號有多人共享,預測一個共享帳號有幾個人共享,還可以即時偵測當前帳號是哪一位使用者,讓AI在進行音樂推薦時,能精準地從使用者的角度做出推薦,甚至連該帳號其中一位使用者在不同情境下聽音樂的習慣都能學習到,做到兼具個人化與情境化的音樂推薦。

如圖8-5為一利用歌曲及其相關資訊,包含專輯名稱與歌手,所建構而成的音樂聆聽行為異質網路,其中綠色點線構成歌曲聆聽序列,藍色虛線表示每一首歌曲與歌手、以及歌曲與專輯之連結,紅色實線為歌手與專輯之關聯,透過偵測正在聆聽《Born This Way》是共享帳號下的特定用戶,我們將可利用此網路來推薦該用戶《Bad Kids》,因為此二歌曲同為知名歌手Lady Gaga的《Born This Way》專輯所收錄。

8-5
Photo Credit: 三民出版
  • 個體行為側寫

個體行為側寫的目的在於瞭解個體行為與個體間的互動。社群網路中的個體經常會有群聚現象,舉例來說,使用者在家庭、大學同學、工作夥伴……等不同社交圈中,每個小圈圈群體內部通常都會有較為緊密的社群互動,而群與群之間的互動關係則相對稀疏且不頻繁。我們可以透過AI找出哪些個體屬於同一群體,應用在各種類型的網路,帶來不同的成效或目的。譬如在人際網路中,我們可從群體中推估使用者喜好的朋友類型;在犯罪網路中,可從群體中找出犯罪同夥;在股票漲跌網路中,可推薦能獲利的投資標的;在企業合作網路中,可瞭解公司間的競爭與合作關係;甚至在大腦組織細胞網路中,AI可偵測大腦各功能部位。

  • 環境感測及保護

AI搭配網路結構還可應用於環境保護上。譬如給定某一城市的下水道網路(每個住家或工廠都是一個點,點之間若存在下水道管線則彼此建立連結),以及歷史汙水擴散資料,我們就可透過AI找出汙水感測器的最佳設置地點, 讓我們能在汙染擴散到最大之前,儘早偵測到汙水,使汙水感測器發揮最大的效果。其基本想法是讓AI根據地面上地點鄰近區域的類型分布、地形及地貌、人口分布狀況等資訊,來評估每一地點產生汙染的機率,並同時從下水道網路中預測每一地點被汙水流過後所帶來的擴散風險,兩相結合後預測某地點搭建汙水感測器的效益。如此將可協助相關政府部門布設汙水感測網路,達到環境保護的目的。

  • 大數據與社群網路

人工智慧仰賴大數據,線上社群網站提供了大量以人為主的同質社群網路資料,而無所不在的各種物聯網感測裝置將萬物聯繫成一個巨大的異質網路,其中感測數值無時不刻被蒐集記錄下來,這些大量的網路資料作為人工智慧訓練模型的燃料,讓人工智慧基於深度學習開發出更具預測能力的圖神經網路(graph neural networks,簡稱GNN技術。有別於專門針對圖像資料的卷積神經網路,以及專門處理文字資料的遞迴神經網路, 專門針對網路資料的GNN能十分有效地融合網路圖形結構、個體屬性資訊以及隨著時間與空間變動的數據,進而為每一個網路上的每一個節點作出更為精準的預測。

目前研究人員正著手利用各種網路大數據, 開發出基於GNN的多種網路應用,除了上述所有應用均能透過GNN來強化準確性,更有利用道路網路來預測交通流量、利用感測網路來推估空氣品質、利用文字知識網路來開發對話機器人、利用物件關聯網路來辨識圖像語意、利用電子電路結構來改善晶圓設計良率、以及利用生物化學網路來開發傳染病疫苗,未來更多圖神經網路這種更具威力的人工智慧技術對各種網路大數據帶來更廣泛且更具影響力的應用,將指日可待。

書籍介紹

本文摘錄自《智慧新世界:圖靈所沒有預料到的人工智慧》,三民出版

作者:台大科學教育發展中心

  • momo網路書店
  • 透過以上連結購書,《關鍵評論網》將由此獲得分潤收益。

辨識一張圖片居然比訓練出AlphaGo還要難?
AI不止可以下棋,還能做法律諮詢?
AI也能當個稱職的批踢踢鄉民!

人工智慧一詞首度於1955年被提出,在二十一世紀的今天已普遍被認為是影響未來人類社會發展的關鍵技術。

人工智慧之父圖靈認為人工智慧可藉由模仿人類智慧,從符號邏輯的推導與知識結合達成,但這個方向的人工智慧並沒有獲得巨大的成功。而進化至今的人工智慧,是建構在以巨量資料和統計為基礎的機器學習與深度學習之上,二十一世紀的人工智慧早已聰明地滲透在你我生活中。

本書收錄台大科學教育發展中心「探索基礎科學講座」的演說內容,主題圍繞「人工智慧」,將從機器學習、資料探勘、自然語言處理及電腦視覺重點切入,並重磅推出「AI嘉年華」,深入淺出人工智慧的基礎理論、方法、技術與應用,且看人工智慧將如何翻轉我們的社會,帶領我們前往智慧新世界。

  • 完善的歷史發展軌跡

人工智慧是近年來的科技發展趨勢,本書以林守德教授開頭介紹人工智慧的發展歷史及其碰到的瓶頸,讓讀者瞭解:即使是現在大熱門的人工智慧也經歷過三次的寒冬。

  • 先從基底打起!

以清晰圖像圖表整理,詳細介紹AI的各個領域:支撐向量、資料探勘、自然語言處理及電腦視覺,以基礎知識帶領讀者進入AI的世界。

  • 為什麼要發展人工智慧?當然不是只為了下棋!

詩詞.法律.資訊工程.社群網路.電機工程.生醫產業.音樂產業
本書以多個領域介紹AI的應用,讓讀者一窺各界翹楚分享的秘辛及知識,顛覆你對AI的認知!

getImage
Photo Credit:三民出版

責任編輯:翁世航
核稿編輯:王祖鵬