用大數據分析潛藏的情緒:人工智慧可以幫助被霸凌的人嗎?

用大數據分析潛藏的情緒:人工智慧可以幫助被霸凌的人嗎?
Photo Credit:研之有物

我們想讓你知道的是

情緒,是許多疾病和社會問題的表徵。若能及早偵測到這些情緒,就有機會及時避免憾事發生,而這個任務可透過人工智慧(Artificial Intelligence, AI)協助。

執行編輯:林婷嫻
美術編輯:張語辰

大數據情緒分析

在2017台灣人工智慧年會演講中,清華大學資工系的陳宜欣副教授,分享團隊以機器學習分析社群發文情緒的經驗。希望有助偵測網路發文者的心理狀態,或協助醫師理解病人無法清楚陳述的情緒。

「我沒事」到底是什麼情緒?

情緒,是許多疾病和社會問題的表徵。例如有躁鬱傾向的人們,說話用詞有很大的情緒起伏;又如網路霸凌,會反映於社群留言的用字情緒。若能及早偵測到這些情緒,就有機會及時避免憾事發生,而這個任務可透過人工智慧(Artificial Intelligence, AI)協助。

但是,情緒不是那麼容易透過詞語理解。

例如,朋友在Facebook發文「我沒事」,究竟代表心平氣和的「我沒事」,還是絕望至極的「我沒事」;還有當鄉民留言「看吧!」,想表達的是讚賞意味的「看吧!」,或是嘲諷語氣的「看吧!」?

如同《來自星星的傻瓜》電影主角(一名外星人)所言,人類的語言非常難理解,在不同情境脈絡有不同意思,甚至會隱藏真實情感說謊。這些都增加人工智慧從語意分析情緒的難度。

清華大學資工系的陳宜欣副教授,是三個小孩的媽媽。她發現從小孩學習如何說話表達情緒的過程,可以梳理出一條路徑訓練機器學習。雖然小孩說話常常毫無邏輯,但許多小細節累積起來,就能讓大人判斷小孩的情緒。

例如當小孩對媽媽說「妳總是叫我收玩具」,其中用了「總是」這個詞,可以判斷小孩不太高興。或是小孩說「我永遠不能電視看了」,乍聽滿頭問號,但用了「永遠不能」這組詞,可以判斷其中的負面情緒。

不懂語法、沒背過辭典,還是可以表達情緒,反之也能分析情緒。

網路爬文 借用群眾智慧

陳宜欣團隊運用網路爬蟲技術,將社群網站公開發文(PTT、Facebook、Twitter 等),跟情緒有關的內容都蒐集建立至「情緒資料庫」。或許有些人會認為:「這不就是一堆人在發廢文?」,但以群眾外包(crowdsourcing)的角度,這些社群發言集結起來,就是群眾智慧,可做為訓練機器學習的資料。

1
圖片來源:研之有物
「情緒,是社群網站上的一種特性,也是可供機器學習的資料」陳宜欣強調。(照片來源│2017台灣人工智慧年會X台灣資料科學年會)

團隊將社群發文者原先在發文加上的情緒Hashtag(例如#anger)作為參考答案,但一開始先把這些「答案」遮起來,訓練機器透過演算法學習發文中「出現哪些字」代表「什麼樣的情緒」,最後再與原本的答案(例如#anger)對照,一次次地優化機器判斷情緒的準確率。

「用大數據做情緒分析有個重點,就是刪資料不要心痛!」陳宜欣笑中有股失敗無數次的堅毅,「太多Hashtag的發文、重複發文、太短沒有情緒特徵的發文等等,都要從訓練資料中拿掉」。

團隊也參考新聞標題,找出哪些字是較中性的「非情緒資料」,並從機器學習的訓練資料中排除、優化準確率。值得注意的是,選舉時期的新聞標題不能參考,因為用字遣詞太過激昂。

找出情緒用詞的邏輯

經過機器學習分析,陳宜欣團隊發現一些跨語系的情緒邏輯。例如「finally *** my」這組字詞多表達快樂,而中文「我終於***」也多用來傳達正面的消息。又如「my *** always」這組字詞多含有生氣意味,就像小朋友說「爸爸/媽媽總是***」藉以表達不快。

中文贅字的處理,也是情緒分析很有趣的一環。「學生建議這很重要,一定要列入分析!」陳宜欣說。

例如:「喔,我來做」其實是不太想做,「喔喔,我來做」較為中性,「喔喔喔,我來做」帶有積極感。凡是超過三個以上的贅字,可視同為三個贅字。這個規則用在「哈」、「哈哈」、「哈哈哈」、「哈哈哈哈」也有同工之妙。

然而陳宜欣團隊發現,社群平台上「開心」的發文特別多,不能否認社群平台很多人發文以炫耀為主、或是報喜不報憂。

另外,網路霸凌其實有很多「暗語」。

例如,團隊看過一則發文是「那些外國動物不應該被出口」,其實這句暗地裡帶有種族歧視。其中一種解決方案是運用Hatebase仇恨發言資料庫,並藉由機器學習比對非仇恨的文字資料,找出這類「暗語」的關聯性(通常哪幾個字會一起被使用)、以及相似性(字詞會在句子中哪些類似地方出現)。

許多人會在憾事發生後,回過頭從當事者社群發文的字裡行間尋找跡象,但未來能否更早偵測?當局者迷,旁觀者清。讓人工智慧成為一名不帶情緒的旁觀者,分析社群大數據找出被情緒糾葛的人們,甚至是預防犯罪、偵測自殺傾向,在來不及之前。

本文經研之有物授權刊登,原文刊載於此

責任編輯:朱家儀
核稿編輯:翁世航


猜你喜歡


辦公室突擊!交出你的Photoshop祕技吧!麻瓜也會上手的設計指南

辦公室突擊!交出你的Photoshop祕技吧!麻瓜也會上手的設計指南

我們想讓你知道的是

Photoshop 是設計師必備的工具,我們來到關鍵評論網媒體集團辦公室突擊四位設計師,看看他們平時都是怎麼應用 PS 製作出精彩的時事插畫、社群宣傳與節目吧!

不論是畫面生動又讓人秒懂的圖解插畫,還是清晰俐落的報導配圖,關鍵評論網的讀者們想必於這些視覺素材不陌生,你是否好奇它們是怎麼做出來的呢?這次我們請到關鍵評論網媒體集團的編輯與設計師們,來跟大家分享他們各自拿手的 PS 技巧!讓設計麻瓜也能上手!

Cool3C 編輯討喜小姐:身為插畫家,我推薦 Photoshop!

010
Photo Credit: The News Lens Brand Studio

第一位登場的是 Cool3C 內容部編輯討喜小姐!她平時畫插畫也負責影像合成的工作,從漫長的新聞事件到艱深的新科技產品,全都透過討喜小姐的畫筆「一圖看懂」。Photoshop 是愛畫畫的討喜從小就開始使用的繪圖軟體,因為爸爸工作的緣故,討喜小姐五年級就開始使用Photoshop,這也是她最早接觸的 Adobe 軟體,使用PS的時間甚至比Word更早!

PS 筆刷討喜最常用的功能,要創造出風格插畫,筆觸與材質是不可忽略的重要細節。在工具列裡面有非常多預設的筆刷樣式,「可以選擇你看得最順眼的,再進行筆刷設計的調整,調整過後插畫線條就會變得非常不一樣!」討喜邊說邊向我們示範了幾個他愛用的筆刷。

☞ 打開你的Photoshop,設定出專屬筆刷!

020
Photo Credit: The News Lens Brand Studio

想要讓插畫更有風格的話,討喜小姐建議可以為你的畫作套用一些 PS 濾鏡效果,或者將照片調整成黑白之後,作為質感的肌理,直接在 Photoshop 裡與你的插畫疊圖,透過更改圖層的混合模式,就可讓插畫更有層次。

030
Photo Credit: The News Lens Brand Studio

接下來討喜也教大家用 Photoshop 做出機器感十足的「像素字」。首先在 Photoshop 用文字工具輸入你要的文字內容,字體選用新細明體之後,將字體的「平滑度」改成無,再調整字的大小就可以輕鬆做出像素字,不論在海報設計或 banner 設計的時候都超實用!

☞ Photoshop 是你做社群宣傳的最佳幫手!

視覺設計部設計師 San:Photoshop 幫你把腦中的靈感具現化

040
Photo Credit: The News Lens Brand Studio

表情總是酷酷的 San 是關鍵評論網的視覺設計師,負責網頁設計與許多報導配圖的製作。在 PM 提供專案需求後,San 會先蒐集一些與主題相關的視覺素材,像是情境照片加上牛皮紙張等來做質感搭配。

050
Photo Credit: The News Lens Brand Studio

San 用一張報導的主視覺示範他平時的 PS 相片拼貼流程,「我先將照片中要使用的人物去背、抽色,在背後加上一個輪廓,讓他有種從紙張上剪下來的感覺」,再用另一種紙張做質感圖層,更改圖層屬性讓紙張的材質跟人物融合,最加入報導相關的物件、Logo、標題,為畫面打上陰影就完成了!

☞ 用 Photoshop 拼貼出吸睛的主視覺

社群行銷 Stellina:打開 Photoshop 是一件很自然的事

060
Photo Credit: The News Lens Brand Studio

在關鍵評論網擔任社群行銷的 Stellina,另一個身份是一位插畫家,他常根據時事的來畫幽默的漫畫,發佈在 Instagram 和 Twitter 等社群平台,也經常跟編輯合作繪製資訊圖表。「我大概是 2016 年開始接觸 Photoshop,」Stellina 習慣用 Photoshop iPad 版為插畫上色,「它有一個像是電腦 option 鍵的功能,壓著就會變成橡皮擦,兩指手點一下就會還原。」他分享了幾個在平板上操作 PS 超好用的手勢。在不同載體之間,都能輕鬆使用Photoshop。

070
Photo Credit: The News Lens Brand Studio

☞ iPad修圖與畫畫首選 Photoshop

內容部節目組 Sid:想把討厭的人變不見?推薦你使用 Photoshop!

080
Photo Credit: The News Lens Brand Studio

最後登場的是內容部節目組的 Sid,他的工作主要是負責內容視覺設定以及平面影像合成,像是國際大風吹、國際值日生等熱門節目,都是由他負責。冷面笑匠 Sid 說他常用自己的身體當成合成要素,「跟大家介紹一個非常方便的物件選取工具,稍微滑一下游標就會發現,我的身體已經被含括在這個選取的範圍了。」只需要幾秒 Photoshop 就能判斷圖片中的物件,讓我們用 PS 去背更輕鬆。

☞ 下載Photoshop,一秒去背輕鬆貼

090
Photo Credit: The News Lens Brand Studio

擷取好手部的素材之後,Sid 將素材與既有的底圖結合,「利用遮色片搭配筆刷工具,既不會破壞原本影像,還可以做更多變化。」除此之外,Sid 還介紹了 Adobe 近期應用機器學習開發的功能 Nerual Filters,在濾鏡欄點擊 Nerual Filters 後開啟「彩色化」的選項,既可以在幾秒鐘內將黑白照片變成彩色照片囉。

看完設計師們的分享,是不是也想自己動手試試看呢?不管你是資深使用者,還是從未接觸過修圖軟體的設計麻瓜,習慣用電腦合成或用平板繪圖,Photoshop 都能滿足你所有的需求,現在就下載 Photoshop 感受魔法般的功能吧!


猜你喜歡