AI人臉辨識可以用大量圖片來訓練準確率,為什麼「AI醫療影像判讀」這樣做卻成效不佳?

我們想讓你知道的是
在這場「肺癌自動診斷」的線上競賽中,最後至少有5組獲勝的演算法模組,對從影像中偵測出肺結節表現出超過90%的準確率。然而當科學家將10組表現最佳的演算法模組,以不同資料子集對其進行測試,卻發現判讀準確度下降到令人擔憂的60-70%。科學家還稱在某些影像上,這些演算法的表現甚至和擲硬幣的表現無異。
人工智慧(AI)的應用在近期成為一門顯學,不論繪圖、寫論文做研究、寫文章,都可以看見實際應用的例子。而在醫療領域上,AI於診斷與健康監測上的應用早已是許多科學家研究的方向,也已經有不少醫藥大廠推出自己的AI醫療影像判讀工具。然而一篇刊登於《自然》(Nature)期刊的文章,卻提出AI在協助診斷的影像判讀上,可能具有再現性(reproducibility)不佳的問題。
關於AI醫療影像判讀的應用,文章當中舉了美國肺癌篩檢的例子。
平均而言,美國每天有350人因肺癌而死亡,然而當中其實有許多死亡可以因為低劑量電腦斷層掃描(CT scan)的早期篩檢而避免。不過若對數百萬人進行掃描篩檢,及意味著有數百萬組電腦斷層掃描的影像需要判讀,但卻沒有足夠多具備專業的醫事放射師能夠判讀這些結果。即便有足夠的人力,對於部分難以判讀的影像是否代表患者出現癌症,不同的專家之間可能看法各異。
2017年,在人工智慧領域極具企圖心的競賽「Data Science Bowl」,出了一道題目:機器學習演算法是否能補上這之間的判讀缺口?
在這場「肺癌自動診斷」的線上競賽中,主辦方提供1397位患者的電腦斷層影像,讓上百組團隊測試他們的演算法。最後至少有五組獲勝的演算法模組,對從影像中偵測出肺結節(一小塊不正常組織,型態上可以是圓形或橢圓形,除了可能是癌症,也可能是因感染而引起),表現出超過90%的準確率。
這麼高的準確率看起來非常理想,但要真能應用於臨床上,這些演算法模組需要能在其他不同影像資料集(Dataset)上也具有這樣好的表現。於是其他資料科學家將10組表現最佳的演算法模組,以不同資料子集對其進行測試,卻發現判讀準確度下降到令人擔憂的60-70%。科學家還稱在某些影像上,這些演算法的表現甚至和擲硬幣的表現無異。

任職於國防醫學中心資料科學研究室的林嶔副教授表示,目前在醫療診斷上,AI技術可以用於輔助判斷,但最後都還是需要人類去做最後的判定。
「我對這個(AI於醫療應用的再現性)問題是有些自己的看法。」林嶔表示,目前AI這一波發展比較像是由電腦科學家去主導,但要放到醫學研究裡時,一些原本在醫學研究上會注意的點可能被忽略了。
林嶔舉例:「通常AI訓練時獲得的圖片素材都可以很大量,diversity也很高,被辨認的主要標的之外的背景變化度很大,這樣AI就能獲得比較好的訓練......但現在假如你要做一個COVID-19病人的肺炎胸部X光診斷,希望找一群有確診和另一群沒有確診的病人來進行研究訓練。但你很容易就會發現,你所找到的COVID-19病人經常年紀都是比較大的,而控制組的人則可能年紀都比較小。」
在這樣的情況下,研究學者在自己的data set裡面,AI的表現不錯,但其實你並不知道AI真正辨認的東西是我們要的,還是可能辨認到高齡者胸部X光片中可能經常會出現的背景?
若再以心臟衰竭影像辨識AI舉例,通常研究團隊進行研究時,會找一批健康的人(可能是從健檢中心招募)的影像資料,再找一批有心臟衰竭患者的影像資料,來給AI做訓練與學習。但這搬到臨床上醫生要使用時,卻會發現來掛心臟科的都是已經有不適狀況的人,那要再從中分辨誰是真正的心臟衰竭患者時,就可能和當初AI受到訓練的data set有極大的差異。
林嶔表示就自己的感覺,目前研究團隊在AI研究模型於本地運行時,經常都表現得不錯,到了其他地方運行不好。這可能比較不像是「造假」,通常表現出問題都發生在跨data set的時候。
「我覺得這次《自然》期刊提到的比較不像典型的『實驗結果複製不出來』的再現性問題,比較像是本地的模型沒有辦法外推到其他地方去的『外推性問題』。」
林嶔提及,目前影像AI的應用是比較複雜的,例如胸部X光在取得的過程中,有非常多影響的參數,是由當下那位放射師決定的,比如說,放射的強度。「每個人的身材不同,對於比較厚的人來說,可能就需要比較強的放射強度才有辦法成像。」另外還有像要看哪個範圍,更不用說機器成像上本來就有一些前處理的方式可能不一樣。而在這些規格沒有統一的情況下,AI影像判讀想要跨機構仍然維持高準確度,就沒那麼容易。

面對這樣的困境是否有辦法克服?林嶔舉了藥物試驗的例子。以藥物設計來說,就不會有跨機構、跨區域藥物就不能使用的情況,這是為什麼?「藥物試驗有統一的實驗規定,FDA甚至有寫出說做什麼樣的事情,就該用什麼樣的研究設計去做。因為大家都遵循一樣的標準,審核單位也一樣,效果就會很一致。」
回推到目前AI醫療的相關研究設計,林嶔認為似乎有點太自由了。而這也是因為這個領域才剛發展,也許還沒有標準的規範訂出來。若是標準訂出來之後,在研究設計方面的統一性至少就可以確定。
若要增進醫療影像判讀AI的能力,是否蒐集越多張圖片資料給它判讀越好?對於這個問題,曾任美國華府喬治城大學醫學中心放射科及腫瘤科的婁世鐘教授表示:「我一直跟這些電腦科學(computer science)的專家說,這個觀念在辨識人臉或ChatGPT的訓練時,這個觀念是對的。但在醫學影像判讀這塊,這觀念只對50%。」
Tags:
穿越2222年,未來選擇地給孩子一個想像,也給我們一個重新選擇的機會!台北華山親子逛展新選擇,啟迪孩子的永續生活教育

我們想讓你知道的是
前進2222到重返2023年,共打造四大展區,以永續為策展核心,讓「2222」這個天使數字成為一個親子共學的起點,師生共享的觀點,了解永續不一定是政府企業的高談闊論,從日常的選擇就可以參與永續行動!
從學校教育到未來職場,聯合國「永續發展目標SDGs」已成趨勢關鍵詞,永續發展共有17大項目標(註1),涵蓋環境、經濟、社會等面向,其實已經融入許多教育課程的設計,校園年度宣導的重點計畫,甚至成立永續相關研究中心與系所,以培育未來企業所需的ESG永續人才。
回顧近年全球歷經的肺炎疫情、極端氣候、通膨怪獸、能源危機等災難,讓人們更專注、更急迫面對世界的面貌與真相,需要肩負這個世代挑戰與達成永續目標的,正是我們的下一代:暖世代—成長於全球暖化、環境劇烈變遷的一代。他們從小戴著口罩抵抗病毒與空污,需要在擁擠的城市尋找遮蔽酷暑寒冬的屋簷,人類壯闊的文明發展將是「債留子孫」還是「永續未來」,其實,都取決我們每日的選擇!
《2222-未來選擇地》給孩子一個想像,也給我們一個重新選擇的機會
「永續發展目標SDGs」聽起來很艱深?如果我們說「一個200年後未來人的故事」你也許可以聽聽看!《2222-未來選擇地》是台灣首個原創永續概念展,於2023年1月6日-4月5日在台北華山1914園區展出,你可以在這裡參與永續美學的策展,觀賞跨界藝術與科幻故事的創作,透過沉浸式體驗,與未來人並肩前行穿越200年後的未來,守護最後的生機,捕捉污染機械獸,透過思考與選擇協助改變未來人的世界。
前進2222到重返2023年,共打造四大展區,以永續為策展核心,讓「2222」這個天使數字成為一個親子共學的起點,師生共享的觀點,連成你我共創的永續日常,圈起人與環境共好生活態度,並聯手台灣在地藝術家、綠色品牌、永續名人團體打造的永續學習場域。了解永續不一定是政府企業的高談闊論,從日常的選擇就可以參與永續行動!






▶親子、旅遊部落客展覽開箱推薦
- 小妞的生活旅程 :適合親子共賞的互動式永續展覽,教育意義十足
- 艾麗絲愛旅行:台北展覽親子、師生看展新選擇!跟未來人一起成為改變歷史的關鍵
- 小胖盈的花椒人蔘:台北展覽推薦:搭乘時光機到2222年的世界吧!科幻永續主題展,互動沉浸式體驗反思生活方式
▶展覽資訊
日期:2023/1/6 - 4/5
時間:10:00 - 18:00
地點:華山1914文創產業園區西4館&西5館
購票詳情洽:《2222-未來選擇地》

▶展場提供觀展證書申請
完成觀展後,可於現場依照工作人員指示,完成電子證書申請流程,將於一週的工作天寄出證書電子檔案,提供大人、小孩一個觀展紀念。

(註1)SDGs永續發展目標(Sustainable Development Goals)是一項全球共識,旨在2030年前實現可持續發展的一系列目標。由聯合國提出訂定17項明確目標、涵蓋169項具體指標,目的是實踐地球上所有面向的永續發展,包含地球環境保護、社會公平正義、永續經濟發展。
17項永續發展目標:
1.消除貧窮、2.終結飢餓、3.健康與福祉、4.優質教育、5.性別平等、6.淨水與衛生、7.可負擔的永續能源、8.就業與經濟成長、9.永續工業與基礎建設、10.消弭不平等、11.永續城鄉、12.責任消費與生產、13.氣候行動、14.永續海洋與保育、15.陸域生態、16.制度的正義與和平、17.永續發展夥伴關係。
責任編輯:Anita
核稿編輯:Joanna