《眼見為憑》:「有視力的電腦」如何完成臉部辨識?

我們想讓你知道的是
實際上我們並不知道神經網絡如何區分出比爾。皮膚的顏色?臉部高度和寬度之間的比例?直鼻或是鷹勾鼻?酒窩?青春痘留下的傷痕?還是以上全部?這些都在隱藏層中,都位於數不盡的連結裡。
文:理查・馬斯蘭(Richard Masland)
今天讓你發生勝利呼喊的發明,很快就會讓你發出恐懼的呼喊。——貝托爾特・布萊希特(BertoltBrecht)
有視力的電腦
你可能聽說過有視力的電腦,出現在自動駕駛車上,或是能夠辨識臉部。擔憂科幻情節成真的人會想到將來有天去百貨公司,攝影機拍到你的臉,之後把你的身分和購物喜好連接在一起,然後百貨公司會(以某種方式)操縱你買你原本沒有打算買的東西。
我得告訴你,無須擔心……至少現在還不需要。目前圖型式驗證碼(CAPTCHA)依然用來維持你的網路安全。事實上圖型式驗證碼是一個很好的例子,說明日常用電腦依然有難以解決的任務(美國航太總署的電腦當然能夠破解絕大部分的圖型驗證碼,但在日常生活中出現的業餘機器人是辦不到的)。
電腦能夠看東西,真的很厲害,而且辨別的速度突飛猛進。為了說明這種能力,我會介紹幾種辨識臉部的方法,這是我在本書一開始就提出的問題,對於視覺神經科學家而言,如聖母峰般高聳。
現在最佳的臉部辨識電腦其實表現得非常棒,幾乎和人類一樣好,不過體積比人腦大太多了,而且需要消耗許多能量。我將說明兩類南轅北轍的方式。其中一類以規則為基礎,也就是說這個方法會嚴格遵守一連串特殊的分析步驟。
大部分的人想到的會是這種,舉例來說,我在這一章開頭提到的那位堅持己見的航太工程師便是。為了方便說明,我把以規則為基礎的稱為「蠢方法」(dumb method),不過這一類中有些方法一點都不蠢。
第二類方式利用機器學習,模仿腦的運作,現在看來會是將來的主流,讓隱私權擁護者恐懼的也是這類方式。我們把這類人工智慧方式稱為「巧方法」(smart method)。我的描述將會集中在後者,主要是因為這些方法類似於神經元的行為,而我認為神經元是靈巧的。目前人工智慧法是臉部辨識的主流。
臉部辨識演算法中包括了數個任務:首先要認出有一張臉存在,然後分辨那是誰的臉。第一個任務只是臉部偵測(face detection),不是臉部辨識。在蠢方法和巧方法中,都需要完成這個任務。在有各式各樣物品的一幕中,例如百貨公司的男裝部門,這兩類方式都要能夠看出是否有臉部存在,並且把臉部影像提取出來以便後續分析。
但是在尋找臉部之前,電腦必須讓那個測試影像(對電腦來說)盡可能清晰,這些發生在演算法真正要開始找出臉部之前的過程,稱為前處理(preprocessing)。讓影像變得更清晰的方法非常多,有修圖經驗的人就知道。我會說明兩個例子。
第一個例子是最為自然的場景,光線並不單一:從窗外照進的日光會造成陰影,百貨公司室內的燈光集中在當天促銷的運動外套上。之前已經提到過,基於數種原因,我們不會注意到光亮的差異,但是手機或是電腦配備的數位相機卻會。電腦是根本沒有想像力的,這會是個大問題。同一個東西在不同的光照下,對電腦而言是不同的東西。
因此第一個前處理轉換辨識讓影像中的亮度「平面化」(flatten)。電腦會把整個影像中的亮度平均化(有的時候會採取類似平均化的巧妙方式),並且調整亮度,讓整個影像的亮度保持一致,這樣影像中的物體看起來會像是由單一均勻光源照射下的樣子。
其次,絕大部分的演算法會採用某種邊緣強化方法,這之前也多次提到過,邊緣與行動息息相關,演算法多多少少會讓邊緣更鮮明。
現在電腦清理好了影像,第二項任務是把影像中的臉找出來,這也有好幾種方法。其中一種很有趣,因為它類似於視覺皮質中神經結構進行的方式,產生的圖稱為HOG影像。
HOG的意思是「方向梯度直方圖」(histogram of gradients),其中的「梯度」是從亮到暗的變化區域,邊緣便是一邊亮而另一邊暗。換句話說,梯度不只顯現出邊緣,而且還可以指出邊緣是朝內或是朝外。電腦會盡可能計算影像中的梯度以及方向,並且描繪出來。

這裡是一個簡化過的影像。設計演算法的人把一個影像分解成許多縱橫各有十六個像素的小方塊,在每個小方塊中,演算法會計算有多少梯度指著主要的方向(上、下或是傾斜),然後把影像小方塊的梯度濃縮成簡單的邊緣線條,取代原來的影像,這個線條經過調整,之前是方格中最明顯的邊緣。
實際上,書中這個影像是許多HOG影像的平均值,來自於許多張臉,是共通的臉孔。你可以把這張臉當成模板來找出人群中的臉,方法是為影像中每個大小適當的區域都做一個HOG影像,每格大小和臉部相當。你把這個檢驗用的方格在你認為含有臉部的影像上移動,之後比較影像上某個HOG和理想中完美的臉部HOG。
大部分的區域中是沒有意義的混亂邊緣,但是有些和組合出的HOG相符,演算法會認為這些區域是臉。當然到目前還沒有指出是誰的臉,只能指出是臉而已。不過這個過程可把臉納入標準座標(into standard coordinates)中,這些圖案之後會再加以分類,同時比起原始影像,挑選過的影像在之後處理的難易程度會大幅降低。
演算法最先得到的是雜亂無章的像素,裡面人頭鑽動,像是有許多團像素雲。演算法會把可能是臉的像素團先挑出來。
現在影像經過清理,並且確定了臉孔的位置。經由一些調整,這些臉會成為標準格式(舉例來說,會把臉部仔細地切除下來,好去除周圍的影像,在有些科幻電影中你可以看到區隔臉部和周遭的小方框),接下來便能著手確認那些臉的身分。
ESG成為永續經營新顯學,除了追求獲利,這些企業更重視打造多元包容及友善環境的幸福社會!

我們想讓你知道的是
現今越來越多企業共享ESG架構理念,彼此跨業結盟、分享各自優勢,讓企業影響力發揮一加一大於二的效果。從渣打銀行與全球第一大烈酒集團帝亞吉歐的對談中,就可以看到雙方有許多相似之處。
「我的夢想」是許多人小時候作文課都會寫的題目,但是長大後,能真正實現夢想的人為什麼少之又少?其實,原因來自千里馬沒能遇上給予支援與資源的伯樂。
不過現在情況正在翻轉,因為現代商業環境,除了追求獲利最大化,更多企業把重心投入於實踐永續發展理念;尤其是在社會責任方面,企業更加重視勞工及社區等利害關係人的權益與福祉。打造更包容與多元的社會,需要更多企業一起聯手合作。
渣打、帝亞吉歐:從各自領域幫助社會上的千里馬
渣打銀行與帝亞吉歐在社會責任方面的相似之處,在於兩家企業都有幫助社會更具包容、照顧弱勢的公益計畫。
多年來,渣打在攜手政府單位及社福夥伴,共同打造「看得見的希望視障就業平台」,並透過連續贊助國內最大型的公益馬拉松賽事「渣打臺北公益馬拉松」至今累計幫助近700位視障朋友成功並穩定就業。在支持視障青年多元就業之外,渣打集團於2019年推出全新的全球性計畫 — Futuremakers by Standard Chartered,並擴大所協助對象,主要協助16-35歲視障青年及弱勢女性,並與社福團體合作,結合各組織的專業與資源,為他們提供就業的支持,幫助他們翻轉未來。在2020~2023年期間,渣打協助近7,000名視障青年及弱勢女性學習新技能、輔助他們就業及創業。目前渣打銀行也有6位視障員工在銀行擔任客戶服務的工作。

一般人可能無法體會,一些簡單的動作因為礙於視力限制,必須比常人多付出數十倍的反覆練習,沖泡咖啡就是一例。台灣第一位視障咖啡師林佳箴,小時候因意外導致視力逐漸退化,但她沒有向命運低頭,努力取得英國國際咖啡師證照,並且創立「甜裡開始」咖啡廳。
林佳箴的故事,能夠感動人心並且躍上媒體版面,一方面也因為她是帝亞吉歐「Keep Walking夢想資助計畫」的2020年得主名單之一。
帝亞吉歐Keep Walking計畫從2003年正式啟動,訴求不以營利為目的,不限定夢想的類型和議題,從環保生態、藝術文化、公益推動、到偏鄉教育,如今已經實現超過200份計畫,累積提供達1.8億元獎金回饋。每一位夢想家獲得贊助後,得以展現他們的天賦,實現自己的使命,堅持夢想並且勇往直前。
為地球永續而戰,日常小動作也能節能減碳
ESG概念的另一個重要議題是「環境保育」。近年因應極端氣候現象頻傳,為了讓全球溫升控制在1.5°C以內,截至2022年10月,全球已經有137個國家響應2050年要達成淨零排放,其中德國、瑞典、日本、英國等先進國家,更將「淨零入法」透過實際舉措要求企業從營運過程減少碳排放。
從國家立法到企業響應並展開行動,證明永續行動的迫切性,也凸顯沒有任何人可以在節能減碳這件事置身事外。
帝亞吉歐近期提出「2030社會願景」計畫,其中三個核心範疇分別是「提倡理性飲酒、促進社會多元包容、促進環境永續發展」,最後一項就扣連2030年要達到淨零排放。帝亞吉歐台灣總經理梁殷禎分享,在釀酒過程,最重要的成分就是水資源,帝亞吉歐規劃未來在產地製造過程,運用先進技術讓產品減少30%用水,具體提高產品生產效率。

渣打銀行總經理韓德聖(Ian Anderson)則表示,渣打集團也訂出2025年底要落實自身營運零碳排,2050年底達成投融資淨零碳排的目標。由於銀行的業務屬性,碳盤查過程, 屬於範疇一、範疇二的溫室氣體排放可以從自身做起;範疇三則屬於其他間接排放,例如商務旅行、上下游運輸、乃至於供應鏈、客戶所產生的碳排,且範疇三的碳排放量佔了總排放量95%。因此,渣打銀行下個目標就是要幫助客戶落實綠色轉型,打造綠色永續生態系。
值得一提的是,淨零減碳除了仰賴數位科技、組織轉型、調整商業模式來達成,每個人也可以在生活中擔任永續小尖兵。例如渣打銀行推出自家的永續發展App,員工可以在每日的工作中掌握自己的碳足跡,嘗試透過趣味的方式減碳,像是澆水、種樹小遊戲,企業會依同樣比例植樹,讓員工在日常為永續盡份心力。
翻轉偉大企業定義的現在進行式
股神巴菲特曾如此定義他眼中的偉大公司:「我認為競爭優勢可以持續25年到30年的公司」。然而,在ESG思維之下的今日,值得思考的是,偉大企業的意義應被賦予更多價值,除了具備競爭力與獲利能力,更重要的是願意關注社會、在乎永續的願景及行動。
對此,韓德聖這樣回應:「我們相信在推動商業與經濟增長的過程中,不能忽視對人類、環境、以及相關社群的關懷;藉由把永續行動融入我們的政策及業務之中,攜手我們的員工、客戶、乃至於更多人,一起創造更好的未來。」
想知道更多渣打銀行與帝亞吉歐決策者的精采對談,以及他們為ESG投入哪些心力?點擊影片觀看更多:https://www.youtube.com/watch?v=8Ub5gUPWBO8
延伸閱讀
l 渣打銀行永續之旅網站
l 【渣打銀行的永續之旅】全球最高的綠建築 台北101
l 【渣打銀行的永續之旅】全球最成功的公共自行車系統 YouBike
l 【渣打銀行的永續之旅】永續能源推手 哥本哈根基礎建設基金