Netflix與YouTube如何挑選影片推薦給你?

Netflix與YouTube如何挑選影片推薦給你?
Photo Credit: Shutterstock / 達志影像

我們想讓你知道的是

YouTube及Netflix等網絡影片平台收集了用戶數據後,透過各用戶對少數影片的喜好數據,估算出他們對其他影片的喜好程度,但背後的演算法到底如何運作?

推薦系統在現今社會可說是無處不在。當你在亞馬遜瀏覽網絡書店時,網站上的推薦清單讓你更有機會找到有興趣的書籍;影音串流網站Netflix根據你看過的影集及電影給你專屬化推薦,讓你不必煩惱如何選片。推薦系統流派與方法的發展雖已趨於成熟,但在現今科技蓬勃發展、凡事講求快狠準的時代,如何兼顧速度與準確度,有效滿足社會需求,不被企業及消費者淘汰,仍有很大的進步空間。

推薦系統

1990年代中期,由於「評分結構」的研究逐漸受到重視,「推薦系統」於是演變成一門獨立的學問;在多數情況下,其可以被概括為「估計用戶對未知商品評分的問題」。一旦我們可以估計用戶對未知商品的評分,就可以找出分數最高的商品推薦給用戶。

假設:

C:所有用戶形成的集合;
S:所有潛在物品形成的集合;
u:為評估商品(s)對用戶(c)的效用函數(utility function),

針對某用戶c,我們希望能推薦一項在S集合中對用戶c效用最大的商品s。上述想法可簡單表示如下:

movie-uf

針對一用戶c,我們可以用一系列例如年齡、性別、所得的特徵來表示;同樣地,我們也可以用一系列的商品特徵來定義一商品s,以電影推薦系統為例,電影名稱、類型、導演與演員等,都可被用以定義s。

效用函數通常只在一部分的集合中有完整的對應值。例如在電影推薦系統中,一般收視戶可能只為一小部分的電影評過分,我們可以簡單的用戶—評分表格表示:

movie-1

推薦系統的目標,就是以各種方法推估表格內空集合(Ø)的值。如此,我們才能從所有商品中選出最高分的前幾種商品推薦給用戶。

需要注意的是:所推薦的商品雖應與用戶喜好相似,卻也需與用戶過往的瀏覽紀錄有一定的區別,帶有一些新意,而非舊調重彈,例如針對同一事件但不同敘述的報導。依據估計評分的方式,可以將推薦系統大致分為「基於內容」、「偕同過濾」或「混和過濾」等三類(以下皆以電影推薦系統為例)。

基於內容的推薦(Content-Based Recommendations)

此方法只運用用戶c評分過的電影資訊,去推測他(她)對未評分過的電影s的評分。核心概念是從該用戶已評分的電影中,找出n項與s最相似的電影,並推薦這些電影給該用戶。此方法可以透過兩種方式實踐:啟發式學習以及模型學習。

前者主要是運用一系列的關鍵字去代表用戶及電影,並計算用戶及不同電影之間的相似程度,相似程度的衡量可以用相關係數等指標量化;後者則是將模型套用到現有資料,學習並進而預測電影評分,許多模型都可以運用在推薦系統,諸如決策樹、貝氏分類器、類神經網絡等。

協同過濾推薦(Collaborative Recommendations)

此方法利用與用戶c相似的用戶群的資料,來推估c對電影s的評分。至於如何找到與用戶c有相似品味的用戶群,則可分為兩種方法——記憶式學習及模型學習。

前者藉由兩用戶共同評分過的電影,來計算兩者間的相似度(可以用相關係數或餘弦相似性表示),並以此將中每位用戶對電影s的評分做加權平均,得到評分估計。後者則是直接將模型套用到所有用戶對該電影s的評分資料,學習並預測電影評分。

混和推薦(Hybrid Recommendations)

上述兩種方法可以下列四種方式結合,截長補短,使得即使在評分資料稀少,如新用戶或新電影時,仍可適用:

  1. 分別運用「基於內容」與「協同過濾」兩方法預測評分,再結合兩者評分得到最終評分;
  2. 將「基於內容」的用戶特徵加入「協同過濾」法內,以預測評分。兩用戶間用來計算相似度的特徵不再僅限於共同評分過的電影,也可以包含用戶的基本資料;
  3. 將「協同過濾」的特徵加入「基於內容」內預測評分;
  4. 發展一套結合兩方法之特徵的預測模型。
lno2vxczoeuyhozcuuykjs6ag67x5b
Credit: Depositphotos

更省時的推薦演算法

上述方法奠定了推薦演算法的基礎,但卻有一個共同問題:運算時間。無論是基於內容、協同過濾或混合推薦法,都必須在瀏覽過所有電影及用戶資料後,方可開始計算。隨著資料量增長,計算時間也勢必大幅拉長,如何降低運算時間因而成為重要議題。2018年7月12日機器學習研討會中,由哈佛大學電腦科學家Yaron Singer與Eric Balkanski提出的演算法能在短時間內找出最佳解,更聰明也更快速地解決問題。

相較於傳統電影推薦系統,需在瀏覽所有電影資料庫的電影後,方能列出推薦清單;新的演算法一開始只選取一定數量的電影,在這些電影之中找出最符合推薦標準的幾部電影,並捨棄未選上的電影,而後再由縮小後的資料庫中隨機選取一定數量的電影,保留最符合標準的電影,並捨棄其他,持續重複上述步驟。如此做法,創建推薦清單的速度是傳統演算法的10倍以上。

而其應用範圍,也不僅限於電影推薦。在另一個試驗中,這種新的演算法能迅速找出紐約計程車的最佳路徑,速度是傳統方法的六倍以上。除此之外,也可以加速資料處理的速度,並拓廣運用到如社群媒體或基因資料的分析。

編譯來源︰Maria Temming, "Solving problems by computer just got a lot faster", Science News, July 16, 2018.

參考資料︰

  1. Adomavicius, G., Tuzhilin, A. "Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions. "IEEE Transactions on Knowledge and Data Engineering 17(6), pp.734–749, 2005.
  2. Basu, Chumki, Haym Hirsh, and William Cohen. "Recommendation as classification: Using social and content-based information in recommendation." Aaai/iaai, pp. 714-720, 1998.

本文由教育部補助「AI報報─AI科普推廣計畫」執行團隊編譯,編譯者:陳育婷(台大統計碩士學程 ),原文發表於此

延伸閱讀

責任編輯:丁肇九
核稿編輯:翁世航


猜你喜歡


「大宅豐鼎」改寫豐原天際線,成就絕無僅有超越之作

「大宅豐鼎」改寫豐原天際線,成就絕無僅有超越之作
Photo Credit:富宇大宅豐鼎

我們想讓你知道的是

曾在台中七期推出「東方之冠」代表作的富宇建設,選中緊鄰豐原火車站的蛋黃區,欲以七期豪宅頂級規格鑄造「大宅豐鼎」,由於基地面積廣達2010坪,又規劃拔地而起三座28層豐原最高樓,甫曝光即成為詢問度與討論度飆高的熱門建案。

車水馬龍的圓環北路與豐勢路口一側,挑高兩層樓的晶瑩落地窗外觀,已然烘托出「大宅豐鼎」接待會館的非凡氣勢,沿著曲形結構踏進入口中庭,兩株聳天的原生鳳凰木,不僅營造清新脫俗的迎賓格調,還喻意著引領豐原興盛的木業發展脈絡,令人留下深刻印象; 至於跳脫制式框架的會館內部,規劃了洽談區、吧台與宴會廳等豐富設施,皆在流線型木質天花板的層疊延展下,釋放了空間尺度視覺張力,顯得更加經典雋永,一如富宇建設賦予「大宅豐鼎」的臻於完美價值,經得起時間考驗。

_MG_0348
Photo Credit:富宇大宅豐鼎
「大宅豐鼎」接待會館入口中庭,特地保留兩棵聳天鳳凰木,既喻意豐原的山城木業歷史脈絡,也宣告豐原將迎來首棟摩天住宅。
_MG_0336
Photo Credit:富宇大宅豐鼎
挑高兩層樓的「大宅豐鼎」接待會館,在曲型木質天花板層疊延展下釋放尺度張力,更顯氣派尊貴。

圓環路內市區稀缺地段,抗跌增值潛力備受矚目

「大宅豐鼎」基地位在圓環路內核心地帶,還被12公尺寬的文化街、愛國街、直興街以及向陽路173巷所環抱,坐擁四面臨路完整街廓,早已具備正市區的抗跌增值及高稀缺性等優勢,而且步行2至5分鐘就能抵達生活機能完備的向陽商圈或豐原火車站,就連前往廟東、SOGO百貨雙商圈的車程也僅需10分鐘,以及火車站旁的豐原轉運中心預計9月上旬啟用,屆時除了有國道、市區客運轉運功能,更結合大型商場、iBike及計程車招呼站等便民設施,有益於活絡區域發展,為豐原市區帶來嶄新氣象。

此外,堪稱大台中環狀快速公路網最後一哩路的國道四號豐原潭子段,年底正式通車後透過豐原、潭子兩條連絡道,就能無縫銜接台74線快速公路,估計豐原往返台中屯區可比現今節省約20分鐘,等於把大台中都心與副都心生活圈緊緊牽繫在一起,形塑出無限發展可能性,所以如此一塊堪比台中七期的鑽石級寶地,讓富宇建設展現雄心壯志,冀求打造「豐原七期」傳奇,不只讓豐原驚艷,還要讓豐原為傲。

23豐原轉運中心
Photo Credit:富宇大宅豐鼎
「大宅豐鼎」坐落在豐原市中心,距離火車站與轉運站僅2至5分鐘,屬於交通及生活機能便利地段。
02太平洋百貨商圈
Photo Credit:富宇大宅豐鼎
圓環路內都是豐原市區精華地帶,從「大宅豐鼎」開車到SOGO商圈與廟東夜市都只要10分鐘。

豐原唯一摩天地標,享受前所未見層峰生活視野

「大宅豐鼎」被定位為豐原市中心的超越之作,富宇建設號召多位設計名師傾力擘劃,集奢華、氣度與風格大成於一身,包括三座28層摩天大樓將以品字型排列,不僅確保戶戶邊間擁有良好通風採光,舉凡外觀立面、燈光設計、園藝公設與高空Lounge Bar,也都致力兼顧極致工藝美學與獨特機能價值,希望演繹出豪宅該有的大器典雅,好與113公尺高聳挺拔的摩天地標名實相符,讓住戶回到家就能享受極盡講究與永久棟距的感官震撼,一邊品味層峰生活,一邊飽覽無垠景緻。

「大宅豐鼎」總共規劃380戶,涵蓋37坪標準三房、41坪大三房、43坪標準四房、50坪大四房等四種房型,可以滿足首購或換屋不同置產需求。以往不少事業有成的在地實業家、企業主與科技新貴,總會感慨豐原沒有一棟具有國際視野的住宅建築,如今終於不必羡慕台北或台中,能夠衣錦榮歸落籍市中心,或撫慰打拼事業的辛勞,或當成榮耀家族的象徵,畢竟豐原最高豪宅的殊榮,比起台中七期有過之而無不及,足以當成獨一無二的傳家寶。

交通與產業雙加持,豐原市中心指標建案上看5字頭

尤其時值豐原正在持續蛻變進化,像是機械產業鏈上中下游完整的豐洲科技工業園區,將進一步升級為智慧機械園區,再與中科后里園區相輔相成,串聯成高科技產業廊帶,未來有望超車中科與台中工業區,大舉吸引外商投資與科技人才,同時豐富專案二期園區會以「前店後廠」模式,推動運動與創新產業落地,勢必替本來就相當活絡的豐原經濟發展,扎穩未來長遠的競爭優勢。

有了地段、交通、產業助攻,豐原市區房市增值潛力無法擋,直接受惠於就業人口紅利帶動的購屋需求,目前市場預估「大宅豐鼎」在以七期DNA打造豐原地標的願景下,房價可望站上5字頭,預見將成為層峰菁英鎖定入主的優先標的。

13豐洲工業區
Photo Credit:富宇大宅豐鼎
豐洲科技工業園區將升級為智慧機械園區,可望與中科后里園區串聯成高科技產業聚落,吸引更多投資與人才,替豐原房市再添柴火。
16后科園區
Photo Credit:富宇大宅豐鼎
隨著國道四號豐原潭子段即將通車,加上多家科技大廠搶進中科后里園區設廠,在交通與產業雙助攻下,豐原房價繼續水漲船高。

猜你喜歡