Netflix與YouTube的「推薦系統」如何挑選影片給我?

Netflix與YouTube的「推薦系統」如何挑選影片給我?

我們想讓你知道的是

「推薦系統」早在1990年代就演變成一門獨立的學問,經過不斷的演進,今天的演算方式可以針對小數量的電影計算,保留最符合標準的電影,並捨棄其他,比早先的計算方式可以快上10倍以上。

推薦系統在現今社會可說是無處不在。當你在亞馬遜瀏覽網路書店時,網站上的推薦清單讓你更有機會找到有興趣的書籍;影音串流網站Netflix根據你看過的影集及電影給你專屬化推薦,讓你不必煩惱如何選片。推薦系統流派與方法的發展雖已趨於成熟,但在現今科技蓬勃發展、凡事講求快狠準的時代,如何兼顧速度與準確度,有效滿足社會需求,不被企業及消費者淘汰,仍有很大的進步空間。

推薦系統

1990年代中期,由於「評分結構」的研究逐漸受到重視,「推薦系統」於是演變成一門獨立的學問;在多數情況下,其可以被概括為「估計用戶對未知商品評分的問題」。一旦我們可以估計用戶對未知商品的評分,就可以找出分數最高的商品推薦給用戶。

假設:

C:所有用戶形成的集合;
S:所有潛在物品形成的集合;
u:為評估商品(s)對用戶(c)的效用函數(utility function),

針對某用戶c,我們希望能推薦一項在S集合中對用戶c效用最大的商品s。上述想法可簡單表示如下:

針對一用戶c,我們可以用一系列例如年齡、性別、所得的特徵來表示;同樣地,我們也可以用一系列的商品特徵來定義一商品s,以電影推薦系統為例,電影名稱、類型、導演與演員等,都可被用以定義s。

效用函數通常只在一部分的集合中有完整的對應值。例如在電影推薦系統中,一般收視戶可能只為一小部分的電影評過分,我們可以簡單的用戶—評分表格表示:

推薦系統的目標,就是以各種方法推估表格內空集合(Ø)的值。如此,我們才能從所有商品中選出最高分的前幾種商品推薦給用戶。

需要注意的是:所推薦的商品雖應與用戶喜好相似,卻也需與用戶過往的瀏覽紀錄有一定的區別,帶有一些新意,而非舊調重彈,例如針對同一事件但不同敘述的報導。依據估計評分的方式,可以將推薦系統大致分為「基於內容」、「偕同過濾」或「混和過濾」等三類(以下皆以電影推薦系統為例)。

  • 基於內容的推薦(Content-Based Recommendations)

此方法只運用用戶c評分過的電影資訊,去推測他(她)對未評分過的電影s的評分。核心概念是從該用戶已評分的電影中,找出n項與s最相似的電影,並推薦這些電影給該用戶。此方法可以透過兩種方式實踐:啟發式學習以及模型學習。

前者主要是運用一系列的關鍵字去代表用戶及電影,並計算用戶及不同電影之間的相似程度,相似程度的衡量可以用相關係數等指標量化;後者則是將模型套用到現有資料,學習並進而預測電影評分,許多模型都可以運用在推薦系統,諸如決策樹、貝氏分類器、類神經網路等。

  • 協同過濾推薦(Collaborative Recommendations)

此方法利用與用戶c相似的用戶群的資料,來推估c對電影s的評分。至於如何找到與用戶c有相似品味的用戶群,則可分為兩種方法——記憶式學習及模型學習。前者藉由兩用戶共同評分過的電影,來計算兩者間的相似度(可以用相關係數或餘弦相似性表示),並以此將中每位用戶對電影s的評分做加權平均,得到評分估計。後者則是直接將模型套用到所有用戶對該電影s的評分資料,學習並預測電影評分。

  • 混和推薦(Hybrid Recommendations)

上述兩種方法可以下列四種方式結合,截長補短,使得即使在評分資料稀少,如新用戶或新電影時,仍可適用:

  1. 分別運用「基於內容」與「協同過濾」兩方法預測評分,再結合兩者評分得到最終評分
  2. 將「基於內容」的用戶特徵加入「協同過濾」法內,以預測評分。兩用戶間用來計算相似度的特徵不再僅限於共同評分過的電影,也可以包含用戶的基本資料
  3. 將「協同過濾」的特徵加入「基於內容」內預測評分
  4. 發展一套結合兩方法之特徵的預測模型
lno2vxczoeuyhozcuuykjs6ag67x5b
Credit: Depositphotos

更省時的推薦演算法

上述方法奠定了推薦演算法的基礎,但卻有一個共同問題:運算時間。無論是基於內容、協同過濾或混合推薦法,都必須在瀏覽過所有電影及用戶資料後,方可開始計算。隨著資料量增長,計算時間也勢必大幅拉長,如何降低運算時間因而成為重要議題。今年(2018)7月12日機器學習研討會中,由哈佛大學電腦科學家Yaron Singer 與Eric Balkanski提出的演算法,能在短時間內找出最佳解,更聰明也更快速地解決問題。

相較於傳統電影推薦系統,需在瀏覽所有電影資料庫的電影後,方能列出推薦清單;新的演算法一開始只選取一定數量的電影,在這些電影之中找出最符合推薦標準的幾部電影,並捨棄未選上的電影,而後再由縮小後的資料庫中隨機選取一定數量的電影,保留最符合標準的電影,並捨棄其他,持續重複上述步驟。如此做法,創建推薦清單的速度是傳統演算法的10倍以上。

而其應用範圍,也不僅限於電影推薦。在另一個試驗中,這種新的演算法能迅速找出紐約計程車的最佳路徑,速度是傳統方法的六倍以上。除此之外,也可以加速資料處理的速度,並拓廣運用到如社群媒體或基因資料的分析。


編譯來源

參考資料

  1. Adomavicius, G., Tuzhilin, A. "Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions. "IEEE Transactions on Knowledge and Data Engineering 17(6), pp.734–749, 2005.
  2. Basu, Chumki, Haym Hirsh, and William Cohen. "Recommendation as classification: Using social and content-based information in recommendation." Aaai/iaai, pp. 714-720, 1998.

本文由教育部補助「AI報報─AI科普推廣計畫」執行團隊編譯,編譯者:陳育婷(台大統計碩士學程 ),原文發表於此

延伸閱讀


臺大科教中心講座:科學史沙龍(華山場)

講題:
1.【海洋微生物知多少】謝志豪|臺灣大學海洋研究所教授
2.【臺灣海洋科學研究:半世紀的風華】詹森|臺灣大學海洋研究所教授

時間:2019.05. 05(日)14:00-16:00
地點:華山文創園區中三館二樓拱廳

詳細資訊請參閱活動網頁

責任編輯:丁肇九
核稿編輯:翁世航


猜你喜歡


2022網路使用調查:台灣家用連網裝置需求增,宅家防疫Wi-Fi滿屋專案逗相挺

2022網路使用調查:台灣家用連網裝置需求增,宅家防疫Wi-Fi滿屋專案逗相挺
photo credit:shutterstock

我們想讓你知道的是

根據關鍵議題研究中心的調查報告,台灣多數家庭仍為寬頻上網所苦,不僅費用過高,所獲得的上網速率、品質也不理想,無線網路的建置更是許多人的痛處。台灣大寬頻推出完整解決方案,不僅讓你宅家防疫擁有1G高速網路和影音娛樂,最新Wi-Fi 6+Mesh無線網路也幫你裝到好。

戴口罩、勤洗手,維持個人良好衛生習慣,已是全球新冠肺炎疫情肆虐下的日常。後疫情時代,許多人享有在家上班的權利,隨之也更依賴隨選視訊、線上會議、遠距教學,加上眾多線上遊戲、串流影音服務陸續登台,對家用網路是個不小的傳輸負擔。

由於行動網路(如4G、5G)的特性,頻寬是由該基地台與所有連線的手機共同分享,因此回到家中後,大多數人會切換到有線寬頻網路或是無線Wi-Fi,但隨著對網路的依賴加深、連線裝置越來越多,該如何建置穩定且高速的無線上網環境,可就不是人人都會的技能。就讓我們透過TNLR關鍵議題研究中心的網路調查,了解現代民眾對於上網的需求究竟有多高?

第三方市調顯示:民眾上網需求提高,快又穩定的家用網路為唯一首選

根據關鍵議題中心最新的調查,年齡20歲至45歲的台灣民眾並以上網人口比例加權,每日平均上網時間達5.1小時,能夠得知現代人對於網路使用已有相當高的依賴性;約六成的民眾集中於每日2小時至6小時之間,另有超過兩成的比例,每日上網時間高達8小時以上,可說是吃飯、工作、娛樂幾乎都離不開網路。

3
Photo Credit: 關鍵議題研究中心
根據關鍵議題中心最新的調查,年齡20歲至45歲的民眾,每日平均上網時間達5.1小時,超過兩成民眾上網甚至高達8小時以上。

由於電信業者過去的499之亂,以及部分業者推出低速率吃到飽的資費方案,在調查當中也顯示出將近七成的民眾,選擇使用行動網路(如4G、5G)作為主要的上網方式,家用網路(含Wi-Fi)則是接近四成。不過有趣的是,使用家用網路時,約有八成五的比例享受影音娛樂、將近六成則是用來玩遊戲,顯見多數民眾也知曉行動網路的極限,尖峰時段的頻寬和延遲表現不佳,轉而使用比較穩定的家用網路,也讓電視、電腦、手機等多種設備能夠同時上網。

3
Photo Credit: 關鍵議題研究中心
部分電信業者推出低速率吃到飽方案,讓近七成民眾選擇使用行動網路作為主要的上網方式,但隨著電信業者逐漸整併和5G基礎建設成本大幅度提升,未來充滿許多變數。
4
Photo Credit: 關鍵議題研究中心
影音娛樂、上網打遊戲,分別需要極高的頻寬和極低的延遲,這也是家用網路的強項。

不過即便是家用網路,各家業者的競爭也是不遑多讓;其中讓消費者最感不悅的,當屬超過六成比例的網路品質問題,接著是多裝置上網後的速度變慢,以及家中空間造成的Wi-Fi收訊不良……等問題。因此除了對外頻寬速度、穩定度之外,消費者同樣也在意家中Wi-Fi無線網路的速度與訊號覆蓋率,需要業者提供完整的解決方案。

5
Photo Credit: 關鍵議題研究中心
網路連線品質仍是多數消費者心中的痛,接著就是家中上網裝置越來越多造成的搶頻寬問題,以及Wi-Fi無線網路訊號的速度與覆蓋率。

1G上網速率、最新Wi-Fi 6無線網路、Mesh網狀無線網路隨處用

根據現代人各項使用網路的痛處,以及切合目前在家防疫的需求,台灣大寬頻推出「防疫短期」專案,6個月約期每月只要699元起,除了享有120M上網速度不限流量之外,還有免費的4K Android機上盒,近萬部MyVideo優質好片看到飽,更享有防疫級安裝,工程人員進屋安裝前將依國家級防疫規格清潔、消毒,讓你享有高速、超值、最安心的上網體驗。

更棒的是,每個月費用270元的Disney+隨選影音串流服務,防疫短期專案也提供3個月無限暢看!讓使用者能夠享受迪士尼、漫威、星際大戰、皮克斯、國家地理、Star等六大影視娛樂品牌,讓您在家防疫不無聊!

6
Photo Credit: 台灣大寬頻
台灣大寬頻推出「防疫短期專案」,簽約6個月、每個月699元起,即可享有優質的對外網路連線,以及免費的影視內容,再加碼享3個月的Disney+,觀賞100多部4K超高畫質和HDR影片!

若網路需求較高,如多人大家庭、透天厝……等,不妨考慮「Wi-Fi滿屋」專案。此專案能夠免費租用1台Mesh子機,與原有的Wi-Fi功能數據機一同提供更好的訊號覆蓋範圍,1G高頻寬速率方案更能夠免費租用2台。Mesh Wi-Fi透過無線方式相互連結母機與子機,不必為了安裝有線網路破換家中既有裝潢,即可立即提升訊號覆蓋範圍,且使用同一個SSID即可全屋無線漫遊,不用手動切換方便許多。

shutterstock_526662046
Photo Credit: shutterstock
Mesh Wi-Fi透過無線方式相互連結母機與子機,不必安裝有線網路破壞家中裝潢,即可立即提升訊號覆蓋範圍,並享有斷線自動路徑修復、同一SSID免切換等方便功能。

更棒的是,只要申辦「Wi-Fi滿屋」500M速率以上的寬頻方案,直接升級為最新的Wi-Fi 6無線網路,相較前一代Wi-Fi 5快兩倍、傳輸延遲更低、容納更多裝置同時連線、更省電,且相容於近期1~2年所購買的裝置。若是不需要Mesh子機,還可以選擇雲端遊戲平台GeForce NOW白金方案6個月+羅技有線搖桿、奧創插座+momo紅利金最高1,000元、Uniigym體感健身課程一年、瑪帛電視電話3個月等好禮任擇一,輕鬆在家玩遊戲、購物、運動、與親友聯繫!

1
Photo Credit: 台灣大寬頻
「Wi-Fi滿屋」專案免費借用Mesh子機,提升家中無線訊號覆蓋範圍,1G速率更能夠免費借用2台!還有MyVideo免費看2年、免費升級4K Android機上盒 + 藍牙聲控遙控器、加購Disney+年約年繳送您6個月等多重好康。
2
Photo Credit: 台灣大寬頻
「Wi-Fi滿屋」500M速率以上立即升級至最新、最快的Wi-Fi 6,免費享有速度提升、連線裝置數量增加、傳輸延遲更低……等多種好處,並相容近年購買的裝置,立即享用高速無線網路!

台灣大寬頻性價比高,領先其他同業

根據調查,多數人每月願意負擔的家庭網路費用為新台幣千元以下,比例超過八成,整體平均金額為新台幣656元。台灣大寬頻每月只要699元起,就可以享有120M網路和免費借用1台Mesh子機,最快的1G頻寬每月也只要999元,而且1G寬頻方案可免費借用2台Wi-Fi 6 Mesh子機,相較老牌電信1G上網每月2,399元,可說是十分划算。

3
Photo Credit: 關鍵議題研究中心
超過八成民眾每月願意負擔的家庭網路費用在新台幣千元以下,台灣大寬頻分別提供120M/699元、300M/799元、500M/899元、1G/999元等方案,讓您可以根據預算和需求進行選擇。

除了提供優質且吸引人的上網方案,台灣大寬頻更重視上網品質,使用HFC混合光纖同軸網路,選擇成本較高、傳輸穩定的光纖作為骨幹網路,最高可以申請1G速率,且可供裝區域比老牌電信更多。免電路月租費、不限流量,數據機直接內建路由器和Wi-Fi無線網路功能,開機即上網,不用額外購置無線路由器,更不必費心繁雜設定。

還在煩惱在家防疫該如何選擇快又穩定、方案超值的家用網路專案嗎?台灣大寬頻是您的優質首選,立即使用、高速上網、影視資源、無線網路等多個願望一次滿足。

台灣大寬頻【防疫短期】專案請點我

台灣大寬頻【Wi-Fi滿屋】專案請點我

更多方案請洽台灣大寬頻 網路門市 請點我


猜你喜歡