港男靠Big Data搞網媒賺錢,將數據化成「寫手指南」 創意末日?

港男靠Big Data搞網媒賺錢,將數據化成「寫手指南」  創意末日?
Photo Credit: Reuters / 達志影像

我們想讓你知道的是

有留學澳洲的香港男生以大數據搞網媒成功「發圍」,究竟利用大數據的模式挑選寫作方式,對往後的媒體生態有何影響?作者先為你將他的故事和思考說一次。

這原本是第一篇的内容,沒料到最終要寫到第四篇才寫到。這篇會是終章,必須直入「數據亅如何進入了媒體的營運並且帶來所謂的「數據主導新聞學」(Data Driven Journalism),文末也會寫到我對數據主導下的網媒的憂慮 。

十數人經營的網媒,每月瀏覽量超越兩千萬

先來說一個經典個案,若果你經常留意網媒新聞,你必定聽過它,若果你仍未聽過它,我認為你必須花數分鐘讀完拙文。

它的名字叫做Lifehack,網址是http://www.lifehack.org 。Hack有坎、劈的意思,另外,也有解作journalist、correspondent、newspaperman,即「僱傭文人」。Life就不用解釋了吧。

先説一説它如何厲害,去年每月的瀏覽量已經超越2,000萬,訂戶超過20萬,目前的Facebook專頁的粉絲有867,000人,最厲害的是它只有十數人在經營,大部份是程式員,主力編輯一人,她叫Anna,並且不需要聘請大量寫手,最最厲害的是有錢賺,而且跟隨著閱聽人數的增加而不斷上升!不容易吧!就連香港No.1網媒《壹傳媒》(可以這樣稱呼它吧,因為這個媒體集團正不斷收縮紙媒,並擴展網媒)也在虧蝕中,Lifehack是怎樣做到的呢?!很想知道吧!

「文章篩選閱讀神器」監視網絡文章

好了!讓我們從頭説起,2005年,二十五歲的香港留學澳洲青年何樂頌(Leon),業餘地創辦了Lifehack.org,內容主要圍繞人際關係、職場要訣,也就是説目標讀者群是上班一族,網媒定位清晰明確,容易操作及推廣,這是Leon行出正確的第一步。

Leon一開始就選擇以英文作為網媒的語言,潛在的讀者就擴展至全球的英語人,這是他行出正確的第二步。以業餘時間經營了兩年,每月的瀏覽率達到100萬,廣告收入超過了正職薪資,看到了前景,Leon決定全身投入,並把這個網媒帶回香港擴展經營。

這是故事的上半部,現在進入故事的最重要部份,就是Leon如何利用「數據」不斷壯大Lifehack。Leon找電腦程式員寫了一個「文章篩選閱讀神器」(「神器」),監視著200多個全球最受歡迎的網媒上不斷更新的海量文章,透過運算程式計算出每篇文章的受歡迎程度,包括在Social Media獲得的Like和Share數,若是文章達到了指標,「神器」就會把有關的文章Highlight。

全球二千寫手按「寫作指南」寫文

之前提及的編輯Anna,她的其中一個主力工作就是透過解讀「神器」的結果,抓著最受歡迎的題材,硏究文章的結構、寫作風格、用字、配圖等等,然後編寫一份「稿單」,發給Lifehack的「特約寫手」,稿單內已列明寫作方向、風格、用字等的指導。Anna每天發出60至80篇(今時今日或許更多)稿單,Lifehack全球有超過2000名「寫手」(或稱為博客),當中有約500名是活躍寫手。這些寫手都獲得一份詳盡入微的「寫作指南」,按著來寫文章,就可以得到良好的Social Media表現(Social Media Optimization SMO)。這份「寫作指南」是如何得出來的呢?就是由Lifehack經過日積月累研究受歡迎的文章後歸納出來的。

Robot收集數據監視文章SMO表現

好了,有了「寫作指南」,也不代表每一名寫手都成為網文高手,Lifehack開發了一個名為「Robot」的數據收集及分析系統,監視著Lifehack每一篇文章的SMO表現,有多少個Like,有多少個Share。得到高SMO的寫手就可以留低,表現欠佳的就會被Out。

就是這樣,Lifehack彷彿成了一個「網文實驗室」,每一篇文章的表現都有客觀的數據作統計及分析。有時為了分析更加細緻準確,Lifehack開初時會將一篇文章作不同的處理,例如有不同的標題、不同的Infographic,即所謂的A/B題,網民會看到不同的版本,Robot再搜集Social Media的數據,看那一個版本會獲得更佳的SMO效果,下一步就是按著數據結果決定最終用那一個版本。

就是透過這種數據的收集和分析,Lifehack的文章得到了愈來愈多的like和share,網站的訂戶數和各種社交媒體專頁的粉絲數亦直線上升。

事實上,Lifehack也不算是創先河,赫芬頓郵報(Huffington Post)的創辦人之一Jonah Peretti,他也是BuzzFeed的創辦人,就是引用了上述的「數據搜集與分析」、「A / B題」等方法,將赫芬頓郵報與BuzzFeed推上成為最成功、最多人看、市值最高的網絡媒體。

數據主導下,「新聞價值」無人再提

這種「數據主導」(Data Driven)的經營手法也有不少爭議的,其中最大的爭議是新聞網絡媒體由「編輯主導」(Editor Driven)轉為「數據主導」。90年代初,壹傳媒將「市場主導新聞學」(Market Driven Journalism)引進香港,「數據主導新聞學」其實只是「市場主導新聞學」的極致落實,「新聞價值」(News Worthiness)這個詞彙在新聞房(News Room)已經消失,新聞寫作與標題都受到數據的影響。

以計算取代嘗試,以精準取代探索


猜你喜歡


【影音】整理數十萬張空拍影像,就像一場馬拉松:看見・齊柏林基金會「數位典藏」計畫

【影音】整理數十萬張空拍影像,就像一場馬拉松:看見・齊柏林基金會「數位典藏」計畫
Photo Credit:TNL Brand Studio

我們想讓你知道的是

「透過影像為環境發聲」是齊柏林畢生在做的事,也是看見・齊柏林基金會要接力做下去的事。打造一座把台灣存起來的影像資料庫,讓齊柏林留下的影像資產得以傳承世代,「數位典藏」計畫需要你我一同支持響應。

2017年,《看見台灣》的導演齊柏林匆匆離開這個世界,留下無數珍貴空拍影像資產;這些跨越1990年代到2017年、長達25年台灣自然與人文地景變遷的真實紀錄,不只保留了台灣之美,更在學術研究、環保倡議和環境教育上有著無可取代的價值。然而,龐大的影像素材需要經過「數位典藏」才能被有效應用,因此「看見・齊柏林基金會」成立的初衷,就是為了承接數位典藏的使命,讓齊導畢生的心血,能夠世代傳承,發揮永續的影響力。經過兩年的摸索,基金會最終研擬出最合適的數位典藏計畫,不只將齊導作品數位化、分類歸檔,更要建置線上影像資料庫,並將繼續記錄台灣的使命傳承下去。

根據看見・齊柏林基金會統計,齊柏林導演在空中拍攝超過2500小時所累積的影像,約為10萬張空拍底片、50萬張數位照片,上千小時的空拍影片;要為如此龐大的影像資料建檔與整理,勢必耗費許多金錢、時間與人力。不過,只要能集結眾人之力,這一場數位典藏人員及專業志工接力的馬拉松,將會是美麗而撼動人心的一段旅程。

「數位典藏」做什麼?

數位典藏(digital archive),意思是將有保存價值的實體或非實體資料,透過數位化(諸如攝影、掃描、影音拍攝、全文輸入等)與加上屬性資料等詮釋資料(Metadata),建立數位檔案的形式,作為永久保管儲存。

而看見・齊柏林基金會的數位典藏計畫可分為三大工作線,分別為:

  • 傳統底片組:挑選底片→掃描成數位檔案→建立屬性資料→歸檔
  • 數位照片組:挑選照片→建立屬性資料→歸檔
  • 空拍影片組:挑選影片→建立屬性資料→歸檔

除了要將齊導留下來的影像作品數位化歸檔,數位典藏計畫還包括改版建置「iTaiwan8影像資料庫」,也就是建設完整的線上影像資料庫系統,讓齊導作品更便於靈活運用,也能讓更多世人看見。

飛行2500小時累積的空拍影像,怎麼整理?

  • 整理底片/數位掃描

數位典藏組專員詹宇雯的工作,是負責整理傳統底片。即便存放在防潮櫃中,傳統底片仍面臨逐漸老化褪色的壓力,需要與時間賽跑進行數位化保存;然而大多未經篩選的10萬張底片,有些因為直升機震動導致些微的畫面模糊,也有因飛行路線連續較重複的地景構圖,而詹宇雯的其中一項任務,就是拿著放大鏡一一檢視精挑,並標註定位和勘誤照片資訊。

「整理底片最常發生的問題就是人工出錯,因為以前留下的資料可能是齊導或其他志工整理出來、用手寫的,貼紙可能貼錯或資料寫錯。」詹宇雯說起某次經驗,當時有一張台北車站的照片被貼了很多年份,為了找出正確年份,她試圖辨識照片裡招牌跑馬燈上的氣溫、股市市值等資料,交叉比對推斷出正確年份。雖然偶有這種偵探辦案一樣的趣事,但大多數時候是耗費專注度與眼力的過程。

完成底片挑選的階段,接著進到底片掃描數位化。然而,這步驟並不容易,除了整體的影像品質控制與檔案管理,齊柏林導演留下的底片最遠距今至少11年,老化褪色的底片容易出現色彩偏誤,須進行色彩還原,再修掉畫面上的髒點、存成解析度高的數位影像才算完成。

image3
Photo Credit:TNL Brand Studio
整理傳統底片的過程,必須拿著放大鏡一一檢視精挑,標註定位和勘誤照片資訊。
  • 建立屬性資料

所謂「建立屬性資料」,其實就是為影像添增各種描述紀錄的資訊,有了這些資訊,龐大的影像資料才能被有效率的搜尋、管理。數位典藏組副組長陳宣穎表示,以齊導拍攝的影像為例,包含:拍攝主題、地點及詮釋地景的關鍵字都屬於此範疇;而其中投入最多時間的便是「定位」和「建立關鍵字」這兩項任務。

「定位」指的是找出拍攝主體所在地點和座標,有時可透過既有的飛行軌跡紀錄來推測,但更多時候是在沒有軌跡紀錄的狀態下,憑藉地理知識及照片上的蛛絲馬跡判讀位置。如果影像拍攝年代久遠,或是地景變化很大,就需要運用更多歷史圖資或佐證資料去搜索、推論。

「我們要一張一張照片判讀,建立屬性資料。像是早期的傳統相機沒有定位功能,常常看到照片中只有一大片山稜線,此時我們就要仔細比對地圖、衛星影像,想辦法查找,盡可能貼近正確。」陳宣穎說。

「建立關鍵字」看起來似乎相對輕鬆,然而事實上,光是決定有哪些關鍵字可以使用,就是一門功夫。第一步必須辨認影像中的景物,例如一塊農田種植的是什麼作物,就必須蒐集其他資料輔助判斷;其次,由於空拍照片尺度不一,在畫面中佔比多大的景物需要設立關鍵字,也需要經過討論訂定規則;最後,還必須從使用者的角度思考,依據一般人的搜尋習慣設立關鍵字。

因此,在建立屬性資料的過程中,看見・齊柏林基金會也特別諮詢多位專家,共同研究規劃出適合台灣空中影像的關鍵字建置邏輯,並以此基礎進行分門別類、校正檢核,確保影像被妥善歸納及運用。

image2
Photo Credit:TNL Brand Studio
建立屬性資料時需要大量對比地圖,並依照訂定好的規則建立屬性資料,使歸納邏輯一致。
  • 影音資料典藏

相較於照片整理,動態影片的典藏工程更為多元複雜。首先,要針對近千小時空拍影片進行盤點,接著進行特殊格式轉檔與備份,再逐步建立邏輯編碼、標示檔案管理方式,以推動後續屬性資料建立。

「影片整理最大的兩個挑戰,其一是影片內容橫跨的範圍很大,導演可能是台中起飛、屏東降落,因此要去判斷每個影片節點的地景定位;其二是飛機上升的垂直範圍很大、晃動又劇烈,有時候會遇到『果凍效應1』致使內容失真。」影音製作組專員鄭宇程說明,由於各時期的影片拍帶檔案格式、影像內容品質、影片時長都不同,大大增加了管理建檔難度。

image4
Photo Credit:TNL Brand Studio
影音資料的典藏,需要讀取大量的檔案,逐格檢視、分段建立屬性資料、調色等。

加入數位典藏的馬拉松,傳承接棒台灣之美

從一步步定義操作流程、統一色彩管理語言、購置影像處理設備等,到培訓志工與實習生、讓人力支援一步到位、避免巨量資料的協作過程中出現錯誤,都是數位典藏計畫的範疇。多元內容創意部副總監王俐文表示,「數位典藏」四個字說來簡單,但過程繁複龐雜,需要所有人一致的專注、耐心、細心、以及熱忱。

「iTaiwan8影像資料庫」作為看見・齊柏林基金會數位典藏計畫的目標之一,改版上線只是第一步,接下來除了完成龐大影像資料的典藏,更大的挑戰是要繼續記錄台灣,讓影像不會只停留在2017年。

「透過影像為環境發聲」是齊導畢生在做的事,也是基金會要接力做下去的事。而數位典藏計畫,就是齊導生命的延續,也是基金會動力的源頭。要打造一座把台灣存起來的影像資料庫並不容易,看見・齊柏林基金會亟需各界的支持,共同建置屬於台灣最美的影像資料庫。讓我們一起守護齊柏林留下的影像資產,讓土地脈動的珍貴影像得以傳承世代,發揮更多價值。

捐款支持看見・齊柏林基金會,透過影像為環境發聲


註1:果凍效應(rolling shutter)是數位相機CMOS感光元件的一種效應,當使用電子快門來拍攝高速移動的物件時,原本垂直的物件拍攝出的畫面卻為傾斜甚至變形。(資料來源:維基百科)


猜你喜歡