擁有大筆資料就沒問題?關於大數據,那些新創與線上企業沒學會的事

擁有大筆資料就沒問題?關於大數據,那些新創與線上企業沒學會的事

我們想讓你知道的是

來自線上與新創企業的大數據經驗談有時很受用,卻未必永遠是對的。什麼是這些企業還沒學會的事?

作者:湯瑪斯.戴文波特(Thomas H. Davenport),曾獲《顧問》(Consulting)雜誌提名為全球二十五大顧問,是齊夫.戴維斯(Ziff Davis)出版社的「資訊科技百大最有影響力人物」之一,也是《財星》雜誌全球五十大商學院教授之一。

新創與線上企業沒學會的事

雖然來自線上與新創企業的大數據經驗談很受用,這些企業的所作所為卻未必永遠是對的。有些狀況下,它們其實提供的是負面教材。這些錯誤示範或許不會讓公司垮台,也不是每家公司都如此,但是卻可能因為這些錯誤的做法,而導致新創企業的成功變得比應有水準差一點。

一、未與顧客分享資料

大數據較敏感的議題之一是,顧客對關於自己的資料,或者是從自己的線上活動中產生的資料,到底能夠掌握多少?聰明的公司會基於一些建設性的用意,而把這樣的資料提供給顧客使用。例如,企業可藉此更為了解顧客如何使用公司的產品或服務。

大多數線上企業都不太善於讓顧客知道,他們掌握了顧客的什麼資料,也不太善於把資料分享給顧客本人使用。臉書與Google常會因為對於顧客資料缺乏透明度,而與顧客、媒體,以及政府執法人員發生衝突。Google確實會提供顧客一些關於他們的資料,像是個人搜尋紀錄,以及你如何使用該公司的其他產品(見Google儀表板:Google Dashboard),也會告知顧客提供了什麼用戶資訊給政府。但還是有很多資料是顧客不知道的。

在這件事情上,大企業算是最先進的,雖然對任何人來說都還屬於初步階段而已。例如,聖地牙哥天然氣與電力公司(San Diego Gas & Electric)透過「綠按鈕」(Green Button)計畫,讓希望自行分析用電狀況(藉以節省用電)的顧客,可以使用自己最長達十三個月的用電資料。歐洲行動通訊業者橘子電信(Orange)訂出以顧客為中心的資料隱私政策,並已推出一些讓顧客能夠控管自己通訊資料的計畫。

二、為收集資料而收集資料

有些新創企業以及亞馬遜、Google等財力雄厚的線上企業,都會為了編整資料而編整資料。這些公司相信,資料有一天遲早派得上用場。Google會從顧客身上以及顧客的行為中,收集幾乎所有能夠收集的資料,有時還在根本不該收集時收集。最知名的例子是,Google的街景地圖繪製計畫在街景車開過去時,也會收集到別人未加密的Wi-Fi資料。這些公司都有足夠資源,才能如此漫無目的收集資料。雖然我覺得,如果他們能在收集資料前就先想好要用在什麼地方,這些公司會更為成功。

有些大數據的新創企業一開始就有一批資料,卻不是百分之百清楚該如何運用。但這對新創企業來說比較不是問題,因為它們基本上會面對來自投資人的壓力,必須在很早的階段就承諾採行某種商業模式。這兩家企業都是很快就為產品與商業模式找到焦點。

從大量資料中篩選,以找出裡頭可能埋藏著什麼金塊,其實頗有意義。不過,漫無目的瞎篩一通,可能是極耗成本與時間之舉。腦中先有假說畢竟較為妥當,特別是在開始收集大量資料之前,甚或在開始分析之前也是。

位於波士頓的大數據新創企業作業資料分析(Operating Analytics)公司,就是行事聚焦的好例子。該公司運用資料與資料分析,協助醫院將手術室的使用最佳化。

手術室是要價不菲的資源,但是在同一家醫院內部或不同醫院之間,手術室的使用率卻可能有很大的落差。想把手術室的使用最佳化,牽涉到複雜的分析過程,要分析的包括手術室內的房間與專業設備、病患、可安排的醫生與助手,以及病患住院天數與再住院比率等結果變數。醫院很難自行做這樣的分析,但若有更好的解決方案,卻又能輕鬆讓營收實際增加。作業資料分析公司目前還在創立的初期,但我認為,這種聚焦於明確的企業問題與明確顧客的做法,往往勝過在大數據的汪洋裡大海撈針。

三、談太多技術的事

大數據產業─特別是矽谷那些大數據技術的供應商,但有時也包括其他類型的公司在內─都很迷戀技術。無論是公司內的討論內容和素材,或是為了在公司外使用而製作的行銷素材,都給人很技術的感覺,導致非技術背景的人很難理解。

很多這類公司的網站,都會盡情地四處提及技術專有名詞。有些會吹捧「在Hadoop上跑SQL」,卻幾乎或完全不說明它的意義或有何重要之處。某網站保證「Hadoop:帶著Apache YARN超越批次」,卻同樣對什麼是YARN沒有詳細陳述,但是又清楚寫出「是Hadoop 2.0的基礎」。這個問題或許部分原因在於阿帕契基金會發布的開放原始碼計畫名稱:Apache Hadoop、Apache Flume、Apache HBase、Apache Mahout、Apache Oozie、Apache Zookeeper等等。

一個毫無技術背景的企業管理者,對這樣的專有名詞會做何感想?就連IBM這家在幾十年前最先探討商業導向資料處理的公司,有時候也忍不住滿口技術用語。例如,在該公司一篇以「何謂Hadoop」為標題的短文裡,就包括這樣的用詞:「這些叢集的彈性靠的不是高階硬體,而是來自於軟體在應用程式層級偵測與控制錯誤的能力。」