什麼書會暢銷?數據比你知道得更多

什麼書會暢銷?數據比你知道得更多
Photo Credit:研之有物

我們想讓你知道的是

誰在買書?買什麼書?這是規劃出版與行銷計畫時,需考量的因素,過去僅能用專業經驗判斷,現在透過資料分析與機器學習,可以用客觀的科學輔佐主觀的決策。

執行編輯:林婷嫻
美術編輯:張語辰

「數據分析」結合「機器學習」,探勘書市商機

誰在買書?買什麼書?這是規劃出版與行銷計畫時,需考量的因素,過去僅能用專業經驗判斷,現在透過資料分析與機器學習,可以用客觀的科學輔佐主觀的決策。中央研究院資訊科學研究所陳昇瑋研究員,帶領資料洞察實驗室,找出書籍銷售數據中潛藏的商機。

資料科學:先搞懂如何發生,再讓它發生

1
Photo Credit:研之有物
資料分析的四個階段:描述、診斷、預測、指示。(資料來源:Gartner/圖說改編:張語辰)

資料分析並非輸入數據、按下Enter鍵,就能得到立即性的結果,其工作至少可分為四個層次:

  • 描述:瞭解眼前發生了什麼,例如讀者是什麼樣貌
  • 診斷:用電腦來診斷眼前這件事為何發生,例如某些書籍的銷售為什麼特別好
  • 預測:未來會不會發生某件事,例如預測新書的銷售表現
  • 指示:如何促進某件事在未來發生,例如建置自動薦購系統或上架小工具,幫助提升新書銷售;或是幫書籍做更合適的命名以及封面設計

資料分析跟淘金一樣困難,若沒有以正確的方式使用合適的工具,什麼價值也淘不出來。

分析原始資料就像在砂礫中淘金,雖然不用冒著日曬雨淋的痛苦,但需長時間與電腦折騰,結合數學、統計、機器學習、資料探勘與資料視覺化的專業,整理資料的邏輯,找出隱藏在數據中的含意。若遇到非結構化的資料,在分析前尚需花額外的心力半自動或手動地將之轉換為結構化資料,才能使用分析技術來處理。但正因資料分析可以找出隱藏在數據中的洞察、輔助人類的思維,是一門值得投資心力的科學。

中研院陳昇瑋團隊與博客來合作,將2014年12月至2016年3月間的匿名購書資料,結合政府資料開放平臺的數據,包含各個地區的綜合所得稅申報情況、教育程度、2016 年總統大選得票數等,探討購書行為和讀者生活型態的相關性,將不同購書客群之間的「差異性」數據化,藉以回答誰在買書、買什麼書、什麼書會暢銷等問題,進而將資料科學的思維引入出版界,讓出版人不用再只是憑著經驗及感覺選書及做書。

什麼人在買什麼書?

2
Photo Credit:研之有物
博客來各類購書讀者:性別x年齡(資料區間為2014年12月至2016年3月間)(資料來源:陳昇瑋提供)

從博客來的匿名消費資料,顯示讀者基本樣貌與購書興趣為:男性較多購買自然科普、電腦資訊和商業理財的書籍,女性較多購買親子教養、飲食、童書和青少年文學。長輩較多購買童書、宗教命理和醫療保健的書籍,而年輕人較多購買輕小說、漫畫和語言學習的書籍。

一樣米養百樣人,一種書也養百種人

在規劃出版與行銷策略時,有一個盲點常被忽略:

不能將同一個書籍類別的讀者,都視為同樣一個族群。

過往看銷售報表與會員資料時,經常會把讀者視為只有一種樣貌:例如財經讀者就是白領階級。但陳昇瑋與團隊定義「差異式讀者樣貌分析」,一層一層深入子類別探勘資料,證實同一個書籍類別亦存在「多重客群」。

以「小說」這個大類別為例,愛看「小說」的不會只是同一群人,例如都是戴著眼鏡的文青。同性愛小說和愛情小說的讀者主要是年輕人,而歷史武俠和文學研究的小說,讀者群以長輩為主。若進一步深入分析武俠小說中的「金庸」這個子類別,更存在兩種主要客群:15歲以下的青少年和40~50歲的中年人。

這反應出一個課題:出版與行銷規劃需更分眾、更精準,無論是溝通的宣傳語言、購買的行銷版位,皆需考慮多重客群的存在。

3
Photo Credit:研之有物
博客來讀者樣貌差異:文學小說類別(資料區間為2014年12月至2016年3月間)(資料來源:陳昇瑋提供)

從購書數據一窺社會現象

世間男女情愛糾葛,李組長眉頭一皺發現事情並不單純,這種社會議題不只在電視劇或新聞中出現,也顯現於購書行為中。

在商業理財的類別,存在許多教導如何成功的書,數據顯示25歲以前偏好購買「生涯規劃」類的成功經驗書籍,而30歲之後改買如何「致富」的成功指導書籍,顯示30歲大關是人生覺悟的交叉點,與其花時間規劃生涯卻前途迷茫,快速致富還比較實際,但也可能因為30歲之後除了養自己也要養家人,肩膀壓力更重了。

另一方面,低收入族群偏向購買「投資理財」、「網路創業開店」的書籍,高收入族群則偏向購買「傳記」、「快樂學」的書籍,顯現M型社會下兩種不同人生方向與思維,有錢人需要學習如何快樂,而中產階級正朝著累積財富努力。

「外遇離婚」相關的書籍,會購買的族群大多年收入超過70萬,年收入越高,購買者越多,箇中含意不便多加著墨。

若將男性與女性消費者購買的書籍類別和數量,以書籍關鍵字作成文字雲,明顯看出男女想法大不同。在「心理勵志」這個書籍類別中,男性多關注「把妹、正妹、搭訕」,書中自有顏如玉是從古至今不變的智慧。而女性多關注「幸福、療癒、女人」,顯示現今女人越來越懂得要愛自己,是個樂見其成的社會風氣。

4
Photo Credit:研之有物
博客來讀者性別偏好的差異:心理勵志類為例(資料區間為2014年12月至2016年3月間)(資料來源:陳昇瑋提供)
5
Photo Credit:研之有物
博客來讀者性別偏好的差異:飲食類為例(資料區間為2014年12月至2016年3月間)(資料來源:陳昇瑋提供)

無論是賣書或餐飲業,都值得注意年輕人與長輩的喜好差異。「甜點、雞尾酒、廚藝、咖啡」相關書籍熱銷,與近來市場上年輕族群的甜點學校、咖啡開店熱潮相輔相成。而長輩較喜歡「健康、養生、好吃」相關書籍,對於市場而言,開發同時符合健康及好吃需求的餐飲,是顯著的商機。

「養生」這個書名關鍵字,在「飲食類」受到長輩歡迎,但在「醫療保健類」在銷量上並沒有同樣得到大眾的青睞。

陳昇瑋與團隊以「書名關鍵字」,找出關鍵字與暢銷書之間的相關性。在醫療保健類發現,「養生」這個關鍵字不受讀者歡迎,反而是「名醫、改善、療法、奇蹟」這類關鍵字能抓住讀者的眼球與荷包。也許這反應出一個醫療保健現況:在一秒鐘幾十萬上下的今日,人們不注重花費時間經營的健康之本──日常養生,而是在症狀出現時追求速效的醫療結果。

6
Photo Credit:研之有物
書名關鍵字與銷量的相關性:以博客來醫療保健類別為例(資料區間為2014年12月至2016年3月間)(資料來源:陳昇瑋提供)
7
Photo Credit:研之有物
書名關鍵字與銷量的相關性:以「輕鬆」為例(資料區間為2014年12月至2016年3月間)(資料來源:陳昇瑋提供)

「文字」在不同環境中,會發揮不同力量。同一個書籍關鍵字,在不同書籍類別中,會產生不同的銷售表現。例如,「輕鬆」這個字是行銷時常使用的關鍵字,彷彿在告訴消費者一旦買了這個產品,就能豪不費力地享受好處。對於「輕鬆投資、輕鬆存錢、輕鬆提升業績」這類輕鬆致富的願景,讀者們的想法是「反正我是信了」。但如果在不努力就沒有收穫的語言學習類別,就算告訴讀者「輕鬆說英語、輕鬆搞定文法、輕鬆學日文」,銷量顯示讀者們不會買單。

哪些書會暢銷?除了財神,也能問問電腦

以上內容尚處於資料分析的「描述」和「診斷」階段,真正有意義是分析的第三階段「預測分析」,藉由機器學習技術自動歸納出書籍銷量與各式書籍屬性的相關性,進而建立銷售表現的預測模型。

「機器學習」的作法為,讓程式自動學習哪些因子是重要的,預測某本書成為暢銷書的機率。

8
Photo Credit:研之有物
書籍銷售表現的預測模型(資料來源:陳昇瑋提供/圖說設計:張語辰)

在「預測分析」這個工作階段中,陳昇瑋團隊運用「書籍屬性」、「書名關鍵字」及「上市前的市場狀況」來發展暢銷書預測的模型,以文學小說類別測試,其暢銷書的預測準確度可以接近八成。預測分析的最終目的為「指示型分析」,也就是資料分析的第四個工作階段,透過程式的指示提供最佳化建議,例如書名及副標怎麽下、書介如何編排、預覽圖片要放哪幾張、如何訂價及折扣等等,協助拉近書籍與目標消費者的距離。




台美減碳有「共同國家策略」!專家看好低碳汽油合作

台美減碳有「共同國家策略」!專家看好低碳汽油合作
Photo Credit:財團法人環境與發展基金會、美國穀物協會

我們想讓你知道的是

財團法人環境與發展基金會攜手美國穀物協會舉辦「全球推動低碳汽油融入淨零碳排趨勢系列座談」,邀請台美專家共同與談,專家表示,低碳汽油減碳成效佳,已助力全球60餘國的運輸減碳,台灣應將低碳汽油納入2050淨零碳排國家戰略,加速運輸部門邁向零碳。

財團法人環境與發展基金會、美國穀物協會日前舉辦「全球推動低碳汽油融入淨零碳排趨勢系列座談」,包括美國在台協會、行政院能源減碳辦公室、經濟部、環保署、台灣中油、台塑石化以及國內外專家共同與會,針對台灣導入低碳汽油,加速運輸部門邁向零碳進行討論。環境與發展基金會蔡俊鴻董事長表示,低碳汽油已在超過60個國家普遍採用,導入低碳汽油對於運輸部門有立即的減碳效果。台灣2050淨零碳排轉型是整體性的國家戰略,任何助於減碳的策略都應被討論,重點在於國家是否真的有減碳的決心。

圖一:合照
Photo Credit:財團法人環境與發展基金會、美國穀物協會
全球推動低碳汽油融入淨零碳排趨勢座談,共同探討可行的減碳方針與策略。來賓自左起為:台榮周忠平副理、台塑石化李後昆處長、台灣綜合研究院柯亮群所長、經濟部工業局潘建成組長、行政院能源及減碳辦公室黃錦明科長、臺灣師範大學葉欣誠教授、美國在台協會(AIT)王睿珂(Erich Kuss)組長、美國穀物協會盧智卿駐台代表、環境與發展基金會蔡俊鴻董事長、環保署氣候變遷辦公室蔡玲儀主任、循環台灣基金會黃育徵董事長、經濟部能源局蔡秀芬組長、中油王淑麗組長、中華氣候變遷暨農業發展學會張學義委員、台塑洪宗益協理。

全球正面臨氣候變遷與能源轉型的重大挑戰,亟需有效且可行的減碳方法。美國在台協會王睿珂組長致詞時表示,台灣與美國都有邁向淨零碳排的目標。美國是全球推動低碳汽油的先驅,美國長年採用低碳汽油作為解決溫室氣體排放的策略之一,不僅減碳效果立竿見影,更提供消費者減碳的選擇。台美是重要的能源戰略合作夥伴,盼透過此次座談交流,促使雙方在減碳路上更進一步合作,實現淨零碳排的願景。

圖二:AIT農業組組長
Photo Credit:財團法人環境與發展基金會、美國穀物協會
美國在台協會農業組組長王睿珂表示,台美是能源合作戰略夥伴,盼能加強交流、合作實現淨零碳排的願景。

環保署氣候變遷辦公室蔡玲儀主任強調,台灣正在研擬2050淨零路徑規劃,總共12項關鍵戰略,其中也包括運具邁向無碳化。確實政策推動不可能一次到位,一定是從低碳逐漸邁向無碳,機車就是很好的例子。台灣運輸部門的主要排放源是汽車和機車1400萬輛,目前環保署鼓勵淘汰老舊機車,也有助於減碳。低碳汽油在世界各國早已廣泛運用,最重要的是如何進行社會影響面評估,做好公眾溝通,讓民眾能夠接受。此次座談針對技術面、產業面問題都有探討,相信資料彙整後對運輸部門如何減碳有更多的幫助。

圖三:環保署蔡玲儀主任
Photo Credit:財團法人環境與發展基金會、美國穀物協會
環保署氣候變遷辦公室蔡玲儀主任表示2050淨零目標無法一次到位,轉型過程一定是從低碳到無碳。

美國穀物協會乙醇技術顧問Rowena Torres-Ordonez以美國推動低碳汽油基礎設施以及車輛適用性評估進行專題演講分享。她表示,美國推動低碳汽油已有近半世紀的歷史,從歷年的統計數據來看,汽車兼容E10低碳汽油已不是問題,所有廠牌汽車皆可直接使用。尤其低碳汽油具有親水性的問題,美國已經建立完善的指導原則和知識體系,透過核心技術將乙醇和水相分離(phase separation),以穩定油品的品質,確保低碳汽油輸配系統全程保持乾燥。例如每個配送點都會檢測含水量,避免水干擾問題,而對比過去E3低碳汽油,E10低碳汽油對水份的抵抗能力更強,並不會影響到行車安全。Rowena更進一步表示,減碳、低污染必須倚靠多元策略並進。低碳汽油非常容易推動,唯一要做的就只是替換原本的汽油,對於民眾、社會不易造成影響,卻能立即減碳。Rowena強調「假設 2040 是淨零碳排階段目標,那我們該如何思考從現在過渡到2040?低碳汽油與電動車策略完全不衝突,可以同時共進」。

國立臺灣師範大學永續管理與環境教育研究所葉欣誠教授認為,在社會公正轉型的基礎上,低碳汽油在技術上絕對是解決氣候變遷的可行解方。曾有民調指出,許多民眾認為電動車是高價產品,負擔不起,導致短時間內電動車無法普及。淨零轉型的過程必須特別注重社會階級的公平、公正,若能直接從傳統燃油的成分調整達到減碳效果,是相當務實的做法。另一方面,從實務上來看,電動車所需的電力仍有八成以上倚靠火力發電,因此運具全面電動化並非淨零碳排的終點。況且,能源選項的多元化,其實是對台灣能源安全的保障。葉欣誠教授強調,關鍵還是在於政策推動的決心,尤其政府單位應由誰主責,低碳汽油的推動涉及行政院能源減碳辦公室、環保署、經濟部、交通部等多個單位,必須有明確的任務賦予。

圖四:葉欣誠教授
Photo Credit:財團法人環境與發展基金會、美國穀物協會
台灣師範大學永續管理與環境教育研究所葉欣誠教授認為電動車短時間內無法普及、且電力碳排仍高,應該從務實角度思考導入低碳汽油。

台塑石化股份有限公司洪宗益協理表示,只要政府政策明確,推動E10低碳汽油在技術上不是問題,若能循序漸進推動轉型,配合誘因機制和輔導,消費者應該可以接受低碳汽油,畢竟電動車政策無法一步到位。公正轉型絕對是減碳過程中必須關注的環節,尤其年輕世代,機車擔任主要的短程工具,更是經濟弱勢族群的移動需求核心,如何讓他們也能參與減碳是政府必須思考的。這也帶出一個思考的出發點,減碳轉型究竟只能從購買運具更換的思維出發,還是可以讓既有交通運具也能扮演減碳的角色?

中華氣候變遷暨農業發展學會張學義委員表示,社會對於低碳汽油的原料一直有所誤解,目前仍有人認為能源作物可能與糧食相互競爭。事實上全球農作物生產效能歷經數次突破性成長,其產能用於供應生質燃料的比例不到5%,影響微乎其微,燃料會與糧食競爭的說法早已是過去式,這點政府有責任廣為宣導。低碳汽油能直接達到減碳、減少空污的效果,包括美國在內的先進國家已經提供很多極好的導入經驗,油品問題無須擔憂,只是過往E3低碳汽油效果有限,E10的效益相對顯著。張學義委員補充,台灣電力供應源的轉換各界都有疑慮,思維不應綁在運具轉換,而是整體上如何導入乾淨能源。

台灣綜合研究院柯亮群所長指出,從策略規劃的角度,所有有助減碳之選項都應納入思考範圍。資料顯示低碳汽油生產的碳強度在持續下降,若要驗證所使用的原料是否永續,可以參考德國生質能源料源之永續性認證制度、或歐盟永續性生質燃料標準。若從整個生命週期證實是有減碳效益,對未來社會大眾推廣也有幫助。其次,淨零碳排轉型的過程,公正轉型絕對是重要議題。尤其台灣具有大量機車的社會特殊性,其代表轉型的背後,受影響的不只是燃油車廠商,更包括不一定有能力轉換電動運具的一般民眾。建議政府可盤點目前低碳汽油適用機車類型,以明確低碳汽油在轉型過程中可帶來之「公正」社會效益。

循環台灣基金會黃育徵董事長則表示,淨零碳排必須是跨國、跨產業的合作行動,才可能共解氣候危機,這不是單純的貿易關係。樂見台美能源戰略夥伴有更緊密的合作。黃育徵也補充,要達成淨零碳排目標,整個社會都必須思考新經濟模式,非僅有供給端的改變,更需要考量需求端的槓桿角色。民眾必須有意識的改變自己邁向淨零生活,才能帶動淨零生產。

行政院能源及減碳辦公室黃錦明科長表示,不論是從消費端推動低碳汽油、或從產業端推動電動車,同樣都可以協助運輸部門減碳,對運輸部門達成2050淨零排放的階段減碳目標有很大幫助。目前應優先評估是否納入國家淨零碳排減碳戰略中,確定納入國家政策推動方向後,再由主政部門規劃具體推動作法與分工,較為可行。黃錦明科長認為,導入低碳汽油最重要的是相關標準的訂定,可由公協會依照市場需求提出E10低碳汽油的油品標準,提供給標檢局審查,同時參考國際經驗建立相關的標準作業程序,減少運輸、摻配、貯存過程中可能讓汽油變質的問題。建議系列座談未來可更務實討論,包括交通部公路總局、經濟部國營事業委員會、經濟部標準檢驗局、汽機車相關公協會都應參與討論。

在車輛適用性的問題上,國際上雖然已有相當豐富的證實研究,美國再生能源協會(RFA)也在全球七國進行研究,機車也能直接使用低碳汽油,經濟部永續發展組潘建成科長仍建議,若要增加對民眾的信心,應要有本土科學數據的研究,才能夠提高民眾的信任。經濟部能源局蔡秀芬組長也表示,品牌車廠角色也可加入討論,讓原廠能夠向車主說明低碳汽油的適用性,民眾的疑慮也會降低。

圖五:蔡俊鴻董事長_and_盧智卿駐台代表
Photo Credit:財團法人環境與發展基金會、美國穀物協會
財團法人環境與發展基金會董事長蔡俊鴻、美國穀物協會駐台代表盧智卿表示,低碳汽油已為全球超過60個國家帶來相當可觀的減碳效益,盼與政府共同合作台美淨零碳排行動。

美國穀物協會盧智卿駐台代表結語時表示,低碳汽油已為全球超過60個國家帶來相當可觀的減碳效益,甚至帶動農業的升級轉型。美國十分願意與台灣政府、民間共同努力,將成功的經驗、技術專業等資訊與大眾進行交流,與台灣政府一同達成2050淨零碳排目標。