「大數據」到底是什麼意思?事實上,它是一種精神

「大數據」到底是什麼意思?事實上,它是一種精神
Photo Credit: Escola Santa Anna @ Flickr CC BY ND 2.0

我們想讓你知道的是

大數據無統一定義,代表著傳統的儲存、分析技術難以應付的高維度資料。實際上大數據的特性包括了3V:Volume、Variety)與Velocity。近年又多了一 個V :真實性(Veracity)。

  1. 一場改變全球十億人口資訊服務的革命!Google、微軟爭相佈局的雲端運算服務

本篇是「機器學習專題」的第二篇文。

人們每天上傳至雲端的檔案數量,多達一億張相片、十億份文件……更別提數位影音、交易、生物醫療。每天全球所創造的資料量高達2.5艾位元組(exabyes,即1000,000,000,000,000,000)。

但資料量大就是大數據嗎?究竟什麼是大數據?又為何大數據會在近幾年突然興盛起來?時常耳聞的Hadoop、MapReduce、Spark等技術又是什麼呢?

今天,就讓我們來聊聊什麼是「大數據」(Big Data)。

大數據的源起

「儲存成本」與「資料取得成本」因科技進步而大幅下降,造就了這個年代大數據的興起。

30年前,1TB檔案存儲的成本為16億美金,如今一個1TB的硬碟不到100美金。同時間,全球各行業的資料量成長更是急速攀升;根據預估,從2013年至2020年間將成長10倍的資料量,資料總量將從4.4ZB增加至44ZB。

以天文學為例,2000年美國太空總署在新墨西哥州發起的史隆數位化巡天(Sloan Digital Sky Survey)專案啟動時,望遠鏡在短短幾周內收集到的資料,已經比天文學歷史上總共收集的資料還要多。

在生物醫學領域,新型的基因儀三天內即可測序1.8TB的量,使的以往傳統定序方法需花10年的工作,現在1天即可完成。在金融領域,以銀行卡、股票、外匯等金融業務為例,該類業務的交易峰值每秒可達萬筆之上。

Google每天要處理超過24千兆位元組的資料,這意味著其每天的資料處理量是美國國家圖書館所有紙質出版物所含資料量的上千倍。

Facebook每天處理500億張的上傳相片,每天人們在網站上點擊「讚」(Like)按鈕、或留言次數大約有數十億次。

YouTube的使用者人數已突破十億人,幾乎是全體網際網路使用者人數的三分之一,而全球的使用者每天在YouTube上觀看影片的總時數達上億小時。

在Twitter上,每秒鐘平均有6,000多條推文發布,每天平均約五億條推文。

千禧年開始,天文學、海洋學、生物工程、電腦科學,到智慧型手機的流行,科學家發現:仰賴於科技的進步(感測器、智慧型手機),資料的取得成本相比過去開始大幅地下降──過去十多年蒐集的資料,今朝一夕之間即能達成。

也因為取得數據不再是科學研究最大的困難,如何「儲存」、「挖掘」海量數據,並成功地「溝通」分析結果,成為新的瓶頸與研究重點。

接下來,我們將進一步介紹大數據的定義、特性,與發展重點。

什麼是大數據?

大數據意指資料的規模巨大,以致無法透過傳統的方式在一定時間內進行儲存、運算與分析。

至於「大」是多大,則各家定義不一,有兆位元組(TB)、千兆位元組(PB)、百萬兆位元組(EB)、甚至更大的規模單位;然而若真要找到符合這麼大規模數據量的企業倒也是不容易。事實上,根據451Research的資料科學家Matt Aslett,他將大數據定義為「以前因為科技所限而忽略的資料」,討論這些以前無法儲存、分析的資料。

如本文第一段所言,由於在近年來儲存成本降低與資料獲取量變大,因而能觀察到不曾注意過的商業趨勢,讓企業做出更全面的考量。無論企業規模大小,我們應注重的不僅是數據量本身,而應將「大數據」作為在科學研究與商業方法的運營心態:大數據需要全新的處理方式,以新型的儲存運算方法分析數據、產出溝通圖表,並將該分析結果視為一種戰略資產。

Lynn閒聊:

講白點:「大數據,是一種精神。」你要說它是一個Mindset、一個Fu、一個buzz word的口號都可以。

如果你公司裡的主管對於幾MB的資料稱為大數據……要說他錯也很難,大數據本來就沒甚麼定義。跟著我再唸一遍:大數據,是一種精神。不講潮一點就會跟不上時代。

Data一詞,台灣通常翻譯成「資料」,中國翻譯成「數據」。所以Database台灣叫資料庫,中國叫數據庫。

早期台灣學術界和工研院等政府機構,都把Big Data翻成巨量資料。後來中國炒作大數據這個概念炒得太凶、紅回台灣,變成一般民眾習於「大數據」這個詞,而非巨量資料或大資料。

(跟某些叫知識經濟或IP的東西,好像是差不多的套路呢……訂閱文章收錢可以炒作、著作權也可以炒作,通通都可以炒,我也是醉了)

現在Data Science、Data Scientist台灣還是叫資料科學、資料科學家,中國叫數據科學;但遇到Big Data就一起叫大數據。

大數據的特性?

目前大部份的機構將大數據的特性歸類為「3V」,包括資料量(Volume)、資料類型(Variety)與資料傳輸速度(Velocity)。

1
圖片來源:作者提供

一、資料量(VOLUME)

無論是天文學、生物醫療、金融、聯網物間連線、社群互動……每分每秒都正在生成龐大的數據量,如同上述所說的 TB、PB、EB規模單位。

二、資料多元性(VARIETY)

舉一個簡單的例子:

│資料類型│ 0 │ 0 │ 1 │ 0 │ 0 │ 1 │ 0 │ 0 │ 1 │ 0 │ 0 │ 1 │……

就算上述資料量高達1TB,採用傳統統計方法仍能很容易地找到資料規律。也因此,真正困難的問題在於分析多樣化的資料──從文字、位置、語音、影像、圖片、交易數據、類比訊號……等結構化與非結構化包羅萬象的資料,彼此間能進行交互分析、尋找數據間的關聯性。

三、資料即時性(VELOCITY)

大數據亦強調資料的時效性。隨著使用者每秒都在產生大量的數據回饋,過去三五年的資料已毫無用處。一旦資料串流到運算伺服器,企業便須立即進行分析、即時得到結果並立即做出反應修正,才能發揮資料的最大價值。

到目前為止,大數據的3V到底要多大或多即時,並沒有明確的共識或定義。(請再跟著我唸:大數據,是一種精神。)

近年來大數據的定義又從最早的3V變成了4V──第四個V代表Veracity,意指資料真實性。Veracity討論的問題包括:資料收集的時候是不是有資料造假、即使是真實資料,是否能夠準確的紀錄、資料中有沒有異常值、有異常值的話該怎麼處理等等。

目前台灣真正能符合大數據「3V」定義的企業微乎其微,在數據分析上更是幾乎不可能。


猜你喜歡


不用是專家也能輕鬆妝點生活,Adobe「攝影計畫」利用AI智慧修圖升級你的照片

不用是專家也能輕鬆妝點生活,Adobe「攝影計畫」利用AI智慧修圖升級你的照片

我們想讓你知道的是

你也喜歡攝影嗎?想讓手上的照片輕鬆升級,那麼你絕對不能錯過Adobe的「攝影計畫」方案,這邊我們就分享幾個利用「攝影計畫」讓照片質感提升的小技巧!

想到創作就會想到Adobe,在Adobe全系列軟體中,Lightroom跟Photoshop是諸多專業攝影師與攝影愛好者必備的軟體。這幾年來,Adobe為它們導入AI科技,讓照片透過簡單步驟就能變得更有質感。

因應現在人手一機的全民攝影的風潮,Adobe特別針對拍照愛好者推出「攝影計畫」,新用戶首年每月方案優惠價不到300元,輕鬆讓你提升照片質感,晉升專業影像玩家。

想讓出遊的照片變得更好看嗎?想讓自己得照片與眾不同嗎?那你肯定不能錯過這篇文章,我們將介紹Lightroom跟Photoshop實用好上手的功能,簡單就能有更好的照片。

一鍵輕鬆編修,讓你幾個步驟就能創造出個人風格的Lightroom

Lightroom是一款深受專業攝影師與攝影愛好者喜愛的影像軟體,它一直以來都以快速地調整、輕鬆的大量管理照片聞名,也讓世界上諸多的攝影師得以創造出專屬自己的影像。如果我們只是平常出遊與享受生活美好的片刻,紀錄下這一切後,Lightroom會不會稍嫌大材小用呢?一點都不會!近期Lightroom也針對現在使用者喜愛的風格,推出各式各樣的預設集,也導入了AI智慧,能夠智慧辨識出主體,就算不是專業大師,只要輕鬆一鍵,就能透過Lightroom將生活日常修整出質感好照片。

首先先來介紹「自適應」這個預設集,它的原理是利用AI演算、辨識出特定主體,讓我們可以套用各式各樣的場景,讓整體照片快速變得好看。

「自適應」預設集裡面分成兩個,其中一個是『主體』。『自適應:主體』這個濾鏡最主要的功能就是辨識出主體後,針對主體的區域進行濾鏡的套用、快速修整。

這個功能非常推薦使用在人像的補光上,會有非常好的效果。在這裡我們分享修整的前後,透過『『自適應:主體』預設集的修整,可以看到人像的主體有更自然的打亮,如果你想製造出更多風格的話,除了主體亮度也能有其他變化。

01
Photo Credit:The News Lens Brand Studio
『自適應:主體』預設集修整前。
02
Photo Credit:The News Lens Brand Studio
『自適應:主體』預設集修整後。選用普普風預設集。

而另外一個『自適應:天空』,顧名思義則是針對天空進行調整。它能辨識出天空的邊界,除了常見的夕陽與日出以外,還有顏色更強烈的調整,能讓照片變得更加吸引人目光。

03
Photo Credit:The News Lens Brand Studio
『自適應:天空』預設集修整前
04
Photo Credit:The News Lens Brand Studio
『自適應:天空』預設集修整後。選用夕陽預設集。

要建立屬於自己的照片風格最常遇到的問題是不知道從何處下手。但在Lightroom裡可輕鬆解決這樣的困擾,使用「圖庫」這個功能分頁下瀏覽、挑選管理照片時,就能用非常簡單的方式編修好手上的照片。

只要在「色調控制」裡面按下「自動」,再透過下面的細項調整曝光、清晰、鮮豔,不需要精密的熟悉每一個選項,幾秒鐘就能輕鬆得到好看的照片,摸索出屬於自己的照片風格。

05
Photo Credit:The News Lens Brand Studio
夜景照片未調整前,畫面些許偏暗。
06
Photo Credit:The News Lens Brand Studio
透過色調控制的「自動」,再簡單根據畫面變化調整曝光、清晰度等選項的結果。

若想要有更強烈的個人風格的話,Lightroom裡面的「預設集」也非常值得推薦,Adobe針對常見的照片類型提供出許多預設集,讓使用者一鍵套用自己喜歡的風格,再經過微調,就能創作出類似底片拍出的風格照片。

這樣的風格照片涵蓋我們日常會遇到的各種類型,舉凡人像、旅遊、生活紀錄等等…若你是喜歡在IG分享生活或者撰寫部落格的人,這就是一個快速且簡單建立自己風格的方式。

07
Photo Credit:The News Lens Brand Studio
Lightroom「預設集」示範之一
08
Photo Credit:The News Lens Brand Studio
Lightroom「預設集」示範之二
09
Photo Credit:The News Lens Brand Studio
Lightroom「預設集」示範之三

自由創意翻玩,讓Photoshop的AI智慧替你輕鬆編修好照片

如果說Lightroom是Adobe設計給攝影愛好者來調整、管理大量照片的軟體,那具有強大、多元編修功能的Photoshop肯定更是影像愛好者的好幫手。

經過多年的演進,Photoshop如今也發展出獨具一格的AI智慧演算,像是天空取代、神經網路濾鏡、智慧感知,都是能快速上手,快速創意改造照片的必學功能。

以天空取代來說,我們只要在「編輯」中選擇「天空取代」,此時Photoshop會運算出天空的範圍,我們只要從內建的幾個天空圖片中選擇出自己想要的天空,就能輕鬆替換掉。

這個功能很適合用在多雲的天氣,可以讓風景的照片更豐富,甚至還可以根據挑選替換的天空,增添一些雲朵,讓每次出門的風景不受氣象影響,每張都好看。

10
Photo Credit:The News Lens Brand Studio
天空取代,範例之一。
11
Photo Credit:The News Lens Brand Studio
天空取代,範例之二。
12
Photo Credit:The News Lens Brand Studio
天空取代,範例之三。

神經網路濾鏡(Neural Filters)則是Photoshop的獨家功能,它運用了近期熱門的雲端演算技術,分析照片的組成,並將資料上傳到雲端後,再搭配本機電腦的處理運算效果。

神經網路濾鏡目前已有幾種不同的類型,在這裡我們特別推薦「智慧型肖像」與「皮膚平滑化」兩個濾鏡,兩者都能讓我們輕鬆讓人像類型的照片變得更好。

「智慧型肖像」可以在演算後讓我們針對表情、視線方向,甚至是外表年齡跟頭髮厚薄都做調整,是很實用的濾鏡。

13
Photo Credit:The News Lens Brand Studio
經過了「智慧型肖像」濾鏡調整,我們能改變些許表情,讓人像照片更好看。

「皮膚平滑化」則透過雲端的AI演算,能快速簡單的讓我們獲得自然的膚質。簡單就能有好氣色跟膚質,再也不需要花時間使用圖章工具。

14
Photo Credit:The News Lens Brand Studio
「皮膚平滑化」一下子就能讓人像膚質大大提升。

出門在外,遇到人多的觀光勝地,或者是環境中的雜物一時沒注意的話,常常會有預期之外的物件入鏡,以前我們需要使用圖層跟修圖技巧,現在Photoshop的「智慧感知」功能,只要圈選覺得礙眼的雜物,在「編輯」內選擇「內容感知填色」,幾秒鐘的時間畫面雜物就能去除乾淨。

1516
Photo Credit:The News Lens Brand Studio
使用智慧感知後,地上的人孔蓋消失,讓我們視線更集中在人像上。
1718
Photo Credit:The News Lens Brand Studio
漂亮的老房內,預留的插座孔破壞了整體感,「智慧感知」同樣很快的讓照片變得更好看。

攝影愛好者必備Lightroom與Photoshop,AI科技讓你輕鬆增添照片質感

Adobe「攝影計畫」讓所有人都能輕鬆編修照片,它包含了照片編修常用的應用程式:Lightroom、Lightroom Classic、Photoshop 電腦版本與iPad的版本。還包含了20GB的雲端空間,我們隨時都可以分享照片,也可以在不同裝置上同步照片來編修。

Lightroom與Photoshop經過長期的發展,具備許多完善的功能,現在更是導入了AI運算技術,大幅降低了使用難度,在這強調個人風格與影像品質的數位時代來說,不只是專業攝影師能使用,一般的IG分享、部落格撰文,都能提升自身經營的影像質感。

目前Adobe也針對「攝影計畫」服務推出限時八折的優惠,新用戶訂閱計劃,首年每月只要新台幣257元。簡單上手、輕鬆負擔,是時候讓「攝影計畫」輕鬆提升你的照片質感了!

Adobe「攝影計畫」:優惠訂閱方案


猜你喜歡