1. 甚麼是大數據?
大數據(Big Data)又被稱為巨量資料,其概念是資料分析、商業智慧(Business Intelligence)和統計應用之總成。但現今的觀念大數據更是一種新的企業思維和商業模式,因為資料量急速成長、儲存設備成本下降、軟體技術進化和雲端環境成熟等種種客觀條件就位,方才讓資料分析從過去的洞悉歷史進化到預測未來,甚至是破舊立新,開創從所未見的商業模式。
2. 大數據一定要很大嗎?
雖然大數據的狹義定義是,資料量要在100TB到PB之間,但其實絕大多數的企業,都不符合這個標準,大企業如eBay、亞馬遜或AT&T或許符合大數據的標準。但Volume只是大數據的其中一個面向,Variety才是潛藏大數據資料價值的面向。企業真正要尋找的是非傳統的、而且未曾被挖掘過的資料,並且從這些資料中去提煉出價值,這才是對大數據應有的正確認知,而非只是執著於資料大小。
3. 大數據的核心是甚麼?
大數據有四個特點 (4V) Volume 、Velocity 、Variety 、Veracity,其中Volume,Velocity
可以透過Hadoop跟電腦科技處理。
真正能發揮企業需求價值的是處理資料Variety 跟Veracity 的技術。大數據運用資料探勘(Data Mining)工具技術,
可以有效率的分析處理Variety跟Veracity的問題,更可挖掘並呈現出資料的價值。
Data Mining 包含五大項商業智慧挖掘技術:
- 分類
(classification) - 推估
(estimation) - 預測
(prediction) - 關聯分組
(affinity grouping) - 同質分組
(clustering)