大數據的定義

1. 甚麼是大數據?

大數據(Big Data)又被稱為巨量資料,其概念是資料分析、商業智慧(Business Intelligence)和統計應用之總成。但現今的觀念大數據更是一種新的企業思維和商業模式,因為資料量急速成長、儲存設備成本下降、軟體技術進化和雲端環境成熟等種種客觀條件就位,方才讓資料分析從過去的洞悉歷史進化到預測未來,甚至是破舊立新,開創從所未見的商業模式。

2. 大數據一定要很大嗎?

雖然大數據的狹義定義是,資料量要在100TB到PB之間,但其實絕大多數的企業,都不符合這個標準,大企業如eBay、亞馬遜或AT&T或許符合大數據的標準。但Volume只是大數據的其中一個面向,Variety才是潛藏大數據資料價值的面向。企業真正要尋找的是非傳統的、而且未曾被挖掘過的資料,並且從這些資料中去提煉出價值,這才是對大數據應有的正確認知,而非只是執著於資料大小。

3. 大數據的核心是甚麼?

大數據有四個特點 (4V) Volume 、Velocity 、Variety 、Veracity,其中Volume,Velocity 可以透過Hadoop跟電腦科技處理。
真正能發揮企業需求價值的是處理資料Variety 跟Veracity 的技術。大數據運用資料探勘(Data Mining)工具技術, 可以有效率的分析處理Variety跟Veracity的問題,更可挖掘並呈現出資料的價值。
Data Mining 包含五大項商業智慧挖掘技術:

  • 分類
    (classification)
  • 推估
    (estimation)
  • 預測
    (prediction)
  • 關聯分組
    (affinity grouping)
  • 同質分組
    (clustering)

回頂部


4. 大數據的執行步驟是甚麼?

1).Business Understand(理解商業模式) 理解企業營運重點跟商業模式。

2).Data Understand(資料理解) 瞭解企業現有可以呈現用於分析的的資料及商業資料對客戶分析的意義。

3).Data Preparation (資料準備) 包含資料的清理(Clearing) 移除噪音(Noise )、資料整合(Data integration) 、 資料選擇(Data selection) 與資料轉換(Data Transformation)。 這佔整個專案工作量的60% !

4). Modeling (資料探勘) 選擇合適的探勘演算法以找尋感興趣的Pattern。

5). Pattern evaluation (樣式評估) 根據測量方法,來分辨歸納出真正有趣的樣式。

6). Knowledge presentation (知識表示) 將探勘到的知識,利用視覺化或一些知識表示的技術,呈現給使用者



回頂部



5. 雲義提供大數據的專業服務

雲義自2001成立之初,即專注於資料探勘技術核心模組的開發。發展出相當多應用於資料分析,文字分析與搜尋的技術與相關應用。
對Data Mining 相關技術已有多年的深厚技術與應用經驗。再結合國外大廠的產品平台技術,將提供客戶更完整的商業智慧大數據解決方案。

A. 大數據文字分析技術






B. 運用先進軟體工具執行大數據分析





C. 大數據在品牌分析的應用




回頂部