課程介紹
面對 Big Data 這波巨大資訊(料)的洪流,需要依靠來自 Apache 開源碼專案 Hadoop,來當做驅動海量資料的核心動力,而 Hadoop 這宛如渦輪引擎般的動力,即可輕易駕馭這龐大到難以數計的資料流。然而,要架構此核心動力,並不需要採購高額資金的設備來建置,且不管小從個人,或大到跨國企業,只需要掌握以下的關鍵技術,就可以利用相當低廉且有限的預算,來建置可驅動 Big Data 的動力引擎,進而探究 Big Data 所帶來的下個世代的智慧分析與應用
1. 新一代虛擬化技術 - Linux Container (LXC)
2. Hadoop 資料作業系統 (HDFS, YARN)
3. Pig - 資料分析工具
課程目標
訓練選手具有建置與管理 Hadoop 資料作業系統的能力及Big Data 初階實務分析能力, 進而輔導選手取得以下雙認證。
1. HPATA: Serevrs & Storage(伺服器與儲存管理)
2. MSCS: Big Data, Configuring (巨量資料分析技術師)
課程內容
本課程旨在建立Big Data處理、分析、應用的根基,讓參訓選手瞭解正確的觀念與方法,重點並不在講解程式設計的細節,而在於透過體驗式教學方式的實作,經由指令剪貼方式來體驗實際的操作方式,以從體驗中驗證課程所學。
上課方式採用巢狀虛擬 (Nested VM) 實作教學環境, 每位學員可在各自的 VMware 虛擬系統中, 啟動新一代雲端虛擬化系統 (Linux Container ), 得以完全實做多節點 Hadoop 資料作業系統. 如下圖 :
|