各有關單位:
互聯網企業和云計算服務企業每天都會產生大量的數據并面臨高并發的嚴峻考驗,傳統的關系型數據庫已經無法滿足大數據量高并發的要求,何以解憂?Hadoop!我中心針對目前企事業單位信息技術研發人員對Hadoop大數據處理技術的緊迫需求,設計推出了Hadoop大型應用開發實戰課程。
具體課程事宜如下:
一、課程目標
全面掌握Hadoop的架構原理和使用場景;
全程項目實戰訓練;
徹底掌握使用Hadoop進行MapReduce程序開發;
熟悉分布式計算領域的常用算法。
二、學習對象
軟件工程師、數據庫開發人員、網絡后臺開發人員、運維人員等。學員要求有一定的Java編程基礎。
三、授課師資
王老師 國內早從事于Hadoop框架應用程序軟件開發以及Hadoop解決方案專家。業界知名IT技術培訓講師、多家公司的技術顧問。
四、培訓證書
本課程頒發雙證,證書查詢:www.ncie.gov.cn;www.zpedu.org
1、工業和信息化部人才交流中心頒發的《Hadoop架構師》證書。
2、中國信息化培訓中心頒發的《Hadoop架構師》證書。
證書可作為專業技術人員職業能力考核的證明,以及專業技術人員崗位聘用、任職、定級和晉升職務的重要依據。
五、培訓費用
4500 元/人(含培訓費、考試費、證書費、資料費、午餐) 食宿統一安排,費用自理。(請學員帶二寸彩照2張—背面注明姓名,身份證復印件一張)。
六、具體課程安排
日程
|
模塊單元
|
模塊單元
|
第 一 天
|
第1個主題:Hadoop MapReduce 1. Hadoop JobTracker 剖析 2.Hadoop TaskTracker 剖析 3.Hadoop 任務提交流程剖析 第2個主題: Hadoop MapReduce Streaming編程 1. Hadoop Streaming 和 Java MapReduce Api 差異 2. 使用 MapReduce 實現數據庫功能 第3個主題:MapReduce分布式程序 1. MapReduce流程 2.剖析一個MapReduce程序 3.基本MapReduceAPI 概念 4.驅動代碼
|
5.Mapper 6.Reducer 7.API 使用Eclipse進行快速開發 8.新MapReduce API 第4個主題:Hadoop 核心代碼剖析 1. Hadoop Mapper 類核心代碼剖析 2. Hadoop Reducer 類核心代碼剖析 第5個主題:HDFS分布式文件系統編程 1. Hadoop HDFS 剖析 2. Hadoop NameNode 剖析 3. Hadoop DataNode 剖析 4. hadoop I/O 操作 5. 使用Hadoop HDFS API對HDFS編程
|
第 二 天
|
第1個主題:Hadoop Mapreduce編程 1.ToolRunner介紹 2.使用MRUnit進行測試 3.利用Combiners來減少中間數據 4.使用Configure和Close方法來進行Map/Reduce設置和關閉 5.編寫Partitioner來優化負載平衡 6.直接訪問Hadoop分布式文件系統(HDFS) 7.使用分布式緩存(Distributed Cache) 第2個主題:MapReduce的優化 1. map優化 2. reduce優化 3. 小文件優化
|
第3個主題:MapReduce的任務調度 1. Queue調度的使用 2. 公平調度的使用 3. 能力調度的使用 第4個主題:MapReduce編程實戰 1. Hadoop的join操作 2. Hadoop的二次排序 3. Hadoop的海量日志分析 第5個主題:flume+hadoop日志收集實戰 1. flume介紹 2. flume核心組件講解 3. flume自帶的組件分析 4. flume二次開發實戰
|
第 三 天
|
第1個主題:Hadoop的來源和動機 1.傳統大規模系統存在的問題 2.對一種新的解決方案的需求 第2個主題:Hadoop安裝和部署準備 Hadoop系統模塊組件概述 Hadoop試驗集群的部署結構 Hadoop 安裝依賴關系 Hadoop 生產環境的部署結構 第3個主題:Hadoop集群安裝和部署 Red hat Linux基礎環境搭建 上機實驗 Hadoop 單機系統版本 安裝配置 上機實驗 Hadoop 集群系統版本 安裝和啟動配置 上機實驗 Hadoop 集群異常Debug 方法 Hadoop 集群簡單測試方法 使用 Hadoop MapReduce Streaming 快速測試系統 第4個主題:Hadoop組件詳解 Hadoop HDFS 基本結構 Hadoop HDFS 副本存放策略 Hadoop NameNode 詳解 Hadoop SecondaryNameNode 詳解 Hadoop DataNode 詳解 Hadoop JobTracker 詳解 Hadoop TaskTracker 詳解 第5個主題:Hadoop集群配置詳解 Hadoop core-site,hdfs-site,mapred-site 配置詳解 Hadoop 高可用配置方法
|
第1個主題:Hadoop集群配置:機架感知,開啟壓縮和任務均衡 Hadoop 集群安裝和開啟LZO壓縮 Hadoop 配置集群具備機架感知 Hadoop 集群開啟公平任務調度器 Hadoop 集群開啟能力任務調度器 第2個主題:Hadoop 集群維護與管理 查看集群狀態 HDFS數據管理 Mapreduce 任務管理 HDFS安全模式 模擬集群Namenode,jobtrack失效 添加刪除節點 數據平衡 文件數據跨集群拷貝 集群升級 第3個主題:Hadoop 集群規劃和測試 集群規劃(硬件,系統,網絡) 集群性能測試 第4個主題:Hadoop 集群監控和運維 1. 使用Ganglia 監控Hadoop集群 2. 使用Cacti 監控操作系統 第5個主題:Hadoop HDFS高可用 Hadoop 元數據NFS備份方案 Hadoop SecondaryNameNode備份方案 Hadoop CheckpointNode備份方案 Hadoop BackupNode備份方案 Hadoop Cloudera HA Namenode 方案
|