課程介紹:
整套課程從hadoop入門開始,由淺入深,內(nèi)置“hadoop源碼解析與企業(yè)應(yīng)用開發(fā)實戰(zhàn)”,“Hive開發(fā)實戰(zhàn)”,“Hbase開發(fā)實戰(zhàn)”,“Spark,mahout,sqoop,storm諸模塊開發(fā)實戰(zhàn)”。因為這個課程有4個板塊組成,所以學(xué)員可以按照自己的實際情況選擇學(xué)習(xí)。例如,對于只需要了解hadoop基本編程的人,只需要選擇“hadoop源碼解析與企業(yè)應(yīng)用開發(fā)實戰(zhàn)”模塊就可以了;對于立志于從事大數(shù)據(jù)領(lǐng)域的零起點人員,可以選擇四個板塊依次學(xué)習(xí);對于已經(jīng)有一定基礎(chǔ)的hadoop開發(fā)人員,你可以根據(jù)自己的情況,選擇學(xué)習(xí)模塊,而不必4個板塊從頭開始學(xué)。
第一部分內(nèi)容:
I. Hadoop的起源與生態(tài)系統(tǒng)介紹。要點:
了解什么是大數(shù)據(jù);
Google的三篇論文;
圍繞Hadoop形成的一系列的生態(tài)系統(tǒng);
各個子項目簡要介紹
II. Hadoop集群配置與搭建。要點:
Hadoop安裝與部署;
如何寫配置文件;
運行簡單的wordcount程序;
Hadoop程序結(jié)構(gòu)介紹 實戰(zhàn):
Hadoop系統(tǒng)的安裝與部署;
編寫配置文件;
編寫運行簡單的wordcount程序。
預(yù)期收獲:
了解什么是大數(shù)據(jù)以及大數(shù)據(jù)和hadoop的關(guān)系;
了解hadoop本身;
學(xué)會Hadoop系統(tǒng)的安裝和部署;
學(xué)會配置hadoop系統(tǒng);
學(xué)會編寫簡單的wordcount程序;
第二部分內(nèi)容:
III. Common組件和HDFS組件原理及體系結(jié)構(gòu)介紹。要點:
Hadoop IO機制;
序列化;
壓縮;
RPC;
HDFS副本機制;
HDFS讀寫機制;
塊選擇策略;
預(yù)期收獲:
掌握common組件和HDFS組件;
了解Hadoop的IO機制;
第三部分內(nèi)容:
IV. MapReduce2.0組件原理及體系架構(gòu)介紹。要點:
MapReduce工作原理;
類型與格式;
JT內(nèi)部實現(xiàn);
TT內(nèi)部實現(xiàn);
Task運行過程分析;
V. MapReduce2.0編程實戰(zhàn)。要點:
Pipes編程;
Streaming編程;
動手編寫MapReduce程序;
實戰(zhàn):
MapReduce2.0編程(Pipes,Streaming);
編寫MapReduce程序;
預(yù)期收獲:
徹底掌握MapReduce這個關(guān)鍵模塊;
第四部分內(nèi)容:
VI. Hadoop集群管理與安全機制分析。要點:
Hadoop集群管理機制;
Hadoop現(xiàn)有安全機制
VII. YARN及ResourcManager組件。要點:
YARN/MRv2環(huán)境搭建與部署;
ResourceManager組件的分析與實戰(zhàn);
實戰(zhàn):
動手搭建YARN環(huán)境
預(yù)期收獲:
掌握Hadoop的集群管理機制;
了解Hadoop現(xiàn)有的安全機制;
掌握YARN和ResourceManager組件。
——————-課程目錄——————-
課時1 免費試聽.doc
課時2 免費試聽二.doc
課時3 付費學(xué)員服務(wù)指引.doc
課時4 課前環(huán)境準(zhǔn)備.doc
課時5 參考資料.doc
課時6 Hadoop開源軟件及其生態(tài)系統(tǒng).avi
課時7 HDFS集群的安裝與部署.avi
課時8 MapReduce集群的安裝與部署.avi
課時9 閱讀練習(xí)Hadoop 偽分布式集群部署參考文檔.pdf
課時9 閱讀練習(xí)ssh實現(xiàn)Linux無密碼訪問.pdf
課時10 第一周練習(xí).doc
課時11 Hadoop架構(gòu)答疑.avi
課時12 HDFS架構(gòu)、SNN、副本放置策略.avi
課時13 HDFS API.avi
課時14 練習(xí)2:HDFS組件分析1.doc
課時15 本周答疑.avi
課時16 準(zhǔn)備:JNI編程基礎(chǔ).avi
課時17 Hadoop IO.avi
課時18 HDFS 壓縮.avi
課時19 HDFS 完整性.avi
課時20 HDFS 序列化.avi
課時21 練習(xí)3 HDFS 詳細(xì)分析2.doc
課時22 HDFS 基于文件的數(shù)據(jù)結(jié)構(gòu).avi
課時23 Hadoop RPC 遠程方法調(diào)用.avi
課時24 練習(xí)4.doc
課時25 MapReduce API 及工作流程(1).avi
課時25 MapReduce API 及工作流程(2).avi
課時26 MapReduce工作原理(2):錯誤處理、作業(yè)調(diào)度、Shuffle和Sort.avi
課時27 MapReduce類型與格式(1).avi
課時27 MapReduce類型與格式(2).avi
課時28 練習(xí)5:MapReduce工作原理、流程.doc
課時29 MapReduce重要組件_ MapReduce Combiner組件分析.avi
課時30 MapReduce重要組件_ MapReduce Partitioner組件.avi
課時31 MapReduce重要組件_ MapReduce Recordreader組件(2).avi
課時32 練習(xí)6:MapReduce重要組件.doc
課時33 MapReduce計數(shù)器.avi
課時34 MapReduceJoin.avi
課時35 Map端Join.avi
課時36 MapReduce Sort.avi
課時37 Hadoop Pipes_Streaming高級編程.avi
課時38 練習(xí)7:MapReduce編程.doc
課時39 Hadoop 集群管理與安全.avi
課時40 Hbase.avi
課時41 練習(xí)8:HBase.doc
課時42 Yarn基礎(chǔ).avi
課時43 spark講解.avi