壹、大數據前沿知識及hadoop介紹
零基礎入門,了解大數據的歷史背景和發展方向,掌握hadoop的兩種安裝配置。
第二,Hadoop部署先進
精通hadoop集群構建;深入分析了基於Hadoop架構的分布式文件系統HDFS。
第三,Java基金會
了解java編程的基本思想,熟練使用eclipse進行簡單的java編程,熟練使用jar文件,了解mysql等數據庫管理系統的原理,了解基於web的程序開發流程。
第四,MapReduce理論與實戰
熟悉mapreduce的工作原理和應用,熟悉MapReduce基礎編程,掌握根據大數據分析的目標進行基於MapReduce的項目的設計和編寫。
V hadoop+Mahout大數據分析
掌握基於hadoop+mahout的大數據分析方法的使用場景,熟練運用mahout的成熟算法在具體場景下分析大數據。
六、Hbase理論與實戰
掌握hbase的數據存儲和項目實戰,掌握Spark和Hive的安裝、配置和使用場景。
七、星火大數據分析
Spark,Hive安裝,配置和使用場景,熟練運用Spark成熟的算法進行特定場景下的大數據分析。
八、大數據學習綜合知識儲備
統計學:多元統計分析,應用回歸
計算機:R,python,SQL,數據分析,機器學習。
Matlab和mathematica也需要掌握。前者在實際工程應用和仿真分析方面有很大優勢,後者在計算功能和數學模型分析方面非常優秀。互相補貼可以互補。