Hadoop MapReduce HDFS紗:Hadoop: Hadoop概念,版本,歷史,HDFS工作原理,紗介紹,組件介紹。
大數據存儲階段:hbase,hive,sqoop。
大數據架構設計階段:Flume distributed,Zookeeper,Kafka。
大數據實時計算階段:Mahout,Spark,storm。
大數據數據收集階段:Python,Scala。
大數據業務實踐階段:企業大數據處理業務場景實際操作、需求分析、解決方案實施、綜合技術實際應用。
大數據分析的幾個方面:
1,可視化分析:可視化分析可以直觀的呈現大數據的特點,同時也容易被讀者接受,就像看圖說話壹樣簡單。
2.數據挖掘算法:大數據分析的理論核心是數據挖掘算法。
3.預測分析:從大數據中挖掘特征,科學建立模型,預測未來數據。
4.語義引擎:需要設計足夠的人工智能,從數據中主動提取信息。
5.數據質量和數據管理:可以保證分析結果的真實性。