1關於Java
Java是壹種編程語言,要達到同樣的要求,有上百種編程語言。Java只是大數據的工具。
2.關於大數據
大數據是壹個行業,同樣的需求也有很多工具可以選擇。狹義上,從技術角度來說,有Hadoop、spark、storm、flink等各種框架。就這類技術生態而言,還有flume、kafka、sqoop等各種中間件。這些框架和工具大部分是用Java寫的,但是提供了Java、scala、Python、r等各種服務。
所以大數據的實習需要Java,但Java不是大數據。
大數據只是互聯網發展到現階段的壹種表征或特征。沒有必要將其神話或保持敬畏。在以雲計算為代表的技術創新背景下,這些原本難以收集和使用的數據開始被輕松使用。通過各行各業的不斷創新,大數據將逐漸為人類創造更多的價值。
業界(最早由IBM定義)將大數據的特征分為四個“V”(量、種類、價值、速度),或者說特征有四個層次:壹是數據量巨大。大數據的計量起始單位至少是P(1000 t)、E (1億t)或Z (1億t);第二,數據類型多。比如博客、視頻、圖片、地理信息等等。第三,價值密度低,商業價值高。第四,處理速度快。這最後壹點也與傳統的數據挖掘技術有著本質的區別。