由于目前的大數(shù)據(jù)很多都是指的Hadoop,而且目前企業(yè)使用最多的大數(shù)據(jù)工具也是Hadoop。Java作為學(xué)習(xí)大數(shù)據(jù)的基礎(chǔ),很多組件都是使用Java語(yǔ)言或者JVM可以運(yùn)行的語(yǔ)言。所以在你熟練使用Java具備轉(zhuǎn)大數(shù)據(jù)的基本條件后,接下來(lái)就是知識(shí)、技術(shù)的學(xué)習(xí)。
Hadoop主要包括三部分HDFS,MapReduce,Yarn都需要深入學(xué)習(xí),因?yàn)槊嬖嚨臅r(shí)候可能會(huì)被問(wèn)到一些原理的問(wèn)題。
Hadoop生態(tài)區(qū)重要組件Hive(離線)、Hbase、Spark(實(shí)時(shí),實(shí)時(shí)框架有spark、storm、flink等,可以選擇其中的一種學(xué)習(xí)),這些重要的組件都需要深入系統(tǒng)的學(xué)習(xí),在大數(shù)據(jù)中也是使用最對(duì)的。
Hadoop生態(tài)圈重要工具kafka、flume、sqoop等等,還有像azkaban這樣的調(diào)度工作,在日常的工作中都是必不可少的。
當(dāng)然,在學(xué)會(huì)上面的相關(guān)知識(shí)、技術(shù)后,最重要的還是需要項(xiàng)目實(shí)戰(zhàn)來(lái)學(xué)會(huì)使用。另外最好也能多看看別人優(yōu)秀的源碼來(lái)提升自己。加油!