大數(shù)據(jù)從入門到精通,一套專業(yè)的學習路線是必不可少的,尤其是對于想要自學的同學來說,這個至關重要。個人也整理了一套大數(shù)據(jù)學習路線,如果你是從零基礎開始的同學,可以作為自己的學習參考。
大數(shù)據(jù)學習路線圖是分為五個大的階段的,學習時間不確定,要看自己的學習能力和集中學習的精力。
階段一:是java基礎。此階段是針對沒有編程基礎,或者對基礎不扎實的同學一次補習,這個很重要,就像建一座大廈,這就是地基,地基不穩(wěn),就算修再高,總有一天會轟然倒塌!
需要掌握的技術知識:
(1)Java語言基礎
Java開發(fā)介紹、熟悉Eclipse開發(fā)工具、Java語言基礎、Java流程控制、Java字符串、Java數(shù)組與類和對象、數(shù)字處理類與核心技術、I/O與反射、多線程、Swing程序與集合類
(2)HTML、CSS與JavaScript
PC端網(wǎng)站布局、HTML5+CSS3基礎、WebApp頁面布局、原生JavaScript交互功能開發(fā)、Ajax異步交互、jQuery應用
(3)JavaWeb和數(shù)據(jù)庫
數(shù)據(jù)庫、JavaWeb開發(fā)核心、JavaWeb開發(fā)內幕
階段二:linux基礎和Hadoop生態(tài)系統(tǒng)。
本階段的linux也是基礎課程,幫大家進入大數(shù)據(jù)領域,以便更好地學習Hadoop、hbase、NoSQL、Spark、Storm、docker、kvm、openstack等眾多課程。因為企業(yè)中無一例外的是使用Linux來搭建或部署項目。
Hadoop生態(tài)系統(tǒng)的課程,對HDFS體系結構和shell以及java操作詳細剖析,從知曉原理到開發(fā)網(wǎng)盤的項目,讓大家打好學習大數(shù)據(jù)的基礎。
需要掌握的技術知識:
Linux體系、Hadoop離線計算大綱、分布式數(shù)據(jù)庫Hbase、數(shù)據(jù)倉庫Hive、數(shù)據(jù)遷移工具Sqoop、Flume分布式日志框架
階段三:分布式計算框架和Spark&Strom生態(tài)體系
Spark大數(shù)據(jù)處理本部分內容全面涵蓋了Spark生態(tài)系統(tǒng)的概述及其編程模型,深入內核的研究,。不僅面向項目開發(fā)人員,甚至對于研究Spark的學員,此部分都是非常有學習指引意義的課程。
需要掌握的技術知識:
(1)分布式計算框架
Python編程語言、Scala編程語言、Spark大數(shù)據(jù)處理、Spark—Streaming大數(shù)據(jù)處理、Spark—Mlib機器學習、Spark—GraphX圖計算、實戰(zhàn)一:基于Spark的推薦系統(tǒng)(某一線公司真實項目)、實戰(zhàn)二:新浪網(wǎng)
(2)storm技術架構體系
Storm原理與基礎、消息隊列kafka、Redis工具、zookeeper詳解、實戰(zhàn)一:日志告警系統(tǒng)項目、實戰(zhàn)二:猜你喜歡推薦系統(tǒng)實戰(zhàn)
階段四:項目練習其實是穿插課程其中的,在講解大數(shù)據(jù)理論的同時,將實踐知識穿插其中,增加學生對大數(shù)據(jù)技術的理解和應用。
階段五:此階段是深入提升階段,主要是人工智能的一些技術知識,也為學生想轉行人工智能打下良好的基礎,多重技能,更能大大提升就業(yè)質量。
這個只是大體的大數(shù)據(jù)學習路線,想要什么深入學習,還是要找相應的視頻教程和書籍配合學習。如果想快速進入大數(shù)據(jù)行業(yè),可以選擇專業(yè)的學習方式。