大數據學習可以從最基礎的java語言入手,然后去學習Linux&Hadoop生態體系,一些分布式的技術理念,再然后就是學習機器學習,深度學習算法。
階段一、大數據基礎——java語言基礎方面
(1)Java語言基礎
Java開發介紹、熟悉Eclipse開發工具、Java語言基礎、Java流程控制、Java字符串、Java數組與類和對象、數字處理類與核心技術、I/O與反射、多線程、Swing程序與集合類
(2)JavaWeb和數據庫
數據庫、JavaWeb開發核心、JavaWeb開發內幕
推薦書籍:
《Effective Java中文版》(第2版)
這本書是學習java必備書籍,看完這本書也就掌握了入門的基礎知識。
階段二、 Linux&Hadoop生態體系
學習大數據離不開hadoop,圍繞hadoop有一套生態體系,分布式數據庫Hbase、數據倉庫Hive、數據遷移工具Sqoop、Flume分布式日志框架需要了解并掌握。
推薦書籍:
1、《Big Data》
2、《Hadoop權威指南》
3、《Hive編程指南》
階段三、 分布式計算。
(1)分布式計算框架
Python編程語言、Scala編程語言、Spark大數據處理、Spark—Streaming大數據處理、Spark—Mlib機器學習、Spark—GraphX 圖計算等
(2)storm技術架構體系
Storm原理與基礎、消息隊列kafka、Redis工具、zookeeper集群
推薦書籍:
1、《Learning Spark》
2、《Spark機器學習:核心技術與實踐》
階段四、機器學習和深度學習算法的學習,可以更好的利用大數據去處理問題。