沒有計算機基礎應該如何學習大數據知識?
學習程序開發可以多瀏覽一些開源平臺上面的項目,博客,問答等。比較著名的平臺如github, stackoverflow等。
在 github 上搜索 big data,就會出現相關的項目,有一個大數據入門指南的項目挺不錯的,你可以參照著學習。地址:https://github.com/heibaiying/BigData-Notes,如果訪問被限制,可以點贊,評論。
如下是摘自項目中的圖解,和章節導航。
附:項目的相關知識點如下
?? 前 言
大數據學習路線
大數據技術棧思維導圖
大數據常用軟件安裝指南
一、Hadoop
分布式文件存儲系統 —— HDFS
分布式計算框架 —— MapReduce
集群資源管理器 —— YARN
Hadoop 單機偽集群環境搭建
Hadoop 集群環境搭建
HDFS 常用 Shell 命令
HDFS Java API 的使用
基于 Zookeeper 搭建 Hadoop 高可用集群
二、Hive
Hive 簡介及核心概念
Linux 環境下 Hive 的安裝部署
Hive CLI 和 Beeline 命令行的基本使用
Hive 常用 DDL 操作
Hive 分區表和分桶表
Hive 視圖和索引
Hive 常用 DML 操作
Hive 數據查詢詳解
三、Spark
Spark Core :
Spark 簡介
Spark 開發環境搭建
彈性式數據集 RDD
RDD 常用算子詳解
Spark 運行模式與作業提交
Spark 累加器與廣播變量
基于 Zookeeper 搭建 Spark 高可用集群
Spark SQL :
DateFrame 和 DataSet
Structured API 的基本使用
Spark SQL 外部數據源
Spark SQL 常用聚合函數
Spark SQL JOIN 操作
Spark Streaming :
Spark Streaming 簡介
Spark Streaming 基本操作
Spark Streaming 整合 Flume
Spark Streaming 整合 Kafka
四、Storm
Storm 和流處理簡介
Storm 核心概念詳解
Storm 單機環境搭建
Storm 集群環境搭建
Storm 編程模型詳解
Storm 項目三種打包方式對比分析
Storm 集成 Redis 詳解
Storm 集成 HDFS/HBase
Storm 集成 Kafka
五、Flink
Flink 核心概念綜述
Flink 開發環境搭建
Flink Data Source
Flink Data Transformation
Flink Data Sink
Flink 窗口模型
Flink 狀態管理與檢查點機制
Flink Standalone 集群部署
六、HBase
Hbase 簡介
HBase 系統架構及數據結構
HBase 基本環境搭建 (Standalone /pseudo-distributed mode)
HBase 集群環境搭建
HBase 常用 Shell 命令
HBase Java API
HBase 過濾器詳解
HBase 協處理器詳解
HBase 容災與備份
HBase的 SQL 中間層 —— Phoenix
Spring/Spring Boot 整合 Mybatis + Phoenix
七、Kafka
Kafka 簡介
基于 Zookeeper 搭建 Kafka 高可用集群
Kafka 生產者詳解
Kafka 消費者詳解
深入理解 Kafka 副本機制
八、Zookeeper
Zookeeper 簡介及核心概念
Zookeeper 單機環境和集群環境搭建
Zookeeper 常用 Shell 命令
Zookeeper Java 客戶端 —— Apache Curator
Zookeeper ACL 權限控制
九、Flume
Flume 簡介及基本使用
Linux 環境下 Flume 的安裝部署
Flume 整合 Kafka
十、Sqoop
Sqoop 簡介與安裝
Sqoop 的基本使用
十一、Azkaban
Azkaban 簡介
Azkaban3.x 編譯及部署
Azkaban Flow 1.0 的使用
Azkaban Flow 2.0 的使用
十二、Scala
Scala 簡介及開發環境配置
基本數據類型和運算符
流程控制語句
數組 —— Array
集合類型綜述
常用集合類型之 —— List & Set
常用集合類型之 —— Map & Tuple
類和對象
繼承和特質
函數 & 閉包 & 柯里化
模式匹配
類型參數
隱式轉換和隱式參數
十三、公共內容
大數據應用常用打包方式
? 后 記
資料分享與開發工具推薦