有哪些方向可以選擇?
為著以后未來的發(fā)展和薪資考慮,很多程序員都非常看好大數(shù)據(jù)這個方向,剛畢業(yè)的應(yīng)屆生想做大數(shù)據(jù)開發(fā),傳統(tǒng)的Java后端工程師、Web開發(fā)工程師也都想轉(zhuǎn)型大數(shù)據(jù)崗位。
但面對高端的大數(shù)據(jù)技術(shù),沒有兩把梳刷子是不可企及的。想要成為大數(shù)據(jù)工程師,你需要具備以下技能:
(1)基礎(chǔ)編程能力
至少掌握一門編程語言,Java,Python等深入理解數(shù)據(jù)結(jié)構(gòu)、計(jì)算機(jī)網(wǎng)絡(luò)等。
(2)大數(shù)據(jù)生態(tài)環(huán)境
熟悉Hadoop生態(tài)架構(gòu),了解MR以及分布式計(jì)算。
(3)業(yè)務(wù)抽象能力
數(shù)據(jù)說到底都是一些業(yè)務(wù)日志,要求你對數(shù)據(jù)敏感,并能把握問題的本質(zhì),追根溯源,將業(yè)務(wù)邏輯抽象出來。
也就是說,大數(shù)據(jù)開發(fā)工程師的核心工作,就是抽象業(yè)務(wù)邏輯,利用技術(shù)實(shí)現(xiàn)工程自動化,包括數(shù)據(jù)采集、實(shí)時處理、存儲等等。
在學(xué)習(xí)大數(shù)據(jù)之初,不要盲目學(xué)習(xí),需要循序漸進(jìn),為了避免從入門到放棄,要先從一個方向打開,比如:
你想做大規(guī)模離線處理,那你就先深入學(xué)習(xí)hadoop;
如果你想先做實(shí)時處理,學(xué)習(xí)重點(diǎn)就放在Storm或者Spark Streaming上;
想做ETL,你就要熟悉ETL流程。然后,慢慢再往大領(lǐng)域中擴(kuò)充自己的大數(shù)據(jù)知識庫存。
如果你沒有什么計(jì)算機(jī)基礎(chǔ),建議可以選擇專業(yè)的學(xué)習(xí)方式。學(xué)習(xí)大數(shù)據(jù)不是件容易的事,但是只要你能多努力,積極地解決自己的疑惑,多練手,相信你一定可以掌握這門技術(shù)。