隨著大數據技術的呼聲只增不減,越來越多的人開始了對大數據技術的學習,在這里對參加大數據學習的同學提出幾點建議!
1、應屆生學習大數據
個人覺得應屆生應該打好基礎,大學本科一般都會開設數據結構,算法基礎,操作系統,編譯原理,計算機網絡等課程。這些課程一定要好好學,基礎扎實了學其他東西問題都不大,而且好多大公司面試都會問這些東西。如果你準備從事IT行業,這些東西對你會很有幫助。
至于學什么語言,我覺得對大數據行業來說,Java還是比較多。有時間有興趣的話可以學學scala,這個語言寫spark比較棒。
集群環境一定要搭起來。有條件的話可以搭一個小的分布式集群,沒條件的可以在自己電腦上裝個虛擬機然后搭一個偽分布式的集群。一來能幫助你充分認識Hadoop,而來可以在上面做點實際的東西。你所有踩得坑都是你寶貴的財富。
然后就可以試著寫一些數據計算中常見的去重,排序,表關聯等操作。
對于很多面試官來說,面試應屆生就問你的基礎,筆試大多是數據結構和算法方面的,如果你基礎不錯而且有一定的大數據方面的經驗,基本上都會過。
2、對有一定編程工作經驗想轉行的,來學習大數據技術
主要考察三個方面,一是基礎,二是學習能力,三是解決問題的能力。
基礎很好考察,給幾道筆試題做完基本上就知道什么水平了。
學習能力還是非常重要的,畢竟寫Javaweb和寫mapreduce還是不一樣的。大數據處理技術目前都有好多種,而且企業用的時候也不單單使用一種,再一個行業發展比較快,要時刻學習新的東西并用到實踐中。
解決問題的能力在什么時候都比較重要,數據開發中尤為重要,我們同常會遇到很多數據問題,比如說最后產生的報表數據對不上,一般來說一份最終的數據往往來源于很多原始數據,中間又經過了n多處理。要求你對數據敏感,并能把握問題的本質,追根溯源,在盡可能短的時間里解決問題。
基礎知識好加強,換工作前兩周復習一下就行。學習能力和解決問題的能力就要在平時的工作中多鍛煉。
對大數據技術基礎知識不扎實的同學,建議還是先掌握基礎技術,外加一些簡單的項目進行練習。