謝謝邀請!
數據分析師通常分成兩種,一種是應用級數據分析師,另一種是研發級數據分析師,區別就在于是否具備算法設計及實現的能力。
應用級數據分析師通常需要掌握各種數據分析工具,把業務模型映射到數據分析工具上,從而得到數據分析的結果。數據分析工具比較多,比如Excel就是一個傳統的數據分析工具,另外還有Minitab、LINGO、JMP等,要想全面掌握這些工具的使用需要具備一定的數學基礎和統計學基礎。通常做BI的數據分析師還需要進一步掌握數據庫的基礎知識,但是難度往往并不大。
研發級數據分析師就需要掌握編程知識了,在數據分析領域R、Python、C、MATLAB等語言都有廣泛的應用,目前通過Python等語言來完成數據分析也是一個比較常見的做法。其實MATLAB也是一個在數據分析領域占據重要位置的軟件(語言),MATLAB功能非常強大。
在大數據時代,通過機器學習的方式實現數據分析是一個比較常見的方式,而Python語言則是一個比較常見的選擇,一方面Python語言簡單易學,另一方面Python語言具備豐富的庫支持,比如Numpy、Scipy、Matplotlib、Sympy、pandas等都是比較常見的庫,這些庫的使用會極大的降低算法實現的難度。
總之,對于數據分析師來說,如果想在數據分析的道路上走的更遠,編程是一定要掌握的,其實編程語言本身并不是數據分析環節中的難點,比如學習Python還是一個比較輕松的過程。
對于基礎比較薄弱的學習者來說,從使用工具開始學習數據分析是一個比較現實的選擇。
作者簡介:中國科學院大學計算機專業研究生導師,從事IT行業多年,研究方向包括動態軟件體系結構、大數據、人工智能相關領域,有多年的一線研發經驗。
歡迎關注作者,歡迎咨詢計算機相關問題。