未來想從事數據分析師數據挖掘本科應該選擇什么專業?
謝謝邀請!
數據分析是專業性相對較高的工作崗位,未來要想從事數據分析工作不僅需要扎實的數學基礎,還需要了解數據分析的方式方法。
與數據分析關聯密切的專業有統計學、計算機、大數據(數據科學)、數學以及經濟學等專業,這些專業對于數據的理解各有側重,下面做一個簡單的分析:
數學是基礎學科,未來發展的彈性比較大,但是需要補學的相關專業知識也比較多。數學專業未來可以從事計算機、統計、大數據、人工智能等方向,可以說數學是現代信息技術的基礎,掌握扎實的數據知識會有一個非常廣闊的發展空間。
計算機學科是信息化時代的代表學科,數據分析(數據挖掘)是計算機專業的常見方向,目前大量從事數據分析(數據挖掘)的專業人才都是計算機專業畢業的,計算機專業不僅有扎實的數學基礎,同時計算機專業對于工具的使用也有系統的培養過程。
統計學一個重要的工作就是數據分析,通過對數據分析得出各種結果,發現數據背后的規律從而指導決策,可以說數據分析是統計學的核心內容之一。統計學與計算機的結合一直就比較緊密,因為現代統計學要通過計算機技術來進行呈現,而統計學、計算機和數學的結合就成為了大數據的基礎,所以大數據專業在做數據分析(數據挖掘)方面具有天然的知識結構上的優勢。
對于大數據時代背景下的數據分析師來說,掌握一定的編碼知識對于數據分析任務來說幾乎是不可避免的,因為大數據的時代特征造就了數據的諸多特點,包括數據量大、結構多樣性、價值密度低、速度快、真假難辨等等,這些特征如果采用傳統的數據分析方法顯然不能充分挖掘出數據的價值,通過機器學習等方式來進行數據分析是當前的流行做法。
數據分析專業并不需要做功能全面的編程工作,并不需要去考慮程序的系統級問題,比如并發、分布式、資源調度等等內容,只需要能通過算法設計和實現發現數據背后的規律就可以了,從這個角度來說,數據分析師的任務跟程序員還是有本質區別的。
目前使用Python做數據分析是比較常見的做法,Python有豐富的庫可以方便各種數據分析,同時也能把結果比較直觀的呈現出來。看兩個Python的小例子:
數據分析是進行大數據價值化的重要渠道,所以數據分析未來的發展空間還是比較大的。
作者簡介:中國科學院大學計算機專業研究生導師,從事IT行業多年,研究方向包括動態軟件體系結構、大數據、人工智能相關領域,有多年的一線研發經驗。歡迎關注作者,歡迎咨詢計算機相關問題。