怎么學習數據科學?
早在 2009 年 1 月,Google 首席經濟學家 Hal Varian 就曾斷言,“能夠獲取數據 —— 能夠理解數據 —— 處理數據,從中提取價值,可視化并傳達信息,這將成為未來幾十年非常重要的技能……因為現在我們確實擁有基本上是免費和無處不在的數據。”
時下, 數據科學(Data Science)無疑是出國留學申請最為火熱的專業之一,隨著赴美國留學讀Data Science的學生越來越多,美國數據科學專業申請競爭也日趨激烈。那么數據科學是什么?學什么?就業如何呢?小星為你一一道來
1、內容大綱
什么是數據科學數據科學的核心技能數據科學學什么數據科學就業如何美研數據科學申請要求數據科學選校推薦2、什么是數據科學
2003年,《數據科學雜志》曾提出:“所謂的‘數據科學’,指的是那些任何與數據相關的內容”。對此,我表示贊同,現在一切都無法與數據分割。
從最基本的角度來看,數據科學可以被定義為從數據中獲得任何有價值的東西。在現實中,數據科學發展如此迅速,而且呈現出巨大可能性,因此一個更廣泛的定義對于理解它是至關重要的。
如何從數據中獲得有價值的東西呢?不管是用統計學,還是用機器學習;不管是做數據分析,還是做數據挖掘,都有可能達成這個目標。因此,具體問題需要具體分析。簡而言之,針對具體的問題,從業務-數據-特征-算法-應用這些角度切入,做出對的思考和行動。
3、數據科學的核心技能
我之前聽過一位斯坦福學長的課程,下圖是他提到的數據科學需要具備的技能,總結來說就是數理能力、數據分析能力、軟素質、溝通表達和可視化的能力。
總結來說:
--要有獨立從各種各樣的地方把數據化為己用的能力;
你就會用到SQL、Programming、Hadoop/parallel processing、Machine Learning、Data Mining、Modeling等等。
--你不光要理解what users say they want,你還需要真正的理解what they actually mean;
--數據科學家會跟公司的很多不同部門的人打交道,會比碼農跟更有機會見到高層或者是 business領域的人,你需要知道區分什么是問題本質、什么是技術細節,要有能力給上層領導講high level的分析和推薦,有能力給同事講解和defend你的技術細節。
4、數據科學學什么?
了解了數據科學家需要具備的能力之后,數據科學學什么也就更加顯而易見了。
以下是紐大數據科學的課程
數學方面有:數據科學入門;概率統計;機器學習與計算統計;大數據這些課程
計算機方面有:自然語言處理與表示論;自然語言理解與計算語義;推斷與表示;深度學習;文本分析;自然語言處理等等。
5、數據科學就業如何?
美國企業與高等教育論壇(BHEF)與普華永道(PWC)近期發布重要報告稱:
“數據分析的人才需求每年都在增長,而每年的高校畢業生數量遠遠無法滿足行業需求。” 報告顯示:只有23%的教育者認為畢業生會有數據分析技能,但69%的雇主都希望求職者真正具備數據分析技能。在 Glassdoor 2019年新發布的《50份最佳就業》報告(50 best jobs in America)中,“數據科學家”在各個職業中名列最佳工作,職業滿意度高,職缺多,且重要的是:薪水還很高。
著名求職網站 Indeed 今年 2 月的最新統計數據透露,全美平均數據科學家的平均年薪為 12 萬 7981 美元,像科技巨頭如 Facebook 等,薪資則會更高。
但是,盡管有這么高的評價與薪資,數據分析領域還是很缺人!
2018 年 8 月 Linkedin 發布的勞動力報告顯示,全美有超過 151,000 個數據科學家工作空缺,所有主要城市都出現短缺。其中,紐約、舊金山和洛杉磯出現“急劇”短缺。“數據科學家”的職位自2013年12月以來“飆升了344%”,職缺的速度甚至大于“軟件工程師”。
按照官方說法,美國勞工統計局甚至預測,到 2024 年,該領域的工作崗位將增加 11 個百分點。
6、美國數據科學申請要求?
美研申請一方面考察學生的學校,績點,語言成績,專業背景,另一方面會比較看重軟性背景,也就是相關實習和項目經歷。
專業背景方面,數學/統計或CS為佳,物理,經濟學等強調數學能力的專業次之,其他理工專業再次之。轉專業申請者,建議修過相關數學課程,如線性代數,概率論,數理統計,微積分等;計算機方面建議修過CS相關課程,如https://www.52fb.cn語言Python、R、Java、C++等。
以下是哥大DS項目官網的申請要求:
---哥倫比亞大學的MS in Data Science 項目處于美國數據科學碩士申請難度的第一梯隊。該項目為期1年,學生共需修讀30個學分,無需撰寫畢業論文。
---該項目要求申請者擁有一定的數學及https://www.52fb.cn基礎,最好學過微積分、線性代數、計算機https://www.52fb.cn等課程,沒有強制性的工作經驗要求,有的話也會為申請者加分。
---需要遞交GRE成績,托福100、雅思7.0,不可使用GMAT代替GRE成績。
7、美國數據科學選校推薦
哈佛大學
MS Data Science 1年
專業背景:自然科學,數學,或工程專業學士學位
不接受GMAT代替GRE,不接受IELTS代替TOEFL
哥倫比亞大學
MS in Data Science 2年
專業背景:定量課程 (微積分,線性代數等);計算機https://www.52fb.cn
斯坦福大學
M.S. in Statistics: Data Science 5 Quarters(1年3個Quarters)
專業背景:較強的數學和計算機背景
不接受GMAT代替GRE,不接受IELTS代替TOEFL
杜克大學
Master in Interdisciplinary Data Science (MIDS) 2年
每年大約招收25-35個學生
布朗大學
Master's in Data Science
專業背景:先修課要求為1年的微積分,1學期的線性代數,1學期的概率與統計
喬治城大學
Master of Science in Data Science for Public Policy 2年
專業背景:大學本科微積分課程,成績為B級或以上,并展示技術能力的證據,如計算機科學、高級統計或高等數學課程。
南加州大學
Master of Science in Computer Science (Data Science)
專業背景:工程學、數學或硬科學。
不接受GMAT代替GRE
卡耐基梅隆大學
MSPPM Data Analytics track 1.5年
業背景:較強的數學基礎,有先修課要求
紐約大學
MS in Data Science 2年
專業背景:在數學、計算機科學和應用統計學方面有很強的背景。
不接受GMAT代替GRE
羅徹斯特大學
MS in Data Science 2學期
專業背景:科學、工程、數學或商業