給大家提供兩個公開的數據分析項目來源:
阿里天池
阿里天池https://tianchi.aliyun.com/是國內數據科學競賽平臺,有獎金可觀的實戰競賽,也有供學員備戰的學習賽。對剛入門數據分析的同學來說,學習賽是不錯的選擇。在提高技能的同時,還能對標其他同學,確定自己的競爭力。
下面是幾個較容易上手的學習賽項目:
1.Airbnb短租數據集分析賽:
https://tianchi.aliyun.com/competition/entrance/231715/introduction
這是一個較為開放式的問題,側重分析的思路,是練習數據分析的最佳項目選擇。
2.零基礎入門數據挖掘-二手車交易價格預測
https://tianchi.aliyun.com/competition/entrance/231784/introduction
這是一個典型的回歸問題,也是機器學習最容易上手的項目。
3.零基礎入門NLP-新聞文本分類
https://tianchi.aliyun.com/competition/entrance/531810/introduction
這是文本處理、NLP的入門項目。
除了學習賽,阿里天池還有競爭程度激烈的競賽:如算法大賽、程序設計大賽、可視化大賽、諸神之戰等,同學們可以根據自己感興趣的發展方向選擇比賽項目。
Kaggle
Kaggle(https://www.kaggle.com/)成立于2010年,是一個進行數據挖掘和預測的在線競賽平臺。Kaggle上的競賽有多種,如獎金高且競爭激烈的Featured項目,相對入門級別的Research項目。
Kaggle項目雖然不限制編程語言,但絕大多數隊伍會選用Python和R,所以你需要至少熟悉其中一種。
下面是三個入門級的經典項目:
1.Titanic:MachineLearningfromDisaster(泰坦尼克:從災難中學習):
https://www.kaggle.com/c/titanic
2.HousePrices:AdvancedRegressionTechniques(房價預測:高階回歸技巧)
https://www.kaggle.com/c/house-prices-advanced-regression-techniques
3.DigitalRecognition(數字識別)
https://www.kaggle.com/c/tmlc/notebooks
英文好的同學可以選擇Kaggle的項目來練習,這是一個受國際認可的數據科學競賽平臺,在這個平臺上成績靠前的同學,是不愁找工作的,都是別人來找自己。
過往經驗
當然,除了上面的項目,平時工作中多數也會用到數據分析,你可以從之前工作中總結數據分析的思路。
雖然數據不是你處理的,但是分析的思路是通用的。
數據分析是為解決問題而生的,過去積累的通過數據發現問題進而給出解決方案的經驗,是數據分析的精華所在。不要忽視哦!
我之前有整理過50多個數據分析項目,想要的話轉發本文,私信我“項目”獲得