通俗點說,
方法論方面:一個是統計,一個是機器學習
數據分析作用的多數是概率統計理工具,比如留存率的分析,大多數上是對歷史數據的某個維度的展示。而數據挖掘,背后的目標隱藏在大數據中,需要通過機器學習、深度學習理論去預測,比如挖掘用戶的喜好,本質上是對用戶未來行為的預測。
工具層面:一個是excel,一個是代碼
數據分析,通過excel可以基本搞定,excel內置很多統計函數,頂多做個簡單的線性回歸分析。而數據挖掘,將要利用大數據、機器學習等用更專業的編程語言來實現,比如python調用sklearn或xgboost,來實現。
數據層面:一個是小數據,一個是大數據
數據分析數據量上相對小,或者很多數據都進行了聚合。比如通過分析某商品的近幾年的銷量來看市場趨勢。而數據挖掘,背后對應的大部分為海量數據,比如通過用戶行為日志,來對用戶做千人千面的個性化推薦。
實際項目中,以實際需求驅動,根據實際情況選不同的方法。