數據挖掘是通過對大量數據的清理及處理以發現信息,并將這原理應用于分類,推薦系統,預測等方面的過程。
數據挖掘過程:
1.數據選擇
在分析業務需求后,需要選擇應用于需求業務相關的數據.明確業務需求并選擇好業務針對性的數據是數據挖掘的先決條件。
2.數據預處理
選擇好的數據會有噪音,不完整等缺陷,需要對數據進行清洗,集成,轉換以及歸納。
3.數據轉換
根據選擇的算法,對預處理好的數據轉換為特定數據挖掘算法的分析模型。
4.數據挖掘
使用選擇好的數據挖掘算法對數據進行處理后得到信息。
5.解釋與評價
對數據挖掘后的信息加以分析解釋,并應用于實際的工作領域。