數據挖掘是一個比較傳統的研究方向,數據挖掘是通過計算機、算法以及統計學知識發掘大量數據中蘊含的價值化信息的過程,從這個角度來看,數據挖掘需要綜合運用計算機、數學以及統計學的相關知識。在大數據時代,數據挖掘被賦予了更豐富的含義,研究范圍也有了相應的拓展。
從數據挖掘本身來看,算法設計是數據挖掘的核心,而統計學為數據挖掘提供了指導思想,同時數據挖掘又需要數據庫和分布式計算的支撐,所以說數學、統計學、計算機(軟件工程)這幾個學科在數據挖掘中都起到了比較重要的作用。
從數據挖掘研發的角度來看,算法工程師往往是研發的重要參與者,因為數據挖掘的核心是算法設計,算法設計關系到數據挖掘的效率以及質量,另外算法設計還要綜合考慮多種不同的應用場景,而這往往是算法設計師的工作內容。
從項目實施的角度來看,具備計算機(數據庫)相關知識的工程師從事數據挖掘工作是比較普遍的現象,一方面計算機專業往往也具備扎實的數學基礎(算法基礎),另一方面計算機工程師也能夠完成算法的實現過程,所以數據挖掘的項目實施過程往往是由軟件工程師來完成的,包括數據庫工程師。
從應用場景的角度來看,數據挖掘往往是由統計學工程師完成的,因為數據挖掘的應用場景與大量的生產場景密切相關,而統計學工程師往往都具有豐富的行業背景經驗,所以具體的數據挖掘工作往往是由統計學工程師完成的。
綜上所述,數學、統計學、計算機(軟件工程)專業都是參與數據挖掘的直接學科,但是數據挖掘的不同階段往往有所側重。