數(shù)據(jù)科學(xué)(DS)
簡(jiǎn)單定義為:數(shù)據(jù)科學(xué)是從數(shù)據(jù)中提取有用知識(shí)的一系列技能和技術(shù)。
這些技能通常用德魯·康威(DrewConway)創(chuàng)造的維恩圖(或它的變體)來(lái)表示:
三個(gè)圓圈分別代表三個(gè)不同的領(lǐng)域:編程領(lǐng)域(語(yǔ)言知識(shí)、語(yǔ)言庫(kù)、設(shè)計(jì)模式、體系結(jié)構(gòu)等);數(shù)學(xué)(代數(shù)、微積分等)和統(tǒng)計(jì)學(xué)領(lǐng)域;數(shù)據(jù)領(lǐng)域(特定領(lǐng)域的知識(shí):醫(yī)療、金融、工業(yè)等)。
這些領(lǐng)域共同構(gòu)成了定義中的技能和技術(shù)。它們包括獲取數(shù)據(jù)、數(shù)據(jù)清理、數(shù)據(jù)分析、創(chuàng)建假設(shè)、算法、機(jī)器學(xué)習(xí)、優(yōu)化、結(jié)果可視化等等。
數(shù)據(jù)科學(xué)匯集了這些領(lǐng)域和技能,支持和改進(jìn)了從原始數(shù)據(jù)中提取見(jiàn)解和知識(shí)的過(guò)程。
什么是“有用的知識(shí)”?就是可以具有某種價(jià)值、可以回答或解決現(xiàn)實(shí)世界中問(wèn)題的知識(shí)。
數(shù)據(jù)科學(xué)也可以定義為:研究應(yīng)用數(shù)據(jù)處理和分析方面的進(jìn)展,為我們提供解決方法和答案的領(lǐng)域。