大數(shù)據(jù)是我的主要研究方向之一,同時也在帶大數(shù)據(jù)方向的研究生,我來回答一下這個問題。
對于非計(jì)算機(jī)專業(yè)出身的人來說,學(xué)習(xí)數(shù)據(jù)分析可以從基本的數(shù)據(jù)分析工具開始學(xué)起,一方面比如容易掌握,另一方面也可以跟實(shí)際工作相結(jié)合。
對于銷售人員來說,學(xué)習(xí)數(shù)據(jù)分析技術(shù)具有比較強(qiáng)的現(xiàn)實(shí)意義,目前不少公司的銷售部門都會配備專業(yè)的數(shù)據(jù)分析人員,進(jìn)行場景化的大數(shù)據(jù)分析。場景大數(shù)據(jù)分析通常需要進(jìn)行三個步驟,其一是完成數(shù)據(jù)的采集和整理(抽取),其二是根據(jù)行業(yè)規(guī)則進(jìn)行算法設(shè)計(jì),其三是根據(jù)場景需要進(jìn)行結(jié)果呈現(xiàn)。
場景數(shù)據(jù)分析目前依然以結(jié)構(gòu)化數(shù)據(jù)為主,尤其是銷售類數(shù)據(jù)更是如此。通常情況下,場景數(shù)據(jù)自身的價值密度是比較高的,而且維度也比較清晰,所以在數(shù)據(jù)采集和整理方面會相對比較容易,通??梢灾苯訌囊延械臄?shù)據(jù)庫中進(jìn)行數(shù)據(jù)提取。要想完成這個步驟需要掌握Sql語言以及一些常見數(shù)據(jù)庫的使用。
場景分析的第二步是根據(jù)行業(yè)規(guī)則進(jìn)行算法設(shè)計(jì),這個步驟通常需要具備一定的專業(yè)知識,需要掌握一些常見的算法,比如kNN、決策樹、樸素貝葉斯、支持向量機(jī)等等,這些算法都是數(shù)據(jù)分析領(lǐng)域比較常見的算法。當(dāng)然,目前BI工具已經(jīng)集成了大量的算法,只要根據(jù)具體的應(yīng)用場景進(jìn)行選擇就可以了。其實(shí)大部分常見算法并不復(fù)雜,具備一定線性代數(shù)和概率論的基礎(chǔ)知識就能夠掌握。
場景分析的第三步是進(jìn)行結(jié)果呈現(xiàn),結(jié)果呈現(xiàn)可以有很多種方式,比如可以通過BI工具自帶的模版進(jìn)行定制化設(shè)計(jì),也可以通過編程的方式完成結(jié)果呈現(xiàn)。