大數(shù)據(jù)是我的主要研究方向之一,同時(shí)也在帶大數(shù)據(jù)方向的研究生,所以我來回答一下這個(gè)問題。
首先,SQL語言是數(shù)據(jù)分析師的重要技能之一,大量的數(shù)據(jù)分析任務(wù)都需要使用SQL語言。
在大數(shù)據(jù)逐漸落地應(yīng)用的大背景下,廣大的傳統(tǒng)行業(yè)會陸續(xù)釋放出大量的數(shù)據(jù)分析師崗位,數(shù)據(jù)分析師也將從互聯(lián)網(wǎng)行業(yè)逐漸走向傳統(tǒng)行業(yè)。
大數(shù)據(jù)分析通常有兩種方式,其一是采用機(jī)器學(xué)習(xí)的方式,其二是采用統(tǒng)計(jì)學(xué)的方式,不論采用哪種方式,既可以通過編程來實(shí)現(xiàn)數(shù)據(jù)分析,也可以通過數(shù)據(jù)分析工具來實(shí)現(xiàn)數(shù)據(jù)分析,比如Excel、報(bào)表工具、BI工具等等都是數(shù)據(jù)分析比較常見的工具。不論采用編程的方式實(shí)現(xiàn)數(shù)據(jù)分析,還是通過BI工具的方式來實(shí)現(xiàn)數(shù)據(jù)分析,SQL都是基本的技能要求之一。
基礎(chǔ)的數(shù)據(jù)分析任務(wù)通常通過Excel工具就可以完成,對于大部分職場人來說,結(jié)構(gòu)化數(shù)據(jù)分析是比較常見的,而且數(shù)據(jù)量通常都在十萬條以內(nèi),這種情況下采用Excel就可以完成基本的數(shù)據(jù)分析任務(wù),此時(shí)即使不會使用SQL,也能完成數(shù)據(jù)分析任務(wù)。
但是如果數(shù)據(jù)量比較大,而且數(shù)據(jù)相對比較分散,位于多個(gè)數(shù)據(jù)庫中,此時(shí)就需要使用SQL語言了。不僅在數(shù)據(jù)清洗的過程中需要使用SQL語言,在進(jìn)行基礎(chǔ)數(shù)據(jù)歸并和分析時(shí)也需要采用SQL語言,所以SQL語言對于數(shù)據(jù)分析師、數(shù)據(jù)采集工程師、大數(shù)據(jù)運(yùn)維工程師來說都是重要的基本技能之一。
對于數(shù)據(jù)分析師來說,通常需要具備三方面知識結(jié)構(gòu),其一是數(shù)據(jù)庫知識(包括諸多工具);其二是編程知識(比如Python、R就比較常用);其三是行業(yè)背景知識,因?yàn)槟壳皥鼍按髷?shù)據(jù)分析是重要的落地應(yīng)用。