數據分析包含哪幾個步驟?
數據分析主要有哪些思維?學習的路線是怎么樣的?
為了提供一個簡單的方向指引,讓數據分析思維的學習過程更加有趣,我做了一幅數據分析思維九段路線圖,你可以把學習的過程當作一種游戲,享受段位升級的樂趣。
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
在段位升級的過程中,如果你理解起來感覺比較吃力,那么應該沉下心來,認真地先把基礎打好,積累更多的數據分析經驗。
DataFocus 企業大數據BI分析系統,讓數據分析像搜索一樣簡單
1. 初段:目標思維
做數據分析,首先要一定明確目標,以終為始。
只有明確目標,才不會迷失方向,就像導航軟件,如果沒有設置目的地,那么它是沒法告訴你路線圖的。
目標思維主要體現在以下 3 個方面:
(1)正確地定義問題
比如說,小明聽了煎餅大媽月入 3 萬的故事,心里就想:為什么煎餅大媽月入 3 萬?
這個問題的定義,應該是關注「月入 3 萬」,而不是「煎餅大媽」。
也就是說,小明想的應該是「如何實現月入 3 萬」,而不是「如何變成煎餅大媽」。
(2)合理地分解問題
比如說,煎餅大媽如何實現月收入 3 萬?
這是一個比較大的問題,可以進行細分,因為收入等于訂單數乘以客單價,所以把這個問題細分為兩個小問題:
a. 如何實現一個月賣 5000 個煎餅?
b. 如何實現平均每個煎餅賣 6 塊錢?
(3)抓住關鍵的問題
在不同的發展階段,關鍵問題是不一樣的。
比如說,對煎餅大媽來講,剛開始做的時候,關鍵問題是:如何選擇人流量大的好地段?
當選好地段之后,關鍵問題就變成:如何提高路人來購買的概率?如何提高客單價?如何提高重復購買率?
總之,數據分析的目標,就好比槍上的瞄準器,如果沒有瞄準器,槍照樣可以打,但是有了瞄準器,槍才可以打的更準。
2. 二段:對比思維
有人說:
沒有對比,就沒有傷害。
在數據分析中,沒有對比,就沒有結論。
比如說,小明某次期末考試的成績不好,英語只得了 30 分,小明的媽媽對他說:“你上次考試英語考了 70 分,這次怎么就考得這么差?你看你的同班同學,這次都考 80 分以上。”
常見的對比思維有以下 5 種:
(1)跟目標對比
(2)跟上個月比
(3)跟去年同比
(4)分渠道對比
(5)跟同類對比
數據分析的過程,就是在明確目標之后,通過對比等思維,找到問題的原因,得出分析的結論,提出可行的建議,從而起到幫助決策和指導行動的作用。
3. 三段:細分思維
有人說:
不自由,毋寧死。
在數據分析中,細分是數據分析的靈魂,無細分,毋寧死。
比如說,小明某次考試的總成績不好,細分一看,發現其他科目的成績都不錯,只有英語成績特別差,只得了 30 分,從而拉低了整體的成績。
常見的細分方法有以下 5 種:
(1)按時間細分
(2)按空間細分
(3)按過程細分
(4)按公式細分
(5)按模型細分
在運用細分思維解決問題的過程中,要做到有的放矢,圍繞數據分析的目標,找到合適的方法,不要像無頭蒼蠅一樣到處亂撞。
當發現數據異常時,嘗試從不同的維度進行細分,這樣既能鍛煉你的數據分析思維,又能加深你對業務的理解。
4. 四段:溯源思維
做數據分析的時候,要多問幾個為什么,追根溯源,在數據源尋找可能隱藏的邏輯關系和解決方案。
比如說,小明把自己每天的行動數據,都用 Excel 詳細記錄下來,其中包括每一時段的情緒數據。小明做復盤總結的時候,發現有一天情緒數據特別低,然后連續問了幾個為什么:
(1)為什么這一天情緒數據特別低?
因為那一天小明上當受騙了。
(2)為什么會上當受騙?
因為騙子用生命安全來嚇小明。
(3)為什么騙子能嚇到小明?
因為小明擔心自己的生命安全。
(4)為什么小明會擔心生命安全?
因為求生是人類的本能反應。
(5)為什么人會有求生的本能?
因為人的大腦分為:年代久遠的本能腦、相對古老的情緒腦和非常年輕的理智腦。
理智腦對大腦的控制能力很弱,大部分決策往往源于本能和情緒,而非理智。
到這一步,小明找到了自己上當受騙的根本原因,在于自己當時沒有控制好自己的大腦,所以失去理智。
針對這個問題,小明運用「控制兩分法」,并在腦海中反復進行演練,然后在實踐中進行校正,實現與情緒的和平共處,從而更加理智地面對紛繁復雜的世界。
如果你經常運用溯源思維,就能提升數據的敏感度,并加深對業務的理解。
5. 五段:相關思維
相關思維,就是尋找變量之間相互關聯的程度。
比如說,有一家超市的數據分析師發現,跟尿布一起購買最多的商品竟然是啤酒,啤酒和尿布有什么關聯呢?
采訪小明的爸爸,他說自己下班后,給小明的妹妹買尿布的同時,也會購買自己喜歡喝的啤酒。
如果一個變量改變的時候,另一個變量也朝著相同的方向發生變化,那么我們就說這兩個變量之間存在正相關性。
運用相關思維,通常包括以下 3 個步驟:
(1)收集相關數據
(2)繪制散點圖形
(3)計算相關系數
需要注意的是,相關不等于因果。即使兩個變量之間相關,也不代表其中一個變量的改變,是由另一個變量的變化引起的。
比如說,國家的諾貝爾獎數量,與巧克力消費量之間呈現正相關關系,但這并不是說,多吃巧克力有助于獲得更多的諾貝爾獎。
一種合理的解釋是,諾貝爾獎的數量與巧克力的消費量,很可能都是由其他變量導致的,例如國民的受教育程度和富裕程度。
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
6. 六段:假設思維
胡適先生說過:
大膽假設,小心求證。
這句話非常適合用在數據分析領域。
大膽假設,就是要打破既有觀念的束縛,掙破舊有思想的牢籠,大膽創新,對未解決的問題提出新的假設。
小心求證,就是基于上面的假設,用一種嚴謹務實的態度,尋找真相,不能有半點馬虎。
比如說,有一天小明去買水果,跟賣水果的阿姨說:
“阿姨,你這桔子甜不甜?”
阿姨:“甜啊,不信你試試。”
小明:“好,那我試一個。”
小明剝開一個桔子,嘗了一口說:
“嗯,不錯,確實挺甜的,給我稱兩斤。”
運用假設思維,通常包括以下 3 個步驟:
(1)提出假設
(2)統計檢驗
(3)做出判斷
大膽假設并非絕對可靠,但是通過小心求證,我們可以更好地認識世界上的許多現象,從而得出更有價值的分析結論。
7. 七段:逆向思維
到了七段,你已經具備比較豐富的數據分析經驗,此時如果想要進一步有所突破,就得打破常規,具有逆向思維的能力。
比如說,有一天小明去買西紅柿:“阿姨,你這西紅柿多少錢一斤?”
阿姨:“兩塊五。”
小明挑了 3 個放到秤盤:“阿姨,幫我稱一下。”
阿姨:“一斤半,3 塊 7 毛。”
小明去掉其中最大的西紅柿:“做湯不用那么多。”
阿姨:“一斤二兩,3 塊。”
小明拿起剛剛去掉的那個最大的西紅柿,付了 7 毛錢,扭頭就走了。
你看,本來是阿姨想占小明的便宜,虛報重量。但是,小明利用逆向思維,反而讓阿姨吃了啞巴虧。
常見的逆向思維有以下 5 種:
(1)結構逆向
(2)功能逆向
(3)狀態逆向
(4)原理逆向
(5)方法逆向
理解這些逆向的方法,有助于你打開數據分析的思路,不斷提升自己的可遷移能力,尤其是底層的思維能力,做到以不變應萬變。
8. 八段:演繹思維
演繹思維的方向是由一般到個別,主要形式是「三段論」,由大前提、小前提、結論三部分組成。
比如說,小明不僅知道:金屬都能導電;而且知道:銅是一種金屬;所以小明可以得出結論:銅能導電。
運用演繹思維,應該遵循 5 項基本原則:
(1)不要出現第四個概念
(2)中項要能向外延伸
(3)大項和小項都不能擴大
(4)前提都為否,結論不必然
(5)前提有一否,結論必為否
掌握以上基本原則,能幫你建立更加嚴謹的數據分析思維。
9. 九段:歸納思維
歸納思維的方向與演繹正好相反,歸納的過程是從個別到一般。
比如說,小明先知道:金、銀、銅、鐵等金屬分別能導電,然后歸納出一個結論:所有金屬都能導電。
這個過程,是先接觸到個別事物,然后再進行歸納總結。
常見的歸納方法有以下 5 種:
(1)求同法
(2)求異法
(3)共用法
(4)共變法
(5)剩余法
這些方法是我們獲取新知識的重要途徑,不過需要注意的是,很多案例和故事都說明,有限的觀察并不等于真理。
為了避免以偏概全,我們還要加強歸納思維的訓練,積累更多實戰的經驗,這樣歸納總結出來的結論,才能經得起時間的考驗,才會更有現實意義。
通過歸納總結,得出有價值的分析結論,這既是數據分析的終點,也是數據分析的起點,形成一個正向的循環系統。
最后的話
正確的思維能力,是做好數據分析的必備條件,這也是很多人相對比較欠缺的一種能力。
要想成為一個有洞察力的人,就要多學習、多思考、多總結、多實踐,通過刻意練習,舉一反三,把數據分析的思維,應用到日常的工作和生活中去,逐漸提升自己的數據分析思維能力。