題主所說的漏斗分析是網(wǎng)站分析的特定方法,除此以外,還有路徑分析、歸因分析和熱力圖分析等。
漏斗分析是網(wǎng)站分析的基本方法,很多強大的工具支持全站頁面、事件、目標(biāo)之間的混合漏斗分析,通過漏斗查看特定目標(biāo)的完成和流失情況。根據(jù)漏斗的封閉性可分為封閉型漏斗和開放型漏斗。
封閉型漏斗指漏斗從第一環(huán)節(jié)開始后最后的環(huán)節(jié),數(shù)據(jù)從上一環(huán)節(jié)開始依次“漏”下來,不存在其他進入途徑。典型的封閉型漏斗是購物車流程,通常情況下從加入購物車開始,用戶依次進入結(jié)算和提交訂單,由此形成加入購物車→結(jié)算→提交訂單完整閉環(huán),該過程中不可能從其他環(huán)節(jié)直接進入。
開放型漏斗指漏斗的各個環(huán)節(jié)都有可能存在其他入口,整個漏斗不封閉。典型的開放型漏斗是全站購物流程漏斗,通常該漏斗是到達著陸頁→查看產(chǎn)品頁→加入購物車。在整個過程中,用戶查看產(chǎn)品頁和加入購物車可能從任何一個具備該功能的入口進入,而不一定是從著陸頁開始。
漏斗分析的典型應(yīng)用場景是分析站內(nèi)流程,如注冊流程、購物車流程等;除了可以做針對多頁面的流程分析外,還可以做單頁面的多個步驟分析,如表單分析、注冊分析等。
路徑分析也是網(wǎng)站分析的基本方法,借助于網(wǎng)站數(shù)據(jù)的可跟蹤和可監(jiān)測特征,所有用戶行為都處于可分析的狀態(tài)。路徑分析不僅可以基于頁面產(chǎn)生,還可以基于目標(biāo)路徑、事件路徑等數(shù)據(jù)主體產(chǎn)生。
頁面路徑常用于分析不同頁面引流和前后路徑關(guān)系,如用戶從活動頁落地后如何分流、典型客戶的路徑特征、客戶網(wǎng)站訪問動線、頁面廣告資源挖掘、站內(nèi)多頁面流程設(shè)計優(yōu)化等。大多數(shù)網(wǎng)站分析系統(tǒng)只能提供基于流量(通常是PV)的單維度路徑,有些強大的分析系統(tǒng)或插件能實現(xiàn)三維路徑分析。這些分析可以為站內(nèi)流程優(yōu)化、流量引導(dǎo)和分配等提供決策建議。典型應(yīng)用包括:
活動主會場/網(wǎng)站主頁面如何導(dǎo)流?
用戶是否按照“預(yù)期”流程行動?
購買“手機的用戶”的瀏覽習(xí)慣是怎樣的?
渠道A集中訪問了某條路徑,是否是“惡意流量”?
歸因分析很多時候也叫訂單轉(zhuǎn)化歸因或歸因模型,主要用于評估多個參與轉(zhuǎn)化的主體如何分配貢獻大小。出現(xiàn)歸因的基本條件是某些轉(zhuǎn)化沒有特定的歸屬,因此無法直接判斷到底是由哪些因素產(chǎn)生。
以訂單轉(zhuǎn)化為例,歸因分析用來衡量在用戶從第一次進入網(wǎng)站到最后一次進入網(wǎng)站成單時,所有來源渠道對訂單的貢獻作用。傳統(tǒng)的網(wǎng)站分析工具把訂單歸因為最后一次來源渠道(在此不考慮渠道覆蓋規(guī)則),但這種訂單歸因的分配模式忽視了其他渠道對于該訂單的“轉(zhuǎn)化支持”作用。在實際運營業(yè)務(wù)中,SEM品牌詞流量、直接輸入流量、網(wǎng)址導(dǎo)航直接進入網(wǎng)站的流量質(zhì)量都非常高,原因是用戶認(rèn)知度、認(rèn)可度和忠誠度比較高。但如果因此只投放這些“收口”渠道而忽視其他渠道,這些“收口”渠道效果是否還能持續(xù)?
除了傳統(tǒng)的歸因于最后進入的渠道的方法外,還有其他的歸因方法:歸因于最初進入的渠道、線性平均歸因、隨時間衰減歸因、根據(jù)位置的綜合歸因等。
好了除了上述方法外,就沒有其他方法了嗎?當(dāng)然不是,你還有這些方法:
1.協(xié)同過濾
協(xié)同過濾(CollaborativeFiltering,CF))是利用集體智慧的一個典型方法,常被用于分辨特定對象(通常是人)可能感興趣的項目(項目可能是商品、資訊、書籍、音樂、帖子等),這些感興趣的內(nèi)容來源于其他類似人群的興趣和愛好,然后被作為推薦內(nèi)容推薦給特定對象。
協(xié)同過濾主要解決的問題是當(dāng)客戶進入某個領(lǐng)域后,什么內(nèi)容或項目是他/她可能感興趣的東西,然后以用戶的興趣為出發(fā)點推薦他/她可能感興趣的內(nèi)容,以此來提高用戶體驗、用戶交互頻率提升、訂單轉(zhuǎn)化效果、銷售利潤提升等。
協(xié)同過濾目前主要用于電子商務(wù)網(wǎng)站、興趣部落網(wǎng)站、知識性網(wǎng)站、話題型網(wǎng)站、社交性網(wǎng)站的個性化項目推薦。協(xié)同過濾推薦的場景通常發(fā)生在,當(dāng)客戶對內(nèi)容進行打分的前提下,例如內(nèi)容評分、綜合評價等。
2.回歸
回歸是研究自變量x對因變量y影響的一種數(shù)據(jù)分析方法。最簡單的回歸模型是一元線性回歸(只包括一個自變量和一個因變量,且二者的關(guān)系可用一條直線近似表示),可以表示為Y=β0+β1x+ε,其中Y為因變量,x為自變量,β1為影響系數(shù),β0為截距,ε為隨機誤差。
回歸分析按照自變量的個數(shù)分為一元回歸模型和多元回歸模型;按照影響是否線性分為線性回歸和非線性回歸。
回歸分析是廣泛應(yīng)用的統(tǒng)計學(xué)分析方法,可以用于分析其中一方對另一方的影響關(guān)系(通過自變量求因變量),也可以分析自變量對因變量的影響方向(正向影響還是負(fù)向影響)。回歸分析的主要應(yīng)用場景是進行預(yù)測和控制,例如計劃制定、KPI制定、目標(biāo)制定等方面,也可以基于預(yù)測的數(shù)據(jù)與實際數(shù)據(jù)進行比對和分析,確定事件發(fā)展程度并給未來行動提供方向性。
3.聚類
聚類是數(shù)據(jù)挖掘和計算中的基本任務(wù),聚類是將大量數(shù)據(jù)集中具有“相似”特征的數(shù)據(jù)點劃分為統(tǒng)一類別,并最終生成多個類的方法。聚類分析的基本思想是“物以類聚、人以群分”,因此大量的數(shù)據(jù)集中必然存在相似的數(shù)據(jù)點,基于這個假設(shè)就可以將數(shù)據(jù)區(qū)分出來,并發(fā)現(xiàn)每個數(shù)據(jù)集(分類)的特征。
聚類常用于數(shù)據(jù)探索或挖掘初期,在沒有做數(shù)據(jù)整體分析之前進行的探索性分析,適用于樣本量較大情況下的數(shù)據(jù)初步探索。比如針對企業(yè)整體用戶特征,在未得到相關(guān)知識或經(jīng)驗之前先根據(jù)數(shù)據(jù)本身特點進行用戶分群,然后再針對不同群體做進一步分析。
聚類析能解決的問題類型包括:目前的數(shù)據(jù)集可以分為幾類、每個類別有多少樣本量、不同類別中各個變量的強弱關(guān)系如何、不同類別的典型特征是什么等;同時,基于聚類可以對客戶進行細(xì)分,在市場研究中的規(guī)模測試、機會發(fā)掘,以及進行圖片壓縮等應(yīng)用。聚類無法提供明確的行動指向,聚類結(jié)果更多是為后期挖掘和分析工作提供參考,無法回答“為什么”和“怎么辦”的問題。
4.分類
分類算法通過對已知類別訓(xùn)練集的計算和分析,從中發(fā)現(xiàn)類別規(guī)則,以此預(yù)測新數(shù)據(jù)的類別的一類算法。分類算法是解決分類問題的方法,是數(shù)據(jù)挖掘、機器學(xué)習(xí)和模式識別中一個重要的研究領(lǐng)域。
分類的主要用途和場景是“預(yù)測”,基于已有的樣本預(yù)測新的樣本的所屬類別。例如,信用評級、風(fēng)險等級、欺詐預(yù)測等;它是模式識別的重要組成部分,例如機器翻譯,人臉識別、醫(yī)學(xué)診斷手寫字符識別、指紋識別等圖像識別領(lǐng)域,語音識別領(lǐng)域,視頻識別領(lǐng)域等;另外,可以用于知識抽取,通過模型找到潛在的規(guī)律,幫助業(yè)務(wù)得到可執(zhí)行的規(guī)則。
5.關(guān)聯(lián)
關(guān)聯(lián)規(guī)則學(xué)習(xí)通過尋找最能夠解釋數(shù)據(jù)變量之間關(guān)系的規(guī)則,來找出大量多元數(shù)據(jù)集中有用的關(guān)聯(lián)規(guī)則,它是從大量數(shù)據(jù)中發(fā)現(xiàn)多種數(shù)據(jù)之間關(guān)系的一種方法,另外,它還可以基于時間序列對多種數(shù)據(jù)間的關(guān)系進行挖掘。關(guān)聯(lián)分析的典型案例是“啤酒和尿布”的捆綁銷售,即買了尿布的用戶還會一起買啤酒。
關(guān)聯(lián)規(guī)則相對其他數(shù)據(jù)挖掘模型簡單,易于業(yè)務(wù)理解和應(yīng)用。關(guān)聯(lián)模型的典型應(yīng)用場景是購物籃分析,通過分析用戶同時購買了哪些商品來分析用戶購物習(xí)慣。這種策略還會應(yīng)用于捆綁銷售、商品促銷設(shè)計、頁面促銷設(shè)計、商品陳列設(shè)計、商品價格策略和基于購買的用戶特征分析等。網(wǎng)站分析工具Webtrekk中的關(guān)聯(lián)分析報表即應(yīng)用了關(guān)聯(lián)模型。
關(guān)聯(lián)模型廣泛應(yīng)用于購物籃分析、網(wǎng)站頁面瀏覽分析、廣告流量來源分析、用戶關(guān)鍵字搜索分析、網(wǎng)站內(nèi)容或產(chǎn)品查看分析、生物特征提取、DNA序列破譯、自然災(zāi)害預(yù)測、科學(xué)實驗分析等,回答的問題類似于“發(fā)生了A之后,還會發(fā)生B還是C?”或者“通常A和B還是和C一起發(fā)生”?
6.時間序列
時間序列是用來研究數(shù)據(jù)隨時間變化趨勢而變化的一類算法,它是一種常用的回歸預(yù)測方法。它的原理是事物的連續(xù)性,所謂連續(xù)性是指客觀事物的發(fā)展具有合乎規(guī)律的連續(xù)性,事物發(fā)展是按照它本身固有的規(guī)律進行的。在一定條件下,只要規(guī)律賴以發(fā)生作用的條件不產(chǎn)生質(zhì)的變化,則事物的基本發(fā)展趨勢在未來就還會延續(xù)下去。
時間序列可以解決在只有時間(序列項)而沒有其他可控變量下對對未來數(shù)據(jù)的預(yù)測問題,常用于經(jīng)濟預(yù)測、股市預(yù)測、天氣預(yù)測等偏宏觀或沒有可控自變量的場景下。
7.異常檢測
大多數(shù)數(shù)據(jù)挖掘或數(shù)據(jù)工作中,異常值都會在數(shù)據(jù)的預(yù)處理過程中被認(rèn)為是“噪音”而剔除,以避免其對總體數(shù)據(jù)評估和分析挖掘的影響。但某些情況下,如果數(shù)據(jù)工作的目標(biāo)就是圍繞異常值,那么這些異常值會成為數(shù)據(jù)工作的焦點。
數(shù)據(jù)集中的異常數(shù)據(jù)通常被成為異常點、離群點或孤立點等,典型特征是這些數(shù)據(jù)的特征或規(guī)則與大多數(shù)數(shù)據(jù)不一致,呈現(xiàn)出“異常”的特點,而檢測這些數(shù)據(jù)的方法被稱為異常檢測。
異常值檢測常用于異常訂單識別、風(fēng)險客戶預(yù)警、黃牛識別、貸款風(fēng)險識別、欺詐檢測、技術(shù)入侵等針對個體的分析場景。