舉一個證券的例子,舉一個銀行的例子。
證券行業的案例
以上是一個神策標簽畫像產品的實施流程示意,如上圖,可以發現,我們整體的項目管理做的非常精細,包括項目準備、系統部署、標簽需求梳理、產品持續交付、標簽系統實施、交付與培訓、交付后支持七個步驟。
1.需求調研:梳理業務場景、運營策略和需求
具體到其中的需求調研階段,上圖是我們根據了解到客戶的業務場景、運營策略和需求初步建立的一個需求梳理框架。因為該企業設計標簽體系的目的是做用戶運營,所以會從新客培育、活躍留存、交易提升、資金留存、沉沒喚醒、流失預防、喪失召回、用戶體驗、大客戶運營等維度來梳理企業的業務體系,但是如果企業的標簽體系設計目的是做個性化推薦,設計思路將完全不同。
所以,我們為每一個企業梳理標簽體系前都要明確目標,根據目標來梳理一個基本的業務需求框架,再通過前期調研,如訪談、查資料等來補充框架上的信息。
2.由業務需求抽離出標簽需求
明確企業的業務需求后,我們再根據企業的業務需求梳理標簽需求,并梳理出相應的標簽策略,最后制定對應的標簽,這些標簽是企業最終的場景應用會使用到的標簽。
如上圖,我們最終幫該證券客戶的標簽梳理成幾大類。
第一類是用戶的基本信息。基本信息包括如用戶識別、激活信息(引流或者拉新時的重要信息,如用戶什么時候來、什么渠道來等)、風險特征(金融行業用的比較多)等信息。
第二類是用戶的賬戶特征。因為證券企業的用戶有多套資金帳戶,但是不管用戶操作的是哪個資金帳戶,企業最終營銷的都是用戶本身,關于用戶本身的特征和偏好才是最重要的信息,所以我們會對用戶的帳戶做一層設計。
第三類是業務特征。之所以我們會劃分交易、理財、資訊、服務四類,與企業的運營體系相關,他們是按照板塊劃分具體的運營的。所以要建立真正代表用戶在特定業務場景下的標簽,我們會拆分業務層,業務層對應的標簽就是表征業務本身的特點,如理財的標簽與交易標簽完全不一樣,股票標簽會涉及到個股偏好,但是理財產品實際上對特定產品偏好較弱,更看重產品類型。還有活躍特征和價值標簽很好理解,我就不贅述了。
下圖是某證券客戶標簽畫像系統實施的demo示例。
第二個銀行的案例,是中原銀行大數據架構師劉遠東的一次分享。
平臺建設目標與思路
中原銀行已將大數據治理與應用建設上升到全行戰略層面,并制定了以技術創新為導向,秉承自主可控、開放共享的理念,構建統一完整、便捷高效、智能安全的大數據技術體系,提供全流程、一站式、智能化的數據服務的目標。
值得強調的是,中原銀行一直以來的目標不是做一個系統,而是為了提供一種服務。比如,當業務人員想知道流失了多少客戶,就目前來說,很難提供給他BI,即使提供了數據,他也很難算出來,但通過場景化分析,制定出該場景下所需要的維度和指標,通過調取相關數據,很容易進行分析。因此,我們計劃把一個場景做成服務,未來提供給業務團隊使用。
數據平臺建設進展與規劃
這是中原銀行大體的平臺建設進展情況:
2016年已完成基礎平臺搭建和數據架構的設計;
2017年建立了一個數據整合平臺,構建了數據服務引擎、OLAP自助分析引擎和挖掘分析平臺的基礎搭建;
2018年計劃做數據治理、實時計算服務、圖計算服務、數據交換平臺、機器學習平臺等;
2019年,我們可能會從技術角度出發,做一些更加整合類的、更加完善類的、提升類的項目。
在很多情況下,雖然科技部門領頭建立了技術體系,但并沒有真正的業務落地,現在我們在嘗試往實現業務跨越發展的方向轉移。
在2018年6月,中原銀行特別成立了一個一級部——數據銀行部,這是從信息技術部分離出來的一個部門。
以前我們更多地專注于技術,但現在意識到用技術驅動業務,在營銷和風控方面的成本和難度都非常高,且技術并不一定能驅動業務帶來收益,從這一點上,我們決定嘗試神策數據提供的這一套場景化的方法論和邏輯。
中原銀行在過去幾年做了一些技術驅動的改進。比如,面向全行的集中交付能力優化,包括固定報表和移動報表,自助查詢模型等,特別是在過去幾年銀行業的自助查詢比較流行,沒有做的銀行未來也一定要做,這是一個必經的階段。
數據分析需求理解:五種模式支持全行應用
我認為銀行業的數據分析需求可能有五種場景的數據交互模式(如上圖)。中原銀行目前做了一個數據實驗室,其實是一套數據湖的系統,就是把以前的倉庫、集市這些平臺遷到了一個新的計算架構上面,它的主要作用是為了做數據建模和探索性的分析,該平臺完全獨立于原來的P2P平臺,且不像以前那樣只做報表,也能做一些自助分析、數據建模,以便將來能支持更多建模師的使用。
我們希望這種項目出來成果之后,能做成不同類的業務場景應用。不過,有些舊有模式,比如即席查詢在中國視角下會一直存在,因為很難從別的應用場景完全替代它。
數據分析平臺體系建設
中原銀行目前規劃了一套數據平臺體系,但目前這個體系還在演進。
在過去幾年,中原銀行大概做了將近1000張報表、20多個主題的自助分析以及數據實驗室的平臺。
這些平臺面向的人員有所不同,報表主要面向數據使用人員;自助分析主要面向條線,比如給領導編制報表和往下發布數據的人;數據實驗室主要面向一些有科技背景的人員,比如建模師。
除了上述三大平臺,中原銀行還建立了一個社區平臺,我們把這些統稱為一站式分析平臺。
數據驅動創新社區的建立是為了引領行業數據驅動的發展,目前,科技部正在主導這個社區的建設。
我們會在該社區大量地發布一些數據驅動的內容,比如,數據分析報告,文章等。
個人認為,像數據驅動這種工作的推動,將來一定是業務牽頭的,因為即使技術人員有思路也很難達到盈利,所以需要站到業務角度上去實踐,現在,我們會把自己的技術人派遣到業務部門,學習在業務場景下進行分析。
前面提到的這幾種數據分析平臺還是比較偏技術方向,不過我始終認為,未來一定是場景化的方向才有發展。因為場景化的成本更低,比如,更低的使用成本,場景化讓業務人員使用更方便;更低的人才成本,場景化的應用不需要招很多技術人員。
面向大數據的綜合分析平臺架構
這是中原銀行目前面向大數據的綜合分析平臺架構,在這方面各行差異不大。
不過,中原銀行集市做的很薄,只有一個貼源的ODS,以及4-5塊集市,比如管會、內部運營、營銷等,與其他銀行相比,中原銀行是一個非常輕的架構,從貼源可以直接到集市,有的集市甚至沒有指標加工,就直接整合明細,再到自助分析、報表,有的也往實驗室里面供。
個人認為,像自助分析和場景化分析、數據湖這樣的思路早晚會替代我們之前做的大量報表,T+0會替代T+1,這只是時間問題,所以,我們整個架構現在也在往這邊遷移。
分析平臺建設實踐—性能優化
在前幾年中原銀行對分析平臺做了一些性能調優。一般剛開始從報表轉到BI,肯定會面臨性能問題,因為BI本身是一種以空間換取靈活性的方式。
我們采用大數據技術支撐計算,用了30個物理計算節點,大概有二三十個面向大數據反范式設計的主題模型,也就是寬表模型,因為寬表模型犧牲了很多空間的代價,在這個大數據的平臺上一般會跑得比較順,冗余度高一點,性能會提高。
不過,大數據平臺的一個主要特點是成本較低,擴容方面也可以接受,所以我們現在更多選用這種方式。
分析平臺建設實踐—質量提升
數據質量提升,是中原銀行今年的重點,我們準備啟動一個新的數據治理項目。下面簡單介紹下:
我們建設了一個在線口徑管理的渠道。舉個例子,現在業務在看報表發現數據問題的時候,會有一個線上的渠道直接在上面反饋問題,之后會有專門的技術人員跟進,除此之外,我們還有一個類似知識庫的渠道,該渠道有利于口徑的沉淀,但是,對數據的治理,比如主數據、標準管理,我們還需要進一步完善。
分析平臺建設實踐-靈活性提升
這個是中原銀行的BI平臺,總體來說使用還不錯。我認為銀行到一個階段必須做BI,如果沒有BI很難把數據驅動的思路真正地讓業務落地,因為業務人員無法直接接觸數據,很難了解數據在未來的作用。只有他們把BI用熟了之后,你才能告訴他以后可以做場景化分析和預測類分析,現在中原銀行就是沿著這樣的軌跡發展。
分析平臺建設實踐—數據安全管控
金融業會涉及很多敏感數據,特別要注意數據安全問題,為了保證數據安全,我們做了一些技術上的加工,比如:
下載管理,我們建立了完善的數據使用審核流程和設定了數據最小訪問授權,按需分配報表訪問權限;
實時脫敏,Smartbi支持不同形式的數據脫敏展現,可以實現前臺敏感信息的脫敏展示,對像身份證號這樣的敏感數據在實時展現時會隱去;
使用痕跡的管理,我們會統計發布報表訪問數據,促進報表使用過程中的自我監督和相互監督,便于及時發現因崗位調整,多余授權帶來的數據泄漏風險;
行為監控,我們利用大數據與機器學習技術,建設數據安全智能分析預警平臺,對數據操作行為進行智能化監控,防范內部數據安全事件。
未來建設規劃—數據深度探查服務體系
我們的未來建設規劃大體如上圖,目前來說,我們還處于數據探索和多維分析階段,在今年我們啟動了幾個數據建模項目,下面列舉一二。
我們啟動了一個叫做網點的現金流預測項目,要做到精準預測,需要考慮到很多維度,比如網點的維度、人員的維度、客流的維度、天氣的維度。因此,這個項目通過分析研究所有網點的歷史數據來預測各支行每天需要多少存款,這里的存款指的是現金。因為對支行來說現金的存量是個非常大的成本,比如運輸成本,而且現金沉淀到支行沒有利息,相當于現金放那兒了。
我們希望預測類的項目在明年會有一些階段性的成果出現,也希望通過我們在數據驅動變革創新方面的努力,能為推進金融業數字化轉型建設發展進一份力。
以上是我的回答,希望對你能有幫助,我的主頁。