好的DAP數據分析平臺應該包括數據源頭管理、數據采集、數據加工、數據調度、數據集市、數據可視化配置、OpenAPI配置、機器學習算法等全生命周期的管理功能,把DW/ETL/BI結合在一起搞定傳統意義的數據分析、領導決策平臺,且能平滑升級后未來的大數據分析平臺。
前期通常以內部生產經營管理數據、格式化的數據為主,后期結合外部的數據(互聯網爬蟲、同業對標、國計民生、社交數據等)、包含非格式化數據,支持流式數據介入、預置算法、大數據深度分析、智能預測決策、且提供OpenAPI供其它系統使用。
數據分析平臺的重點是看什么、怎么分析看、怎么才好看(酷炫、便捷);難點是數據全不全、準不準、數據怎么來、怎么加工處理。絕大多數數據平臺都忽略難點、主攻重點,很多時候把垃圾數據展現成精美點心、好看卻不實用。
數據平臺建設過程中包括幾個步驟,數據源分析與挑選(占30%工作量)、各系統數據同步抽取到ODS(占20%)、數據從ODS加工處理成可用的數倉模型(占30%)、數據的展現配置及權限配置等(占20%),其中數據質量管理、血緣分析、影響分析卻是要分析平臺底層來保障的,一個整體數據分析方案需要數據分析平臺、數據總線平臺、主數據管理平臺組合、相互協作來完成、保障數據決策分析平臺項目能夠落地、真正達到輔助領導決策的目標。