真實、海量豐滿的數據集合,是每個企業或機構都夢寐以求的“信息黃金”,是促進行業經濟發展,持續產品服務科技創新,實現智慧生活方式等方方面面,都起著核心作用的基礎社會要素。那么如何獲取數據,可以從以下幾個方面入手:
1.自建數據倉庫或使用第三方的數據庫云;
從自我業務流程數據匯總入手,沿著業務流程向下擴展至市場下游終端,向上延伸至生產制造,原材料采購等上游始端,完善供應鏈體系,同時開放數據接口,對接供應鏈上所有價值環節共同進行數據輸入,流轉,輸出,實現數據匯總,收集或分享;
這種大數據獲取過程,保障了數據的真實,有效,在量級與類型都能滿足大數據的性質定位;
(圖片僅供參考)
這個過程,一般大致需要三年時間左右才能初具成效;比如mobike,ofo等;同時需要專業的系統技術及人才團隊,針對自我企業發展目標進行系統架構,指標庫,數據模型等的設計的不斷迭代和持續完善;
這類自建的收集存儲數據系統,具備顯著的行業垂直特性,在數據的信度效度上,能達到80%以上的使用參考價值;非常有利于供應鏈系統的資源優化及有效實現各價值環節的利益最大化;當然搭建系統和數據積累過程所產生的成本也是很高的;
2.與已具備較完善大數據集合所屬方(比如BAT),或正迅速發展的各行業前十數據流量入口平臺合作(比如新媒體平臺頭條,百家,微信等),通過嵌入式SDK數據接口進行快速采集,匯總,清洗;
(圖片僅供參考)
這類收集獲取的數據類型,建立在已有的數據倉庫基礎之上,獲取的數據具備一定的行業特性,但數據量級及類型會更加繁雜,對后期的數據清洗上會產生較大的工作量及成本;在數據信度,效度上的參考價值在60%以上,但大大縮短了數據獲取的時間周期及成本;
3.直接向第三方大數據機構購買;
這類主要用于企業上市,戰略制定或調整及新項目快速啟動時,針對市場需求及目標用戶畫像,產品創新設計等行業競爭動態方面的策略決策上做數據支撐;
屬于定制化數據獲取,真實性及有效性,需要深入考察第三方的數據來源及處理技術,數據整合資質及行業口碑等在做評估;
(圖片僅供參考)
以上為目前較為常規的大數據獲取方式。其中,數據使用目的及需求緊迫程度不同,決定著數據獲取方式的不同;而不同的獲取方式,決定著數據質量(信度和效度)的高低,數據質量的優劣,又決定著對決策支撐的參考價值;
以上內容,簡述了大數據獲取的三種主流方式及不同獲取方式的數據質量優劣,對企業戰略決策的不同價值參考,希望能幫到朋友們快速理解和學習。對大數據有興趣的朋友,可在評論區一起交流探討。謝謝。
【墨蔸集】作者:連續創業者,專注商業數據分析及團隊管理。定期輸出大數據商業運營管理實戰經驗。。