數據可視化既是一門技術,又是一門藝術。優秀的數據可視化作品可以高效、精準地傳達信息。本篇用3章的篇幅,淺顯地講述相關知識點,目標是讓讀者對數據可視化有一個基本的了解,初步認識數據類型,以及數據可視化的一些常用技巧。本篇的知識儲備尚能應付書本后續的數據分析及可視化實踐。但如果要深入研究建議讀者更廣泛的去閱讀愛德華-塔夫特(EdwardTufte)等人專門論述數據可視化的書籍。
數據可視化的意義
觸手可及的數據
經過三次信息化浪潮的洗禮,將生活的點滴進行數字化記錄和存儲的現象已經變得司空見慣。將一天中的美好瞬間記錄成數字化圖片,比如錄下小寶寶剛剛學會走路時的可愛影像,或者用AppleWatch記錄下心跳,用于開展有規律地運動和飲食,或者用便攜式電子設備記錄下血糖數值,科學指導用藥。到如今,虛擬現實(VR)和增強現實(AR)已經開始模糊數字化世界和真實的世界,新興起的腦機接口技術則將人類推向了人機融合的未來。人類正在朝著比特化生存的大路狂奔而去,未來難以確定,但是有一點可以肯定的是,您的生活正在被量化。相比于個體的人來說,企業組織則早就是數字化革命的先鋒。從最早的業務電算化,到業務信息化的發展過程中,企業就創建了大量基于軟件和互聯網的業務系統。如今ERP(EnterpriseResourcePlanning,企業資源計劃系統)、CRM(CustomerRelationshipManagement,客戶關系管理系統)等信息系統更是企業的標配,一些大型企業集團經過20多年的信息化建設,甚至形成了幾十種、數百種業務信息系統,而這些用比特記錄的業務系統的點點滴滴正在形成龐大的數據池。據IDC(InternationalDataCorporation,國際數據公司)預測,全球數據總量在2020年達到44個ZB(如圖1-1),我國數據量將達到8060個EB,占全球數據總量的18%。物聯網、5G技術的普及,讓工業4.0水到渠成。精益生產越來越普遍,企業將更加注重效率,通過數據分析,挖掘提升組織效率成為必然。圖1-1IDC預測全球數據總量數據資產的價值
大部分人會選擇將寶貴的生活記錄保存下來,以便空閑的時候回顧精彩人生。這樣一年大概會產生100GB的數據,其中大部分是圖片、視頻或音頻。而一個中小型企業組織,每年則會產生1TB的數據,大型企業集團一年的數據增加量甚至會突破1PB。如此大量的數據,僅僅是被記錄存儲就耗費巨大,企業付出昂貴的代價僅僅是為了保存這些數據嗎?有人說,數字化時代“數據就是石油”。企業業務系統所形成的數據大部分與企業的生產、經營、市場活動息息相關,這些數據記錄著企業的業務規律,承載著客戶關系。但如果僅僅是把數據記錄存儲起來,那么這些數據將成為企業永遠的成本。只有對數據進行有效的整理和挖掘,這些數據才會從沉默的費用成本變成有效的資產。如果輔之以高效的數據分析平臺,業務人員隨時隨地可以進行數據分析,從數據中獲得對企業有業務啟示的生產經營規律、市場線索,那么這些數據將變成具有高度變現能力的流動資產,才會真正變成企業的業務增長引擎所必需的燃油。數據可視化的意義
在過去,很多人或許對數據可視化并沒有很直接的觀感,因為跟其打交道的數據應用模式無非就是EXCEL或是固定的數據模型或工具。但是隨著大數據時代的到來,數據量和數據復雜性增加,模型的復雜性也隨之增加。此時對于企業來說,內部業務系統之間的數據流通和分析結果的可視化是非常關鍵的工作,同時也是一個跨越性的挑戰。數據的可視化可以將復雜的分析結果以豐富的圖表信息的方式呈現給讀者。然而只有分析人員對目標業務活動有深刻的了解,才能更好地進行可視化展現。正如耶魯大學統計學教授愛德華·塔夫特(EdwardTufte)所說:“圖形表現數據,實際上比傳統的統計分析法更加精確和有啟發性。”對于廣大新聞編輯、設計師、運營分析師、大數據研究者來說,他們都需要從不同維度、不同層面、不同粒度的數據統計處理中,以圖表或信息圖的方式為用戶(只獲得信息)、閱讀者(消費信息)及管理者(利用信息進行管理和決策)呈現不同于表格式的分析結果。數據可視化技術綜合運用計算機圖形學、圖像、人機交互等技術,將采集、清洗、轉換、處理過的符合標準和規范的數據映射為可識別的圖形、圖像、動畫甚至視頻,并允許用戶與可視化數據進行交互和分析。而任何形式的數據可視化都由豐富的內容、引人注意的視覺效果、精細的制作三要素組成,概括起來就是新穎而有趣、充實而高效、美感且悅目三個特征。不僅如此,很多基于數字化交易的企業,數據量每天都在急速增長,并且來源多而雜亂,因此找到準確、精細、相關的數據變得更加困難和重要。可視化能夠讓決策者精準地洞察數據反映的結果,如趨勢、占比等,而不需要去手動讀取那些困難的表格。舉一個例子,對于氣象行業來說,有效利用大數據可視化至關重要。天氣模型會利用大量數據進行分析呈現,消費者收到的最終預測通常是幾種模型分析的結果。企業也是一樣,當預測變得越來越復雜的時候,一種讓決策者能夠理解并快速采取行動的方式,或者說獲取數據分析結果并傳遞有效信息,是企業成功的必要條件。但是,很多決策者得到了這些結果,在沒有可視化的情況下,仍是需要分析人員解釋的。比如很多以數據分析服務為業務的乙方公司,有非常多個不同的數據源關聯各類具有不同數據屬性的復雜模型,那么如何以一種使其易于操作的方式向甲方解釋?這也是數據可視化存在的必要性,通過正確的圖形,甲方可以快速獲取并解讀不同維度的復雜數據結果。所以,無論是哪種職業和應用場景,數據可視化都有一個共同的目的,那就是準確而高效、精簡而全面地傳遞信息和知識。可視化能將不可見的數據現象轉化為可見的圖形符號,能將錯綜復雜、看起來沒法解釋和關聯的數據,建立起聯系和關聯,發現其規律和特征,獲得更有商業價值的洞見和價值,并且利用合適的圖表直截了當,且清晰而直觀地表達出來,實現數據自我解釋、讓數據說話的目的。而人類右腦記憶圖像的速度比左腦記憶抽象的文字快100萬倍。因此,數據可視化能夠加深和強化受眾對于數據的理解和記憶。我們可以從決策者角度來感受一下可視化的魅力。這里我們使用一種非常便捷的可視化的工具——DataFocus,它易于使用并且可提供多種角色的決策場景,可以使商務人士的數據決策獨立、靈活和多樣化。比如原來我們看到數據表格是這樣的,如表1-1:表1-1付款周期統計數據表圖1-2是將表格經過可視化之后獲得的結果:圖1-2付款周期可視化結果我們可以看到,可視化不僅可以做到讓數據結果美觀易讀,更能根據數據可視化需求從大量數據最難過提取決策者想要的數據維度,達到“想要即呈現”的目的,不必花額外時間從復雜的數據表中尋找、提取及分析解讀。小結
數據飛速增長是正在發生的事實。人們的生活逐漸步入數字化時代,高度信息化的社會使得人們每天必須消費大量信息。科學研究表明,人類的大腦對圖像信息的獲取速度遠高于數據處理速度,因此數據可視化將成為人類工作生活的基本技能——高效的可視化數據可以讓人充分利用碎片時間,更加快速、準確地獲取和處理信息。關注DataFocus,了解更多數據分析知識!