自詡是這個(gè)領(lǐng)域“有一腳”的人,上帝派我來(lái)嚴(yán)謹(jǐn)?shù)幕卮痤I(lǐng)域問(wèn)題(順便插科打諢的)。
利益相關(guān),首先介紹一下,我們算是可視化領(lǐng)域和數(shù)據(jù)分析領(lǐng)域的一個(gè)分支,把企業(yè)數(shù)據(jù)揉一揉(收集整合)、泡一泡(加工分析)、舔一舔(展示檢驗(yàn)),以供展示有價(jià)值的信息,所以這樣的可視化更講究應(yīng)用和實(shí)用性(下文會(huì)講)。
將數(shù)據(jù)轉(zhuǎn)化成可視化圖表/形,其實(shí)一個(gè)工具就能完成,礙于工具太多,按照使用場(chǎng)景,暫且將已成熟應(yīng)用的分為三個(gè)層次(歡迎各路知友補(bǔ)充):
第一層:數(shù)據(jù)報(bào)告、信息圖這里統(tǒng)稱信息圖。信息圖是把數(shù)據(jù)、信息或知識(shí)可視化,必須要有一個(gè)清楚準(zhǔn)確的解釋或表達(dá)甚為復(fù)雜且大量的信息。
代表人物是新聞界的DavidMcCandless(大衛(wèi).麥克坎德雷斯),曾為《英國(guó)衛(wèi)報(bào)》、《連線》、《獨(dú)立報(bào)》等刊物撰稿。常以簡(jiǎn)潔精美的圖像展現(xiàn)復(fù)雜抽象資訊,并將不同的數(shù)據(jù)組合,展現(xiàn)其中的聯(lián)系。他在TED上曾講過(guò):
“可視化并不局限于數(shù)字,概念也同樣適用,比如政治傾向圖譜。我試圖將各種政治傾向融入到圖表中,并展示其如何從政府滲透到社會(huì)、文化中,對(duì)家庭和個(gè)人產(chǎn)生影響,繼而又反過(guò)來(lái)影響政治。
比如用圖形來(lái)表示數(shù)值
視線流動(dòng),構(gòu)建時(shí)空
而更多普遍實(shí)用的是類似
何明科在自己的文章分析中,使用一些信息圖表,展示結(jié)論。信息圖的制作:
利用PPT自帶的圖表,可以制作簡(jiǎn)潔直觀的數(shù)據(jù)圖表,但附上人文花鳥就需要美工設(shè)計(jì);
PS+AI+icon,前期規(guī)劃好表達(dá)思路、展示內(nèi)容、所需素材,之后便大刀闊斧動(dòng)工組件了。圖表的細(xì)節(jié),如柱狀圖的長(zhǎng)短依據(jù)數(shù)據(jù)大概等比例量一下。
這一類對(duì)數(shù)據(jù)的維度數(shù)量要求都不高,運(yùn)用的大多是結(jié)果數(shù)據(jù),側(cè)重點(diǎn)也在于展示。
第二層:實(shí)際數(shù)據(jù)應(yīng)用應(yīng)用類的可視化正如上面所說(shuō)的,將一堆幾百到即使幾百萬(wàn)不等的數(shù)據(jù)展示、分析。對(duì)于企業(yè),因?yàn)檫@些數(shù)據(jù)本身是自己生產(chǎn)經(jīng)營(yíng)過(guò)程中產(chǎn)生的,能反映歷史的狀況,總結(jié)發(fā)展之道,對(duì)目前的問(wèn)題或者未來(lái)下一步的決策起到輔助作用。
這樣的工具excel能解決,報(bào)表工具能解決,BI也能解決,具體細(xì)化到什么樣的場(chǎng)景不是這里的重點(diǎn),大家可以在下面評(píng)論交流。
通常的制作流程是:導(dǎo)入數(shù)據(jù)(excel)/連接數(shù)據(jù)庫(kù)(本地/服務(wù)器)——選擇圖表(組合)——設(shè)定分析維度——美化展示。比如像這種濃濃的帶有商業(yè)味道的可視化報(bào)表(有FineReport制作)
當(dāng)然,這樣功力的可視化報(bào)表需要一定的審美和熟練操作。圖中每一塊都是一個(gè)圖表控件,在表單(dashboard)中拖入一個(gè)圖表控件,選定數(shù)據(jù)字段,然后搭配組合,排布版型。
具體的操作要講上3天3夜,附上demo鏈接吧:數(shù)據(jù)決策系統(tǒng)(用戶名:demo;密碼:demo)
第三層:據(jù)挖掘、數(shù)據(jù)連接、關(guān)系傳遞這個(gè)可以理解為從海量數(shù)據(jù)中挖掘關(guān)系。
大致思路:原始數(shù)據(jù)經(jīng)過(guò)一連串收集、提取、清洗、整理等預(yù)處理過(guò)程,形成高質(zhì)量的數(shù)據(jù)。然后按照需要對(duì)數(shù)據(jù)貼標(biāo)簽分類或者預(yù)測(cè),如果要從大量復(fù)雜的數(shù)據(jù)中提取有價(jià)值且不易發(fā)現(xiàn)的信息還要數(shù)據(jù)建模。(細(xì)節(jié)可能各有不同)
比較適用的是一寫高級(jí)的數(shù)據(jù)分析挖掘工具以及開源圖表控件,如R,如D3。
用R做可視化,比較容易做出漂亮的可視化圖表,推薦書籍RGraphicsCookbook,書中有150多個(gè)recipes,足夠應(yīng)付大多類型的數(shù)據(jù)。
D3做圖可以定制,美觀圖圖表的豐富性秒殺大多圖表控件,但要求的水平有一丟丟高。
最后,再次引用DavidMcCandless的話“炫酷的可視化對(duì)于把思想傳遞給大眾又是至關(guān)重要的”,切勿一味追求美感,本末倒置。