其實(shí),大數(shù)據(jù)分析這個(gè)部分是很大的模塊,包括從底層數(shù)據(jù)倉庫搭建到最后的數(shù)據(jù)展示,非常復(fù)雜。
你說的是業(yè)務(wù)、IT都能用的數(shù)據(jù)處理和展現(xiàn)部分吧,今天就推薦一個(gè)。
前言"數(shù)據(jù)可視化工具,可愛者甚番。分析師獨(dú)愛R,自Python以來,世人盛愛matplotlib。余獨(dú)愛FineBI之出分析而不拖沓,做可視化還算酷炫......."。哈哈,秀個(gè)拙劣~
本文向大家介紹最近更新的一個(gè)數(shù)據(jù)分析可視化神器——FineBI。和Tableau、PowerBI都是同屬一類工具,自助式BI。
之前我在一些回答里面也有過推薦,不過我更愛他的兄弟FineReport,以至于換了兩家公司都連續(xù)推薦采購。但最近新出的5.0版本著實(shí)讓我驚艷了一把,給人的感覺,比PowerBI更成熟穩(wěn)定功能更多,平價(jià)版的Tableau替代!
接下來講重點(diǎn)講解它的主要功能、特點(diǎn)和同類具的對比、以及基本使用方法。
后面還會(huì)再針對這個(gè)工具寫一篇詳細(xì)深入的上手教程。
閱讀目錄前言FineBI的主要功能FineBI的主要特點(diǎn)FineBI Vs 其他同類產(chǎn)品FineBI的分析思想獲取方法&學(xué)習(xí)資料小結(jié)FineBI的主要功能先來說說BI,BI全稱商業(yè)智能(Business Intelligence),是一套完整的數(shù)據(jù)解決方案,將企業(yè)的數(shù)據(jù)有效整合,快速制作可視化報(bào)表,以供業(yè)務(wù)決策。它一般涉及數(shù)據(jù)倉庫(現(xiàn)也和很多大數(shù)據(jù)方案對接)、ETL、OLAP分析,權(quán)限控制等模塊。
顧名思義,F(xiàn)ineBI是一款BI商業(yè)智能工具,能簡單快速的生成各種酷炫的可視化數(shù)據(jù)報(bào)表,做有目的性的數(shù)據(jù)分析。
所以,它主要完成下面幾個(gè)工作:
1. 數(shù)據(jù)的整合
2. 數(shù)據(jù)的分析和可視化
3. 報(bào)表制作與發(fā)布
FineBI的主要特點(diǎn)BI工具那么多,為何我要重點(diǎn)推薦這款BI工具呢?
Tableau和PowerBI的好自不用我多說,知乎上大家都議論了很多。
但這款BI做為國產(chǎn),不由得讓我產(chǎn)生好奇和好感,值得關(guān)注和鼓勵(lì)。更何況它能夠足以應(yīng)對基本的數(shù)據(jù)分析,不虛于那兩者,且具備下面幾大特點(diǎn):
1、打通各類數(shù)據(jù)源
FineBI能夠從各種數(shù)據(jù)源中抓取數(shù)據(jù)進(jìn)行分析,除了支持大家常用的Oracle、SQLServer、MySQL等數(shù)據(jù)庫,還支持SAP BW、HANA、Essbase等多維數(shù)據(jù)庫。
大數(shù)據(jù)前端分析,F(xiàn)ineBI可對接Hadoop、Kylin、Derby、Gbase、ADS、Hbase、Mongodb等大數(shù)據(jù)平臺。在對接方面有自己的分布式連接方案。
下圖是FineBI的數(shù)據(jù)連接窗口:
還支持導(dǎo)入Excel數(shù)據(jù),支持從R語言腳本導(dǎo)入數(shù)據(jù)。所以基本能對接各類數(shù)據(jù)源,打通并整合。
2. 易用性(無需編程)
筆者給自己的定位是一枚數(shù)據(jù)科學(xué)家,因此不會(huì)也不能將過多精力放在可視化工作上。畢竟數(shù)據(jù)庫/數(shù)據(jù)倉庫系統(tǒng)架構(gòu),數(shù)據(jù)挖掘算法研究等工作更是重中之重。而FineBI采用的拖拽數(shù)據(jù)字段,自動(dòng)出圖的操作方式,將我從可視化的泥潭中解放出來,把更多精力投放到數(shù)據(jù)管理,算法研究和業(yè)務(wù)溝通上。下圖展示了FineBI清爽商務(wù)的工作界面。
易用性還體現(xiàn)在數(shù)據(jù)處理方面。
要知道一份數(shù)據(jù)拿到在分析是還是要做很多公式計(jì)算、過濾篩選處理的。驚喜的是這個(gè)工具內(nèi)置了各種計(jì)算公式、過濾組件。
比如時(shí)間過濾,大家覺得還要手寫公式么。
各種現(xiàn)成的計(jì)算公式,基本告別SQL和代碼。
這里展示的僅僅是一小個(gè)方面,絕大多數(shù)商業(yè)公司出品的軟件在易用性方面完爆開源產(chǎn)品。
3、可視化顏值高
一些圖表(出自官方)
下面這些圖是筆者20分鐘不到就做好的,稍加美化,估計(jì)也能達(dá)到大部分客戶在顏值上的要求了:
要知道同樣的工作使用R語言的ggplot2至少要2小時(shí)(含調(diào)試),使用Python的matplotlib就更久了。
4、數(shù)據(jù)權(quán)限管控
FineBI的數(shù)據(jù)權(quán)限管控,可以說是很專業(yè)了,這也是開源和商業(yè)不能比的。
筆者是FineReport的深度用戶,F(xiàn)ineReport是報(bào)表應(yīng)用工具,應(yīng)用面更廣,數(shù)據(jù)安全性要求也更高,F(xiàn)ineBI差不多是沿用了其兄弟產(chǎn)品的一套權(quán)限管理方案。可以對不同部門/崗位/角色的人員,進(jìn)行數(shù)據(jù)源/業(yè)務(wù)包/數(shù)據(jù)表/分析報(bào)表的權(quán)限管控。簡單來講,你可以讓不同人看到僅有自己權(quán)限下的報(bào)表和數(shù)據(jù)。
嗯,暫時(shí)就說這幾點(diǎn),再說有打廣告嫌疑了......
FineBI Vs 其他同類產(chǎn)品1. FineBI VS Excel
兩者是不太一樣的產(chǎn)品,Excel更全面更加注重?cái)?shù)據(jù)處理,而FineBI比較精簡更注重報(bào)表及可視化,F(xiàn)ineBI更像是數(shù)據(jù)透視表+少量VBA。不過兩者結(jié)合用相得益彰。
2. FineBI VS R語言ggplot2
ggplot2其實(shí)是R語言的可視化包,因此對于熟悉R語言的人來說,使用ggplot2會(huì)非常得心應(yīng)手。同時(shí)由于ggplot2是由編程語言R驅(qū)動(dòng),因此它在定制化方面肯定做得比FineBI要好。但是要寫一定量代碼,這個(gè)不是每個(gè)人都擅長,畢竟如果是簡單的分析,大可不必入R的門。
3. FineBI VS Echarts等開源圖表
Echarts一般是給前端程序員用的,需要編程語言JS驅(qū)動(dòng),不推薦沒有編程基礎(chǔ)的分析師使用,雖然Echarts可視化更豐富。
4. FineBI VS 其他商用BI工具(如Tableau、PowerBI等)
功能方面都沒有太大差異,就是你多一個(gè),我少一個(gè)的區(qū)別。對大部分人來說日常的數(shù)據(jù)分析足夠了。
使用感都有所不同,F(xiàn)ineBI有個(gè)建立業(yè)務(wù)包環(huán)節(jié),對數(shù)據(jù)做業(yè)務(wù)/場景區(qū)分。PowerBI屬于組件拖拽式風(fēng);Tableau在分析時(shí)和FineBI差不多,探索式分析,調(diào)整可視化樣式。
實(shí)際企業(yè)級商用有差異,因?yàn)橐紤]得更多。企業(yè)級應(yīng)用出產(chǎn)品使用上還要更多關(guān)注平臺對接,架構(gòu)方案,數(shù)據(jù)抽取方式還有性能,包括之前提的權(quán)限管控等,F(xiàn)ineBI和Tableau更有商用基因,具體要看自己的實(shí)際需求和使用環(huán)境。
綜上所述,以上的工具都沒有單純的優(yōu)劣之分,具體問題具體分析,什么需求用什么工具。不過,如果你想快速地做美觀的可視化報(bào)表,那FineBI值得一學(xué)。
FineBI的數(shù)據(jù)分析思想用FineBI做數(shù)據(jù)分析,總體的思路是這樣的,和Tableau有點(diǎn)像:
1.先連接數(shù)據(jù)庫,導(dǎo)入數(shù)據(jù)源。支持的數(shù)據(jù)源類型前文已說過。
2.然后初步處理數(shù)據(jù),選擇要分析的字段,分組匯總、新增列、合并表、行列轉(zhuǎn)換等等。
3.接著進(jìn)行數(shù)據(jù)分析。如果沒目的,可以先根據(jù)自己的假設(shè)拖拽數(shù)據(jù)字段,看看數(shù)據(jù)是什么趨勢是否有規(guī)律,漸漸摸清楚思路,所謂探索性分析。如果有目的,直接可視化就行。
4.最后形成可視化分析報(bào)告,導(dǎo)出或分享。
這里,我后面會(huì)出個(gè)一個(gè)詳細(xì)的案例,可能會(huì)更能理解。
小結(jié)有些人可能會(huì)對商業(yè)軟件帶有一種排斥觀念,個(gè)人覺得這是比較幼稚的。商業(yè)軟件固然需要花錢,但劣質(zhì)的開源軟件更可能浪費(fèi)大家的寶貴時(shí)間。顯然我們應(yīng)該將精力更多的投放到數(shù)據(jù)和算法本身以及具體業(yè)務(wù)上,工具只不過是工具罷了。
這個(gè)觀點(diǎn)比較主觀,不過請不要糾結(jié),因?yàn)镕ineBI是免費(fèi)的,企業(yè)級部署會(huì)有2個(gè)并發(fā)限制,需要購買lic。