Kylin mysql是一個開源的,分布式的大數(shù)據(jù)分析工具。Kylin mysql具有超快的多維度查詢速度,支持SQL查詢,可擴展性強,易于集成到現(xiàn)有的大數(shù)據(jù)系統(tǒng),同時Kylin mysql還具備海量數(shù)據(jù)的存儲能力和容錯性,可以對PB級別的數(shù)據(jù)進行計算分析。
Kylin mysql的基本特點是將OLAP分析與Hadoop生態(tài)系統(tǒng)結(jié)合在一起,利用HDFS存儲海量的數(shù)據(jù)集,并使用MapReduce對數(shù)據(jù)進行批處理,之后將查詢結(jié)果加載到多維動態(tài)數(shù)據(jù)集中。Kylin mysql的多維分析引擎是基于OLAP Cube的,使用Kylin mysql可以進行多維度分析,如產(chǎn)品銷售分析,全國銷售分析等。
Kylin mysql將大數(shù)據(jù)計算轉(zhuǎn)換為多維Cube計算,支持實時、交互式、多維查詢,這大大提高了查詢速度、性能和準(zhǔn)確性。Kylin mysql要求數(shù)據(jù)表進行預(yù)處理,包括數(shù)據(jù)抽樣、數(shù)據(jù)清洗等,之后使用Kylin mysql提供的Schema Builder對數(shù)據(jù)表進行建模和Cube的構(gòu)建,最后進行數(shù)據(jù)加載,Kylin mysql就可以對PB級別的數(shù)據(jù)進行多維度的查詢和分析了。
mysql>select COUNT(*) from TB;
+----------+
| COUNT(*) |
+----------+
| 203040 |
+----------+
總之,Kylin mysql是一款非常優(yōu)秀的大數(shù)據(jù)分析工具,由于Kylin mysql的性能、可擴展性和易用性,很多企業(yè)都將其應(yīng)用于大數(shù)據(jù)分析。KYlin mysql也源于全球的開源用戶和開發(fā)者,具有強大的社區(qū)支持,未來還可期。