在數據統計分析領域,Druid一直是一個備受推崇的處理工具,不僅因為它可以實時查詢PB級別的數據,而且還有著強大的查詢和聚合功能。今天我們將討論一下Druid如何通過JSON實現快速的數據統計。
{ "queryType": "groupBy", "dataSource": "my_datasource", "granularity": "DAY", "dimensions": ["continent", "country", "device_type"], "filters": [ { "dimension": "event_type", "value": "click", "type": "selector" } ], "aggregations": [ { "type": "count", "name": "clicks", "fieldName": "event_count" } ], "intervals": ["2019-01-01/2019-01-07"] }
上面的JSON代碼是一個Druid查詢的例子。它會返回從2019年1月1日到2019年1月7日,每天的不同區域、不同設備類型以及不同國家的點擊次數。讓我們逐一解釋一下。
queryType指定了查詢的類型,這里是groupBy,表示我們想根據一些維度對數據進行分組。
dataSource指定了查詢的數據源,這里是“my_datasource”。
granularity指定了查詢的時間粒度,這里是“DAY”,表示我們想按日對數據進行分組。
dimensions指定了我們想要分組的維度,這里有三個:大洲、國家和設備類型。
filters指定了我們想過濾出的數據,這里只關注“click”事件的數據。
aggregations指定了我們想聚合的數據,這里我們只關心點擊次數。
intervals指定了我們想查詢的時間范圍。
總之,使用Druid JSON查詢非常方便,只需要按照所需的維度和度量指標提供一個JSON,就能得到相應的數據。