大數(shù)據(jù)挖掘中的流數(shù)據(jù)什么意思?
流數(shù)據(jù)是指由數(shù)千個數(shù)據(jù)源持續(xù)生成的數(shù)據(jù),通常也同時以數(shù)據(jù)記錄的形式發(fā)送,規(guī)模較小(約幾千字節(jié))。流數(shù)據(jù)包括多種數(shù)據(jù),例如客戶使用您的移動或 Web 應用程序生成的日志文件、網(wǎng)購數(shù)據(jù)、游戲內(nèi)玩家活動、社交網(wǎng)站信息、金融交易大廳或地理空間服務,以及來自數(shù)據(jù)中心內(nèi)所連接設備或儀器的遙測數(shù)據(jù)。此類數(shù)據(jù)需要按記錄或根據(jù)滑動時間窗口按順序進行遞增式處理,可用于多種分析,包括關聯(lián)、聚合、篩選和取樣。借助此類分析得出的信息,公司得以深入了解其業(yè)務和客戶活動的方方面面,例如服務使用情況(用于計量/計費)、服務器活動、網(wǎng)站點擊量以及設備、人員和實物的地理位置,從而迅速對新情況做出響應。