目前主數(shù)據(jù)、大數(shù)據(jù)、數(shù)據(jù)倉庫、Hadoop等概念都是市場上炒的很火的概念,但是很多人僅僅了解這些概念是互相有關(guān)聯(lián)的,卻不能很好的區(qū)分這些名詞之間的區(qū)別,今天在這里我主要介紹一下主數(shù)據(jù)與數(shù)據(jù)倉庫。
在我看來主數(shù)據(jù)是指具有高業(yè)務(wù)價值的、可以在企業(yè)內(nèi)跨越各個業(yè)務(wù)部門且能被重復(fù)使用的數(shù)據(jù),是單一、準(zhǔn)確、權(quán)威的數(shù)據(jù)。而數(shù)據(jù)倉庫是一個很大的數(shù)據(jù)存儲集合,出于企業(yè)的分析性報告和決策支持目的而創(chuàng)建,對多樣的業(yè)務(wù)數(shù)據(jù)進(jìn)行篩選與整合。主數(shù)據(jù)可以看成是一類數(shù)據(jù)或多類數(shù)據(jù),而數(shù)據(jù)倉庫則是多類數(shù)據(jù)的合集??梢钥闯鲋鲾?shù)據(jù)其實(shí)是數(shù)據(jù)倉庫的一部分。
我們搭建數(shù)倉,基于一定的規(guī)則進(jìn)行數(shù)據(jù)抽取,將數(shù)據(jù)沉淀,保障數(shù)據(jù)是可追溯的?;诓煌乃惴ㄒ?guī)則對數(shù)倉中的數(shù)據(jù)進(jìn)行計算、匯聚來實(shí)現(xiàn)預(yù)測分析。而主數(shù)據(jù)管理使得企業(yè)能夠集中化管理數(shù)據(jù),在分散的系統(tǒng)間保證主數(shù)據(jù)的一致性、準(zhǔn)確性和權(quán)威性。主數(shù)據(jù)為數(shù)據(jù)倉庫提供的基礎(chǔ)數(shù)據(jù)(數(shù)倉模型的維表數(shù)據(jù))就更具有權(quán)威性,那么在做數(shù)據(jù)分析時也能更準(zhǔn)確、更趨向于實(shí)際情況,更好的幫助企業(yè)高層進(jìn)行決策分析。