大數據應用服務的兩條主線?
兩條主線包括:
一是大數據技術體系。主要是數據采集和數據搜索,構建數據搜索體系。
二是大數據應用。即經歷了從Google、Yahoo在搜索引擎時代,數據倉儲、 大數據分析時代,大數據挖掘時代,再到AI技術與大數據結合時代。
其中,Google通過HDFS對海量數據的存儲,運用Map Reduce技術中高效的計算網頁內容,提高用戶的檢索能力,維系了搜索引擎之巔的地位。由于數據采集離不開存儲,索引的構建也需要大量計算,因此存儲容器和計算能力貫穿搜索引擎的整個更迭過程。
大數據應用服務的兩條主線?
兩條主線包括:
一是大數據技術體系。主要是數據采集和數據搜索,構建數據搜索體系。
二是大數據應用。即經歷了從Google、Yahoo在搜索引擎時代,數據倉儲、 大數據分析時代,大數據挖掘時代,再到AI技術與大數據結合時代。
其中,Google通過HDFS對海量數據的存儲,運用Map Reduce技術中高效的計算網頁內容,提高用戶的檢索能力,維系了搜索引擎之巔的地位。由于數據采集離不開存儲,索引的構建也需要大量計算,因此存儲容器和計算能力貫穿搜索引擎的整個更迭過程。