索引規(guī)范?
必須手動(dòng)指定分片數(shù)。
分片數(shù)會(huì)影響查詢效率。
分兩種情況:
數(shù)據(jù)量大而分片數(shù)較少。將影響單分片的查詢效率。導(dǎo)致最終查詢時(shí)間慢。
數(shù)據(jù)量不大但分片數(shù)過多。分片數(shù)過多影響聚合效率,也會(huì)導(dǎo)致最終查詢慢。
不建議使用es的默認(rèn)分片數(shù)(根據(jù)es版本的不同,默認(rèn)分片數(shù)為5或者1),不適合實(shí)際使用情況。
一般根據(jù)數(shù)據(jù)量或者數(shù)據(jù)存儲大小來判斷。大概5到10G,1000w到3000w條數(shù)據(jù)一個(gè)分片。
將無需分詞查詢的字段類型設(shè)為keyword。
es中字符串有兩種類型,text 和 keyword。如果該字段不需要分詞查詢(如feed_id),類型設(shè)為keyword即可。
keyword類型的字段不會(huì)被分詞,節(jié)約es內(nèi)存空間。
需要中文分詞的字段,必須指定分詞器。一般為"ik_smart"。
如果不指定分詞器,es將會(huì)使用默認(rèn)分詞器。默認(rèn)分詞器不支持中文,會(huì)把中文分為一個(gè)個(gè)漢字的形式。浪費(fèi)空間且不符合實(shí)際使用情況。