nlpir使用教程?
nlpir主要功能包括中文分詞;英文分詞;詞性標(biāo)注;命名實(shí)體識(shí)別;新詞識(shí)別;關(guān)鍵詞提取;支持用戶(hù)專(zhuān)業(yè)詞典與微博分析。
nlpir系統(tǒng)支持多種編碼、多種操作系統(tǒng)、多種開(kāi)發(fā)語(yǔ)言與平臺(tái)。
nlpir功能:
1.中英文混合分詞功能
自動(dòng)對(duì)中文英文信息進(jìn)行分詞與詞性標(biāo)注功能,涵蓋了中文分詞、英文分詞、詞性標(biāo)注、未登錄詞識(shí)別與用戶(hù)詞典等功能。
2.關(guān)鍵詞提取功能
采用交叉信息熵的算法自動(dòng)計(jì)算關(guān)鍵詞,包括新詞與已知詞,下面是對(duì)十八屆三中全會(huì)報(bào)告部分內(nèi)容的關(guān)鍵詞提取結(jié)果。
3.新詞識(shí)別與自適應(yīng)分詞功能
從較長(zhǎng)的文本內(nèi)容中,基于信息交叉熵自動(dòng)發(fā)現(xiàn)新特征語(yǔ)言,并自適應(yīng)測(cè)試語(yǔ)料的語(yǔ)言概率分布模型,實(shí)現(xiàn)自適應(yīng)分詞。
4.用戶(hù)專(zhuān)業(yè)詞典功能
可以單條導(dǎo)入用戶(hù)詞典,也可以批量導(dǎo)入用戶(hù)詞典。