基于新聞評論的短文本聚類?
首先回答短文本聚類用到哪些技術,中分分詞(好的分詞器會減少分詞碎片),過濾停用詞一些對于聚類影響不大的詞語比如的,了,代詞,助詞等,語義擴展如本文的word2vec,特征選擇,卡方,互信息,本文中用到的tfidf等,提問中說的內存,可以通過調整參數處理
基于新聞評論的短文本聚類?
首先回答短文本聚類用到哪些技術,中分分詞(好的分詞器會減少分詞碎片),過濾停用詞一些對于聚類影響不大的詞語比如的,了,代詞,助詞等,語義擴展如本文的word2vec,特征選擇,卡方,互信息,本文中用到的tfidf等,提問中說的內存,可以通過調整參數處理