生成詞云圖。
的wordcloud庫(kù)。使用pip安裝該庫(kù)的命令如下
```stall wordcloud
.txt”。
函數(shù)來(lái)讀取文本文件。代碼如下
```coding="utf-8") as f
text = f.read()
將讀取到的文本數(shù)據(jù)存儲(chǔ)在變量text中。
在讀取數(shù)據(jù)之后,我們需要對(duì)數(shù)據(jù)進(jìn)行清洗。清洗的目的是去掉一些無(wú)用的詞語(yǔ),比如“的”、“了”等等。這些詞語(yǔ)不僅會(huì)影響詞云圖的美觀度,還會(huì)影響詞云圖的準(zhǔn)確性。
提供了jieba庫(kù)來(lái)進(jìn)行中文分詞。中文分詞的目的是將一段中文文本分成一個(gè)個(gè)有意義的詞語(yǔ)。代碼如下
```port jieba
對(duì)文本進(jìn)行分詞
words = jieba.cut(text)
將分詞結(jié)果轉(zhuǎn)換成列表
words_list = list(words)
分詞后,我們需要進(jìn)行數(shù)據(jù)清洗。代碼如下
定義停用詞列表
stopwords = ["的", "了", "是", "在", "和", "有", "為", "就", "這", "到", "與", "也", "我們", "但", "要", "還", "個(gè)", "人", "來(lái)", "他", "們", "中", "上", "下", "之", "年", "月", "日", "時(shí)", "分", "秒", "及", "等", "與", "或", "不", "一", "二", "三", "四", "五", "六", "七", "八", "九", "十", "這個(gè)", "那個(gè)", "這些", "那些", "一些", "一種", "一樣", "這樣", "那樣", "如何"]
刪除停用詞ot stopwords]
生成詞云圖
在進(jìn)行數(shù)據(jù)清洗之后,我們可以開(kāi)始生成詞云圖了。代碼如下
```port WordCloudportatplotlib.pyplot as plt
將列表轉(zhuǎn)換成字符串(words_list)
生成詞云圖theidax_words=200, width=1000, height=600)erate(text)
顯示詞云圖showterpolationear")
plt.axis("off")
plt.show()
2. 數(shù)據(jù)準(zhǔn)備
3. 讀取數(shù)據(jù)
4. 數(shù)據(jù)清洗
5. 生成詞云圖
的詞云庫(kù),我們可以方便地生成詞云圖。在生成詞云圖之前,我們需要進(jìn)行數(shù)據(jù)清洗,以保證詞云圖的準(zhǔn)確性和美觀度。