詞云是一種基于文本數(shù)據(jù)生成詞匯相關(guān)度展示的可視化方法。Python語言中有豐富的詞云庫,其中最流行的是wordcloud庫。使用wordcloud可以輕松地生成各種美觀而有意義的詞云。
# 導(dǎo)入所需的庫與數(shù)據(jù) import jieba from wordcloud import WordCloud text = "數(shù)學(xué)是一門基礎(chǔ)學(xué)科,研究數(shù)的大小、形態(tài)及其變化規(guī)律以及數(shù)量關(guān)系等一系列問題" words = jieba.cut(text) word_list = [] for word in words: word_list.append(word) text = " ".join(word_list) # 生成詞云 wc = WordCloud( background_color="white", max_words=2000, width=1000, height=600, font_path="msyh.ttc", stopwords={"的", "以及", "還是", "一門"} ).generate(text) # 顯示詞云 wc.to_image()
上述代碼中,我們通過jieba將文本進(jìn)行分詞,并將分詞后的結(jié)果存入一個(gè)列表中。接著,我們使用空格將列表中的每一個(gè)元素(即每一個(gè)詞)拼接起來。最后,我們調(diào)用WordCloud生成詞云,并通過設(shè)置background_color、max_words、width、height、stopwords等參數(shù)優(yōu)化詞云的效果。使用to_image()函數(shù)可以將生成的詞云展示出來。
Python詞云還有許多其他優(yōu)秀的庫,例如pyecharts、matplotlib等。這些庫可以幫助我們更好地展示文本數(shù)據(jù),讓人們更加直觀地理解文本的主旨、關(guān)鍵字和相關(guān)性。詞云不僅可以用于文本分析,還可以被廣泛運(yùn)用于行業(yè)調(diào)研、社交媒體挖掘、歷史事件分析等領(lǐng)域。
上一篇python 詞云 安裝
下一篇python 詞云亂碼