Python詞云和詞頻是兩個充滿趣味性的應用。詞云可以讓用戶更直觀地看到文本重點內容,詞頻則能讓用戶通過數據分析更好地理解文本主旨。
import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt text = 'Python是一種廣泛使用的高級編程語言' cut_text = jieba.cut(text) result = ' '.join(cut_text) cloud = WordCloud(font_path='msyh.ttc', background_color='white', width=800, height=600).generate(result) plt.imshow(cloud) plt.axis('off') plt.show()
上述代碼演示了如何使用jieba分詞和WordCloud生成一個簡單的詞云。在這個例子中,我們將Python作為文本,使用jieba分詞將文本分割為單個詞語,并使用WordCloud將這些詞語展示為詞云圖。可以看到,Python作為詞云中的主詞,很快就能吸引眼球。
text = ['Python是一種廣泛使用的高級編程語言,它可以用于Web開發,數據分析,人工智能等領域。', 'Python的優勢是語法簡單易懂,可以省略大量的繁瑣代碼。', '在Python中,我們可以使用各種庫和框架,幫助我們完成復雜的任務,使我們的工作更輕松。', 'Python實用性強,應用范圍廣泛,是程序員學習和使用的一門必修課程。'] result = {} for t in text: cut_text = jieba.cut(t) for word in cut_text: if word not in result: result[word] = 1 else: result[word] += 1 result = sorted(result.items(), key=lambda x: x[1], reverse=True) for r in result: print(r)
以上代碼演示了如何使用jieba分詞和詞頻統計來分析一段文本。在這個例子中,我們將Python相關的幾句話作為文本,并使用jieba分詞庫統計每個單詞的出現次數。最后,我們對每個單詞出現的次數進行排序并輸出結果。通過詞頻統計,我們可以更好地理解Python對開發者的重要性。