Python 是一種高級(jí)編程語(yǔ)言,常用于大數(shù)據(jù)分析和人工智能等領(lǐng)域。在文本分析中,經(jīng)常需要按詞頻對(duì)文本進(jìn)行排序,在 Python 中可以很方便地實(shí)現(xiàn)。
# -*- coding: utf-8 -*- from collections import Counter text = "Python 是一種高級(jí)編程語(yǔ)言,常用于大數(shù)據(jù)分析和人工智能等領(lǐng)域。在文本分析中,經(jīng)常需要按詞頻對(duì)文本進(jìn)行排序,在 Python 中可以很方便地實(shí)現(xiàn)。" words = text.split() word_counts = Counter(words) sorted_words = sorted(word_counts.items(), key=lambda x: x[1], reverse=True) for word, count in sorted_words: print(word, count)
以上程序會(huì)輸出每個(gè)單詞及其出現(xiàn)次數(shù),按照單詞出現(xiàn)次數(shù)從大到小排列。通過(guò) Python 的 Counter 模塊可以很方便地計(jì)算出字符串中每個(gè)單詞的出現(xiàn)次數(shù)。而 sorted 函數(shù)可以按照指定的字段進(jìn)行排序,這里通過(guò) lambda 函數(shù)指定按照出現(xiàn)次數(shù)進(jìn)行排序,同時(shí)指定降序排列。
這個(gè)小程序展示了 Python 的高效和易用性,使文本分析變得更加簡(jiǎn)潔和方便。