Python 是一種高級(jí)編程語言,適用于多種計(jì)算任務(wù),比如數(shù)據(jù)分析、人工智能和網(wǎng)絡(luò)編程等。這篇文章將介紹一些有用的 Python 文本處理函數(shù)。
# 讀取文件 with open('file.txt', 'r') as f: text = f.read() # 清洗文本 text = text.replace('\n',' ') # 去除換行符 text = text.lower() # 小寫化所有字符 # 分割單詞 words = text.split(' ') # 用空格分割 # 統(tǒng)計(jì)單詞頻率 freq_dict = {} for word in words: if word in freq_dict: freq_dict[word] += 1 else: freq_dict[word] = 1 # 排序輸出 sorted_dict = sorted(freq_dict.items(), key=lambda x: x[1], reverse=True) for i in range(10): print(sorted_dict[i])
以上代碼展示了如何讀取一個(gè)文本文件,并對(duì)其中的單詞進(jìn)行清洗、分割、統(tǒng)計(jì)和排序。通過這些函數(shù),我們可以快速分析文本數(shù)據(jù)。
Python 還有許多其他文本處理函數(shù),如正則表達(dá)式、自然語言處理工具等,可以根據(jù)實(shí)際應(yīng)用需求靈活使用。
上一篇vue css過大
下一篇es存多字段還是json