Python是一種廣泛使用的編程語言,在數(shù)據(jù)挖掘、人工智能等領域有著廣泛的應用。在日常的工作中,我們可能需要同時讀取大量的文本數(shù)據(jù),這時候就可以使用Python中的批量讀取方法。
import os folder = 'path/to/folder' files = os.listdir(folder) for file in files: if file.endswith('.txt'): with open(os.path.join(folder, file), 'r') as f: data = f.read() # 對讀取到的文件內容進行處理
以上代碼中,我們首先通過os模塊中的listdir方法讀取指定文件夾下的所有文件名,并將其存儲在列表files中。在循環(huán)中,我們使用文件名的endswith方法篩選出所有以.txt結尾的文件,并打開它們。通過os模塊中的join方法可以方便地將文件夾路徑與文件名進行拼接。在打開文件后,我們可以使用read方法讀取文件的全部內容,并對其進行處理。
除了可以使用os模塊中的listdir方法批量讀取文件外,我們還可以使用glob模塊:
import glob folder = 'path/to/folder' files = glob.glob(folder + '/*.txt') for file in files: with open(file, 'r') as f: data = f.read() # 對讀取到的文件內容進行處理
通過glob.glob函數(shù),我們可以指定路徑及通配符,快速地獲取所有符合條件的文件。對于讀取大量數(shù)據(jù)來說,這種方法更加高效。