Python 作為一門強大的編程語言,很適合用于處理和分析大量數據。而在數據處理過程中,打開數據集是一個必要的步驟。
import pandas as pd # 打開CSV格式數據集 data = pd.read_csv('mydataset.csv') # 打開Excel格式數據集 data = pd.read_excel('mydataset.xlsx') # 打開JSON格式數據集 data = pd.read_json('mydataset.json') # 打開SQL數據庫數據集 import sqlite3 conn = sqlite3.connect('mydataset.db') data = pd.read_sql('SELECT * FROM mytable', conn)
在代碼中,我們通過調用 pandas 庫的 read_csv、read_excel、read_json 和 read_sql 函數依次打開了 CSV、Excel、JSON 和 SQL 數據庫格式的數據集。其中,read_csv、read_excel 和 read_json 函數都只需傳入一個表示數據集路徑的字符串作為參數,而 read_sql 函數則還需要傳入連接數據庫所需的一些參數。
無論是什么格式的數據集,一旦成功打開后,我們都可以像處理 Python 中的普通數據結構一樣來處理它們。這樣,我們就可以方便地進行數據分析和處理。