Python 是一種通用的編程語言,被廣泛用于數(shù)據(jù)分析和科學(xué)計算。在數(shù)據(jù)分析領(lǐng)域中,Python 的一個重要工具是 pandas 庫,它提供了 DataFrame 數(shù)據(jù)結(jié)構(gòu),具有類似于 SQL 數(shù)據(jù)庫和 Excel 表格的功能。在本文中,我們將介紹 Python 數(shù)據(jù)框?qū)傩缘囊恍┏R娪梅ā?/p>
# 導(dǎo)入 pandas 庫 import pandas as pd # 創(chuàng)建數(shù)據(jù)框 df = pd.DataFrame({'Name': ['Tom', 'Jerry', 'Mary', 'John'], 'Age': [25, 30, 28, 27], 'Gender': ['Male', 'Male', 'Female', 'Male'], 'Salary': [50000, 60000, 55000, 65000]}) # 查看數(shù)據(jù)框的行數(shù)和列數(shù) print("Shape:", df.shape) # 查看數(shù)據(jù)框的列名 print("Columns:", df.columns) # 查看數(shù)據(jù)框的索引 print("Index:", df.index) # 查看數(shù)據(jù)框的數(shù)據(jù)類型 print("Data Types:\n", df.dtypes) # 查看數(shù)據(jù)框的前幾行 print("Head:\n", df.head()) # 查看數(shù)據(jù)框的后幾行 print("Tail:\n", df.tail()) # 查看數(shù)據(jù)框的統(tǒng)計信息 print("Statistics:\n", df.describe())
以上是一些常見的數(shù)據(jù)框?qū)傩缘挠梅āF渲校瑂hape 屬性返回數(shù)據(jù)框的行數(shù)和列數(shù);columns 屬性返回數(shù)據(jù)框的列名,index 屬性返回數(shù)據(jù)框的索引;dtypes 屬性返回數(shù)據(jù)框的數(shù)據(jù)類型;head 方法和 tail 方法分別返回數(shù)據(jù)框的前幾行和后幾行;describe 方法返回數(shù)據(jù)框的統(tǒng)計信息,如最大值、最小值、平均值等。
在數(shù)據(jù)分析中,數(shù)據(jù)框?qū)傩缘挠梅ǚ浅V匾K鼈兛梢詭椭覀兏玫乩斫夂头治鰯?shù)據(jù),進(jìn)而做出更準(zhǔn)確的決策。