Python中常用的數據處理工具之一是pandas庫。在pandas中,最基本的數據結構是數據框(DataFrame)。數據框由多行和多列的數據組成,類似于Excel中的一個表格。
對于數據框的操作,我們通常需要對其進行修改以滿足我們需要的分析要求。下面介紹幾種數據框修改的基本方法。
#創建一個數據框 import pandas as pd df = pd.DataFrame({ 'Name':['Alex','Bob','Cat','Dog','Emma'], 'Age':[20,28,35,45,52], 'Gender':['M','M','F','M','F'], 'Salary':[5000,8000,10000,15000,20000] }) #查看數據框原始數據 print(df)
1. 添加新列
#添加新列 df['Position'] = ['Manager','Staff','Manager','Manager','CEO'] #查看添加新列后的數據框 print(df)
2. 刪除列
#刪除列 df = df.drop(columns=['Salary']) #查看刪除列后的數據框 print(df)
3. 修改列
#修改列 df.loc[2, 'Age'] = 36 #查看修改列后的數據框 print(df)
4. 添加新行
#添加新行 newdata = pd.DataFrame({ 'Name':'Frank', 'Age':25, 'Gender':'M', 'Position':'Staff' }, index=[5]) df = pd.concat([df,newdata]) #查看添加新行后的數據框 print(df)
5. 刪除行
#刪除行 df = df.drop(index=[1,3]) #查看刪除行后的數據框 print(df)
通過以上幾種方法,我們可以在Python中靈活地修改數據框以滿足我們的分析需求。