在Python中,我們可以使用條件分組對(duì)數(shù)據(jù)進(jìn)行分類(lèi)和統(tǒng)計(jì)。條件分組是根據(jù)一定的條件進(jìn)行分組的一種數(shù)據(jù)分析方法,它可以將數(shù)據(jù)分成若干個(gè)互不重疊的組,并在此基礎(chǔ)上進(jìn)行分析和計(jì)算。在Python中,我們可以使用pandas庫(kù)中的groupby方法來(lái)實(shí)現(xiàn)條件分組。
import pandas as pd # 創(chuàng)建數(shù)據(jù) data = {'學(xué)科': ['語(yǔ)文', '數(shù)學(xué)', '英語(yǔ)', '數(shù)學(xué)', '語(yǔ)文', '英語(yǔ)', '英語(yǔ)'], '分?jǐn)?shù)': [90, 85, 95, 92, 88, 90, 93]} df = pd.DataFrame(data) # 按學(xué)科分組,并計(jì)算平均分 result = df.groupby('學(xué)科')['分?jǐn)?shù)'].mean() print(result)
在上面的代碼中,我們首先使用pandas庫(kù)創(chuàng)建了一組數(shù)據(jù),包含學(xué)科和分?jǐn)?shù)兩列。然后使用groupby方法,按照學(xué)科列進(jìn)行分組,并計(jì)算每個(gè)分組中的分?jǐn)?shù)平均值。最后,將結(jié)果輸出。
此外,我們還可以根據(jù)多個(gè)條件進(jìn)行分組。在groupby方法中可以傳入多個(gè)列名作為參數(shù),此時(shí)會(huì)按照這些列的組合進(jìn)行分組。
import pandas as pd # 創(chuàng)建數(shù)據(jù) data = {'學(xué)科': ['語(yǔ)文', '數(shù)學(xué)', '英語(yǔ)', '數(shù)學(xué)', '語(yǔ)文', '英語(yǔ)', '英語(yǔ)'], '班級(jí)': ['一班', '二班', '三班', '二班', '一班', '三班', '三班'], '分?jǐn)?shù)': [90, 85, 95, 92, 88, 90, 93]} df = pd.DataFrame(data) # 按學(xué)科和班級(jí)分組,并計(jì)算平均分 result = df.groupby(['學(xué)科', '班級(jí)'])['分?jǐn)?shù)'].mean() print(result)
在上面的代碼中,我們根據(jù)學(xué)科和班級(jí)兩個(gè)條件進(jìn)行分組,并計(jì)算每個(gè)組的分?jǐn)?shù)平均值。
通過(guò)條件分組,我們可以方便地對(duì)數(shù)據(jù)進(jìn)行分類(lèi)和統(tǒng)計(jì),便于我們進(jìn)行數(shù)據(jù)分析和決策。