Python是廣受歡迎的編程語言,它有著簡單易學、靈活多樣的特點,可應用于各種領域。在數據處理方面,Python的數據分析庫pandas是非常強大的,它可以輕松地對數據進行統計、篩選、清洗等操作。
下面,我們就來看一個涉及Python數據分析的真題:如何用Python統計一組人的年齡分布。
import pandas as pd
# 假設這是一個人的年齡數據
ages = [22, 33, 18, 25, 29, 21, 25, 26, 30, 30, 32, 35, 20, 18, 28, 25]
# 將年齡數據裝進DataFrame中
age_df = pd.DataFrame(ages, columns=['age'])
# 統計各個年齡段的人數
bin_edges = [0, 20, 25, 30, 40] # 年齡段的邊界值
labels = ['0-20', '20-25', '25-30', '30-40'] # 年齡段的標簽
age_df['age_group'] = pd.cut(age_df['age'], bins=bin_edges, labels=labels)
count_df = age_df.groupby('age_group').size().reset_index(name='count')
# 輸出統計結果
print(count_df)
# age_group count
# 0-20 2
# 20-25 5
# 25-30 5
# 30-40 4
以上代碼首先將一組年齡數據裝進DataFrame中,然后使用pandas的cut函數將年齡數據分組。該函數接受一個邊界值列表和一個標簽列表作為參數,將數據根據邊界值劃分成不同的組,并賦予對應的標簽。然后使用groupby函數對年齡組進行分組并統計人數,最后輸出統計結果。
通過以上代碼,我們可以很方便地得到一組年齡數據的分布情況,從而更好地了解數據的特征。
上一篇java運行和可運行狀態
下一篇java設計點和線