Python 是一種功能強(qiáng)大的編程語(yǔ)言,旨在幫助從事數(shù)據(jù)分析和繪圖的人員輕松完成數(shù)據(jù)分析任務(wù)。直方圖是一種數(shù)據(jù)可視化方法,它將定量數(shù)據(jù)分成若干個(gè)均等的區(qū)間,并繪制出每個(gè)區(qū)間所包含的數(shù)據(jù)數(shù)量(即頻數(shù))。Python 通過(guò) matplotlib 庫(kù)提供了繪制直方圖的功能。
# 導(dǎo)入必要的庫(kù) import numpy as np import matplotlib.pyplot as plt # 生成一組隨機(jī)數(shù)據(jù) data = np.random.randn(1000) # 繪制直方圖 plt.hist(data, bins=20) # 顯示圖形 plt.show()
上述代碼中,我們使用 numpy 庫(kù)生成了一組包含 1000 個(gè)隨機(jī)數(shù)的數(shù)據(jù)。然后,我們調(diào)用 matplotlib.pyplot 的 hist() 函數(shù)來(lái)繪制直方圖。該函數(shù)接受兩個(gè)參數(shù):數(shù)據(jù)和區(qū)間數(shù)(即直方圖的柱子個(gè)數(shù))。在這個(gè)例子中,我們將數(shù)據(jù)分成了 20 個(gè)區(qū)間,并繪制了每個(gè)區(qū)間的頻數(shù)。
除此之外,直方圖還可以用于繪制概率密度圖。概率密度是指某個(gè)隨機(jī)變量取到某個(gè)值的概率密度函數(shù)(PDF)在該點(diǎn)的值。通過(guò)對(duì)數(shù)據(jù)進(jìn)行核密度估計(jì)(KDE),我們可以得到數(shù)據(jù)的概率密度函數(shù),并將其繪制成一條平滑曲線。
# 導(dǎo)入必要的庫(kù) import seaborn as sns # 生成一組隨機(jī)數(shù)據(jù) data = np.random.randn(1000) # 繪制直方圖和概率密度圖 sns.histplot(data, kde=True) # 顯示圖形 plt.show()
在這個(gè)例子中,我們使用 seaborn 庫(kù)的 histplot() 函數(shù)來(lái)繪制直方圖和概率密度圖。該函數(shù)還可以通過(guò) kde 參數(shù)來(lái)控制是否繪制概率密度曲線。在這個(gè)例子中,我們繪制了一條概率密度曲線,用于顯示數(shù)據(jù)的分布情況。