Python 是一門有著豐富科學計算庫的絕佳語言,可以精確計算各種數據。在數據分析里,很常見的一種方法是使用統計分析的方法,輔助數據分析的決策,求概率分布就是其中的一種方法。
# 導入需要的庫 import numpy as np import scipy.stats as stats # 生成樣本數據 data = np.random.normal(size=1000) # 求出概率分布 density = stats.kde.gaussian_kde(data) # 繪制概率密度圖 import matplotlib.pyplot as plt plt.hist(data, bins=30, density=True, alpha=0.6, color='g') xmin, xmax = plt.xlim() x = np.linspace(xmin, xmax, 100) plt.plot(x, density(x), color='r') plt.show()
這里我們使用了 Numpy 庫生成了 1000 個標準正態分布的樣本數據;使用 Scipy 庫中的 stats.kde.gaussian_kde 對樣本數據生成概率分布的密度函數;最后使用 Matplotlib 庫繪制概率分布圖,其中參數 density 設置為 True 則表示繪制的是概率密度函數,不是頻率分布圖。綠色柱狀圖是每個區間內數據出現的頻數,紅色曲線是概率分布函數。
Python 語言有著這樣的方便、簡單、易用、高效的特點,再加上可視化手段更進一步,讓我們能夠輕松地處理和分析數據,從中找到有用的信息,獲得數據驅動的解決方案。
上一篇python 類深拷貝
下一篇python 類屬性函數