正太檢驗,又稱正態性檢驗,是一種用于檢查數據集是否符合正態分布的統計方法。在Python中,可以使用 scipy.stats 模塊來進行正態檢驗。
from scipy import stats
import numpy as np
#生成隨機數
data = np.random.normal(0, 1, 1000)
#進行正態檢驗
stat, p = stats.normaltest(data)
#輸出檢驗結果
print("統計量:", stat)
print("p值:", p)
if p >0.05:
print("數據集符合正態分布")
else:
print("數據集不符合正態分布")
在這段代碼中,我們首先使用 numpy 生成了一個包含1000個隨機數的數據集,然后使用 stats.normaltest 函數對這個數據集進行正態檢驗。這個函數會返回兩個值:統計量和 p 值。
p 值是一個在0到1之間的數,用于評估數據集是否服從正態分布的程度。通常,p值小于0.05被認為是不顯著,數據集就不能被認為是符合正態分布。如果p值大于0.05,則認為數據集服從正態分布。
使用 Python 進行正態檢驗非常簡單,而且非常有用。在許多數據分析任務中,我們需要知道數據集是否符合正態分布,以選擇合適的統計方法。通過使用 Python 進行正態檢驗,我們可以快速、準確地對數據集進行評估,從而更好地完成數據分析任務。