Python是一種功能強(qiáng)大的編程語言,它可以用于幾乎所有領(lǐng)域,包括數(shù)據(jù)科學(xué)。在數(shù)據(jù)科學(xué)中,統(tǒng)計分析是非常重要的一部分。而正態(tài)檢驗則是統(tǒng)計學(xué)中的一個基本概念。
import numpy as np from scipy import stats import matplotlib.pyplot as plt # 生成一個正態(tài)分布的數(shù)據(jù)集 data = np.random.normal(size=1000) # 查看數(shù)據(jù)的基本統(tǒng)計信息 print('Mean:', np.mean(data)) print('Std:', np.std(data)) # 畫出數(shù)據(jù)的概率密度圖 plt.hist(data, bins=50, density=True, color='blue') # 進(jìn)行正態(tài)檢驗 # 如果返回值的第二個值小于0.05,則代表數(shù)據(jù)不服從正態(tài)分布 result = stats.normaltest(data) print('p-value:', result[1]) # 顯示圖像 plt.show()
以上代碼使用了Python中的NumPy、SciPy和Matplotlib庫,先生成一個包含1000個數(shù)據(jù)的正態(tài)分布的數(shù)據(jù)集,然后使用Matplotlib庫畫出了數(shù)據(jù)的概率密度圖。接著利用SciPy庫中的stats.normaltest函數(shù)進(jìn)行正態(tài)檢驗,返回一個包含兩個值的元組,其中p值小于0.05時,則拒絕正態(tài)性假設(shè),即認(rèn)為數(shù)據(jù)不服從正態(tài)分布。
正態(tài)檢驗在統(tǒng)計分析中非常有用,它可以幫助我們確定數(shù)據(jù)是否符合正態(tài)分布,以便于后續(xù)的數(shù)據(jù)分析和建模。而Python作為一種非常流行的編程語言,具有豐富的統(tǒng)計分析和數(shù)據(jù)可視化庫,可以極大程度地簡化數(shù)據(jù)科學(xué)的工作流程。