在數據分析過程中,探索性數據分析(EDA)是很重要的環節之一。在EDA過程中,我們通常需要了解數據之間的關系及其分布。其中,聯合分布就是一種非常有用的探索工具。本文將介紹如何使用Python畫聯合分布。
# 導入相關庫 import seaborn as sns import matplotlib.pyplot as plt # 導入數據 tips = sns.load_dataset('tips') # 畫聯合分布圖 sns.jointplot(x='total_bill', y='tip', data=tips, kind='scatter') plt.show()
代碼解釋:
- sns.load_dataset('tips')導入tips數據集
- sns.jointplot()函數用于畫聯合分布圖,其中x為橫坐標,y為縱坐標,data為數據集,kind為圖表類型,此處為散點圖
- plt.show()用于顯示圖表
上述代碼所畫的聯合分布圖如下圖所示:
______________ | | | X X X X X X | | X X X X X X | | X X X X X X | | X X X X X X | | X X X X X X | | X X X X X X | |______________
其中,X表示散點。
除了散點圖外,聯合分布圖還有其他圖表類型,如hex、kde等。它們的使用方式與上述代碼類似,只需要將kind參數改為對應的值即可。
Python的seaborn庫提供了非常方便的畫圖函數,可以幫我們快速地進行探索性數據分析,包括聯合分布圖。希望本文能對大家的數據分析工作有所幫助。