Python是一種強大的編程語言,除了可以用來進行數據分析、機器學習等,還可以用來畫各種統計圖。本文主要介紹如何使用Python來畫出常用的統計圖。
# 導入numpy和matplotlib庫 import numpy as np import matplotlib.pyplot as plt # 生成一組隨機數據 np.random.seed(1) data = np.random.randn(1000) # 畫直方圖 plt.hist(data, bins=30) plt.title('Histogram') plt.xlabel('Value') plt.ylabel('Frequency') plt.show()
以上代碼生成了一個具有正態分布數據的直方圖,代碼解釋如下:
- 第1行導入了numpy和matplotlib庫。
- 第4行利用numpy生成了1000個具有標準正態分布的隨機數。
- 第7行調用matplotlib的hist()函數畫出直方圖,bins參數指定了直方圖的橫坐標區間個數。
- 第8行設置了直方圖的標題。
- 第9行設置了直方圖的x軸標簽。
- 第10行設置了直方圖的y軸標簽。
- 第11行調用matplotlib的show()函數將圖形顯示出來。
# 導入pandas和matplotlib庫 import pandas as pd import matplotlib.pyplot as plt # 生成一組隨機數據 data = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [2, 4, 6, 8, 10], 'C': [3, 6, 9, 12, 15]}) # 畫折線圖 plt.plot(data['A'], data['B'], label='B') plt.plot(data['A'], data['C'], label='C') plt.title('Line Chart') plt.xlabel('A') plt.ylabel('Value') plt.legend() plt.show()
以上代碼生成了一個包含兩條折線的折線圖,代碼解釋如下:
- 第1行導入了pandas和matplotlib庫。
- 第4行利用pandas生成了一組包含3列數數據幀。
- 第7和8行用plt.plot()函數分別畫出了data的A列與B列的折線和A列與C列的折線,并且用label參數分別為兩條折線設置了標簽。
- 第9行設置了折線圖的標題。
- 第10行設置了折線圖的x軸標簽。
- 第11行設置了折線圖的y軸標簽。
- 第12行調用matplotlib的legend()函數讓標簽顯示出來。
- 第13行調用matplotlib的show()函數將圖形顯示出來。
以上代碼只是兩個簡單的例子,實際上Python還可以畫出其他類型的統計圖,例如散點圖、餅圖、箱線圖等等。掌握Python畫統計圖可以幫助我們更好地了解數據的分布和規律,也可以讓我們的數據分析工作更加高效快捷。