Python 的桑基圖是一種非常有效的數據可視化工具,它可以展現不同流量之間的關系,最常見的應用場景是展示不同產品或服務銷售數量之間的關系。下面我們來看一個簡單的示例:
import pandas as pd import matplotlib.pyplot as plt import squarify # 計算數據 data = pd.DataFrame({ '銷售量': [30, 25, 25, 20], '產品': ['A', 'B', 'C', 'D'], '顏色': ['紅', '黃', '藍', '綠'] }) size = data['銷售量'] label = data.apply(lambda x: str(x[0]) + ' ' + x[1] + ' (' + x[2] + ')', axis=1) colors = ['#FFCDD2', '#D1C4E9', '#B2EBF2', '#C8E6C9'] # 繪制?;鶊D squarify.plot(sizes=size, label=label, color=colors, alpha=.7) plt.axis('off') plt.show()
這段代碼首先引入了 pandas 和 matplotlib 庫,并且計算了一個數據表格,其中包含了不同產品的銷售量以及顏色。隨后使用 squarify 庫繪制出了?;鶊D。結果如下:
從圖中可以清晰地看出,產品 A 占據了最大的比重,而且它的顏色是紅色。另外,從顏色的對應關系可以看出,黃色對應的是產品 B,藍色對應的是產品 C,綠色對應的是產品 D。
總的來說,Python 桑基圖是一種非常實用的數據可視化工具,適合于各種不同類型的數據分析場景。希望大家可以掌握這個工具,提高數據分析的效率和準確性。