Python 是一種強大的編程語言,擁有許多非常有用的庫和工具。其中,層次化索引是一項非常重要的功能。
層次化索引是 pandas 數據分析庫中的一項特性,其主要作用是在數據分析過程中對數據進行分組和聚合操作。層次化索引又被稱為“多重索引”。
import pandas as pd import numpy as np # 創建一個包含三個層級的多重索引 arrays = [ ['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'], ['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two'] ] tuples = list(zip(*arrays)) index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second']) # 創建一組隨機數 np.random.seed(0) df = pd.DataFrame(np.random.randn(8, 4), index=index, columns=['A', 'B', 'C', 'D']) # 分組和聚合操作 grouped = df.groupby(level=0).sum() print(grouped)
以上代碼首先創建了一個包含三個層級的多重索引,并根據該多重索引創建了一個數據幀。然后,對數據幀進行了分組和聚合操作。最后,輸出了分組后的求和結果。
通過層次化索引,我們可以更加清晰和方便的對數據進行分組和聚合操作,從而實現更為高效和準確的數據分析工作。