Python是非常簡單易學的一門編程語言,也是現今最流行的科學計算語言之一。在數據分析、機器學習和可視化的領域,Python也表現出了強大的能力。
其中可視化在數據處理過程中非常重要,它可以讓我們更清晰、更快速的了解數據之間的關系和趨勢。下面簡單介紹一下Python中基于航班數據的可視化和分析。
# 導入所需的庫 import pandas as pd import matplotlib.pyplot as plt # 讀取航班數據 df = pd.read_csv('flight.csv') # 繪制航班數量時序圖 df['Date'] = pd.to_datetime(df['Date']) df.index = pd.PeriodIndex(df['Date'],freq='M') df = df.drop(columns=['Date']) df_monthly = df.groupby(df.index)['Passengers'].sum() df_monthly.plot(figsize=(10,5)) # 繪制航班數量的柱狀圖 df_by_airline = df.groupby('Airline')['Passengers'].sum() df_by_airline.plot(kind='bar',figsize=(10,5)) # 繪制航空公司間的航班數量堆積圖 df_pivoted = df.pivot(index='Year',columns='Airline',values='Passengers') df_pivoted.plot(kind='area',stacked=True,figsize=(10,5))
這段代碼展示了如何用Python中的Pandas和Matplotlib庫對航班的數據進行可視化和分析。首先我們導入了所需的庫,并讀取了航班數據,然后對數據進行了預處理,如將日期轉換為時間戳,并按照月份進行了聚合。
接著我們繪制了航班數量的時序圖,用于展示航班數量的趨勢。然后我們又繪制了航班數量的柱狀圖和航空公司間的航班數量堆積圖,用于比較不同航空公司在同一時間范圍內的航班數量。
通過這個例子,我們可以發現Python的可視化實現非常簡單、易懂,而且可以呈現出很多復雜的圖表效果。在數據處理的過程中,Python的強大功能一定會幫助你大大提高工作效率,并且讓你更輕松地了解數據之間的關聯和趨勢。