生存曲線是統(tǒng)計與生物學領(lǐng)域中常見的一種曲線,用來表示一個群體或個體在某種事件或疾病下存活的時間分布情況。Python中可使用生存分析庫lifelines來畫生存曲線。
# 導入必要的庫 import pandas as pd import numpy as np import matplotlib.pyplot as plt from lifelines import KaplanMeierFitter # 創(chuàng)建數(shù)據(jù)集 df = pd.DataFrame({'time': [5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15], 'event': [0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1]}) # 創(chuàng)建KaplanMeierFitter對象 kmf = KaplanMeierFitter() # 對數(shù)據(jù)進行擬合 kmf.fit(df['time'], event_observed=df['event']) # 畫圖 kmf.plot() # 為生存曲線添加標簽、標題等 plt.xlabel('Time (days)') plt.ylabel('Survival probability') plt.title('Survival curve') plt.show()
代碼中,我們首先導入必要的庫,包括pandas、numpy、matplotlib和lifelines。然后,我們創(chuàng)建一個數(shù)據(jù)集,其中包含了每個單位所受到的事件和時間。接著,我們創(chuàng)建了一個KaplanMeierFitter對象,對數(shù)據(jù)進行擬合。最后,我們使用.plot()方法畫生存曲線,并對曲線添加標簽、標題等。
使用lifelines庫可以方便地創(chuàng)建和畫出生存曲線,用戶可以根據(jù)具體需求調(diào)整曲線樣式、添加標簽等。通過分析生存曲線,我們可以了解到群體或個體在某種事件或疾病下的存活情況,從而指導我們的研究和實踐。