嶺回歸是一種用于解決多重共線性問題的回歸方法,它在普通線性回歸通常引發過擬合的情況下,使用L2正則化項對模型參數進行約束,從而提高了模型的泛化能力。Python中可以使用sklearn庫中的Ridge類來實現嶺回歸。
from sklearn.linear_model import Ridge import numpy as np # 生成隨機數據 np.random.seed(0) X = np.random.rand(10, 5) y = np.random.rand(10) # 嶺回歸模型 ridge = Ridge(alpha=1.0) ridge.fit(X, y) # 預測 x_new = np.random.rand(5) y_new = ridge.predict(x_new.reshape(1,-1)) print(y_new)
在上面的代碼中,我們首先生成了10行5列的隨機數作為特征矩陣X,同時生成了10個隨機數作為目標變量y。接著創建了一個alpha參數為1.0的嶺回歸模型,并使用fit()函數擬合數據。最后,我們生成了一個隨機數向量x_new,并使用predict()函數對該向量進行預測,得到了一個實數值。
需要注意的是,在使用嶺回歸模型時,alpha參數的值越大,模型的懲罰力度就越大,但是模型偏差會相應增大,而方差會減小。因此,我們需要根據實際情況和數據特征來選擇alpha參數的值,并在交叉驗證等方法中進行調整,以獲得更好的效果。