驗證集和測試集的區(qū)別?
驗證集 —— 是模型訓(xùn)練過程中單獨留出的樣本集,它可以用于調(diào)整模型的超參數(shù)和用于對模型的能力進(jìn)行初步評估。
測試集 —— 用來評估模最終模型的泛化能力。但不能作為調(diào)參、選擇特征等算法相關(guān)的選擇的依據(jù)。
測試集與驗證集的存在主要是為了把調(diào)參與評估泛化能力分為兩個相對獨立的步驟,體現(xiàn)了正交化思想。驗證集一般用于進(jìn)一步確定模型中的超參數(shù)(例如正則項系數(shù)、神經(jīng)網(wǎng)絡(luò)中隱層的節(jié)點個數(shù),k值等),而測試集只是用于評估模型的精確度(即泛化能力)。
訓(xùn)練集用于訓(xùn)練模型參數(shù),測試集用于估計模型對樣本的泛化誤差,驗證集用于“訓(xùn)練”模型的超參數(shù)