決策樹的結果是唯一的嗎?
不同的決策樹它的結果不都一樣。首先我們看一下決策樹的生成過程:
(1)將所有的特征看成一個一個的節點;
(2)遍歷當前特征的每一種分割方式,找到最好的分割點、將數據劃分為不同的子節點,eg: N1、 N2、…、Nm;計算劃分之后所有子節點的“純度”信息;
(3)使用第二步遍歷所有特征,選擇出最優的特征,以及該特征的最優的劃分方式,得出最終的子節點N1、 N2、…、Nm;(4)對子節點N1、N2、…、Nm分別繼續執行2-3步,直到每個最終的子節點都足夠“純”。
從上述步驟可以看出,決策樹的生成過程中有三個重要的問題:對數據進行分割、選擇分裂特征以及什么時候停止分裂。
下一篇代碼之父