英文名字: Decision Tree
決策樹(shù)是一種典型的分類方法,首先對(duì)數(shù)據(jù)進(jìn)行處理,利用歸納算法生成可讀的規(guī)則和決策樹(shù),然后使用決策對(duì)新數(shù)據(jù)進(jìn)行分析。本質(zhì)上決策樹(shù)是通過(guò)一系列規(guī)則對(duì)數(shù)據(jù)進(jìn)行分類的過(guò)程。
決策樹(shù)是一個(gè)監(jiān)督式學(xué)習(xí)方法,主要用于分類和回歸。 算法的目標(biāo)是通過(guò)推斷數(shù)據(jù)特征,學(xué)習(xí)決策規(guī)則從而創(chuàng)建一個(gè)預(yù)測(cè)目標(biāo)變量的模型。
決策樹(shù)類似if-else結(jié)構(gòu),它的結(jié)果就是你要生成這樣一個(gè)可以從樹(shù)根開(kāi)始不斷判斷選擇到葉子節(jié)點(diǎn)的樹(shù)。 但是這里的if-else判斷條件不是人工設(shè)置,而是計(jì)算機(jī)根據(jù)我們提供的算法自動(dòng)生成的。
決策樹(shù)組成元素
決策點(diǎn)
是對(duì)幾種可能方案的選擇,即最后選擇的最佳方案。如果決策屬于多級(jí)決策,則決策樹(shù)的中間可以有多個(gè)決策點(diǎn),以決策樹(shù)根部的決策點(diǎn)為最終決策方案。
狀態(tài)節(jié)點(diǎn)
代表備選方案的經(jīng)濟(jì)效果(期望值),通過(guò)各狀態(tài)節(jié)點(diǎn)的經(jīng)濟(jì)效果的對(duì)比,按照一定的決策標(biāo)準(zhǔn)就可以選出最佳方案。由狀態(tài)節(jié)點(diǎn)引出的分支稱為概率枝,概率枝的數(shù)目表示可能出現(xiàn)的自然狀態(tài)數(shù)目每個(gè)分枝上要注明該狀態(tài)出現(xiàn)的概率。
結(jié)果節(jié)點(diǎn)
將每個(gè)方案在各種自然狀態(tài)下取得的損益值標(biāo)注于結(jié)果節(jié)點(diǎn)的右端
決策樹(shù)組優(yōu)缺點(diǎn)
決策樹(shù)優(yōu)勢(shì)
簡(jiǎn)單易懂,原理清晰,決策樹(shù)可以實(shí)現(xiàn)可視化
推理過(guò)程容易理解,決策推理過(guò)程可以表示成if-else形式
推理過(guò)程完全依賴于屬性變量的取值特點(diǎn)
可自動(dòng)忽略目標(biāo)變量沒(méi)有貢獻(xiàn)的屬性變量,也為判斷屬性變量的重要性,減少變量的數(shù)目提供參考