不純度的度量
ßgini係數:是一種與資訊熵類似的做特徵選擇的方式,可以用來衡量資料的不純度。gini係數的計算方式如下:
ß資訊增益(info gain)用於id3
ßgini用於cart
ß資訊增益率(info gain ratio)用於c4.5。
id3演算法思想描述
ß(a)對當前例子集合,計算屬性的資訊增益;
ß(b)選擇資訊增益最大的屬性ai;
ß(c)把在ai處取值相同的例子歸於同於子集,ai取幾個值就得幾個子集;
ß(d)對依次對每種取值情況下的子集,遞迴呼叫建樹演算法,即遞迴進入(a);
ß(e)若子集只含有單個屬性,則分支為葉子節點,判斷其屬性值並標上相應的符號,然後返回。
人工智慧入門 R語言資料分析與數72
rpart引數設定 rpart.control對樹進行一些設定 xval是10折交叉驗證 minsplit是最小分支節點數,這裡指大於等於20,那麼該節點會繼續分劃下去,否則停止 minbucket 葉子節點最小樣本數 maxdepth 樹的深度 cp全稱為complexity parameter,...
人工智慧入門 R語言資料分析86
啟用函式 人工神經網路 人工神經網路 大量神經元節點按一定體系結構連線成網狀結構。神經網路一般都具有輸入層,隱含層和輸出層。前饋神經網路 前饋神經網路,是人工神經網路的一種。在此種神經網路中,各神經元從輸入層開始,接收前一級輸入,並輸出到下一級,直至輸出層。整個網路中無反饋,可用乙個有向無環圖表示。...
人工智慧入門 R語言資料分析90
神經網路的r語言例子 從函式y x1 2 x2 2產生2000組樣本資料,其中1900組作為學習集,100組作為待測集。用r語言建立合適的bp神經網路模型並利用上述學習集進行訓練。然後用訓練後的神經網路模型對待測集進行 畫圖對比 值和理想值之間的誤差情況 nnet實現bp網路 nnet引數說明 輸入...