rpart引數設定
ßrpart.control對樹進行一些設定
þxval是10折交叉驗證
þminsplit是最小分支節點數,這裡指大於等於20,那麼該節點會繼續分劃下去,否則停止
þminbucket:葉子節點最小樣本數
þmaxdepth:樹的深度
þcp全稱為complexity parameter,指某個點的複雜度,對每一步拆分,模型的擬合優度必須提高的程度
ßna.action:缺失資料的處理辦法,預設為刪除因變數缺失的觀測而保留自變數缺失的觀測。
ßmethod:樹的末端資料型別選擇相應的變數分割方法:
ß連續性method=「anova」,離散型method=「class」,計數型method=「poisson」,生存分析型method=「exp」
ßparms用來設定三個引數:先驗概率、損失矩陣、分類純度的度量方法(gini和information)
ßcost是損失矩陣,在剪枝的時候,葉子節點的加權誤差與父節點的誤差進行比較,考慮損失矩陣的時候,從將「減少-誤差」調整為「減少-損失」
繪圖結果
人工智慧入門 R語言資料分析與數62
不純度的度量 gini係數 是一種與資訊熵類似的做特徵選擇的方式,可以用來衡量資料的不純度。gini係數的計算方式如下 資訊增益 info gain 用於id3 gini用於cart 資訊增益率 info gain ratio 用於c4.5。id3演算法思想描述 a 對當前例子集合,計算屬性的資訊增...
人工智慧入門 R語言資料分析86
啟用函式 人工神經網路 人工神經網路 大量神經元節點按一定體系結構連線成網狀結構。神經網路一般都具有輸入層,隱含層和輸出層。前饋神經網路 前饋神經網路,是人工神經網路的一種。在此種神經網路中,各神經元從輸入層開始,接收前一級輸入,並輸出到下一級,直至輸出層。整個網路中無反饋,可用乙個有向無環圖表示。...
人工智慧入門 R語言資料分析90
神經網路的r語言例子 從函式y x1 2 x2 2產生2000組樣本資料,其中1900組作為學習集,100組作為待測集。用r語言建立合適的bp神經網路模型並利用上述學習集進行訓練。然後用訓練後的神經網路模型對待測集進行 畫圖對比 值和理想值之間的誤差情況 nnet實現bp網路 nnet引數說明 輸入...