資料探勘 機器學習 總結3 聽徐老師講課第三集

2021-09-25 06:03:59 字數 389 閱讀 3603

1.有監督學習

features(attributes) ----> label(target)    [ label(target)是為了告訴你對錯]

機器學習要考慮他的準確性以及可解釋性。

2.決策樹演算法(decision trees)

(1)entropy(熵)

h表示熵。

熵越小,越穩定。

(2)conditional entropy(條件熵)       # 模擬於條件概率

mutual informational(互資訊、資訊增量)

(3)gain(s, a) = 熵 - 條件熵的和   ???

考量乙個模型:效能(精度)+ 複雜度

實際應用中:可以利用決策樹去選取特徵,再考慮使用其他模型。

資料探勘 機器學習 大資料比賽羅列

最近自己想參加一些如題型別的比賽,卻發現找不到。自己知道的比賽平台要麼已經截止報名,要麼就是快結束了,內心真是一萬匹馬在奔騰。好不容易選了個阿里 的比賽,花了兩天時間初步實現了一種方法,提交結果還不錯,至少能進二期,卻發現由於自己沒看比賽規則,需要那啥實名驗證,而被直接淘汰。想想就心酸。看來有必要整...

資料探勘 機器學習 深度學習常用資料集

大的資料收錄 即被交付給的原始資料集 0.2.1 離散和連續型普通資料集 0.2.2 影象資料集 影象分類 目標檢測 目標跟蹤 語義分割 影象融合 超解析度 flyingchairs 22872張影象對,2d對應的3d影象,標註ground truth為光流。celeba202599張各個尺寸的,此...

資料探勘 機器學習 之 開新坑

之前的部落格一直是關於leetcode的內容,接下來除了這個外我還會寫關於資料探勘 機器學習的一些東西,開乙個新的坑。這個乙個方向將會是我的重心,近期的計畫包括 面試經驗 書籍閱讀筆記 自己的一些感想和經驗 在這裡我先介紹下我的心路歷程 我本科和研究生的方向和資料探勘 機器學習其實不太沾邊,甚至和計...