1.有監督學習
features(attributes) ----> label(target) [ label(target)是為了告訴你對錯]
機器學習要考慮他的準確性以及可解釋性。
2.決策樹演算法(decision trees)
(1)entropy(熵)
h表示熵。
熵越小,越穩定。
(2)conditional entropy(條件熵) # 模擬於條件概率
mutual informational(互資訊、資訊增量)
(3)gain(s, a) = 熵 - 條件熵的和 ???
考量乙個模型:效能(精度)+ 複雜度
實際應用中:可以利用決策樹去選取特徵,再考慮使用其他模型。
資料探勘 機器學習 大資料比賽羅列
最近自己想參加一些如題型別的比賽,卻發現找不到。自己知道的比賽平台要麼已經截止報名,要麼就是快結束了,內心真是一萬匹馬在奔騰。好不容易選了個阿里 的比賽,花了兩天時間初步實現了一種方法,提交結果還不錯,至少能進二期,卻發現由於自己沒看比賽規則,需要那啥實名驗證,而被直接淘汰。想想就心酸。看來有必要整...
資料探勘 機器學習 深度學習常用資料集
大的資料收錄 即被交付給的原始資料集 0.2.1 離散和連續型普通資料集 0.2.2 影象資料集 影象分類 目標檢測 目標跟蹤 語義分割 影象融合 超解析度 flyingchairs 22872張影象對,2d對應的3d影象,標註ground truth為光流。celeba202599張各個尺寸的,此...
資料探勘 機器學習 之 開新坑
之前的部落格一直是關於leetcode的內容,接下來除了這個外我還會寫關於資料探勘 機器學習的一些東西,開乙個新的坑。這個乙個方向將會是我的重心,近期的計畫包括 面試經驗 書籍閱讀筆記 自己的一些感想和經驗 在這裡我先介紹下我的心路歷程 我本科和研究生的方向和資料探勘 機器學習其實不太沾邊,甚至和計...