積極學習方法:從訓練記錄中提取模型,對**資料進行分類
消極學習方法:rote分類器,記住整個訓練資料,僅當測試例項的屬性和某個訓練樣例完全匹配時才進行分類,缺點是某些測試記錄不能被分類
更靈活的方法是找出和測試樣例的屬性相對接近的所有訓練樣例,這些訓練樣例即最近鄰
最近鄰分類器是把每個樣例看作多維空間上的乙個資料點,計算測試樣例和訓練集中其他資料點的鄰近度(任意一種鄰近度度量);給定樣例z的k-最近鄰是指和z距離最近的k個資料點;如果有多個最近鄰類標號則指派到多數類
最近鄰演算法:
高效的索引技術可以降低測試樣例找到最近鄰的計算量
最近鄰表決,每個最近鄰對分類的影響都一樣,可以對每個最近鄰加權
最近鄰分類器的特徵:
最近鄰的基礎技術是基於例項的學習,使用具體的訓練例項進行**
消極學習方法每次**的消耗都很大
最近鄰分類器基於區域性資訊進行**,而積極方法則是尋找輸入空間的全域性模型,正因為如此當k很小時,對雜訊非常敏感
最近鄰分類器可以生成任意形狀的決策邊界,決策樹和基於規則的分類器通常是直線決策邊界
採用適當的鄰近性度量和資料預處理,可以提高最近鄰分類器的準確率
2 最近鄰分類器
2 最近鄰分類器 接下來我們來開發乙個影象分類器 最近鄰分類器。這個分類器在實踐中很少用,但是可以讓我們對資料驅動的影象分類方法有乙個概念性的理解。影象分類樣例資料集 cifar 10,這是乙個有名的影象分類資料集。包含6萬張32x32畫素的小圖,每張都標記為10個分類中的某乙個 比如airplan...
第五章 分類和詞性標註
import nltk text nltk.word tokenize and now for something completely different a nltk.pos tag text 分詞後進行詞性標註,cc是連詞,rb是副詞,in是介詞,nn是名詞,jj是形容詞,可以使用 nltk....
第五章Object C類
介面與實現檔案 在這些時間裡用你的類宣告並且定義這些單獨的檔案。如果你用的是xcode,你將要開始乙個新的專案稱為fractiontest。緊緊跟著這個專案檔案是main.m import fraction.h int main int argc,char argv return 0 這個檔案並沒有...