分詞方法大致可分為三大類:基於字串匹配的分詞方法(機械分詞方法)、基於統計的分詞方法和基於理解的分詞方法。機械分詞方法主要有整箱最大匹配演算法、逆向最大匹配演算法、雙向最大匹配演算法和最少切分演算法。
id3演算法要求特徵必須離散化
主動學習方法:有時候,有類標號的資料比較稀少而沒有類標號的資料相當豐富,但是對資料進行人工標註有非常安規,此時學習演算法可以主動地提出一些標註請求,將一些經過篩選的資料提交給專家進行標註。
故主動學習並不屬於監督學習、無監督學習和半監督學習的範疇,因為主動學習過程中指的是主動提出標註請求,也就是需要乙個外在的能夠對其請求進行標註的實體(通常是相關領域專業人員),即主動學習是互動進行的。
而半監督學習指的是學習演算法不需要人工干預,基於自身對未標記資料加以利用。
下列屬於特徵選擇方法的是( )a模擬退火演算法b序列浮動演算法c分支限界演算法d雙向搜素演算法
測試用例=變數數*(每個變數的取值數-1)+1
自頂向下的語法分析方法:
(1)遞迴子程式法(2)ll(1)分析法
自底向上的分析技術 有:
( 1 )簡單優先分析法
( 2 )算符優先分析法
( 3 )優先函式
( 4 ) lr 分析法
機器學習筆試題一
1.輸入大小為200 200,依次經過一層卷積 kernel size 5 5,padding 1,stride 2 pooling kernel size 3 3,padding 0,stride 1 又一層卷積 kernel size 3 3,padding 1,stride 1 之後,輸出特徵...
機器學習筆試題(一)
判別方法 由資料直接學習決策函式 y f x 或者由條件分布概率 p y x 作為 模型,即判別模型。生成方法 由資料學習聯合概率密度分布函式 p x,y 然後求出條件概率分布p y x 作為 的模型,即生成模型。由生成模型可以得到判別模型,但由判別模型得不到生成模型。常見判別模型 k近鄰 svm ...
機器學習面筆試 資料篇
常用的有白化,去均值,歸一化和pca。可參考這裡。常用的歸一化方法 線性歸一化和0均值標準化 線性歸一化將資料轉換到 0,1 之間 xn orm x xm inxm ax x min xno rm x xmi nxma x xm in 0均值標準化,均值為0,方差為1的資料集 z x z x 為資料...