1. 考慮兩隊之間的足球比賽:隊0和隊1。假設65%的比賽隊0勝出,剩餘的比賽隊1獲勝。隊0獲勝的比賽中只有30%是在隊1的主場,而隊1取勝的比賽中75%是主場獲勝。如果下一場比賽在隊1的主場進行隊1獲勝的概率為 ( )
a 0.75
b 0.35
c 0.4678
d 0.5738
2. 如果允許一條記錄觸發多條分類規則,把每條被觸發規則的後件看作是對相應類的一次投票,然後計票確定測試記錄的類標號,稱為( )
a 無序規則
b 窮舉規則
c 互斥規則
d 有序規則
3. 以下哪些演算法是基於規則的分類器 ( )
a c4.5
b knn
c ***** bayes
d ann
4. 在基於規則分類器的中,依據規則質量的某種度量對規則排序,保證每乙個測試記錄都是由覆蓋它的「最好的」規格來分類,這種方案稱為 ( )
a 基於類的排序方案
b 基於規則的排序方案
c 基於度量的排序方案
d 基於規格的排序方案
5. 以下哪項關於決策樹的說法是錯誤的 ()
a 冗餘屬性不會對決策樹的準確率造成不利的影響
b 子樹可能在決策樹中重複多次
c 決策樹演算法對於雜訊的干擾非常敏感
d 尋找最佳決策樹是np完全問題
6. 決策樹中不包含一下哪種結點, ( )
a 根結點(root node)
b 內部結點(internal node)
c 外部結點(external node)
d 葉結點(leaf node)
7. 以下哪些分類方法可以較好地避免樣本的不平衡問題, ()
a knn
b svm
c bayes
d 神經網路
8. 以下哪些演算法是分類演算法()
a dbscan
b c4.5
c k-mean
d em
9. 下面購物籃能夠提取的3-項集的最大數量是多少
id 購買項
1 牛奶,啤酒,尿布
2 麵包,黃油,牛奶
3 牛奶,尿布,餅乾
3 麵包,黃油,餅乾
5 啤酒,餅乾,尿布
6 牛奶,尿布,麵包,黃油
7 麵包,黃油,尿布
8 啤酒,尿布
9 牛奶,尿布,麵包,黃油
10 啤酒,餅乾
a 1
b 2
c 3
d 4
10. 下列____不是將主觀資訊加入到模式發現任務中的方法。
a 與同一時期其他資料對比
b 視覺化
c 基於模板的方法
d 主觀興趣度量
獲取答案和詳細的答案解析:
DM 大資料題 含答案和解析
1.在基於圖的簇評估度量表裡面,如果簇度量為proximity ci c 簇權值為mi 那麼它的型別是 a 基於圖的凝聚度 b 基於原型的凝聚度 c 基於原型的分離度 d 基於圖的凝聚度和分離度 2.dbscan在最壞情況下的時間複雜度是 a o m b o m2 c o log m d o m l...
DM 大資料題 含答案和解析
1.考慮值集 其四分位數極差是 a 31 b 24 c 55 d 3 2.假定用於分析的資料報含屬性age。資料元組中age的值如下 按遞增序 13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問題 使用按...
演算法題 含答案和解析
1.某段文字中各個字母出現的頻率分別是,使用哈夫曼編碼,則哪種是可能的編碼 a a 001 b 000 h 01 i 10 o 11 b a 0000 b 0001 h 001 o 01 i 1 c a 000 b 001 h 01 i 10 o 00 d a 0000 b 0001 h 001 o...