DM 大資料題 含答案和解析

2021-10-21 17:17:56 字數 1430 閱讀 8265

1. 考慮兩隊之間的足球比賽:隊0和隊1。假設65%的比賽隊0勝出,剩餘的比賽隊1獲勝。隊0獲勝的比賽中只有30%是在隊1的主場,而隊1取勝的比賽中75%是主場獲勝。如果下一場比賽在隊1的主場進行隊1獲勝的概率為 ( )

a  0.75

b  0.35

c  0.4678

d  0.5738

2. 如果允許一條記錄觸發多條分類規則,把每條被觸發規則的後件看作是對相應類的一次投票,然後計票確定測試記錄的類標號,稱為( )

a  無序規則

b  窮舉規則

c  互斥規則

d  有序規則

3. 以下哪些演算法是基於規則的分類器 ( )

a  c4.5

b  knn

c  ***** bayes

d  ann

4. 在基於規則分類器的中,依據規則質量的某種度量對規則排序,保證每乙個測試記錄都是由覆蓋它的「最好的」規格來分類,這種方案稱為 ( )

a  基於類的排序方案

b  基於規則的排序方案

c  基於度量的排序方案

d  基於規格的排序方案

5. 以下哪項關於決策樹的說法是錯誤的 ()

a  冗餘屬性不會對決策樹的準確率造成不利的影響

b  子樹可能在決策樹中重複多次

c  決策樹演算法對於雜訊的干擾非常敏感

d  尋找最佳決策樹是np完全問題

6. 決策樹中不包含一下哪種結點, ( )

a  根結點(root node)

b  內部結點(internal node)

c  外部結點(external node)

d  葉結點(leaf node)

7. 以下哪些分類方法可以較好地避免樣本的不平衡問題, ()

a  knn

b  svm

c  bayes

d  神經網路

8. 以下哪些演算法是分類演算法()

a  dbscan

b  c4.5

c  k-mean

d  em

9. 下面購物籃能夠提取的3-項集的最大數量是多少

id 購買項

1 牛奶,啤酒,尿布

2 麵包,黃油,牛奶

3 牛奶,尿布,餅乾

3 麵包,黃油,餅乾

5 啤酒,餅乾,尿布

6 牛奶,尿布,麵包,黃油

7 麵包,黃油,尿布

8 啤酒,尿布

9 牛奶,尿布,麵包,黃油

10 啤酒,餅乾

a  1

b  2

c  3

d  4

10. 下列____不是將主觀資訊加入到模式發現任務中的方法。

a  與同一時期其他資料對比

b  視覺化

c  基於模板的方法

d  主觀興趣度量

獲取答案和詳細的答案解析:

DM 大資料題 含答案和解析

1.在基於圖的簇評估度量表裡面,如果簇度量為proximity ci c 簇權值為mi 那麼它的型別是 a 基於圖的凝聚度 b 基於原型的凝聚度 c 基於原型的分離度 d 基於圖的凝聚度和分離度 2.dbscan在最壞情況下的時間複雜度是 a o m b o m2 c o log m d o m l...

DM 大資料題 含答案和解析

1.考慮值集 其四分位數極差是 a 31 b 24 c 55 d 3 2.假定用於分析的資料報含屬性age。資料元組中age的值如下 按遞增序 13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問題 使用按...

演算法題 含答案和解析

1.某段文字中各個字母出現的頻率分別是,使用哈夫曼編碼,則哪種是可能的編碼 a a 001 b 000 h 01 i 10 o 11 b a 0000 b 0001 h 001 o 01 i 1 c a 000 b 001 h 01 i 10 o 00 d a 0000 b 0001 h 001 o...