1. 在基於圖的簇評估度量表裡面,如果簇度量為proximity(ci , c),簇權值為mi ,那麼它的型別是( )。
a 基於圖的凝聚度
b 基於原型的凝聚度
c 基於原型的分離度
d 基於圖的凝聚度和分離度
2. dbscan在最壞情況下的時間複雜度是( )。
a o(m)
b o(m2)
c o(log m)
d o(m*log m)
3. ( )將兩個簇的鄰近度定義為不同簇的所有點對的平均逐對鄰近度,它是一種凝聚層次聚類技術。
a min(單鏈)
b max(全鏈)
c 組平均
d ward方法
4. 檢測一元正態分佈中的離群點,屬於異常檢測中的基於( )的離群點檢測。
a 統計方法
b 鄰近度
c 密度
d 聚類技術
5. birch是一種( b )。
a 分類器
b 聚類演算法
c 關聯分析演算法
d 特徵選擇演算法
6. ( )是乙個觀測值,它與其他觀測值的差別如此之大,以至於懷疑它是由不同的機制產生的。
a 邊界點
b 質心
c 離群點
d 核心點
7. 在基本k均值演算法裡,當鄰近度函式採用( )的時候,合適的質心是簇中各點的中位數。
a 曼哈頓距離
b 平方歐幾里德距離
c 余弦距離
d bregman散度
8. 簡單地將資料物件集劃分成不重疊的子集,使得每個資料物件恰在乙個子集中,這種聚類型別稱作( )
a 層次聚類
b 劃分聚類
c 非互斥聚類
d 模糊聚類
9. 通過聚集多個分類器的**來提高分類準確率的技術稱為 ( )
a 組合(ensemble)
b 聚集(aggregate)
c 合併(combination)
d 投票(voting)
10. 以下關於人工神經網路(ann)的描述錯誤的有 ( )
a 神經網路對訓練資料中的雜訊非常魯棒
b 可以處理冗餘特徵
c 訓練ann是乙個很耗時的過程
d 至少含有乙個隱藏層的多層神經網路
獲取答案和詳細的答案解析:
DM 大資料題 含答案和解析
1.考慮兩隊之間的足球比賽 隊0和隊1。假設65 的比賽隊0勝出,剩餘的比賽隊1獲勝。隊0獲勝的比賽中只有30 是在隊1的主場,而隊1取勝的比賽中75 是主場獲勝。如果下一場比賽在隊1的主場進行隊1獲勝的概率為 a 0.75 b 0.35 c 0.4678 d 0.5738 2.如果允許一條記錄觸發...
DM 大資料題 含答案和解析
1.考慮值集 其四分位數極差是 a 31 b 24 c 55 d 3 2.假定用於分析的資料報含屬性age。資料元組中age的值如下 按遞增序 13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問題 使用按...
演算法題 含答案和解析
1.某段文字中各個字母出現的頻率分別是,使用哈夫曼編碼,則哪種是可能的編碼 a a 001 b 000 h 01 i 10 o 11 b a 0000 b 0001 h 001 o 01 i 1 c a 000 b 001 h 01 i 10 o 00 d a 0000 b 0001 h 001 o...