1. 考慮值集 ,其四分位數極差是
a 31
b 24
c 55
d 3
2. 假定用於分析的資料報含屬性age。資料元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 問題:使用按箱平均值平滑方法對上述資料進行平滑,箱的深度為3。第二個箱子值為
a 18.3
b 22.6
c 26.8
d 27.9
3. 假設屬性income的最大最小值分別是12000元和98000元。利用最大最小規範化的方法將屬性的值對映到0至1的範圍內。對屬性income的73600元將被轉化為
a 0.821
b 1.224
c 1.458
d 0.716
4. 熵是為消除不確定性所需要獲得的資訊量,投擲均勻正六面體骰子的熵是
a 1位元
b 2.6位元
c 3.2位元
d 3.8位元
5. 下面哪個屬於對映資料到新的空間的方法?
a 傅利葉變換
b 特徵加權
c 漸進抽樣
d 維歸約
6. 考慮值集,其截斷均值(p=20%)是
a 2
b 3
c 3.5
d 5
7. 下面不屬於建立新屬性的相關方法的是
a 特徵提取
b 特徵修改
c 對映資料到新的空間
d 特徵構造
8. 只有非零值才重要的二元屬性被稱作
a 計數屬性
b 離散屬性
c 非對稱的二元屬性
d 對稱屬性
9. 下面哪個不屬於資料的屬性型別
a 標稱
b 序數
c 區間
d 相異
10. 假設12個銷售**記錄組已經排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內?
a 第乙個
b 第二個
c 第三個
d 第四個
獲取答案和詳細的答案解析:
DM 大資料題 含答案和解析
1.在基於圖的簇評估度量表裡面,如果簇度量為proximity ci c 簇權值為mi 那麼它的型別是 a 基於圖的凝聚度 b 基於原型的凝聚度 c 基於原型的分離度 d 基於圖的凝聚度和分離度 2.dbscan在最壞情況下的時間複雜度是 a o m b o m2 c o log m d o m l...
DM 大資料題 含答案和解析
1.考慮兩隊之間的足球比賽 隊0和隊1。假設65 的比賽隊0勝出,剩餘的比賽隊1獲勝。隊0獲勝的比賽中只有30 是在隊1的主場,而隊1取勝的比賽中75 是主場獲勝。如果下一場比賽在隊1的主場進行隊1獲勝的概率為 a 0.75 b 0.35 c 0.4678 d 0.5738 2.如果允許一條記錄觸發...
演算法題 含答案和解析
1.某段文字中各個字母出現的頻率分別是,使用哈夫曼編碼,則哪種是可能的編碼 a a 001 b 000 h 01 i 10 o 11 b a 0000 b 0001 h 001 o 01 i 1 c a 000 b 001 h 01 i 10 o 00 d a 0000 b 0001 h 001 o...