下列對學生相關屬性描述中,不是標稱屬性的是( )。
a.學號
b.婚姻狀況
c.身高
d.頭髮顏色
下列哪些選項能表示序數屬性的資料集中趨勢度量( )。
a.四分位數
b.眾數
c.均值
d.標準差
( )可以觀察從乙個分布到另一分布是否有漂移。
a.盒圖
b.分位數-分位數圖
c.散點圖
d.直方圖
度量作為一種測度,滿足以下哪些條件:
a.以上均是
b.同一性
c.三角不等式
d.對稱性
python科學計算的基本包是( )。
a.pandas
b.numpy
c.scikit-learn
d.matplotlib
以下python包中,提供了dataframe資料型別的是( )。
a.numpy
b.pandas
c.scikit-learn
d.matplotlib
d.直接安裝pycharm
下列對學生的描述屬性中,標稱屬性的屬性是:
a.學號
b.婚姻狀況
c.身高
d.頭髮顏色
下列哪些指標可以度量資料的離散趨勢度量:
a.極差
b.五數概括
c.四分位數極差
d.四分位數
在探索性資料分析中,認為最有代表性,最能反映資料重要特徵的五數概括,包括:
a.中位數q2
b.最大值
c.四分位數q3
d.最小值
序數屬性的值存在有意義的序。相鄰兩者之間的差是已知的。×
四分位數極差(iqr)是第1個和第2個四分位數之間的距離。×
在計算混合型別屬性的相異性時,一般是通過將所有有意義的屬性轉換到共同的區間[0.0,1.0]上,實現在單個相異性矩陣中進行計算。√
給定兩個資料物件(19,4,5)和(22,6,3),則兩個物件之間的曼哈頓距離7。【如果計算結果是小數,則保留一位;如果是整數,則直接填寫整數】
給定兩個資料物件(19,4,5)和(22,6,3),則兩個物件之間的上確界距離3。【如果計算結果是小數,則保留一位;如果是整數,則直接填寫整數】
資料探勘第二章 認識資料
2.4 度量資料的相似性和相異性 資料物件 實體 屬性 描述資料物件,資料物件的乙個特徵 屬性的型別 標稱屬性nominal attribute 二元屬性binary attribute 序數屬性ordinal attribute 數值屬性numeric attribute 區間標度屬性 比率標度屬...
單元一 認識資料庫系統
1 access 2010是microsoft office 2010辦公軟體的元件之一,也是新一代的桌面資料庫管理系統。2 資料 儲存於某種 的物理符號串行,是一種未經加工的原始資料。資料不僅包括數字 字母 文字等文字資料,而且包括圖形 影象 動畫等非文字資料。3 資訊 經過加工處理的資料表現形式...
資料探勘 認識資料
越來越多的人認識到,資料對這個世界的影響越來越大,掌握資料就掌握了發言權。如何從資料中找到想要的知識,是得到資料之後最需要關心的。資料探勘,也是知識發現的過程。1 理解資料 現實世界中,各行各業每時每刻都在產生數量龐大的資料集,讓人眼花繚亂,應該怎樣理解和處理資料呢?資料集由資料物件組成,乙個資料物...