第二單元 認識資料

2021-10-06 21:35:30 字數 1350 閱讀 5252

下列對學生相關屬性描述中,不是標稱屬性的是( )。

a.學號

b.婚姻狀況

c.身高

d.頭髮顏色

下列哪些選項能表示序數屬性的資料集中趨勢度量( )。

a.四分位數

b.眾數

c.均值

d.標準差

( )可以觀察從乙個分布到另一分布是否有漂移。

a.盒圖

b.分位數-分位數圖

c.散點圖

d.直方圖

度量作為一種測度,滿足以下哪些條件:

a.以上均是

b.同一性

c.三角不等式

d.對稱性

python科學計算的基本包是( )。

a.pandas

b.numpy

c.scikit-learn

d.matplotlib

以下python包中,提供了dataframe資料型別的是( )。

a.numpy

b.pandas

c.scikit-learn

d.matplotlib

d.直接安裝pycharm

下列對學生的描述屬性中,標稱屬性的屬性是:

a.學號

b.婚姻狀況

c.身高

d.頭髮顏色

下列哪些指標可以度量資料的離散趨勢度量:

a.極差

b.五數概括

c.四分位數極差

d.四分位數

在探索性資料分析中,認為最有代表性,最能反映資料重要特徵的五數概括,包括:

a.中位數q2

b.最大值

c.四分位數q3

d.最小值

序數屬性的值存在有意義的序。相鄰兩者之間的差是已知的。×

四分位數極差(iqr)是第1個和第2個四分位數之間的距離。×

在計算混合型別屬性的相異性時,一般是通過將所有有意義的屬性轉換到共同的區間[0.0,1.0]上,實現在單個相異性矩陣中進行計算。√

給定兩個資料物件(19,4,5)和(22,6,3),則兩個物件之間的曼哈頓距離7。【如果計算結果是小數,則保留一位;如果是整數,則直接填寫整數】

給定兩個資料物件(19,4,5)和(22,6,3),則兩個物件之間的上確界距離3。【如果計算結果是小數,則保留一位;如果是整數,則直接填寫整數】

資料探勘第二章 認識資料

2.4 度量資料的相似性和相異性 資料物件 實體 屬性 描述資料物件,資料物件的乙個特徵 屬性的型別 標稱屬性nominal attribute 二元屬性binary attribute 序數屬性ordinal attribute 數值屬性numeric attribute 區間標度屬性 比率標度屬...

單元一 認識資料庫系統

1 access 2010是microsoft office 2010辦公軟體的元件之一,也是新一代的桌面資料庫管理系統。2 資料 儲存於某種 的物理符號串行,是一種未經加工的原始資料。資料不僅包括數字 字母 文字等文字資料,而且包括圖形 影象 動畫等非文字資料。3 資訊 經過加工處理的資料表現形式...

資料探勘 認識資料

越來越多的人認識到,資料對這個世界的影響越來越大,掌握資料就掌握了發言權。如何從資料中找到想要的知識,是得到資料之後最需要關心的。資料探勘,也是知識發現的過程。1 理解資料 現實世界中,各行各業每時每刻都在產生數量龐大的資料集,讓人眼花繚亂,應該怎樣理解和處理資料呢?資料集由資料物件組成,乙個資料物...