2 1 什麼是資料

2021-10-18 23:50:31 字數 1098 閱讀 9870

那上面對於資料分析來說是非常重要的一章,就好比我們在學習寫作之前,你需要學習基本的遣詞造句一樣。後續的資料分析內容,都會涉及到本章節涉及到的知識點。

資料是對事物的描述和記錄,其實我們思考一下,我們的日常和生活中,到處都充斥著資料。我們在描述的過程中,也無法離開資料。我們上網看到的這些**、網頁上面都布滿了資料,我們用的報表文件,甚至看到的選單等等。這些都是由資料所組成的。

那麼根據資料計量層次,可以從低到高的對資料進行進一步對資料進行分類。

那麼什麼是計量層次呢?

觀察第一組資料:黃瓜,番茄,森林,書本。你會發現這樣的資料會有乙個特點,就是他是文字描述形的資料,你沒有辦法對它進行一定順序上的排序或者是大小的比較。那麼對於這樣的資料來說,我無法進行計算比較的資料,我們就說這是計量層次比較低的資料型別。

那麼對於數值形的:1,2,3,4,5,這些資料可以計算、比較,那麼計量層次就高。

與上面的資料有共同的部分,就是都是文字表示的,不同之處是可以比較優劣的。

當你可以拿到資料的時候,可以看看拿到的是定距資料還是定比資料。

當上面的資料組合起來的時候,就組合成了資料矩陣。也就是我們經常接觸到的二維資料表,我們資料表橫的表稱為觀測值、或者是記錄。我們把列表字段,稱為我們的資料屬性或者資料緯度。而這也是我們主要展示資料的主要方式。

2 1什麼是線性表

通過前面的學習我們知道,具有 一對一 邏輯關係的資料,最佳的儲存方式是使用線性表。那麼,什麼是線性表呢?線性表,全名為線性儲存結構。使用線性表儲存資料的方式可以這樣理解,即 把所有資料 用一根線兒 串起來,再儲存到物理空間中 圖 1 一對一 邏輯關係的資料 如圖 1 所示,這是一組具有 一對一 關係...

2 1 「關係」資料庫,什麼是「關係」?

1.關聯式資料庫由表組成,各表名稱唯一。2.簡單的表的例子 instructor表,由四列組成 id name dept name salary,表中的每一行都記錄了一位老師的資訊。再比如course 表,由course id title dept name and credits 四列組成。注意到...

什麼是稀疏資料?什麼是池化?

一 稀疏資料 在資料庫中,稀疏資料是指在二維表中含有大量空值的資料 即稀疏資料是指,在資料集中絕大多數數值缺失或者為零的資料。稀疏資料絕對不是無用資料,只不過是資訊不完全,通過適當的手段是可以挖掘出大量有用資訊。稀疏資料是指,資料框中絕大多數數值缺失或者為零的資料。在現代社會中,隨著資訊的 式增長,...