表結構資料
1.什麼是表結構資料
表結構資料指的是資料庫結構的資料
•以整列資料為基本計算單位
• 無法對某乙個特定值進行操作
• 無法在行上進行操作
• 表中的行稱做「記錄」
• 表中的列稱作「字段」
• 在資料庫中,欄位的集合為表,表的集合為資料庫
2.表結構資料特徵
• 乙個字段只能有一種資料型別
• 用欄位名來定位字段
(就像excel**結構資料中的列號)
• 表中所有欄位的總行數一致
• 用表名來定義表
• 一般乙個表中有乙個主鍵,主鍵的特點是每一行記錄中都沒有空值與重複值,主鍵是表的記錄單位
,表中所有其他欄位都是圍繞主鍵展開的、主鍵用來識別定位表中的不同行(就像excel**結構
資料中的行號)
• 在記錄中可以沒有值,但沒有值也佔一行記錄,沒有值的地方在程式中被識別為null值,null值是
人與計算機都無法識別的經常需要做替換空值的處理
3.表結構資料優勢
• 幾乎所有資料分析工具都支援表結構資料
• 優勢1:可非常輕鬆地關聯並整合多種不同資料來源資料
• 優勢2:可對大規模資料進行批量計算,其速度遠大於**結構資料
• 優勢3:可在不同表間建立關聯關係,讓所有不同維度資料表集成為乙個完整的多維資料模型
• 優勢4:可對零散數值進行不同維度下的彙總觀測
• 優勢5: 多數表結構資料處理工具記錄的是運算過程而非計算結果,所以一旦記錄好一次完整、準確的運算過程,便可反覆利用,可大幅減少在excel傳統工作表中進行的重複性工作
4.橫向連線
橫向連線兩表可以補充字段資訊
• 兩表通過有共同記錄資訊內容的關鍵字段相連
• 三種基本連線方式:左(外)連線、右(外)連線、內連線
• 兩表連線的結果通過三個屬性決定
5.變數
字段作為不同分析角色使用時的屬性
• 名義型變數:欄位中的值與值之間沒有順序關係,只單純用來定義名稱的變數
例:姓名、性別、血型等
• 有序型變數:欄位中的值與值之間有順序關係但不連續,值與值之間有間隔的變數
例:職稱(分析員、分析師、高階分析師)、成績(不及格、及格、良、優)
• 連續型變數:欄位中的值與值之間不僅有順序關係而且值與值之間取值連貫,可以取小數點後位數的變數
例: 身高、體重、溫度、金額等
6.彙總求值
彙總求值是業務資料分析中最主要的分析手段,用來將零散的資料彙總為可認知的彙總值,彙總值由維度、度量及彙總方法三部分構成
• 維度:有序型或名義型變數、又叫分組依據、分為彙總維度及篩選維度兩類
• 度量:維度彙總的物件、絕大多數情況下使用連續型變數
• 彙總規則:連線維度與度量的橋梁、有以下五種基本彙總規則
今天的介紹就到這裡,希望對大家有所幫助。
大資料介紹
大資料技術的戰略意義不在於掌握龐大的資料量,而在於對這些資料進行專業化處理。資料一直都在以每年50 的速度增長,也就是說每兩年就增長一倍。大資料是由結構化和非結構化資料組成的 10 的結構化資料,儲存在資料庫中 90 的非結構化資料,它們與人類資訊密切相關 資料結構 參閱c語言資料結構 資料結構是計...
大資料介紹
一 什麼是大資料 大資料是指無法在一定時間內用常規軟體工具對其內容進行抓取 管理和處理的資料集合。大資料技術,是指從各種各樣型別的資料中,快速獲得有價值資訊的能力。適用於大資料的技術,包括大規模並行處理 mpp 資料庫,資料探勘電網,分布式檔案系統,分布式資料庫,雲計算平台,網際網路,和可擴充套件的...
MODIS資料介紹
1 衛星概況 1999年2月18日,美國成功地發 地球觀測系統 eos 的第一顆先進的極地軌道環境遙感衛星terra。它的主要目標是實現從單系列極軌空間平台上對太陽輻射 大氣 海洋和陸地進行綜合觀測,獲取有關海洋 陸地 冰雪圈和太陽動力系統等資訊,進行土地利用和土地覆蓋研究 氣候季節和年際變化研究 ...