index 索引
定義
分類 [1]結構化資料 固定格式、有限長度 應用:資料庫、元資料
[2]非結構化資料 非定格式、非限長度 應用:磁碟檔案
查詢方式
[1]結構化查詢 資料庫搜尋
[2]非結構化查詢 [a]順序掃瞄
[b]全文檢索
定義 根據使用者需求,從資料庫提取資料,生成資料表。[ 資料表:可放回資料庫,也可進一步處理 ]
流程 [1]排序
[2]篩選
檢索方法
[1]順序檢索 逐個比較、判斷相等:關鍵字、資料區的資料 n/2次比較
[2]對分檢索
[3]索引查詢
定義
定義 首先建立索引,然後對其搜尋的過程
定義
分類 [1]正序索引 根據位置,查詢內容
[2]逆序索引 根據內容,查詢位置
[3]全文索引
資料探勘 資料
對關注的屬性,樣本與原始資料集有相同的性質,則用抽樣計算的結果與全集是一樣。1.1 抽樣的方法 1 簡單隨機抽樣 random sampling 放回 不放回 2 分層抽樣 stratified sampling 如果資料集不同型別的資料數量差異過大,則隨機抽樣會丟失數量少的樣本。可針對不同資料組,...
大資料資料
作業系統 核心 分配和管理硬體 庫 沒有入口的應用軟體 應用軟體 1 設定網絡卡為nat模式 2 確保windows下的服務是否啟動 dhcp,net服務 3 編輯檔案 vi etc sysconfig network scripts ifcfg eth0 4 onboot yes 5 設定ip s...
大資料 資料分析 資料探勘
在大資料領域裡,經常會看到例如資料探勘 olap 資料分析等等的專業詞彙。如果僅僅從字面上,我們很難說清楚每個詞彙的意義和差別。大講台老師通過一些大資料在高校應用的例子,來為大家說明白 資料探勘 大資料 olap 資料統計的區別。一 資料分析 資料分析是乙個大的概念,理論上任何對資料進行計算 處理從...