直方圖、密度圖、箱線圖。
一般橫軸表示資料型別,縱軸表示分布情況。
直方圖可以很直觀地展示每個屬性的分布狀況。公國圖表可以很直觀地看到資料是高斯分布、指數分布還是偏態分布。
從直方圖可以看出,separ-length和separ-length符合高斯分布。
密度圖是一種表現資料值對應的邊界或域物件的圖形表示方法,一般用於呈現連續變數。
密度圖類似於對直方圖進行抽象,用平滑的線來描述資料的分布。
箱線圖也是一種用於顯示資料分布狀況的手段。首先畫一條中位線,然後以下四分位數和上四分位數畫乙個盒子,上下各有一條橫線,表示上邊緣和下邊緣,通過橫線來顯示資料的伸展狀況,游離在邊緣之外的點為異常值。
相關矩陣圖主要用來表示兩個不同屬性之間的相互影響的程度。
《機器學習Python實踐》第5章 資料匯入
python 提供了乙個標準類庫csv,用來處理csv檔案。這個類庫中的reader 函式用來讀入csv檔案。當csv檔案被讀入後,可以利用這些資料生成乙個numpy陣列,用來訓練演算法模型。from csv import reader import numpy as np filename pim...
第7章學習小結
一 線性表的查詢 1 順序查詢 typedef keytype int 這個根據具體情況去定義 在這裡定義為int typedef structelemtype typedef struct sstable 查詢過程 按順序乙個乙個比對,直到找到為止 若全部對比完都沒找到,則意味著查詢失敗。設定哨兵...
第7章學習小結
在第七章我們學習了查詢演算法 查詢主要包括三種結構 線性表 樹表 雜湊表 一 線性表 順序查詢 折半查詢 分塊查詢 查詢時間複雜度 o n o log2n asl l查塊 l塊內查詢 特點毫無特點 效率高一點點咯 甚至不如折半查詢 通用情況 任何結構都行 有序的順序表 塊間有序 塊內無序的順序表 二...