資料探勘目錄

2022-01-18 12:45:29 字數 1485 閱讀 8288

numpy 的ndarray

ndarray的資料型別

numpy的array陣列和標量之間的運算

numpy 切片和索引

numpy 的陣列轉置和軸對換

numpy 的通用函式:快速的元素級陣列函式

numpy 產生隨機的一維, 二維陣列**

numpy 的數學和統計方法

numpy 利用陣列進行資料處理where, sort, unique等

numpy 用於陣列的檔案輸入和輸出

numpy的線性代數

numpy的排序

pandas 的資料結構(series, dataframe)建立以及索引等方法

dataframe重新命名單個column

pandas 的算術運算和資料對齊

pandas dataframe 函式應用和對映(有對dataframe小數格式化方法等)

series 對缺失值進行處理

pandas的排序和排名(series, dataframe)

dataframe在算術方法中填充值

pandas 帶有重複值的軸索引

pandas彙總和計算描述統計

唯一值、值計數以及成員資格

相關係數和協方差

處理缺失資料

層次化索引

pandas 讀取文字格式資料

error

pandas series keyerror: -1

pandas 的軸向連線 concat

資料規整化:pandas 求合併資料集(交集並集等)merge等

合併重疊資料combine_first, where等

重塑和軸向旋轉unstack, stack

轉換:

資料轉換--移除重複資料等

利用函式或對映進行資料轉換 (map)

替換值重新命名軸索引

離散化和面元劃分(可以理解為劃分段)

預處理演算法_1_表連線

預處理演算法_2_型別轉換

預處理演算法_3_新增序列

預處理演算法_4_表堆疊

預處理演算法_5_資料集劃分

預處理演算法_6_缺失值處理

預處理演算法_7_資料去重

預處理演算法_8_異常值處理(未完成)

預處理演算法_9_資料標準化

預處理演算法_10_數學函式

資料預處理演算法_11_排序

預處理演算法_12_分組聚合

1. python統計分析-純隨機性檢驗  

6. python統計分析-主成份分析

7. python統計分析-頻數統計

8.  python統計分析-全表統計

9. python統計分析-平穩性檢驗

10.  python統計分析-因子分析

11.  python統計分析-卡方檢驗

SPSS Modeler資料探勘 資料探勘概述

資料探勘 是一種通過數理模式來分析大量資料,以找出不同的客戶或市場劃分,分析出消費者喜好和行為的方法。可以描述為 是按企業既定業務目標,對大量的企業資料進行探索和分析,揭示隱藏的 未知的 或驗證已知的規律性,並進一步將其模型化的先進的有效的方法。資料探勘 data mining 在技術上的定義是從大...

漏洞挖掘 目錄瀏覽漏洞

web中介軟體如果開啟了目錄瀏覽功能,當使用者訪問web應用時,web伺服器會將web應用的目錄結構 檔案資訊返回給客戶端,攻擊者可能利用這些敏感資訊對web應用進行攻擊,如資料庫指令碼sql檔案路徑洩露 程式備份壓縮檔案路徑洩露等。中 直接訪問web應用存在的一些目錄,如果返回檔案列表資訊,證明存...

資料探勘 資料

對關注的屬性,樣本與原始資料集有相同的性質,則用抽樣計算的結果與全集是一樣。1.1 抽樣的方法 1 簡單隨機抽樣 random sampling 放回 不放回 2 分層抽樣 stratified sampling 如果資料集不同型別的資料數量差異過大,則隨機抽樣會丟失數量少的樣本。可針對不同資料組,...