資料探勘之概念描述 特徵與比較學習筆記

2021-09-01 20:11:18 字數 262 閱讀 4968

從資料分析的角度,資料探勘可以分為兩類:描述式資料探勘和**式資料探勘。描述式資料探勘以簡潔概要的方式描述資料,並提供資料的有趣的一般性質。**式資料探勘分析資料,建立乙個或一組模型,並試圖**新資料集的行為。

資料庫通常存放大量的細節資料。然而,使用者通常希望以簡潔的描述形式觀察彙總的資料集。

這種資料描述可以提供一類資料的概貌,或將它與對比類相區別。此外,使用者希望方便、靈活地以不同的粒度和從不同的角度描述資料集。這種描述性資料探勘稱為概念描述,它是資料探勘的乙個重要部分。

資料探勘之特徵工程

標籤編碼與獨熱編碼 onehotencoder獨熱編碼和 labelencoder標籤編碼 資料探勘的基本流程 多項式特徵 特徵構建 生成多項式特徵 對於特徵離散化,特徵交叉,連續特徵離散化非常經典的解釋 資料預處理與特徵選擇 特徵工程到底是什麼?機器學習中的資料清洗與特徵處理綜述 sklearn ...

資料探勘之特徵工程

是對原始資料進行一系列工程處理,將其提煉為特徵,作為輸入供演算法和模型使用。從本質上來講,特徵工程是乙個表示和展現數 據的過程。在實際工作中,特徵工程旨在去除原始資料中的雜質和冗餘,設計更 高效的特徵以刻畫求解的問題與 模型之間的關係。特徵工程有很多的方法,其中比較常見的有 為了消除資料特徵之間的量...

資料探勘之基礎概念

任務 根據其他屬性的值,特定屬性的值。通常資料探勘的任務 描述任務 匯出概括資料中潛聯絡的模式 四種主要的資料探勘任務 建模 關聯分析 聚類分析 異常檢測 建模 分類 用於 離散的目標變數 回歸 用於 連續的目標變數 關聯分析 用於發現描述資料中強關聯特徵的模式。異常檢測 識別器特徵顯著不同於其他資...