資料探勘基礎知識與比賽的了解 task1

2021-10-04 07:50:30 字數 444 閱讀 3587

懷著緊張的心情開啟了自己第一次關於資料方面的比賽之旅,有挑戰,也有期待。

理解賽題

對賽題背景要了解,不要一拿到賽題就拿**,拿資料去跑;

資料中會有很多異常值,我們要對錯誤值、缺失值等等進行資料清洗;

比賽分類通常為三種,分類問題,回歸問題,其他問題,本次比賽的二手車交易是乙個回歸問題,用已有之前的資料進行回歸分析來**以後的二手車的**等等;

泛化能力要強,做出的模型要對學習集以外的一些資料能做出更好的**;

賽題的資料

比賽的評判標準,有 r^2,mae平均覺得誤差,mse均方誤差資料科學庫:pandas,numpy,scipy

資料視覺化:matplotlib,seabon

xgb,lbg等演算法是模型建造的重點

這些都是以後需要找時間細細學習的地方

資料探勘學習基礎知識

資料探勘的學習,我是參考了 資料探勘概念與技術 韓家煒老師的書籍學習 第一部分 認識資料 1.1 屬性 屬性是乙個資料字段,便是資料物件的乙個特徵。分類一 標稱屬性 值是符號或事物的名稱。ex,hair color,customer id。對其算數運算無 意義。二元屬性 一種標稱屬性。只有兩個狀態o...

資料探勘引入 基礎知識

全球每天都在產生數以兆兆的資料,每個人的行為都會產生資料 資料的 式增長並且廣泛可用讓我們真正進入資料時代。普通人面對這資料海洋就是束手無策 一臉懵逼 我是誰?我從哪兒來?我要去哪兒?但是在這資料海洋中有著無與倫比的財富等待著我們去發現。資料探勘 資料探勘是指從大量的資料中通過演算法搜尋隱藏於其中資...

資料探勘的幾個基礎知識

1.為什麼資料探勘是重要的?主要是由於存在可以廣泛使用的大量資料,並且迫切需要將這些資料轉換成有用的資訊和知識,以將其廣泛用於市場分析 欺詐檢測 顧客保有 產品控制和科學探索等。2.資料探勘系統的一般結構 知識發現過程由以下步驟組成 1 資料清理 消除雜訊和不一致資料 2 資料整合 可將多重資料來源...