特徵預處理
什麼是特徵預處理:通過一些轉換函式將特徵資料轉換成更加適合演算法模型的特徵資料過程
1、包含內容
2、特徵預處理api
3、歸一化
from sklearn.preprocessing import minmaxscaler
defminmax_demo()
:'''
歸一化:return:
'''# 1、獲取資料
data = pd.read_csv(
'dating.txt'
) data = data.iloc[:,
:3]# 提取前三列
# 2、例項化乙個轉換器類
transfer = minmaxscaler(feature_range=[0
,1])
# 3、呼叫fit_transform
data_new = transfer.fit_transform(data)
print
('data_new:\n'
, data_new)
return
none
if __name__ ==
'__main__'
: minmax_demo(
)
4、標準化
from sklearn.preprocessing import standardscaler
defstand_demo()
:'''
標準化:return:
'''# 1、獲取資料
data = pd.read_csv(
'dating.txt'
) data = data.iloc[:,
:3]# 2、例項化乙個轉換器
transfer = standardscaler(
)# 3、呼叫fit_transform
data_new = transfer.fit_transform(data)
print
('data_new:\n'
, data_new)
return
none
if __name__ ==
'__main__'
: stand_demo(
)
機器學習 特徵預處理
通過一些轉換函式將特徵資料轉換成更加適合演算法模型的特徵資料的過程。特徵的單位或者大小相差較大,或者某特徵的方差相比其他的特徵要大出幾個數量級,容易影響 支配 目標結果,使得一些演算法無法學習到其它的特徵。對資料進行標準化或者歸一化可解決此類現象 資料標準化 是消除變數間的量綱關係,從而使資料具有可...
機器學習 特徵工程 特徵預處理
定義 將原始資料轉換為更好地代表 模型的潛在問題的特徵的過程,從而提高了對未知資料的 準確性。內容 主要有三部分 1 特徵抽取 2 特徵預處理 3 資料的降維 特徵預處理 通過特定的統計方法 數學方法 將資料轉換成演算法要求的資料。1 包含內容 2 sklearn特徵處理api sklearn.pr...
機器學習 資料特徵預處理
資料的特徵預處理 數值型資料 標準縮放 歸一化 標準化 缺失值 類別型資料 one hot編碼 時間型別 時間的切分 歸一化處理 統計人覺得幾個特徵同等重要時,要用歸一化 目的 使得乙個特徵不會對最終結果不會造成更大影響 特點 通過對原始資料進行變換,把資料對映到 預設 0,1 之間 公式 x x ...