資料降維
維度:即特徵的數量
資料降維的方法有:1.特徵選擇 2.主成分分析
特徵選擇:
**例項:
from sklearn.feature_selection import執行結果:variancethreshold
defvar():
'''特徵選擇-刪除低方差的特徵 特徵減少
:return:none
'''var = variancethreshold(threshold=0.0)
data = var.fit_transform([[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]])
(data)
return
none
if__name__ == '
__main__':
var()
主成分分析pca:
**例項:
from sklearn.decomposition import執行結果:pcadef
pca():
'''主成分分析進行特徵降維
:return:none
'''pca = pca(n_components=0.9)
data = pca.fit_transform([[2, 8, 4, 5], [6, 3, 0, 8], [5, 4, 9, 1]])
(data)
return
none
if__name__ == '
__main__':
pca()
2 2 2 特徵降維(主成分分析)
import numpy as np 初始化乙個2 2的線性相關矩陣 m np.array 1,2 2,4 計算2 2線性相關矩陣的秩 np.linalg.matrix rank m,tol none import pandas as pd 從網際網路讀入手寫體識別任務的訓練資料,儲存在變數digi...
主成分分析 降維
import pandas as pd 引數初始化 inputfile data principal component.xls outputfile tmp dimention reducted.xls 降維後的資料 data pd.read excel inputfile,header none...
資料降維 主成分分析(PCA)
主成分分析 pca 是一種比較經典的降維方法,它的思想主要是將資料對映到低維空間時使得資料在低維空間的方差最大。演算法如下 python 如下,我主要使用了兩種方法特徵值分解和奇異值分解。import numpy as np import matplotlib.pyplot as plt from ...