比如區分金毛和吉娃娃,他們都是狗狗,他們有的特徵為:身高、耳朵大小、毛素、體重大小等等,這些定性的描述就是特徵
機器在學習過程中,需要對資料維度降維,
(1)提高機器學習速度,較少過擬合
(2)使模型泛化能力更強
(3)增強對特徵和特徵值之間的理解
1.定性的特徵,需要轉化為定量的特徵才能使用
2.方差小的資料,沒什麼用,多選擇離散程度大的變數
3.去無意義、重複性、避免複雜的資料
filter方法:
主要思想是:對每一維的特徵進行「打分」,即給每一維的特徵賦予權重,這樣的權重就代表著該維特徵的重要性,然後依據權重進行排序。主要的方法是:chi-squared test(卡方檢驗),information gain(資訊增益),correlation coefficient scores(相關係數)
其主要思想是:將子集的選擇看作是乙個搜尋尋優問題,對組合進行評價,再與其他的組合進行比較。這樣就將子集的選擇看作是乙個優化問題,這裡有很多的優化演算法可以解決,齊次是一些啟發的優化演算法,如ga,pso,de,abc等。主要方法有:recursive feature elimination algorithm(遞迴特徵消除演算法)
embedded方法:
其主要思想是:在模型既定的情況下學習出對提高模型準確性最好的屬性。其實是講在確定模型的過程中,挑選出那些對模型的訓練有重要意義的屬性。主要方法有:正則化,嶺回歸就是在基本線性回歸的過程中加入了正則項。
C 十分好用的Qt的多執行緒
1 先看一些執行緒相關的類 qthread 提供了開始乙個新執行緒的方法 qthreadstorage 提供逐執行緒資料儲存 qmutex 互斥鎖qmutexlocker 自動鎖 在建構函式中自動對mutex進行加鎖,在析構函式中進行解鎖。需要用到mutable在const函式中修改被定義的非con...
心理正常與異常的區分 怎樣區分心理正常與異常
郭念鋒 1986 認為區分心理正常與異常,具體標準一時難於確定,但基本原則是可以說清楚的。根據心理學對心理活動的定義 心理是客觀現實的反映,是腦的機能 從心理學對人類心理活動的定義出發,結合心理活動的特點,明確提出區分心理正常與異常的三原則。第一,主觀世界與客觀世界的統一性原則。因為心理是客觀現實的...
怎樣區分一款虛擬主機的好壞
然後回車,便得到你從中國訪問微軟的伺服器的回應時間。一般,ping 命令會自動進行下去,直到你讓它終止,如敲 ctrl c 如果你熟悉使用telnet中ping的功能,並且你具有在不同網路上的telnet帳號,你就可以以不同的網路為基礎,對其他的主機 ip位址或網域名稱 進行ping的測試,你可以比...