監督學習,過濾,特徵加權
第乙個問題就是,怎樣定義乙個"好的"的特徵?
首先我們尊重資料,資料是大爺,所以乙個好的特徵得到的結果應該和資料相吻合。即如果原資料中兩點相近,那麼在該特徵下兩點也應該相近。
其次,好的特徵應該能將類之間分開,那麼如果乙個特徵的跨度越到,我們認為這個特徵就就具有好的分類特性,衡量這個跨度的就是方差,所以就要有乙個大的方差。
laplacian score 的方法這樣定義乙個特徵的權重值,
其中其中t 為乙個給定值
為什麼會有sij?
我認為sij 度量的是xi 和xj 之間的距離,所以就為分析某乙個特性的時候帶入了整體感……
下面再化簡
根據乙個叫做spectral graph thery 的理論可以用對焦矩陣d來估計
所以就有
可以證明
所以所以laplacian score的演算法流程為
step1 : 用所有的資料建立乙個圖,將相鄰的兩個點相連。兩個點
是相連的,如果
step2 : 計算
。對於相鄰的兩點
其中 t是給定的乙個值,
step3 :對於第r個特徵,,
;step4 : 最後
總結:laplacian score 演算法可以說是fisher score的推廣情況。這個演算法比較有效的衡量了各個特徵的權重,優先選擇權重比較小的那些。但是這個演算法沒有衡量各個特之間相互的硬性,有可能會選取冗餘特徵。
用Margin還是用Padding
用margin還是用padding 何時應當使用margin 需要在border外側新增空白時。空白處不需要背景 色 時。上下相連的兩個盒子之間的空白,需要相互抵消時。如15px 20px的margin,將得到20px的空白。何時應當時用padding 需要在border內測新增空白時。空白處需要背...
用Margin還是用Padding
用margin還是用padding這個問題是每個學習css高階時的必經之路。css邊距屬性定義元素周圍的空間。通過使用單獨的屬性,可以對上 右 下 左的外邊距進行設定。也可以使用簡寫的外邊距屬性同時改變所有的外邊距。w3school 邊界 margin 元素周圍生成額外的空白區。空白區 通常是指其他...
用yaml寫用例
第一步 安裝yaml,在執行裡輸入 pip install pyyaml 檢驗是否安裝成功,在pycharm裡輸入 import yaml 第二步 建立乙個file,字尾寫yaml或yml 在yml檔案裡寫入單個使用者名稱和密碼 開啟yml檔案並以字典的形式列印出來 執行結果 在yml檔案裡寫入多個...