#引用
##latex
@article
##normal
ergun gumus, zeliha gormez, olcay kursun,
multi objective snp selection using pareto optimality,
computational biology and chemistry,
volume 43,
2013,
pages 23-28,
issn 1476-9271,
(keywords: feature selection; principal component analysis (pca); mutual information (mi); genomic–geographical distance; human genome diversity project snp dataset
#摘要
biomarker discovery 生物標誌物發現
snp — single nucleotide polymorphism 單核苷酸多型性
傳統單目標 — 最大化分類準確度
1 高分類準確度#主要內容2 種族群體遺傳多樣性與地理距離的相關性
資料集:
human genome diversity project (hgdp) snp 資料集
1064個個體
52個族群
原始資料:
1043個個體
每個個體 — 660,918 snps(163來自線粒體dna,排除)— 用660,755
每個snp — 2個等位基因 — 編碼表示為:
\left\
目標一:
高分類準確度 — mutual information mi 互資訊
hh — 隨機變數的熵
目標二:
基因組地理相關性 — principal components analysis pca
由於維度較高 — 對pca使用了「維度戲法」
c
cc — d×d
d\times d
d×d維協方差矩陣
y
yy — n×d
n \times d
n×d為中心資料矩陣,n≪d
n \ll d
n≪d
k
ik_i
ki — 特徵向量i
ii兩邊同乘yyy
v i=
ykiv_i = yk_i
vi=yk
i— 協方差矩陣yyt
yy^t
yyt的第i
ii個特徵向量
兩邊同乘y
ty^t
yt可得:
多目標優化之帕累託最優
維基百科 帕累託最優是指資源分配的一種理想狀態。給定固有的一群人和可分配的資源,如果從一種分配狀態到另一種狀態的變化中,在沒有使任何人境況變壞的前提下,使得至少乙個人變得更好,這就是帕累託改善。帕累託最優的狀態就是不可能再有更多的帕雷託改善的狀態 換句話說,不可能在不使任何其他人受損的情況下再改善某...
多目標優化演算法 多目標優化之帕累託最優
example 有個求最小化的優化問題,2個變數,兩個目標函式,目標1的空間曲線如下圖所示 目標1空間曲線 目標2的空間曲線 目標2空間曲線 現在在設計空間均勻的取點陣,然後計算所有點的真實目標值,便可以得到解空間和目標空間的分布情況了,如下圖所示 左圖是解空間的均勻點陣,右圖是對應的目標空間兩個目...
多目標優化 帕累託(Pareto)
參考與這個鏈結的部落格 1 多目標優化簡介 2多目標優化數學語言描述 3 多目標優化的pareto佔優 在現實生活中有很多的問題都是由互相衝突和影響的多個目標組成,這些目標不可能同時達到最優的狀態,我們通常會盡量讓這些目標在一定的區域內達到最佳的狀態,這就是多目標優化。多目標優化問題是由多個目標函式...