基於帕累託最優的多目標SNP選擇

#引用

##latex

@article

##normal

ergun gumus, zeliha gormez, olcay kursun,

multi objective snp selection using pareto optimality,

computational biology and chemistry,

volume 43,

2013,

pages 23-28,

issn 1476-9271,

(keywords: feature selection; principal component analysis (pca); mutual information (mi); genomic–geographical distance; human genome diversity project snp dataset

#摘要

biomarker discovery 生物標誌物發現

snp — single nucleotide polymorphism 單核苷酸多型性

傳統單目標 — 最大化分類準確度

1 高分類準確度

2 種族群體遺傳多樣性與地理距離的相關性

#主要內容

資料集：

human genome diversity project (hgdp) snp 資料集

1064個個體

52個族群

原始資料：

1043個個體

每個個體 — 660,918 snps（163來自線粒體dna，排除）— 用660,755

每個snp — 2個等位基因 — 編碼表示為：

\left\

目標一：

高分類準確度 — mutual information mi 互資訊

hh — 隨機變數的熵

目標二：

基因組地理相關性 — principal components analysis pca

由於維度較高 — 對pca使用了「維度戲法」

cc — d×d

d\times d

d×d維協方差矩陣

yy — n×d

n \times d

n×d為中心資料矩陣，n≪d

n \ll d

n≪d

ik_i

ki — 特徵向量i

ii兩邊同乘yyy

v i=

ykiv_i = yk_i

vi=yk

i— 協方差矩陣yyt

yy^t

yyt的第i

ii個特徵向量

兩邊同乘y

ty^t

yt可得：

多目標優化之帕累託最優

維基百科帕累託最優是指資源分配的一種理想狀態。給定固有的一群人和可分配的資源，如果從一種分配狀態到另一種狀態的變化中，在沒有使任何人境況變壞的前提下，使得至少乙個人變得更好，這就是帕累託改善。帕累託最優的狀態就是不可能再有更多的帕雷託改善的狀態換句話說，不可能在不使任何其他人受損的情況下再改善某...

多目標優化演算法多目標優化之帕累託最優

example 有個求最小化的優化問題，2個變數，兩個目標函式，目標1的空間曲線如下圖所示目標1空間曲線目標2的空間曲線目標2空間曲線現在在設計空間均勻的取點陣，然後計算所有點的真實目標值，便可以得到解空間和目標空間的分布情況了，如下圖所示左圖是解空間的均勻點陣，右圖是對應的目標空間兩個目...

多目標優化帕累託（Pareto）

參考與這個鏈結的部落格 1 多目標優化簡介 2多目標優化數學語言描述 3 多目標優化的pareto佔優在現實生活中有很多的問題都是由互相衝突和影響的多個目標組成，這些目標不可能同時達到最優的狀態，我們通常會盡量讓這些目標在一定的區域內達到最佳的狀態，這就是多目標優化。多目標優化問題是由多個目標函式...

基於帕累託最優的多目標SNP選擇

多目標優化之帕累託最優

多目標優化演算法 多目標優化之帕累託最優

多目標優化 帕累託（Pareto）

相關推薦

多目標優化演算法多目標優化之帕累託最優

多目標優化帕累託（Pareto）