基於帕累託最優的多目標SNP選擇

2021-08-19 14:17:00 字數 1635 閱讀 3282

#引用

##latex

@article

##normal

ergun gumus, zeliha gormez, olcay kursun,

multi objective snp selection using pareto optimality,

computational biology and chemistry,

volume 43,

2013,

pages 23-28,

issn 1476-9271,

(keywords: feature selection; principal component analysis (pca); mutual information (mi); genomic–geographical distance; human genome diversity project snp dataset

#摘要

biomarker discovery 生物標誌物發現

snp — single nucleotide polymorphism 單核苷酸多型性

傳統單目標 — 最大化分類準確度

1 高分類準確度

2 種族群體遺傳多樣性與地理距離的相關性

#主要內容

資料集:

human genome diversity project (hgdp) snp 資料集

1064個個體

52個族群

原始資料:

1043個個體

每個個體 — 660,918 snps(163來自線粒體dna,排除)— 用660,755

每個snp — 2個等位基因 — 編碼表示為:

\left\

目標一

高分類準確度 — mutual information mi 互資訊

hh — 隨機變數的熵

目標二

基因組地理相關性 — principal components analysis pca

由於維度較高 — 對pca使用了「維度戲法」

c

cc — d×d

d\times d

d×d維協方差矩陣

y

yy — n×d

n \times d

n×d為中心資料矩陣,n≪d

n \ll d

n≪d

k

ik_i

ki​ — 特徵向量i

ii兩邊同乘yyy

v i=

ykiv_i = yk_i

vi​=yk

i​— 協方差矩陣yyt

yy^t

yyt的第i

ii個特徵向量

兩邊同乘y

ty^t

yt可得:

多目標優化之帕累託最優

維基百科 帕累託最優是指資源分配的一種理想狀態。給定固有的一群人和可分配的資源,如果從一種分配狀態到另一種狀態的變化中,在沒有使任何人境況變壞的前提下,使得至少乙個人變得更好,這就是帕累託改善。帕累託最優的狀態就是不可能再有更多的帕雷託改善的狀態 換句話說,不可能在不使任何其他人受損的情況下再改善某...

多目標優化演算法 多目標優化之帕累託最優

example 有個求最小化的優化問題,2個變數,兩個目標函式,目標1的空間曲線如下圖所示 目標1空間曲線 目標2的空間曲線 目標2空間曲線 現在在設計空間均勻的取點陣,然後計算所有點的真實目標值,便可以得到解空間和目標空間的分布情況了,如下圖所示 左圖是解空間的均勻點陣,右圖是對應的目標空間兩個目...

多目標優化 帕累託(Pareto)

參考與這個鏈結的部落格 1 多目標優化簡介 2多目標優化數學語言描述 3 多目標優化的pareto佔優 在現實生活中有很多的問題都是由互相衝突和影響的多個目標組成,這些目標不可能同時達到最優的狀態,我們通常會盡量讓這些目標在一定的區域內達到最佳的狀態,這就是多目標優化。多目標優化問題是由多個目標函式...