讀文獻 全基因組選擇模型進展及展望

2021-09-28 12:03:23 字數 1389 閱讀 6039

隨著全基因組選擇統計模型的不斷改進優化,模型的穩定性及準確性不斷提高,但是依然面臨兩個重要的挑戰,即計算準確性和計算效率;直接法(gblup為代表)計算效率較高,但是計算準確性略差於間接法(bayesb為代表),雖然學者對直接法進行了改進,但是由於改進的策略中人為設定引數較多,因此模型的**準確性受主觀因素影響較大;間接法計算準確性較高,但是由於引數求解過程中計算量龐大,且無法實現並行運算,而育種講求時效性,所以難以高效指導育種實踐;因此,如何優化模型,盡可能減少人為設定引數,與機器學習方法有效結合,並融入高效可並行運算,既能保證較高準確性的同時,大大提公升計算效率,是未來全基因組選擇模型優化的方向。

尹立林, 馬雲龍, 項韜, et al. 全基因組選擇模型研究進展及展望[j]. 畜牧獸醫學報, 2019, 50(02):9-18.

全基因組選擇是一種利用覆蓋全基因組的高密度標記進行選擇育種的新方法,可通過早期選擇縮短世代間隔,提高育種值估計準確性等加快遺傳進展,尤其對低遺傳力、難測定的複雜性狀具有較好的**效果,真正實現了基因組技術指導育種實踐。

統計模型是全基因組選擇的核心,極大地影響了基因組**的準確度和效率。根據統計模型的不同,全基因組選擇的模型大體可分為兩大類:

直接法公式:

間接法公式:

性狀遺傳構建複雜多樣,目前還沒有一種模型能廣泛適用於所有性狀[56-57]。隨著全基因組選擇統計模型的不斷改進優化,模型的穩定性及準確性不斷提高,但是依然面臨兩個重要的挑戰,即計算準確性和計算效率;直接法(gblup為代表)計算效率較高,但是計算準確性略差於間接法(bayesb為代表),雖然學者對直接法進行了改進,但是由於改進的策略中人為設定引數較多,因此模型的**準確性受主觀因素影響較大;間接法計算準確性較高,但是由於引數求解過程中計算量龐大,且無法實現並行運算,而育種講求時效性,所以難以高效指導育種實踐;因此,如何優化模型,盡可能減少人為設定引數,與機器學習方法有效結合,並融入高效可並行運算,既能保證較高準確性的同時,大大提公升計算效率,是未來全基因組選擇模型優化的方向。

儘管測序技術對於全基因組選擇具有眾多好處,但也存在一些問題,測序技術已經經歷了3代技術革新,檢測質量及完整性越來越高,高質量的測序結果需要更高的測序深度,意味著測序成本更昂貴,並且測序資料龐大,主流的分析軟體處理速度較慢,使用複雜繁瑣,對於計算資源的配置需求較高,因此如何快速、有效地儲存、處理及分析資料是測序技術應用於全基因組育種的重要挑戰,另外,測序只能檢測參考基因組中已知的序列和基因資訊,對於未知的基因序列和基因還不能進一步深入研究。當然,隨著測序方法和晶元技術的不斷成熟,未來個體分型費用將不斷降低,分型準確性不斷提高,全基因組選擇將逐步替代傳統育種方法,為動物育種改良帶來一次新的技術革命。

線粒體和葉綠體的基因組特點 基因和基因組

基因 gene 是能夠編碼蛋白質或者rna等具有特定功能產物的 負載遺傳資訊的基本單位,即有遺傳效應的dn 段 可以理解為 gene protein rna mrna trna rrna 基因組 genome 是指乙個生物體內所有遺傳物質的總和,對於含有線粒體或者葉綠體等結構的生物來說,還包括其中的...

全基因組關聯分析(GWAS)軟體 MAGMA

magma軟體被設計用於基於基因的 gene based 或基因集的 gene set based 的關聯分析,可以直接找到與目的性狀相關的功能基因或功能模組 如基因調控通路等 也有利於發現由多個微效 snp 關聯的基因。magma 的輸入資料可以是原始的基因型資料,也可以是其它關聯分析軟體的結果 ...

全基因組關聯分析(GWAS)軟體 Tassel5

tassel 是比較經典的關聯分析軟體,但是因為執行速度沒有優勢,所以在重測序等資料量比較大的研究中不太常用。這是記錄一下tassel5 命令列進行關聯分析的過程。參考 tassel5 mlm run pipeline.pl plink ped snp.ped map snp.map kinship...