求離散資料的突變點 突變的效應分布 DFE

2021-10-12 06:25:02 字數 3419 閱讀 1050

適應效應分布distribution of fitness effects, dfe是描述群體中有利突變、中性突變和有害突變的佔比。

不同物種的dfe分布形狀不同,受到物種群體大小和基因組大小的影響。

編碼區dna和非編碼區dna的dfe的分布性狀也不同。

有利突變是極少的。

強有利突變的dfe呈指數分布。

有害突變的dfe比較複雜,通常是多峰分布。

突變型別一般分為三種:有害突變,中性突變和有利突變。但是實際上,突變的效應並非是離散分布的,而是連續的,極度有害 -> 弱有害 ->中性 -> 弱有利 -> 強有利,這種突變效應的連續分布頻譜就是突變的效應分布dfe

與父母相比,我們每個人大概產生100個新突變,那麼這些突變是有害的?還是有利的?從進化生物學的角度來說,dfe能夠幫助我們理解分子鐘、遺傳變異的維繫等一系列問題。

從定量遺傳學來看,乙個性狀對應的遺傳結構取決於自然選擇和dfe。如果該性狀主要受到大效應的中頻位點控制,我們能夠很容易地定位對應的基因位點;反之,如果性狀受到低頻位點或者小效應的中頻位點的控制,那麼定位這些位點就非常困難了。

研究dfe最直接的方法就是誘導生物的自發突變,然後在實驗室條件下測定這些突變的效應大小。但是這麼做的前提是這些突變效應要足夠大,否則很難測量到。

【實驗室條件下,病毒的dfe分布,適應性<1意味著是有害突變,>1表示有利突變。上圖可以看出,大部分突變是有害突變,還有很多致死性突變(適應性=0)】

另一種研究方法是通過突變累積實驗mutatin accumulation,實驗群體在實驗室環境下培養多代,群體保持較小的數量,以便將自然選擇的效應最小化,在遺傳漂變的作用下,有害突變也可以在群體中累積。之後比較突變累積群體的適應性和祖系群體的適應性差異。通常突變累積群體的適應性會逐漸下降。但是突變累積實驗得到引數的置信區間很大。突變率和突變的效應大小共同決定了dfe

此外,上述兩種方法(誘發突變和累積突變)得到突變dfe可能不相同。而且僅僅根據適應性來判斷突變效應往往只是觀測到了突變效應較大的位點,很多突變效應較小的位點可能無法觀測到。所以,通過比對dna序列來推測突變的效應更合適。當然,使用dna序列推測dfe也有侷限性,比如需要選擇合適的中性位點做參比,位點之間的關聯性問題等。

dfe的gemma分布,該分布有兩個引數:形狀引數和均數引數。上圖是當均數為1時,不同值對應的分布性狀。時,分布呈「l」型,是為指數分布,時趨向於正態分佈。】

首先要搞清楚的是「中性」的定義,幾乎所有的突變都會帶來適應性改變(哪怕是非常非常小的改變),嚴格上來說沒用中性突變。但是,在特定的群體中,受到遺傳漂變的作用,當遠遠小於1時,我們可以認為這些突變是中性突變。所以對「中性」的定義並非根據其功能,而是根據其在群體中的表現。

因此,乙個群體的有效群體數量越大,其中性突變的比例越低,反之,越高。此外,群體越大,自然選擇識別度越高,有利突變更容易在群體中固定,隨著適應性逐漸向最適生態位靠近,其dfe也會相應的改變。

通過蛋白編碼序列的分析,有一些非同義突變表現為中性。通過比較不同物種之間的非同義位點和同義位點,可以推測乙個物種非同義突變位點中表現為中性位點的數量。比如在人類中,有效群體數量在10000-30000之間,其之比略小於0.3,也就意味著有接近30%的非同義突變表現為中性。在果蠅和細菌中,分別有16%和2.5%的非同義位點表現為中性。考慮到這些生物的有效群體數量比較大,出現較少比例的中性位點也是合理的。

一直以來,人們認為在dna的非編碼區中,變異都是中性的。但是很多研究發現,非編碼區的序列比預期的要保守。比如在果蠅中,有超過50%的位點可能首先自然選擇的影響。

相比於中性突變,有利突變的數量要少很多。在病毒中有4%的突變是有利突變,大腸桿菌中是0%,噬菌體中有0-15%。雖然有利突變比較少,但是它們對進化的貢獻還是很大的,比如在果蠅中,有15%的核酸替換(進化)是有有利突變導致的。

不同大小的群體,其有利突變的dfe也不相同。比如,在人類和黑猩猩的蛋白編碼序列,適應性非同義替換位點的比例幾乎為0,而在果蠅物種中,這一比例可達50%。在非編碼序列,果蠅中的適應性非同義替換比例同樣比人類/黑猩猩多。

那麼有利突變的dfe到底是如何分布的?有一種理論是極值理論,認為有利突變的dfe是指數分布。但是該理論的假設是在進化過程中,dfe維持不變。如下圖(a):

【有利突變dfe分布的兩種模型】

但是,有對rna分子的變異研究發現有利突變dfe在進化過程中是不斷變化的,如上圖(b),隨著趨近最適生態位,群體中總是保持一定的弱有利位點,所以dfe的分布應該是「l」 型的。

相比於上述有利突變dfe的指數型或者「l」 性分布,有害突變的dfe要複雜很多,通常不是單峰分布。有害突變中包含一部分致死性突變。在病毒實驗中,有40%誘導突變是致死性突變,在酵母中,也有30%-40%的突變是致死的。

對於有害突變的dfe,有乙個峰靠近於中性突變,即說明大量的輕微有害突變;另乙個峰則源於致死性突變(如本文的第一張圖)。

有害突變dfe的複雜性源於其不同位點的有害程度不同。比如,非同義位點的dfe可能和非編碼區的dfe不同,點突變的dfe可能與轉移元件插入造成的dfe不同。這些不同**的dfe綜合起來,表現出其整體複雜性很高。

對於輕微有害突變而言,由於其適應性效應很小,其dfe分布通常通過比對dna序列推測。在非蛋白編碼區,研究同樣發現大量的輕微有害突變。

不同物種的dfe不同。群體大小不同,中性位點的比例不同。有利突變的dfe分布比較簡單;但是有害突變dfe分布比較複雜,不同基因功能區的dfe分布也不相同。

dfe雖然複雜,如果我們有足夠的測序資料,dfe是可以測量的。

如何應對天氣的突變

全球變暖已經是個不爭的事實,即使是在偏北的天津,對熱字的理解也決不比在深圳時差。所以先是習慣了深圳的酷暑與汽車尾氣之後,輾轉來到天津又再次習慣了天津不同於華中和華南的寒冷,於是到了現在。現在氣候很不一般,在太陽下活動數分鐘之後,估計體內會產生大量急需排除的熱毒 而排除熱毒的方法分內外兩種。先講外法。...

雙基因突變患者 我的肺癌沒有基因突變,這是好是壞

我的肺癌沒有基因突變,這是好是壞?問題的答案顯然不會是 好 還是 壞 這麼簡單。我們當然知道大多數患者在迫切想知道答案的同時,卻沒有額外的精力去學習癌症診治的知識。但是,用 好 和 壞 這種非黑即白的方式理解世界總會遇到瓶頸。所以,在真正回答問題之前用基本事實構建乙個簡單的邏輯 事實1腫瘤是體內細胞...

突變 mongoose os的系統配置API改變

breaking sys config api change fields directly,e.g.instead of get cfg update.timeout it should be mgos sys config get update timeout to get the curren...