每日文獻 2018 02 24

2021-09-29 03:41:55 字數 4338 閱讀 3975

由於最近不知不覺開始涉及群體遺傳學,所以準備精讀(其實就是原文翻譯)一篇review盡力去了解這個我陌生的領域。文章原標題為molecular signatures of natural selection, 作者rasmus nielsen。

分子群體遺傳學的其中乙個方向就是從分子變異中區分出中性變異(僅僅受到遺傳漂變的影響),找到受到選擇尤其是正選擇的變異。其中乙個重要觀點就是,中性模型通常允許強的有害突變的存在,而這些強的有害突變會降低適應度,因此會從群體中立即被清除。如果選擇僅僅包括這些非常強效應的突變,那麼伴隨群體分離的突變就只會是中性突變。因此,中性模型有普遍強的負選擇存在。但是負選擇或純化選擇也很有用,它能幫助檢測重要的功能區域或殘基,而目前大多數進化相關文獻注重於正選擇,因為它和新功能的適應和演化相關。群體遺傳學其中乙個爭論就是正選擇能多大程度上解釋種群間和種群內的變異模式

我覺得這裡作者想表達的觀點是:通常正選擇才會保留突變,而負選擇會淘汰不利突變,淘汰的突變就不能被我們所觀察到。但是中性模型卻是能夠保留負選擇的突變,那我們應該關注中性模型中那些強烈負選擇的區域,這些區域可能就有重要的功能。

過去50多年的群體遺傳學的理**獻主要集中在開發和分析模型,讓之前提到的基本雙等位基因模型一般化,能夠處理兩個以上可能分離的等位基因,處理出現的多個突變和相互作用(這可能是重組導致),處理會隨著時間發生改變的環境,以及受到各種人口因素作用導致的隨機遺傳漂變。在理論上,我們已經獲得了許多有價值的見解,比如,選擇效率不僅僅依賴於選擇係數,而主要依賴於選擇係數和有效群體大小乘積。選擇效應的提高可能是由於群體大小的增加,也可能是較大的選擇係數。其中重要發現還有,選擇衡量的產生原因有多種,不僅僅是超顯性(例如環境條件波動),因此有可能非常常見。而選擇效力會因為基因組上多個選擇位點同時分離而降低。突變之間會相互干擾,降低區域性有效群體大小。許多群體遺傳學曾經認為,保持大量選擇所需的選擇性死亡數量必須如此之大,以至於選擇可能在形成遺傳變異方面起著非常小的作用。這些引數被稱為遺傳負荷引數(genetic load arguments),有助於中性理論的發展。然而,基因組允許的選擇數量取決於突變和物種適應度以及其他重要模型假設的互動效應。在缺少來自於活著物種的真實資料前,群體遺傳理論沒有排除選擇普遍存在以及能夠單獨確定相對重要性和選擇形態(modality of selection)的可能

目前已經有了大量基因組資料集,許多理論裡的推測可以得到驗證。特別地,我們有能力檢測到新出現並具有強的選擇優勢的突變的分子印跡,因為它們已經固定,即在群體中頻率達到了1。當這些突變頻率增加時,它們會傾向於降低鄰近區域的變異,這些區域裡的中性變異會分離。這種被選擇的突變位點在固定時會降低連鎖位點的變異程度的過程就是選擇性清除(selective swepp),見圖1。也就是說可以通過分析大量比較基因組學資料集和大量snp資料集,我們就能夠同時確定正選擇和負選擇的在人類和其他物種中的位置,以及時如何影響變異。

圖1:選擇性清除在遺傳變異上的效應

自然選擇的其中乙個主要效應就是改變物種間和物種內的變異程度,見表1。選擇性清除傾向於顯著地降低中間內變異度,但是不會減少物種特異性差異(species-specific differences)。相反地,作用於多個位點地負選擇更傾向於顯著降低物種間變異度而不是物種內。表1總結了不同型別的選擇如何影響變異度。注意,單單突變率的改變將同時影響物種間(interspecific)和物種內(intraspecific)的變異度,但是影響程度不同。因此,許多常用的群體遺傳學檢測選擇的方法就是基於物種間變異的比較,其中最有名的就是hka測驗。在該測驗中,多個基因的分離多型位點的比率會用來比較。如果比率在這些基因的變化程度高於中性模型的期望值,就拒絕中性假設。

進化因子

種內變異性

種間變異性

種間/種內變異性比率

頻率譜提高變異率

提高提高

無影響無影響

負定向選擇

降低降低

當選擇不是特別強時降低

提高低頻率標記的比例

正定向選擇

提高或降低

提高提高

提高高頻率變異的比例

平衡選擇

提高提高或降低

降低提高中等頻率變異的比例

選擇性清除

降低平均替換率不變,但是提高變異

提高大多為提高低頻率變異的比例

大部分情況下,選擇會提高種群之間的分化程度。特別是最近的理論發現,選擇性清除可以極大地影響物種的細分水平(level of population subdivision), 尤其是當選擇性清除還沒有傳播到同一物種的所有種群時。當乙個座位相比較其他座位在遺傳上有異常的群體分化水平時,這個位點就可以被解釋為正選擇的證據。

其中乙個使用該現象的中性檢驗方法叫做lewontin-krakauer測驗。該測驗當種群間的遺傳分化大於專門的中性模型**值時,拒絕原假設。最近在大規模基因組資料的出現又再度以不同的形式復活。例如,akey等就檢查了人類不同種群全基因組範圍的fst變異(群體分化常用衡量指標)。beaumont和balding 開發了精巧的統計學方法用來找種群細分中可能的離群值位點。

選擇同樣也會影響中群內的等位基因頻率分布。對於dna測序或snp資料,一些很常見也有應用的測驗就是基於資訊彙總,即所謂的頻譜。頻譜就是變異數量的計數,變異表示為x(i) = i/n, i=1,2,3,...,n-1,樣本大小為n。換句話說,就是樣本中不同突變的等位基因頻率的描述性統計展示。在標準中性模型中(如隨機交配,固定群體大小。無群體細分這類模型),x(i)的期望值是1/i.有害突變的負選擇會增加該突變在樣本中低頻率分離的比例。選擇性清除在頻譜上的效應差不多相同。與之相關,正選擇會提高突變在樣本中高頻分布的比例。不同選擇對頻譜的影響見圖2:

圖2:不同選擇下的頻譜

許多經典中性測驗關注頻譜中提供的資訊。比較有名的例子為tajima』s d test。在該測驗中,配對序列的核酸差異平均數和總分離位點數相比較。如果兩個變異度測量值的差異大於基於標準中性模型的期望值,拒絕原假設。選擇性清除對tajima』s d test的影響見圖1。fu和li拓展了這個測驗,使用乙個演化上的外群(outgroup, 比如說人類遺傳變異分析的黑猩猩就是外群)來處理兩極資訊(information regarding the polarity of the information),fu又做了更多的優化。fay和wu提出的乙個測驗,提高了突變引起的高頻資訊的權重。奇迄今位置,這些測驗大多是應用比較多中性測驗。

選擇性清除產生的變異模式是非常複雜的空間模式(圖1)。中性測驗的功效會因加入選擇性清除的模式而提高,甚至找到選擇性清除的位置也是可能的。kim和stephan基於明確的群體遺傳學選擇性清除模型建立了乙個模型。利用這個模型,他們可以計算出乙個位點的期望頻譜,作為其與有利突變距離的函式。通過使用資料對該模型進行擬合,他們就能估計出選擇性清除的位置和強度,以及基於該選擇性清除的假設性檢驗。這個方法特別的使用,因為它考慮到了選擇性清除在序列上留下的空間模式。

連鎖不平衡(linkage disequibibrium,ld)水平也就是不同位點的等位基因的相關性,會在選擇區域中增加。處於平衡選擇區域中的古老多型性位點會降低ld,但在瞬時相位(transient phase)時的多型性位點可能會提高ld。同樣選擇性清除在瞬時相位時也會提高ld水平,但是這階段會相對比較短。近期,大家逐漸認識到不完全的清除(當適應性突變尚未在群體中完全固定時)會在單倍型結構中留下不同的模式。這就使得許多基於ld的選擇檢測的統計學方法被開發出來。hudson發展出基於出現在乙個樣本的等位基因數目的測驗。andolftto發展出相近的測驗,確定是否連續性變異位點的任意子集裡得單倍型都比中性模型的期望值要少。depaulis 和veuille也提出相似的測驗。在該主題下,sabeti提出的方法有一些變化,他考慮到遠離潛在選擇性清除位置的不同單倍型數目會增加。kelly考慮了配對座位的相關水平。kim和nielsen拓展了kim和stephan的方法(前面的選擇性清除模型),加入配對位點去整合了連鎖不平衡的資訊。

最後,macdonald-kreitman測驗探索了來自編碼區位點的兩類突變:非同義突變和同義突變。對資料進行彙總得到了macdonald-kreitman**,包括物種內和物種間的同義突變和非同義突變的計數。如果選擇只影響非同義突變,負選擇會降低非同義突變的數量,相對於同義突變正選擇會提高非同義突變的數目。然而,分歧資料中的效應強於多型性資料。所以,就能基於物種內和物種間的同義突變和非同義突變的比率建立類似於hka測驗的測驗。如果這些比率差異顯著,就提供了選擇的證據。

每日文獻 2018 01 10

為了能夠適應環境,植物需要監控自身的代謝途徑,能夠符合當前的生長和防禦。初期代謝產物可以通過遍在保守tor target of rapamycin 通路進行衡量,在有限的能量和影響下平衡生長和發育之間的關係。最新的工作表明,植物能夠先估計防禦性代謝產物,制定好某些策略從而快速將資源重定位到植物生長和...

每日文獻 2018 01 12

每到年終大家都愛做總結,除了我在每日文獻 2018 01 08提到的比對工具年鑑更新到了2017版,各大生物資料中心也開始紛紛做總結,然後發一篇核酸研究nar.這三篇文章的標題和位址如下 地點資料庫名 原文標題 美國ncbi database resources of the national ce...

每日文獻 2018 01 29

這是一篇發表在 briefings in bioinformatics 的文章,這篇文章最大的亮點在於,作者只有乙個人,但是在摘要裡面,他可能害怕寂寞,於是在摘要裡我見到了 we,而不是i,或許他乙個人就是乙個團隊吧。這篇文章的工作等同把乙個公司的流程拿出來發,我們來比較一下公司的流程和他的流程 文...