每日文獻 2018 01 10

2021-09-20 02:02:33 字數 1871 閱讀 9771

為了能夠適應環境,植物需要監控自身的代謝途徑,能夠符合當前的生長和防禦。初期代謝產物可以通過遍在保守tor(target of rapamycin)通路進行衡量,在有限的能量和影響下平衡生長和發育之間的關係。最新的工作表明,植物能夠先估計防禦性代謝產物,制定好某些策略從而快速將資源重定位到植物生長和發育的位置。當然,這種機制肯定還沒有完全研究清楚,所以作者才寫了這篇文章。作者使用了glucosinolates,硫代葡萄糖苷,一類重要的植物防禦性代謝產物做了這項研究。他們發現了乙個和硫代葡萄糖苷完全不同的乙個新的訊號屬性(signaling properties),並且在植物和真菌中都有,叫做3-羥丙基芥子油苷(3-

hydroxypropylglucosinolate)。該防禦性代謝產物,或者說獲得性成分(derived compounds),能夠可逆地抑制植物的根部生長和發育。3-羥丙基芥子油苷訊號通過古老的tor通路裡的基因發育發揮功能。如果該事件不是特異的,那麼就說明會有其他在進化上比較新的植物代謝物和古老的訊號通路相連。

在每日文獻:2018-01-06中,我提到老闆讓我讀的文章裡的chip-seq找peak是作者他們自己寫指令碼完成的,但其實在2年前的2023年劉小樂實驗室就發了chip-seq找peak的工具,也就是大家耳熟能詳的macs(目前是macs2)。

chip-seq儘管有很多好處,但是也有幾個問題不得不說

macs包聲稱能夠搞定解決以上問題,這裡看下他們的模型的設計思路。

閱讀下文前,請記住當年基本都用單端測序, 測序長度大概為50bp。

chip-seq得到的read是chip dna文庫片段裡的末尾,為了更好的表示蛋白-dna結合位點,通常要往3'端偏移一定距離。這個距離是多少,大多是不知道的,所以我在每日文獻:2018-01-06看到他們根據經驗全部偏移到130bp。

但是由於chip-seq的文庫片段兩端被測序的概率相同的(當時是單端),也就是真實的結合區域上的reads會形成雙峰(bimodal enrichment pattern),也就是waston鏈會在上富集,crick鏈會在下游富集。

左:macs找到的d;右:fkhr motif驗證

於是作者根據超聲打斷的平均條帶長度(bandwidth)和高可信度倍數富集區域(mfold)在全基因組上以2_bandwidth_進行掃瞄,找到盡可能可信的mfold,選取這些片段計算雙峰距離(d), 最後read的偏移距離就是d/2.

我的問題是,現在pe150bp還需要考慮這個read偏移嗎?

如果有對照,macs會把對照組的reads count縮放(scale)為chip-seq tag count一樣多. 並且macs會根據測序深度(二項分布p值<10e-5)自動去重.

作者用泊松分布對read進行建模, 在染色體上以2 d(雙峰之間距離)為windows,以偏移以後的reads作為輸入,尋找可能的peak,並且peak裡要有足夠富集的reads. 當然和我之前讀的文獻裡簡單粗暴的把lambda設為區域性的平均深度(即所有鹼基的覆蓋深度除以鹼基總數)不同, 作者觀察到read的分布式存在區域性波動和偏差的,比如說所用的foxa1的候選peak裡, read count在chip和對照組之間是相關的. 這可能是區域性染色質結構,dna擴增和測序偏差和拷貝數變異所引起.

作者就想到了使用動態的 local lambda進行優化.

公式最後的多重實驗矯正(fdr),作者使用的是之前chip-chip peak finder工具mat和ma2c.

每日文獻 2018 01 12

每到年終大家都愛做總結,除了我在每日文獻 2018 01 08提到的比對工具年鑑更新到了2017版,各大生物資料中心也開始紛紛做總結,然後發一篇核酸研究nar.這三篇文章的標題和位址如下 地點資料庫名 原文標題 美國ncbi database resources of the national ce...

每日文獻 2018 01 29

這是一篇發表在 briefings in bioinformatics 的文章,這篇文章最大的亮點在於,作者只有乙個人,但是在摘要裡面,他可能害怕寂寞,於是在摘要裡我見到了 we,而不是i,或許他乙個人就是乙個團隊吧。這篇文章的工作等同把乙個公司的流程拿出來發,我們來比較一下公司的流程和他的流程 文...

每日文獻 2018 01 07

一圖了解常用測序及其適用範圍 所謂 遇事不決先測序,經費太多測個序 反應的就是當前測序的火熱程度。測序方法大多使用縮略語,比如說家耳熟能詳的rna seq,chip seq和最新火起來的atac seq。但是大家有沒有想過,當你們說rna seq時,未必指的是相同乙個生物學問題,有人可能是是定量,有...