12 3日周二學習筆記

2022-05-09 03:30:09 字數 3135 閱讀 3080

1.在看imputation的樣例**

測試損失是怎麼得出來的呢?將x輸入進模型,並且**出了x',那麼此時就可以根據loss函式來計算了,包括重建的概率損失,以及隱空間變數和庫大小變數的kl散度。

那麼imputation它是如何進行的呢?檢視**後我發現了,首先從資料集中載入已經擾亂過的資料:

通過擾亂資料訓練模型,並且測試資料使用的是原始資料:

# start a new fresh model on a corrupted training set:

在train_model類中,訓練是通過擾亂資料,

其中評估imputed資料是:

這樣輸入的**x_zero對應的資料,並且傳入原始資料exp_train,以此來計算出填充錯誤。

我認為是對rate_和exp_train對應的i,j行計算imputed損失。

總之,先使用x_zero訓練模型,並給出x_zero的結果,再和原始資料計算l1距離的中值作為損失。

#但是還是難以接受,直接擬合分布,就算資料出現插補也是ok的?難以接受。但是補充不都是以當前資料去補充當前資料嗎,沒問題的。

2.對cortex的資料集的sv同樣進行了分析,發現是一樣的道理。

對擾亂資料建立模型,之後會得到擾亂資料的vae結果,因為之前使用了擾亂資料訓練,所以會自動進行填充,然後和原始資料計算error。

3.np.nonzero的例子

import

numpy as np

x=np.array([1,2,3,0,12,14]).reshape(2,3)

print

(x)print

(np.nonzero(x))

#輸出:

[[ 1 2 3]

[ 0 12 14]]

(array([0, 0, 0, 1, 1], dtype=int64), array([0, 1, 2, 1, 2], dtype=int64))

這裡輸出是兩個list,分別指示行和列,一 一對應的關係。

要注意得到的兩個list長度是相同的,就是非0元素的個數。

#反應過來之後,感覺真是厲害。

#我還以為輸出的直接是(i,j)這樣子的。

4.高斯核密度估計

(待看)

5.負對數似然

(待看)

7.接下來看差異表達分析!

假設檢驗什麼的我最不明白了。

差異表達分析應該是對不同的細胞型別來說的吧?這篇文章的意思是直接對表達矩陣建模???

不的,是對不同的細胞型別找出de基因的。

嘗試理解這兩個假設檢驗的例子:

fw函式是計算每個cell中細胞的表達佔比,是通過softmax層輸出的,那這裡fgw是針對其中乙個gene,

#那這裡的s是對當前cell所標識的batch,還是對所有的batch呢?我目前認為是前者。但是後者也有可能,是它忽略了batch,因為就算不同的batch也有可能是相同的cell型別。

如果對所有batch來說,當前gene的均值在當前細胞型別za中 大於 另一cell型別,那麼就接受原假設,當前g是差異表達基因,反之如果≤就不是???

es是根據經驗頻率得出的。

#明白了一點,它不需要校正細胞的批次,而是對es這樣求期望,就忽略批次,而能夠得出差異表達的gene。

8.轉錄組差異表達分析

似乎也沒什麼用。

9.貝葉斯檢驗的書部分介紹

但是這本書講的也太抽象了。

10.貝葉斯假設檢驗

貝葉斯假設檢驗的總體步驟:

總之要計算原假設的後驗概率和備擇假設的後驗概率,然後求二者之商。

11.對後驗積分的理解

左邊是原假設的後驗概率,右邊是對所有批次的類別細胞,za和zb應該是兩個不同的cluster的,首先對於乙個za,

p(s)是每個批次中的細胞相對豐度。#目前還對這個公式啥意思完全不明白。

對每乙個基因g和細胞對(za,zb),觀測到的基因表達為(xa,xb)並且批id為(sa,sb)。

12.搜尋關鍵字「貝葉斯檢驗 差異表達」,結果不佳。

13.通過在給的實驗說明中,理解了一點:

從訓練有素的vae模型中,我們可以取樣每個細胞中每個基因的基因表達率。 然後,對於兩個感興趣的種群,我們可以從每個種群中隨機抽取一對細胞,以比較它們在乙個基因中的表達率。差異表達的程度通過logit(p /(1-p))進行度量,其中p是種群a中的細胞表達高於種群b中的細胞的概率。我們可以形成de值的零分布 通過從組合人口中隨機抽取配對。

上面所說的p就是原假設h1。

再看basic教程,講解如何確定de基因,首先選定感興趣的細胞型別。

10月26日 周二 晴

天氣預報說今天有颱風,天氣將降溫。一早醒來,風和日麗,陽光明媚,是否是山雨欲來風滿樓?心情很是惆悵,雖然考完試了,輕鬆了不少,但是生活依舊煩悶,雖然每天仍是笑聲爽朗。我離開了莊,儘管不捨,但仍是義無反顧。每每想起心便是鈍鈍的疼,我是個好女孩,但是為何幸福離我那般遠?人是不是都很賤,容易到手的東西就是...

Adobe仿效微軟 實施「周二補丁日」

近期發生了很多利用adobe reader和acrobat中的安全漏洞實施攻擊行為的事件,更有安全研究人員建議使用者放棄使用reader和acrobat選擇其它pdf閱讀器,面對嚴峻的局面,adobe公司決定改變其補丁修復的操作方式。今天adobe表示,公司計畫更頻繁地對系統進行安全公升級,並即時發...

2023年8月微軟「周二補丁日」

2017年8月8日,微軟在補丁日為48個cve漏洞發布了補丁。相對於7月來說,本次發布的補丁涉及到的漏洞相對較輕微。在48個cve漏洞中,總共有26個cve被評為 關鍵 21評分為 重要 和1評級為 中等 在所有這些漏洞中,軟體和服務的 安全更新包括 26個cve中的18個評級為 嚴重 影響micr...