在tgca資料庫中乙個患者至多對應兩個樣本,但在原始選區的時候,一共是有多個樣本可以選取的,從這多個樣本中選取陰性(癌旁組織)和陽性(癌組織)最好的那個,當然,如果只有陽性或陰性的話,那麼至多只有1個樣本。如:
tgca-a6-6650-01a-11r-1174-07
tgca-a6-6650-01a-11r-a278-07
tgca-a6-6650-01b-02r-a277-07
一般我們只能看到前4組數字,即tgca-a6-6650-01a,也就是另外2個樣本被捨棄了,捨棄原則:
tgca-project名稱
a6-癌症組織名稱,具體見
6650-受試者編號(id);
01:01-09表示腫瘤;
10-19表示正常對照組;
aorb:具體不清楚,但是a好於b,所以有a的話一定會選a
後面的2組編號不再重要了,分別是
11:portion,同屬乙個患者組織的不同部分的順序編號,同一組織會分割為100-120mg的部分
r:分析的分鐘型別,具體如下:對應分析因子型別
1174:plate,在一系列96孔板中的順序,值越大製板越晚
07:測序或鑑定中心編碼
綜上,以上3個樣本優先排除第三個,至於1和2,可以繼續分析analyte,對於rna資料來說,優先順序r>t
對於dna資料來說,優先順序d最高
如果analyte相同,繼續比較plate,選擇較大者。
(後面的其實不重要,我們只需知道tgca資料庫中乙個患者至多對應兩個樣本
。
mysql的庫命名規範 資料庫命名規範(命名規則)
資料庫命名規範 引言 資料庫設計過程中庫 表 欄位等的命名規範也算是設計規範的一部分,不過設計規範更多的是為了確保資料庫設計的合理性 為了專案最終的協調穩定性,而命名規範更多的是為了確保設計的正式和統一。資料庫中欄位等等以什麼樣的命名方式,並不會直接影響到專案的穩定性。制定規範的直接目的是約束行為,...
資料庫中的命名規則
資料庫中的命名規則 資料庫涉及字元規則 採用26個英文本母 區分大小寫 和0 9這十個自然數,加上下劃線 組成,共63個字元。不能出現其他字元 注釋除外 據庫物件命名規則 資料庫物件包括表 檢視 查詢 儲存過程 引數查詢 函式 約束。物件名字由字首和實際名字組成,長度不超過30。字首 使用小寫字母。...
資料庫表的命名規範
資料檔案命名採用系統名 檔案型別,比如系統名為kupage,則資料庫檔案命名為kupage database.mdf,有的資料庫檔案有多個,比如sql server就有2個,乙個是資料庫檔案,另乙個是日誌檔案,那麼他們的檔案命名分別為 kupage database.mdf,kupage log.l...