今天博主博士答辯完畢啦,超開心的,撒花~
雖然很疲憊(昨晚太晚睡了==),但想到今天跟師妹說給她gene-based關聯分析的方法。
於是,決定還是整理好了再休息休息。
好,進入主題。
之前的推文我曾經寫過使用vegas2(versatile gene-based association study)進行gene based的關聯分析研究。
但用過的人就知道,vegas2有個很明顯的缺點,跑起來很佔cpu,因此今天再重新推薦另乙個工具gcta,也是可以計算gene-based關聯分析的。
wget
解壓:unzip gcta_1.92.4beta2.zip
cd gcta_1.92.4beta2
準備summary_statistics的輸入檔案gwasp,輸入檔案gwasp包括兩列,第一列是snp的id,第二列是snp的p值(這裡顯示的是p-value)。
準備基因型檔案1000g_eur
,基因型檔案可以是公共資料庫的,比如千人基因組的。值得注意的是,你拿到的資料是什麼人群的,基因型檔案就選用相應的人群資料,比如你的資料是歐洲祖先,那麼基因型的話就選用千人基因組的歐洲祖先人群,而不是所有樣本(兩千多個)。
基因型檔案1000g_eur
為plink格式(bed,bim,fam或者map,ped),plink格式還不了解?見推文gwas分析基本流程及分析思路
準備glist-hg19.txt
檔案,格式如下所示:
準備好gwasp
、1000g_eur
和glist-hg19.txt
後,輸入如下命令:
gcta64 --bfile 1000g_eur --maf 0.01 --fastbat gwasp --fastbat-gene-list glist-hg19.txt --out gwasp_result --thread-num 10
完成以上分析後,會得到gwasp_result.gene.fastbat
的結果檔案,其示例如下所示:
今天的介紹就到這,明天有時間的話再推一篇超實用的工具!
祝各位周一愉快!
基於IP,基於port和基於網域名稱的三種
1 基於相同ip不同port的虛擬主機 2 將listen欄位改為 listen 80 listen 8888 以上設定表示使用80以及8888埠 3 更改虛擬主機部分為 documentroot var www html website1 documentroot var www html web...
基於函式的索引 建立基於函式的索引
基於函式的索引 1基於函式的索引是常規的b樹索引。2該索引存放的資料是由表中的資料應用函式後得到的,而不是直接存放表中的資料本身。3如果查詢條件包含與索引相同的函式,就可以使用基於函式的索引,提高查詢速度 舉例 測試表 create table student2 sno varchar2 10 pr...
基於Token的認證和基於宣告的標識
openid解決跨站點的認證問題,oauth解決跨站點的授權問題。認證和授權是密不可分的。而openid和oauth這兩套協議出自兩個不同的組織,協議上有相似和重合的之處,所以想將二者整合有些難度。好在openid connect作為openid的下一版本,在oauth 2.0的協議基礎上進行擴充套...