python與醫學統計 醫學統計思維 資料庫

2021-10-12 11:14:32 字數 1223 閱讀 2197

資料分析是統計中最常用的技能,但是資料從何而來,許多是根據乙個想法臨時收集,這個想法**可能是仙人指路,也可能是自己閱讀文獻或是臨床實踐的靈光一閃,又或者是突發奇想,然後想驗證一下。無論哪一種,都是正向思維,由想法到資料收集,但許多人是沒有仙人指路的,也沒有大量閱讀文獻的技能與習慣,也缺乏敏銳的洞察力。

在讀研時,由於畢業**需要,我收集了1個小方向的資料庫,大概300~400的樣子,拿這個畢了業,再畢業一年後,乙個師妹找到我,需要當時的資料庫,因為統計套路有了,想法有了,可是沒有資料,又由於疫情原因,無法到醫院自己收集,進度、速度大大受阻。此時我也正在學習資料探勘,回看自己當時的做的資料庫,漏洞百出、粗製濫造,原因很多,比如源頭資料的不準確、源資料無法溯源、建庫思路模糊、資料改動無記錄、無區分都影響了資料庫的再次開發利用。正在學習資料探勘的我也面臨一些問題,由於積累不夠,還沒有建立乙個對臨床科研系統的認知觀,正向思維下我無法開展工作,正向的思維需要乙個明確的研究假設,然後開題,進行資料收集,最後通過資料分析驗證假設。舉個例子,正向思維就像挖x礦,你首先要找乙個地方,然後開始挖洞,驗證是否真有乙個x礦。這對你的勘探定位能力要求很高,需要大量的經驗積累,你才有能力找到乙個可能有x礦的地方。但是目前我還不具備這種能力。

怎麼辦呢,坐以待斃嗎?我喜歡拆東西,以前有個詞叫山寨,換到工業界叫逆向工程/逆向製造。

有正向思維,也就有逆向思維。

逆向思維更加適合小白的情況,沒有明確的方向,但是先把資料收集起來,然後通過對比資料,統計分析,發現規律,提煉假設,就想礦石精煉一樣,但是我也不知道最後練出來什麼礦,也許是金礦,也許是煤礦。正向、逆向,沒有好壞之分,第一種方式比較適合王者段位的玩家,對資源、技術、意識要求較高,第二種方式更適合青銅玩家。反觀我建立的第乙個庫,我獲得哪些經驗呢?

1. 沒有研究該領域的高分文章,收集的變數不全。

2. 沒有隨訪工作,單薄的資料,缺少了時間的可能性。3. 建庫過程缺少記錄。4. 研究有回顧研究也有前瞻研究,建庫也有回顧建庫與前瞻建庫,沒有持續做下去改進。臨床工作是繁瑣的,建庫工作也不是乙個人能完成的,最理想的模式是研究生進行錄入工作,上級醫生負責質控。醫院的資訊化建設也是助力,所有資料之源是初始錄入,如何規範是學習、協調的工作,如何提取是乙個技術手段,r語言、python可以做資料清洗,但是清洗工作是依據特徵進行的,就想限制性內切酶,需要特定序列,進行提取,這個又回到初始錄入工作了,怎樣給關鍵資訊打標,以便以後補錄工作順利高效,需要學習資料清洗,最簡單的,excel是怎麼拆列的。

成長很慢,現在才有一點點想法,希望有一天實現專業方向臨床、標本、組學三庫合一。我也在一點點進行

醫學統計學基礎 第一講

1 簡單幾何平均數 2 加權幾何平均數 應用 例 假定某地儲蓄年利率 按複利計算 5 持續1.5年,3 持續2.5年,2.2 持續1年。請問此5年內該地平均儲蓄年利率。解 由得到該地平均儲蓄年利率 3 幾何意義 算術平均數,體現純粹數字上的關係 而 稱為幾何平均數,這個體現了乙個幾何關係。2 作一正...

醫學統計學學習記錄之t檢驗應用

t檢驗有如下幾種 1 單樣本t檢驗 one sample group t test 使用場合 如已知一般脂肪肝疾患的健康人群尿素氮均值 測得20名脂肪肝患者的尿素氮值,檢驗脂肪肝患者的尿素氮值是否高於健康人群?2 配對樣本t檢驗 2.1 自身配對 1 同一受試物件給某種處理前後對比 推斷某種處理有無...

AI與醫學輔助診斷

人工智慧一詞越來越頻繁的出現在日常生活中。一種事物的時髦,必然有其背後的原因。而對於這樣乙個大的話題,從整體上來敘述總顯得有些不接地氣。作為跟ai沾過一些邊的博主將以自己接觸的方面來發表一點看法。首先介紹一下,博主在研究生期間從事醫療數字影像研究和醫療系統開發,期間跟臨床醫生也有過一些交流,研究生課...