深度醫療 3 基於深度學習肺部病變診斷識別

2021-09-17 19:59:27 字數 2402 閱讀 6530

深度醫療是筆者基於深度學習的醫學專案應用開發實踐,經過整理輸出了文件和本系列課程,希望通過分享可以和大家共同討論、相互學習,探索更好的解決方案。筆者是一名普通的大資料和人工智慧領域從業者,過程中如有錯誤和理解不到位的地方請廣大同仁不吝賜教。筆者一直堅信深度學習和醫學的有機結合一定能碰撞出效能強大的深度醫療系統,服務大眾。

深度醫療(3) - 肺部病變診斷識別

本文主要介紹了通過深度學習進行肺部病變識別的應用,首先簡單介紹了影像學醫學背景和相關知識,接著介紹了目前能獲得的公開的肺部病變資料集,最後介紹了神經網路的實現方式和處理後的效果以及效能分析,其中涉及到了多特徵識別的問題。

1.概述

背景胸部x射線檢查是最常見和最具成本效益的檢查之一。醫學影像學檢查。然而,胸部x射線的臨床診斷是具有挑戰性的,有時被認為比胸部ct成像更難診斷。

如何利用醫院的知識庫,並通過深度學習訓練這些寶貴的影像,以建立真正大規模的高精度電腦輔助診斷,是現在乙個非常前沿的課題。

影像學影像學不僅擴大了人體的檢查範圍,提高了診斷水平,而且可以對某引些疾病進行**。這樣,就大大地擴充套件了本學科的工作內容,並成為醫療工作中的重要支柱。自倫琴2023年發現x線以後不久,在醫學上,x線就被用於對人體檢查,進行疾病診斷,形成了放射診斷學的新學科,並奠定了醫學影像學的基礎。至今放射診斷學仍是醫學影像學中的主要內容,應用非常的普遍。

2.資料集

資料是從美國國立衛生研究院臨床中心臨床pacs資料庫中提取的,其中正前位的胸片佔醫院所有正前位胸片總數的60%。因此,這個資料集更具代表性。

資料集包括112120張前檢視x射線影象,分別對應14個疾病影象標籤。

其中包括14種常見的肺部病理:肺不張(atelectasis)、實變(consolidation)、浸潤(infiltration) 、氣胸(pneumothorax) 、水腫(edema) 、肺氣腫(emphysema) 、纖維化(fibrosis) 、滲出(effusion) 、肺炎(pneumonia) 、胸膜增厚(pleural thickening) 、心肥大(cardiomegaly) 、結節(nodule) 、腫塊(mass )、疝氣(hernia) 。

3.資料提取

資料是png格式,每個大小是1024 * 1024的解析度;

4.神經網路結構

神經網路採用了dense net進行處理,主要有三層dense net進行級聯,每個dense net包括4個block,每個block包含batch_norm、relu、cnn、dropout模組,特別要提出的是最後的合併concat不是相加,而是通過連線的方式處理的。

5.多特徵判別

一張xray的影象有可能包含一張病變,也有可能包含多個病變,例如某個病人只有肺炎一種病,但另外乙個病人可能同時有肺氣腫和胸膜增厚兩種病,甚至有些病人同時患有三種以上的病;這個時候就出現了多特徵的判別的問題:

6.結果分析和系統優化

誤差收斂曲線

精度曲線

因為乙個病人的一張x片可能對應幾種病變,這個系統不是單一的分類問題,是乙個多分類問題,所以前面採用了sigmoid取代了softmax作為輸出的判別,但我們忽略了乙個問題,這種多分類問題需要有乙個置信區間,因為從原理上來說,神經網路在做**的時候是不知道這個x片到底對應幾個病變的,所以我們需要給乙個置信區間,在訓練的時候滿足這個置信區間。

7.存在的問題和後續優化方案

原始的解析度很高(1024x1024),為了提高處理速度,神經網路中reshape成了128x128大小的,相對影象資訊損失較大,可以通過修改網路輸入的大小把輸入reshape成解析度更高,從而來提高系統的精度;

通過優化網路結構,例如加深dense net或加入其它網路,類似residual net進行處理;

對輸入的原始資料進行預處理,通過剪裁、翻轉等方式增加訓練資料的資料量;

基於深度學習的NER

命名實體識別 ner 是在自然語言處理中的乙個經典問題,其應用也極為廣泛。比如從一句話中識別出人名 地名,從電商的搜尋中識別出產品的名字,識別藥物名稱等等。傳統的公認比較好的處理演算法是條件隨機場 crf 它是一種判別式概率模型,是隨機場的一種,常用於標註或分析序列資料,如自然語言文字或是生物序列。...

基於遙感背景的深度學習探索 深度學習簡介(一)

深度學習,我起初對其感覺既陌生又熟悉 陌生的是我完全不懂它背後的數學原理,熟悉是深度學習炒的太火,你不想知道都不可能 換句話說我腦海中沒有建立深度學習的大樹,只有硬生生的 深度學習 這個詞。而本文我想簡單介紹一下我通過學習之後建立起的深度學習的簡單樹,而這個所謂的樹指的是機器學習 深度學習 神經網路...

基於深度學習場景分類演算法

目前出現的相對流行的場景分類方法主要有以下三類 1 基於物件的場景分類 這種分類方法以物件為識別單位,根據場景中出現的特定物件來區分不同的場景 基於視覺的場景分類方法大部分都是以物件為單位的,也就是說,通過識別一些有 代表性的物件來確定自然界的位置。典型的基於物件的場景分類方法有以下的中間步驟 特徵...