國際頂級人工智能醫學影像學術會議 2019會期臨近,論文錄用結果陸續揭曉,騰訊共計入選8篇論文,涵蓋病理癌癥圖像分類、醫學影像分割、CT病灶檢測、機器學習等范疇。

近年來AI醫學蓬勃發展,以“騰訊覓影”為代表的AI醫學解決方案快速進入多種疾病的診斷核心環節。不過,醫學影像數據質量參差不齊,人工標注難度大等行業性難題,導致AI在醫學上的學習和應用面臨諸多挑戰。在此次 2019中,騰訊旗下兩大AI實驗室——騰訊優圖實驗室與騰訊AI Lab分別從深度學習效率提升,以及醫學臨床應用角度進行創新性研究,各入選4篇論文。

提升深度學習效率:彌補“小數據”短板

將AI應用于醫學圖像分類的一大挑戰是訓練數據少,其中一個解決辦法是結合遷移學習、多任務學習、半監督學習等多種訓練方式。騰訊AI Lab的研究把三種方法整合在統一框架中,從而疊加各方法的貢獻,并公平對比不同場景下各方法的貢獻。

圖注:半監督學習前沿的一致性約束算法(包括VAT和PI-)和廣泛采用的多任務學習算法(hard )整合在一個網絡中,采用交替任務的方式進行端到端的訓練,通過初始點的設定融入遷移學習。

在胃鏡圖片良惡性分類問題上的一系列實驗說明:單獨使用時遷移學習提升性能最顯著;遷移學習基礎上,多任務學習在項目早期數據量較小時可進一步提高,而半監督學習可在較大數據量上持續提升;三者組合并利用大參數量網絡可獲得更好性能。這項研究成果將可用來指導如何單獨或組合使用遷移學習、多任務學習和半監督學習提升醫學分類模型的準確率。

與此同時,騰訊優圖實驗室的研究,則有望在解決醫學影像標注難題上找到新思路:醫療圖像(如CT,MRI)往往是三維數據,該類數據存在標注難度大,標注信息難以獲取等問題,這導致標注的三維醫學圖像數量通常不足以很好地訓練深度學習網絡。騰訊優圖實驗室提出了一種深度挖掘原始數據信息的自監督學習方法,通過模擬魔方復原過程,使網絡自發地在原始數據中提取有用信息。

這項研究有望減少深度學習網絡對數據量的需求,提高后續監督任務的準確率。同時,這也是業內首次提出三維自監督學習方法,有望彌補業內的研究空白。

圖注:模擬魔方復原過程的自監督學習框架。該框架包含兩個操作:打亂立方塊順序及旋轉立方塊方向。

此外,騰訊優圖實驗室的另一項研究則提出了成對分割框架,通過有效挖掘醫療影像切片間的關系,并以代理監督的形式加以約束,從而通過不同切片之間的配對,大幅提升標注數據的數量和相鄰切片預測結果的光滑性和一致性。這一方法能夠在標注數據不足的條件下進行語義分割這一現實場景發揮效用,通過有效挖掘先驗知識,彌補數據量不足的問題。

AI病理研究新突破:弱監督、無標簽、色彩歸一

騰訊AI Lab 醫療中心首席科學家姚建華博士曾介紹病理AI的三個主要研究方向:一是基于AI技術的病理診斷模型,二是病理組學,三是基于AI技術的病理預后預測模型,三個方向分別幫助醫生提高診斷效率、一致率、準確率,以及新增了醫生的預測療效能力。此次在 2019上,騰訊AI Lab在病理分析上連發3篇論文,闡述其在AI病理分析上的研究新突破。

研究之一由騰訊AI Lab與中山大學附屬第六醫院合作,提出一種僅使用臨床診斷結果作為弱監督信號來訓練分類器的方法,對從病理圖像中拆分出的瓦塊進行自動分類。這個新的分類方法可加速病理圖像分類器的開發,通過結合智能顯微鏡,為臨床醫生提供實時的診斷意見,降低誤診的發生。

圖注:腸癌病理組織HE染色切片。通過結合智能顯微鏡,可以為臨床醫生提供實時的診斷意見,降低誤診的發生。

研究之二則由騰訊AI Lab與華南理工大學、中山大學附屬第六醫院合作,提出一種無標簽領域自適應算法,來訓練具有領域不變性的深度神經網絡,從而通過探索全視野數字切片的標注信息,解決無標簽顯微鏡圖像的分類任務。基于該方法訓練出來的深度神經網絡,在不使用任何帶標注顯微鏡數據的情況下,在顯微鏡任務上取得了極為優異的性能,甚至超過了使用部分帶標注數據訓練的神經網絡。

研究之三則圍繞病理圖像的色彩歸一化。由于制片染色流程以及病理掃描儀的不同,數字病理圖像的色彩存在非常顯著的差異。因此,幾乎所有數字病理相關的分析之前都需要進行色彩歸一化。騰訊AI Lab提出了一種針對病理圖像特點優化的循環生成對抗網絡,通過引入額外的輸入,引導生成器產生特定色彩風格的病理圖像,從而穩定訓練過程中的循環一致性損失函數。相比與其他色彩歸一化方法,騰訊AI Lab提出的色彩歸一化網絡作為癌癥分類任務的前處理,能夠更好地提升后續任務的性能。

圖注: (上)測試數據來源于5個不同的醫學中心,本文提出的方法能將這些病理圖像都歸一化到相近的色彩風格。(下)將訓練好的模型不經過參數微調(fine-tune)直接在其他病理數據集上測試,同樣能進行準確的色彩歸一化。

AI研究更貼近臨床診斷需求:實時CT病灶檢測與眼底血管分割

在智能醫學影像分析上深耕多年的騰訊優圖實驗室醫療AI總監鄭冶楓博士,在介紹AI算法研究經驗時曾表示:最重要的體會是不要改變醫生的現有流程,而是把AI技術無縫嵌入到醫生的檢查流程中去。此次在 2019中,騰訊優圖實驗室帶來了兩項與臨床診斷需求非常緊密的研究成果。

研究之一是應用在CT病灶檢測上。為了提升對不同尺寸病灶的檢測準確性,騰訊優圖實驗室提出了一種利用通道和空間注意力機制的多尺度檢測器,首次在2D檢測網絡上達到比3D檢測網絡更準確的結果,使得檢測效率更高,為后續病灶檢測方法的研究提供了堅實的基礎。值得一提的是,這一方法還可以為臨床醫生提供實時的病灶檢測結果,提高醫生分析CT圖像的效率。

研究之二則是應用于眼底血管分割。眼底血管是人體唯一一處可以直接無介入觀測的血管,很多全身性的疾病和心腦血管疾病都會影響眼底動脈和靜脈的形態。因此,自動化的血管分割和動靜脈分類具有重要的臨床意義。騰訊優圖實驗室將深度學習和多任務模型引入血管分割和動靜脈分類任務,同時實現端到端的動脈、靜脈及全血管的分割和分類。

這項研究成果極大地提高了眼底血管分類的精度和預測速度,實現了端到端的血管分割和動靜脈分類。為眼底血管的精確量化打下了基礎,進而可以促進全身性疾病和心腦血管疾病在眼底生物標記的相關研究。

圖注:動靜脈血管分割和分類效果圖。(A)原始圖片;(B)(E)血管分割和動靜脈分類標簽;(C)(F)模型預測結果; (D)(G) 局部細節放大圖

加速研究到應用轉化

作為“騰訊覓影”背后的技術提供者,騰訊優圖實驗室與騰訊AI Lab的研究成果已源源不斷地落地于真實的臨床研究和應用探索中。目前,“騰訊覓影”已能利用AI醫學影像分析輔助臨床醫生篩查早期肺癌、眼底病變、結直腸腫瘤、宮頸癌、乳腺腫瘤等疾病,以及利用AI輔診引擎輔助醫生對700多種疾病風險進行識別和預測。

與此同時,AI技術在臨床上的有效性也正在被逐步驗證。在北京、上海、廣州、溫州、南寧、德清等地,“騰訊覓影”在學科帶頭人的帶領下分別針對早期肺癌、消化道腫瘤、眼底疾病等進行臨床實驗及科研合作,希望以技術幫助優化醫療資源的不均衡。