在大模型推動下,AI在醫(yī)療場景的應(yīng)用正往影像領(lǐng)域延伸。
9月17日,“聆音”EchoCare超聲大模型在香港發(fā)布。這是目前所知首個訓(xùn)練規(guī)模超過400萬張的超聲影像數(shù)據(jù)集,構(gòu)建了國內(nèi)首個覆蓋多中心、多地區(qū)、多人種、多器官(52+全身器官)的大規(guī)模超聲數(shù)據(jù)集。
EchoCare由中國科學(xué)院香港創(chuàng)新研究院人工智能與機器人創(chuàng)新中心(CAIR)研發(fā)?!按竽P妥鳛獒t(yī)生的工具,我們的開發(fā)目的是讓超聲設(shè)備用起來更簡單,另一方面提升對超聲數(shù)據(jù)的理解程度和診斷水平。綜合而言,要讓醫(yī)生這個職業(yè)變成一個腦力工作者,而不是一個體力工作者?!盋AIR主任劉宏斌研究員在發(fā)布會上指出。
劉宏斌表示,最新發(fā)布的預(yù)訓(xùn)練基座大模型,可以理解為一個模型的編碼器,也就是把數(shù)據(jù)壓縮成更容易處理下游任務(wù)的關(guān)鍵模塊,基座模型也計劃開源給醫(yī)院團隊和科研機構(gòu)。下一步,要把模型適配到臨床實際場景中。而跟頭部超聲影像企業(yè)合作、把該模型加載到設(shè)備上,也會是技術(shù)轉(zhuǎn)化的重要路徑之一。
巨大的缺口
作為醫(yī)學(xué)常規(guī)篩查和首選篩查手段,超聲技術(shù)在疾病診斷、健康檢測和臨床醫(yī)療的作用不可替代。在中國,每年超聲檢查量達到20億次,在常規(guī)醫(yī)療檢查(如CT、MRI、X光等)中的年檢量位列第一。
與之形成反差的是供給端的巨大缺口。公開數(shù)據(jù)顯示,國內(nèi)超聲醫(yī)生缺口至少達到15萬。這是由于,傳統(tǒng)超聲技術(shù)對操作經(jīng)驗和解讀能力的要求極高,培養(yǎng)一名合格超聲醫(yī)生需要3到5年,產(chǎn)篩領(lǐng)域甚至要5到8年,這也限制了超聲檢查的普及。
香港中文大學(xué)醫(yī)學(xué)院外科學(xué)系教授、心胸外科主任黃鴻亮對此深有體會。“在香港,如果不是緊急病癥,檢查分流要等很久,甚至幾個月。而普通檢查,等一年以上也是有的?!彼蚪缑嫘侣劚硎?。
黃鴻亮在業(yè)內(nèi)首創(chuàng)性提出用超聲前期篩查心胸主動脈疾病,也認(rèn)為需要在急診室引入超聲以避免漏診,“主動脈撕裂導(dǎo)致的死亡率很高,會在很短的時間致命。因此急診室在短時間快速檢查病癥,以及用超聲手段進行前期篩查、預(yù)防并發(fā)癥很重要。但是老實說,目前香港急診室還沒有這個篩查過程。與此同時,醫(yī)生都是超負(fù)荷工作,要處理海量病例?!?/p>
2015年,香港中文大學(xué)醫(yī)學(xué)院跟香港威爾斯親王醫(yī)院合作面向超過1500名病人開展超聲波普查的研究。但不管是門診普查,還是急診室篩查,超聲檢查目前仍未推廣開來,缺乏專門的超聲醫(yī)生、專科操作員培訓(xùn)周期和成本大都是掣肘,“在香港現(xiàn)有醫(yī)療系統(tǒng)下,專門培訓(xùn)在急診室做超聲波的檢查員是不可能的,操作的非標(biāo)準(zhǔn)化也是超聲檢查另一個很大的挑戰(zhàn)。”
這種情況下,黃鴻亮希望“有一個智能化系統(tǒng)進行人力補充和操作標(biāo)準(zhǔn)化”。在香港醫(yī)管局牽頭下,黃鴻亮團隊在2024年跟CAIR開展合作,提供了超過2萬張匿名化病例影像進行訓(xùn)練。
“香港雖然數(shù)據(jù)量上不占優(yōu)勢,但這邊的理念很超前,診療手段、手術(shù)方式也跟國際接軌,對AI接受度很高。醫(yī)療大模型以臨床需求為驅(qū)動,例如香港中文大學(xué)醫(yī)學(xué)院外科提出的超聲波篩查主動脈疾病就很前沿。”CAIR副主任孟高峰研究員接受界面新聞采訪時指出。
這一背景下,香港超聲領(lǐng)域的AI應(yīng)用迎來突破。
搭建規(guī)模最大數(shù)據(jù)集
事實上,在EchoCare之前,AI應(yīng)用已是香港醫(yī)學(xué)界的共識。
黃鴻亮對界面新聞提到,近幾年在香港醫(yī)管局推動下,本地醫(yī)院已經(jīng)引入了AI技術(shù),例如AI輔助查看胸部X線平片,會對異常情況進行提示,但是還沒延伸到其他影像類型。
此外,傳統(tǒng)超聲AI診斷面臨諸多挑戰(zhàn),包括高質(zhì)量超聲標(biāo)注數(shù)據(jù)稀缺、醫(yī)學(xué)數(shù)據(jù)固有的長尾分布、模型跨中心跨設(shè)備泛化性差,以及傳統(tǒng)模型嵌入醫(yī)學(xué)知識困難,這都限制了AI超聲在臨床上的大規(guī)模普及。
直到大模型技術(shù)誕生,超聲圖像特征學(xué)習(xí)與下游任務(wù)適配的關(guān)鍵難題出現(xiàn)了解答。EchoCare是目前已知規(guī)模最大的超聲圖像數(shù)據(jù)集,450多萬張圖像涵蓋了138個常用數(shù)據(jù)集。孟高峰提及,數(shù)據(jù)來自20多個國家或者地區(qū),“多中心可以理解為,數(shù)據(jù)不是來自單一地區(qū)或單一醫(yī)院。如果只選取單一對象,模型訓(xùn)練出來后就存在泛化性問題,不同醫(yī)院的設(shè)備也不一樣,模型換了一個地方性能就會大打折扣?!?/p>
相較傳統(tǒng)大模型,EchoCare首創(chuàng)純數(shù)據(jù)驅(qū)動的結(jié)構(gòu)化對比自監(jiān)督學(xué)習(xí)方法,不需要大量的數(shù)據(jù)標(biāo)注,即可實現(xiàn)特征學(xué)習(xí)與下游任務(wù)的解耦,實現(xiàn)超聲領(lǐng)域先驗知識內(nèi)化以及跨任務(wù)知識遷移。
孟高峰指出,以前的模型訓(xùn)練是監(jiān)督學(xué)習(xí),需要人為標(biāo)注“標(biāo)準(zhǔn)答案”,模型進行輸入和輸出,模型輸出和人為標(biāo)注對比后,再調(diào)參數(shù)模型。而在自監(jiān)督學(xué)習(xí)下,不需要再靠人力標(biāo)注,數(shù)據(jù)內(nèi)部之間存在聯(lián)系,“就像把一幅畫的一部分遮住,可以根據(jù)周圍推理出被遮住的部分。用數(shù)據(jù)本身的關(guān)系構(gòu)造學(xué)習(xí)任務(wù),再用任務(wù)驅(qū)動模型學(xué)習(xí)。后面做很具體的下游任務(wù)就只需要標(biāo)注少量數(shù)據(jù)。這種模式的精度效果也超過全監(jiān)督學(xué)習(xí)。”
EchoCare另一個創(chuàng)新性在于連續(xù)學(xué)習(xí)。孟高峰分析道,大模型數(shù)據(jù)的收集不是一次性工作,不同應(yīng)用場景需要新的數(shù)據(jù),而歷史數(shù)據(jù)也需要更新。連續(xù)學(xué)習(xí)解決的就是模型越用越差的問題,基于少部分?jǐn)?shù)據(jù),模型能不斷迭代、跟上最新情況,“特別是需要多中心應(yīng)用時,每個中心的數(shù)據(jù)不同,也對連續(xù)學(xué)習(xí)提出要求,這跟醫(yī)療場景很契合。”
針對器官識別、器官分割、甲狀腺結(jié)節(jié)檢測分類以及病灶分類管理檢測等項目任務(wù),該模型進行了測試,相較傳統(tǒng)的SOTA模型,性能平均能提高3到5個百分點。
“我們提供了約600個病例的數(shù)據(jù)。從訓(xùn)練的model來看,平均誤差是1毫米左右,在某一些定位是零點幾毫米,這是相當(dāng)不錯的數(shù)據(jù)。不僅是心胸外科,內(nèi)科也是合作方,醫(yī)生對于正確關(guān)鍵幀、病變圖像的需求很大。”黃鴻亮說。
下一步如何發(fā)展?
從實驗室到實際應(yīng)用,一項成果需要經(jīng)過回溯性研究、前瞻性研究、醫(yī)療證取證等幾個階段。目前,EchoCare目前已完成臨床上的第一階段,即回溯性研究。
模型在山東大學(xué)齊魯醫(yī)院、中南大學(xué)湘雅醫(yī)院和香港中文大學(xué)醫(yī)學(xué)院進行了臨床回溯性驗證。結(jié)果顯示,基于山東大學(xué)齊魯醫(yī)院婦產(chǎn)科1556例卵巢腫瘤超聲病例,模型分類靈敏度達到85.6%,特異度88.7%,腫瘤良惡性分類靈敏度相對SOTA方法提升8%。
劉宏斌提到,除了上述醫(yī)院,也在跟國內(nèi)不少醫(yī)院推動合作,例如中山大學(xué)第一附屬醫(yī)院、四川大學(xué)華西醫(yī)院等,“我們正跟五、六家醫(yī)院接洽將大模型適配在臨床上,內(nèi)地醫(yī)院的優(yōu)勢在于數(shù)據(jù)規(guī)模,像中山一附院、湘雅醫(yī)院都是萬級以上,齊魯醫(yī)院也接近萬級。在訓(xùn)練模型過程中,也用了大量國際開源數(shù)據(jù)以作冷啟動。當(dāng)然,不管是內(nèi)地還是香港,病人數(shù)據(jù)的倫理問題,如何平衡模型訓(xùn)練需要和病人隱私保護,都在逐步解決?!?/p>
部署到醫(yī)院是下一步方向。黃鴻亮告訴界面新聞,在前瞻性研究上,會在病例上部署大模型,并跟心臟科醫(yī)生的診療數(shù)據(jù)進行對比,通過臨床研究進一步證明數(shù)據(jù)的準(zhǔn)確度。前瞻性研究耗時更長,可能需要兩到三年。
他認(rèn)為,急診室會是未來超聲大模型最好的切入點,“每年因為心痛、胸痛到急診室的病人很多,如何鑒別病癥,到底是心肌梗塞、肺動脈血栓還是主動脈破裂,是急診室很重要的問題。但現(xiàn)在的問題是,很多病人連超聲波也做不了,需要讓AI解決這個步驟,后面再做更詳細(xì)的檢查。試驗過程中,大模型會對主動脈不同位置進行標(biāo)注,如果尺寸出現(xiàn)異常會提出警示,給出高危標(biāo)簽,這將是急診室預(yù)防漏診的一個關(guān)鍵。”
針對大模型的商業(yè)化路徑,劉宏斌向界面新聞表示,會聯(lián)合頭部超聲設(shè)備企業(yè),將大模型跟設(shè)備結(jié)合起來,通過臨床驗證后把模型授權(quán)給企業(yè)。后續(xù)的醫(yī)療器械取證等環(huán)節(jié)則交由企業(yè)進行,“已經(jīng)有三家企業(yè)通過其他渠道了解到我們的研究成果,在跟我們進行接洽了?!?/p>