午夜激情影院国产_久久毛片免费播放_国产成人综合在线95精品_精品视频在线观自拍自拍_无码粉嫩小泬抽搐白浆免费_在线观看麻豆国产传媒61_黄色视频无码亚洲啊v在线_国产成人精品免费久亚洲高清不卡_先锋无码午夜资源网站_2021自拍视频亚洲国产第一区

 
  • Nature重磅:魔改GPT-2!AI幫你預(yù)測未來20年健康風(fēng)險(xiǎn),涉及1000+疾病

    作者:詹姆士23 來源:上海 瀏覽: 【】 發(fā)布時(shí)間:2025-09-20評論數(shù):

    許多人一生中會罹患不止一種疾病,但預(yù)測不同疾病之間的相互影響依然困難。

    在醫(yī)療決策領(lǐng)域,精準(zhǔn)預(yù)測患者未來健康走向一直是核心需求。人工智能(AI)模型可借助患者記錄中的海量數(shù)據(jù),幫助識別疾病的進(jìn)展模式。然而,它們的潛力尚未被充分挖掘,尤其是在大規(guī)模人群層面。

    日前,德國海德堡德國癌癥研究中心 DKFZ 腫瘤學(xué) AI 分部等聯(lián)合團(tuán)隊(duì)在Nature期刊上發(fā)布了一篇論文,提出了一項(xiàng)突破性的研究成果:Delphi-2M 模型。模型基于生成式預(yù)訓(xùn)練 Transformer(GPT)技術(shù),通過分析個(gè)人病歷和生活方式,對1000多種疾病提供長達(dá) 20 年的潛在疾病風(fēng)險(xiǎn)評估,并生成保護(hù)隱私的合成數(shù)據(jù),為個(gè)性化醫(yī)療和長期健康規(guī)劃開辟了全新路徑。

    論文鏈接:

    https://www.nature.com/articles/s41586-025-09529-3

    魔改 GPT-2,AI 預(yù)測個(gè)體未來 20 年健康

    Delphi-2M 模型的核心在于,通過理解患者過去與當(dāng)下的健康狀態(tài),預(yù)測未來疾病風(fēng)險(xiǎn)并進(jìn)行干預(yù)。

    過去,AI 方法雖能從醫(yī)療記錄中學(xué)習(xí)和預(yù)測疾病進(jìn)展,但受限于模型架構(gòu),難以實(shí)現(xiàn)對多疾病、長周期、大規(guī)模的精準(zhǔn)預(yù)測。隨著人口老齡化加劇,疾病預(yù)測的重要性愈發(fā)凸顯。在此背景下,可以精準(zhǔn)模擬多疾病進(jìn)展的 AI 模型,將成為醫(yī)療規(guī)劃與資源分配的關(guān)鍵工具。

    為了模擬疾病歷史數(shù)據(jù),研究團(tuán)隊(duì)對 GPT-2 架構(gòu)進(jìn)行了“魔改”。Transformer 模型通過將輸入映射到嵌入空間,逐步聚合信息以實(shí)現(xiàn)自回歸預(yù)測。他們用正弦和余弦基函數(shù)對連續(xù)年齡進(jìn)行編碼,并在輸出頭中加入另一個(gè)模塊,通過指數(shù)等待時(shí)間模型預(yù)測下一時(shí)間。該架構(gòu)允許用戶通過提供部分健康軌跡,計(jì)算出疾病及死亡事件的每日新增率,并根據(jù)這些速率對后續(xù) token 及對應(yīng)時(shí)間進(jìn)行抽樣,逐步完成完整健康軌跡的抽樣。

    圖|Delphi-2M 模型架構(gòu)

    Delphi-2M 的訓(xùn)練與驗(yàn)證依托內(nèi)、外兩大高質(zhì)量數(shù)據(jù)集,確保模型的泛化能力與可靠性。訓(xùn)練數(shù)據(jù)主要來自英國生物樣本庫的 40 萬名參與者,涵蓋 ICD-10 頂級診斷代碼、性別、體重指數(shù)(BMI)、吸煙 / 飲酒習(xí)慣及死亡信息。

    內(nèi)部驗(yàn)證數(shù)據(jù):英國生物樣本庫剩余 20% 參與者(約 10.2 萬人),用于模型超參數(shù)優(yōu)化;同時(shí)選取 47.1 萬名 2020 年 7 月 1 日仍存活的參與者,追蹤至 2022 年 7 月 1 日,驗(yàn)證模型的縱向預(yù)測能力。

    外部驗(yàn)證數(shù)據(jù):丹麥全國疾病登記系統(tǒng)的 193 萬國民數(shù)據(jù),時(shí)間跨度從 1978-2018 年。值得注意的是,應(yīng)用于丹麥數(shù)據(jù)時(shí),模型未調(diào)整任何參數(shù),直接復(fù)用英國數(shù)據(jù)訓(xùn)練的權(quán)重,以此檢驗(yàn)其跨人群、跨醫(yī)療體系的適用性。

    傳統(tǒng)臨床風(fēng)險(xiǎn)模型往往注重專精,如 QRisk3 用于心血管疾病風(fēng)險(xiǎn)評估、UKBDRS 用于癡呆預(yù)測,多數(shù)模型僅能覆蓋數(shù)十種疾病。而Delphi-2M 近乎實(shí)現(xiàn)了“全譜覆蓋”,可同時(shí)預(yù)測1256 種疾病及死亡風(fēng)險(xiǎn),且精準(zhǔn)度表現(xiàn)出色。

    圖|Delphi-2M 模型精準(zhǔn)模擬了多種疾病的發(fā)病率。

    內(nèi)部驗(yàn)證表現(xiàn)方面,在英國生物樣本庫數(shù)據(jù)中,模型對多數(shù)疾病的年齡 - 性別分層 AUC(受試者工作特征曲線下面積,越高表示預(yù)測能力越強(qiáng))平均達(dá) 0.76,97% 的疾病 AUC 超過 0.5,表明其具備一定的預(yù)測價(jià)值。其中,死亡風(fēng)險(xiǎn)預(yù)測的 AUC 最高,男女均達(dá) 0.97,已經(jīng)接近完美預(yù)測。

    與臨床工具進(jìn)行對比時(shí),研究團(tuán)隊(duì)發(fā)現(xiàn),當(dāng)使用模型預(yù)測心血管疾病、癡呆時(shí),AUC 與 QRisk3、UKBDRS 等經(jīng)典工具相當(dāng);預(yù)測死亡風(fēng)險(xiǎn)時(shí),AUC 優(yōu)于 Charlson 共病指數(shù)、Elixhauser 共病指數(shù)等常用指標(biāo);僅在糖尿病預(yù)測上略遜于臨床金標(biāo)準(zhǔn) HbA1c,這也提示了研究人員未來可以通過整合生物標(biāo)志物進(jìn)一步優(yōu)化。

    Delphi-2M 在跨人群泛化能力的表現(xiàn)也較為優(yōu)異。應(yīng)用于丹麥數(shù)據(jù)時(shí),Delphi-2M 平均 AUC 雖略低于英國數(shù)據(jù),但疾病預(yù)測結(jié)果與丹麥人群實(shí)際發(fā)病模式高度相關(guān),證明其在不同醫(yī)療體系下具備廣泛適用性。

    圖|Delphi-2M inform 生成未來健康軌跡的建模方法。

    不同于傳統(tǒng)模型僅能預(yù)測 1-5 年的發(fā)病概率,Delphi-2M 的“生成式”特性使其能模擬個(gè)體未來長達(dá) 20 年的健康路徑。研究團(tuán)隊(duì)以英國生物樣本庫中 60 歲參與者為例,基于其 60 歲前的病史數(shù)據(jù),生成未來健康軌跡,并與實(shí)際隨訪結(jié)果對比得出以下結(jié)論:

    首先,群體層面的吻合度較高。Delphi-2M 的 70-75 歲疾病發(fā)病率與實(shí)際觀察值高度一致,衡量預(yù)測分布與真實(shí)分布差異的交叉熵?fù)p失與真實(shí)數(shù)據(jù)無顯著差異;若隨機(jī)打亂參與者的既往病史,模擬結(jié)果的準(zhǔn)確性會明顯下降,證明 Delphi-2M 確實(shí)捕捉到了病史與未來疾病的關(guān)聯(lián)。

    其次,個(gè)體風(fēng)險(xiǎn)區(qū)分清晰。對于胰腺癌等疾病,模型能區(qū)分出“高風(fēng)險(xiǎn)”與“低風(fēng)險(xiǎn)”個(gè)體。如既往有消化系統(tǒng)疾病的人群,其患胰腺癌的風(fēng)險(xiǎn)會大幅升高;而哮喘、骨關(guān)節(jié)炎等疾病的風(fēng)險(xiǎn)預(yù)測雖仍依賴年齡 - 性別趨勢,但也能識別出偏離群體平均風(fēng)險(xiǎn)的個(gè)體。

    此外,實(shí)驗(yàn)證明長期預(yù)測仍然有效。隨著預(yù)測時(shí)間延長,模型準(zhǔn)確性會逐漸下降,但仍優(yōu)于僅基于年齡和性別的預(yù)測,證明了其具備長期預(yù)測價(jià)值。

    安格利亞魯斯金大學(xué)生物醫(yī)學(xué)科學(xué)教授 Justin Stebbing 評價(jià)道,“Delphi-2M 是計(jì)算醫(yī)學(xué)與數(shù)據(jù)整合領(lǐng)域的重大突破,凸顯了 GPT 模型在預(yù)測大規(guī)模人群及個(gè)體健康軌跡中千余種疾病發(fā)生率與時(shí)間節(jié)點(diǎn)方面的強(qiáng)大能力。”

    倫敦國王學(xué)院基因組神經(jīng)影像與人工智能教授 Gustavo Sudre 也認(rèn)為,“Delphi-2M 清晰地展示如何運(yùn)用可解釋 AI 進(jìn)行預(yù)測建模至關(guān)重要,這為該技術(shù)應(yīng)用于臨床實(shí)踐奠定基礎(chǔ),并暗示識別出需要干預(yù)的高風(fēng)險(xiǎn)個(gè)體?!?/p>

    此外。醫(yī)療數(shù)據(jù)的隱私敏感性一直是 AI 研究的痛點(diǎn),直接使用真實(shí)數(shù)據(jù)訓(xùn)練模型可能泄露個(gè)人信息,但匿名化處理又會損失關(guān)鍵信息,模型的合成數(shù)據(jù)生成能力為這一難題提供了新解法。

    Delphi-2M 可生成完全虛構(gòu)的健康軌跡,復(fù)現(xiàn)真實(shí)人群的年齡 - 性別特異性發(fā)病率模式,且無法通過合成數(shù)據(jù)反推真實(shí)的個(gè)人信息,因此可作為真實(shí)數(shù)據(jù)的一種替代品,用于訓(xùn)練其他醫(yī)療 AI 模型,既能保護(hù)隱私,又避免了數(shù)據(jù)資源的浪費(fèi)。Stebbing 教授也肯定了這一優(yōu)勢,稱其“外部驗(yàn)證能力與合成數(shù)據(jù)集生成能力,彰顯了模型的魯棒性、隱私管理優(yōu)勢及醫(yī)療規(guī)劃潛力”。

    不足與未來

    盡管 Delphi-2M 表現(xiàn)突出,但研究團(tuán)隊(duì)在論文中也明確指出了其局限性,需在應(yīng)用過程中謹(jǐn)慎對待。

    例如,Delphi-2M存在訓(xùn)練數(shù)據(jù)偏差的情況,這是由于在學(xué)習(xí)英國生物樣本庫時(shí)造成的“固有偏差”。英國生物樣本庫參與者以 40-70 歲社會經(jīng)濟(jì)地位較高的白人為主,導(dǎo)致模型對其他人群的預(yù)測可靠性較低。目前的模型還無法建立因果關(guān)系,僅能捕捉“相關(guān)性”,不能基于預(yù)測結(jié)果直接制定干預(yù)方案。

    此外,Delphi-2M 僅通過數(shù)據(jù)擬合驗(yàn)證,尚未經(jīng)過前瞻性臨床試驗(yàn),未在真實(shí)臨床場景中測試。英國工程與技術(shù)學(xué)會院士 Peter Bannister 也表示,“這兩個(gè)數(shù)據(jù)集在年齡、種族和當(dāng)前醫(yī)療結(jié)果方面都存在偏差,距離改善醫(yī)療保健還有很長的路要走?!?/p>

    Delphi-2M 的發(fā)布,標(biāo)志著 AI 在醫(yī)療預(yù)測領(lǐng)域從單一擴(kuò)展到多元、從“短期風(fēng)險(xiǎn)”向“長期軌跡”、從“依賴真實(shí)數(shù)據(jù)”向“隱私保護(hù)兼容”的跨越。其核心價(jià)值不僅在于預(yù)測能力強(qiáng),更在于為精準(zhǔn)醫(yī)療提供了可解釋、可擴(kuò)展的框架。通過 SHAP 分析,模型可清晰地展示“某一既往疾病如何影響未來風(fēng)險(xiǎn)”。通過整合基因組數(shù)據(jù)、更豐富的代謝組學(xué)信息、診斷影像數(shù)據(jù)或可穿戴設(shè)備數(shù)據(jù),可進(jìn)一步提升其預(yù)測能力。

    對于 Delphi-2M 模型的未來,Sudre 教授指出,“雖然當(dāng)前版本僅依賴匿名化臨床記錄,但令人鼓舞的是模型架構(gòu)經(jīng)過精心設(shè)計(jì),可兼容生物標(biāo)志物、影像學(xué)乃至基因組學(xué)等更豐富的數(shù)據(jù)類型。隨著未來數(shù)據(jù)整合的推進(jìn),Delphi 平臺有望發(fā)展為真正的多模態(tài)精準(zhǔn)醫(yī)療工具”。

    當(dāng)然,模型是醫(yī)療決策的助手,而非替代者,其預(yù)測結(jié)果需結(jié)合醫(yī)生經(jīng)驗(yàn)、患者意愿綜合判斷。未來,隨著訓(xùn)練數(shù)據(jù)的多元化、驗(yàn)證場景的臨床化等,Delphi-2M 這類 AI 模型有望真正融入醫(yī)療流程,為每個(gè)人提供量身定制的健康管理方案,真正推動精準(zhǔn)醫(yī)療從概念走向?qū)嵺`。

    整理:小瑜

    如需轉(zhuǎn)載或投稿,請直接在公眾號內(nèi)留言