研(yán )究團(tuán)隊(duì)篩選了總計(jì) 18371 項(xiàng)研究(jiū ),最終確定 83 項(xiàng)進(jìn)(jìn )行詳細(xì)分析(xī )。這些研究涉及(jí )多種(zhǒng )生成式AI模型,包括 GPT-4、Llama3 70B、Gemini 1.5 Pro 和 Claude 3 Sonnet 等,覆蓋了多(duō )個(gè )醫(yī)療領(lǐng)域。其中,GPT-4 是研究最多的模型。結(jié)果(guǒ )顯(xiǎn )示,這些AI模型的平均診斷(duàn )準(zhǔn)確率為 52.1%(95% 置信區(qū)(qū )間:47.0% - 57.1%)。部分模型的診斷準(zhǔn)(zhǔn )確率與非專家(jiā )醫(yī)生相(xiàng )當(dāng),兩者之間沒有顯著統(tǒng)計(jì)差異。然而,專(zhuān )家醫(yī)生的表現(xiàn)仍優(yōu)(yōu )于(yú ) AI,其準(zhǔn)確率差距為(wéi ) 15.8%(95% 置(zhì )信區(qū)間:4.4% - 27.1%,p=0.007)。盡管(guǎn )如此,隨著技術(shù)(shù )的不斷進(jìn)步,這一差距可能(néng )會逐漸縮小。
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利