研究(jiū )團(tuán)隊(duì)篩選了(le )總計(jì) 18371 項(xiàng)研(yán )究,最終(zhōng )確定 83 項(xiàng)進(jìn)行詳細(xì)分析。這(zhè )些研(yán )究涉(shè )及多種生成式AI模型,包(bāo )括(kuò ) GPT-4、Llama3 70B、Gemini 1.5 Pro 和 Claude 3 Sonnet 等,覆(fù )蓋了多個(gè)醫(yī)療領(lǐng)(lǐng )域。其(qí )中,GPT-4 是研究最(zuì )多的模(mó )型。結(jié)(jié )果顯示,這些AI模型的平均診斷準(zhǔn)確率為 52.1%(95% 置信區(qū)間:47.0% - 57.1%)。部(bù )分模(mó )型的(de )診斷準(zhǔn)確率與非專(zhuān)家醫(yī)生相當(dāng),兩(liǎng )者之間沒(méi)有顯著統(tǒng)計(jì)差異。然而,專(zhuān)家醫(yī)生(shēng )的表現(xiàn)仍?xún)?yōu)(yōu )于 AI,其準(zhǔn)確率差距為 15.8%(95% 置信區(qū)間:4.4% - 27.1%,p=0.007)。盡管(guǎn )如此,隨著技術(shù)(shù )的不斷(duàn )進(jìn)步(bù ),這一差距可能會(huì)逐(zhú )漸縮(suō )小。
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利