研究團(tuán )隊篩選了總計 18371 項研究,最終(zhōng )確定 83 項進行詳(xiáng )細分析。這些研(yán )究涉及多種生成式AI模(mó )型,包括 GPT-4、Llama3 70B、Gemini 1.5 Pro 和(hé ) Claude 3 Sonnet 等(děng ),覆蓋了多個醫(yī)療領域。其中,GPT-4 是研究最(zuì )多的模型。結果顯示,這些AI模型的(de )平均診斷準確率為 52.1%(95% 置信區(qū)間(jiān ):47.0% - 57.1%)。部分(fèn )模型的診斷準確(què )率與非(fēi )專(zhuān )家醫(yī)生相當,兩者之間沒有顯著統(tǒng)計差(chà )異。然(rán )而,專家醫(yī)(yī )生的表現(xiàn)仍優(yōu)(yōu )于 AI,其準確率差距為 15.8%(95% 置信區(qū)間:4.4% - 27.1%,p=0.007)。盡管(guǎn )如(rú )此,隨著技(jì )術的(de )不斷進步(bù ),這一差距(jù )可能會逐漸縮小。
版權所有 ? 2025 青龍影院 保留所有權利