去年 12 月,OpenAI 首次發(fā)布 o3 模型(xíng )時(shí)宣稱,該模(mó )型(xíng )能夠在 FrontierMath 這一極(jí )具挑戰(zhàn)性的數(shù)(shù )學(xué)(xué )問題集上(shàng )正確回答(dá )超過四分之一的問題。這一成績遠(yuǎn)遠(yuǎn)超過(guò )了競(jìng )爭(zhēng )對手 —— 排名第二的模型僅能正確回答約 2% 的 FrontierMath 問題(tí )。OpenAI 首席研究官(guān ) Mark Chen 在直播中(zhōng )表示(shì ):“目前市(shì )場上(shàng )所有其他產(chǎn)品在(zài ) FrontierMath 上的成績都不足(zú ) 2%,而我們在內(nèi)部測試中(zhōng ),使用 o3 模型(xíng )在激進(jìn)的(de )測試時(shí)計(jì)算設(shè)置下(xià ),能夠達(dá)到超(chāo )過 25% 的正確率?!?
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利