去年 12 月,OpenAI 首次發(fā)(fā )布 o3 模型時宣稱,該模型能夠在 FrontierMath 這一極具挑戰(zhàn)性的數(shù)(shù )學(xué)問題集上正確(què )回答超過四分之一的問題。這一成績遠(yuǎn)遠(yuǎn)(yuǎn )超(chāo )過了競爭(zhēng )對手 —— 排名第二的模型(xíng )僅能正確回答(dá )約(yuē ) 2% 的 FrontierMath 問題。OpenAI 首席研究官(guān ) Mark Chen 在直播中表示:“目前市(shì )場(chǎng )上(shàng )所有其他產(chǎn)品在 FrontierMath 上的成(chéng )績都不足 2%,而(ér )我(wǒ )們在內(nèi)(nèi )部測試(shì )中,使用 o3 模型在激進(jìn)的測(cè )試時計算設(shè)置下,能夠達(dá)到超過(guò ) 25% 的正確(què )率。”
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利