去年 12 月,OpenAI 首次發(fā)布(bù ) o3 模型時宣稱,該模型(xíng )能夠在 FrontierMath 這一極具挑戰(zhàn)性(xìng )的(de )數(shù)學(xué)問題集上正確回答超過四分之一的問題。這一成績遠遠超過了競(jìng )爭對手(shǒu ) —— 排名(míng )第二的模型僅能正確回(huí )答約 2% 的 FrontierMath 問題(tí )。OpenAI 首席研究官 Mark Chen 在直播中表示(shì ):“目前市場上所有其他產(chǎn)品(pǐn )在(zài ) FrontierMath 上的成績(jì )都不足 2%,而我們在內(nèi)部測試(shì )中,使(shǐ )用 o3 模型在(zài )激進的測試時計算(suàn )設(shè)置下,能(néng )夠達(dá )到超過 25% 的(de )正確率?!?
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利