去年(nián ) 12 月,OpenAI 首次(cì )發(fā)布 o3 模(mó )型時宣稱,該模型能(néng )夠在(zài ) FrontierMath 這一極具挑戰(zhàn)性的數(shù)學(xué)問題集上正確回答超(chāo )過四分之一的問題。這(zhè )一成績遠(yuǎn)遠(yuǎn)超過了競爭對手 —— 排名第二的模型僅(jǐn )能正(zhèng )確回答約 2% 的 FrontierMath 問題(tí )。OpenAI 首席(xí )研究官 Mark Chen 在(zài )直(zhí )播中表示:“目前市場上所有其他產(chǎn)品在(zài ) FrontierMath 上的(de )成績都不足 2%,而我們在內(nèi)部測(cè )試中,使(shǐ )用 o3 模(mó )型在激進(jìn)(jìn )的測試(shì )時(shí )計算設(shè)置下,能夠達(dá)到超(chāo )過 25% 的正確率?!?
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利