去年 12 月,OpenAI 首次發(fā)布 o3 模型時宣稱,該模型能夠在 FrontierMath 這一(yī )極具挑戰(zhàn)性(xìng )的數(shù)學問(wèn )題(tí )集上正確(què )回答超過四分(fèn )之一的問題。這一成績遠遠超過了(le )競爭對手 —— 排名第二的模型僅能正確回(huí )答約 2% 的 FrontierMath 問題。OpenAI 首席研究官 Mark Chen 在直播中表示:“目前(qián )市場上所(suǒ )有其他產(chǎn)品在 FrontierMath 上(shàng )的成(chéng )績都不足(zú ) 2%,而我們在內(nèi)部測(cè )試中(zhōng ),使(shǐ )用(yòng ) o3 模型在(zài )激進的測試(shì )時計算設(shè)置下,能夠達到超(chāo )過(guò ) 25% 的正確率?!?
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利