去年 12 月,OpenAI 首(shǒu )次發(fā)布(bù ) o3 模型時(shí)宣稱,該模型能夠在 FrontierMath 這一極具挑戰(zhàn)性(xìng )的數(shù)學(xué)問(wèn)(wèn )題集(jí )上正(zhèng )確回答超過(guò)四分之一的問(wèn)題(tí )。這一成績(jī)(jì )遠(yuǎn)遠(yuǎn)超過(guò)了競(jìng)爭(zhēng)對(duì)手 —— 排名第二(èr )的(de )模型僅能正(zhèng )確回答約 2% 的 FrontierMath 問(wèn)題。OpenAI 首席研究(jiū )官 Mark Chen 在直播中表示:“目(mù )前市場(chǎng)(chǎng )上所有其他產(chǎn)品在 FrontierMath 上的成績(jī)都不足(zú ) 2%,而我們?cè)趦?nèi)部測(cè)試(shì )中,使用 o3 模型在激進(jìn)的測(cè)試時(shí)計(jì)算設(shè)置下(xià ),能(néng )夠(gòu )達(dá)到超過(guò) 25% 的正確(què )率?!?
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利