然而,這一高分似乎是一個(gè)上限(xiàn )值,是通過(guò)一(yī )個(gè)計(jì)(jì )算資(zī )源更為強(qiáng)大的(de ) o3 模(mó )型版本實(shí)現(xiàn)的,而并非(fēi )是 OpenAI 上(shàng )周公開(kāi)發(fā)布的版本(běn )。負(fù)責(zé) FrontierMath 的 Epoch 研究所于(yú )上周(zhōu )五(wǔ )公布了其對(duì) o3 模型的獨(dú)立基準(zhǔn)測(cè)試結(jié)果,發(fā)(fā )現(xiàn) o3 的得(dé )分僅為約 10%,遠(yuǎn)低于 OpenAI 此前聲稱(chēng)的最高分?jǐn)?shù)。
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利