這并不意味著 OpenAI 故(gù )意撒(sā )謊,該公司在(zài ) 12 月份公布的基(jī )準(zhǔn)測(cè)試結(jié)果中(zhōng )也包含(hán )了一個(gè)與 Epoch 測(cè)試結(jié)果相符的較低分?jǐn)?shù)。Epoch 還指出,其測(cè)試設(shè)置可能與 OpenAI 有所(suǒ )不同,并且其評(píng)估(gū )使用(yòng )了更新版本的 FrontierMath。Epoch 在報(bào)告中寫(xiě)道(dào ):“我們與(yǔ ) OpenAI 的結(jié)果差異可能(néng )是因?yàn)?wéi ) OpenAI 在內(nèi)部評(píng)估時(shí)使(shǐ )用了更強(qiáng)大(dà )的計(jì)算框架、更多的測(cè)(cè )試時(shí)(shí )計(jì)算資源,或者是因?yàn)檫@些結(jié)果是在 FrontierMath 的不同子集上運(yùn)行的(例(lì )如 2024 年(nián ) 11 月 26 日版(bǎn )本的 180 個(gè)問(wèn)題與 2025 年(nián ) 2 月(yuè ) 28 日私有(yǒu )版本的 290 個(gè)問(wèn)題)。”
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利