這并不意(yì )味著 OpenAI 故意撒(sā )謊,該公司在(zài ) 12 月份公布的基準(zhǔn)測(cè)試結(jié)果中也包含了一個(gè)與 Epoch 測(cè)試(shì )結(jié)果相符的(de )較低分?jǐn)?shù)。Epoch 還指出,其測(cè)試設(shè)置可能(néng )與 OpenAI 有所不同,并且其評(píng)估使(shǐ )用了(le )更新版本的 FrontierMath。Epoch 在(zài )報(bào)告中寫道(dào ):“我們與(yǔ ) OpenAI 的結(jié)果差異可能(néng )是因(yīn )為(wéi ) OpenAI 在(zài )內(nèi)部評(píng)(píng )估時(shí)使用了更強(qiáng)大(dà )的計(jì)算框架(jià )、更多的測(cè)試時(shí)計(jì)算資源,或者是因?yàn)檫@些結(jié)果是在 FrontierMath 的不同子集(jí )上(shàng )運(yùn)行(háng )的(de )(例如 2024 年(nián ) 11 月 26 日版本的 180 個(gè)問(wèn)題與 2025 年 2 月 28 日私有版本的 290 個(gè)(gè )問(wèn)題)?!?
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利