這(zhè )并不意(yì )味著 OpenAI 故意撒(sā )謊(huǎng ),該公司在 12 月份公布的基準(zhǔn)測試結(jié)果中也包含了一(yī )個與 Epoch 測試結(jié)果相符的較低分?jǐn)?shù)。Epoch 還指出,其測試設(shè)置可能(néng )與 OpenAI 有所不同(tóng ),并且(qiě )其評(píng )估使用了(le )更新(xīn )版本(běn )的 FrontierMath。Epoch 在報(bào )告中寫道:“我們與 OpenAI 的結(jié)果(guǒ )差異可能是因為 OpenAI 在(zài )內(nèi)部評估時使用了(le )更強大的計算框(kuàng )架、更多的(de )測試時計算(suàn )資源,或者是因為這些結(jié)果(guǒ )是在 FrontierMath 的不同子集上運行的(例如 2024 年 11 月(yuè ) 26 日版本的(de ) 180 個問題與 2025 年 2 月 28 日私有版本(běn )的 290 個問題)。”
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利