隨著多智能體的優(yōu)勢(shì )成(chéng )為共(gòng )識,其(qí )評估(gū )范式亦需有根(gēn )本性的變革 ——MAS 評估應(yīng)聚焦(jiāo )于 Agent 交互的(de )整體性(xìng ),包括協(xié)同規(guī)劃的效率、信息傳遞的(de )質(zhì)量(liàng )與群體決策的性能等關(guān)鍵維度。由此衍(yǎn )生,作者總結(jié)了 MAS 常見的任務(wù)(wù )求解型 benchmark,以及最新的通(tōng )用能力評估方式(shì ):前者的(de )重點在于,衡(héng )量(liàng )多智能體在各種環(huán)境中的決策協(xié)(xié )同的推(tuī )理深度(dù )與正確性;后者評估智能體(tǐ )群在復(fù)(fù )雜(zá )、動態(tài)場景下的交互與適應(yīng)(yīng )能力。
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利