實驗表明,傳統(tǒng)世界模型(xíng )通常聚焦于(yú ) RGB 圖像的預(yù)測而(ér )忽略了(le )背后隱含(hán )的幾何(hé )信息,引(yǐn )入空間建模后,各(gè )項指標(biāo)均顯著提升,其中視頻一致性指標(biāo)提升約 4%。更重要的(de )是,即使只使(shǐ )用合(hé )成數(shù)據(jù)進行(háng )訓(xùn)練,模型在真實環(huán)境中依(yī )然展(zhǎn )現(xiàn)出強大的零樣本泛化能力。
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利