3、VLA(視覺(jué)-語(yǔ)言-動(dòng)作模型)是在具身智能研(yán )究中(zhōng )產(chǎn)(chǎn )生的一種多模態(tài)模型(xíng ),用于(yú )處理(lǐ )具身智(zhì )能(néng )系統(tǒng)所面(miàn )對(duì)語(yǔ)言條件機(jī)器人(rén )任(rèn )務(wù)。谷(gǔ )歌 DeepMind 在 2023 年 7 月發(fā)布的 RT-2 被認(rèn)為是首個(gè)(gè ) VLA,而(ér )后這種概念在具身智能、機(jī)(jī )器人和智駕領(lǐng)域中迅速擴(kuò)散。
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利