同時,團(tuán)隊訓(xùn)練了一個統(tǒng)一的(de )視頻理解(jiě )模型 SkyCaptioner-V1,它能(néng )夠高效地理解(jiě )視頻數(shù)據(jù),生成符合原(yuán )始結(jié)(jié )構(gòu)信息的(de )多(duō )樣化描(miáo )述。通過這(zhè )種方式,SkyCaptioner-V1不僅(jǐn )能(néng )夠理解視頻的一般內(nèi)容,還能捕捉到電影場(chǎng )景中的專業(yè)鏡頭語言,從而顯著提高了生成視頻(pín )的提示詞遵循能力。此外(wài ),這個模(mó )型現(xiàn)(xiàn )在已(yǐ )經(jīng)開源,可以直(zhí )接使(shǐ )用。
版權(quán)所有 ? 2025 青龍影院 保留所有權(quán)利