Meta发表基于大模型的视频剪辑工具 LAVE,开始使用 Agent 剪视频了!
这几天,OpenAI推出的视频生成工具 Sora 火爆出圈,生成的视频可以以假乱真。然而,很多时候直接生成的视频难以满足需求,需要二次剪辑。目前视频剪辑依然主要依赖人工...
清华大学开发出新视觉语言模型 可更准确理解 GUI
清华大学智普AI的研究人员开发了一种新的视觉语言模型(VLM),名为 CogAgent。该模型专门设计用于理解和导航图形用户界面(GUI)。
CogAgent 通过采用低分辨率和高分辨率图像编码器而脱颖而出...