CogAgent

这几天，OpenAI推出的视频生成工具 Sora 火爆出圈，生成的视频可以以假乱真。然而，很多时候直接生成的视频难以满足需求，需要二次剪辑。目前视频剪辑依然主要依赖人工...

2024-02-26 1.69k

清华大学智普AI的研究人员开发了一种新的视觉语言模型（VLM），名为 CogAgent。该模型专门设计用于理解和导航图形用户界面(GUI)。 CogAgent 通过采用低分辨率和高分辨率图像编码器而脱颖而出...

2024-01-02 780

微信公众号