“CharacterGen: Efficient 3D Character Generation from Single Images with Multi-View Pose Canonicalization”   游戏建模需要专业的人员,消耗大量时间完成。近...
2024-04-18 618

“Mora: Enabling Generalist Video Generation via A Multi-Agent Framework”   Sora的爆火带动了AI视频生成的关注,然而闭源的Sora为后续研究带来了挑战。为了解...
2024-04-17 347

视频到视频编辑涉及编辑源视频和附加属性(如文本提示、主题或样式),以生成与源视频和提供的控件一致的新视频。传统方法受限于特定的编辑类型,限制了其满足用...
2024-03-28 460

淘宝买衣服的时候不知道上身效果如何?想知道衣服穿在模特身上和穿在自己身上效果有什么区别?今天我们来看看阿里最新推出的虚拟试衣方法Wear-Any-Way,不仅可以试穿衣...
2024-03-28 792

摘要 目前个性化文本到图像扩散模型中的两个问题:多个概念的个性化技术不可靠,以及缺乏综合评估性能的度量标准。为了解决这些问题,作者提出了Gen4Gen数据集...
2024-03-28 407

“AnyGPT: Unified Multimodal LLM with Discrete Sequence Modeling” 现实世界是多模态的,生物体间通过视觉、语言、声音和触觉等多种方式感知和交换信息。近日,复旦大...
2024-03-06 630

“SongComposer: A Large Language Model for Lyric and Melody Composition in Song Generation” 创作一首歌曲包含歌词和旋律两部分,对于人类而言,能掌握其中一样已经...
2024-03-06 914

近日,港城大、快手、天大联合发表Direct-a-Video,成功解耦AI生成视频中物体运动和摄像机运动,让视频生成的灵活性和可控性大大增强! 项目主页:https://direct-a-vi...
2024-03-06 523

这几天,OpenAI推出的视频生成工具 Sora 火爆出圈,生成的视频可以以假乱真。然而,很多时候直接生成的视频难以满足需求,需要二次剪辑。目前视频剪辑依然主要依赖人工...
2024-02-26 1.22k

DreamTalk是一个基于扩散的音频驱动的富有表现力的说话头生成框架,可以生成不同说话风格的高质量的说话头视频。DreamTalk对各种输入表现出强大的性能,包括歌曲、多语...
2024-02-26 698
显示验证码