“Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models”   近日,香港中文大学终身教授贾佳亚团队发表了Mini-Gemini多模态模型,该模型在多模...
2024-04-18 352

“CharacterGen: Efficient 3D Character Generation from Single Images with Multi-View Pose Canonicalization”   游戏建模需要专业的人员,消耗大量时间完成。近...
2024-04-18 624

众所周知,前段时间OpenAI推出的Sora文生视频AI模型爆火,让“生成式AI”在视频创作方面的潜力再一次受到了大众的关注。甚至有不少创作者都因此“哀嚎”,称传统的视频拍摄和剪辑人员可能会因此...
2024-04-17 354

“Mora: Enabling Generalist Video Generation via A Multi-Agent Framework”   Sora的爆火带动了AI视频生成的关注,然而闭源的Sora为后续研究带来了挑战。为了解...
2024-04-17 351

近期,一篇名为Stream Multi Diffusion的论文提出了一种新颖的实时、交互式的文本到图像生成系统。这种系统能够根据用户提供的手绘区域和相应的语义文本提示来生成图像,为专业图像创作者提...
2024-04-17 257

OOTDiffusion是一个高度可控的虚拟服装试穿开源工具,经过测试,效果非常出色。该工具可以根据不同性别和体型自动调整,与模特身形非常贴合。同时,用户也可以根据自己的需求和偏好调整试穿...
2024-04-17 569

LaVague 是一个旨在自动化浏览器交互的大型动作模型框架,通过将自然语言指令转化为无缝的浏览器交互,重新定义了互联网浏览体验。 该框架的设计初衷是为用户自动化繁琐的任务,节省时间,让...
2024-04-17 396

在数字媒体和虚拟现实领域,3D动画角色的创建一直是一个重要的环节。现在,一款名为Cartwheel的新工具正在改变这一游戏规则。Cartwheel是一个创新的文本转3D动画工具,它能够仅通过输入文字...
2024-04-03 487

3 月 14 日消息,初创公司 Figure AI 今天发布一段新视频,展示了人形机器人 Figure 01所具备的技能,网友在视频中留言:“未来 5-10 年绝对是一个疯狂的时代”。 Figure 01 身高167.64 厘米...
2024-03-31 491

      Google DeepMind最新研究:推出名为Genie的模型,能够从图像中生成类似于超级马里奥兄弟游戏的2D视频游戏。       Genie代表Generative Interactive Environments,经过在互联网视频...
2024-03-28 360
显示验证码