人工智能·头条

PoseAnimate：首个高质量零样本角色动画生成方法

“PoseAnimate: Zero-shot high fidelity pose controllable character animation”论文地址：https://arxiv.org/pdf/2404.13680.pdf 摘要 PoseAnimate是一个...

2024-04-28 724

阿里发表DivAvatar，简单提示即可生成多样化3D人物头像，单张V100即可运行

人工智能·头条

“DivAvatar: Diverse 3D Avatar Generation with a Single Prompt” 近日，阿里发表了DivAvatar，解决了当前头像方法中普遍存在的多样性挑战。DivAvatar能够从单个文本...

2024-04-19 825

超级重磅！Meta发布开源大语言模型Llama 3系列

人工智能·头条

说到开源大语言模型，最重要的就是Meta的Llama系列，尤其是去年发布的Llama2，成了很多大学、研究机构、甚至初创公司研究及开发大语言模型的基础。大家一直都在期待Meta发布Llama 3，原...

2024-04-19 791

新版DALL-E好不好用？你必须知道的新功能

人工智能·头条

目前AI绘画的三大王者：Midjourney、Stable Diffusion、DALL-E，可以说是各有特色。因为托身于ChatGPT这样的自然语言大模型，DALL-E是这三大王者中对提示词理解能力最强的，也是唯一使用自...

2024-04-19 683

谷歌发布基础世界模型Genie：11B参数，单张图生成可交互的虚拟世界

人工智能·头条

谷歌最新发布了基础世界模型Genie，这一模型拥有110亿参数，能够生成可交互的虚拟世界。Genie的出现让人们看到了人工智能在虚拟世界的无限可能性。Genie可以在没有动作标签的情况下学习控制...

2024-04-19 862

新加坡国立大学研究人员设计出一种利用鱼鳞传递加密信息的方法

人工智能·头条

科学家们设计出了一种利用鱼鳞传递加密信息的方法。这项技术不仅能将海鲜业的废弃物从垃圾填埋场转移出来，而且成本也低于特殊油墨等现有方案。这项技术是由 Sow Chorng Haur 教授领导的新加...

2024-04-19 628

美团&浙大发表MobileVLM V2，端侧实时运行，更快更强的轻量化VLM

人工智能·头条

“MobileVLM V2: Faster and Stronger Baseline for Vision Language Model” 大模型的轻量化已经成为了业界追逐的热点，近日，美团、浙大发表了MobileVLM V2。MobileVLM ...

2024-04-19 1.17k

华科&金山发表TextMonkey，通用文档理解大模型，刷新多个SOTA

人工智能·头条

“TextMonkey: An OCR-Free Large Multimodal Model for Understanding Document” 由华科和金山联合开发的Monkey多模态大模型早前已被人工智能领域国际顶级会议CVPR2024...

2024-04-19 824

研究人员推一款开源Python库DataDreamer:可通过编写简单代码简化和管理LLM工作流程

人工智能·头条

DataDreamer 是一款开源 Python 库，旨在简化和管理大语言模型（LLMs）的工作流程。 DataDreamer 提供了一套功能，大大降低了有效使用 LLMs 的障碍。 DataDreamer 的方法论集成了解决 LL...

2024-04-19 761

Stability AI发布Stable Video 3D，单张图片即可生成高质量3D视频，模型已开源，单张4090即可运行

人工智能·头条

“SV3D: Novel Multi-view Synthesis and 3D Generation from a Single Image using Latent Video Diffusion” Stability AI日前发布了用于3D视频模型Stable Video 3D...

2024-04-19 1.24k

PoseAnimate：首个高质量零样本角色动画生成方法

阿里发表DivAvatar，简单提示即可生成多样化3D人物头像，单张V100即可运行

超级重磅！Meta发布开源大语言模型Llama 3系列

新版DALL-E好不好用？你必须知道的新功能

谷歌发布基础世界模型Genie：11B参数，单张图生成可交互的虚拟世界

新加坡国立大学研究人员设计出一种利用鱼鳞传递加密信息的方法

美团&浙大发表MobileVLM V2，端侧实时运行，更快更强的轻量化VLM

华科&金山发表TextMonkey，通用文档理解大模型，刷新多个SOTA

研究人员推一款开源Python库DataDreamer:可通过编写简单代码简化和管理LLM工作流程

Stability AI发布Stable Video 3D，单张图片即可生成高质量3D视频，模型已开源，单张4090即可运行

微信公众号

客服微信