ThemeStation:AI生成3D主题乐园,风格一致角色、建筑批量一键生成
“ThemeStation: Generating Theme-Aware 3D Assets from Few Exemplars”
3D模型生成需要设计师消耗大量的精力完成,目前无法快速大规模生成。为了解决这个问题,提升3D...
腾讯开源Hunyuan-DiT混元大模型,首个中文原生DiT架构大模型,刷新多个SOTA
近日,腾讯开源了旗下的混元大模型Hunyuan-DiT。模型含有15亿参数量,在文本-图像一致性、排除AI伪像的能力、主题清晰度和美感等任务上取得全面SOTA。
目前已在 Hug...
SemCity:使用AI进行真实3D户外环境场景生成
摘要
SemCity是一个3D Diffusion模型,用于在现实世界的户外环境中生成语义场景。与合成数据不同,真实的户外数据集由于传感器限制通常包含更多的空白空间,这给学习真实户外...
清华发表GeneOH Diffusion,让AI看懂手物交互动作,迈进全息操作
“GENEOH DIFFUSION: TOWARDS GENERALIZABLE HAND-OBJECT INTERACTION DENOISING VIA DENOISING DIFFUSION”
电影《钢铁侠》中史塔克可以通过挥动双手直接操作全息投影中...
FixAgent:使用大模型进行自动化代码调试,80个BUG中成功修复了79个!
“A Unified Debugging Approach via LLM-Based Multi-Agent Synergy”
对于程序员来说,找BUG是一个痛苦的过程。目前的大模型已经可以自己写代码了,那是否可以实现自动D...
字节发表StoryDiffusion:让AI生成一个好的漫画故事,已开源
你是否还在为如何创作一个漫画故事发愁?让我们来看看字节和南开发表的StoryDiffusion,让AI自动生成一个好的漫画故事。
项目主页:https://storydiffusion.github.io/
...
ChatHuman:一个模型实现3D数字人交互分析、3D姿势估计、情感分析
“ChatHuman: Language-driven 3D Human Understanding with Retrieval-Augmented Tool Reasoning”
项目主页:https://chathuman.github.io/
论文地址:https://arxiv.o...
ID-Aligner:要真实还要好看,结合美学评分的高保真身份保持生成方法
“ID-Aligner: Enhancing Identity-Preserving Text-to-Image Generation with Reward Feedback Learning”
项目主页:https://idaligner.github.io/
论文地址:https://...
清华发表AutoWebGLM,基于大模型的自动网页导航Agent,让大模型帮我们浏览网页
“AutoWebGLM: Bootstrap And Reinforce A Large Language Model-basedWeb Navigating Agent”
AutoWebGLM是一个旨在构建更高效的语言模型驱动的自动web导航代理的项目。...
LinkIn最新研究,利用大模型提升客户技术支持服务质量,有效降低28.6%响应时间
本文介绍了一种将知识图谱与检索增强生成(RAG)相结合的客户服务问答方法。本方法利用历史问题构建知识图谱,保留了问题内部结构和问题间关系,提高了检索准确...