在这个信息爆炸的时代,每个人都渴望拥有一个随时随地能给予帮助的智能助手。 最近,微软刚刚宣布,他们的iOS Copilot APP现已正式上架,而且,它搭载了强大的GPT-4模式。是的,你没有听错...
2024-01-04 598

Text2Immersion是一种创新的方法,通过文本提示生成高质量的3D沉浸式场景。该项目的流程首先利用预训练的2D扩散和深度估计模型逐步生成高斯云,然后在高斯云上进行细化阶段,通过插值和细化...
2024-01-04 556

自发布以来,曾被认为是世界上最强大的 GPT-4 也经历了多场「信任危机」。 ChatGPT发布一年多,已经在全世界累积了超过1.8亿用户。而随着越来越多的人们开始频繁使用它,近几个月关于GPT-...
2024-01-04 522

阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。 模型下载地址:https://huggingface.co/damo-vilab/dre...
2024-01-04 601

MyShell最新推出的开源语音克隆工具OpenVoice引起了广泛关注。这一创新产品由麻省理工学院(MIT)、清华大学以及加拿大人工智能初创公司MyShell合作开发。OpenVoice采用了一种概念简单但高效...
2024-01-04 625

“DreamGaussian4D: Generative 4D Gaussian Splatting” 项目主页:https://jiawei-ren.github.io/projects/dreamgaussian4d/ 论文地址:https://arxiv.org/abs/2312....
2024-01-02 595

清华大学智普AI的研究人员开发了一种新的视觉语言模型(VLM),名为 CogAgent。该模型专门设计用于理解和导航图形用户界面(GUI)。 CogAgent 通过采用低分辨率和高分辨率图像编码器而脱颖而出...
2024-01-02 605

“CoSeR: Bridging Image and Language for Cognitive Super-Resolution”   图像超分辨率技术旨在将低分辨率图像转换为高分辨率图像,从而提高图像的清晰度。现有的超分...
2024-01-02 1.18k

生成式大语言模型 (LLM) 因其在各种任务中的出色表现而闻名,包括复杂的自然语言处理 (NLP)、创意写作、问答和代码生成。近年来,LLM 已在易于使用的本地系统上运行,包括带有消费级 GPU ...
2024-01-02 621

人工智能的崛起可能会彻底改变数字平台的格局,甚至在某些领域取代传统互联网。据雷蒙德·詹姆斯分析师称,亚马逊和Facebook旗下的Meta平台似乎是在这一未来中更具前景的投资选择,而非谷歌...
2024-01-02 441
显示验证码