SceneVerse:百万级别的3D视觉语言数据集,3D场景理解新SOTA
“SCENEVERSE: Scaling 3D Vision-Language Learning for Grounded Scene Understanding”
项目主页:https://scene-verse.github.io
论文地址:https://arxiv.org/pdf/2...
字节发表Boximator,为视频合成生成丰富和可控的运动,可以控制由图片生成的视频中物体的运动轨迹
本文提出了一种用于细粒度运动控制的新方法Boximator。Boximator可以控制由图片生成的视频中物体的运动轨迹。先圈出图片中的主体,再圈出要移动到位置,即可生成主体从...
继GPT-4出来之后 一款击败「GPT-4之外所有大模型神秘新模型」“Miqu”展露锋芒
近期AI社区掀起了一场关于Mistral-Medium模型的讨论,该模型意外泄露并与一个名为quot;Miququot;的新模型有关。Miqu在EQ-Bench基准上的表现引起关注,直接击败除GPT-4之外的所有大模型,得分...
微软成立专门的 AI 团队,开发类似 OpenAI 模型的小型 AI 模型,成本更低
微软正在与 OpenAI 竞争,在开发小型语言模型方面形成了专门的 AI 团队。据《The Information》报道,这些小型语言模型将具有类似于 OpenAI 的 ChatGPT 的功能。微软已经组建了一个团队来应...
阿里推生成模型开源框架SCEPTER 支持和简化图像生成
SCEPTER是由阿里巴巴开发的一个专为生成模型设计的开源框架。它用于训练、微调和推理生成模型,涵盖诸如图像生成、转换和编辑等下游任务。这个框架专门用于支持和简化图像生成、合成和编辑任...
华盛顿大学推高效大模型调优方法“代理调优”
华盛顿大学推出更高效的大模型调优方法“代理调优”,该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测,实现对模型的调优而无需接触模型的内部权重。
随着ChatGPT等生...
腾讯发表VideoDrafter,一次性生成多个场景的视频
VideoCrafter 由腾讯ai实验室和香港科技大学主导,同时也有来自中国科学院、香港中文大学和香港城市大学的研究人员参与。是一款全新的视频生成模型,可以进行创建和编...
拉勾招聘大数据研究院:2023年00后职场生态洞察报告(PDF下载)
报告显示,近七成00后理想月薪要过万,其中26%的00后期望月薪为10000-15000元,42%的00后期望月薪在15000元以上;另有24%的00后期望月薪在5000-10000元,仅有8%的00后期望月薪在5000以下。这...
推荐5款好用的AI音频工具,好用到爆!
今天小编要给大家推荐的是5款好用的音视频处理工具,快来看看吧!
讯飞智作
https://peiyin.xunfei.cn/
一款一站式智能配音服务平台,提供AI文字转语音、语音合成、智能配音、AI虚拟主播...
字节发表Magic-Me,仅需几张图片即可实现特定人物的AI视频生成
在文本到图像生成(T2I)领域,主题驱动的内容生成已经取得了巨大的进展,图像中的ID是可控的。然而,直接将其扩展到视频生成还没有得到很好的探索。
本文提出一种简单...