MoA:用于图片合成的混合注意力架构 可实现风格参考和人物融合
在最新的研究中,提出了一种名为注意力混合模式(MoA)的新架构,旨在个性化文本到图像扩散模型,可以实现风格参考和人物融合的效果。
受大型语言模型(LLMs)中使用的专家混合机制的启发,M...
DeepMind研究发现提升语言模型推理能力的简单方法FACENOW 的报道 • 3 周 • 2 分钟读取
深度学习领域的研究人员发现,语言模型在逻辑推理方面的表现仍然是一个重要挑战。最新的一项由Google旗下的DeepMind(DeepMind)进行的研究揭示了一个简单而重要的发现:任务中前提的顺序显著...
Meta发表基于大模型的视频剪辑工具 LAVE,开始使用 Agent 剪视频了!
这几天,OpenAI推出的视频生成工具 Sora 火爆出圈,生成的视频可以以假乱真。然而,很多时候直接生成的视频难以满足需求,需要二次剪辑。目前视频剪辑依然主要依赖人工...
UC伯克利发表大世界模型,上下文长度可达100万Token
“WORLD MODEL ON MILLION-LENGTH VIDEO AND LANGUAGE WITH RINGATTENTION”
世界包含丰富的信息,人类在理解世界时需要整理来自文字、图片、声音等多个维度的信息,单纯...
华盛顿大学推高效大模型调优方法“代理调优”
华盛顿大学推出更高效的大模型调优方法“代理调优”,该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测,实现对模型的调优而无需接触模型的内部权重。
随着ChatGPT等生...
国内首个与ChatGPT不同机制的通用大模型发布,算力消耗缩减50%
1月24日下午,国内AIGC企业上海岩芯数智人工智能科技有限公司(岩芯数智,RockAI)在上海发布了国内首个自研的非Transformer Attention机制的低算力通用自然语言大模型——Yan模型,记忆能力提...
没法使用ChatGPT?使用这些程序在本地打造专属GPT,轻松运行大语言模型
在大语言模型方面最强的就是 OpenAI 旗下的 ChatGPT,不过国内使用可能不太方便,好在现在有非常多开源的大语言模型,让大家可以在自己的电脑上运行大语言模型,不仅可以聊天还可以编程,让...
生成式LLM PowerInfer:单个GPU就能运行,机器学习模型推理速度提高11倍
生成式大语言模型 (LLM) 因其在各种任务中的出色表现而闻名,包括复杂的自然语言处理 (NLP)、创意写作、问答和代码生成。近年来,LLM 已在易于使用的本地系统上运行,包括带有消费级 GPU ...
谷歌重磅发布零样本视频生成模型!10秒生成视频,效果碾压顶流Gen-2
自从人工智能诞生以来,科技巨头们就在不断探索如何利用这个强大的工具改变世界,在图像生成、语音识别、自然语言处理等领域取得突破后,人工智能的下一个目标就是视频生成。
回看过去几个...
AI版权第一案判决书来了,AI 创作者终于可以放心大胆的创作了!
最近,在北京互联网法院,审理的国内首例“AI文生图”侵权案中,原告李某某使用了Stable Diffusion人工智能大模型,通过输入提示词生成了一张人物图片,并在小红书平台发布。被告刘某某在个...
- 1
- 2