春节将至,赶快来让LLM(大语言模型)准备拜年文案啦!
前言
春节,是中国最重要的传统节日之一,在春节期间,人们通常会进行相互拜年以传达对新的一年的美好祝福。
过去小编每年给亲朋好友拜年时,基本上都是东抄抄西抄抄,综合上几篇拜年...
一张草稿让AI做个想象中的CG(Stable Diffusion进阶篇:AI手稿到动画)
很多人可能都看过至少是听说过《三体》这本书吧,再不济也听说过《流浪地球》这部电影,作为中国科幻小说界的扛把子,刘慈欣老师描绘出的科幻世界给予了我无限的想象空间。
不知道有没有人...
Github爆火AI语音克隆项目OpenVoice,精准进行声音复刻
最近,Github上的一个名为OpenVoice的AI语音克隆项目爆火,该项目由myshell-ai开源,仅开源了不到三周,就有了6.1k的star。
OpenVoice仅需参考说话者的短音频片段,即可复制其声音并生成多种...
Unified-IO 2:首个图像/文本/音频/视频/动作多模态模型,迈向AGI任务
“Unified-IO 2: Scaling Autoregressive Multimodal Models with Vision, Language, Audio, and Action”
Unified-IO 2号称是第一个能够理解和生成图像、文本、音频和动...
清华、浙大推GPT-4V开源平替!LLaVA、CogAgent等开源视觉模型大爆发
近期,GPT-4V的开源替代方案在中国的顶尖学府清华、浙大等的推动下,出现了一系列性能优异的开源视觉模型。其中,LLaVA、CogAgent和BakLLaVA是三种备受关注的开源视觉语言模型。
LLaVA是一个...
Pose Anything:类别无关通用姿态估计方法,实现任意目标类别的关键点定位
“Pose Anything: A Graph-Based Approach for Category-Agnostic Pose Estimation”
本文提出一种新的CAPE方法,通过新设计的Graph Transformer Decoder,利用关键点之间...
阿里达摩院发表AnyText,解决文生图中文字生成模糊、错误问题
“ANYTEXT: MULTILINGUAL VISUAL TEXT GENERATION AND EDITING”
文生图中的文字生成问题一直困扰着广大AIGC应用,今日,阿里发表了AnyText针对这个问题进行了优化。接下...
阿里发表Make-A-Character,AI头像生成工具,几分钟内即可生成高质量3D的动画人物头像
“Make-A-Character: High Quality Text-to-3D Character Generation within Minutes”
项目主页:https://human3daigc.github.io/MACH/
论文地址:https://arxiv.org/...
AI绘画新革命!解锁DALL·E创造一致性图像的秘密
当我们谈论AI绘画时,Chatgpt的DALL·E因其超强的语义理解能力而备受关注。但它也有其不足之处,即随机性太强,画质稍逊。然而,如果我们能解决这些问题,DALL·E的潜力将是无限的。
让我们来...
52页 | 快手&磁力引擎:快手CNY用户数据洞察(文末附下载)
报告显示,在2023年春节期间,快手平台的日均活跃用户数较去年同期提升了8.5%,APP使用时长更是同比增加了11.7%,为品牌营销提供了高价值阵地。
女性用户在这次增长中发挥了重要作用,其增速...