腾讯开源视频运动控制器MotionCtrl,可有效控制AI视频中人物运动轨迹
之前给大家介绍过《 腾讯开源视频运动控制器 MotionCtrl》,这是一个可以用于控制 AI 生成视频中物体的运动路径的控制器,近期官方又上架了 MotionCtrl+SVD,让大家可以控制 SVD 生成视频时...
阿里AI项目DreamTalk开源 可让人物头像说话
阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。
模型下载地址:https://huggingface.co/damo-vilab/dre...
旷视发表Vary,开源大模型OCR引擎,支持中英文,一键识别图片中的文本、公式、表格
“Vary: Scaling up the Vision Vocabulary for Large Vision-Language Models”
近日,旷视发表了Vary,可以一键识别图片中的文本、公式、表格,并输出成markdown格式。...
开源白板工具Excalidraw新增AI功能「Text to diagram 」,输入提示词即可画出知识图表
Excalidraw 是一个开源的白板工具,可以用于创建漂亮的手绘图、线框图或任何您喜欢的内容,支持支持多人协作、从 Excel 粘贴表格、快捷键等功能,还可以自托管。近期官方又添加了 AI 功能...