C114通信网:门户-论坛-人才网-百科-IDC产业联盟

移动版-English


谷歌推出多模态VLOGGER AI:让静态肖像图动起来“说话”

谷歌近日在 GitHub 页面发布博文,介绍了 VLOGGER AI 模型,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物动起来,富有面部表情地朗读音频内容。VLOGGER AI 是一种适用于虚拟肖像的多模态 Diffusion 模型,使用 MENTOR 数据库进行训练,该数据库中包

https://www.c114.com.cn/ai/5339/a1257647.html - 转载 - 2024-3-19

1
Copyright©1999-2024 c114 All Rights Reserved
上海荧通网络信息技术有限公司版权所有
南方广告业务部: 021-54451141,54451142 E-mail:c114@c114.net
北方广告业务部: 010-63533177,63533977 E-mail:shixinqi@c114.com.cn
编辑部联系: 021-54451141,54451142 E-mail:editor@c114.com.cn
服务热线: 021-54451141,54451142
沪ICP备12002291号