宁德生活圈

网站首页 信息互动 > 正文

英伟达推出下一代视频会议

2021-06-28 11:28:24 信息互动 来源:
导读 GPU 制造商 Nvidia 发布了一个新 AI 系统的演示,该系统可以从单个静止图像创建视频会议源。Vid2Vid Cameo 于 2020 年 12 月发

GPU 制造商 Nvidia 发布了一个新 AI 系统的演示,该系统可以从单个静止图像创建视频会议源。Vid2Vid Cameo 于 2020 年 12 月发布,是一种基于 180,000 个视频数据集的深度学习模型。它使用生成对抗网络 (GAN) 使用实时视频输入为 2D 图像制作动画,还可以重新定位视频主题,使人看起来直接对着相机说话。

该系统需要两个输入:源图像(可以是真实照片或头像)和实时网络摄像头馈送。在视频通话期间,Vid2Vid Cameo 将人的动作和表情映射到提供的图像上。

正如英伟达在一篇博客文章中所解释的那样,这意味着有人可以穿着睡衣参加一个重要的会议,头发像鸟巢,但似乎穿着“适合工作”的服装。

据 Nvidia 称,Vid2Vid Cameo 还将帮助解决人们在大流行期间面临的最令人沮丧的问题之一:断断续续的低分辨率视频源。

尽管大型远程工作实验在很大程度上被认为是成功的,但诸如此类的问题已经削弱了与面对面进行有效沟通的能力。

然而,Vid2Vid Cameo 利用视频压缩技术大幅降低带宽需求,这意味着会议能够顺利进行,而不管连接质量如何。

在该系统下,不需要在参与者之间发送大量视频流,只需要发送与面部运动相关的音频数据和信息。然后,这些数据在接收方一侧被合成为视频。

“许多人的互联网带宽有限,但仍希望与朋友和家人进行流畅的视频通话,”Nvidia 研究员、该项目的合著者刘明宇说。

受益的不仅仅是远程工作者;刘说,这项技术也可能对许多创意产业产生影响,例如动画、照片编辑和游戏开发。

Vid2Vid Cameo 功能很快将与 Nvidia Maxine SDK 打包在一起,这是一个免费平台,可帮助开发人员使用一系列 AI 模型优化视频和实时流媒体。


免责声明: 本文由用户上传,如有侵权请联系删除!


标签: