宁德生活圈

网站首页 科技 > 正文

人工智能听人的声音 然后产生他们的脸

2021-09-16 20:36:53 科技 来源:
导读 你有没有仅仅根据一个人的声音,构建出一个你从未见过的人的心理形象?人工智能(AI)现在可以做到这一点,只有短音频剪辑可以作为参考来生成

你有没有仅仅根据一个人的声音,构建出一个你从未见过的人的心理形象?人工智能(AI)现在可以做到这一点,只有短音频剪辑可以作为参考来生成人脸的数字图像。

AI倾听了人们的声音然后产生了他们的脸

名为“Speech2Face”(一种以类似人脑的方式“思考”的计算机)的神经网络已经被科学家训练,并从互联网上接收了数百万个教育视频,显示了10多万个不同的人在说话。

在一项新的研究中,研究人员写道,Speech2Face通过这个数据集学习了语音提示和人脸的一些物理特征之间的关系。然后,人工智能使用音频剪辑来建模与语音匹配的真实人脸。

幸运的是,人工智能不能仅仅通过声音就确切地知道一个特定的人是什么样的。作者报道,神经网络识别语音中的一些标记,这些标记指向性别、年龄和种族,这是许多人的共同特征。

AI倾听了人们的声音然后产生了他们的脸

科学家写道:“因此,这种模型只会产生长相普通的面孔。”“它不会产生特定个人的图像。”

虽然坦白说,猫的解释有点吓人,但AI已经证明了它可以产生极其准确的人脸。

Speech2Face生成的面孔——全部面向前方,表情中性——与声音背后的人并不完全匹配。然而,根据这项研究,这些图像通常确实捕捉到了正确的年龄范围、种族和性别。

然而,这种算法的解释远非完美。面对语言的变化,Speech2Face表现出“混合表情”。例如,当AI听亚洲人说中文的音频片段时,程序会产生亚洲面孔的图像。然而,根据科学家的说法,当同一个人用不同的音频片段说英语时,人工智能会产生白脸。

AI倾听了人们的声音然后产生了他们的脸

该算法还显示了性别偏见,将低频声音与男性面孔联系起来,将高频声音与女性面孔联系起来。研究人员写道,由于训练数据集仅代表YouTube上的教育视频,因此“不能代表整个世界人口。”

郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。


免责声明: 本文由用户上传,如有侵权请联系删除!


标签: