宁德生活圈

网站首页 互联网 > 正文

谷歌的VideoBERT算法可以一次性预测未来的烹饪视频

2021-09-13 15:20:08 互联网 来源:
导读 谷歌有限责任公司(Google LLC)今天推出了VideoBERT,这是一种人工智能,可以像人类一样观看视频的一部分,并推断未来几秒钟内会发生什么

谷歌有限责任公司(Google LLC)今天推出了VideoBERT,这是一种人工智能,可以像人类一样观看视频的一部分,并推断未来几秒钟内会发生什么。

Google的VideoBERT算法可一次预测未来的烹饪视频

为了使计算机能够理解视觉场景并从中得出正确的结论,需要非常复杂的算法。然而,对于谷歌研究人员来说,挑战不是构建算法,而是找到足够的数据进行训练。机器学习模型必须吸收大量信息才能理解甚至基本概念,通常必须手动准备信息。

对于VideoBERT来说,这是不可行的,因为教模型如何预测未来事件需要更多的示例视频,这些视频可以由谷歌研究人员手动组装。他们还必须为每个片段的每个单独帧编写描述,以便人工智能可以跟踪正在发生的事情。于是,团队提出了一个替代方案:免费教学视频。

Google的VideoBERT算法可一次预测未来的烹饪视频

在展示如何烹饪煎蛋或填充轮胎的视频中,演示任务的人通常会解释执行任务时的每一步,并逐帧描述研究人员用来替换他们应该做的事情的描述,否则就是为AI创建的。该团队编辑了100多万个剪辑,涵盖了烹饪和园艺等类别。然后,他们把它们喂给VideoBERT,教模型如何跟踪常见活动的进度。

训练结束后,模特被放上了一段从未见过的烹饪视频。当视频片段显示一碗面粉和可可粉的视频片段时,VideoBERT巧妙地预测到这些食材会被放入烤箱,变成布朗尼或蛋糕。研究人员还设法利用算法的观察技术从视频中提取食谱,厨师在视频中解释了如何烹饪牛排。

Google的VideoBERT算法可一次预测未来的烹饪视频

谷歌开发的训练VideoBERT的方法终于可以在更严肃的应用中找到用途。例如,如果自动驾驶汽车能够在接下来的几秒钟内准确预测附近车辆的位置,它们可能会变得更加安全。对于在人类工人附近工作的无人机和工业机器人来说,这一愿景也可能是一项重要资产。

郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。


免责声明: 本文由用户上传,如有侵权请联系删除!


标签: