宁德生活圈

网站首页 互联网 > 正文

谷歌使用本地化叙事来增强开放图像数据集 以促进人工智能

2021-09-17 02:48:42 互联网 来源:
导读 谷歌LLC今天推出了新版Open Images(其用于人工智能研究的照片数据集),增加了数百万个其他数据点,并提供了名为“本地化叙述”的功能,

谷歌LLC今天推出了新版Open Images(其用于人工智能研究的照片数据集),增加了数百万个其他数据点,并提供了名为“本地化叙述”的功能,旨在帮助学术项目。

谷歌利用本地化叙事增强了开放图像数据集以推进人工智能

Open Images于2016年首次发布,其中包含900万张带有描述性标签的照片。这样的数据集在人工智能生态系统中扮演着重要的角色。研究人员利用它们为目标识别和自动驾驶等任务开发新的机器学习模型。

除了提供免费照片,Open Images还包含数百万条对AI培训有价值的评论。未经训练的神经网络无法自行识别照片中的物体,因此需要注释等元数据来理解屏幕上的内容。元数据越详细,AI就能学得越好。

今天发布的新版“开放图像”增加了2350万个“照片级”标签,这些标签已经被人类验证,可以提供图像中发生的事情的大致描述。数据库现在总共有5990万个这样的标签。谷歌还添加了更多的上下文注释,包括250万个用于描述照片中人们所做动作的标签,以及另外39.1万个用于描述对象之间关系的标签。

然而,最大的亮点是谷歌的本地化叙事。这些都是搜索巨头开发的新标注,希望AI模型能比旧的标注方法收集到更多关于图像的信息。

谷歌利用本地化叙事增强了开放图像数据集以推进人工智能

谷歌通过让人类播音员悬停在照片中的每个物体上,并用他们自己的话描述它,来生成本地化的叙述。然后将光标移动的记录与自然语言描述进行匹配,这样每个单词都可以与它所应用的对象相关联。谷歌表示,这种方法将使人工智能模型在开放图像数据集上训练时能够更有效地学习。

“为了理解这些本地化叙述所代表的更多数据,鼠标轨迹的总长度约为6400公里。如果你一直大声朗读,所有的叙述都需要大约1.5年才能听完,”谷歌研究科学家乔迪庞特-图塞特在他的博客文章中详细介绍道。

谷歌利用本地化叙事增强了开放图像数据集以推进人工智能

到目前为止,谷歌已经为大约50万个开放图像文件创建了本地化的叙述。Pont-Tuset写道,此次更新代表着“在改进图像分类、对象检测、视觉关系检测和案例分割的统一标注方面迈出了重要的定性和定量的一步。”“我们希望Open Images V6能够进一步激发人们对真实场景的理解。”

郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。


免责声明: 本文由用户上传,如有侵权请联系删除!


标签: