宁德生活圈

网站首页 互联网 > 正文

提升AI在常识推理方面的最新技术水平

2021-09-13 21:45:58 互联网 来源:
导读 对于任何事物的最新技术水平来说,10%是一个相当大的进步。这是Salesforce对用于语言模型深度学习的常识推理的研究结果。在他的论文中,解

对于任何事物的最新技术水平来说,10%是一个相当大的进步。这是Salesforce对用于语言模型深度学习的常识推理的研究结果。

在他的论文中,解释你自己!用于常识推理的语言模型的使用将在明天的计算语言学协会(ACL)2019年会上展示。Salesforce的研究人员揭示了两个重要贡献:CoSE,一个关于常识解释的数据集;还有CAGE,一个自动解读常识的模型。ZDNe借此机会与两位Salesforce Research的科学家Nazneen Rajani和Bryan McCann进行了问答。

创建常识推理数据集。

提醒一下,Salesforce的研究侧重于问答,作为通过爱因斯坦促进数据访问的一种方式。我们以前见过其他Salesforce研究人员如何调查知识地图的使用。

拉贾尼和麦肯在他们的工作中使用了不同的方法,但他们也建立在以前的一些贡献上。对于一些世界领先的研究人员来说,常识推理是一个悬而未决的问题。例如,建造凯奇的关键因素之一是开放GPT。这种配音语言模式最近由OpenAI source在埃隆马斯克(elon musk)开放,并在野外发布,因为“太危险”可能过于谨慎。

然而,它是语言模型的最新技术。正如Rajani和McCann指出的那样,这些自然语言处理网络仅限于文本,这对生活在现实世界中的人来说是一个糟糕的替代品。因此,研究人员通过要求模型阅读一系列令人难以置信的文本来训练模型,包括所有的维基百科、成千上万本书和其他方法。他们也可以查询谷歌以获得结果。

这些模型通过一个叫做常识问答(CQA)的选择题测试,其中包含需要常识推理才能回答的问题。在典型的深度学习方式中,模型在CQA的一些例子上进行训练,然后在不同的问题集上进行测试。与人类相比,众所周知,这些博览群书的神经网络在这项任务中表现非常糟糕。

拉贾尼和麦肯创建了一个基于CQA的数据集,但是他们除了回答问题之外还包括解释。这就是他们如何创建CoSE的,这是常识解释的数据集。正如Rajani所说,CoSE v1.0有8500个例子,v1.11有10962个例子,包括训练集和验证集。对于深度学习标准来说,这并不是很多数据。

拉贾尼和麦肯承认这一点,增加数据集是他们未来的目标之一。麦肯表示,他们希望将这一数据收集过程扩展到该领域的其他基准,包括自由形式的文本、结构化信息和来自图像或视频的视觉信号,以便他们能够在许多不同领域训练和解释模型。

解释是用机械土耳其人的包装制作的。请Turkers提供问题的答案,解释答案,并突出显示引导他们解释问题的部分。让我们注意到,最近关于使用Mechanical Turk对知识图表进行质量处理的研究表明,众包是此类任务的可行解决方案。

Rajani提到,有一些例子需要重新注释,尽管它们对解释的质量有最初的限制,因为它们已经陷入困境。设计任务和收集数据大约需要三周时间。CoSE可以被其他研究人员使用和进一步增强,并且可以在GitHub上获得。

郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。


免责声明: 本文由用户上传,如有侵权请联系删除!


标签: