网站首页 科技 > 正文
一个以人工智能领域一些最伟大的头脑为特色的研究小组正在引入一个衡量自然语言处理能力的基准。
该联盟包括谷歌深度思维、脸书人工智能、纽约大学和华盛顿大学。联盟的每个成员都认为NLP需要一个比当前解决方案更全面的基准。
根据脸书人工智能的说法,结果是一个名为SuperGLUE的基准平台,它用一个“更复杂的基准取代了一个名为GLUE的旧平台,其中包括一个全面的人类基准”。
SuperGLUE有助于测试NLP能力,之前的基准测试对于最新的系统来说太简单了。
在发布后的一年内,一些NLP模型已经在GLUE基准上超过了人类的基准性能。当前的模型提出了一种非常有效的方法,将语言模型对大量文本数据集的预训练与简单的多任务和传输学习技术相结合。"
2018年,谷歌发布了BERT(变形金刚双向编码器),脸书称之为NLP最大的突破之一。脸书采用了谷歌的开源工作,并确定了改进其有效性的变化,这导致了罗伯塔(robusly Bert Pre-Training Approach)。
研究并推出AI自然语言处理基准。
在发布后的一年内,几个NLP模型(包括RoBERTa)在GLUE基准测试中已经超过了人类的基准性能。目前的模型提出了一种非常有效的方法,将语言模型对大量文本数据集的预训练与简单的多任务和传输学习技术相结合,”脸书解释道。
对于SuperGLUE基准测试,联盟已经确定任务:满足以下四个标准。
有不同的格式。
使用更微妙的问题。
使用最先进的方法仍有待解决。
很容易解决。
新的基准测试包括八个不同且具有挑战性的任务,包括一个看似合理的选择(COPA)因果推理任务。以上任务为系统提供了一个句子的前提,它必须从两种可能的选择中确定前提的因果关系。人类在COPA上的准确率是100%,而Bert的准确率只有74%。
郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。
免责声明: 本文由用户上传,如有侵权请联系删除!
- 上一篇: 黑暗模式最终到达测试版的WhatsApp
- 下一篇: GMAIL为程序员设计的AI编码软件
猜你喜欢:
- 2023-07-05 酸梅四物饮怎么做(酸梅饮料怎么做的)
- 2023-07-05 英雄联盟手游光明哨兵活动任务怎么做(英雄联盟手游光明哨兵活动任务怎么做视频)
- 2023-07-04 叠杯子教程玩法(叠杯子教程玩法6个)
- 2023-07-04 微信怎么直接向手机号转账(微信怎么直接向手机号转账了)
- 2023-07-04 如何学习蹲踞式跳远:[1]助跑与起跳(蹲踞式跳远助跑的动作要领)
- 2023-07-04 360安全浏览器和极速浏览器哪个好(360安全浏览器和360极速浏览器哪个更好)
- 2023-07-04 mac地址怎么查(mac地址怎么查命令)
- 2023-07-04 怎么在去哪儿网上订酒店?(网上订酒店在哪里)
最新文章:
- 2023-07-05 易语言做qq强制聊天软件(Qq强制聊天软件)
- 2023-07-05 新倩女幽魂端游一条龙任务之大盗宝藏副本玩法(倩女大盗宝藏攻略)
- 2023-07-05 CDR怎么填充多种颜色渐变(cdr渐变色填充)
- 2023-07-05 页边距怎么设置(页边距怎么设置在哪里Word)
- 2023-07-05 win10兼容模式怎么设置在哪(win10兼容模式怎么设置在哪里)
- 2023-07-05 网易126邮箱如何设置黑名单?(网易邮箱126解除黑名单)
- 2023-07-05 英雄联盟手游凯南怎么出装(英雄联盟手游凯南怎么出装备)
- 2023-07-05 点点赚怎么答卷赚钱攻略(赚点答题技巧)
- 2023-07-05 自己做电脑系统最简单的方法!(自己做电脑系统最简单的方法是什么)
- 2023-07-05 快手放电影怎么放啊(快手放电影怎么放)
- 2023-07-05 QQ如何更换密保手机(qq如何更换密保手机号申诉不记得手机号了)
- 2023-07-05 win10默认安装路径在哪里设置如何修改安装路径(windows10修改默认安装路径)
- 2023-07-05 万网域名证书在哪里?怎么打印万网域名证书?(如何打印域名证书)
- 2023-07-05 原神神里绫人的圣遗物怎么获得(原神神里绫华平民圣遗物)
- 2023-07-05 微信转账0.01恶搞步骤(微信转账0.01恶搞文字)
- 2023-07-05 电子书营销技巧(电子书营销技巧与方法)