网站首页 互联网 > 正文
一个由人工智能的一些最伟大的头脑组成的研究联盟正在发布一个衡量自然语言处理能力的基准。
该联盟包括谷歌深度思维、脸书人工智能、纽约大学和华盛顿大学。联盟的每个成员都认为NLP需要一个比当前解决方案更全面的基准。
其结果是一个名为SuperGLUE的基准平台,它用一个“更难的基准和全面的人工基准”取代了一个名为GLUE的旧平台。
SuperGLUE有助于测试NLP功能,但是之前的基准测试对于最新的系统来说太简单了。
“在发布后的一年内,一些NLP模型在GLUE基准上的性能已经超过了人类基准。当前的模型已经提出了一种令人惊讶的有效方法,该方法将针对大型文本数据集的语言模型预训练与简单的多任务和迁移学习技术相结合。
2018年,谷歌发布了Bert(《变形金刚》的双向编码器),脸书称之为NLP最大的突破之一。脸书接受了谷歌的开源工作,并确定了改进其有效性的变化,这导致了RoBERTa(严格优化的BERT预训练方法)。
正如孩子们所说,罗伯塔基本上按照共同的基准“砸了它”:
“在发布后的一年内,几个NLP模型(包括RoBERTa)在GLUE基准上的性能已经超过了人类基准。当前的模型已经提出了一种令人惊讶的有效方法,该方法将针对大型文本数据集的语言模型预训练与简单的多任务和迁移学习技术相结合。
对于SuperGLUE基准测试,联盟决定了满足四个条件的任务:
有很多格式。
使用更微妙的问题。
使用最先进的方法仍有待解决。
很容易被人解决。
新的基准测试包括八个多样且具有挑战性的任务,包括“选择合理选择(COPA)”的因果推理任务。上述任务为系统提供了句子的前提,它必须从两种可能的选择中确定前提的原因或结果。人类在COPA上已经成功实现了100%的准确率,而BERT只有74%。
郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。
免责声明: 本文由用户上传,如有侵权请联系删除!
- 上一篇: AI项目成功的8个秘�
- 下一篇: 英特尔为人工智能打开了第一个芯片包装 叫做Spring Hill
猜你喜欢:
- 2023-07-05 被遗忘的国度 恶魔之石心得(遗忘国度:恶魔之石)
- 2023-07-05 怎样做到勤能补拙(勤能补拙的方法)
- 2023-07-05 手机上在哪里查询生育险(手机上在哪里查询生育险余额)
- 2023-07-05 跑步膝盖疼的原因及解决方法(跑步膝盖疼的原因及解决方法图片)
- 2023-07-05 山羊画什么脚印(山羊画什么脚印像什么)
- 2023-07-05 设计图:君王板甲护腕如何获得?(君王板甲腰带图纸获取办法)
- 2023-07-05 电脑如何恢复出厂设置win7(笔记本电脑如何恢复出厂设置win7)
- 2023-07-05 DOTA中的骷髅王出装推荐(dota2骷髅王最强出装)
最新文章:
- 2023-07-05 上海搬家公司价格查询怎样进行普通搬家多少钱?(上海搬家公司价格表一览)
- 2023-07-05 电脑网页打开很慢怎么办(电脑网页打开很慢怎么办有时还打不开)
- 2023-07-05 拳皇WingEx1.0隐藏技能怎么用(拳皇wingex1.02隐藏技能)
- 2023-07-05 《名将传说》新手攻略5大职业特色技能详解(《名将传说》新手攻略5大职业特色技能详解介绍)
- 2023-07-05 如何锻炼口才(如何锻炼口才和思维能力)
- 2023-07-05 sumifs函数的使用方法(sumifs函数的使用方法日期)
- 2023-07-05 win10回收站图标不能正常显示怎么办(windows10只有回收站图标)
- 2023-07-05 长沙周边一日游 农家乐农的传人值得你去一趟(长沙农家乐好去处)
- 2023-07-05 联想a789刷机教程 最简单的线刷方法等你分享
- 2023-07-05 育苗块怎么用(育苗块怎么使用)
- 2023-07-05 瑜伽冥想有哪些好处(瑜伽冥想有哪些好处呢)
- 2023-07-05 海鱼的做法大全(海鱼的做法大全视频)
- 2023-07-05 招商银行缴纳学费(招商银行缴纳学费步骤)
- 2023-07-05 qq空间怎么添加音乐(QQ空间如何添加音乐)
- 2023-07-05 如何在淘宝上开店(淘宝店铺怎么开)
- 2023-07-05 女孩子喜欢什么礼物(给女孩子送什么礼物比较好)