网站首页 互联网 > 正文
亚马逊的Alexa Speech团队科学家今天宣布,他们已经使用了他们认为有史以来最大的无标签数据集之一来训练声学模型,并提高助手理解人声的能力。
使用半监督学习,一种结合人和机器来标记数据以训练AI模型的方法,亚马逊科学家可以训练模型,并将语音识别的错误率降低10-22%,同时完全依赖监督学习。在嘈杂的音频中,我们可以看到语音识别错误减少的更大好处。
声学模型用7000小时的标记数据训练,然后用100万小时的未标记或未标记数据训练。声学模型是一系列人工智能系统之一,它为自动语音识别提供动力,并将语音命令转换为计算机动作。
Alexa的高级应用科学家Hari Parthasarathi在一篇博文中表示:“我们目前正在尝试将新模型集成到Alexa中,预计发布日期将在今年晚些时候。
这项工作将于下月在英国布莱顿举行的IEEE声学、语音和信号处理国际会议上展示。
阿列克谢理解人声能力的这些进步是通过使用名为师生培训的长期和短期记忆(LSTM)网络实现的。经过培训,“老师”可以理解30 ms音频块,然后使用未标记的数据将一些理解传递给“学生”网络。
许多其他技术已经被应用于优化或加速模型训练,例如分析学生模型的音频一次而不是两次,交错或混合两个模型,并且在训练期间以最高概率仅存储20个教师模型输出,而不是将结果分成3000个不同的聚类。然后,学生模型必须尝试匹配尽可能多的20个概率。
“7000小时的标注数据比机器标注的数据更准确,所以在训练学生的时候,我们会跨越它们。我们的直觉是,如果机器标记的数据开始将模型引向错误的方向,带注释的数据可以提供路线修正。
今天的消息是2月份宣布的,用其他半监督学习方法将语音识别的错误率降低20%,并使双麦克风阵列比本周早些时候宣布的七麦克风阵列更有效。
郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。
免责声明: 本文由用户上传,如有侵权请联系删除!
- 上一篇: 人工智能能改变科学吗?让我们来看看
- 下一篇: 本地公司有机会支持学习者的努力和技术挑战
猜你喜欢:
- 2023-07-05 被遗忘的国度 恶魔之石心得(遗忘国度:恶魔之石)
- 2023-07-05 怎样做到勤能补拙(勤能补拙的方法)
- 2023-07-05 手机上在哪里查询生育险(手机上在哪里查询生育险余额)
- 2023-07-05 跑步膝盖疼的原因及解决方法(跑步膝盖疼的原因及解决方法图片)
- 2023-07-05 山羊画什么脚印(山羊画什么脚印像什么)
- 2023-07-05 设计图:君王板甲护腕如何获得?(君王板甲腰带图纸获取办法)
- 2023-07-05 电脑如何恢复出厂设置win7(笔记本电脑如何恢复出厂设置win7)
- 2023-07-05 DOTA中的骷髅王出装推荐(dota2骷髅王最强出装)
最新文章:
- 2023-07-05 上海搬家公司价格查询怎样进行普通搬家多少钱?(上海搬家公司价格表一览)
- 2023-07-05 电脑网页打开很慢怎么办(电脑网页打开很慢怎么办有时还打不开)
- 2023-07-05 拳皇WingEx1.0隐藏技能怎么用(拳皇wingex1.02隐藏技能)
- 2023-07-05 《名将传说》新手攻略5大职业特色技能详解(《名将传说》新手攻略5大职业特色技能详解介绍)
- 2023-07-05 如何锻炼口才(如何锻炼口才和思维能力)
- 2023-07-05 sumifs函数的使用方法(sumifs函数的使用方法日期)
- 2023-07-05 win10回收站图标不能正常显示怎么办(windows10只有回收站图标)
- 2023-07-05 长沙周边一日游 农家乐农的传人值得你去一趟(长沙农家乐好去处)
- 2023-07-05 联想a789刷机教程 最简单的线刷方法等你分享
- 2023-07-05 育苗块怎么用(育苗块怎么使用)
- 2023-07-05 瑜伽冥想有哪些好处(瑜伽冥想有哪些好处呢)
- 2023-07-05 海鱼的做法大全(海鱼的做法大全视频)
- 2023-07-05 招商银行缴纳学费(招商银行缴纳学费步骤)
- 2023-07-05 qq空间怎么添加音乐(QQ空间如何添加音乐)
- 2023-07-05 如何在淘宝上开店(淘宝店铺怎么开)
- 2023-07-05 女孩子喜欢什么礼物(给女孩子送什么礼物比较好)