宁德生活圈

网站首页 互联网 > 正文

AI塑料袋系统取得了最先进的图像分类成果

2021-09-13 21:22:10 互联网 来源:
导读 人工智能最重要的理论家、最近的图灵奖获得者——向学生Sara Sabour和Nicholas Frosst提出了一个名为CapsNet的机器学习框架,这是一

人工智能最重要的理论家、最近的图灵奖获得者——向学生Sara Sabour和Nicholas Frosst提出了一个名为CapsNet的机器学习框架,这是一种经过判别训练的多层方法,实现了最先进的技术。基于流行基准的图像分类性能。作为他们最初工作的后续,辛顿、萨布尔和牛津机器人研究所的研究人员本周详细介绍了胶囊网络的一个版本,该版本在无监督分类任务中赢得了领先的算法。

他们的工作描述在一篇发表在Arxiv.org预印服务器上的论文中(“堆叠胶囊自动编码器”)。

对于不熟悉的人来说,胶囊系统通过几何解释其相关部分的有组织集合来理解物体。针对各种对象属性(如位置、大小和色调)单独激活的数学函数(胶囊)的集合被添加到卷积神经网络(通常用于分析视觉图像的人工智能模型)中,并且它们的一些输出被重用以形成更“稳定”的高阶胶囊表示。由于这些表示在整个过程中保持不变,胶囊系统可以使用它们来识别对象,即使当视点改变时,例如,当交换或转换组件的位置时。

关于胶囊系统的另一个独特之处,他们注重路线。像所有深度神经网络一样,胶囊的功能被安排在互连层,从输入数据中传输“信号”,并缓慢调整每个连接的突触强度-重量。(这是他们如何提取特征并学习如何进行预测。然而,在胶囊的情况下,权重是根据前一层函数预测下一层输出的能力来动态计算的。

Hinton和他的同事最近的研究工作是研究一种神经编码器,它可以查看图像样本,并试图消除物体的存在和姿态。它使用解码器进行训练,解码器使用混合的姿势预测来预测已经找到的图像部分的姿势(由自动编码器分割),并将每个图像像素建模为由变换部分做出的混合预测。然后在未标记的数据上学习胶囊系统,将已有的向量(数学表示)聚集在一起,捕捉整个物体和零件之间的空间关系。

合著者指出,对象胶囊的存在概率向量更有可能形成紧密聚类,为每个紧密聚类分配一个类将对街景房号数据集(A)进行无监督分类,从而产生最高级的结果。一个真实图像数据集,包含来自谷歌街景图像的超过60万个门牌号。此外,该实现导致了MNIST(手写数字语料库)的几乎最先进的结果,并进一步提高了少于300个参数的性能。

郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。


免责声明: 本文由用户上传,如有侵权请联系删除!


标签: