宁德生活圈

网站首页 科技 > 正文

这项巧妙的技术可以帮助机器人识别和区分物体

2021-09-18 19:22:44 科技 来源:
导读 导航可以加快自主最后一英里的交付。在不久的将来,机器人可能会被派遣作为最后一英里的送货车,当你能找到门的时候,在你的门口放下你的外

导航可以加快自主最后一英里的交付。

在不久的将来,机器人可能会被派遣作为最后一英里的送货车,当你能找到门的时候,在你的门口放下你的外卖订单、包裹或套餐。

这项聪明的技术可以帮助机器人识别和区分物体

机器人导航的标准方法包括预先绘制区域,然后使用算法将机器人引导到地图或GPS坐标上的特定目标。尽管这种方法对于探索特定环境可能很有意义,例如特定建筑的布局或规划的障碍路线,但在最后一英里交付的情况下可能会变得很尴尬。

比如想象一下,机器人送货区的每一个邻居都必须提前画出来,包括邻居中每一个房子的配置,每一个房子前门的具体坐标。这样的任务可能很难扩展到整个城市,尤其是当房子的外观经常随着季节而变化的时候。绘制每栋房子的地图也可能会遇到安全和隐私问题。

现在,麻省理工学院的工程师已经开发出一种导航方法,不需要提前绘制区域。相反,他们的方法使机器人能够使用其环境中的线索来规划到达目的地的路线,这可以用一般的语义术语来描述(例如“前门”或“车库”),而不是地图上的坐标。例如,如果机器人被指示将包裹送到某人的前门,它可能会在路上启动并看到一条车道,这条车道已经被训练成识别它可能通向人行道,人行道又可能通向前门。

这项聪明的技术可以帮助机器人识别和区分物体

这项新技术可以大大减少机器人在确定目标之前探索一个地方的时间,而且它不依赖于特定住所的地图。

麻省理工学院机械工程系的研究生迈克尔埃弗雷特(Michael Everett)说,“我们不需要绘制每一栋需要参观的建筑的地图。”“有了这项技术,我们希望把机器人放在任何车道的尽头,让它找到一扇门。”

埃弗雷特将在本周的智能机器人和系统国际会议上展示这个小组的成果。这篇论文由麻省理工学院航空航天学教授乔纳森何(Jonathan How)和福特汽车公司的贾斯汀米勒(Justin Miller)共同撰写,并入围“认知机器人最佳论文”。

“事物的感觉”

近年来,研究人员致力于将自然语义语言引入机器人系统,并训练机器人通过其语义标签识别物体,使其能够在视觉上将门视为门,而不是简单地将其视为实心的矩形障碍物。

埃弗雷特说:“现在,我们有能力让机器人实时了解事物的状态。

Everett、How和Miller使用相似的语义技术作为他们新的导航方法的跳板,该方法利用现有的算法,从视觉数据中提取特征,生成同一场景的新地图,该地图由语义线索或上下文来表示。

在他们的案例中,当机器人四处移动时,研究人员使用一种算法,通过使用每个对象的语义标签和深度图像来构建环境地图。该算法被称为语义SLAM(同时定位和映射)。

虽然其他语义算法使机器人能够识别和映射环境中的对象,但它们不允许机器人在导航新环境时,即通过最有效的路径到达语义目的地时做出决策。例如“前门”。

“在探索之前,先放下一个机器人,然后说‘开始’。它会四处移动,最后到达那里,但它的速度会非常慢,”How说。

成本开始。

研究人员希望通过丰富多彩的语义和上下文世界来加快机器人的路径规划。他们开发了一种新的“销售成本估计器”,它将先前存在的SLAM算法创建的语义图转换成第二个图,表明任何给定的位置都有可能靠近目标。

埃弗雷特说:“这是受图像到图像转换的启发,在图像转换中,你可以给猫拍照,让它们看起来像狗。”“同样的想法也发生在这里。你取一张看起来像世界地图的图像,然后转换成另一张看起来像世界地图的图像,但现在你可以根据地图上不同点的接近程度给它上色,以达到最终的目的。”

这项聪明的技术可以帮助机器人识别和区分物体

>此“成本计算”地图以彩色着色,以将较暗的区域表示为远离目标的位置,将较亮的区域表示为靠近目标的区域。例如,在语义地图中以黄色编码的人行道,可以通过成本核算算法转换为新地图中较暗的区域,而车道则在接近前门时逐渐变轻,新地图中最亮的区域。

研究人员在来自Bing地图的卫星图像上训练了这种新算法,该图像包含来自一个城市和三个郊区的77栋房屋。该系统将语义图转换为可使用的成本图,并按照最轻的区域映射出最有效的路径,直至最终目标。对于每个卫星图像,埃弗里特为典型的前院中的环境特征分配语义标签和颜色,例如前门为灰色,车道为蓝色,绿篱为绿色。

在此培训过程中,团队还对每个图像应用了蒙版,以模仿机器人的摄像机经过院子时可能具有的局部视图。

“我们方法的部分技巧是[提供系统]许多局部图像,” How解释道。“因此,它真的必须弄清楚所有这些东西是如何相互关联的。这就是使这项工作稳定进行的部分原因。”

然后,研究人员在训练数据集之外的一所全新房屋的图像模拟中测试了他们的方法,首先使用预先存在的SLAM算法生成语义图,然后使用其新的成本估算器生成第二张地图和通往目标的路径(在这种情况下为前门)。

该小组的新的成本管理技术发现前门的速度比经典导航算法快了189%,后者没有考虑上下文或语义,而是花了过多的步骤来探索不太可能达到其目标的区域。

埃弗里特(Everett)说,结果说明了即使在陌生,未映射的环境中,机器人也可以使用上下文有效地定位目标。

埃弗里特说:“即使机器人将包裹运送到从未去过的环境中,也可能会有与所见过的其他地方相同的线索。” “因此,世界的布局可能有所不同,但是可能存在一些共同点。”

这项研究得到福特汽车公司的部分支持。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

免责声明: 本文由用户上传,如有侵权请联系删除!


标签: