宁德生活圈

网站首页 互联网 > 正文

机器人可以在未开发的海域进行研究

2021-09-18 18:33:19 互联网 来源:
导读 麻省理工学院和伍兹霍尔海洋研究所(WHOI)的研究人员发明了一种自动机器人系统,可以有效地探测广阔和未探索的水中最科学和有趣的采样点,但

麻省理工学院和伍兹霍尔海洋研究所(WHOI)的研究人员发明了一种自动机器人系统,可以有效地探测广阔和未探索的水中最科学和有趣的采样点,但很难找到它们。

环境科学家通常对在环境中最有趣的位置或“最大值”收集样本感兴趣。一个例子可能是泄漏的化学物质的来源,它的浓度最高,并且大部分不会被外部因素损坏。但是最大值可以是研究人员想要测量的任何可量化的值,例如水深或暴露在空气中的珊瑚礁。

该机器人可以在未开发的海域进行研究

以最大性能部署机器人的工作受到效率和准确性问题的困扰。通常,机器人像割草机一样来回移动以覆盖一个区域,这很耗时,并且会收集许多有趣的样本。一些机器人会感知并跟随高浓度的线索来寻找泄漏源。但它们可能会误导人。例如,化学品可能会在远离源头的缝隙中被捕获和积累。机器人可能会识别那些高浓度点作为源头,但距离仍然很近。

在国际智能机器人和系统会议(IROS)上发表的一篇论文中,研究人员描述了“火舌”,它使自主移动机器人能够更快、更有效地实现最大归零。火舌使用概率技术来预测哪些路径可能导致最大值,同时导航障碍物、移动的水流和其他变量。在采集样本时,它会权衡所学知识,以确定是继续沿着有希望的道路前进,还是寻找未知的东西——这可能会保留更多有价值的样本。

重要的是,火羽不会卡在那些棘手的高浓度点,并达到目的地。“这很重要,因为人们很容易认为你找到了黄金,但事实上你为傻瓜找到了黄金,”第一作者,计算机科学和人工智能实验室(CSAIL)和麻省理工学院-WHOI联合项目说。

该机器人可以在未开发的海域进行研究

研究人员建造了一艘由fluils驱动的机器人船,成功发现了巴巴多斯贝拉尔斯边缘礁的裸露珊瑚头,这意味着它位于最浅的位置,这对于研究太阳如何影响珊瑚生活非常有用。在不同水下环境下进行的100次模拟实验中,虚拟羽流机器人在指定时间范围内连续采集的最大样本数是传统覆盖方法的7-8倍。

该研究的第一作者、CSAIL和麻省理工学院-WHOI联合项目的博士生Genevieve Flaspohler说:“fleels做了最少的探索,找到了最大的探索量,然后迅速集中精力在那里收集有价值的样本。

来自WHOI应用海洋物理和工程系的科学家安娜米歇尔和约格什格达尔将普勒斯顿和弗拉斯波勒添加到论文中。尼古拉斯罗伊是加拿大航空航天学会和航空航天部的教授。

导航开发-探索权衡。

火羽的一个关键见解是使用从概率到推理的技术来解决众所周知的复杂权衡,即权衡利用关于环境的知识和探索可能更有价值的未知领域之间的关系。

Flaspohler说:“最大程度上最大的挑战是让机器人平衡从已知的高度集中的地方获得的信息,探索他们不太了解的地方。”“如果机器人探索太多,最多也收集不到足够的有价值的样本。如果你没有足够的探索,你可能会完全错过最大值。”

放置在新环境中的火羽机器人使用一种称为高斯过程的概率统计模型来预测环境变量(如化学物质浓度)和估计感应不确定性。然后,火舌生成机器人可以走的可能路径的分布,并使用估计值和不确定性根据机器人被允许探索和利用的程度对每条路径进行排序。

首先,火羽会随机选择探索环境的路径。然而,每个样本将提供关于周围环境目标值的新信息,例如化学浓度最高或深度最浅的点。高斯模型利用这些数据来缩小机器人从其给定位置可以遵循的路径,从而从具有较高值的位置进行采样。fleets使用一种新颖的目标函数(通常用于机器学习,以实现回报最大化)来确定机器人应该使用过去的知识还是探索新的领域。

“光明”之路

决定在哪里收集下一个样本取决于系统从当前位置“半透明”所有可能的未来操作的能力。因此,它使用改进的蒙特卡罗树搜索(MCTS)版本,这是一种路径规划技术,广泛用于为掌握复杂游戏(如围棋和象棋)的人工智能系统提供动力。

MCTS使用决策树(连接节点和线的图形)来模拟实现最终获胜动作所需的路径或移动顺序。但在游戏中,可能路径的空间有限。在未知的环境中。

,随着实时变化的动态变化,空间实际上是无限的,从而使规划变得极为困难。研究人员设计了“连续观测MCTS”,它利用高斯过程和新颖的目标函数来搜索可能的真实路径的繁琐空间。

该机器人可以在未开发的海域进行研究

此MCTS决策树的根始于“信念”节点,这是机器人可以采取的下一个直接步骤。该节点包含直到那时的机器人动作和观察的全部历史记录。然后,系统将树从根部扩展到新的行和节点,并查看导致开发区和未开发区的未来操作的几个步骤。

然后,系统根据从先前的观察中学到的一些模式,模拟如果从每个新生成的节点中抽取一个样本将会发生什么。取决于最终模拟节点的值,整个路径会获得奖励分数,值越高,意味着采取的措施就越多。来自所有路径的奖励分数将回滚到根节点。机器人选择得分最高的路径,迈出一步,并收集真实的样本。然后,它使用实际数据更新其高斯过程模型并重复“卤化”过程。

Flaspohler说:“只要系统继续幻化为在世界看不见的地区可能会有更高的价值,它就必须继续探索。” “当它最终收敛于一个点时,它估计是最大值,因为它无法沿着路径产生更高的幻觉,然后便停止探索。”

现在,研究人员正在与WHOI的科学家合作,使用PLUMES驱动的机器人在火山现场定位化学羽流,并研究北极融化的沿海河口中的甲烷释放。科学家对释放到大气中的化学气体的来源很感兴趣,但是这些测试场所可以跨越数百平方英里。

普雷斯顿说:“他们可以[使用PLUMES]花更少的时间去探索那个广阔的区域,而真正专注于收集具有科学价值的样本。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

免责声明: 本文由用户上传,如有侵权请联系删除!


标签: