宁德生活圈

网站首页 科技 > 正文

研究人员正在研究玩Minecraft的AI训练

2022-12-05 19:23:07 科技 来源:
导读 也许核聚变和Minecraft之间有更多的重叠,而不仅仅是你可以花在任何一个上的时间。《麻省理工科技评论》称,非营利性人工智能研究机构OpenA

也许核聚变和Minecraft之间有更多的重叠,而不仅仅是你可以花在任何一个上的时间。《麻省理工科技评论》称,非营利性人工智能研究机构OpenAI开发了最先进的Minecraft游戏机器人。它通过评估超过 70,000 小时的人类游戏时间,通过一种新颖的训练过程进行。研究人员预测,机器人的成就有一天可能会带来改变游戏规则的技术。它包括自动驾驶汽车和几乎无穷无尽的可再生能源。尽管它现在仅限于制造像素化工具和建筑物。

研究人员使用了一种称为模仿学习的方法,创建了第一个能够制作“钻石工具”的机器人,这是Minecraft中的一种物品,通常需要人类大约20分钟和24,000个动作来制造。模仿学习,顾名思义,需要一个人工智能来研究并最终超越数百个人类输入样本。但强化学习是另一种广受欢迎的人工智能开发策略,它依靠反复试验来学习,采取了一种不那么有条理、更随意的方法。

模仿学习的传统问题源于这样一个事实,即研究人员通常需要手动标记“每个步骤”,正如《技术评论》所解释的那样。例如,“执行此操作会导致发生这种情况,执行该操作会导致发生这种情况,依此类推”。OpenAI开发了一种称为视频预训练的独特神经网络,能够处理标记过程(VPT)。研究人员雇佣了零工工作者玩Minecraft2000小时,并记录每一次按键和视频,以教授AI机器人。

通过整合VPT,新的AI软件能够在Minecraft中完成壮举。机器人完全依赖于强化学习,并且无法做到。例如,用人造木板构建桌子的大约 970 步过程。当仿真和监督学习耦合时,该机器人能够通过超过 20,000 次连续操作来处理构建作业。

在《我的世界》中看到的模仿学习成果有朝一日可能会使核聚变研究和自动驾驶汽车受益。然而,这些还很遥远。仿真和强化学习的有效性和伦理仍然未知。

2015年,埃隆·马斯克(Elon Musk)和山姆·奥特曼(Sam Altman)是该公司的联合创始人之一。彼得·泰尔(Peter Thiel)是早期投资者。然而,马斯克今年在2018年离开了董事会。


免责声明: 本文由用户上传,如有侵权请联系删除!


标签: