宁德生活圈

网站首页 互联网 > 正文

讨论如何让人工智能系统做我们想做的事情

2021-09-20 16:24:06 互联网 来源:
导读 在这一集中,罗欣将首先按顺序执行第一集中讨论的方法。我们将从嵌入式代理开始,然后讨论使人工智能系统能够实现我们想要的目标的领域,然

在这一集中,罗欣将首先按顺序执行第一集中讨论的方法。我们将从嵌入式代理开始,然后讨论使人工智能系统能够实现我们想要的目标的领域,然后我们将讨论雄心勃勃的价值学习。接下来,我们将关注可纠正性,尤其是迭代放大、辩论和因素认知。

讨论如何让人工智能系统做我们想做的事

接下来,我们将讨论对人工智能系统设置限制,这将是人工智能拳击和冲击测量。之后,我们将介绍鲁棒性,包括验证、对抗性机器学习和对抗性示例。

接下来,我们将讨论解释方法,最后是全面的人工智能服务。通过阅读本系列的第一部分,您应该有足够的背景来理解第二部分中的这些材料。有一点,希望这个播客对观众特别有用,特别有趣。因此,我继续进行了三分钟的简短调查。您可以在FLI页面或本播客的描述中找到本播客的链接。一如既往,如果您觉得本播客有趣或有用,请确保您喜欢、订阅并关注我们您最喜欢的收听平台。

讨论如何让人工智能系统做我们想做的事

对于还不熟悉Rohin的人来说,他是加州大学伯克利分校计算机科学专业的五年级博士生,和Anca Dragan、Pieter Abbeel、Stuart Russell一起在AI兼容人类中心工作。他每周在《校准通讯》中收集和总结与人工智能校准相关的最新进展。这样,我们将从遍历刚刚列出的方法开始。好的。那么,我们继续,从第一个开始,我觉得这是一个嵌入式代理。

罗欣:对,所以是嵌入式代理。我有点想与嵌入式机构的顺序不同,因为我不会做任何我能做得这么好的事情。但基本的想法是,我们希望有这种智能理论,而实现这一目标的一个主要障碍是,我们目前所有的理论(最显著的是强化学习)都假设环境和智能体之间有一个良好而清晰的边界。就像一个代理在玩电子游戏,而电子游戏就是环境。环境不能真正影响代理人。代理有这个定义好的输入通道,并且可以执行操作,这些操作会被发送到视频游戏环境,视频游戏环境会在此基础上进行操作并创建观察结果,然后将观察结果发送回负责观察的代理,这里有一个非常漂亮简洁的抽象。代理可以比电子游戏大,就像我比井字游戏大一样。

其实我可以模拟井字游戏的整棵树,找出井字游戏的最佳策略。事实上,这个伟大的XKCD真的向你展示了整个游戏树,这很棒。

因此,与视频游戏设置一样,代理可以比视频游戏环境更大,因为它可以有一个完全准确的环境模型,并且确切地知道它的动作会做什么。因此,我们在电子游戏环境中有所有这些好的假设,但在现实世界中,这些假设是不可行的。如果你考虑地球上的我,我将无法获得整个环境的精确模型,因为环境包含了我,我的内部不可能有一个完美的自我模型。只是一些不可能发生的事。更不用说拥有宇宙其余部分的完美模型,但我们甚至把它放在一边。

一个事实是,不清楚我的行动空间是什么。一旦我有了可以使用的笔记本电脑,笔记本电脑会在我的移动空间开始通话吗?我们只是在说我可以活动四肢的命令吗?但是如果我突然上传,现在没有更多的镜头,会发生什么?我的动作怎么了,消失了?因此,嵌入式代理将这个问题大致分为四个子问题。我把它们和颜色联系起来,因为这是斯科特和亚伯兰在他们的序列中所做的。这是红色决策理论。通常,决策理论是考虑所有可能的行为来模拟它们的后果,并选择一种会带来最高预期效用的行为。当您是嵌入式代理时,这不是您可以做的事情,因为环境可能取决于您实施的策略。

最典型的例子就是Newcom问题,其中有一部分环境是强存在的,欧米茄。欧米茄可以完美地预测你的情况,所以它确切地知道你要做什么,欧米茄100%值得信任,所有这些都简化了假设。欧米茄为您提供以下游戏。他会把两个透明的盒子放在你面前。第一个盒子将始终包含1000美元,第二个盒子将包含数百万美元或什么都不包含,您可以看到,因为它们是透明的。你可以选择带一两个盒子,然后拿走里面的东西。

令人不安的是,如果欧米茄预测你只会带一个100万美元的盒子而不是另一个盒子,他只会在盒子里放100万美元。所以现在你看到两个盒子,一个有一百万美元,另一个有一千美元。在这种情况下,您应该同时使用这两个盒子吗?或者只是一个百万美元的盒子?所以,按照我现在的设置,从逻辑上讲,除了花一百万,你什么都做不了。所以,也许你会说是的,我逻辑上要求这样,所以不是很有意思。不过可以放宽到一个问题,那就是欧米茄达到99.999%预测准确率的可能性。从某种意义上说,你现在确实有代理权。您可以选择两个框,但这是合乎逻辑的。

上是不可能的,并且您知道,两个框都在那里。您现在无法更改框中的金额。伙计,您应该只带两个盒子,因为这样可以多给您$ 1,000。你为什么不这样做呢?

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

免责声明: 本文由用户上传,如有侵权请联系删除!


标签: