网站首页 科技 > 正文
在这一集中,罗欣将首先按顺序执行第一集中讨论的方法。我们将从嵌入式代理开始,然后讨论使人工智能系统能够实现我们想要的目标的领域,然后我们将讨论雄心勃勃的价值学习。接下来,我们将关注可纠正性,尤其是迭代放大、辩论和因素认知。
接下来,我们将讨论对人工智能系统设置限制,这将是人工智能拳击和冲击测量。之后,我们将介绍鲁棒性,包括验证、对抗性机器学习和对抗性示例。
接下来,我们将讨论解释方法,最后是全面的人工智能服务。通过阅读本系列的第一部分,您应该有足够的背景来理解第二部分中的这些材料。有一点,希望这个播客对观众特别有用,特别有趣。因此,我继续进行了三分钟的简短调查。您可以在FLI页面或本播客的描述中找到本播客的链接。一如既往,如果您觉得本播客有趣或有用,请确保您喜欢、订阅并关注我们您最喜欢的收听平台。
对于还不熟悉Rohin的人来说,他是加州大学伯克利分校计算机科学专业的五年级博士生,和Anca Dragan、Pieter Abbeel、Stuart Russell一起在AI兼容人类中心工作。他每周在《校准通讯》中收集和总结与人工智能校准相关的最新进展。这样,我们将从遍历刚刚列出的方法开始。好的。那么,我们继续,从第一个开始,我觉得这是一个嵌入式代理。
罗欣:对,所以是嵌入式代理。我有点想与嵌入式机构的顺序不同,因为我不会做任何我能做得这么好的事情。但基本的想法是,我们希望有这种智能理论,而实现这一目标的一个主要障碍是,我们目前所有的理论(最显著的是强化学习)都假设环境和智能体之间有一个良好而清晰的边界。就像一个代理在玩电子游戏,而电子游戏就是环境。环境不能真正影响代理人。代理有这个定义好的输入通道,并且可以执行操作,这些操作会被发送到视频游戏环境,视频游戏环境会在此基础上进行操作并创建观察结果,然后将观察结果发送回负责观察的代理,这里有一个非常漂亮简洁的抽象。代理可以比电子游戏大,就像我比井字游戏大一样。
其实我可以模拟井字游戏的整棵树,找出井字游戏的最佳策略。事实上,这个伟大的XKCD真的向你展示了整个游戏树,这很棒。
因此,与视频游戏设置一样,代理可以比视频游戏环境更大,因为它可以有一个完全准确的环境模型,并且确切地知道它的动作会做什么。因此,我们在电子游戏环境中有所有这些好的假设,但在现实世界中,这些假设是不可行的。如果你考虑地球上的我,我将无法获得整个环境的精确模型,因为环境包含了我,我的内部不可能有一个完美的自我模型。只是一些不可能发生的事。更不用说拥有宇宙其余部分的完美模型,但我们甚至把它放在一边。
一个事实是,不清楚我的行动空间是什么。一旦我有了可以使用的笔记本电脑,笔记本电脑会在我的移动空间开始通话吗?我们只是在说我可以活动四肢的命令吗?但是如果我突然上传,现在没有更多的镜头,会发生什么?我的动作怎么了,消失了?因此,嵌入式代理将这个问题大致分为四个子问题。我把它们和颜色联系起来,因为这是斯科特和亚伯兰在他们的序列中所做的。这是红色决策理论。通常,决策理论是考虑所有可能的行为来模拟它们的后果,并选择一种会带来最高预期效用的行为。当您是嵌入式代理时,这不是您可以做的事情,因为环境可能取决于您实施的策略。
最典型的例子就是Newcom问题,其中有一部分环境是强存在的,欧米茄。欧米茄可以完美地预测你的情况,所以它确切地知道你要做什么,欧米茄100%值得信任,所有这些都简化了假设。欧米茄为您提供以下游戏。他会把两个透明的盒子放在你面前。第一个盒子将始终包含1000美元,第二个盒子将包含数百万美元或什么都不包含,您可以看到,因为它们是透明的。你可以选择带一两个盒子,然后拿走里面的东西。
令人不安的是,如果欧米茄预测你只会带一个100万美元的盒子而不是另一个盒子,他只会在盒子里放100万美元。所以现在你看到两个盒子,一个有一百万美元,另一个有一千美元。在这种情况下,你应该吗?
该同时使用两个盒子?还是只带上一百万美元的盒子?因此,按照我现在的设置方式,从逻辑上讲,除了花费一百万美元之外,您什么都做不到。因此,也许您会说好,我在逻辑上要求这样做,所以这不是很有趣。但是,您可以将其放宽到一个问题,即Omega达到99.999%的预测正确率的可能性。从某种意义上说,现在您确实有代理权。您可以选择两个框,但这在逻辑上是不可能的,并且您知道,两个框都在那里。您现在无法更改框中的金额。伙计,您应该只带两个盒子,因为这样可以多给您$ 1,000。你为什么不这样做呢? 郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。免责声明: 本文由用户上传,如有侵权请联系删除!
- 上一篇: 在自我提升AI中发现自我参照推理
- 下一篇: 利用斯图亚特·阿姆斯特朗将人们的喜好综合成实用功能
猜你喜欢:
- 2023-07-05 酸梅四物饮怎么做(酸梅饮料怎么做的)
- 2023-07-05 英雄联盟手游光明哨兵活动任务怎么做(英雄联盟手游光明哨兵活动任务怎么做视频)
- 2023-07-04 叠杯子教程玩法(叠杯子教程玩法6个)
- 2023-07-04 微信怎么直接向手机号转账(微信怎么直接向手机号转账了)
- 2023-07-04 如何学习蹲踞式跳远:[1]助跑与起跳(蹲踞式跳远助跑的动作要领)
- 2023-07-04 360安全浏览器和极速浏览器哪个好(360安全浏览器和360极速浏览器哪个更好)
- 2023-07-04 mac地址怎么查(mac地址怎么查命令)
- 2023-07-04 怎么在去哪儿网上订酒店?(网上订酒店在哪里)
最新文章:
- 2023-07-05 易语言做qq强制聊天软件(Qq强制聊天软件)
- 2023-07-05 新倩女幽魂端游一条龙任务之大盗宝藏副本玩法(倩女大盗宝藏攻略)
- 2023-07-05 CDR怎么填充多种颜色渐变(cdr渐变色填充)
- 2023-07-05 页边距怎么设置(页边距怎么设置在哪里Word)
- 2023-07-05 win10兼容模式怎么设置在哪(win10兼容模式怎么设置在哪里)
- 2023-07-05 网易126邮箱如何设置黑名单?(网易邮箱126解除黑名单)
- 2023-07-05 英雄联盟手游凯南怎么出装(英雄联盟手游凯南怎么出装备)
- 2023-07-05 点点赚怎么答卷赚钱攻略(赚点答题技巧)
- 2023-07-05 自己做电脑系统最简单的方法!(自己做电脑系统最简单的方法是什么)
- 2023-07-05 快手放电影怎么放啊(快手放电影怎么放)
- 2023-07-05 QQ如何更换密保手机(qq如何更换密保手机号申诉不记得手机号了)
- 2023-07-05 win10默认安装路径在哪里设置如何修改安装路径(windows10修改默认安装路径)
- 2023-07-05 万网域名证书在哪里?怎么打印万网域名证书?(如何打印域名证书)
- 2023-07-05 原神神里绫人的圣遗物怎么获得(原神神里绫华平民圣遗物)
- 2023-07-05 微信转账0.01恶搞步骤(微信转账0.01恶搞文字)
- 2023-07-05 电子书营销技巧(电子书营销技巧与方法)