网站首页 互联网 > 正文
在这一集中,罗欣将首先按顺序执行第一集中讨论的方法。我们将从嵌入式代理开始,然后讨论使人工智能系统能够实现我们想要的目标的领域,然后我们将讨论雄心勃勃的价值学习。接下来,我们将关注可纠正性,尤其是迭代放大、辩论和因素认知。
接下来,我们将讨论对人工智能系统设置限制,这将是人工智能拳击和冲击测量。之后,我们将介绍鲁棒性,包括验证、对抗性机器学习和对抗性示例。
接下来,我们将讨论解释方法,最后是全面的人工智能服务。通过阅读本系列的第一部分,您应该有足够的背景来理解第二部分中的这些材料。有一点,希望这个播客对观众特别有用,特别有趣。因此,我继续进行了三分钟的简短调查。您可以在FLI页面或本播客的描述中找到本播客的链接。一如既往,如果您觉得本播客有趣或有用,请确保您喜欢、订阅并关注我们您最喜欢的收听平台。
对于还不熟悉Rohin的人来说,他是加州大学伯克利分校计算机科学专业的五年级博士生,和Anca Dragan、Pieter Abbeel、Stuart Russell一起在AI兼容人类中心工作。他每周在《校准通讯》中收集和总结与人工智能校准相关的最新进展。这样,我们将从遍历刚刚列出的方法开始。好的。那么,我们继续,从第一个开始,我觉得这是一个嵌入式代理。
罗欣:对,所以是嵌入式代理。我有点想与嵌入式机构的顺序不同,因为我不会做任何我能做得这么好的事情。但基本的想法是,我们希望有这种智能理论,而实现这一目标的一个主要障碍是,我们目前所有的理论(最显著的是强化学习)都假设环境和智能体之间有一个良好而清晰的边界。就像一个代理在玩电子游戏,而电子游戏就是环境。环境不能真正影响代理人。代理有这个定义好的输入通道,并且可以执行操作,这些操作会被发送到视频游戏环境,视频游戏环境会在此基础上进行操作并创建观察结果,然后将观察结果发送回负责观察的代理,这里有一个非常漂亮简洁的抽象。代理可以比电子游戏大,就像我比井字游戏大一样。
其实我可以模拟井字游戏的整棵树,找出井字游戏的最佳策略。事实上,这个伟大的XKCD真的向你展示了整个游戏树,这很棒。
因此,与视频游戏设置一样,代理可以比视频游戏环境更大,因为它可以有一个完全准确的环境模型,并且确切地知道它的动作会做什么。因此,我们在电子游戏环境中有所有这些好的假设,但在现实世界中,这些假设是不可行的。如果你考虑地球上的我,我将无法获得整个环境的精确模型,因为环境包含了我,我的内部不可能有一个完美的自我模型。只是一些不可能发生的事。更不用说拥有宇宙其余部分的完美模型,但我们甚至把它放在一边。
一个事实是,不清楚我的行动空间是什么。一旦我有了可以使用的笔记本电脑,笔记本电脑会在我的移动空间开始通话吗?我们只是在说我可以活动四肢的命令吗?但是如果我突然上传,现在没有更多的镜头,会发生什么?我的动作怎么了,消失了?因此,嵌入式代理将这个问题大致分为四个子问题。我把它们和颜色联系起来,因为这是斯科特和亚伯兰在他们的序列中所做的。这是红色决策理论。通常,决策理论是考虑所有可能的行为来模拟它们的后果,并选择一种会带来最高预期效用的行为。当您是嵌入式代理时,这不是您可以做的事情,因为环境可能取决于您实施的策略。
最典型的例子就是Newcom问题,其中有一部分环境是强存在的,欧米茄。欧米茄可以完美地预测你的情况,所以它确切地知道你要做什么,欧米茄100%值得信任,所有这些都简化了假设。欧米茄为您提供以下游戏。他会把两个透明的盒子放在你面前。第一个盒子将始终包含1000美元,第二个盒子将包含数百万美元或什么都不包含,您可以看到,因为它们是透明的。你可以选择带一两个盒子,然后拿走里面的东西。
令人不安的是,如果欧米茄预测你只会带一个100万美元的盒子而不是另一个盒子,他只会在盒子里放100万美元。所以现在你看到两个盒子,一个有一百万美元,另一个有一千美元。在这种情况下,您应该同时使用这两个盒子吗?或者只是一个百万美元的盒子?所以,按照我现在的设置,从逻辑上讲,除了花一百万,你什么都做不了。所以,也许你会说是的,我逻辑上要求这样,所以不是很有意思。不过可以放宽到一个问题,那就是欧米茄达到99.999%预测准确率的可能性。从某种意义上说,你现在确实有代理权。您可以选择两个框,但这是合乎逻辑的。
上是不可能的,并且您知道,两个框都在那里。您现在无法更改框中的金额。伙计,您应该只带两个盒子,因为这样可以多给您$ 1,000。你为什么不这样做呢? 郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。免责声明: 本文由用户上传,如有侵权请联系删除!
- 上一篇: 谷歌希望在你的帮助下打造优秀的AI
- 下一篇: AI系统将如何理解人的价值?
猜你喜欢:
- 2023-07-05 被遗忘的国度 恶魔之石心得(遗忘国度:恶魔之石)
- 2023-07-05 怎样做到勤能补拙(勤能补拙的方法)
- 2023-07-05 手机上在哪里查询生育险(手机上在哪里查询生育险余额)
- 2023-07-05 跑步膝盖疼的原因及解决方法(跑步膝盖疼的原因及解决方法图片)
- 2023-07-05 山羊画什么脚印(山羊画什么脚印像什么)
- 2023-07-05 设计图:君王板甲护腕如何获得?(君王板甲腰带图纸获取办法)
- 2023-07-05 电脑如何恢复出厂设置win7(笔记本电脑如何恢复出厂设置win7)
- 2023-07-05 DOTA中的骷髅王出装推荐(dota2骷髅王最强出装)
最新文章:
- 2023-07-05 上海搬家公司价格查询怎样进行普通搬家多少钱?(上海搬家公司价格表一览)
- 2023-07-05 电脑网页打开很慢怎么办(电脑网页打开很慢怎么办有时还打不开)
- 2023-07-05 拳皇WingEx1.0隐藏技能怎么用(拳皇wingex1.02隐藏技能)
- 2023-07-05 《名将传说》新手攻略5大职业特色技能详解(《名将传说》新手攻略5大职业特色技能详解介绍)
- 2023-07-05 如何锻炼口才(如何锻炼口才和思维能力)
- 2023-07-05 sumifs函数的使用方法(sumifs函数的使用方法日期)
- 2023-07-05 win10回收站图标不能正常显示怎么办(windows10只有回收站图标)
- 2023-07-05 长沙周边一日游 农家乐农的传人值得你去一趟(长沙农家乐好去处)
- 2023-07-05 联想a789刷机教程 最简单的线刷方法等你分享
- 2023-07-05 育苗块怎么用(育苗块怎么使用)
- 2023-07-05 瑜伽冥想有哪些好处(瑜伽冥想有哪些好处呢)
- 2023-07-05 海鱼的做法大全(海鱼的做法大全视频)
- 2023-07-05 招商银行缴纳学费(招商银行缴纳学费步骤)
- 2023-07-05 qq空间怎么添加音乐(QQ空间如何添加音乐)
- 2023-07-05 如何在淘宝上开店(淘宝店铺怎么开)
- 2023-07-05 女孩子喜欢什么礼物(给女孩子送什么礼物比较好)