当前位置:首页 >  科学 >  AI,来感受被,分手厨房,支配的恐惧吗

AI,来感受被,分手厨房,支配的恐惧吗

发布时间:2021-01-17 15:23编辑:小狐阅读: 148次 手机阅读

鱼羊 发自 凹非寺

盆友,你感受过被 分手厨房,啊不,《煮糊了》 (Overcooked)支配的恐惧吗?

AI,来感受被,分手厨房,支配的恐惧吗(图1)

其实,别说是你,就是AI们碰上需要多人配合,又得切菜,又得上锅,又得送菜,地形还复杂的情况,也一样会分分钟败下阵来。

这不,来自诺丁汉大学、UC伯克利和微软研究院的研究人员,现在就提出:不会玩《煮糊了》的深度强化学习模型,不是好协作AI。

他们还发现,当前多数深度RL模型,竟然都没法儿在《煮糊了》里拿到 65%以上的分数。

为此,他们专门写了一篇论文。

用简化版《煮糊了》进行基准

想要在现实世界中应用深度强化学习模型,实现AI与人类的协作,目前一个大的在于,这类在遇到过程中未曾见过的情况、未训练过的行为时,能否保持鲁棒性。

而如何去评估模型的鲁棒性,也是困扰学界的一个难点。

不知道是不是分手厨房带来的胡闹现场启发了他们,研究人员认为,《煮糊了》能够成功在能够处理的范围内,出潜在的边缘案例。

比如,在游戏中,必须应对这样的场景:盘子被不小心落在了柜台上,搭档因为思考或者暂时离开停留在原地…

于是,他们根据《煮糊了》的环境,设计了简化版的单元。

AI,来感受被,分手厨房,支配的恐惧吗(图2)

主要分为三类:

状态鲁棒性单元,这时成功的标准不取决于搭档的状态。如上图(a)中,绿帽子厨师已经拿到了一个盘子,所以无论绿帽子厨师接下来作出怎样的决策,蓝帽子厨师都只要向左拿一个洋葱就是了。

智能体鲁棒性单元,这时搭档的状态会影响结果,需要衡量智能体的鲁棒性。如上图(b)中,通道只有一条,绿帽子厨师想要去送汤,蓝帽子厨师就得让开。

智能体&记忆鲁棒性单元。如上图(c)中,绿帽子厨师没动静了,出于离开状态,那么蓝帽子厨师应该自己去取盘子送汤。这个状态需要结合历史记录来检测。

AI,来感受被,分手厨房,支配的恐惧吗(图3)

传送门

加入AI社群,拓展你的AI行业人脉

վ“ᴗ” ի 追踪AI技术和产品新动态

本文相关词条概念解析:

鲁棒性

鲁棒是Robust的音译,也就是健壮和强壮的意思。它是在异常和危险情况下系统生存的关键。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不崩溃,就是该软件的鲁棒性。所谓“鲁棒性”,是指控制系统在一定(结构,大小)的参数摄动下,维持其它某些性能的特性。根据对性能的不同定义,可分为稳定鲁棒性和性能鲁棒性。以闭环系统的鲁棒性作为目标设计得到的固定控制器称为鲁棒控制器。

延伸 · 推荐

拥有这两款神器,再也不用担心被长语音的恐惧所支配

当下沟通工具的便利,有时反倒让我们得了沟通恐惧症,一到下班或者周末时间就很想打开勿扰模式,特别是碰到时长达到 60 秒以上的长语音,一条接一条,根本无法让我们平心静气地听完,这种长语音恐惧症在职场同事...

Home的歪果人民被视频办公逼疯了,一个开会机器人就完成了,同事们都笑疯了

郭一璞 发自 凹非寺还记得被会议支配的恐惧么?上一辈的老人在厨房准备香喷喷的食物,下一辈的孩子在一旁开心的玩游戏和玩具,只有你,上半身衣着光鲜头发整齐,下半身穿着睡裤光着脚,在会议软件里人模狗样,应付...

另外红米K40,总有一天他们会想起被抢购支配的恐惧

屏幕也从二流LCD屏升级到了一块三星E4的120HZ柔性直屏,除了相机和快充没有明显的提升外,其它的升级真心是非常凶猛了。所以从这个角度来说,红米K40相比K30应该是“降价”的另外红米K40 Pro...

标签:
  • 网友评论

科学本月排行

科学精选