近5亿次捉迷藏游戏中,AI玩家策略轮番升级,花式使用工具!
2019-10-10 17:01 |
查看: 1252|
评论: 0
在生命诞生初期,生命体是非常简单的。它们是微小的单细胞生物,几乎没有协调能力。然而,经过数十亿年的竞争和自然选择,这些简单的生命体逐渐演化成为我们今天所拥有的复杂生命形式以及复杂的人类智慧。 总部位于旧金山的营利性AI实验室“OpenAI”的研究人员现在正在验证这样一个假设:如果可以在虚拟世界中模拟这种竞争,是否能够演化出更加复杂的人工智能呢? 近期,OpenAI的实验智能体逐渐具备了掌握复杂行为的能力,为开发更复杂的人工智能指引了一条新的道路。 该实验基于该领域现有的两种思想:多智能体学习,即通过将多种算法进行竞争或协调以产生应急智能;以及强化学习,即一种在不断试验和纠错的过程中学习并实现目标的特定机器学习技术。 DeepMind凭借其具有突破性的程序AlphaGo,击败了围棋中最优秀的人类棋手,从而很好地普及了强化学习这一概念。 在最近发布的一篇论文中,OpenAI揭示了这一试验的初步结果。在玩了数亿次捉迷藏游戏后,两个相互竞争的AI队伍(搜寻者和躲藏者)设计出了复杂的游戏策略,其中不乏工具使用和相互协作。该研究也是对以OpenAI为主导的研究策略的深刻诠释:大幅扩展现有的人工智能技术,看看有没有什么新东西出现。 |
免责声明:
除非特别声明,文章均为投稿或网络转载,仅代表作者观点,与大数据中国网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如果本文内容有侵犯你的权益,请发送信息至ab12-120@163.com,我们会及时删除
最新评论
最新新闻
最新新闻