当前位置: 首页 >今日更新 > 内容

游戏历来是检验人工智能算法进展的主要竞技场之一

今日更新
导读 最初的努力包括开发可以玩国际象棋和跳棋等棋盘游戏的人工智能模型,最终开发出复杂的中国围棋游戏。最近,人工智能研究人员将注意力转向了...

最初的努力包括开发可以玩国际象棋和跳棋等棋盘游戏的人工智能模型,最终开发出复杂的中国围棋游戏。最近,人工智能研究人员将注意力转向了电子游戏,这些游戏明显更加复杂和具有挑战性。

在这方面,OpenAI Five 的胜利标志着 AI 社区的里程碑式成就。

强化学习

在 Dota 2 中,两支由五名玩家组成的队伍相互竞争。游戏的最终目标是摧毁敌人的塔,被称为“古代”,同时防止自己的破坏。每个玩家都可以扮演游戏特色的众多“英雄”角色之一。掌握 Dota 2 需要战斗战术、资源管理、使用特殊技能和制定长期战略。游戏是实时进行的(相对于回合制),这使得游戏变得更加困难。

简而言之,Dota 2 是一款易学难精的游戏。

OpenAI 尚未公布其玩 Dota 2 的 AI 的技术细节。但它已经发布了一些关于该模型如何发展其玩游戏能力的初步信息。新 AI 是OpenAI 于 2018 年 6 月推出的原始模型的高级版本。

OpenAI Five 是一个由五个神经网络组成的团队(因此得名),一个团队中的五个英雄角色各一个。神经网络是通过分析大型数据集并发现相关性和模式来发展其行为的软件结构。

OpenAI Five 通过使用强化学习来训练其神经网络,强化学习是人工智能的一个子集,其中模型被赋予环境规则和追求的奖励。然后让 AI 自行尝试不同的组合并找出可以最大化奖励的成功序列。

强化学习是深度学习中最先进的子集之一,也是 DeepMind 的AlphaZero和AlphaStar等其他游戏 AI 模型中使用的主要方法。

在 Dota 2 的案例中,OpenAI 的神经网络必须找到能够帮助他们朝着游戏中许多大大小小的目标前进的组合,例如收集资源、让他们的英雄更强大、摧毁敌方英雄和摧毁敌方队伍的远古。

免责声明:本文由用户上传,如有侵权请联系删除!