近日,Alphabet旗下人工智能子公司DeepMind,与游戏公司Blizzard Entertainment推出了一系列系统工具,旨在让程序员在星际争霸系列游戏中更好地应用各种人工智能算法。但是要想探索人类和人工智能系统如何和谐相处?未来可能需要人机在星际争霸中进行更多的磨合,共同杀死更多的Zerg(虫族)。
据悉,这款游戏比迄今为止大多数AI程序处理的游戏都更具挑战性。星际争霸不仅极其复杂,还需要提前规划,并试图揣测对手的意图。这意味着将开发能够与人类相匹敌的人工智能程序,未来有助于研究人员利用机器探索人类智能的新领域。据相关人士透露,这些工具还有另外一个潜在的好处,那就是探索人类和人工智能合作的新方式。
“星际争霸拥有千万粉丝的原因有很多,”DeepMind首席研究员Oriol Vinyals说。“例如,玩家通常只能看到对手的活动,这就意味着算法需要开发出更好的记忆信息存储方式。在这里,记忆是至关重要的。你现在看到的东西不是之前看到的东西,几秒钟前发生的事情可能会让你采取完全不同的行动。”
为了更好地掌握这些游戏,DeepMind的研究人员通过强化学习这一机器学习技术,让计算机自己在没有明确指令的情况下自主学习。据悉,强化学习受到动物学习方式的启发,并通过反复实验得到积极反馈从而进行下一步调整和完善。
然而,Vinyals表示,将强化学习应用到星际争霸仍有很多困难亟待解决,因为每种游戏都需要很长的时间去实践。
DeepMind和 Blizzard开发的工具将使人工智能研究人员在星际争霸中部署和测试机器学习算法变得更加容易。这些工具向人工智能本体提供与人类玩家相同的游戏画面和界面,并且这些工具还可以限制程序执行动作的速度。这样就可以确保一个程序必须跟人一样依赖相同的智力工具。
星际争霸作为一个研究平台已有一段时间,但其开发难度依然较大。Vinyals是一名专业的星际争霸玩家,也是加州大学伯克利分校的一名学生,他为星际争霸设计了开创性的自动程序。Facebook和中国公司阿里巴巴的团队也发布了星际争霸的研究成果。DeepMind近日也在一个重要的机器学习会议上发表了一篇论文,展示了现有算法在游戏中的表现。
该程序在无限制德州扑克游戏的单人或双人比赛中击败了多名职业选手。在整个游戏中,Libratus使用了一种非常复杂的算法来计算最佳策略。很巧的是,Brown今年夏天一直在DeepMind实习。
Blizzard的首席工程师Jacob Repp说,他的公司通过观察复杂的人工智能主体与玩家的竞争或合作,探索如何让游戏变得更加有趣。该公司目前已经可以创建遵循游戏脚本命令的主体了。
Repp谈到这些主体在某种程度上使用机器学习也很有意思,他表示公司也正在开发这类创意。“我们发现,这些工具在游戏制作和游戏设计中非常有用。”
据悉,在星际争霸中,玩家可以从三个种族中任选一种参加战斗:来自地球的人类、神秘而强大的星灵以及异形异虫。
战斗涉及了复杂的战略行动,如开采资源和建造基地,以及旷日持久的系列战斗。星际争霸也是最受欢迎的电子竞技之一,尤其在韩国,比赛通常在大型体育场馆中进行,全程电视直播,观众上亿。得知AI要挑战人类,星际争霸的玩家们对AI的“挑衅”表示欢迎,但目前DeepMind尚未对外透露这一计划将何时执行。
翻译 网易见外智能编译机器人 审校 曲海宁