东南教育网您的位置:首页 >互联网 >

借助新的AlphaStar系统DeepMind首先获得了另一个AI

导读 在训练了一种能够熟练掌握国际象棋和围棋的人工智能模型之后,Alphabet Inc 的DeepMind子公司开始了一个新项目:在一款热门电子游戏上破解

在训练了一种能够熟练掌握国际象棋和围棋的人工智能模型之后,Alphabet Inc.的DeepMind子公司开始了一个新项目:在一款热门电子游戏上破解该代码,研究人员将其视为AI的“巨大挑战”之一。

该小组已经为名为“星际争霸2”的游戏建立了专用的深度学习系统AlphaStar,该系统在周四晚些时候进行了详细介绍。

该系统被誉为迄今为止最复杂的系统。在DeepMind上个月举行的一系列比赛中,AlphaStar成为世界上第一个在没有任何游戏限制的情况下击败专业水平人类玩家的AI。

之所以成为如此重要的里程碑,是因为《星际争霸2》的复杂性。与国际象棋和围棋不同,该游戏提供了一种所谓的不完美信息游戏环境,其中隐藏了某些关键细节。这使它在概念上更类似于AI模型在现实世界中的实际应用中必须处理的任务。

《星际争霸2》具有复杂的策略元素,进一步提高了难度。比赛在三维地图上进行,其中两个对立的玩家收集资源,建造建筑物并组建虚拟军队,以试图使对方超越。

在这些条件下获胜需要AI掌握诸如长期计划之类的技能,这对于某些实际的深度学习用例也是必需的。DeepMind的研究人员解释说:“就像许多现实问题一样,因果关系不是瞬时的。” “游戏也可能需要长达一个小时的时间才能完成,这意味着在游戏早期采取的行动可能不会在很长时间内获得回报。”

DeepMind分两个阶段对AlphaStar进行了培训。首先,它提供了人类玩家比赛的AI素材。然后,该小组让AlphaStar负责虚拟的星际争霸II联赛,并责成其培养能够与对手进行对抗的人工智能竞争对手。

DeepMind研究人员写道:“随着联盟的进步和新竞争对手的出现,新的反战略出现了,这些战略可能会击败早期的战略。” “虽然一些新竞争者执行的策略只是对先前策略的改进,但其他竞争者却发现了由全新的建造订单,单元组成和微观管理计划组成的全新战略。”

在上个月DeepMind举行的比赛系列中,AlphaStar的经纪人击败了10:1的两名专业水平的人类玩家。Alphabet子公司计划在未来的学术研究中与更广泛的AI社区分享促进这一胜利的一些方法。纸。这个想法是使DeepMind以外的研究人员能够在自己的项目中利用AlphaStar的培训技术。

免责声明:本文由用户上传,如有侵权请联系删除!