200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > 谷歌用人工智能踢足球 为什么国足开心了?

谷歌用人工智能踢足球 为什么国足开心了?

时间:2020-08-28 13:18:46

相关推荐

谷歌用人工智能踢足球 为什么国足开心了?

谷歌的人工智能研究人员创造了一个足球模拟器,用于训练下一代机器学习算法。

谷歌在机器智能方面的研究处于世界领先地位。尤其是它的子公司DeepMind,拥有一系列令人印象深刻的成就。DeepMind的神经网络在众多游戏中取得的表现堪称惊艳。比如雅达利的电子游戏,如Pong、Breakout、Space Invaders以及更复杂的多人在线游戏《星际争霸》。

DeepMind在更传统的游戏上也取得了显著的成功。,AlphaGo打败了世界上最强大的职业棋手之一,这是机器首次获胜。在这个过程中,AlphaGo找到了全新的玩法,彻底改变了人类对围棋的看法。

谷歌不满足于坐享其成,现在正将注意力转向更开放型的游戏,在这些游戏中,不可预测性扮演着更重要的角色。谷歌的下一个目标视频足球就有如此特征。

谷歌研究团队的卡罗尔·库拉奇和他的同事们创造了一款名为“谷歌足球环境”的足球电子游戏,让研究人员能够在一个基于物理、可定制、易于使用且可无限复制的世界中测试其算法。他们通过开源许可让这个世界变得可用,这样任何地方的研究人员都可以使用它来开发出更好的足球游戏算法。

背景介绍:人工智能研究人员面临的挑战之一,是找到能为机器学习算法提供新问题的任务。对于这些算法来说,像Pong或Breakout这样简单的电子游戏有时过于简单,它们只需经过几个小时的训练就能实现超越人类的表现。

但是像星际争霸这样更复杂的电子游戏来说,则难度太大。《星际争霸》是一款多人实时战略游戏,游戏发生在一个庞大的在线世界。人工智能研究人员对此很感兴趣,因为它可以让基于游戏的人工智能系统在复杂的环境中与其他人类玩家进行对抗。然而,这个游戏是如此庞大和复杂,它需要巨大的计算资源来收集相关数据和训练一个机器学习系统。这些资源对大多数研究人员来说并不现实。

另一个问题是,许多热门游戏的在线环境运行在专有代码上,研究人员无法更改甚至无法看到这些代码。这使得我们不可能知道游戏是如何做出重要决定的,也不可能尝试不同的决策过程。

最后,许多游戏都是完全确定的:在相同的输入条件下,它们将以完全相同的方式运行。这使得它们很容易被学习算法打败。

但在现实世界中,事情从来都不是理想状态的,处理突发事件的能力是一项重要的技能。机器学习这一技能的唯一方法是在不可预测的环境中进行训练。但不可预测性必须是可控的——太少,游戏就太容易,太多就会让学习变得太难。创建这样一个环境也更棘手。

这就是足球模拟器的用武之地。基于游戏的物理特性,它们具有一定程度的可预测性。但也有很多不可预测性,比如对方球员的战术、在抢断后球员之间的配合等等。

库拉奇和他的同事使用一种名为游戏性足球的公开游戏作为基础建立起自己的模拟器,这个游戏包含足球比赛中的各个要点,包括进球、犯规、角球、点球、越位等等。谷歌团队表示:“足球环境提供了一种基于物理的3D足球模拟,在这种模拟中,球员由人类玩家控制,学习如何在他们之间传球,以及如何克服对手的防守,如何才能进球。”

研究人员根据机器方控球移动到对手球门的距离来衡量机器的成功标准。这很必要,因为衡量成功的标准反映的是一个在足球场上相对罕见的事件进球,而不是提供一个时时刻刻监控机器进展的方法。

该团队还创建了几个不同复杂度的标准环境,用于培训和测试人工智能机器。机器所面临的任务包括射进空门、与门将1V1跑动得分、在1V3的情况下进球、鼓励传球等等。整个测试是包含所有的常规规则和一个基于机器的对手。

这种学习算法适用于和其他机器或人类玩家对抗。这能让它学习到更广泛的策略经验,同时避免机器只是简单地学习基于机器的对手的弱点的场景。库拉奇说:“这是一个具有挑战性的强化学习问题,因为足球这项运动需要在短期控球、学习和队友传球的概念和整个团队战略之间保持自然平衡。”

这是一项有趣的工作,它在帮助机器学习在更现实的环境中工作潜力巨大。而且这也增加了机器学习创造出一种人类从未考虑过的新足球策略的可能性,就像它们学习围棋一样。

这些战术甚至可能出现在机器人足球比赛中,甚至是人类之间的比赛中。

这些策略对真实足球的效果是否和对模拟足球的效果一样好,将是一个值得关注的有趣问题。这对于人工智能研究人员和足球迷来说都是非常吸引人的。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。