0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度强化学习平台为玩家带来新的人工智能体验

星星科技指导员 来源:NVIDIA 作者:Michelle Horton 2022-04-07 16:35 次阅读

得益于索尼 AI 、索尼互动娱乐( SIE )以及 GT Sport 的开发者 Polyphony Digital Inc 。的最新合作, Gran Turismo ( GT ) Sport 的竞争对手正面临一个新的、 AI 超级强大的竞争者。

被称为 Gran Turismo Sophy ( GT Sophy )的自主人工智能赛车代理最近击败了 GT 运动领域的世界最佳车手。发表在 Nature, 上的 工作 介绍了一种新的深度强化学习平台,用于创建 GT Sophy ,并可能为全球玩家带来新的人工智能体验。

索尼集团公司董事长、总裁兼首席执行官吉田健一郎在一份 发布。 的声明中说:“索尼的目的是‘通过创造力和技术的力量,让世界充满情感’,而大图里斯莫·索菲就是这一点的完美体现。”

“我们为游戏玩家打造了一款游戏 AI ,这是索尼作为一家创意娱乐公司的独特之处。它标志着 AI 发展的重大飞跃,同时也为全球 GT 粉丝提供了增强的体验。”

Smart gaming

人工智能对游戏来说并不新鲜。 2017 年,来自 DeepMind 的 Alpha Zero 项目在学会玩和征服国际象棋、日本象棋和使用深度强化学习( deep RL )围棋时成为新闻

作为机器学习的一种补偿, deep RL 在基本术语中使用计算 RL 代理通过试错来做出决策,以解决问题。在算法中引入深度学习后,智能体从非常大的数据集做出决策,并决定有效地实现其目标的行动。

Alpha Zero 程序使用了一种算法,一个未经训练的神经网络对自己进行了数百万次游戏,并根据其结果调整游戏。

然而,赛车人工智能对来自不同汽车、赛道、驾驶员、天气和对手的无数变量提出了更复杂的推理需求。作为最逼真的驾驶模拟器之一, GT Sport 使用真实的赛车和赛道尺寸,通过考虑空气阻力和轮胎摩擦等因素再现比赛环境。

强化良好行为

该团队创建了一个能够适应实时因素的赛车代理,并使用新开发的 deep RL 算法对 GT Sophy 进行了赛车控制、赛车战术和赛车礼仪三项具体技能的培训。根据 project’s website ,该算法使用最新的强化学习技术,根据赛车经纪人的行为对其进行奖励或惩罚。

研究人员在研究报告中写道:“使用 deep RL 开发赛车代理的优点之一是,工程师无需编程如何以及何时执行赢得比赛所需的技能,只要它暴露在正确的条件下,代理通过反复试验学会做正确的事。”。

该团队定制了一个基于网络的分布式异步部署和培训( DART )平台,使用 SIE 的全球云基础设施研究人员在 PlayStation 4 控制台上培训 GT Sophy ,然后使用 DART 收集培训数据并评估代理的版本。

使用这个系统,研究人员指定一个实验,自动运行,并在网络浏览器中查看数据。每个实验都在一个计算节点上使用一个培训师,该培训师使用 cuDNN 加速的 TensorFlow 深度学习框架和 NVIDIA V100 GPU 或 NVIDIA A100 GPU 的一半,再加上大约 8 个 CPU 和 55 个 记忆的碎片。

据 project’s website 报道,“该系统允许索尼人工智能的研究团队无缝地同时运行数百个实验,同时探索将 GT Sophy 提升到下一个水平的技术。”。

增压燃气轮机

在 2021 ,世界上最好的 GT 赛车手中有四人在两个单独的比赛中与 GT Suffy 竞争。这些比赛包括三个赛马场、四名 GT Sophy 经纪人和赛车。在首次亮相时, GT Sophy 在计时赛中表现出色,但在同一赛道上挑战赛车手时表现不佳。

该队在第一场比赛结果的基础上进行了改进,升级了训练体系,增加了网络规模,调整了特征和奖励,增强了对手。

这一结果造就了一名赛车经纪人,他可以在急转弯处超越一名人类驾驶员,处理拥挤的起跑,在滑流中进行弹弓传球,并执行防守动作。经纪人这样做的同时,也遵守了人类驾驶员理解和实践的微妙的体育道德考虑。在计时赛和 FIA 认证的格兰赛车锦标赛系列赛中,它也击败了顶尖的人力车手。

据报道, GT Sophy 在短短几个小时内就学会了绕道而行。在大约两天的时间里,它可以击败大约 95% 的人类玩家。给它 10 到 12 天,大约 45 , 00 个驾驶小时, GT Sophy 就等于或超过了世界顶级车手。

凭借其赛车实力, GT Sophy 的目标是让 GT 运动更有趣、更具竞争力和教育性。一些与 GT Sophy 竞争的专家报告说,他们学习了转弯和驾驶技术的新方法。

研究人员还发现, deep RL 有可能改善协作机器人无人机自动驾驶车辆等系统的实际应用。

关于作者

Michelle Horton 是 NVIDIA 的高级开发人员通信经理,拥有通信经理和科学作家的背景。她在 NVIDIA 为开发者博客撰文,重点介绍了开发者使用 NVIDIA 技术的多种方式。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    201

    文章

    25444

    浏览量

    198942
  • NVIDIA
    +关注

    关注

    14

    文章

    4256

    浏览量

    100443
  • 自动驾驶
    +关注

    关注

    758

    文章

    12207

    浏览量

    161995
收藏 人收藏

    评论

    相关推荐

    未来的人工智能技术趋势是什么?

    深度学习正在超越机器学习人工智能来势凶猛。那么,如今人工智能最热门的技术趋势是什么?黑匣认为,复杂神经网络、LSTMs(长短
    发表于 12-23 14:21

    人工智能和机器学习的前世今生

    人工智能、机器学习深度学习方面的知识,以及它们对商业化意味着什么。如果正确的利用模式识别进行商业预测和决策,那么会为企业带来巨大的利益。机器学习(ML)研究这些模式
    发表于 08-27 10:16

    人工智能、数据挖掘、机器学习深度学习的关系

    人工智能、数据挖掘、机器学习深度学习之间,主要有什么关系?
    发表于 03-16 11:35

    人工智能AI-深度学习C#&LabVIEW视觉控制演示效果

    深度学习人工智能AI的重要组成部分。可以说人脑视觉系统和神经网络。2、目标检测、目标跟踪、图像增强、强化学习、模型压缩、视频理解、人脸技术、三维视觉、SLAM、GAN、GNN等。
    发表于 11-27 11:54

    深度强化学习实战

    强化学习简介课程二、强化学习基础课程三、深度强化学习基础课程四、多智能深度强化学习课程五、多任务深度强化学习课程六、强化学习应用课程七、仿真实验课程八、辅助课程四、主讲
    发表于 01-10 13:42

    人工智能芯片是人工智能发展的

    人工智能芯片是人工智能发展的 | 特伦斯谢诺夫斯基责编 | 屠敏本文内容经授权摘自《深度学习 智能时代的核心驱动力量》从AlphaGo的人机对战,到无人驾驶汽车的上路,再到AI合成主播上岗
    发表于 07-27 07:02

    人工智能汽车标定方案

    人工智能强化学习在汽车标定领域的方案,随着国六标准的实施,RDE测试提高不断要求,通过强化学习算法,构建机器学习模型,设定更严格的参数寻找更优的目标,在虚拟环境中推演RDE测试下的排放情况,提升标定效果,大幅度压缩实验室标定周期,降低标定成本。
    发表于 09-09 15:01

    基于RK3399ProD的人工智能开发板深度学习课程分享

    的人工智能开发板深度学习课程分享
    发表于 02-11 08:54

    什么是人工智能、机器学习深度学习和自然语言处理?

    学习深度学习的结果。人工智能适用于云端,在那里它可以处理大数据。未来的人工智能将主要集中在具有专门硬件架构的边缘设备上。我们希望人工智能能够成为真正的人智能的复制品,并展示出
    发表于 03-22 11:19

    人工智能强化学习开源分享

    人工智能强化学习开源分享.zip》资料免费下载
    发表于 06-20 09:27 0次下载
    <b>人工智能</b><b>强化学习</b>开源分享

    深度学习强化学习相结合的深度强化学习DRL

    深度强化学习DRL自提出以来, 已在理论和应用方面均取得了显著的成果。尤其是谷歌DeepMind团队基于深度强化学习DRL研发的AlphaGo,将深度强化学习DRL成推上新的热点和高度,成为人工智能历史上一个新的里程碑。因此,
    发表于 06-29 18:36 2.7w次阅读

    如何深度强化学习 人工智能深度学习的进阶

    强化学习人工智能领域占据着一个合适的地位。但强化学习在过去几年已开始在很多人工智能计划中发挥更大的作用。
    的头像 发表于 03-03 14:16 3744次阅读

    人工智能机器学习强化学习

    强化学习智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价
    发表于 05-30 06:53 1104次阅读

    强化学习泡沫之后,人工智能的终极答案是什么?

    深度强化学习(Deep Reinforcement Learning, DRL)迅速成为人工智能界的焦点。
    的头像 发表于 08-09 10:12 5561次阅读

    《自动化学报》—多Agent深度强化学习综述

    深度学习强大的表征能力和强化学习有效的策略搜索能力,深度强化学习已经成为实现人工智能颇有前景的学习范式.然而,深度强化学习在多Agent 系统的研究与应用中,仍存在诸多困难和挑战,以StarCraft II
    发表于 01-18 10:08 987次阅读
    《自动<b>化学</b>报》—多Agent<b>深度</b><b>强化学习</b>综述