Unity机器学习｜如何使用ML-Agents教机器人踢足球

admin 欧洲杯直播 2024-02-13 112 0

　　Unity Machine Learning Agents Toolkit（Unity机器学习工具，简称ML-Agents）允许用户使用 Unity 轻松开始强化学习 (RL)。ML-Agents 本身带有多种样例环境和模型架构，可让用户利用现成的环境和架构上手 RL，再通过调整超参数来测试和改进结果模型。所有这些都毋须新建 Unity 场景或导入资产，且初期不涉及任何编程。

　　我们的Unity机器学习系列展示了创作者如何使用Unity人工智能产品而制作一系列Unity项目。在这个例子中，ML-Agents 使 AI 开发人员能够快速、轻松地设置机器学习环境并训练智能体如何踢足球，然后最终将该智能体转移到真正的机器人上大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!。

　　ML-Agents: https://plastichub.unity.cn/unity-tech-cn/ml-agents

　　本文介绍的Unity机器学习项目由日本公司 Ghelia Inc. 创立，他们使用了 ML-Agents 的 Soccer 训练环境来训练智能模型踢足球。训练出的 RL 模型随后被部署到了索尼的 toio 机器人上，在真实世界中踢起了足球。这是一个用 Unity ML-Agent 训练机器人、从“虚拟到现实”的绝佳实例。

　　我们采访了 Ghelia 的 CEO 兼总裁Ryo Shimizu，创新和品牌战略办公室的首席程序员Hidekazu Furukawa，及创新部经理 Masatoshi Uchida，来了解该项目的灵感。下文将介绍公司怎样使用 ML-Agents Toolkit 来训练一个真实机器人踢足球，及高尔夫球在场景中的作用。大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!

　　请问是什么启发了你们呢？

　　Ghelia 是一家专注于强化学习应用的公司。Ghelia 的创始人Hiroaki Kitano（北野弘明）在索尼任职期间创办了 Robocup Soccer 足球赛，并开发出了 AIBO 机器人。我们的团队曾制作过一个空气曲棍球演示，但过于繁杂的部件使其变得不够轻便。为了向客户们解释强化学习的概念，我们开始讨论制作另一个便于展示的演示场景。鉴于 ML-Agents 已经有了一个足球训练环境，我们完全可以用轻便小巧的索尼 toio 机器人来开发一个足球游戏，游戏甚至有可能被病毒式传播。

　　你们是怎样将 ML-Agent 模型移植到真正的机器人上的？

　　为了将强化学习应用于真实的机器人，我们需要将机器人先导入到模拟环境中。幸好，toio 已经有一个称为 toio SDK for Unity 的模拟程序。我们能直接将SDK与 ML-Agents 软件包结合使用，立即开始训练。

　　但toio SDK 仅提供了机器人模型，而足球需要另外制作。

　　我们使用了 Unity 物理引擎在模拟程序中重现了逼真的足球，还在现实中搜寻能准确还原模拟情景的小球大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!。结果，高尔夫球的运动可准确匹配训练的成果。球的位置在 Unity 中以 transform 值表示，在现实里则使用相机进行拍摄、用 OpenCV 进行识别。

　　实机运行的硬件配置是？

　　我们使用一个高尔夫球来代表足球，并将其涂成红色以提高辨识度。不可思议的是，我们仅用一部 iPhone 就能完成足球的探测，控制所有八个机器人（这是一场四对四的足球比赛），再使用 ML-Agents 模型进行推导。

　　你们是如何设计机器学习奖励机制的？

　　起初，是有很多乌龙球的，所以我们尝试给乌龙球设置负面奖励，但这又导致了守门员不会去主动防守球门。而如果为运球设置积极奖励，两队又只会来回运球，不会积极射门，基本上就是在拖延时间。最后，我们决定把奖励设置为进球得一分，被进球则扣一分。

　　项目中最具挑战的地方在哪里？

　　有时实机机器人并不会像模拟的那样行动，其背后原因有时让人捉摸不透。比方说，如果机器人在一个稍微倾斜的地板上运动时，有时会导致推导失败；另外，如果球的反弹与模拟不同，机器人也无法做出训练好的反应。并且，机器人对摄像机位置的要求十分严苛，需要达到毫米级的精度，这使得每次线下活动的镜头调整异常困难。在每一次大型修改后，模型还需要三天左右的训练时间来适应，我们总共进行了约六次的训练环节来实现如今的成果。

　　虚拟机器人在相互碰撞时不会有太大的影响，但真正的机器人相撞可能会引发意外。你们是如何解决这个问题的呢？

　　在 ML-Agents 的演示里，智能代理在进球后会自行回到原位站好，但这一步对真正的机器人来说没这么简单。问题在于，仅靠强化学习很难避免 toio 机器人相撞。最初我们试图为避免相撞设立奖励，但最终还是找到了一种机智的解决方法。

　　对于那些想在项目中用上机器学习的 Unity 创作者，你有什么建议？

　　AI，特别是深度学习是让人痴迷，但人们尚未充分理解它。除非亲手尝试过，否则你将无法欣赏技术的美和复杂度，当半桶水是远远不够的。所以我们鼓励全球 Unity 开发者亲自上手 AI 技术。我想特别指出机器学习非常有趣，而 Unity ML-Agents 机器学习工具能帮你轻松地上手或整合机器学习到项目中。

Unity机器学习｜如何使用ML-Agents教机器人踢足球