^{<sub id="jgr5k"></sub>}

騰訊開悟打造王者榮耀AI開放研究環境，推動人工智能科技創新

本文作者：嘉嘉

2022-11-21 16:35

導語：騰訊開悟“王者榮耀AI開放研究環境”啟動申請，為學術研究提供探索平臺

11月21日，騰訊“開悟”平臺宣布正式開放“王者榮耀AI開放研究環境”申請，邁出全面開放的第一步。面向非商業用途的機器學習算法研究，“開悟”平臺將提供業界獨有的高復雜度MOBA訓練環境，助力相關學術領域的前沿探索。

最新開放申請的“王者榮耀AI開放研究環境”，包含了王者榮耀1v1對戰環境與baseline算法模型，當前支持20位英雄的鏡像對戰任務以及非鏡像類對戰任務，尤其適合研究競爭性強化學習中的泛化性與通用性問題。

現在，研究者只需在騰訊開悟平臺官網注冊賬號、提交資料并通過平臺審核，即可免費下載王者榮耀1v1測試環境gamecore，在本地進行AI相關研究測試。

申請地址：https://aiarena.tencent.com/aiarena/zh/open-gamecore

騰訊開悟打造王者榮耀AI開放研究環境，推動人工智能科技創新

據了解，“王者榮耀AI開放研究環境”項目發布以來受到廣泛關注，今年9月以264星登上Github 月度熱榜，同時，相關論文已被AI領域的頂級國際學術會議 NeurIPS 2022接收。

隨著王者榮耀游戲在持續運營中成長迭代，“開悟”平臺也將逐步探索并開放更多適用于AI研究的游戲測試環境，為AI業界面臨的“缺乏高挑戰測試環境”難題提供全新解決方案。

在王者榮耀對戰中，雙方玩家互為競爭關系，需要收集資源的同時干擾對方，以達到贏得游戲的目的。作為一個具備多英雄、多玩法的復雜對抗游戲，王者榮耀的狀態、動作空間復雜度比圍棋等游戲高很多，是學術屆研究復雜控制類問題的優質環境。

2019年，騰訊AI Lab首次發布決策智能AI“王者絕悟”的研究論文，介紹在王者榮耀1v1環境中研究用深度強化學習來為智能體預測游戲動作的方法，該論文被AAAI 2020接收，之后“王者絕悟”陸續攻克5v5挑戰及全英雄池，在學術領域取得多項成就同時，也為王者榮耀玩家帶來了“挑戰絕悟”等創新玩法。

同年，王者榮耀及騰訊AI Lab聯手打造“開悟”AI開放研究平臺，打造游戲AI產學研新生態。如今“開悟”正式開放王者榮耀1v1環境，并對環境進行了易用性封裝，提供標準代碼與訓練框架，讓個人用戶在資源允許的情況下可以輕松上手分布式訓練。

本次最新開放申請的“王者榮耀AI開放研究環境”在只考慮雙方英雄選擇條件下，支持400種對戰子任務，如果算上召喚師技能，將會有40000種子任務，這對模型的泛化性有很大挑戰，所以尤其適合研究競爭性強化學習中的泛化性與通用性問題。

進一步看，研究模型對不同任務的泛化性，對降低AI在不同領域的應用成本至關重要。例如，面對測試環境中的多個任務，如何在有限的資源和時間條件下獲得最好的效果，這其中的研究方法論和成果就可以遷移到其他領域，比如機器人不同部位的控制等。

“開悟”是騰訊牽頭構建的AI多智能體與復雜決策開放研究平臺，依托騰訊AI Lab和“王者榮耀”在算法、算力、實驗場景方面的核心優勢，為學術研究人員和算法開發者開放的國內領先、國際一流研究與應用探索平臺。

目前，“開悟”也正在持續助力AI學界人才培養。2019年至今，“開悟”AI 開放研究平臺已成功主辦兩屆“開悟多智能體強化學習大賽”、承辦了成都大運會?“世界大學生數智競技邀請賽”AI賽道，“以賽促研”為國內外青年研究人才提供測試及提升AI在復雜游戲場景下應用水平的機會。

2021年起，“開悟”先后與北大、清華、中科大等19所國內頭部高校教師團隊聯合發起創新課程合作項目，已于多所高校陸續落地多智能體強化學習實踐課程，幫助學生通過更有趣的方式掌握機器學習、強化學習、多智能體決策等關鍵知識點。

基于“開悟”平臺，騰訊將與學界、業界攜手，共同利用游戲環境不斷提升AI能力，并尋找 AI 技術解決更多問題的可能性，在機器人、醫療、工業、交通等領域發揮更大作用。

附：論文地址

騰訊開悟打造王者榮耀AI開放研究環境，推動人工智能科技創新

論文鏈接：https://openreview.net/forum?id=7e6W6LEOBg3

代碼鏈接：https://github.com/tencent-ailab/hok_env

雷峰網版權文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

嘉嘉

編輯

發私信

當月熱門文章