<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      業界 正文
      發私信給木子
      發送

      0

      歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

      本文作者: 木子 2021-12-10 12:27
      導語:騰訊絕悟AI奪冠Minecraft AI競賽,挑戰開放世界難題

      絕悟AI開始挑戰更復雜的開放世界游戲環境了。

      Minecraft (中文譯名《我的世界》) 是全球最暢銷的開放世界3D游戲。隨機生成的開放地圖、自由靈活的玩法、多線程長鏈條任務,給AI研究帶來了極大挑戰。針對Minecraft的復雜環境,游戲AI賽事MineRL邀請全球程序員在4天時間內用一臺計算機訓練AI找到游戲中的鉆石。 

      12月8日,第三屆MineRL競賽主賽道 (research track) 發布成績,AI 的“鉆石之夢”向前踏進了一大步:騰訊AI Lab“絕悟”以76.970分的絕對優勢奪冠。研究成果已發布在Arxiv上,算法框架可復用于其他復雜決策環境。

      歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

      (論文鏈接:https://arxiv.org/abs/2112.04907

      MineRL競賽由卡內基·梅隆大學、微軟、DeepMind、OpenAI,聯合機器學習頂級會議NeurIPS共同舉辦,極富挑戰性的賽題持續吸引全球開發者關注。今年賽事共有59支團隊、近500名選手投身其中,其中不乏世界頂級學府和研究機構的科研強隊。競賽的研究主題是:訓練樣本高效的Minecraft AI智能體。

      騰訊AI Lab創新性地通過分層強化學習(Hierarchical Reinforcement Learning)、表示學習(Representation Learning)、自模仿學習(Self-imitation Learning)、集成行為克?。‥nsemble Behavior Cloning)等算法高效實現比賽目標。

      歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

       

      歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

      (絕悟AI以壓倒性優勢獲得歷史最高分,今年榜單詳見鏈接

      極度多樣的環境、完全靠隨機種子生成的地圖、長決策序列與復雜的技能學習、高自由度玩法帶來的海量策略偏好都增加了Minecraft AI研究的難度。比如,為了讓AI在15分鐘內找到鉆石,AI需要經歷徒手采集原木、合成木板、木棍與木鎬,采集到鐵礦,經過一系列加工才能合成鉆石。

      此外,主辦方還制定了種種嚴苛的規則:包括禁止參賽者編寫規則、游戲環境甚至將背包信息與動作空間加密、且不允許使用預訓練模型,只允許與環境最多交互八百萬次,每個參賽隊伍只能使用6核CPU與半張NVIDIA K80顯卡訓練4天——這個配置幾乎對于所有高校實驗室與個人研究者都可以負擔的。

      這次比賽的目的在于促進樣本高效 (Sample-efficient) 游戲AI算法的發展。目前流行的強化學習算法一般需要多達成百上千萬次的試錯來尋找最優流程,耗費大量的時間和計算資源。而純靠人類數據的模仿學習算法雖然更快,但性能上往往不盡如人意。

      歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

      (Minecraft 游戲截圖)

      絕悟AI創新性地提出了一種樣本高效的基于分層強化學習(Hierarchical Reinforcement Learning)的解決方案。數據表明,騰訊AI Lab推出的上層控制器的預測準確率可以達到99.95%,也就是說,AI從人類數據中學到了一套幾乎不出錯的宏觀策略,每時每刻都清晰地知道自己下一步的正確動向。

      在狀態空間表征上,Minecraft游戲遇到的最大挑戰在于如何理解復雜的開放地圖。首先被選中的是近年來熱門的表示學習方法 (Representation Learning)。但研究人員很快發現,已有方法只適用于2D場景,在MineCraft游戲環境里效果很差。于是騰訊AI Lab設計了一種“基于動作感知”(Action-aware Representation Learning)的新穎算法,用來捕捉每個動作對環境產生的影響,形成注意力機制。實驗表明,該算法可以顯著提升智能體獲得資源的能力與效率。

      歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

      (不同動作的可視化結果,AI學會了關注當前圖像中的關鍵區域)

      隨著游戲推進,智能體與人類的策略出現了很大的分歧。此時,人類數據已經很難用于指導AI。絕悟AI使用了自模仿學習 (Self-imitation Learning)的思想,提出了基于鑒別器的自模仿學習算法,AI可以從自身過往的成功與失敗中獲得經驗與教訓,并在察覺到當前狀況不妙的時候,主動往更好的方向修正。對比實驗證明,在加入自模仿策略后,智能體探索到的行為更加一致,也可以顯著降低進入危險區域的概率。

      對于合成物品等需要長鏈條的動作序列的任務,研究人員也做了細致的優化。通過動作序列一致性過濾 (Consistency Filtering) 與基于投票的集成學習(Ensemble Learning),模型在合成物品階段的成功率從35%提升到96%,一舉將最薄弱的鏈條扭轉為了最穩定的制勝點。

      利用高度復雜、高度定制化的游戲場景作訓練場,騰訊 AI Lab 的深度強化學習智能體正不斷走近現實。棋牌游戲 AI “絕藝”從圍棋棋盤逐步走向象棋、麻將,策略協作型 AI “絕悟”從MOBA走向FPS、RTS,再到如今的 3D開放世界 MineCraft。它們邁向全新挑戰的每一步,都讓AI離解決現實問題、科技向善的大目標更近了一步。

      隨著虛實集成世界逐步變成現實,這些研究的經驗、方法與結論,將在真實世界創造更大的實用價值。

      雷峰網(公眾號:雷峰網)

      雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。

      分享:
      相關文章
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 亚洲色无码专区一区| 91资源在线观看| 99久久99久久精品免费看小说。| 合作市| 精品国产精品久久一区| 欧美综合自拍亚洲综合区| 成人看的污污超级黄网站免费| 国产成人无码VA在线观看| 嫩草国产福利视频一区二区| 超碰66| xx性欧美肥妇精品久久久久久| 成人免费ā片在线观看| 狠狠躁18三区二区一区| 无码h黄动漫在线播放网站| 香港特级三A毛片免费观看| 亚洲av午夜福利精品一区二区| 国产熟女AV| 西乌| 婷婷综合色| 国产欧美在线一区二区三区| 日韩AⅤ在线| 好湿好紧太硬了我太爽了视频| 免费无遮挡无码视频网站| 全球成人中文在线| 精品久久一区| 性xxxxbbbb| 资源在线观看视频一区二区| 一区二区中文字幕久久| 亚洲另类综合网| 凸凹人妻人人澡人人添| 国产怡春院无码一区二区 | 日韩激情无码免费毛片| 国产看黄网站又黄又爽又色| 亚洲三级香港三级久久| 啪啪福利导航| 日韩av成人在线天堂| 暖暖免费观看电视在线高清| 亚洲精品国产情侣AV在线| 欧美三级a做爰在线观看| 国产sm重味一区二区三区| 久久综合国产精品一区二区|