<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能 正文
      發私信給楊曉凡
      發送

      0

      DeepMind和暴雪聯手發布開發工具和replay數據集,讓更多AI研究者玩上星際2

      本文作者: 楊曉凡 編輯:郭奕欣 2017-08-10 15:38
      導語:我們已經開始期待到時現場圍觀人類和AI的星際2挑戰賽了

      雷鋒網 AI 科技評論按:去年年底的時候,大家都知道了 DeepMind 的人工智能要開始玩星際了,今天DeepMind 也正式發布了論文和相關博文介紹了自己在這方面的成果,他們與暴雪聯手發布了一系列工具,方便更多的研究者參與到(讓人工智能)玩星際2中來。雷鋒網 AI 科技評論編譯如下。

      DeepMind 一直抱有這樣的一個科學目標:構建能學會解決復雜問題的系統,以此來不斷推進人工智能的發展前沿。為此,DeepMind 開發了各種各樣的智能體,然后在自己搭建的 DeepMind Lab 平臺上用各種各樣的環境測試它們。

      有一類重要的測試環境是游戲。它們雖然不是專門為人工智能研究設計的,但畢竟人類可以玩得很好,它們也就是評估人工智能表現的一種重要方法。在圍棋和 Atari 游戲都玩得比較熟練了以后,DeepMind 這次介紹了自己在新游戲中的研究進展:星際2。

      • DeepMind和暴雪一起發布了SC2LE,這是一個幫助研究如何讓人工智能玩學會星際2這個RTS游戲的工具包。此次發布的 SC2LE 中包括:

      • 一個機器學習API,由暴雪開發,它能夠幫研究者和開發者接入游戲。其中還首次包括了運行在Linux上的工具。

      • 一個匿名的游戲replay數據集,目前只有6萬5千場,在接下來幾周內會增加到50萬場左右。

      • DeepMind的工具包PySC2的開源版本,研究者可以借助它輕松讓智能體使用暴雪的特征層API。

      • 一篇DeepMind和暴雪聯合完成的論文,它大致介紹了環境的組成、在測試小游戲中取得的初期基準成果、如何從replay監督學習,以及與游戲內置的 AI 進行1v1的天梯對抗。

      DeepMind和暴雪聯手發布開發工具和replay數據集,讓更多AI研究者玩上星際2

      星際和星際2算得上是所有游戲里最大、最成功的那一批,玩家們在這些游戲里廝殺也有超過20年了。不僅星際2,第一代星際也已經被人工智能和機器學習研究者用作測試環境,每年的 AIIDE 上都會舉辦人工智能星際大賽。星際之所以如此長壽,有相當一部分原因是由于它豐富、多層面的游戲過程,這樣它也就成為了理想的人工智能研究環境。

      比如,星際的最終目標是要擊敗對手,但玩家還是需要執行一系列收集資源、造建筑這樣的分目標并在它們之間找到平衡。而且,一場游戲所花的時間短則幾分鐘,長則一小時,那么在游戲早期采取的行動就可能在很長一段時間內都看不到對應的收獲。最后,地圖上只有一部分區域是可見的,智能體就需要綜合使用記憶和規劃能力,才能取得勝利。

      除此之外,這個游戲還有一些別的方面也對研究者有吸引力,比如每天都有眾多的玩家在線上游戲中對抗。這就保證了會有海量的replay數據供智能體學習,而智能體將來也會有許許多多極具天賦的對手可以切磋。

      不過,即便只是星際的操作都是一項不小的挑戰,每時每刻可以選擇的基礎操作超過300種。這就跟 Atari 游戲形成了明顯的區別,它里面可選的動作不超過10種(比如上下左右)。在此基礎上,星際中的操作也是有層次的、可以修改以及增強的,其中的許多操作都需要在屏幕上點擊。就算只是一個84x84那樣的小屏幕,所有可能的操作加起來也會高達上億種。

      DeepMind和暴雪聯手發布開發工具和replay數據集,讓更多AI研究者玩上星際2

      對人類和智能體來說,根據選擇的單位不同,可以進行的操作也不同

      在這次的工具發布以后,研究者就可以用暴雪自己的工具解決一些上面提到的麻煩,這樣就可以更方便地構建自己的任務和模型。

      DeepMind 的 PySC2 工具可以把環境分類打包,從而為強化學習智能體提供了一個靈活易用的界面,幫助它們玩游戲。在此次發布的初始版本中,PySC2 把游戲中不同的元素劃分成了不同的“特征層”,比如不同類型的單位、生命值、地圖的可見性等等會相互分開,同時還能保持游戲核心的視覺和空間元素。

      DeepMind和暴雪聯手發布開發工具和replay數據集,讓更多AI研究者玩上星際2

      用不同的層顯示游戲中不同類型的內容

      SC2LE工具包里還包含一系列的測試小游戲,它們把整個游戲分為了多個不同的可控片段,這樣就可以測試智能體在特定任務上的表現,比如切換視角、采礦或者選擇單位等等。研究者可以在這樣的小游戲中測試他們的技術,同時也可以幫助建立更多的測試小游戲,便于更多的研究者繼續競爭和評估。

      DeepMind和暴雪聯手發布開發工具和replay數據集,讓更多AI研究者玩上星際2

      簡單的強化學習小游戲可以讓研究者測試智能體在特定任務中的表現

      以DeepMind目前的研究進展,他們的智能體已經可以在這樣的特定任務小游戲中發揮不錯的表現,但是到了整場游戲,即便是 A3C 這樣比較強的基準 AI 也根本打不贏“簡單”的游戲內置 AI。比如,下面動圖里左邊的就是一個訓練早期的智能體,它沒法讓礦工采礦,這件事對人類來說不費吹灰之力。經過訓練之后,智能體表現出了有意義的動作,但是如果要讓它們有競爭性的話,還需要在深度強化學習和相關領域有更大突破。

      DeepMind和暴雪聯手發布開發工具和replay數據集,讓更多AI研究者玩上星際2

      DeepMind的研究人員發現了一種讓智能體學到更強策略的技巧,就是模仿學習。這樣的學習方法在暴雪的幫助下也很快就會變得容易,他們已經答應會繼續發布幾十萬局星際2天梯上的匿名游戲replay。這不僅可以讓研究者用監督學習的方法訓練智能體,而且也為序列預測、長期記憶等等其它的研究領域提供了可能。

      DeepMind希望這些新發布的工具可以讓人工智能大家庭在星際游戲上已有的研究成果再前進一步,鼓勵更多的人從事深度強化學習研究,也讓研究者可以更輕松地跟上這個領域的前沿發展。DeepMind也期待人工智能大家庭可以有一些精彩的發現。

      論文地址:https://deepmind.com/documents/110/sc2le.pdf

      PySC2 github地址:https://github.com/deepmind/pysc2

      暴雪的星際2 API地址(包含了Linux版的信息、游戲replay和其它相關內容):https://github.com/Blizzard/s2client-proto 

      via DeepMind Research Blog,雷鋒網 AI 科技評論編譯

      相關文章:

      阿里推出多智能體雙向協調網絡BicNet,玩《星際爭霸》堪比人類

      繼圍棋之后“阿爾法狗”又有新戰場,谷歌打算讓它去玩星際爭霸

      雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

      DeepMind和暴雪聯手發布開發工具和replay數據集,讓更多AI研究者玩上星際2

      分享:

      讀論文為生

      日常笑點滴,學術死腦筋
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 丁香婷婷在线观看| 国产在线精品欧美日韩电影| 亚洲av片在线免费观看| 亚洲女同视频在线观看| 激情影院内射美女| 乱人伦人妻精品一区二区| 精品一二三| 欧美阿v视频| 天天做天天大爽天天爱| 色偷偷88888欧美精品久久久| 亚洲成熟女人毛毛耸耸多| 丰满熟女人妻一区二区三| 免费视频欧美无人区码| 精品人妻一区二区三区蜜臀| 妺妺窝人体色WWW看美女| 欧洲成人一区二区三区| 无翼乌口工全彩无遮挡h全彩| 国产探花在线精品一区二区| 99久久久国产精品无码| 久激情内射婷内射蜜桃| 精品a片| 国产人妻无套一区二区普通话对白| 骚虎视频在线观看| 韩国无码av片在线观看网站| 亚洲一区二区三区av链接| 在线观看成人永久免费网站| 国产顶级熟妇高潮xxxxx| 久久精品国产亚洲av天海翼| 亚洲日韩中文第一精品| 承德市| 久久中文骚妇内射| 欧美啪啪视频| 日韩无码专区| 日韩色导航| 精品日韩人妻| 亚洲都市激情| 乱乱网| 丝袜?亚洲?另类?国产?另类| 国产精品毛片app| 久久夜夜免费视频| 亚洲の无码国产の无码步美|