<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能 正文
      發私信給奕欣
      發送

      0

      從AlphaGo到Libratus,百頁白皮書詳解機器博弈

      本文作者: 奕欣 2017-11-07 16:22
      導語:本白皮書介紹了機器博弈的發展過程、國內外重要賽事、博弈典型技術與比賽平臺;并結合相關棋種介紹各種專項博弈技術,包括完備信息的棋類比賽,也涵蓋不完備信息的牌類游戲

      雷鋒網 AI 科技評論按:計算機博弈也稱機器博弈(Computer Games)。如果按英語字面意義來看,這一名詞應該理解為「計算機游戲」。但從事計算機棋牌競技研究的科學家們,所定義的「Computers Games」則是計算機像人一樣會思考和決策的棋類游戲。為了與計算機游戲進行區隔,Computer Games 采用的是「機器博弈」或「計算機博弈」這一具有指代性的譯名。

      1997 年,IBM 深藍戰勝世界棋王卡斯帕羅夫成為了機器博弈的第一個里程碑,而在近 20 年后,AlphaGo 又橫掃了圍棋世界冠軍李世石,升級版 Master 橫掃 60 余名頂級高手,讓我們看到了計算機博弈的強大生命力與令人驚嘆的技術。

      在 2005 年,中國人工智能學會成立了機器博弈專業委員會,將國際象棋算法移植到中國象棋的電腦程序中,并取得了令人矚目的成果。為了更好地對機器博弈進行一個細致、深入的全景式刻畫,中國人工智能學會機器博弈專業委員會撰寫了《機器博弈白皮書》。本白皮書介紹了機器博弈的發展過程、國內外重要賽事、博弈典型技術與比賽平臺;并結合相關棋種介紹各種專項博弈技術,包括完備信息的棋類比賽,也涵蓋不完備信息的牌類游戲搜索算法。

      雷鋒網 AI 科技評論將 102 頁白皮書進行簡單梳理,對重點內容做概要介紹。原報告為中文版本,歡迎關注 AI 科技評論(aitechtalk),在后臺回復關鍵詞「機器博弈」下載報告全文。

      本文要點:

      • 機器博弈的發展狀況

      • 機器博弈的復雜度及典型技術

      • 完備機器博弈及非完備機器博弈的專項技術

      機器博弈的發展狀況

      在 1928 年,「計算機之父」馮?諾依曼通過對兩人零和一類博弈游戲的分析,提出了極大極小值定理,并證明博弈論的基本原理。在馮?諾依曼與摩根斯特恩合著的《博弈論和經濟行為》(1944)中,將二人博弈推廣到 n 人博弈,并將博弈論系統應用于經濟領域,奠定了機器博弈研究的基礎與理論體系。

      近代機器博弈的研究始于 20 世紀 50 年代,包括阿蘭?圖靈、科勞德?香農、約翰?麥卡錫以及馮?諾依曼等人都做出了巨大的貢獻。隨著研究的深入,科學家們開始研究國際象棋的博弈編程方案,并在 50 至 60 年代有了極大突破。由此,科學家們開始思考,棋類對弈是否能成為讓計算機嘗試戰勝人類的入口。

      從上世紀八十年代中期,美國卡耐基梅隆大學開始研究世界級的國際象棋計算機程序,并在 IBM「深思」、「深藍」的不斷迭代中,計算機在 90 年代以來變得越來越聰明。1996 年的「深藍」、1997 年的「超級深藍」與卡斯帕羅夫的兩場比賽飽受世界矚目,堪稱「世紀之戰」。

      進入 21 世紀,計算機博弈水平也在逐步提升。2016-2017 年,AlphaGo 與李世石在圍棋領域的兩場人機大戰,堪稱是人機對抗史上是頂級比賽,從而也掀起了人工智能的全球熱潮。

      隨著圍棋被攻克,科學家們開始將目光投向了多人博弈的非完備信息機器博弈領域。2017 年初,美國卡耐基梅隆大學開發的德州撲克博弈系統 Libratus,在與 4 名人類頂尖撲克選手的人機大戰中獲得了勝利,再次樹立了機器博弈的新一里程碑。

      機器博弈的復雜度及典型技術

      計算機的博弈水平代表了計算機的智能水平。而衡量其復雜程度的的兩個重要標準則包括了計算機博弈問題的狀態復雜度與博弈樹復雜度。下圖為一些常見博弈問題的狀態復雜度及博弈樹復雜度。

      從AlphaGo到Libratus,百頁白皮書詳解機器博弈

      計算機博弈的最高境界是找到該棋種的理想解,即不敗解。而計算機博弈的最大困難和無法逾越的障礙則是問題的計算復雜性。被廣泛認可的博弈問題,其計算復雜性一般都屬于某復雜性類的困難問題(hard)或完全問題(complete),屬于此類計算復雜性類的問題,被認為是最難解或是最難解的。

      計算機博弈系統中,典型的關鍵技術主要包括搜索、評估與優化、學習與訓練等技術。典型的博弈搜索算法:

      1. 從搜索方向考慮,可分為深度優先搜索與寬度優先搜索;

      2. 從控制策略考慮,可分為盲目搜索與啟發搜索;

      3. 從搜索范圍考慮,可分為窮盡搜索、裁剪搜索。

      此外,機器博弈的典型算法還包括迭代深化、最佳優先算法、隨機搜索算法、并行計算、遺傳算法、神經網絡、機器學習等。

      計算機博弈平臺系統本身并不具有下棋或出牌的邏輯決策功能,但它能加載其它一個或多個決策引擎程序,使這些引擎程序以選手的角色參與對局。根據不同標準,計算機博弈平臺可分為如下幾類:

      1. 完備信息博弈平臺和非完備信息博弈平臺

      2. 單引擎博弈平臺和多引擎博弈平臺

      3. 單機博弈平臺和網絡博弈平臺

      4. 程序級博弈平臺和模塊級博弈平臺

      完備機器博弈及非完備機器博弈的專項技術

      以完備信息機器博弈與非完備信息博弈的專項技術,白皮書以棋類為例,分述了不同棋種的游戲規則,并介紹了它們在機器博弈所采用的主要技術。

      國外機器博弈在完備信息博弈的研究代表是 Google 公司的 AlphaGo,它具有極強的自覺能力。AlphaGo 的成功充分驗證了深度學習與計算機博弈技術結合的實用性。學者總結 AlphaGo 的關鍵技術包括:

      1. 棋感直覺:通過深度學習獲得,分為落子棋感與勝負棋感。AlphaGo 通過對 3000 萬的經典棋局進行深度學習獲得快速走棋網絡(落子棋感)與策略網絡;勝負棋感則是通過策略網絡不斷進行自對弈得到。

      2. 搜索驗證:搜索引擎采用蒙特卡洛搜索樹根據落子棋感與勝負棋感不斷展開搜索樹。

      國外機器博弈在不完備信息博弈的研究代表是美國卡耐基梅隆大學開發的德州撲克博弈系統 Libratus。主要包括三個關鍵模塊:

      1. 賽前納什均衡近似,讓 Libratus 自己學會德州撲克。它將最重要的博弈信息(如針對某一手牌對應的戰略)進行抽取,再應用強化學習算法進行提升。

      2. 殘局解算,讓 Libratus 不僅能在比賽前學習,還能在比賽中學到東西。科學家從下往上構建博弈樹,得以較容易地算出最下面節點的狀態,再反過來指導設計上面的博弈樹,并使用蒙特卡洛方法,每次選一些節點更新上面的策略。

      3. 持續自我強化。在游戲中發現問題所在,并找到更多細節進行自我強化,得到更好的納什均衡。

      目前,機器博弈也帶動了游戲產業、智慧醫療、智能交通、航空、航天等相關產業中,特別是與軍事國防領域的產業,催生新型武器與系統。

      盡管機器博弈取得了巨大的成果,但依然存在一定局限性。具體包括:

      1. 應用拓展方面仍有提升空間;在具有模糊性和隨機性的麻將、橋牌、斗地主、多國軍旗等非完備信息博弈上,雖然在基于案例的策略研究上有一定進展,但相關研究還不成熟,開發的程序智力有限,目前還難以戰勝人類頂級高手,存在一定的提升空間。

      2. 在相關技術產業化方面,產學研結合還有不足之處。一方面,相關企業缺乏機器博弈的專業人才,特別是頂級人才的支持;另一方面,機器博弈領域專家、學者們缺少相關部門、企業給予的研發資金支持。

      在國內外,包括國際象棋人機博弈大賽、圍棋人機與機機博弈大賽、橋牌計算機博弈大賽、德州撲克人機與機機博弈大賽、中國象棋人機與機機博弈大賽、中國計算機博弈大賽等多項賽事,本白皮書也做了詳細的介紹與回顧。

      雷鋒網AI科技評論小結:《機器博弈白皮書》成書之際恰逢國務院印發《新一代人工智能發展規劃》,希望能更好讓讀者們對機器博弈這一技術產生系統性的了解。相信在未來,計算機博弈將與其它領域的技術更加緊密結合,推動人工智能產業發展。

      原報告為中文版本,共 102 頁,歡迎關注雷鋒網 AI 科技評論(aitechtalk),在后臺回復關鍵詞「機器博弈」下載報告全文。

      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。

      從AlphaGo到Libratus,百頁白皮書詳解機器博弈

      分享:
      相關文章
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 少女たちよ在线观看| 国产激情免费视频在线观看| 亚洲AV无码久久精品日韩| 亚洲综合图区| 欧美性白人极品hd| 国产精品嫩草影院一二三区入口| 隆安县| 国产精品天干天干综合网| 国产欧美va欧美va香蕉在| 人妻大战黑人白浆狂泄| 亚洲高清中文字幕| www.久久se精品一区二区.com| 暖暖影院日本高清...免费| 扒开女人内裤猛进猛出免费视频| 真实单亲乱l仑对白视频| 亚洲国产精品成人无码区| 思思热在线视频精品| 建瓯市| 无码免费婬av片在线观看| 无码人妻丝袜| 18禁裸体女免费观看| 亚洲精品美女久久7777777| 91国产精品| 熟女丝袜在线| 最新国产精品好看的精品| 国产做无码视频在线观看| 免费视频爱爱太爽了| 亚洲第一成年免费网站| 尤物一区| 丰满诱人的人妻3| 人妻无码第一区二区三区| 亚洲欧美v国产一区二区| 黄色V国产| 亚卅精品| 东京热一本无码av| 亚欧洲乱码视频在线专区| 亚洲色欲久久久久综合网| 国产成人无码a区精油按摩| 成人综合网址| 无遮挡aaaaa大片免费看| 绿帽人妻被插出白浆免费观看 |