<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
      人工智能 正文
      發(fā)私信給亞萌
      發(fā)送

      0

      黃仁勛親自撰文懟上 TPU:P40速度比你快 2 倍,帶寬是你的 10 倍

      本文作者: 亞萌 2017-04-11 19:27
      導(dǎo)語:英偉達 CEO 黃仁勛就親自撰文回應(yīng)了TPU性能的,文章第一段就以谷歌TPU開頭,炮擊意圖十分明顯,隨后更是扔出了 Tesla P40 GPU 與 TPU 的

      黃仁勛親自撰文懟上 TPU:P40速度比你快 2 倍,帶寬是你的 10 倍

      雷鋒網(wǎng)按:前不久谷歌發(fā)布了關(guān)于TPU細(xì)節(jié)的論文,稱“TPU 處理速度比當(dāng)前 GPU 和 CPU 要快 15 到 30 倍”。當(dāng)時就有人對此種“比較”表示質(zhì)疑,因其拿來的比較對象并非市場里性能最好的。

      而昨晚(美國時間 4 月 10 日)英偉達 CEO 黃仁勛就親自撰文回應(yīng)了這一“比較”,文章第一段就以谷歌 TPU 開頭,炮擊意圖十分明顯,隨后更是扔出了 Tesla P40 GPU 與 TPU 的性能對比圖,可謂針尖對麥芒。

      不過 P40 和 TPU 的售價差距很大(P40 24GB版本售價5千多美元,TPU 成本估計在幾百美元),尺寸和制程也不一樣,也有人覺得這樣的對比未免也是不恰當(dāng)?shù)?。但黃仁勛不惜親自撰寫長文,擺事實擺數(shù)據(jù),意在表明英偉達在 AI 芯片領(lǐng)域的強勢姿態(tài)和技術(shù)領(lǐng)先的驕傲。

      當(dāng)時TPU論文甫一發(fā)布,雷鋒網(wǎng)就論文中的比較對象問題咨詢了AI人士意見,感興趣的讀者可戳《谷歌公布TPU細(xì)節(jié)之后,AI業(yè)界怎么看?》。以下為黃仁勛發(fā)表全文,原文標(biāo)題為“AI 驅(qū)動數(shù)據(jù)中心加速計算的崛起”(AI Drives the Rise of Accelerated Computing in Data Centers),由雷鋒網(wǎng)編譯。

      谷歌最近的TPU論文給出了一個十分明確的結(jié)論:如果沒有高速計算能力,大規(guī)模AI實現(xiàn)根本不可能。

      如今的世界經(jīng)濟運行在全球的數(shù)據(jù)中心之上,而數(shù)據(jù)中心也在急劇發(fā)生改變。不久之前,數(shù)據(jù)中心服務(wù)支撐網(wǎng)頁、廣告和視頻?,F(xiàn)在,它們能夠從視頻流里識別聲音、檢測圖片,還能隨時讓我們獲得想要的信息。

      以上提到的各種能力,都在愈來愈依靠深度學(xué)習(xí)來支撐。深度學(xué)習(xí)是一種算法,從海量數(shù)據(jù)里學(xué)習(xí)形成軟件,來處理諸多高難度挑戰(zhàn),包括翻譯、癌癥診斷、自動駕駛等等。這場由AI引發(fā)的變革,正在以一種前所未有的速度影響著各種行業(yè)。

      深度學(xué)習(xí)的開拓者Geoffrey Hinton最近在接受《紐約客》采訪時說道:“凡是任何一個有很多數(shù)據(jù)的分類問題,都可以用深度學(xué)習(xí)的方法來解決。深度學(xué)習(xí)有幾千種應(yīng)用?!?/p>

      不可思議的效果

      以谷歌為例。谷歌在深度學(xué)習(xí)里突破性的工作引發(fā)了全球關(guān)注:Google Now 語音交互系統(tǒng)令人吃驚的精確性、AlphaGo在圍棋領(lǐng)域歷史性的勝利、谷歌翻譯應(yīng)用于100種語言。

      深度學(xué)習(xí)已經(jīng)達到了不可思議的效果。但是深度學(xué)習(xí)的方法,要求計算機在摩爾定律放緩的時代背景下,精確處理海量數(shù)據(jù)。深度學(xué)習(xí)是一種全新的計算模型,它也需要一種全新計算架構(gòu)的誕生。

      一段時間以來,這種 AI 計算模型都是運行于英偉達芯片之上。2010 年,研究員 Dan Ciresan 當(dāng)時在瑞士 Juergen Schmidhuber 教授的 AI 實驗室工作,他發(fā)現(xiàn)英偉達 GPU 芯片可以被用來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),比 CPU 的速度快 50 倍。一年之后,Schmidhuber 教授的實驗室又使用 GPU 開發(fā)了世界上首個純深度神經(jīng)網(wǎng)絡(luò),一舉贏得國際手寫識別和計算機視覺比賽的冠軍。接著,在 2012 年,多倫多大學(xué)的碩士生 Alex Krizhevsky 使用了兩個 GPU,贏得了如今蜚聲國際的 ImageNet 圖像識別競賽。(Schmidhuber教授曾經(jīng)寫過一篇文章,全面梳理了運行于GPU之上的深度學(xué)習(xí)對于當(dāng)代計算機視覺的影響 http://people.idsia.ch/~juergen/computer-vision-contests-won-by-gpu-cnns.html)

      深度學(xué)習(xí)優(yōu)化

      全球的 AI 研究員都發(fā)現(xiàn)了,英偉達為計算機圖形和超級計算應(yīng)用所設(shè)計的 GPU 加速計算模型,是深度學(xué)習(xí)的理想之選。深度學(xué)習(xí)應(yīng)用,比如 3D 圖形,醫(yī)療成像、分子動力學(xué)、量子化學(xué)和氣象模擬等,都是一種線性代數(shù)算法,需要進行大規(guī)模并行張量或多維向量計算。誕生于 2009 年的英偉達 Kepler GPU 架構(gòu),雖然幫助喚醒了世界在深度學(xué)習(xí)中使用 GPU 加速計算,但其誕生之初并非為深度學(xué)習(xí)量身定制的。

      所以,我們必須開發(fā)出新一代GPU架構(gòu),首先是 Maxwell,接著是 Pascal,這兩種架構(gòu)都對深度學(xué)習(xí)進行了特定的優(yōu)化。在Kepler Tesla K80 之后四年,基于 Pascal 架構(gòu)的 Tesla P40 推理加速器誕生了,它的推理性能是前者的 26 倍,遠(yuǎn)遠(yuǎn)超過了摩爾定律的預(yù)期。

      在這一時期,谷歌也設(shè)計了一款定制化的加速器芯片,名為“張量處理單元”,即 TPU。具體針對數(shù)據(jù)推理,于 2015 年部署。

      上周,谷歌團隊發(fā)布了關(guān)于 TPU 優(yōu)越性的一些信息,稱 TPU 比 K80 的推理性能高出 13 倍。但是,谷歌并沒有拿 TPU 與如今最新一代的 Pascal P40 做比較。

      最新對比

      我們創(chuàng)建了如下的圖表,對 K80、TPU 和 P40 的性能進行量化,看看 TPU 與如今的英偉達技術(shù)之間的較量。

      P40 在計算精度和吞吐量、片內(nèi)存儲和存儲帶寬之間達到了良好平衡,不僅在訓(xùn)練階段,也在推理階段達到了前所未有的性能表現(xiàn)。對于訓(xùn)練階段,P40 擁有 10 倍于 TPU 的帶寬,32 位浮點性能達到 12個 TFLOPS 。對于推理階段,P40 具有高吞吐的 8 位整數(shù)和高存儲帶寬。

      黃仁勛親自撰文懟上 TPU:P40速度比你快 2 倍,帶寬是你的 10 倍

      數(shù)據(jù)基于谷歌 Jouppi 等人論文“In-Datacenter Performance Analysis of a Tensor Processing Unit”[Jou17],以及英偉達內(nèi)部基準(zhǔn)分析。K80 與 TPU 的性能比數(shù)據(jù)來源于論文[Jou17]里 CNN0 和 CNN1的加速性能比,其中比較的是性能減半的 K80。K80 與 P40 性能比基于 GoogLeNet 模型,這是一種可以公開使用的CNN 模型,具有相似的性能屬性。

      雖然谷歌和英偉達選擇了不同的發(fā)展路徑,我們有一些共同關(guān)切的主題。具體包括:

      • AI 需要加速計算。在摩爾定律變慢的時代背景下,加速器滿足了深度學(xué)習(xí)海量數(shù)據(jù)處理需求

      • 張量處理處于深度學(xué)習(xí)訓(xùn)練和推理性能的核心位置

      • 張量處理是一個重要的新工作負(fù)載,企業(yè)在建立現(xiàn)代數(shù)據(jù)中心的時候,要考慮這一問題

      • 加速張量處理可以顯著減少現(xiàn)代數(shù)據(jù)中心的建設(shè)成本

      全球科技正處于一場被稱為“AI 革命”的歷史性轉(zhuǎn)變中。如今這場革命影響最深刻的地方,就是阿里巴巴、亞馬遜、百度、Facebook、谷歌、IBM、微軟、騰訊等公司所擁有的的超大規(guī)模數(shù)據(jù)中心。這些數(shù)據(jù)中心,需要加速 AI 工作負(fù)載,不必花費數(shù)十億美元用新的CPU節(jié)點來打造新的數(shù)據(jù)中心。如果沒有加速計算,大規(guī)模 AI 實現(xiàn)根本不可能。

      GPU加速計算為深度學(xué)習(xí)和現(xiàn)代AI 供能。大家可以在 5 月 8-11 日到加州圣何塞參加我們的 GPU Technology 大會。你將會聽到 AI 開拓者們談?wù)撍麄兺黄菩缘陌l(fā)現(xiàn),并且獲悉 GPU 計算的最新進展是如何在變革一個又一個行業(yè)。

      雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

      黃仁勛親自撰文懟上 TPU:P40速度比你快 2 倍,帶寬是你的 10 倍

      分享:
      相關(guān)文章

      編輯

      關(guān)注人工智能(AI)報道
      當(dāng)月熱門文章
      最新文章
      請?zhí)顚懮暾埲速Y料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
      立即設(shè)置 以后再說
      主站蜘蛛池模板: 国产玖玖| 亚洲情人网| 天堂人妻熟妇一区二区不卡| 久久ww精品w免费人成| 国产成人无码一区二区在线播放| 青青草一区二区免费精品| 免费无码高H视频在线观看| 国产丝袜视频| 69老司机精品视频免费观看 | 亚洲精品美女久久久久久久| 高清无码午夜福利视频| 亚洲码欧美码一区二区三区| 久久久这里只有精品10| jizzjizz亚洲| 兴仁县| 亚洲国产精久久久久久久春色 | 99re视频精品全部免费| 美女被躁出白浆视频播放| 夜夜躁狠狠躁日日躁| 亚洲日韩国产精品第一页一区| 熟女人妻aⅴ一区二区三区电影| 国产人人干| 男女互操视频网站在线观看| 久久综合老鸭窝色综合久久| 免费国精产品wnw2544| 瑜伽裤国产一区二区三区| 精品国产午夜福利在线观看| 色姑娘综合网| 亚洲AV成人片不卡无码| 377人体粉嫩噜噜噜| H色无码网站| 好吊色欧美一区二区三区视频| 亚洲AV无码东方伊甸园| 精品国产三级A∨在线| 国产精品久久久久久久影视一免费| 欧美、另类亚洲日本一区二区| 93乱子伦国产乱子伦海的味道| 狠狠躁夜夜躁人人爽天天| 在线视频不卡在线亚洲| 黑人成人网| 欧美乱妇高清无乱码免费|