<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能 正文
      發(fā)私信給劉子榆
      發(fā)送

      2

      牛津大學聯(lián)合 DeepMind 發(fā)布 LipNet :用深度學習讀懂你的唇語

      本文作者: 劉子榆 2016-11-08 12:14
      導語:牛津大學人工智能實驗室、谷歌 DeepMind 和加拿大高等研究院(CIFAR)在近日聯(lián)合發(fā)布了一篇論文,介紹了結合深度學習技術的唇讀程序 LipNet。

       牛津大學聯(lián)合 DeepMind 發(fā)布 LipNet :用深度學習讀懂你的唇語

      新的調查顯示 AI 能夠輕松戰(zhàn)勝人類,但還有很多工作要做。

      如何讀懂唇語對人類來說是一個難題,據(jù)數(shù)據(jù)顯示,大多數(shù)人平均只能讀對一句唇語的十分之一。唇讀很困難,不僅是因為你要觀察對方嘴唇、舌頭和牙齒的輕微運動,而且大多數(shù)唇語信號十分隱晦,難以在沒有語境的情況下分辨。

      現(xiàn)在,研究人員表示人工智能技術,比如深度學習或許能夠解決這個難題。人工智能側重于大數(shù)據(jù)運算,已經(jīng)幫助改善了機器語音識別,甚至能達到人類的水平。那么機器學習技術是不是也能運用到讀懂人類的唇語上?

      據(jù)國外媒體報道,牛津大學人工智能實驗室、谷歌 DeepMind 團隊 和加拿大高等研究院(CIFAR)就在近日聯(lián)合發(fā)布了一篇論文,介紹了結合深度學習技術的唇讀程序 LipNet。在 GRID 語料庫上,LipNet 實現(xiàn)了 93.4% 的準確度,超過了經(jīng)驗豐富的人類唇讀者和之前的 79.6% 的最佳準確度。研究人員還將 LipNet 的表現(xiàn)和聽覺受損的會讀唇的人的表現(xiàn)進行了比較。平均來看,他們可以達到 52.3% 的準確度,LipNet 在相同句子上的表現(xiàn)是這個成績的 1.78 倍。除此之外,該模型將可變長度的視頻序列轉換成文本的過程幾乎是實時的。

      不過,當你沉醉在科幻電影《2001: 太空漫游》里,幻想著像 Hall 一樣能讀懂人類唇語的飛船主控計算機出現(xiàn)之前,雷鋒網(wǎng)小編必須要給你敲響一個警鐘——牛津大學的這一實驗很可能具有局限性。這一實驗首先是基于 GRID 語料庫完成的,這其中包含 34 個志愿者錄的短視頻,所有的視頻都長 3 秒,使用 DLib 面部檢測器和帶有 68 個 landmark 的 iBug 面部形狀預測器進行處理。每個句子都是以這樣的模式出現(xiàn)的:命令、顏色、介詞、字母、數(shù)字、副詞等。例如“set blue by A four please”或者 " place red at C zero again " 這樣的句式。由于這一模式下的詞句是有限的,只包含了四種不同的命令和顏色。這導致人工智能領域的一些專家認為,牛津大學這篇論文的研究結果被夸大了,尤其是當他們看到其中一位研究人員在接受采訪時煽情地表示這項成果意味著人們將“沒有秘密。”

      “事實并非如此,” 研究人員 Yannis Assael 和 Brendan Shillingford 在接受國外科技媒體 The Verge 采訪時說道,他們正在努力地突破“有限的詞匯和語法” 。Assael 表示,“現(xiàn)在的數(shù)據(jù)集雖小,但它卻是一個好的跡象,將來我們會使用更大的數(shù)據(jù)集執(zhí)行任務。”

      除此之外,Yannis Assael 和 Brendan Shillingford 都在強調這一成果不會用于窺探他人的隱私。很簡單,因為唇讀需要看到對方的舌頭,所以你必須在光線很好的地方才能夠完成這一行為。“這在技術上來說是非常困難的。” Assael 表示,任何唇讀軟件都很難做到監(jiān)視他人的地步,所以大家可以放心。而且幀率也是一個重要的因素。“除非你拿著一個技術很高的相機對準目標對象,同時還要舉著一個麥克風指向他。”

      相反,兩位研究者認為在深度學習的幫助下,這種唇讀方式可以幫助有聽力障礙的人,尤其是在嘈雜的環(huán)境中。例如在聚會上,LipNet 就可以錄制實時通話,并將信息清晰準確地送到人們的耳中。“只要你有語音識別和攝像頭,在任何地方都可以實現(xiàn)這項服務。” Assael 說。他還提到蘋果的 Siri 或谷歌語音助理或許也會用到這樣的技術。那么在未來,如果你不想親自和計算機對話,只要動動嘴巴它就能知道你在說什么了。

      論文戳這里 PDF

       Via the verge

      推薦閱讀:

      只訓練一次數(shù)據(jù)就能識別出物體,谷歌全新 AI 算法“單次學習”

      情感計算是不是手機差異化的下一個突破口?前微軟亞洲工程院副院長為何創(chuàng)業(yè)做EMOTIBOT

      雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知

       牛津大學聯(lián)合 DeepMind 發(fā)布 LipNet :用深度學習讀懂你的唇語

      分享:
      相關文章

      打倒麻瓜

      與有趣人做有趣事。
      當月熱門文章
      最新文章
      請?zhí)顚懮暾埲速Y料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 极品人妻少妇一区二区三区| 久久国产免费观看精品| 国产v亚洲v天堂无码久久久| 4480yy亚洲午夜私人影院剧情| 精品av国产一区二区三区| 欧洲熟妇色xxxx欧美老妇软件 | 97超碰资源总站| 亚洲熟妇AV一区二区三区宅男| 亚洲中文无码av在线| 国产精品久久午夜夜伦鲁鲁| 樱花草在线社区www| 天堂网亚洲综合在线| 国产av精品一区二区三区| gogogo高清免费观看| 男女激情一区二区三区| 欧美成人aaa片一区国产精品| 狠狠干欧美| 国产私拍大尺度在线视频| 宫西光在线| 人妻专区中文字幕| 五月天丁香婷婷亚洲欧洲国产| 亚洲综合精品中文字幕| 国产愉拍91九色国产愉拍| 国产乱码字幕精品高清av| 国产女人高潮毛片| 国内精品久久久久影院一蜜桃| 波多野结衣在线播放| 中文字幕四区| 久久av高潮av喷水av无码| 午夜福利看片在线观看| 亚洲综合无码AV在线观看| 人妻精品国产一区二区| 自拍视频在线观看成人| 夜夜躁很很躁日日躁麻豆| 国产亚洲av夜间福利香蕉149| 免费吃奶摸下激烈视频| 51国产视频| 久久精品国产精品亚洲毛片| 久久999| 婷婷伊人綜合中文字幕小说| 不卡无码av|