<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能開發者 正文
      發私信給楊文
      發送

      0

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      本文作者: 楊文 2017-12-15 14:05
      導語:羅冬日分享總結

      雷鋒網AI研習社按:循環神經網絡(RNN)已經在眾多自然語言處理中取得了大量的成功以及廣泛的應用。但是,網上目前關于RNNs的基礎介紹很少,本文便是介紹RNNs的基礎知識,原理以及在自然語言處理任務重是如何實現的。文章內容根據雷鋒網AI研習社線上分享視頻整理而成。

      在近期雷鋒網AI研習社的線上分享會上,來自平安科技的人工智能實驗室的算法研究員羅冬日為大家普及了RNN的基礎知識,分享內容包括其基本機構,優點和不足,以及如何利用LSTM網絡實現語音識別。

      羅冬日,目前就職于平安科技人工智能實驗室,曾就職于百度、大眾點評,擔任算法研究員;中國科學院研究生院碩士,主要研究方向為語音識別,自然語言處理。

      分享主題:循環神經網絡(RNN)基礎

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      主要內容:

      • 普通RNN結構

      • 普通RNN的不足

      • LSTM單元

      • GRU單元

      • 采用LSTM實現語音識別的例子

      RNN和CNN的區別

      普通卷積神經網絡(CNN)處理的是“靜態”數據,樣本數據之間獨立,沒有關系。

      循環神經網絡(RNN)處理的數據是“序列化”數據。 訓練的樣本前后是有關聯的,即一個序列的當前的輸出與前面的輸出也有關。比如語音識別,一段語音是有時間序列的,說的話前后是有關系的。

      總結:在空間或局部上有關聯圖像數據適合卷積神經網絡來處理,在時間序列上有關聯的數據適合用循環時間網絡處理。但目前也會用卷積神經網絡處理語音問題, 或自然言語理解問題,其實也是把卷積神經網絡的計算方法用到這上面。

      RNN 的基本結構和結構展開示意圖:

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      普通RNN的不足之處

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      首先是神經網絡里面的計算,可以大致分為三類:函數合成,函數相加,加權計算。

      在計算過程中,經常會用到激活函數,比如Sigmoid激活函數。殘差在往前傳播的過程中,每經過一個Sigmoid函數,就要乘以一個Sigmoid函數的導數值,殘差值至少會因此消減為原來的0.25倍。神經網絡每多一層,殘差往前傳遞的時候,就會減少至少3/4。如果層數太多,殘差傳遞到前面已經為0,導致前層網絡中國呢的參數無法更新,這就是梯度消失。

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      LSTM單元和普通RNN單元的區別

      主要大的區別是,采用一個叫“細胞狀態(state)”的通道貫穿了整個時間序列。

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結


      通過精心設計的稱作“門”的結構來去除或增加信息到細胞狀態的能力。

      "忘記門”

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      “輸入門”的打開關閉也是由當前輸入和上一個時間點的輸出決定的。

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      “輸出門”,控制輸出多少,最終僅僅會輸出確定輸出的那部分。

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      所有的公式匯總:

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      增加peephole的LSTM單元

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      讓幾個“門”的輸入數據除了正常的輸入數據和上一個時刻的輸出以外,再接受“細胞狀態”的輸入。

      GRU單元

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      它是各種變種之一,將“忘記門”和“輸入們”合成了一個單一的“更新門”,同時還混合了細胞狀態和隱藏狀態。

      接下來用RNN做一個實驗,給大家介紹一個簡單的語音識別例子:

      關于LSTM+CTC背景知識

      2015年,百度公開發布的采用神經網絡的LSTM+CTC模型大幅度降低了語音識別的錯誤率。采用這種技術在安靜環境下的標準普通話的識別率接近97%。


      CTC是Connectionist Temporal Classification 的縮寫,詳細的論文介紹見論文“Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks”


      CTC的計算實際上是計算損失值的過程,就像其他損失函數一樣,它的計算結果也是評估網絡的輸出值和真實差多少。

      聲音波形示意圖

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      在開始之前,需要對原始聲波進行數據處理,輸入數據是提取過聲學特征的數據,以幀長25ms、幀移10ms的分幀為例,一秒鐘的語音數據大概會有100幀左右的數據。

      采用MFCC提取特征,默認情況下一幀語音數據會提取13個特征值,那么一秒鐘大概會提取100*13個特征值。用矩陣表示是一個100行13列的矩陣。

      把語音數據特征提取完之后,其實就和圖像數據差不多了。只不過圖像數據把整個矩陣作為一個整體輸入到神經網絡里面處理,序列化數據是一幀一幀的數據放到網絡處理。

       如果是訓練英文的一句話,假設輸入給LSTM的是一個100*13的數據,發音因素的種類數是26(26個字母),則經過LSTM處理之后,輸入給CTC的數據要求是100*28的形狀的矩陣(28=26+2)。其中100是原始序列的長度,即多少幀的數據,28表示這一幀數據在28個分類上的各自概率。在這28個分類中,其中26個是發音因素,剩下的兩個分別代表空白和沒有標簽。

      設計的基本網絡機構

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      原始的wav文件經過聲學特征提取變成N*13,N代表這段數據有多長,13是每一幀數據有多少特征值。N不是固定的。然后把N*13矩陣輸入給LSTM網絡,這里涉及到兩層雙向LSTM網絡,隱藏節點是40個,經過LSTM網絡之后,如果是單向的,輸出會變成40個維度,雙向的就會變成80個維度。再經過全連接,對這些特征值分類,再經過softmax計算各個分類的概率。后面再接CDC,再接正確的音素序列。

      真實的語音識別環境要復雜很多。實驗中要求的是標準普通話和安靜無噪聲的環境。

      如果對代碼講解(詳細代碼講解請點擊視頻)感興趣的話,可以復制鏈接中的代碼:https://github.com/thewintersun/tensorflowbook/tree/master/Chapter6

      運行結果如下:

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      如果對開發內容感興趣,請關注雷鋒網公眾號:AI研習社。

      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      平安科技羅冬日:如何用RNN實現語音識別?| 分享總結

      分享:
      相關文章

      編輯&記者

      AI科技評論員,微信:yeohandwin
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 激情内射亚洲一区二区三区| 国产免费又黄又爽又色毛| 欧美日韩乱妇高清免费| 好吊色妇女免费视频免费 | 99久久精品免费看国产| 国产精品人成视频免费播放| 国产女主播免费在线观看| 国产精品丝袜一区二区三区| 中国不卡一区| 一区二区三区人妻无码 | 九色精品在线| 成人在线亚洲| 国产免费毛卡片| 一个人看的www日本高清视频| 久久精品日日躁夜夜躁| 国内精品伊人久久久久av| 久久av高潮av无码av喷吹| 成人国产网站| 韩国福利一区二区美女视频| av无码天一区二区一三区| 狠狠人妻久久久久久综合果冻| 天天躁日日躁狠狠躁喷水| 人人妻人人澡人人爽人人精品av| 一 级 黄 色 片免费网站 | 四虎影视在线永久免费观看| 电影在线观看+伦理片| 熟女丝袜av| 神马午夜久久精品人妻| 亚洲精品二| 国产三级在线观看完整版| 日韩亚洲一区二区精品成人 | 亚洲一区二区三区免费av在线 | 野花韩国视频在线观看免费高清| 男女视频在线一区二区| 国内揄拍国内精品少妇| 人妻丰满熟妇无码区免费| 18禁久久| 日本久久免费精品观看| 国产精品久久久一区二区| 欧美va天堂在线电影| 国产性夜夜春夜夜爽1a片|