<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能 正文
      發私信給高婓
      發送

      1

      DeepMind發布最新原始音頻波形深度生成模型WaveNet,將為TTS帶來無數可能

      本文作者: 高婓 2016-09-09 12:54
      導語:Google的DeepMind研究實驗室昨天公布了其在語音合成領域最新成果WaveNet,語音系統更為自然,將模擬生成的語音與人類聲音的差異降低了50%以上。

      編者按:Google的DeepMind研究實驗室昨天公布了其在語音合成領域的最新成果——WaveNet,一種原始音頻波形深度生成模型,能夠模仿人類的聲音,生成的原始音頻質量優于目前Google采用的兩種最優文本-語音模型Parameric TTS與Concatenative TTS。

      WaveNets是一種卷積神經網絡,能夠模擬任意一種人類聲音,生成的語音聽起來比現存的最優文本-語音系統更為自然,將模擬生成的語音與人類聲音之間的差異降低了50%以上。

      我們也將證明,同一種網絡能夠合成其他音頻信號,如音樂,并能夠自動生成沁人心脾的鋼琴曲。

      會說話的機器

      使人們能夠與機器自由交談是人機交互研究領域長久以來的夢想。過去幾年中,深度神經網絡的應用(如Google語音搜索)為提高計算機理解自然語音的能力帶來了革新。但是,運用計算機生成語音——通常用于指代語音合成或文本-語音(TTS)系統——在極大程度上還要依托拼接TTS,TTS中包含一個超大型記錄單個說話者的簡短語音片段的數據庫,隨后將這些語音片段重新合成形成完整的話語。在不記錄一個新的完整數據庫的前提下,這種語音合成方法難以做到修飾聲音(例如,轉換到一個不同的說話者,或者改變其語音中強調的重點或傳達的情感)。

           為了解決語音合成的這一難題,迫切需要運用一種參數TTS,在這種文本-語音系統中,生成數據所需要的所有信息被存儲于模型的參數中,語音所傳達的內容及語音特征可以通過模型的輸入信息得以控制。然而,目前參數(Parametric)TTS模型生成的語音聽起來不如拼接(Concatenative)TTS模型生成的語音自然,這種現象至少出現在音節類語言中,如英語。現有的參數模型通常是運用信號加工算法vocoders計算獲得的輸出信息,以此生成音頻信號。

           WaveNet通過直接為音頻信號的原始波形建模,一次為一種音頻樣本建模,來改變這種范式。同生成聽起來更為自然的語音相同,使用原始波形意味著WaveNet能夠為任意類型的音頻建模,包括音樂。

      WaveNet

      DeepMind發布最新原始音頻波形深度生成模型WaveNet,將為TTS帶來無數可能

      研究者通常避免為原始音頻建模,因為原始音頻往往瞬間發生變化:通常情況下,每秒出現16,000種或更多音頻樣本,在很多時間標尺內出現重要的結構。很明顯,構建一個完全自動回歸模型是一項具有挑戰性的任務,在這種模型中,對每一種音頻樣本的預測均受到之前所有音頻樣本的影響(用統計學方面的話來講,每一種預測性分布是建立在所有先前觀察的基礎之上的)。

      但是,我們今年公布的PixelRNN和PixelCNN模型顯示,做到以每次一個像素,甚至于每次一個顏色通道的方式生成復雜的自然圖像是可能的,這將要求對每個圖像做數千次預測。這也啟發我們將原有的二維PixelNets轉變為一種一維WaveNet。

      DeepMind發布最新原始音頻波形深度生成模型WaveNet,將為TTS帶來無數可能

      上方動畫所示為一個WaveNet模型的內部結構,通常是一種完整的卷積神經網絡,卷積層中有各種各樣的擴張因子,允許其接受域深度成倍增長,并且覆蓋數千個時間步長。

      在訓練時間段內,輸入序列是從人類說話者記錄得來的真實波形。在訓練之后,我們可以對網絡取樣,以生成合成話語。在取樣的每一個步驟中,將從由網絡計算得出的概率分布中抽取數值。所抽取的數值隨后被反饋到輸入信息中,這樣便完成下一步新預測。像這樣每做一次預測就取樣會增加計算成本,但是我們已經發現,這樣的取樣方法對于生成復雜且聽起來真實的音頻是至關重要的。

      改善最優文本-語音轉換模型

      我們曾經運用Google的一些TTS數據集來訓練WaveNet,以便用于評估WaveNet的性能。下圖所示為與Google當前最優TTS系統(參數型TTS和拼接型TTS)和使用Mean Opinion Scores(MOS:用于評估語音通訊系統質量的方法)獲得的人類語音相比,在標尺(1-5)上WaveNets的質量。MOS是一種用于主觀語音質量測試的標準測定方法,在人群中進行盲試驗。我們可以看到,WaveNets將最優模型生成語音的質量與人類自然語音(US英語和漢語普通話)之間的差距降低了50%以上。

      就漢語和英語來講,Google當前的TTS系統在世界范圍內被認為是最優文本-語音系統,因此,用一種單一模型來改善生成漢語與英語語音質量將會是一項重大成就。

      DeepMind發布最新原始音頻波形深度生成模型WaveNet,將為TTS帶來無數可能

      教會WaveNet說有意義的話

      為了實現運用WaveNet將文本轉化為語音,我們得告訴WaveNet文本的內容是什么。我們通過將文本轉換成語言和語音特征(包括音位、音節、單詞等),把轉換得來的特征提供給WaveNet,完成這一過程。這意味著網絡的預測步驟不僅僅基于先前獲得的音頻樣本,而且要基于文本所傳達的內容。

      如果我們想要脫離文本序列來訓練網絡,網絡依然能夠生成語音,但是得自行編造想要傳達的內容。這種條件下生成的音頻簡直是胡言亂語,有意義的單詞被編造的像單詞的聲音隔斷開。

       注意,有時WaveNet也會生成一些非語音類型的聲音,如呼吸或口腔運動;這反映出一種原始音頻模型具有高度靈活性。

      一個單一的WaveNet具備學習許多不同聲音(男性和女性)的特征。為了確保WaveNet能夠知道用何種聲音匹配給定的任何一段話語,我們訓練網絡使之學習獲得說話者的身份特征。有趣的是,我們發現,與單一訓練單個說話者的特征相比,用許多說話者的語言、語音及身份等特征來訓練網絡使得WaveNet能夠更好地模擬單個說話者,這種訓練模式暗含著一種遷移學習形式。

      通過改變說話者的身份,我們可以用WaveNet以不同的聲音表達同一段話語。

       同樣,我們可以為該模型提供額外的輸入信息,如情感或口音,使得生成的語音變得更為多樣化,更有趣。

      生成音樂

      由于WaveNet能夠用來模擬任何一種音頻信號,我們認為,嘗試用WaveNet生成音樂也將很好玩。與TTS實驗不同,我們的網絡不是基于一個輸入序列,告訴它怎么演奏音樂(如一篇樂譜);相反,我們只是簡單地允許WaveNet任意生成一種音樂。當我們采用一個古典鋼琴曲數據集來訓練WaveNet時,它將生成一曲美妙樂章。

       WaveNets將為TTS帶來無數可能,大體上來講,有生成音樂和模擬音頻兩類。事實上,直接運用深度神經網絡一個時間步長一個時間步長地生成音樂,這種方法適用于所有16kHZ音頻,這將是非常令人驚喜的。我們非常期待WaveNets未來將會帶給大家的驚喜。

      想要獲取更多詳細信息,請參考我們的論文詳細

      原文鏈接

      本文由雷鋒網獨家編譯,未經允許拒絕轉載!


      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      DeepMind發布最新原始音頻波形深度生成模型WaveNet,將為TTS帶來無數可能

      分享:
      相關文章
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 浮妇高潮喷白浆视频| 中文字幕人妻熟女在线| 国产男女猛烈无遮挡免费视频网站| av鲁丝一区鲁丝二区鲁丝三区| 暖暖 免费 高清 日本 在线观看5| 哈尔滨市| 国产精品无码成人午夜电影| 亚洲精品美女久久7777777| 熟妇与黑人一区二区三区乱码| 亚洲三级高清免费| 国产a自拍| 欧美肏屄网| 人人操人| 国产精品嫩草影院一二三区入口| 国产suv精品一区二区69| 超碰免费在线观看| 国产精品天堂avav在线| 女人和拘做爰正片视频| 久久精品久久久久观看99水蜜桃| 欧美freesex潮喷| 中文字幕一区二区三区乱码不卡| 午夜视频在线观看区二区| 国产午夜鲁丝片av无码| 天天干夜夜撸| 日本精品人妻无码77777| www.色吊丝av.com| 精品无码人妻一区二区三区 | 亚洲高清成人aⅴ片777| 欧美激情精品久久| 免费人欧美成又黄又爽的视频| 久久精品熟妇丰满人妻99| 一区二区三区鲁丝不卡| 99插插| 乱人伦精品视频在线观看| 超碰123| 国产欧美日韩精品第二区| 精品自拍一区国产精品| 屁屁影院ccyy备用地址| 亚洲国产精品成人网站| 好男人社区影视在线WWW| 国产美女裸身网站免费观看视频 |