<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
      業(yè)界 正文
      發(fā)私信給貝爽
      發(fā)送

      0

      只看手勢動作,就能完美復(fù)現(xiàn)音樂,MIT聯(lián)合沃森實驗室團(tuán)隊推出最新AI,多種高難度樂器信手拈來!

      本文作者: 貝爽 2020-07-24 18:28
      導(dǎo)語:不會樂器也可以玩的很嗨

      會玩樂器的人在生活中簡直自帶光環(huán)!

      不過,學(xué)會一門樂器也真的很難,多少人陷入過從入門到放棄的死循環(huán)。

      但是,不會玩樂器,就真的不能演奏出好聽的音樂了嗎?

      最近,麻省理工(MIT)聯(lián)合沃森人工智能實驗室(MIT-IBM Watson AI Lab)共同開發(fā)出了一款A(yù)I模型Foley Music,它可以根據(jù)演奏手勢完美還原樂曲原聲!

      只看手勢動作,就能完美復(fù)現(xiàn)音樂,MIT聯(lián)合沃森實驗室團(tuán)隊推出最新AI,多種高難度樂器信手拈來!

      而且還是不分樂器的那種,小提琴、鋼琴、尤克里里、吉他,統(tǒng)統(tǒng)都可以。

      只看手勢動作,就能完美復(fù)現(xiàn)音樂,MIT聯(lián)合沃森實驗室團(tuán)隊推出最新AI,多種高難度樂器信手拈來!

      只要拿起樂器,就是一場專業(yè)演奏會!如果喜歡不同音調(diào),還可以對音樂風(fēng)格進(jìn)行編輯,A調(diào)、F調(diào)、G調(diào)均可。

      只看手勢動作,就能完美復(fù)現(xiàn)音樂,MIT聯(lián)合沃森實驗室團(tuán)隊推出最新AI,多種高難度樂器信手拈來!

      這項名為《Foley Music:Learning to Generate Music from Videos》的技術(shù)論文已被ECCV 2020收錄。

      接下來,我們看看AI模型是如何還原音樂的?

      會玩多種樂器的Foley Music

      如同為一段舞蹈配樂需要了解肢體動作、舞蹈風(fēng)格一樣,為樂器演奏者配樂,同樣需要知道其手勢、動作以及所用樂器。

      如果給定一段演奏視頻,AI會自動鎖定目標(biāo)對象的身體關(guān)鍵點(Body Keypoints),以及演奏的樂器和聲音。

      只看手勢動作,就能完美復(fù)現(xiàn)音樂,MIT聯(lián)合沃森實驗室團(tuán)隊推出最新AI,多種高難度樂器信手拈來!

      身體關(guān)鍵點:由AI系統(tǒng)中的視覺感知模塊(Visual Perception Model)來完成。它會通過身體姿勢和手勢的兩項指標(biāo)來反饋。一般身體會提取25個關(guān)2D點,手指提起21個2D點。

      樂器聲音提取:采用音頻表征模塊(Audio Representation Model),該模塊研究人員提出了一種樂器數(shù)字化接口(Musical Instrument Digital Interface,簡稱MIDI)的音頻表征形式。它是Foley Music區(qū)別于其他模型的關(guān)鍵。

      研究人員介紹,對于一個6秒中的演奏視頻,通常會生成大約500個MIDI事件,這些MIDI事件可以輕松導(dǎo)入到標(biāo)準(zhǔn)音樂合成器以生成音樂波形。

      在完成信息提取和處理后,接下來,視-聽模塊(Visual-Audio Model)將整合所有信息并轉(zhuǎn)化,生成最終相匹配的音樂。

      我們先來看一下它完整架構(gòu)圖:主要由視覺編碼,MIDI解碼和MIDI波形圖輸出三個部分構(gòu)成。

      只看手勢動作,就能完美復(fù)現(xiàn)音樂,MIT聯(lián)合沃森實驗室團(tuán)隊推出最新AI,多種高難度樂器信手拈來!

      視覺編碼:將視覺信息進(jìn)行編碼化處理,并傳遞給轉(zhuǎn)換器MIDI解碼器。從視頻幀中提取關(guān)鍵坐標(biāo)點,使用GCN(Graph-CNN)捕獲人體動態(tài)隨時間變化產(chǎn)生的潛在表示。

      MIDI解碼器:通過Graph-Transfomers完成人體姿態(tài)特征和MIDI事件之間的相關(guān)性進(jìn)行建模。Transfomers是基于編解碼器的自回歸生成模型,主要用于機(jī)器翻譯。在這里,它可以根據(jù)人體特征準(zhǔn)確的預(yù)測MIDI事件的序列。

      MIDI輸出:使用標(biāo)準(zhǔn)音頻合成器將MIDI事件轉(zhuǎn)換為最終的波形。

      實驗結(jié)果

      研究人員證實Foley Music遠(yuǎn)優(yōu)于現(xiàn)有其他模型。在對比試驗中,他們采用了三種數(shù)據(jù)集對Foley Music進(jìn)行了訓(xùn)練,并選擇了9中樂器,與其它GAN-based、SampleRNN和WaveNet三種模型進(jìn)行了對比評估。

      其中,數(shù)據(jù)集分別為AtinPiano、MUSIC及URMP,涵蓋了超過11個類別的大約1000個高質(zhì)量的音樂演奏視頻。樂器則為風(fēng)琴,貝斯,巴松管,大提琴,吉他,鋼琴,大號,夏威夷四弦琴和小提琴,其視頻長度均為6秒。以下為定量評估結(jié)果:

      可見,F(xiàn)oley Music模型在貝斯(Bass)樂器演奏的預(yù)測性能最高達(dá)到了72%,而其他模型最高僅為8%。

      只看手勢動作,就能完美復(fù)現(xiàn)音樂,MIT聯(lián)合沃森實驗室團(tuán)隊推出最新AI,多種高難度樂器信手拈來!

      另外,從以下四個指標(biāo)來看,結(jié)果更為突出:

      正確性:生成的歌曲與視頻內(nèi)容之間的相關(guān)性。

      噪音:音樂噪音最小。

      同步性:歌曲在時間上與視頻內(nèi)容最一致。

      只看手勢動作,就能完美復(fù)現(xiàn)音樂,MIT聯(lián)合沃森實驗室團(tuán)隊推出最新AI,多種高難度樂器信手拈來!黃色為Foley Music模型,它在各項指標(biāo)上的性能表現(xiàn)遠(yuǎn)遠(yuǎn)超過了其他模型,在正確性、噪音和同步性三項指標(biāo)上最高均超過了0.6,其他最高不足0.4,且9種樂器均是如此。

      另外,研究人員還發(fā)現(xiàn),與其他基準(zhǔn)系統(tǒng)相比,MIDI事件有助于改善聲音質(zhì)量,語義對齊和時間同步。

      說明

      • GAN模型:它以人體特征為輸入,通過鑒別其判定其姿態(tài)特征所產(chǎn)生的頻譜圖是真或是假,經(jīng)過反復(fù)訓(xùn)練后,通過傅立葉逆變換將頻譜圖轉(zhuǎn)換為音頻波形。

      • SampleRNN:是無條件的端到端的神經(jīng)音頻生成模型,它相較于WaveNet結(jié)構(gòu)更簡單,在樣本級層面生成語音要更快。

      • WaveNet:是谷歌Deepmind推出一款語音生成模型,在text-to-speech和語音生成方面表現(xiàn)很好。

      另外,該模型的優(yōu)勢還在于它的可擴(kuò)展性。MIDI表示是完全可解釋和透明的,因此可以對預(yù)測的MIDI序列進(jìn)行編輯,以生成A\G\F調(diào)不同風(fēng)格音樂。 如果使用波形或者頻譜圖作為音頻表示形式的模型,這個功能是不可實現(xiàn)的。

      只看手勢動作,就能完美復(fù)現(xiàn)音樂,MIT聯(lián)合沃森實驗室團(tuán)隊推出最新AI,多種高難度樂器信手拈來!

      最后研究人員在論文中表明,此項研究通過人體關(guān)鍵點和MIDI表示很好地建立視覺和音樂信號之間的相關(guān)性,實現(xiàn)了音樂風(fēng)格的可拓展性。為當(dāng)前研究視頻和音樂聯(lián)系拓展出了一種更好的研究路徑。

      以下為Youtobe視頻,一起來感受下AI音樂!
      https://www.youtube.com/watch?v=bo5UzyDB80E

      引用鏈接:(雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng))

      雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

      分享:
      當(dāng)月熱門文章
      最新文章
      請?zhí)顚懮暾埲速Y料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
      立即設(shè)置 以后再說
      主站蜘蛛池模板: 伊人免费在线观看| 国产深夜福利| 日韩精品人妻一区二区中文八零网| 日韩在线视频线观看一区| 国产三级a三级三级| 中国china体内裑精亚洲日本 | 欧美黑人巨大精品videos| 成人无号精品一区二区三区| 亚洲成av人片在www鸭子| 欧美肥婆姓交大片| 长春市| 高级会所人妻互换94部分| 91人人干| 精品人妻国产| 中年国产丰满熟女乱子正在播放 | 麻豆精品一区二区综合av| 亚洲午夜福利717| 国产又大又粗又爽的毛片| 男人的天堂色偷偷| 97人人模人人爽人人| 国产69精品久久久久999小说| 曰本丰满熟妇xxxx性| 无毛片| 亚洲3p| 人妻人久久精品中文字幕| 亚洲第一成人会所| 亚洲人成网站观看在线观看 | 91国内视频在线观看| 亚洲精品无码一区二区| 欧美日韩国产亚洲人成| 国产人与zoxxxx另类| 黄总av| 日本无遮挡真人祼交视频| 免费vA片| 亚欧美国产色| 亚洲成av人片大线观看| 女同综合网| 欧州成人与兽| 亚洲欧洲日韩国产综合在线二区| 国产精品成人免费视频网站京东| 无码人妻丰满熟妇区五十路在线 |