<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能學術 正文
      發私信給大木
      發送

      1

      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      本文作者: 大木 編輯:劉曉坤 2021-06-26 13:07
      導語:這是一款可以學習通過操縱隱空間語義進行臉部屬性編輯的GAN模型—— L2M-GAN。
      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      作者 | 楊國興

      編輯 | 陳大鑫

      給一行二次元老婆的臉蛋;
      下一行就能讓她們全部微笑起來:
      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      或者對于鏟屎官們來說,把老虎貓變成?,把狗變成狼?,還可以把老虎變成貓:

      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣
      阿這,等一等,讓我來捋一下:老虎—>>貓——>>狗——>>狼,這豈不是說,老虎==狼了?
      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣
      對于這一點,或許廣大網友們早就見怪不怪了,畢竟蘇大強也可以變身吳彥祖:
      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      沒錯,正如大家所猜到的一樣,今天AI科技評論為大家介紹的就是一款可以學習通過操縱隱空間語義進行臉部屬性編輯的GAN模型—— L2M-GAN。
      這是人民大學高瓴人工智能學校盧志武老師實驗室團隊提出的模型,論文已經被CVPR 2021接收為Oral,論文題目:《L2M-GAN: Learning to Manipulate Latent Space Semantics for Facial Attribute Editing》
      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣


      1

      論文介紹

      臉部屬性編輯任務的目標是操縱真實臉部圖片的語義屬性,其在現實中有著廣泛的應用,例如娛樂、輔助心理治療以及數據增強等等。隨著深度生成模型的發展,最近的工作大多以GAN(Generative Adversarial Network)為基礎。現有的臉部屬性編輯模型面臨的一個主要挑戰是要同時滿足兩個要求:

      (1)正確地修改想要的屬性;(2)保留其它無關的信息。但是因為不同屬性之間存在著各種關系,且屬性與身份信息之間也存在著關系,所以在修改一個屬性時很可能不經意地導致其他特征的改變,這導致了同時滿足這兩個屬性是很困難的。

      為了滿足這兩個條件,一些最新的辦法采用了空間注意力的方法。這類方法假設每個屬性有著一個對應的局部區域,圖片的屬性操作可以被限制在這一區域中。它們通過網絡中的注意力模塊去學習建模這一區域,一但這一區域被確定,它們便可以使用掩碼和殘差和的方法實現僅在部分區域內進行編輯。

      但是這一假設并非對所有的屬性都滿足,比如說性別、笑容等屬性,這些屬性對應的區域基本覆蓋了整個臉部且與其他屬性區域重疊。因此這類模型在操縱這些屬性時效果并不好。另一部分方法則把注意力放在對GAN學到的隱空間中進行隱變量的分解,從而通過分解得到屬性相關的向量。給定一個預訓練好的GAN模型,它們通過學習子映射的方式將原向量映射到表達對應屬性的向量。

      但是這類方法仍然存在兩個問題:

      (1)它們依賴于預訓練好的GAN模型提供的隱空間,并不對模型重新訓練。這種沒有重新進行端到端訓練的模型的隱空間可能是一個次優化的隱空間。

      (2)這類方法往往只在數據集提供的幾個標簽之間進行解耦,但是還有許多并沒有被包含在這些預定義的標簽中的信息需要被解耦,例如光照信息和身份信息等。

      為了克服這些限制,本文提出了一個新的隱空間分解模型L2M-GAN

      該模型進行端到端的訓練,并學習將隱向量明確地分解為屬性相關向量和屬性無關向量,以實現相關屬性信息和其他信息的解耦。與之前的這類方法類似,我們也根據屬性標簽對隱空間中的變量進行解耦,但是不同的是,我們明確地將其分解為屬性相關的向量和屬性無關的向量,而非僅僅對兩個預定義的屬性進行解耦。


      2

      方法

      在介紹我們的方法之前,我們先定義“域”這一概念。“域”指的是某些屬性的值構成的組合。比如想要編輯屬性<性別,年齡>時,一共存在4個“域”,<男性,年老>,<女性,年老>,<男性,年輕>,<女性,年輕>。給定一張輸入圖片和它所對應的域,以及目標域,我們的目的是合成一張屬于目標域的圖片,同時保留輸入圖片的與域無關的信息。

      如下圖所示,我們提出的模型由三個部分組成:風格編碼器、風格轉換器和生成器。

      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      在多任務學習的設置下,我們的風格編碼器由多個域的輸出分支組成。為了解釋方便,上圖中僅表示了一個域的輸出。

      風格編碼器是L2M-GAN的關鍵組成部分,它由分解器和域轉換器兩個組件構成。其中,分解器從原始的隱向量中分解出與域無關的(屬性無關的)向量一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣,再通過相減能得到域相關的(屬性相關的)向量。因為我們的目標是修改目標屬性到目標域中,而其他無關的信息不會被修改。這種情況會出現,當且僅當和一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣是相互垂直的,且修改后的向量也與一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣是相互垂直的。

      為此,我們引入了垂直損失來對這兩個向量進行限制。值得注意的是,之前的方法使用垂直損失來對兩個屬性進行解耦,而L2M-GAN則用該損失來把屬性相關的信息和其他所有無關的信息分離開。這對屬性編輯中保留其他信息這一要求是至關重要的,因為其他的屬性標簽并不能涵蓋所有的無關信息。在得到域相關向量以后,L2M-GAN通過域轉換器把它轉換到目標域中,得到表示目標域信息的域相關向量。其與域無關向量一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣相加后便可得到編輯過后的隱向量。

      生成器以一張輸入圖片和一個編輯后的隱編碼作為輸入,生成一張目標域的圖片,其包含目標域信息和輸入圖片的與域無關的其他信息。與StarGAN V2類似,我們的生成器也采用 Adaptive Instance Normalization(AdaIN)結構來將隱編碼中包含的風格信息融合到輸入圖片中。


      3

      實驗

      我們在廣泛使用的CelebA-HQ數據集上進行實驗。我們根據CelebA的劃分以及CelebA和CelebA-HQ圖片間的對應關系,把CelebA-HQ劃分為27176張訓練圖片和2824張測試圖片。

      我們將我們的方法與其他幾種最新的方法進行了對比。正文中的實驗幾種在“笑容”這一特定屬性上,其他更多屬性的結果我們放在了附件中。值得注意的是,“笑容”這一屬性是數據集所給的40個標簽中最具挑戰性的一個屬性,因為其同時涉及臉部中的多個部分,添加和消除笑容都需要模型對輸入圖片有高級的語義理解,這樣才能同時修改多個臉部圖片的組成部分而不改變其他信息。

      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      從可視化結果中可以看到,StarGAN和CycleGAN傾向于在嘴周圍生成模糊和失真的結果,因此在大多數生成圖片中,它們沒法很好地正確編輯對應屬性。ELEGANT 則總是把參考圖片中與屬性無關的信息也遷移到生成圖片中,這是因為它進行屬性交換的隱空間并沒有很好地解耦。

      PA-GAN是基于空間注意力的方法,因此它較好地保留了一些無關的信息,例如背景等,但是可以看到,面對難以定義確定修改區域的“笑容”屬性,其通常會出現修改不充分的情況,因而無法正確地編輯屬性。InterfaceGAN*能夠生成高質量的圖片,但是在一些細節上仍然做的不夠好,比如眼睛和嘴的生成。同時其有時會修改輸入圖片的身份信息,這是因為其僅僅考慮了屬性間的解耦,而沒有考慮身份等其他信息。

      在量化結果上,我們主要采用了FID和屬性操作準確率來分別評價合成圖片的質量以及屬性編輯的結果正確率。可以看到除了在消除笑容這一結果上的FID比PA-GAN低,其他的結果都是超過了所有最新的結果的,而PA-GAN是以修改不充分為代價來達到較高的圖片質量的。

      除了上述結果,我們的模型還展現出了其他的能力,包括:控制編輯屬性的強度、同時修改多個屬性以及對未見過的圖片的遷移等。

      因為經過訓練之后的隱空間是一個學習到了語義信息的連續空間,當我們線性地把變換到時,合成的圖片所表示的關于目標域的語義信息也會逐漸增加,關于原域的語義信息會逐漸減少,同時因為我們對、與一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣的垂直限制,這個過程不會改變其他無關的信息。這一過程可以表達為:

      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      我們可以通過控制超參數來控制合成圖片的相關屬性的強度。

      此外,我們的L2M-GAN模型以StarGAN V2作為骨架網絡,所以可以很自然地進行多屬性編輯的任務。

      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      本文還使用了數據集外的圖片測試了我們模型的泛化能力。可以看到,我們的模型在CelebA-HQ這一真實人臉數據集上訓練過后,直接在分布差異比較大的動漫數據集上測試也可以很好地實現屬性編輯的功能且合成質量很高的圖片。

      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      同時,為了進一步驗證我們模型結構的有效性,我們還在非人臉的動物數據集AFHQ上進行訓練。從可視化結果中可以看到,我們的模型在非人臉數據集上也能達到很好的屬性編輯效果以及生成圖片質量。這進一步驗證了我們的方法的有效性及泛化性。

      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣


      4

      總結

      我們提出了一種新的基于隱空間分解的臉部屬性編輯模型。

      我們提出的模型L2M-GAN是首個基于隱空間分解的端到端臉部屬性編輯模型,其可以有效地編輯局部和全局屬性。這得益于提出的新的風格轉換器將隱向量分解為屬性相關的部分和屬性無關的部分,并對轉換前后的向量施加了垂直約束。大量的實驗證明了我們提出的L2M-GAN比其他現有的方法有明顯的改進。

      另外本論文已經開源,歡迎大家多多試用、來個star~

      開源鏈接:https://github.com/rucmlcv/L2M-GAN

      論文地址:

      https://openaccess.thecvf.com/content/CVPR2021/papers/Yang_L2M-GAN_Learning_To_Manipulate_Latent_Space_Semantics_for_Facial_Attribute_CVPR_2021_paper.pdf

      雷鋒網雷鋒網雷鋒網雷鋒網


      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      一鍵讓二次元老婆微笑,還能把貓臉變成狗臉,這篇CVPR 論文真有趣

      分享:
      相關文章

      專欄作者

      無人機行業資深從業者
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 人妻少妇被猛烈进入中文字幕| 亚洲成av人片在www色猫咪| 无码人妻AⅤ一区二区三区水密桃| 欧洲亚洲一区| AV天堂中文字幕| 精品一区二区三区波多野结衣| 欧美国产激情18| 无码av免费毛片一区二区| 99久久无色码中文字幕人妻| 国产精品高清国产三级囯产AV| 亚洲成人av| 第一福利导航视频| 日韩av一区二区亚洲| 全部免费特黄特色大片中国| 狠狠爱俺也去去就色| 亚洲а∨天堂久久精品9966| 久久精品中文字幕有码| 日韩毛片在线视频x| 欧洲丰满熟女a片| 岛国av在线免费播放| 精品乱人伦一区二区三区| 亚洲av电影天堂网| 婷婷久久香蕉五月综合加勒比| 国产精品原创不卡在线| 日韩精品人妻中文字幕不卡乱码 | 76少妇精品导航久久久久| 3P在线看| 中文字幕乱码人妻无码久久| 欧美一级黄色影院| 精品国产网站| 国产无遮挡无码视频免费软件| 国产综合视频一区二区三区| 欧美福利精品| 凤台县| 精品av国产一区二区三区| 亚洲综合黄色| 无码人妻精品一区二| 国产精品午夜福利免费看| 中文无码毛片又爽又刺激| 又黄又爽又色的少妇毛片| 天天做天天爱夜夜爽毛片|