<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能學術 正文
      發私信給我在思考中
      發送

      0

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      本文作者: 我在思考中 2022-08-25 10:46
      導語:任意圖像變換方式都可生成。擴散模型或取代GAN?
      任意圖像變換方式都可生成。擴散模型或取代GAN?
      作者 | 王玥、李梅
      編輯 | 陳彩嫻

      最近,Stability.Ai 公開發布了其文本生成圖像模型 Stable Diffusion 的最新版本,網友們的新一波圖像創作熱潮又開始了~

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲
      圖注:Stable Diffusion 生成圖像

      前特斯拉 AI 總監 Andrej Karpathy 評論說:這是人類創造力具有歷史意義的一天,如此豐富的人類視覺創造力集中體現到了一個人人可觸及的產品中。

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      從生成圖像的效果來看,Stable Diffusion 已經是當前最好的模型之一,而它背后的擴散模型(Diffusion Model)最近也備受關注,顯示出要取代 GAN 模型的勢頭。

      其實,自從 2015 年擴散模型首次被提出以來,該領域本身已經有非常多的研究,研究人員也提出不少變體。而日前,來自馬里蘭大學和紐約大學的團隊提出了近來最新的一種擴散模型:Cold Diffusion。



      1

      Diffusion model 再升華

      目前業界出現的擴散模型變體層出不窮,但它們都有一個不變的核心:都是圍繞隨機噪聲去除這個概念建立的。

      擴散模型的本質,以及目前我們對擴散模型的理解,都與高斯噪聲在訓練和生成過程中所起的作用高度相關。我們可以將「擴散」理解為使用 Langevin 動力學圍繞圖像密度函數的隨機移動,擴散的每一步都需要高斯噪聲。擴散始于「高溫」狀態(即噪音很大的狀態),然后逐漸降溫到幾乎沒有噪音的「冷」狀態。

      而在這篇叫做“Cold Diffusion: Inverting Arbitrary Image Transforms Without Noise”的最新論文中,作者提出了一個疑問:制作擴散模型的變體,是不是非得使用高斯噪聲不可?

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      論文地址:https://arxiv.org/pdf/2208.09392.pdf

      通過多次嘗試,該研究團隊得出了答案:并不一定需要。

      在這篇論文中,作者不再將擴散模型局限于「依賴高斯噪聲而建立」,而是提出了圍繞模糊(blurring)、下采樣(downsampling)等任意圖像變換方式建立的廣義擴散模型。由于不再有原先的「高溫」狀態,這種全新廣義擴散模型也就被稱作為 Cold Diffusion。

      過去標準的擴散模型有兩步工作流程:首先,用圖像退化算子(image degradation operator)使得圖像受到高斯噪聲的污染,其次用一個訓練好的恢復算子(restoration operator)對圖像進行去噪,逆轉退化,從而得到一張新圖像。

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      圖注:傳統擴散模型的兩步工作流程

      Cold Diffusion 繼承了這兩步工作流程,但又對之進行了升華式的修改。如下圖所示,在圖像退化再到逆轉退化的過程中,Cold Diffusion 研究團隊嘗試了使用噪聲、模糊、變形(Animorph)、遮罩(mask)、像素化(pixelate)、雪花等變換方式,且都得到了不錯的效果。

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      圖注:Cold Diffusion 使用不同圖像變換方式得到新圖像的工作流程

      工作原理

      對于已知圖像 x0,設圖像退化算子為D,執行算子的次數為t。

      對以往標準的擴散模型來說,其執行圖像變換的前向過程,是由圖像退化算子 D 來對圖像添加高斯噪聲。添加0次時,D 應滿足:

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      添加t次時,則應有:

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      而在 Cold Diffusion 的模型設計中,D 可以用來執行其他各種圖像變換方式,如模糊、變形、像素化、雪花等,其退化程度取決于t ——Cold Diffusion 的「升級」正體現在可以進行包括噪音在內的多種圖像變換。

      同時我們還需要一個能把xt“變回”圖像的恢復算子 R ,應有:

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      在有了圖像退化算子 D 和 恢復算子 R 后,就可以借用擴散模型的標準方法對算子進行串聯使用,從而實現退化運算-逆轉退化的工作流程。如果退化運算的次數 t 比較小(t ≈ 0),對 R 進行一次應用就可以得到一幅恢復后的新圖像。

      由于R通常只經過了一個簡單的凸損失訓練,當執行退化運算的次數 t 很大時,生成的結果會很模糊。對此,作者團隊提出一個改進的 Cold Diffusion 采樣算法來生成高質量圖像。

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      變化無窮

      這篇研究的重點就在于,作者觀察到,擴散模型的圖像生成并不完全依賴于高斯噪聲,我們也可以選擇其他圖像變換方式來生成新圖像。通過改變圖像變換方式,甚至可以構建出整個生成模型家族。

      以模糊為退化運算方式

      基于噪聲的擴散模型中的前向擴散過程(即退化運算這一步)的優點是,在最后一步 T 處的退化圖像分布只是一個各向同性的高斯分布。因此,我們可以首先從各向同性高斯分布中抽取樣本,然后通過反向擴散順序對其進行去噪來執行(無條件)生成。而選擇模糊這種退化運算時,完全退化的圖像不能形成我們可以抽樣的良好封閉式分布,但是可以形成一個足夠簡單的分布,可以用簡單的方法進行建模。

      對于次數足夠大的 T,每個圖像 x0 都會降級為一個常數 xT(即每個像素都是相同的顏色)。該常數值恰好是 RGB 圖像 x0 的通道平均值,可以表示為三維向量,并使用高斯混合模型 (Gaussian mixture model, GMM) 表示。通過對該 GMM 進行采樣,可以產生高度模糊圖像的隨機像素值,然后使用 cold diffusion 就可以進行去模糊化,從而創建新圖像。

      另外,像素之間的對稱性會導致生成的圖像缺乏多樣性,為了打破同一管道像素的對稱性,作者向每個采樣的 xT 添加少量高斯噪聲,這個簡單的技巧極大地提高了生成圖像的豐富性。

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      圖注:對128 × 128 CelebA and AFHQ 數據集使用 cold diffusion 的模糊方式變換生成樣本示例

      以其他圖像變換為退化運算方式

      最后團隊進一步證明,除了模糊方式以外,cold diffusion 還可以擴展到其他變換,如修復、超分辨率和變形(animorphosis)方式上,且生成的圖像效果也都很好:

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      圖注:cold diffusion 的生成圖像。第一行使用變形方式變換,第二行使用修復方式變換,第三行使用超分辨率變換方式。

      研究團隊給出了 CelebA 數據集上的結果,cold diffusion 在修復、超分辨率和變形方面的 FID 得分分別為90.14、92.91和48.51。( FID,即 Rechet Inception Distance score,是用來計算真實圖像和生成圖像計算的特征向量之間距離的指標。)

      在訓練和測試期間不需要高斯噪聲的 cold diffusion,突破了人們對擴散模型的原有理解,為新型生成模型打開了未來的大門。



      2

      Diffusion Model 時代來臨

      這項研究因為提出了一種不同于傳統形式的擴散模型,而在近日登上了許多論文排行榜的熱門,同樣引起了熱議的,還有論文其中一位作者在推特上發起的討論:為什么擴散模型如此迅速地取代了 GAN?

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      馬里蘭大學副教授 Tom Goldstein 解釋,擴散模型的優點是它可以最小化凸回歸損失,所以 OpenAI 在開發 DALLE 時直接拋棄了 GAN,而使用擴散模型來解決不穩定的鞍點問題(saddle point problem)。

      而且,他認為,擴散模型的成功是新數學范式發揮其作用的一個例子,世界上所有的超參數調整都比不過幾行深思熟慮的數學公式。

      要說今天的文本生成圖像領域已經由擴散模型統治或許還不夠嚴謹,但 GAN 的一家獨大的確已經成為歷史。歸根結底,誰的圖像生成質量和穩定性更好,誰才在越來越卷的生成模型界成為寵兒。這項工作提出的 Cold Diffusion,或許就會在不久之后為我們帶來一個新的、強大的文本生成圖像模型。

      參考鏈接:

      https://arxiv.org/pdf/2208.09392.pdf

      更多內容,點擊下方關注:
      掃碼添加 AI 科技評論 微信號,投稿&進群:
      雷峰網(公眾號:雷峰網)擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

      擴散模型家族再添一員,最新 Cold Diffusion 不再依賴高斯噪聲

      分享:
      相關文章
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 国产国产国产国产系列| 精品国产一区二区三区四区| 777爽死你无码免费看一二区| 精品国产亚洲第一区二区三区| 九九碰九九爱97超碰| 亚洲在线不卡 | gogogo高清免费观看| 桃子视频在线播放WWW| 少妇人妻偷人精品视频| 91资源在线| 亚洲国产区| 亚洲一区二区三区丝袜| 国产高清亚洲精品91| 免费人成网上在线观看网址| 国产剧情一区二区| 永久免费毛片在线播放| 元谋县| 狠狠色丁香婷婷综合尤物 | 美国特级A毛片免费网站| 国产精品久久久久久妇女| 好吊av| 日本无遮挡吸乳呻吟视频| 国产中文| 亚洲精品A| 亚洲色人| 超碰66| www.成人| 好男人社区影视在线WWW| 国产精品亚洲综合久久小说| 特级aa毛片在线播放| 亚洲AV无码久久精品日韩| 理论片午午伦夜理片久久| 亚洲无码成人视频| 人人做人人妻人人精| 国产精品久久午夜夜伦鲁鲁 | 国产女人18毛片水真多18精品| 色欲久久人妻内射| 91精品91久久久久久| 国产无人区码一区二区| 亚洲男人天堂| 国产精品视频中文字幕|