^{<sub id="jgr5k"></sub>}

谷歌大腦最新技術(shù)：將馬賽克還原成清晰圖像

本文作者：薩洛

2017-02-08 15:06

導(dǎo)語：Google Brain 在提升圖片分辨率方面取得了突破性進(jìn)展。他們已經(jīng)成功將 8*8（毫米）網(wǎng)格的像素馬賽克轉(zhuǎn)換成為肉眼可辨識的人物圖像。

在觀看島國教育片的時(shí)候，往往在不可描述的部位打上了馬賽克，固然呈現(xiàn)了朦朧美，但部分觀眾依然希望變得更加清晰。現(xiàn)在，Google Brain 在提升圖片分辨率方面取得了突破性進(jìn)展。他們已經(jīng)成功將 8*8（毫米）網(wǎng)格的像素馬賽克轉(zhuǎn)換成為肉眼可辨識的人物圖像。

而真正能夠提升低分辨率照片細(xì)節(jié)的最佳突破口就是神經(jīng)網(wǎng)路。當(dāng)我們被照片中所包含的像素信息難倒的時(shí)候，深度學(xué)習(xí)能通過人類常說的「幻想」來增加細(xì)節(jié)。實(shí)質(zhì)就是軟件基于從其他圖片中學(xué)習(xí)到的信息對圖片進(jìn)行猜測。

Google Brain 的研究團(tuán)隊(duì)已經(jīng)公布了「像素遞歸超分辨率」技術(shù)（Pixel Recursive Super Resolution）的最新進(jìn)展，盡管結(jié)果看上去有點(diǎn)瘆人，但是整個(gè)還原效果令人印象深刻。

下面是他們復(fù)原的效果案例之一：

谷歌大腦最新技術(shù)：將馬賽克還原成清晰圖像

右手邊的圖片，是 32 x 32 網(wǎng)格的真實(shí)人物頭像。左手邊的圖片，是已經(jīng)壓縮到 8 x 8 網(wǎng)格的相同頭像，而中間的照片，是 GoogleBrain 基于低分辨率樣片猜測的原圖。

整個(gè)復(fù)原過程使用了兩種神經(jīng)網(wǎng)絡(luò)。首先介紹的是調(diào)節(jié)網(wǎng)絡(luò)（Conditioning Network），它將低分辨率照片和數(shù)據(jù)庫中的高分辨率照片進(jìn)行對比。這個(gè)過程中迅速降低數(shù)據(jù)庫照片中的分辨率，并根據(jù)像素顏色匹配一堆同類照片。

接下來介紹的是優(yōu)先網(wǎng)絡(luò)（prior network），它就會猜測那些細(xì)節(jié)可以作為高分辨率照片的特征。利用 PixelCNN 架構(gòu)，該網(wǎng)絡(luò)會篩查該尺寸的同類照片，并根據(jù)概率優(yōu)先對高分辨率照片進(jìn)行填充。例如，在論文提供的例子中，提供的同類照片是名人和臥室，優(yōu)先網(wǎng)絡(luò)根據(jù)優(yōu)先級最終確認(rèn)了名人的照片。優(yōu)先網(wǎng)絡(luò)會在低分辨率和高分辨率照片中做出決定，如果發(fā)現(xiàn)鼻子的可能性比較大，就會選擇鼻子。

接下來，兩個(gè)神經(jīng)網(wǎng)絡(luò)的最佳猜測就會進(jìn)行整合，最終形成的圖像如下：

谷歌大腦最新技術(shù)：將馬賽克還原成清晰圖像

下面也是一些通過超像素技術(shù)變化的樣本：

谷歌大腦最新技術(shù)：將馬賽克還原成清晰圖像

在你開始思考：「這并不準(zhǔn)確，這個(gè)人工智能是愚蠢的」，那么請記住人類同樣也是愚蠢的。一名志愿者參與了這樣的測試，同時(shí)展示降低分辨率的照片和通過 Google Brain 復(fù)原的照片，然后提問「你猜那張照片來自于相機(jī)？」，最終結(jié)果是 10% 的名人照片，測試者選擇了 Google Brain 的照片。在 28% 的臥室樣片中，測試者選擇了 Google Brain 的照片。

盡管技術(shù)是純凈的，但是未來可能會有非常可怕的應(yīng)用。就像是波士頓馬拉松爆炸案一樣，不難聯(lián)想到一些執(zhí)法部門會濫用該軟件來抓取嫌疑犯。更為重要的是，人工智能的多次嘗試已經(jīng)被證明存在種族主義，因?yàn)橥鶗㈦s人類的偏見。分析型人工智能和圖像技術(shù)的結(jié)合，在未來必然會經(jīng)歷一段漫長的調(diào)試過程。

via gizmodo

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

2人收藏

相關(guān)文章

薩洛

編輯

發(fā)私信

當(dāng)月熱門文章