1
| 本文作者: 薩洛 | 2017-02-08 15:06 |

在觀看島國教育片的時(shí)候,往往在不可描述的部位打上了馬賽克,固然呈現(xiàn)了朦朧美,但部分觀眾依然希望變得更加清晰。現(xiàn)在,Google Brain 在提升圖片分辨率方面取得了突破性進(jìn)展。他們已經(jīng)成功將 8*8(毫米)網(wǎng)格的像素馬賽克轉(zhuǎn)換成為肉眼可辨識的人物圖像。
而真正能夠提升低分辨率照片細(xì)節(jié)的最佳突破口就是神經(jīng)網(wǎng)路。當(dāng)我們被照片中所包含的像素信息難倒的時(shí)候,深度學(xué)習(xí)能通過人類常說的「幻想」來增加細(xì)節(jié)。實(shí)質(zhì)就是軟件基于從其他圖片中學(xué)習(xí)到的信息對圖片進(jìn)行猜測。
Google Brain 的研究團(tuán)隊(duì)已經(jīng)公布了「像素遞歸超分辨率」技術(shù)(Pixel Recursive Super Resolution)的最新進(jìn)展,盡管結(jié)果看上去有點(diǎn)瘆人,但是整個(gè)還原效果令人印象深刻。
下面是他們復(fù)原的效果案例之一:

右手邊的圖片,是 32 x 32 網(wǎng)格的真實(shí)人物頭像。左手邊的圖片,是已經(jīng)壓縮到 8 x 8 網(wǎng)格的相同頭像,而中間的照片,是 GoogleBrain 基于低分辨率樣片猜測的原圖。
整個(gè)復(fù)原過程使用了兩種神經(jīng)網(wǎng)絡(luò)。首先介紹的是調(diào)節(jié)網(wǎng)絡(luò)(Conditioning Network),它將低分辨率照片和數(shù)據(jù)庫中的高分辨率照片進(jìn)行對比。這個(gè)過程中迅速降低數(shù)據(jù)庫照片中的分辨率,并根據(jù)像素顏色匹配一堆同類照片。
接下來介紹的是優(yōu)先網(wǎng)絡(luò)(prior network),它就會猜測那些細(xì)節(jié)可以作為高分辨率照片的特征。利用 PixelCNN 架構(gòu),該網(wǎng)絡(luò)會篩查該尺寸的同類照片,并根據(jù)概率優(yōu)先對高分辨率照片進(jìn)行填充。例如,在論文提供的例子中,提供的同類照片是名人和臥室,優(yōu)先網(wǎng)絡(luò)根據(jù)優(yōu)先級最終確認(rèn)了名人的照片。優(yōu)先網(wǎng)絡(luò)會在低分辨率和高分辨率照片中做出決定,如果發(fā)現(xiàn)鼻子的可能性比較大,就會選擇鼻子。
接下來,兩個(gè)神經(jīng)網(wǎng)絡(luò)的最佳猜測就會進(jìn)行整合,最終形成的圖像如下:

下面也是一些通過超像素技術(shù)變化的樣本:

在你開始思考:「這并不準(zhǔn)確,這個(gè)人工智能是愚蠢的」,那么請記住人類同樣也是愚蠢的。一名志愿者參與了這樣的測試,同時(shí)展示降低分辨率的照片和通過 Google Brain 復(fù)原的照片,然后提問「你猜那張照片來自于相機(jī)?」,最終結(jié)果是 10% 的名人照片,測試者選擇了 Google Brain 的照片。在 28% 的臥室樣片中,測試者選擇了 Google Brain 的照片。
盡管技術(shù)是純凈的,但是未來可能會有非常可怕的應(yīng)用。就像是波士頓馬拉松爆炸案一樣,不難聯(lián)想到一些執(zhí)法部門會濫用該軟件來抓取嫌疑犯。更為重要的是,人工智能的多次嘗試已經(jīng)被證明存在種族主義,因?yàn)橥鶗㈦s人類的偏見。分析型人工智能和圖像技術(shù)的結(jié)合,在未來必然會經(jīng)歷一段漫長的調(diào)試過程。
via gizmodo
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。