1

大多數人懶得給照片加標簽。如果你屬于這一類(大概率事件),那么你一定知道搜索某張照片有多辛苦。 但這很有可能即將成為過去。
本周,Facebook 披露了其機器學習平臺 Lumos 的更多信息: Lumos 將使用戶們利用相片內容進行搜索,而不是圖片名稱或是標簽。
Facebook 應用機器學習負責人 Joaquin Qui?onero Candela 解釋說:
“換句話說,搜索‘黑襯衫照片‘時,系統能識別出每張照片里是否有黑襯衫,并據此搜索;即便照片并沒有被添加標簽也沒有關系。”

Lumos 利用了計算機視覺技術來識別照片中的人、動物和一系列其他物體。但它遠不止于此,而是更進一大步,能識別出照片中發生的“事”。所以在識別某相片中有某個人之外,它還能夠判斷該人是在行走、騎馬、彈琴還是在做其他的事情。雷鋒網按,Facebook 并沒有提供一張 Lumos 所能識別的人物行為列表,因此目前并不清楚它究竟神通廣大到了何種地步,以及識別的正確率如何,會不會犯下“妖精打架”那樣的錯誤。假使正確率尚在接受范圍以內,相比目前各照片管理軟件還停留于人臉識別的層次(除了 Google Photos),便是極大的進步,其技術可能成為 Google Photos 的直接競爭對手。

介紹 Lumos,就不得不提 FBLearner Flow。Facebook 使用了它的 FBLearner Flow 平臺來開發 Lumos。前者是一個通用型的機器學習流水線(pipeline),開發它的初衷是讓 Facebook 工程師們能同時執行多個 AI 項目,而不需要每次都借助必要的硬件。據 Facebook 透露,現在每月有超過 120 萬個 AI 實驗在 FBLearner Flow 上運行。包括 Lumos 在內的這些項目,能夠獲取社交網絡和 app 上永不停歇的數據流。
雷鋒網獲知,一開始,FBLearner Flow 平臺只是 Facebook AI 研究部門(FAIR)的一個小研究項目。但當它達到量產規模后,它和開發團隊被轉移到了應用機器學習團隊。現在,FBLearner Flow 已是 Facebook 計算機視覺團隊的引擎。
建立在 FBLearner Flow 基礎上的 Lumos,是一個 Facebook 為處理圖像和視頻理解任務而開發的平臺。Facebook 的工程師并不需要接受過深度學習或者計算機視覺培訓,就能使用 Lumos 訓練、布置新模型。 Lumos 平臺在不斷改進,這主要有兩種途徑:
導入新添加標記的數據;
利用 Facebook 應用中有注解的數據。
深度學習的進步使得開發者在圖像分類上取得巨大進展——類似于“圖片中有什么”、“東西在哪?”這樣的問題被系統以前所未有的精確度回答出來。 Facebook 表示,通過設計出能對給定圖片中的物體進行檢測、分離的新技術,他們大幅推動了在該領域的研究。
當 Facebook 應用這些技術時,相片會穿過一個深度學習引擎,后者能分離圖像、識別物體和場景、向照片加入更多含義。這產生出任何 Facebook 產品、服務都能使用的豐富數據。
Joaquin Qui?onero Candela 還表示,Lumos 涵蓋的技術有一系列廣闊的應用場景,遠不止于單純地優化圖像搜索。他進一步解釋:
“出于‘爭議內容檢測,反垃圾信息和自動圖像抓取’等目的,已經有超過 200 個視覺模型被十幾只不同團隊訓練出來,并布置于 Lumos。它們的應用領域十分廣,從我們的 Connectivity Labs (互聯實驗室)到搜索團隊,再到 Accessibility (可達性)團隊,大家都在用 Lumos 的技術。”
雖然 Facebook 在 Lumos 上取得可喜進展,但它還稱不上是獨步天下。谷歌一直在開發圖像掃描 AI 來提高圖像搜索。去年,谷歌聲稱它的 Inception v3 AI 能夠以 93.9% 的精確度抓取圖片內容。雷鋒網消息,最近 Inception v3 又有突破:在它基礎之上將開發能預警皮膚癌的新 AI。
via facebook,siliconangle
相關文章:
IBM Watson 視覺識別新高度,采用 GPUs 分布式網絡看懂圖片內涵
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。