0
| 本文作者: 逸炫 | 2016-05-04 17:17 |
Adam Berenzweig(左二)在斯坦福人的一場人工智能專家論壇上。圖片來源:Forbes。
Adam Berenzweig獲得哥倫比亞大學博士學位后,在谷歌工作了超過十年的時間,建造了最早的谷歌音樂推薦系統,并參與了谷歌新聞、Goggles(Google的圖像搜索應用)和實時搜索等項目工作。在Goggles,他開發移動應用,讓用戶可以將攝像頭對準世界上的任意物體,人工智能會識別物體并提供相關信息。要知道在當時,深度學習和復雜物體識別技術八字都還沒有一撇。
“我們可以做局部特征提取和指紋識別,這對標識、藝術作品和海報還不錯。所以人工智能可以識別街對面的電影海報,但是搞不懂貓和狗有什么區別,或者椅子和桌子有什么區別。”Adam說。大概2012年左右,神經網絡可以識別圖片中的物體了。
“我職業生涯的大部分都在使用機器學習打造產品。我喜歡利用最新的研究突破,研究如何將其應用在實用性強、影響廣泛的項目中。”
在谷歌工作十年之后,Adam受到Matt Zeiler的邀請創建機器學習公司Clarifai,目標“將大規模深度學習帶入日常生活。”作為公司CTO,Adam打造了大部分的機器架構,還涉及了產品。“Matt Zeiler在2013年贏得了ImageNet國際計算機視覺挑戰賽(編者注:ImageNet有“計算機視覺的奧林匹克”之稱,是斯坦福計算機專家模擬人類識別系統建立的計算機視覺系統識別項目。2015年大賽中微軟獲勝、百度因作弊未入榜。)當時,這些模型逐漸顯示出它們的實力。”Adam說。
“他在這個領域內工作了一段時間,他看到了這些系統正在穩步、緩慢、逐步積累地成長。他給我展示了他的早期演示,這在系統性能方面是一個明顯提升,很明顯,這種性能提升為很多新應用打開了空間。”在Clarifai工作了兩年后,Adam于幾周前剛剛離開,回歸自己最初對于個人化推薦的熱情。
“現在,每個人擁有和不斷創造的數據跨越了很多不同的服務。如果我們可以將數據集中在一個地方,讓用戶可以更好地直接接觸到這種科技巨頭們在做的個人模型,我們將大有可為。”Adam說。這是他職業生涯的下一個目標。“如何建造機器驅動的產品,實現以數字為中心,并將機器學習的結果以不讓人混亂的方式呈現出來。”

Adam Berenzweig。圖片來源Linkedin。
Adam在Hacker Unit的線上課程中,分享了他從事機器學習13年的心得:
你用來打造試驗的系統萬分重要:你能夠多快地通過不同參數和配置帶來新的試驗?在沒有很大工程量的前提下,你能多快地設計新試驗并建造模型?接下來的問題就是將結果視覺化,可以快速看到什么結果行、什么結果不行,從而決定接下來專注做什么、不做什么。在我的經驗中,我經常從零開始,但是貌似現在有很多人都在研究這些東西,所以開源工具越來越好了。
從實驗室獲得訓練數據時,思考一下你將如何在頁面上呈現它。要細化到這種程度:用多大的字體、一頁上有多少個物件。這看起來有點傻,不像開發智能硬件的“硬派風格”,但是實際上這些都對訓練數據的數量和質量有很大影響。
現在,有許多產品在某種程度上都包含了機器學習技術。所以,在打造產品的時候腦子里要記住這一點:這個產品里出來的數據,會是好的訓練數據嗎?這是我認為必須一直關注的點。正確的做法可以是,當錯誤發生的時候給用戶改正錯誤的機會,確保這在產品的使用流程之內。給用戶呈現的感覺應該是,這是對我有價值的東西,因為這會幫助改正產品中的錯誤,這對用戶自己也有好處。
關于亞馬遜土耳其機器人(譯者注:一個Web服務應用程序接口(API),開發商可以遠程調用人的智能來完成一些對計算機來說很難的“簡單”任務,例如撰寫產品描述或選擇某一主題的最佳照片等),我的個人經驗是很難找到好的標識員,因為這上面人們的流動性很快。實際上,很多標識任務得讓人花時間適應,基本上要接受一定訓練。我們最終使用了其他的系統,獲得了一些可以保持長期關系的人。那非常重要。
我們建立Clarifai的時候,我們沒有很多的收入。我們有產品,我們在API上有用戶,剩下的,就只有一個“這是一個好機會”的信念。關于Clarifai的另一點是,圖像很容易用來作為演示,所以我們從早期開始在網站上就一直有一個演示,讓人們直接地看到產品的可能性,抓住了他們的想象力。在其他領域,要不是數據非常具體——例如某個公司的企業數據——要不就是不太容易進行視覺呈現。我想這是一個很大的挑戰。
單單用一個GPU就能實現很多東西。也許在未來的一兩年會改變,但是多GPU系統——如何在多個GPU上將訓練最優化——這個問題我覺得還沒有解決。因此,大部分人還不用考慮這個問題。我認為你用同一個GPU就能得到很多,可擴展性只是能不能在訓練中將數據輕松轉移的問題,而且這會有一個長期的服務。
開源系統有非常強的社區,并且在快速提升。你可以去了解一下,看看是不是值得轉移去開源社區。我認為得看領域。其他很重要的因素是團隊的技能如何、人們習慣使用的語言是什么、他們是否真的熟悉這些框架。我認為他們挺好的。
我們一直會使用我們自己喜歡的方法。如果那本來就是我們自己也想深入的方向,或者,如果我們出于其他理由覺得,這對別人來說也會非常有用,我們就會愿意為客戶定制化。當我們心里想到“這是個很好的領域,我們該做。”那么,我們就會去做。有時候,我們會為定制化收費,因為我們投入了額外的工程時間,有其合理性。有時候我們不會收費,這通常是洽談過程的一部分。主要這得看客戶的體量。
可行的東西有很多,你只需要幾個就夠。也許是一支有成功案例的隊伍,也許是一種別人都沒有的技術,也許是產品演示中很好的產品感覺,或者很好的執行能力、公司愿景與想象力,或者是發現一種還沒有人實踐的新機會。Clarifai最初有很多可行的點,但是我們聽到了一種評論,就是我們同時想做到的事情太多了。我們在建造API,我們還有圖片應用。我們成功了,但是有一些投資人因為這一點轉身離去。這其中的關鍵就是,找到對你來說可行的點,然后去找到相應的投資人。
Via BeMyApp
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。