0
兩個月前,陳曦離開工作了一年半的OpenAI,和同事段巖、張天浩一起創立了Embodied Intelligence。
上周, Embodied Intelligence 宣布獲700萬美元種子投資,本輪融資由Amplify Partners領投,峰瑞資本(FreeS)、Lux Capital、SV Angels、11.2 Capital以及A.Capital跟投。
三個年輕的華人,成為硅谷冉冉升起的新星。

從左到右分別為陳曦(首席執行官)、Pieter Abbeel(總裁及首席科學家)、段巖(首席技術官)、張天浩(研究科學家)
Embodied Intelligence 之所以成為投資人爭相的寵兒,離不開三個創始人的背景。
創業前,三人是OpenAI Pieter Abbeel 教授實驗室的同事,從事前沿領域如模仿學習、強化學習、無監督學習以及元學習的研究工作。
OpenAI 是由特斯拉CEO Elon Musk 于2015年12月聯合諸多硅谷大亨建立的人工智能非營利組織,希望能夠預防人工智能的災難性影響,推動人工智能發揮積極作用。
2016年6月21日,OpenAI 宣布了其主要目標,包括制造“通用”機器人和使用自然語言的聊天機器人。OpenAI研發主管Ilya Sutskever、OpenAI CTO Greg Brockman 硅谷知名創業加速器Y Combinator總裁 Sam Altman 以及連續創業家 Elon Musk 等人聯合發表博文稱:“我們正致力于利用物理機器人(現有而非OpenAI開發)完成基本家務。
OpenAI 聚集了世界級的工程師和科學家,其中就包括Pieter Abbeel。Pieter Abbeel 在人工智能領域非常有名,其在伯克利的實驗室引領了諸多近期機器人學習領域的突破性進展,包括讓機器人學會整理衣物,行走(仿真環境),以及通過反復試錯或者VR示范數據來學習視覺驅動的操縱物體的技能。

Pieter Abbeel
CEO陳曦向雷鋒網表示,最近五年學術圈有非常多突破,主要歸結到深度學習的成功,和深度學習跟像強化學習領域的結合。于是,在完成自己的博士項目后,便拉上同事段巖、張天浩一起創立了Embodied Intelligence,而導師Pieter Abbeel 也加盟了這個新團隊任總裁和首席科學家。
基于創始人們在模仿學習、強化學習、無監督學習以及元學習等領域的研究成果,Embodied Intelligence 開發了一款軟件,可讓任何人通過在虛擬現實(VR)設備里示范教學來讓機器人獲得新的技能。這些示范數據會被用來訓練深度神經網絡,而訓練完畢的智能控制器使用強化學習進一步改進。通過這套流程,機器人可以輕松地學會廣泛的技能。
傳統的機器人編程非常耗費時間,只有專業人員才能進行。Embodied Intelligence 提供的智能模塊可以接入任何市面上的機器人,讓它們可以自然地學習新的技能,無需編寫晦澀難懂的代碼。
CEO陳曦向雷鋒網進一步解釋這項技術:
第一步是通過人類的演示進行學習,但這個要比簡單的復制要復雜,因為人類演示是很難把所有的變化都覆蓋到,所以學習的結果是需要泛化的能力,就算是人類示教沒有演示到的情況下也能完成任務。
第二步是機器人可以進行自我學習,具體的學習方法叫做深度強化學習(Deep Reinforcement Learning), 這個是通過機器人自己試錯來進行,可以找到比示教更優的方案。不過不是所有場景都需要這一步,對于不少場景來講,做到跟人的示教一樣快,一樣好就可以了。
在他們發布在youtube的視頻中,他們使用這種方法訓練一個兩臂機器人從桌上拾起球或者打繩結。Embodied Intelligence 團隊們戴著 VR 頭顯,拿著動作追蹤器,不斷地在數字世界中向機器人展示如何完成任務。然后,機器人可以從這些數據中學習。
一般來說,學術圈和工業圈的技術差距在5年左右。對于深度強化學習落地到工業圈,雷鋒網咨詢了幾位機器人領域創業者,他們均表示目前確實有很大進展,尤其是Pieter Abbeel 在這個領域更是領軍人物做出了突出貢獻,不過要落地到工業圈,需要8到10年。
對此,陳曦向雷鋒網回應了一句哈哈。對于是否有落地困難的問題,陳曦表現地很樂觀,表示如果從硬件上面來講,其實這個公司早兩年還真做不了,運算能力(GPU)最近兩年翻了好幾倍,然后消費級的VR設備也是最近才開始普及。而工業機器人方面,則是已經成熟很久了;而從難度來講,之所以選這個就是因為團隊有能力可以做出來。

從左到右分別為Pieter Abbeel(總裁及首席科學家)、陳曦(首席執行官)、段巖(首席技術官)、張天浩(研究科學家)
“第一,我們做的東西真的跟產業中所有看到過的解決方案,不過是市面上的還是在研發的都完全不一樣。我們應該是極少數使用端到端學習(end-to-end learning)的公司,這個應該解釋了為什么會有人說我們做的很學術。
第二是看這個技術本身,最主要的落地門檻在于實際應用中的可靠性。在學術界中端到端學習出來的算法一般是70-90%的成功率左右,這個離工業應用肯定是有一定距離的。但我們團隊最近的研究成果顯示只用30分鐘的示教數據,就可以在很多場景里面達到90%的成功率。那么我們認為,運用更多示教數據和進一步的算法優化,我們是可以達到工業的要求的。”
作為唯一的國內投資方,峰瑞資本創始人李豐對于這個項目給予了高度評價,
“人工智能發展到今天,真正用到決策智能的人工智能項目是很少見的。Embodied Intelligence做的機械臂的控制包括通過有監督學習做無序抓取,是一項有挑戰的事業。不過,Embodied Intelligence的創業團隊,包括 Peter Abbeel,是行業中做人工智能最頂級的研究者和創業者。且這件事是適合中美制造業國情的,應用潛力巨大。”
陳曦向雷鋒網表示目前已有跟數個工廠和系統集成商合作,已經確認了一些具體場景,接觸下來是發現能夠應用的地方很多,接下來希望挑一些有代表性的,能體現他們方案不一樣的地方。
“pick and place(抓取)是比較大的一塊,但是比較簡單的環境下面的pick and place就不是我們關注的了,因為其他解決方案也能做到。我們主要關注一些傳統方法難以解決的問題,例如抓取的原料是deformable (可變形的),像電線,數據線之類的wire bundle (導線束)。
除去抓取之外,我們也會看需要很多contact (物體間接觸)的場景,例如說assembly(裝配)。這也是傳統來講很難解決的問題。例如kitting(物料配送),從物料倉庫撿取原件到一個kit(套件)里面,然后會被運到總裝線上。這個kitting的步驟,如果是剛體的抓取是比較簡單的。有很多現成的方案只需要一個CAD模型,然后會match(匹配)到3D攝像機里面的point cloud(點云數據),然后計算抓取點。但是像電線這樣會變形的東西,這樣的現有方法就不足夠了,因為電線有太多種變形的可能,match 3d point cloud to fixed model(匹配3d點云到固定模型)的方法就很難完成了。
定性來講的話,是任何通過手動編程難以完成的場景都會是很好的candidates(候選者),比較有代表性的有剛剛說的deformable objects picking(可變形的物體抓取)。或者assembly 類型的場景。但是我們沒有講太具體的場景,因為是under NDA(保密)。抽象來講的話,只要是人可以遙控機械臂完成的工作,我們都可以從示教中學習。也就是說如果是需要硬件上的創新(就算由人來控制一個機械臂,也是不能完成的)的場景,就不是我們的關注范疇。
對于我們方案來講,不管是剛體的抓取還是柔性物體的抓取,學習方法是完全一樣的。唯一的不一樣可能是因為物體是柔性的,有更多的variations(變化),而需要更多的訓練數據。”
陳曦向雷鋒網表示,目前項目都在朝著預期進展,“如果說有什么意外的話,那應該是應用場景比想象中要多,這些是很多在學術界比較難接觸到的。”
接下來,陳曦希望在國內也找一些早期應用場景。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。