<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      業界 正文
      發私信給梁丙鑒
      發送

      0

      圓桌論壇:具身數據如何塑造行業未來? | GAIR 2025

      本文作者: 梁丙鑒   2025-12-31 16:42
      導語:百億級投入,具身行業夠成熟了嗎?

      雷峰網(公眾號:雷峰網)訊 高質量數據正在成為具身本體性能突破和成本控制的瓶頸。在具身智能從技術演示走向規模落地的關鍵轉折期,對于數據的需求和爭論也變得越發火熱。從遙操作到UMI,從動捕到仿真數據,具身數據的未來在數采工廠,還是名為In-the-wild的美好愿景?

      2025年12月13日,第八屆GAIR大會的數據&一腦多形專場,舉辦了主題為具身數據的圓桌論壇。圓桌主持人為英諾天使基金 ED,石麻筆記主理人王建明,并邀請了諾亦騰機器人創始人戴若犁,極數迭代CEO、深圳AIRS訪問研究員佟顯喬,鹿明機器人CTO丁琰,共同圍繞具身數據的質量、采集以及數據飛輪等議題,展開了一場深度對話。

      對機器人而言,什么是好的數據?王建明以數據質量切入,幾位嘉賓就“以終為始”達成了共識,最終的模型性能、訓練中機器人的受益程度反映著數據的質量。丁琰進一步指出,采集成本和各種數采方式對于不同場景和硬件的適配與否,都是決定數據質量的關鍵環節。

      未來的數據采集方式或將走向多元化。作為一家有數據能力的創業公司,丁琰表示,鹿明機器人正在籌建自己的數采廠。出于成本考慮,現階段采用 UMI方式進行數據采集,但未來仍可能引進更多方案。“遙操作、 UMI(Universal Manipulation Interface)、動捕、仿真數據,存在即合理。”丁琰強調。

      戴若犁就In-the-wild的數據采集方式發出了提醒,他指出這是一種高度考驗技術水平的方案,其落地需要先后克服軟硬件易用性、組織管理能力兩道難關,而在當前的時間節點,邁過前者的技術門檻無疑更為重要。

      具體而言,在采集階段需要低摩擦、高精度、多模態的數采設備,野采數據的利用,還需要從稀疏原始數據中得到稠密信息的技術方案。戴若犁認為,一條可行的鏈路是通過世界模型進行先驗估計,輸出更豐富的模態及維度數據。相較之下,遠未到比拼人力組織能力的時間。

      佟顯喬認為,數據采集行業仍處于早期階段,數據、本體、模型公司仍在相互磨合。不同的模型公司提出了不同的需求,這意味著數據公司不能停留于堆人力的體力活階段,而是要懂模型、給建議。“模型公司也需要你的knowledge”,佟顯喬強調,“一個個批次之后,大家才能一起做得更好。”

      以下是此次圓桌討論的精彩分享,AI科技評論進行了不改變原意的編輯整理:

      王建明:我們這個panel的話題是數據,所以我的第一個問題,是想請各位先定義一下,對于機器人來說什么是好的數據?請戴博先開始吧。

      戴若犁:我覺得還是以終為始,最終在訓練模型、機器人的時候能夠獲得收益,而且收益比較高的數據是好數據。

      佟顯喬:我覺得這一定是從最后的模型出發,什么數據最后能訓練出一個比較好的模型,就是好的數據。我們今天基本上是這樣定義,但是因為今天模型的狀態沒有收斂,用什么樣的數據能訓練出什么樣的模型,不知道,所以其實也很難定義哪個是好的數據。

      丁琰:第一數據必須要能訓練出一個模型,才是比較好的數據。第二點是數據收集成本要比較低,如果特別高,那整個行業還是接受不了。還有一點,就是數據的采集要適應場景、適應硬件。

      王建明:剛才大家都提到,好的數據首先對于模型訓練要有好的效果,那么在這個前提下,數據公司怎么知道如何提供好的數據?

      通常來說,這些數據都是提供給模型公司或者本體公司,模型效果掌握在客戶的手上。是客戶知道自己想要什么樣的數據,找到數據公司來定點運營,還是數據公司自己知道什么樣的數據對模型公司好,來反哺給模型公司?你們認為在整個具身智能的鏈路里,數據公司跟模型、本體或者應用公司之間,關于數據這件事情的認知,是一個什么樣的一個鏈路呢?

      戴若犁:目前在前端商業實踐上,我看到的是反過來的。不是說模型公司想得特別透徹,就能夠給出命題作文,而是如果有足夠體量的數據,且里邊蘊含的信息足夠多,就能夠訓出效果。如果訓不出效果其實有很多原因,可能是模型架構不對,可能訓練方法不對,這個鍋不一定是數據來背。所以我目前看到的是,如果你有足量且明確知道這一類數據里面蘊含足夠多的信息有待挖掘,那其實對于模型是有反向影響能力的。比如你有一個特別大體量的數據集,即使這個數據集的模態、維度、精度和傳感器的方式方法選擇跟模型方原本的期待并不一樣,他們也會愿意去改變訓練的方式,甚至于讓模型的架構去適應數據集本身。

      佟顯喬:我看到的其實跟戴總看到的比較類似,很多時候模型公司找到我們是說,這樣做行不行,那樣做行不行,他們其實也需要你的knowledge。在這個過程中,大家還有一個磨合,比如一開始說這樣采,很可能采完這一批次以后,下一批他說我覺得這樣做應該更好。

      所以其實目前來看,可能因為行業還是早期階段,所以沒有一個統一的方式,大家都是在相互磨合。甚至你會發現不同模型公司,需求可能千差萬別,提的要求也很不一樣。所以作為一個數據公司,我覺得不能只是純粹做labor的工作,你還是要懂一些模型,你需要跟他們去交流,給他們建議,這樣大家才能一起做得更好。

      丁琰:我還是比較認同佟博士的觀點,我認為就是做數據和做算法的公司是分不開的,數據和算法是不拆家的。到底什么是算法?你要搞一些非常高深的模型架構,做一些很創新的探索,可能沒有到這種級別。但是你如果要把市面上常見的主流算法和數據模型全部玩熟,我覺得還是非常非常必要的。不然的話,你采出來的數據很多是很臟的,基本上不能用。

      跟行業里的人進行交流的時候,我就發現很多公司沒有訓練基礎模型的能力,他們對于數據的理解是非常簡單的,認為只要按照指令把數據給采了就行。但其實這些數據往往是不能用的。

      每個任務都需要進行一些特定的任務設計,比如大家都會疊衣服,但其實這里面技巧性非常強。你這個技巧怎么來的?其實是在采了一堆數據之后訓,發現有一些問題,然后再去改進采集技巧,再來訓,最終才能得到一個比較好的效果。在這個數據采集和算法迭代的過程中,你會獲得很多know-how和insight,這些東西是在數據公司是非常關鍵的,這些東西才是真正寶貴的價值,而不是只是把這個數據采完交付給客戶,客戶愛怎么訓怎么訓就得了。這個是完全不一樣的。

      另外一點就是,說到底是數據決定,我認為現階段做算法的人和做數據的人要不斷地進行迭代,最后才能去完成這個東西。像我們公司就是,我們自己也做一些基礎模型的訓練,然后會對數據本身有一些 know-how 和insight,知道怎么采。但是我們自己得到的這些經驗教訓,可能只能針對于部分任務,比如說pick and place,或者是針對于工業場景,因為我們還是做工業場景比較多。但如果是做精細化的任務,比如我今天跟客戶去聊,系鞋帶、疊衣服、疊紙盒子,這些任務就是另外一種 know-how和insight了。可能得跟客戶一起成長,才能獲得很好的know-how和積累。

      王建明:據我自己觀察,行業其實階段性地對不同類型數據的側重點是不一樣的。比如從2023年下半年開始,同構遙操這種數據采集范式被帶火了。 UMI這個工作是23年年末地,但實際上它近期被Sunday Robotics 還有 the generalist 帶火了。24年我覺得數采還是以同構遙操為主,到了今年上半年,有一些動捕的數據采集范式也被帶火了,我感覺肯定也有一些北美進展的淵源。

      就各位的觀察,目前中美在數據這個問題上面,你們覺得最大的非共識是什么?共識又是什么?你們或多或少跟北美的一些客戶有聯系,你認為他們現在重點的這個數據采集范式又是什么?

      戴若犁:首先我覺得現在中美之間在機器人上完全沒有代差。他們不是開玩笑嗎,說Our Chinese better than your Chinese。我大概每兩個月在灣區待兩周,在灣區談生意需要說英文的時間還是挺少的,其實都是同一撥人,同學、朋友、師兄、師弟、學生,一起聊天。所以首先我沒有覺得中美有特別大的,共識方面的差異,大家其實都還挺一樣的。但我覺得中美在數據上面其實有一個特別大的區別,就是美國好像沒有地方政府的助力。數據這件事情,特別是數采廠,有地方政府助力,就會比較傾向于本體公司和地方政府合作,然后得到非常大的機會,拿到當期收入去建以遙操作為主的數采中心,也就比較少有機會孵化出來像 generative 或者Sunday 這樣In-the-wild或者 UMI的方式去采數據。

      所以這個分水嶺我覺得很有意思。就是如果沒有這么多特別eager地想要幫助創業者,幫助企業招商引資的地方政府,可能就不會有這么多的數采中心用遙操作去采數據,可能也就會促使像 UMI這樣的方式早一點在中國落地。

      這件事情完全不是因為技術的共識有差異或有代差導致的,我覺得反而是一種資源詛咒。我小時候打籃球,彈跳非常好,雙手隨便抓筐哐哐地扣,但是我技術非常差。我現在歲數大了,打球打得越來越差,被原來打球沒我打得好的人隨便過,我這就是資源詛咒,因為我小時候資源太豐富了。所以我覺得這就可能不是代差,而是資源詛咒。

      王建明: UMI這樣的方式去年出來,我感覺當時可能也有一些人在關注,但實際上是今年有一些北美公司把它release出來,才受到更廣泛的關注。

      戴若犁: UMI就是很合理呀。 UMI其實是human-centric,它只是末端執行器end effector 被置換了的human-centric,所以說它就是很合理,它somehow可以跨本體。

      王建明:丁博士, UMI是你之前一個比較著名的工作,可能在這種數據采集方式上面,你們應該是第一批關注,并且在這個基礎上去迭代做工程化的。可以聊聊你們對 UMI的看法嗎?

      丁琰:這項工作其實我們在24年3月份就開始做了,當時在上海 AI Lab的時候就啟動了這個項目,做到現在一直沒有換過。我確實看到了數采方式從遙操作到 UMI,一路在迭代的過程。

      其實我感覺中美之間是有代差的,至少在模型,或者是引領具身智能發展方向上有,可能北美那邊的模型或者資源還是比較多。因為之前我們做 UMI的時候還是比較默默無聞的,沒有人關注,整個大陸好像只有我們一家公司,或者只有我們這一個團隊在做這件事,也是我們自己一直在迭代。直到Sunday Robotics發布出一個非常牛逼的模型,基本上全中國或者全世界的關注點才轉向 UMI。我們的產品剛好在這個時間點工程化出來了,基本上整個具身智能圈子的同行都在瘋狂地采購和咨詢,所以我覺得確實美國那塊的人還是在引領一些潮流和方向。特別是 UMI這個東西,如果只有我們一家公司來做,其實我很難想象到底什么時候能火起來。雖然我們自己很堅信 UMI,但是可能整個中國的同行并不是很堅信。很感謝美國的這些公司引領這些潮流。

      然后關于非共識,在一些技術路線上其實是有一點點非共識,但是gap很小,可能很快就彌補上來了。等到Sunday Robotics出來之后,中國的公司就一擁而上地探索 UMI,很快就把這個非共識給填起來了。

      我們自己在做 UMI的時候,其實也會有一些自己的know-how 和insight。舉個例子,Sunday Robotics其實更偏向于一種后處理的方式,它把設備分發給Airbnb那些工作人員,或者是眾包人員去采,采完之后再把它收集回來處理。我們覺得這種方式稍微有一點點不太合理,因為我自己在建數采廠的過程中,發現人員是非常難管理的。如果是通過這種方式去做,后續處理流程的時間和消耗是異常的巨大。所以我們自己是選取的前處理,前處理的意思就是把時間花在前面,不要花在后面,在采集過程中我就及時評估和反饋數據到底好還是不好,有什么問題當場就處理掉,最后收集起來的數據100%是合格的。

      剛剛那個戴博士說的human-centric data其實有一點點像 UMI,但是 UMI又很特殊,它更多針對于二指夾爪這一塊。真正的human-centric更多地偏向五指,二指比較特殊,但是二指又是一個很重要的領域,因為整個中國使用二指夾爪的這個比例份額我認為還是大于99.9% 的,用五指靈巧手的份額目前來看偏少。主要是這個硬件本身不是特別穩定,所以大家用起來,真正落地的還是二指為主, UMI就在這個生態里面占據了一個比較重要位置。雖然它屬于human-centric這個分支,但是它又跟五指有區別,這是我們對 UMI的認知。

      當然 UMI其實還有很多問題,比如說active perception,要不要帶頭部視角?我們在跟客戶聊的過程中就會發現,因為原始的 UMI只有兩個夾爪,只有手部這兩個相機,這種configuration的配置它對硬件設計就會有一些要求,它會希望這個腕部相機的畫面是稍微比較大的,它可以獲得更多environment的feature,這樣就利于訓練嘛。

      但是如果你加上一個頭部相機,那還需不需要這么大的一個畫面?這也是一個問題。你如果加上一個頭部的畫面,它又會引申出一些其他的問題。比如坐標系之間的對齊,或者是你用哪個坐標系。還有頭部要不要動?對于輪式雙臂來說,頭部一般是固定的,沒有這個自由度。如果你想引入一個active perception,有一些工作是在頭上加了一個小機械臂,把這個小機械臂上掛一個攝像頭,這就會彌補active perception所帶來的自由度問題。但是這樣又引發一些其他的問題,比如市面上沒有這種機器人,頭上還長一個機械臂,所以說這些問題其實都沒有被解決。這個 UMI的探索之路其實還是很長很長的,至少目前來說,我們覺得整個中國大陸或者全世界的具身智能圈子,對這方面的探索基本上屬于空白,或者說沒有做很多。我覺得在這方面,可能中美之間都會有一些這個共識或非共識在里面。

      王建明:對。剛才戴博也說到了資源稟賦的問題,我確實也觀察到,北美它有很多配套模型公司的數采或者數據處理公司,或者設備公司,可能它們都是專門去服務某一些大公司的。那國內的話,我們目前當然看到了有一些數據相關的創業公司,但更多的還是政府支持的數采工廠。

      所以我的一個問題是,這種這種政府支持的數采工廠是不是真的可以解決數據問題?在這個過程中,作為有一定數據能力的創業公司,你們覺得應該怎么跟這些數采工廠合作?或者有什么建議給到這些有資源稟賦的單位?

      佟顯喬:我覺得中國這兩年,各個地方政府大量地建訓練廠,對行業肯定是有促進作用。但是現在建的大量訓練場都是用的遙操方式,那7這是不是正確的?這個也很難說。

      再一個,政府肯定是滯后的。如果以后的方向變了,以這種In-the-wild的方式做數采,可能他也會改變。所以就剛才討論的這個問題,我覺得如果以后通用機器人的能力要到來的話,一定是需要In-the-wild這種方式的數據,因為首先它必定要跨本體,第二一定是要大量數據。那用任何一個本體去采,即使你有那么多訓練場,也不太可能達到這個目標。

      各地訓練場是地方政府投資,然后買本體,給很多做本體的公司帶來了收入。政府肯定也不想做賠錢的生意,采完的數據要賣回去,那數據賣回去以后,大家拿數據訓練模型,可能是形成了這樣的一個小閉環,我覺得短期內對這個行業肯定是有促進的作用。但這件事是從商業上的考量,是不是導致了技術的方向不一定一直在正確的方向上,也是有可能的。不過這個行業因發展很快,其實去年的方向和今年也不一樣,所以這個我覺得都是走一步看一步。

      丁琰:其實我們鹿明公司自己也正在籌建數采廠,目前有兩個正在籌建過程中。我們自己是采用的 UMI這種方式,主要的原因還是在于成本。現在的數采廠建設成本里,有70% ~ 80%可能都是買機器人硬件的花銷,這方面的成本會造成整個數據成本異常高昂。那有沒有人能消耗這些數據,其實還是有點未可知。因為這種大規模的批量建的數采廠,本身如果數據管理做不到位,數據基本上都是廢的,沒有人會買。我跟同行去交流,大家對這些數據的吐槽還是挺多的,主要就是在于精細化管理沒有做到位。

      我覺得這也是前期的一種正常狀態,隨著后面的發展,可能會大家會對數據管理會更精細,或者引進不同的數采方式,彌補數采廠數據的多元化問題。我覺得不管是遙操作也好, UMI也好,動捕也好,仿真數據也好,存在即合理,只是不同份額的問題。我覺得未來的數采可能會更加多元化一點。

      戴若犁:我在北京有辦公室,有團隊,在深圳也有,北京市和深圳市的領導來調研,我其實給他們都寫過這樣的建議。其實他們也很關心,到底應該怎么花錢,怎么幫助企業是最有價值的。我覺得其實就是要看最終數據的成本構成。

      比如我們說兩類數據。一種是數采工廠的,那個數據的成本大概有50%是設備的攤銷折舊。如果按照5年攤銷,大概有50%是人力的工時,剩下的都可以忽略。如果是剛才說的野采,大概60%是人力,大概40%是場景的協調,比如租500個Airbnb或者途家的房子去采生活服務,在這邊硬件攤銷又可以被忽略了。

      所以我當時跟兩邊政府領導說的就是,不管是做數據的公司,還是做模型本體的公司,如果可以幫助他們在需要數據的時候,能夠在人力的補貼或者是場景的協調上降成本,或者在前置的設備投入上能夠幫助企業的話,那其實就直接在成本里頭幫助了大家。也可以考慮請我們這樣的數據服務公司,來采集一些普適的,可以跨本體的數據集,把這個數據集開放給大家,讓大家在早期試錯的時候不用每一家都自己花很多錢去做。這個可以幫助所有人,我是這么認為的。

      王建明:現在很多賣本體的公司,他們經常會有ToG這種銷售模式,其實很大一個點就是消耗他們的本體用來做數據采集。我覺得戴博提到的In-the-wild這個數據采集方式上,如果政府部門可以調動一些,比如國有的超市,或者政府部門能夠介入的一些人力操作的部分,讓In-the-wild這個數據采集的能力組織起來,其實不需要投入太多的這個資金,更多是資源的調度。這樣跟數據公司配合起來,可能會比購買一堆本體來得更直接,和對行業的推動會更有作用一點。

      其實我們剛才也提到了,在工廠里面采集數據對量有一定的需求,但是可能更需要的是In-the-wild這個數量級的數據采集。各位在In-the-wild的數據采集上面有一些什么樣的觀察和思考?我先說說我的想法。我覺得In-the-wild這種數據,其實更多是運營能力的問題。那么是不是像美團、餓了么這一類公司,會更適合做這種數據的運營?作為數據公司來說怎么看這個問題?

      戴若犁:In-the-wild的數據,分兩部分。一部分是你說的,美團、餓了么這種人力動員,高效卷人力的能力,另外一部分可能是設備能力,就是說你要有優質的、對于操作的摩擦很低的 low-friction 設備,而且能夠采到足夠的modality,就是模態和精度,那這是兩部分。另外一部分是數據的利用,In-the-wild采回來的數據最大的問題是稀疏,模態稀疏,維度也稀疏,信息也稀疏,那有沒有辦法從稀疏的數據里邊挖出來稠密的信息,甚至于增廣出稠密的信息?這也是很考驗水平的。比如世界模型,現在有一條鏈路就是稀疏性信息進到一個世界模型,通過大量的先驗估計出來更豐富的模態跟維度,這些其實都跟那個美團、餓了么的人力組織就不太相關了。

      所以我覺得其實In-the-wild也是一個非常考驗技術水平的事情,如果只是靠人力組織的能力,那你的生意就是人力組織。到最后其實你拿出來什么能力,你賺到什么錢,這是非常公平的一個事情。

      佟顯喬:我覺得In-the-wild在現在這個時間點其實屬于非常早期的階段,目前來看人力管理那部分還是第二步。第一步是怎么采集,硬件設備、軟件的易用性,和數據的處理,不管你是online處理還是后處理,都得先讓人可以很快地用起來。

      這些東西成熟以后,后面拼的才是人力組織能力。這就有點像自動駕駛行業,現在數據標注就變成了標框了,但是早期階段,大家用不同的工具,標注的效率和數據采集效率其實是不一樣的。到后邊這個東西成熟以后,大家就變成比拼誰人力成本搞得低,誰組織得好,這個是第二步。所以In-the-wild在具身這塊,其實還是早期階段。目前來看還是從技術的角度,要把采集設備這些技術角度做得更好,才能到下一個階段。

      丁琰:我跟那個佟博的想法還是比較一致的。Collect data In-the-wild 確實是一個很好的愿景,但是我估計大規模需求應該還是在明年下半年才會起來。因為現在整個模型的架構還不是很清楚,對數據的探索,其實還在通過樣本數據或者是小批量數據去試驗的階段。大家雖然嘴上說collect data In-the-wild,但其實并沒有要那么多的數據,大部分數據應該還是出自于數采工廠。

      我覺得collect data In-the-wild 肯定是要做的,但是這樣對于數采設備會提出更高的要求。舉個例子,我們便攜版本和全功能版本之間的區別就是,便攜版本沒有激光。因為激光沒有辦法在野外進行采集,它不可能隨時隨地給你提供一個電源和基站,并且激光可能還會受強光、紅外線等等的影響,還有遮擋之類的各種情況,其實就相當于有些設備In-the-wild是完全不能用的,所以怎么去設計一個數采設備是重中之重,這是第一步。

      第二步是,我覺得野外采集并沒有想象中那么簡單,不是說你隨便雇一個工人,他拿著設備亂采,這個數據就能用了。我們對于數據質量的要求始終是很高的,如果數據量非常非常大的話,可能數據質量臟一點也無所謂,但是如果你的數據量還沒有達到一定級別,其實數據質量要比數據數量重要得多得多。所以怎么在In-the-wild這個過程中保證數據的質量,怎么培訓這些工人,其實也不是那么簡單的。

      像美團或餓了么,他們有大量的場景和普通的工人,但我覺得他們并不能在一開始就作為主力軍去采集數據,至少在很長一段時間里是不可能的。前期階段應該還是以一些比較well train的,有很多采集技巧的工人,拿著這個合格的數采設備在野外進行采集為主。

      王建明:我還有最后兩個問題。剛才也提到,除了工廠的數據采集,In-the-wild的數據采集,其實還有一種是有模型能力并且解決場景問題的公司,自己去做數據采集。舉個例子來說,主機廠自己有數據處理能力和模型能力,我感覺這一類公司確實也有趨勢,最近一段時間有可能是受北美一些公司的影響,他們可能在解決場景的問題的過程中同時積累數據和模型,把自己的小飛輪滾起來。一個一個場景解決了之后,就由小飛輪變成大飛輪。那你們覺得在這個過程中,這類公司會不會更容易積累數據?這些數據跟數據公司沒有什么關系,這會讓你們覺得很擔憂嗎?

      戴若犁:我覺得這是一個很好的期待,但很大的問題就是,是不是真的能夠落地。我親身經歷了好幾個很大的革命,比如說自動駕駛、大語言模型, AR、VR。坦白來說,具身智能現在每年是 200 億美元、300 億美元的錢撒到這個行業,但是如果跟之前的AR、VR、大語言模型和自動駕駛相比,百億級別的錢進到這個行業的時候,那三個行業的成熟度比現在具身智能的成熟度要高非常非常多。大家想想看,百億規模的錢進到 VR 行業的時候,Oculus已經可以做成一個350美元的設備賣給你,你回家可以玩過山車了,但現在是沒有這樣的機器人的。然后自動駕駛,07年的時候,美國的DARPA挑戰賽就有六支隊伍可以完全無人干預地完成幾十英里的自動駕駛,那是18 年以前。

      所以具身智能現在的狀態,其實我覺得很奇怪。建明也是投資人,為什么你們入場會這么早?投資都投到大學教授里面去了。這其實是很奇怪的一件事情,我是高度懷疑,包括國內的一些公司,真的能夠進到人類的家庭,讓小飛輪轉起來嗎?我特別希望可以,但是我不信。

      佟顯喬:我的觀點也是。舉個例子,從最早的深度學習去做感知,到后來感知的范式變成了BEV,再到后來的端到端、VLA,其實具身就是處在一個非常早期的階段,最后是什么樣?很難說。像你說的一些垂直領域的機器人,可能它們干的活相對比較簡單。比如到車廠里邊去擰螺絲,訓一個這樣的小模型。也許以今天的能力,他們自己采數據就能解決,但這可能也不是具身機器人的最終追求。到底是哪條路能先來?這個事其實很難判斷,但我們肯定都是沖著那個最大的,或者是終極階段去的。從數據的角度來說,不管你是垂直領域還是通用領域,你采的數據,你需要的東西和訓的模型結構其實還是那些。現在這個早期階段,大家也只能follow著正確的方向走,我覺得很難判斷最后哪個能成。

      丁琰:其實我是很羨慕和佩服那些公司的。比如說剛剛提到一個例子是Dyna,我們公司肯定沒有他們那種資源,他們是可以完成一個數據采集、數據訓練,反哺反饋,然后再落地的整個閉環,有點像一個獨立的王國在運行這件事。他們的know-how和insight的積累速度是非常快的。

      絕大部分公司不能比擬這個過程。但是他們也會有一個小問題,就是除非資源非常多才能把整套邏輯和這個王國搭建起來,不然資源太分散的話可能搞不定。比如有些公司可能把90%資源全部投來訓模型,但如果每個環節都想做,你又想采數據,又想訓模型,又想去真機部署,那你得花費很多的資源去布置每一個陣地,這是很累的。他們如果能守得住,那肯定是最好,但數據公司的一個缺陷就是,他對于模型的理解肯定沒有別的公司強,如果你不是大量地訓模型,這個know-how和insight總歸還是會比模型公司少。

      但是他還有個活下去的路徑。比如你做一個疊衣服的任務,那個know-how和insight 是針對于疊衣服這個任務本身而言的。但是對于其它任務,比如系鞋帶,這個know-how就沒有了。他不可能把所有的場景、所有的小任務、小場景全給搞定,他不可能有那么大的know-how。

      但是做數據的公司就會有一條活路,這是我突然想出來的。我們是不是可以在和不同客戶打交道地過程中,有些客戶是疊衣服的,有些客戶是系鞋帶的,有些客戶是做飯的,幫助他們去獲取know-how。他們自己可能也沒有那么多資源,所以我們聯合起來,做數據的公司和做模型的公司拼在一起,就可以把每個小場景做閉環。這可能也是一個數據公司活下來的一個途徑之一

      王建明:最后一個問題。各位可以說說在機器人這個行業,個人的vision、你們創辦公司的vision,以及你們覺得大概到什么時間點,這個vision是可以夠得著的嗎?

      戴若犁:我們公司的slogan叫做 we don' t make robots,we make them Intelligent。我們這個機器人公司不造機器人,我最大的期待,也不是vision,就是期待真的造機器人的那些杰出的企業和人,他們能活得好,他們能夠融到大錢,做大生意,這樣我們好好地做個配角就行了。

      佟顯喬:我說一下我的vision。為什么做具身數據這個行業,我覺得從數據切入是在這個不確定的行業里邊,最確定性的一件事情。今天這個行業還在早期階段,最后是什么樣?long way to go。可能十年,可能20年,在這個過程中,我覺得數據是唯一確定的事情,而且數據積累的know-how,實際就是模型積累的。所以為什么我和深圳AIRS一起去做這件事情?也是因為覺得,從數據的角度切入,去follow最先進的方向,做具身智能這件事,是一個長期偏確定性的創業機會。

      丁琰:機器人的場景非常非常多,我們鹿明就希望守住自己這一塊地,在這一塊地里做到top1的級別。我們自己在做 UMI數據的時候,目前來說還是最快的一家,我們想守住自己的陣地,把各種東西探明白、搞清楚,然后服務大家。我們的理解是, UMI這塊還有好多問題沒有解決,甚至沒幾家能夠把它真正用起來,還有比較長的路要走。另外從在工廠里采到在野外采數據,又是另外一個跨越。在工廠里采,采完下一步其實就到要實現落地的階段了,這可能還是一個比較長的過程,要在兩到三年之內完成,這是我個人和公司的愿景。

      王建明:謝謝各位嘉賓,那么數據環節的探討就先到這里。

      雷峰網文章


      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      分享:
      相關文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 91在线网址| 少妇被粗大的猛进69视频| 99亚洲精品| 日本在线亚洲| 亚洲成av人片在www鸭子| 精品国产免费一区二区三区香蕉| 亚洲无码丝袜| 97人妻白浆| 国产精品亚洲综合久久小说| 大伊香蕉精品二区视频在线| 麻豆精品久久久久久久99蜜桃| 滨海县| 人妻无码中文字幕免费视频蜜桃| 亚洲男女视频| 国产成人99| 人妻少妇精品系列一区二区| 亚洲av永久无码精品九九| 无套内射蜜桃小视频| 九九热久久只有精品2| 久久亚洲私人国产精品| 岛国无码av| 99这里有精品视频| 精品国产午夜福利在线观看| 激情内射人妻一区二区| 亚洲精品一区二区三区新线路 | 国产偷久久久精品专区| 亚洲色最新高清AV网站| 国产av一区二区久久蜜臀| 秋霞无码久久久精品| 国产精品香蕉在线| 国产精品国三级国产av| 无码成人午夜在线观看| 六月婷婷久香在线视频| 久久精品中文字幕第一页| 丰满多毛的大隂户视频| 东丰县| 真人作爱90分钟免费看视频| 嘉峪关市| 被灌满精子的波多野结衣| av不卡在线观看| 国产97色在线 | 免费|