1
| 本文作者: 周翔 | 2017-05-22 00:30 |
雷鋒網按:5月20日,由中國計算機學會(CCF)主辦、Xtecher協辦的2017 CCF青年精英大會在北京國家會議中心舉行。中國工程院院士趙沁平、香港中文大學教授湯曉鷗、百度創始七劍客之一雷鳴等圍繞“科研·產業·融合”這個主題做了一些分享。其中,百度創始七劍客之一、酷我音樂創始人、北京大學人工智能創新中心主任、國家特聘專家雷鳴做了主題為《AI時代,科研如何創造產業價值?》的演講。
雷鳴表示,AI時代,科研人員不僅要做基礎研究,還要把研究與產業結合,加速落地,提高研究成果的轉化率。此外,他還對AI領域的創業公司給出了一些建議。在他看來,雖然大公司們掌握了足夠多的數據,但是創業公司依然有機會,特別是在醫療、交通、農業、制造業等領域。

以下根據演講實錄整理,雷鋒網做了不改變原意的刪減:
很高興,今天能夠跟大家分享一下我對人工智能時代科研如何跟產業結合的一些想法。我本人關注人工智能產業大概有四年之久。幾年前我和百度的創始人以及谷歌的高層有過溝通,大家認為這個方向發展前景很好,后來在這一方面投入了不少的時間,做了一些孵化、投資、研究,中間有不少想法,在此跟大家做一個分享。
首先講人工智能對人類影響多大。大家都知道霍金,去年劍橋大學的人工智能中心成立的時候,霍金講了一句話,“人工智能的產生可能是人類歷史上最重大的事情。”科學家說話都不愿意說得太滿,他既然說到最高級,那就表示他認為人工智能是非常重要的。他對人工智能有很強的個人看法。
加州大學的Gregory Clork教授研究了人類一千年來的收入水平,到公元1820年為止,幾乎過去兩千多年,人類的勞動生產率基本沒有什么變化。工業革命之后出現了非常完美的指數曲線,今天我們看這個會議室所有的東西,我們自己穿的用的吃的,基本上所有東西都是過去兩百年前的產物,甚至是過去幾十年。
因為科技不斷進步,淘汰了很老的蒸汽機,現在都是最新電子電氣化設備,社會發展得很快。工業革命在這里給我們演繹了一個完美的拐點,從這兒我們再想:為什么工業革命會使人類有一個突變性的變化?這一點值得我們深思,如果我們找了這個東西,我們就會知道是什么在影響人類的發展。

舉一個簡單的例子,從農業社會到工業社會,勞動生產率的客觀數據就是以收割為例,農業社會一天一畝,工業社會一天一百畝,這是一百倍勞動力的提升。為什么會有這個提升?因為有了收割機,而收割機只是一個事情,但并不是因為收割機而產生勞動生產力。
收割機分為設計、創新、生產、銷售使用等一些環節,哪一個環節是最重要的,是整個價值鏈的起源?顯然就是創新。誰第一個把收割機設計出來了,這才是推動社會勞動生產力的根源。包括我們剛才看到的,現在收割機一天一百畝,如果說誰通過創新把它變成一天兩百畝,在勞動生產率這項任務上又提升了一倍,也就是說,我們認為社會的快速發展來源于創新,來源于不斷創造出這個世界上不存在的東西,而這個東西恰好對社會的發展起到推動作用。
大量有效的創新在推動著社會的發展,第一個造出電腦,第一個發明算法,第一個做了O2O等等,創新不僅僅是科技,也包括了我們剛才講的商業模式。所以創新是推動社會發展的根源,工業革命之所以能夠拉出一個完美的曲線,就是因為工業革命使得更多人開始參與創新。

工業革命之前是農業社會,農業社會、工業社會,現在要進入智能社會,或者說是信息社會。農業社會很重要的體力勞動者占社會的90%,他們基本上是農民;技能勞動者占社會總人口的個位數,這些人就是我們平常所說的鐵匠、磨坊等等;手工業者和管理人員,創新勞動占1%,比如發明新事物(四大發明)的人等等。
但是過去發明創造更多是偶然事件產生的,工業社會之前很少有一個機構專門負責研究、創造。而進入工業社會后,工業革命產生能源和機械。這兩個因素做了什么事情?其將體力勞動完全從社會舞臺上抹掉了,所有的農民不能從事以前的工作了,進而改變整個社會結構,改變技能勞動。
工業革命也是現在教育的起源,在這兒開會的都是大學教授、研究者,都是現代教育的一份子。現代教育為什么往這兒走,就是因為在農業社會里面我們更多依賴生物能量,即體力。工業社會靠技能,技能和體力不等價,技能是需要培育的。現在來看,技能勞動占社會90%以上,另外一部分也把很多人逼向創新勞動,有明確的機構做創新,比如大企業里邊的研究院,比如我們所說的學校,咱們中科院的各種研究機構、研究中心,經費支持也很多,所以大量的資源、人力、物力、財力涌向創新,使得創新推動社會迅速進步。
智能到底會做什么事情?大家說數據等價于過去的能源,這個比較對不對?在與很多專家及企業家都聊過后,我們覺得也對也不對。對在哪兒呢?數據確實與過去的能源有相像之處,沒有數據,算法根本轉不起來。那么不對在哪兒呢,就是其中一個屬性很不一樣。能源是標準化產品,是可流動的,你去國際原油市場按照標準的價格一定能買來相應的石油,是可購買標準化的產品。但是我們今天發現數據私有化非常嚴重,雖然我們也在推動所謂的數據交易平臺,但是大量的數據,由于各種原因是私有的,比如微信數據,除了騰訊可訪問之外,我相信任何其他一家公司很難訪問到,還有一家可訪問的是政府。這樣的話,數據的私有化在這一波里面是很有意思的事情,大家創新很多都需要顧及到這一點。
智能革命到底改變什么?其實智能革命會不斷的替代技能勞動者,我們可以看到掃地機器人,下一步的人臉識別會把安防領域保安以及檢票員替代,自動駕駛會把司機替代。不斷往前推動,進而把人類逼向創新勞動。在座大部分都是創新勞動,在研究各種新算法,新的東西,所謂的技能勞動更像你經過了一個培訓學習之后,然后有相對標準化的方法對社會提供一個服務。創新勞動的人的數量提升之后,可以預計社會進步還會再加速。將來還有一條曲線更快,會迅速走上去。
未來20年,人工智能的發展會如何?未來總是不可預期的,我們只能大概的看一看,去想一想。所說的有可能都是錯的,但我們還是盡量地想去透見未來的星星點點。全球前五大市值公司跟互聯網、或者軟件有關的公司,也可以做某種預期。
我們認為20年前前五的公司都是和人工智能有關的公司,人工智能的公司正在快速改變世界,互聯網到現在不過20年的時間,很多人認為去年或者今年是人工智能的元年,最多推到前年,這樣的話,未來20年將會翻天覆地。

這里面其實有幾個特別有意思的事情,我們看這個圖,首先是這里沒有百年老店,愿意讀書的人,尤其讀管理學的,有一定年紀的人一定看過一本書叫做《基業常青》。這本書非常火,后來這本書出版以后5-10年,《基業常青》里的公司有一半就不常青了,大家覺得很困惑,總結出來的規律到底有沒有用?后來寫了叫做《從優秀到卓越》。看這個圖會發現一個很有意思的點,這五家公司歷史最長的是微軟,1975年建立到現在為止不過40年的時間,蘋果和微軟是40年的公司,另外三家是20年的公司。我們因此得到一個東西,不存在永久的偉大公司。第二,偉大公司在一個偉大的時代,做了一件非常重要的對于人類有貢獻的事情。所以人工智能正處在一個風口,這里面將來會涌現出很多重要的公司,會改變這個世界和人類。
實現路徑,人工智能怎樣影響這個社會,大體上總結有幾點:
第一,未來20年還是弱人工智能時代。很多人一談就談到了什么天網滅掉人類,跟人類競爭,這個東西還比較遠,我們都是搞科技的,那是幾十年以后我們再說的事情。
第二,低技能到高技能,這個技能人學的時間越短,機器學相應復雜度低一點的。最普遍的機器人就是掃地機器人,因為掃地這個技能比較容易,還有停車場的收費現在也在變化,我記得這是最近兩年的事情,以前每次都要取個卡,現在你的車直接開過去,攝像頭拍一下就過去了。這個就是低技能到高技能,高數據化向高技能,互聯網有關的數據走得早一點。現在金融走得不錯,歷史上這些產業上積累了很多的數據,因此大量的數據就容易學習。但是有一些行業比較累,比如說自動駕駛,谷歌等各個企業其實現在都在攢大量的數據,包括農業、工業也是數據量嚴重不足,醫療數據量很大,但是質量嚴重不足。這些都面臨著一些問題。不管通過創業公司或者大公司,當這些行業從零開始攢數據或者清洗數據,等到數據量足夠的時候,相應的智能也會慢慢發展起來。

智能駕駛領域基本上來看,5年左右應該有可以商業化的車。很多時候我們開玩笑,或許20年以后人在路上開車都是違法了,因為自動駕駛,通過車聯網它們之間可以有非常好的交流溝通,人跟它們反而很難溝通,所以人其實有一個很大的問題,從生物學上來講,就是我們看到了事情,然后轉化為腦子處理,再轉化為行動,這之間有一個0.1-0.2秒的延遲,如果車上的高速傳感器高速運轉,比這個高效多了,互相之間可以同步做很多的事情,使得效率大幅度的提升。
機器人我們看到有挺多的,掃地機器人賣得不錯,我跟國內很多家企業都討論過這個問題,包括百度、華為、聯想都在想人工智能到底怎么起來。亞馬遜并不是人工智能見長的公司,但其智能音箱全球銷量超過一千萬臺,正在逐步建立自己的生態,變成一個新的所謂互聯網入口,這些都值得思考。很多人都認為這是一個對話系統,但它是其實更像是一個萬能系統。一開始只解決狹窄領域的問題,現在逐漸往上面加東西。

工業制造,現在這一塊也是發展得非常快,比如特斯拉工廠就實現了所謂無人化,無人不是沒有人,而是沒有流水線的工人,只有工程師盯著整個系統的運轉。

醫療,大家也知道了,今年開始或者去年年底,陸續有過幾篇文章,在醫學影像、疾病預測等等方向上取得一些突破,逐漸在一些狹窄領域上、一兩個點上達到或者超過了人類醫生的水平。
整個螞蟻金服估值非常高,在全球獨角獸排第一的公司,它的核心就是阿里積攢了大量的交易數據,進行分析之后做出來很多模型,用到金融上。對于信用和貸款這一塊,我們更相信它會變成產業鏈或者行業金融的形式,誰擁有這個行業的數據比較多?進而產生一個衍生品,有數據對借貸者進行準確評估、風險控制,因此就可以更準確、更敢于把錢借給他,保證他能還。如果說從外面弄,沒有這些基礎數據,難度會非常大。所以很多人說現在Kensho(雷鋒網注:美國金融大數據公司)很火,想想它未來在哪兒,誰有競爭優勢。
有些人說創業是過程,中間熱一段,只有未來能夠站得住腳的假設,才能真正走下去。
大公司和創業公司。現在創業蠻多的,我知道現在很多人,尤其很多院校的一些教授、博士參與或者說已經出去創業了。我相信未來的五年、十年,還會有很多這樣的現象。因為我們有非常深厚的技術積累,用到產業上,一旦找到一個好的點就真的能夠突破了。
這里面去創業到底有什么風險,大概幾年前很多公司的高層都在聊,人工智能這波創業,創業公司有沒有機會?是不是就是大公司的菜?BAT有錢有人有數據,怎么辦?
我們看一下這大論據,第一叫人才很貴,招人很貴。在座的人更多有兩個想法,第一個是說我管這個部門,我管這個系,這個學院,我下面的老師被挖的差不多了,還有一堆人正在被搶怎么辦?還有一種想法,我正在被挖,我到底該留下來還是該走?現在很多的一些博士剛剛畢業,美國的話有一些好學校,做得非常好的博士一畢業薪酬往百萬美金沖,國內上百萬人民幣的也有一些,這個行業是真的非常熱。你說一個創業公司招不起人怎么辦?
數據剛才也講了,BAT真的有很多數據,他們天天都在搜集數據,處理數據,分析數據。我們作為一個創業公司沒有數據怎么辦?怎么跟BAT相比?
機器,大公司有機器,小公司有夢想。你可以融資,挑戰就是機遇,你被逼到死角要找。我特別欣賞北大的師兄俞敏洪,絕望中尋找希望。這個創業事情永遠都是九死一生,如果你只是看到困難就不要做了。
在這種高壓下,有沒有機會?
從人才方面講,最優秀的人才是愿意打工還是愿意自己干?大家心里其實比較明白。最近我們看到了很多創業公司,都是從BAT、谷歌、臉書、微軟跳出來的,有一定成就的人做的。他們更愿意追求自己的理想。有時候在大企業他會遇到很多限制、機會的問題,所以很多的創業者覺得優秀人愿意出來創業。
不能把數據狹窄化,認為互聯網數據就是這個世界上僅有的數據。其實我們要知道現在互聯網僅僅是有一些產業的數據,比如說阿里是零售業的數據,百度是信息服務業的數據,騰訊是人的交流和溝通的數據,但是比如說醫療數據,交通運輸物流的數據,農業數據,制造業數據,法律數據,很多行業的數據他們都沒有,因此這些行業都有很多機會可以做。
機器,最近大家都知道,人工智能公司還是很能融錢的。我剛才跟他們聊,他們以前投的公司最近剛剛拿了三個多億的融資,一旦有未來的話,很多VC真的給你錢,你燒起錢來比大企業膽量還大。你還記得O2O的時候,可以燒到百度跟阿里發顫,創業公司還拼命燒,沒有上市,就沒有股東,所有股民的股東。投資者只要看遠期,他是支持你燒的,但是作為大企業,你的利潤突然有一個劇烈的下降,你很難跟股民解釋。所以這個里面有時候不好說,創業上還是有機會的。
怎樣做產業需要的科研呢?大家對這個問題蠻感興趣的,我自己也做很多的事情。我在北京大學人工智能創新中心當主任。我們主要想做的事情,就是學校、科研機構擁有最好的技術,怎么樣能夠落地呢?
我特別關注AI+產業,包括北大也開了一門課,我發現因為AI很火,學校選修的學生很多,400多名研究生選了這門公選課。因為教室的原因,最后錄了兩百人。人工智能是大家熱切關注的領域,那么怎樣做一個有用的研究呢?
我簡單分享一下個人的想法。我從網上獲得的數據顯示(這個數據不保證完全正確),中國的研究成果轉化率:發改委副主任說是10%,歐美是40%,當然我也不知道這個歐美40%是不是真實的,但是總體來講中國確實不高,做了這么多研究真正能夠落地的多嗎?
我們再看一個事情,科研和產業真的能夠聯合起來做成一些事情嗎?其實不一定。
先說不同點,首先科研追求學術價值,產業追求生活中的需要。什么是學術價值?在一個地方做到世界最領先這是學術價值。但是產業不是這樣,他說我解決一個問題,能解決問題就行了,不需要最先進的技術。比如:掃地機器人,也是人工智能,但是并沒有太多人工智能,就是路徑規劃加一些硬件,然后做得比較好。
解決實際的問題和高大上的、做最火的東西之間確實有一些不匹配的點。另外我認為有一點特別重要,科研是單點突破,產業則需要完整的產品或服務。學術在一個點上精益求精,很多人參與創業或者在一些公司做顧問,你就會知道如果做產業的話,其實我不關注你那個刷的榜,把這個攝像頭安在海關上,能夠給我抓一個罪犯,這個人到底是不是假證,能不能認出來這是我最關注的事情,同時要給我一個完整的解決方案,這個不能宕機,要保證穩定性,是個完整的東西不是一個某一個點。
科研為了做一個事情不惜代價,但是產業不可以。舉一個例子,大家做量子研究,需要非常高的投入,但是產業絕對不可以這樣,產業要以買得起來衡量。舉個例子,比如說谷歌的眼鏡,感覺蠻酷的,但是這個東西很重,我記得在美國賣的時候大概是一兩千美金,完全不是老百姓可以買的,因此這個東西很難落地。例如,像汽車也是非常貴的,所以必須要降到一個可接受的范圍。比如做一個特別好的手機,一個手機賣兩萬我敢保證不一定賣得很好,但是賣四千我覺得你可以把蘋果干掉了。
科研是不斷進步的,但是產業的要求是能不能用,好不好用。比如說人臉識別,錯誤率從8%-7%,每一步進步在科研上都是重要的,都是全球最好的。但是產業根本不管,產業說我雇了一個人,假如說人的錯誤率是3%,你達不到3%對于我來說沒有用,你一旦超過3%立刻就有用了。
研究的時候完全可以從真實需求中探求課題,做人臉識別挺好,不要做狗臉識別。完整服務的這一塊確實很難服務。我們需要找關鍵的部分,比如說用來抓壞人,這個人臉怎么識別,你把這個解決了,再配一些其他技術就可以賣錢了。研究的時候看這個東西成本是否是可控的,保證良好的性價比。
我并不否認做基礎研究,大家一定要注意,確實需要很多人做一些基礎的研究。大家需要有一個長遠的思路,有些人更愿意跟產業結合,用這些東西好好想想,選擇研究課題的時候確實落地起來更容易一些。
魚和熊掌可不可兼得?你選擇理論物理學咱們就先別想它能不能用,產業研究就想怎么樣落地。科研+產業型研究可不可以?這項東西很高大上,但是接近產業化了。AI時代,科研產業化有什么特點?什么樣的研究特別有價值?
第一,AI做的東西快要接近或者超過人了,這一般都是非常有價值的,一旦超過人,它的產業價值立刻就可以出來了。第二,有足夠的數據。不要做一個BAT有足夠數據的東西,你沒有數據真的很難打,但是跟醫療機構合作,跟教育機構合作,有數據可不可以,這非常好,BAT跟他們合作相對更難。因為傳統產業在過去很長時間老被顛覆,它都快狂掉了,這個時候BAT再找他合作,他們的第一想法就是“黃鼠狼跟雞拜年”。然而小企業合作起來更順暢,你可以跟他一起共贏,但是我們也不知道最后能否共贏,那是一個未知數,但是起碼開始進得去。
關于創業我有幾個建議:
第一,找到需求。創業團隊在介紹自己技術的時候,常說自己的技術可以應用在很多行業,例如教育、安放、工業等都可以用這個,但就是沒用。因為技術不落到一個實際場景上,不能解決實際問題就是沒有用,所以我們要迅速找到你的需求。
第二,找到產品化的團隊。一個技術能用到、實用有很大的距離,光靠科學家完全不行,要找到工程團隊。
第四,要找到商業化的團隊。
第五,調整到產業態度。我知道很多創業公司在那兒刷榜,其實刷榜已經少了。刷榜沒有什么太大用處,一個技術發展到一定程度,大家差得不多,但是實際的應用環境下的話,你結合不好反而差得特別多,所以一定要調整到產業態度:我解決實際問題解決得好不好,我讓產業人評價而不是搞技術的人評價。
最后,找到商業模式,現在很多VC最后一個問的很多,你怎么樣賺錢你跟我講清楚,你有技術別人也有,現在的技術不太稀缺了,不像兩年前你說我做AI,別人說你很有名我就研究。大型科技公司已經占領的領域確實有挑戰,但是有沒有機會?也有機會,不過難一點。這個世界沒有任何是必然的,只是概率問題。
下面這些領域我覺得很有機會,比如說企業服務,以前叫BI換成新BI,客服機器人,幫企業找到他的客戶,還有輿情監控等等一些東西。醫療健康,包括家庭機器人,掃地機器人,助理,自動駕駛,包括法律、審計這些,其實都是有機會的。
每一個產業都有很大的市場,比如醫療領域,占中國GDP的6%,美國18%,在每個都比整個互聯網產業還要大的產業里,當然有機會。比如駕駛,基本上也是在中國10%以上的GDP的產業。我指的較物流運輸業,整個加起來非常大,機會非常多。
其實我們在一個非常令人振奮和激動人心的年代,AI的技術已經到了一個突破口,因此這些技術會不斷應用在各行各業里面,大幅度提升這些行業的效率,解決實際的問題,進而使得行業有深遠的發展。我相信未來20年一定會比過去2年更加精彩,機會更多,無論大家搞研究或者搞產業,只要在這個領域里面,我相信,能夠為社會做的價值、機會,比以前還要多。
謝謝大家。
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。