1
| 本文作者: 張馳 | 2017-02-22 17:26 |

雷鋒網消息,2月21日下午,還未上市的搜狗在北京舉辦了一場財報媒體溝通會。在會上,這位CEO保持了他一貫敢講敢說的風格,除了介紹公司過去所做的事,以及對人工智能和業務方向的理解,還對其他公司作了近乎不留情面的點評。
雷鋒網了解到,在王小川看來,以搜索起家的搜狗本身就是一家AI公司,不存在轉型的說法。“中國現在有兩家是在AI上最努力做報道的自媒體,其中一家問,搜狗要轉型做AI了,我聽了一肚子火。因為搜索其實就是AI,它就是讓機器像人一樣去思考,搜索引擎變得很聰明,能夠幫我們選擇出更好的頁面來。”
他認為,AI里面最難的地方是人的思想和知識的學習,不僅是圖像的識別,語音的識別,因為人的難點也在于知識的理解和推理能力。而搜狗在AI場景里細的分類,是在自然語言里,這是人工智能最難的一塊。公司將通過語言將搜索升級到對話系統、問答系統以及翻譯系統,這是他們核心能力的三部分。
那在AI領域,搜狗做得怎么樣了呢?王小川認為,如果論排名的話,搜狗搜索在國內排名第二,AI方面應該在前三的位置。
不過面對一些世界級公司,他還是比較謹慎,稱“我們沒有Google或者DeepMind那種能力里面,屬于開創出新的算法出來,但基于上面的算法去改良的能力是足夠的。”
百度同樣是一家搜索公司,也同樣將AI放到了核心地點,所以兩家公司的對比也是王小川繞不開的話題。談到百度,他表示,“2015年,我們發布了微信搜索和知乎搜索;2016年,我們發布了明醫搜索和英文搜索,慢慢開始和百度走向不同的道路。”
他說到,“我認為百度是沒戰略的公司。”在醫療上,他則說到,“ 我會認為百度會變得更難,因為百度現在畢竟市場份額大,他會把廣告模式轉成免費為用戶提供多種咨詢的模式,收入會下滑”。
不過王小川對百度新上任的COO陸奇十分尊重,稱陸奇有兩個很大的優點,“一是技術理想主義,和他聊天能看到他一談到新的算法就兩眼放光,半夜兩三點去讀論文,是個很好的技術人。二是也不官僚,跟他談東西,也不會擺在全球華人最高職位上,而是非常平易和我們去談的。”
對于無人駕駛,王小川認為有兩個事,一個是無人駕駛里的輔助系統、導航系統;但開車目前還無法完全實現。他表示,在車載這塊,搜狗會在里面做一些東西,但不是無人駕駛這個事情,“開車這事兒不是搜索公司該干的”,公司會聚焦在“自然交互和實時計算,導航在這個范圍里”。
或許上面就是他認為百度沒有戰略的原因。
對另一家AI公司科大訊飛,王小川顯得“仁慈”得多。
他認為,科大訊飛是to B的公司,基因是做企業的事情;搜狗是做toC的公司,是和消費者、網民能產生一種連接,基礎的技術競爭力方向是不一樣的。
不過在競爭性的產品上,“貶”一下也是不可避免的。
“目前語音識別里,用戶使用量最大的是搜狗,遠遠大于科大訊飛,在輸入法里已經用到了。做技術現在需要兩件事兒,一是有數據,二是有研發AI的能力。數據能力上,我們是有優勢的,研發能力我覺得搜狗也沒有弱的地方。從應用場景到數據積累、技術能力,我自己評估一下我們都占優勢的位置。”
在語音加翻譯上,他表示“和訊飛的比較里已經不是關鍵問題,我們現在明確和兩家公司作對比,一家百度,一家Google,我們有信心比他們要好,直接線上能看的。無論是語音識別還是在線的翻譯,我們都比他們好。”
以下是雷鋒網得到的溝通會王小川自述部分,全文請看這里。
挺高興有機會和大家面對面談,有段時間我們和媒體沒有親密的接受任何一個這樣的訪問。回顧從2013年到2016年,13年搜狗與搜搜合并,到現在已經三年的時間。
我第一個感慨是,搜狗搜索活下來了,2013年合并時,360的一些言論,說中國搜索市場只能容納兩家,沒有第三家的事情,表達第二家是他,現在看起來,在中國百度依然還是很大,此外搜狗是唯一一家既有PC搜索也有無線搜索,市場份額、收入利潤在上升的公司。這也是我們活下來,而且不斷地有更多競爭力的原因。2016年利潤是6.4億人民幣,其中投入到很多領域去,在搜索行業算是活下來的。
具體看量,我們可以號稱叫全球第三大搜索引擎,雖然只做中國市場,因為Google最大,百度第二,我們第三,從搜索量排是在第四,后面才是其他家引擎,想說量上中國市場是最大的,在國內第二,在全球排第三的位置。2015年,我們發布了微信搜索和知乎搜索,2016年,我們發布了明醫搜索和英文搜索,慢慢開始和百度走向不同的道路。大家用微信會用一些。我認為,醫療搜索和英文搜索是通向未來兩個很重要,可以展開無限想象力的事情,通過微信搜索和知乎搜索基本固定了形態,在醫療往下出現自助診斷甚至分診,能夠讓用戶真正明明白白看醫生。現在大家拿著化驗單可能不知道什么意思,給你個診斷方向你不知道怎么辦,或者發生頭痛感冒不知道怎么辦。這是借助大數據下,在AI分析里逐步走向輔助醫生或者讓用戶和醫生之間建立更多信任的工具。我們知道,國內之前有很多做醫療的創業公司,基本覺得把這個市場做壞了,把醫院醫生搞得很疲憊,因為大多數邏輯,是希望醫生脫離醫院出來在線做診斷,他要形成對用戶的吸引力,也要建立后面的商業模式,這是原來的一點。
但是我們沒有這個需求,因為我們本身有用戶,用戶需要解決診斷的問題。我看到一些醫療機構,大部分來講,上不接用戶,下不接醫院,就是醫院不是他的,用戶也不是他的,在中間是沒有競爭力,他想把醫院拉到自己這邊,吸引用戶,醫生是沒有辦法獨立于醫院的,這是之前創業者出現的問題。但是我們有用戶,我們代表用戶找到醫院,找到醫生,這樣的模式能夠真正有機會成立。而且我們在醫療上也沒有創業公司賺錢的壓力,因為對我們而言,只要用戶認可搜狗搜索,有足夠大的搜索量,搜狗搜索有良好的商業模式,只要量大,給用戶搜索產品就行了,而其他創業公司會面臨壓力,第一是沒用戶,第二是基于資本壓力創造賺錢的模式,這也使得搜索引擎公司在醫療服務里能找到自己更好的位置。
我會認為百度會變得更難,因為百度現在畢竟市場份額大,他會把廣告模式轉成免費為用戶提供多種咨詢的模式,收入會下滑,我們沒有這方面的壓力,這是關于醫療上的思考。
另外,我們從英文搜索走向海外搜索,這周內我們會有兩個升級,一是英文搜索升級成海外搜索,最后搜索的結果也是用中文呈現,以前我們大家談到的事情是,去年有幾十個院士跑去給習近平寫聯名信,希望能對谷歌網開一面,如果科技工作人員不能用谷歌搜索海外科技信息,中國和世界是脫節的,國內的科技發展就會受制約,我們可以不看國外的美劇、韓劇,但在國外科技、信息層面不能落后。但我認為不夠,即便開放的Google,但大部分人是用中文的,而世界上非常多有益的信息,包括醫療信息、科技信息,甚至大家言論上的討論都發生在英語世界里。
在這種情況下,把英文變成中文以后,我相信,98%的中國人才能更好享受全球的內容,因為我們最強的是語言部分。正好這個時代到了,去年在AI爆發一年到年底時,翻譯技術是突飛猛進的,比原來的翻譯有快速的發展,就像語音和圖像突破,翻譯技術突破了。因此,我們有機會把翻譯和搜索做一個聯動,因此我們說搜索全世界。一個中文輸進去我們現在開始搜索的是全球的英文,然后我們未來考慮把全球的日文或其他文字的信息都搜索到,這樣會構成一個獨有的競爭力,這是Google并不care的東西,因為英文是他們的母語。這種情況下,在翻譯上更多是秀研究的肌肉,Google秀8國語言的互譯,秀的是如果沒有語料,沒有中文到德文的,只有中文到英文,英文到德文,我是不是能做中文到德文的翻譯,他們是在做這樣的事情,和我們的目標不一樣。我們是實實在在希望通過翻譯技術把搜索做得更好,海外搜索也會成為搜索競爭中的差異化。
第一次從微信內容開始,我們開始和百度不一樣,開始有了知乎、明醫和海外,這周升級完之后就可以完全用中文完全瀏覽世界的網頁,不僅是搜索的詞用中文搜索,結果也用中文呈現,點出去的鏈接也全用中文來看,在一些場景里應用也更加方便。我們內心對這個事情有蠻高的理想,先不說賺錢的問題,因為地球上中國人是最多的,但是我們很不幸,在200年來發生的變化,英語成為世界主要溝通的語言。這么大的人群和世界主要語言有隔閡,使得用中文搜索世界,我認為,對中國整個大的復興、成為世界主旋律的一部分是有歷史意義的,我們內部叫重寫《通天塔》的故事。《通天塔》就是講語言不通,使得各個國家的人沒法聯合起來做事情,語言通暢了之后會帶來一個新文明,就像發明火、發明電一樣,所以我們2016年在搜索做了很多的工作,從AI也是武裝到牙齒。
去年有個很著名的AI媒體負責人跟我聊,中國現在有兩家是在AI上最努力做報道的自媒體,其中一家問,搜狗要轉型做AI了,我聽了一肚子火。因為搜索其實就是AI,它就是讓機器像人一樣去思考,搜索引擎變得很聰明,能夠幫我們選擇出更好的頁面來。陸奇剛剛去百度,放出一句話,說搜索是AI最好的場景,搜索和AI是天生在一塊兒的。今天在做AI的很多公司,大規模做機器學習、深度學習方面,人才方面也都是找搜索公司去要人。因為有了深度學習之后,會使得搜索場景有更好的武器來滿足,甚至升級這樣的能力,而我們內部的員工大部分受過正統的訓練,怎么用這種數據和方法,大家都知道怎么讀論文去提升,我們沒有Google或者DeepMind那種能力里面,屬于開創出新的算法出來,但基于上面的算法去改良的能力是足夠的。
AI里,我們在翻譯里面是往前在走,輸入法之前也是很容易地開始做語音輸入、圖像輸入,我們現在語音輸入量是全中國最大的,而且比其他家加起來還要多的份額,1天2億多次語音識別請求。在AI時代里,大家的理解不只是語音和圖像,AI里面最難的地方是人的思想和知識的學習,不僅是圖像的識別,語音的識別,人最寶貴的不是圖像和聲音,人的難點在于知識的理解和推理能力,而這種能力是靠語言體系來支撐的,靠語言來支撐對知識和思考的表達。搜狗在這里面天生是兩個場景,一是輸入場景,讓大家用語言表達,二是用語言獲取信息。因此,我們在AI場景里細的分類是分在自然語言里,自然語言代表了對知識和思想在這里面的人工智能,這里面是人工智能最難的一塊。
往下的思考是幾個事兒,通過語言將搜索升級到對話系統、問答系統以及翻譯系統,這是我們核心能力的三部分。包括《一站到底》,可以認為是搜索對未來的模式,就是提問題,不是給你10條鏈接,而是給你1個答案,實際上《一站到底》的場景相對比較窄,我們在問答處理能力上是比較寬泛的,不僅能找到實體,能在里面做更多的運算,《一站到底》是演示下一代技術中間的場景。對話系統也是今年的一個重心,翻譯系統,我們會把這種能力不僅用到移動互聯網,未來在智能硬件里也會大量地使用我們的一些能力。以自然語言為核心,我們做語音也是把它翻譯成語言,語音識別是從語音到語言,合成是從語言回到語音,但處理的核心是語言,我們要把語言的能力,結合語音、圖像和其他方式放到手機之外的硬件里。所以,我們AI的邏輯不僅是放在輸入法和搜索里,產品形態里有幾個關鍵詞:輸入法,搜索,自然語言的計算,自然的交互。他們支撐的地方是對話的問題,問答的問題以及翻譯的問題。我們希望在這幾個場景里,大家都能看到搜狗的聲音,尤其硬件、IoT到來的時代,無處不在會有交互和機器智能,這是對未來的判斷。
以上是搜狗過去所做的事情,以及往下對人工智能和業務發展方向的理解。
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。