0

搜狗推出了一款真正落地的語音技術產品。
8月8日,搜狗針對文字工作者,推出語音實時轉文字的速記工具“搜狗聽寫”。適用于寫文章、采訪錄音、會議記錄、筆記整理 、日常記事等場景,幫助用戶實現語音記錄和信息輸入。針對不同場景和需求,搜狗聽寫可以支持“聽寫”和“轉寫”兩種模式。在“聽寫”模式下,錄音的同時即可實時給出識別結果;而“轉寫”模式下則可以離線錄音,錄音完成后一次性獲取文字結果。
為了提高文字整理效率,搜狗聽寫還加入了邊聽邊改、無線標重點(藍牙打點)、多端同步、信息分享等人性化功能,與搜狗輸入法個人詞庫打通。此外,搜狗公司語音交互技術中心總經理王硯峰宣稱,搜狗聽寫還提供耳語識別技術,在說話音量低至30分貝時,依然可以準確識別。
早在2012年,搜狗即開始研發智能語音技術,并同步開啟相關產品落地的布局。去年8月3日,搜狗舉行知音引擎的發布會,取得機器翻譯的突破。跟進當時世界上最領先的機器翻譯的深度學習的框架,基于attion的端到端的框架,再加上以前在語音識別上的累積,用3個月的時間搭建起機器翻譯引擎,并且應用到了去年的烏鎮大會上。
去年11月份,搜狗推出了機器同傳,率先商用化。今年1月份,推出行業首個跨引擎搜索引擎,也是基于機器翻譯核心引擎推出。5月份,搜狗語音核心技術在應用方面取得突破等。
實際上,目前市場上已有一些同類的產品,例如早期推出的訊飛聽見等,相比之下,搜狗是否存在優勢呢?搜狗語音交互中心負責人王硯峰對雷鋒網表示:
第一,訊飛對應的產品,如訊飛聽見、訊飛錄音寶等,是不能支持長時間錄音、并且免費轉寫的。而搜狗是首次做了長時錄音設置,并且支持免費轉寫。
第二,搜狗的產品是面向垂直場景,包括記者采訪的場景、作家寫作的場景等等。這些功能雖小,但它體現在具體場景下,怎么絞盡腦汁的想盡辦法,幫朋友解決問題。
第三,功能上,訊飛手機端沒有”聽見“。且搜狗聽寫有語音實時轉文字、邊聽邊改、標重點、快速查找、多端同步、不限時長錄音等功能。
除此之外,依托搜狗產品日均超過2.6億次的語音請求,提供海量的真實語料數據,可以使得機器不斷學習并提升語音識別準確率。

但對于搜狗轉寫免費會持續多長時間這個問題,王硯峰表示,目前肯定是免費的,至于之后會不會收費,并不完全確定。至少按照現有的產品形態,肯定是在相當長的時間內不考慮使用這個產品來賺錢。作為一家互聯網公司,通過技術來收取技術服務費不是搜狗的商業邏輯。至少到現在為止,搜狗還不想通過產品收費的方式來進行商業的變現。
為什么選擇這個時間點來發布產品?
王硯峰對雷鋒網表示,一方面,是與去年發布的知音引擎更好地呼應,另一方面,搜狗下半年將會集中發布一批人工智能落地產品。王硯峰坦言,客觀來講,搜狗作為一家人工智能業界公司,在AI落地方面做得遠遠不夠。也正因此,下半年將在硬件、軟件等場景集中一波攻勢,包括智能副駕、智能聽寫等。
基于搜狗的語音能力和自然交互能力,在非巨頭壟斷的行業,搜狗將嘗試做更多硬件產品的自研、試水、投資,可能自己研發,也可能投資一些公司,以合作的方式把這些產品做出來。
在王硯峰看來,不論是車載市場、家庭場景,還是可穿戴市場,雖然玩家很多,但離市場成熟期還早得很,在這個過程中,王硯峰認為搜狗完全有信心拿出更多爆款產品或有量產品,來搶占市場份額,例如在中國可穿戴設備硬件中排名前五名的糖貓兒童手表,目前出貨量已突破100萬。
而已如今大火的Amazon Echo為例,王硯峰認為,亞馬遜并非單獨將這個平臺推起來的,而是因為有了巨大的用戶量、進而帶動了平臺的使用量,這才有了更多的開發者加入進來。
在Amazon Echo上,雖然有很多的開發者,但其主功能的比例,絕大部分還是在定位在鬧鐘、天氣,以及音樂上。目前的中小開發者對于智能語音入口的產業格局尚且不成有力威脅,牌還是在巨頭的手上。
王硯峰對雷鋒網表示,如果智能語音入口級硬件可以自己做,像Amazon Echo那樣做出爆款產品,推出自己的硬件,進而搶奪市場入口,這當然是首選。但在手機和電視領域,搜狗暫不會做這樣的硬件,也不可能把硬件戰線拉得過長。對于搜狗來講,做十幾款硬件也是存在問題的。更適合的做法是——瞄準幾款最有用戶痛點、最適合自己風格的硬件產品來做。這兩個之間并不存在非此即彼的關系,更多的是互補的關系。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。