新浪科技專訪搜狗CEO王小川
新浪科技 李根
搜狗CEO王小川在烏鎮演講時“炫”了一把技術,在現場,他一邊講,實時文字轉錄一邊在屏幕顯示——但這還不算結束,考慮到現場有不少老外,這項實時轉錄技術還加入了“翻譯”。
也就是說,在王小川用“川普”(四川普通話)發表對人工智能的看法時,老外們直接看實時字幕就能知道他在講什么。實際上,現場的效果是,那些老外看到有“英文字幕”時,紛紛摘下了同聲傳譯設備。
在其后新浪科技向王小川描述這一幕時,這位搜狗CEO顯得非常開心,不過他也不忘謙虛了一句:“也不枉我們背了服務器過來。”還笑稱調試時去掉了機器對口頭禪“是的”的翻譯,“因為中間有翻譯的時候說是的時候,它說 yes I am。”
王小川認為這種翻譯不僅會顯得“傻”,而且會導致更大的問題,“做翻譯的時候對語音識別要求特別高,你放個火箭的事,把衛星打到預定軌道上絲毫不能錯,語音錯一點在翻譯上就會疊加了,所以這對語音要求特別高。”
然而,對于王小川和他的技術團隊來說,今年的“炫酷”表演顯然不止于此。在采訪現場,他開心之余還向新浪科技展示了自己手機里的最新Demo:一個實時傳譯功能。
當新浪科技說出“好的,這個新產品,是不是意味著以后出國采訪再也不用帶翻譯啦”時,軟件很快給出了翻譯并“讀”道:“OK, this new product, isn`t it meant to be able to go abroad and do not have to translate it again。”
這將是王小川和他的搜狗團隊在今年將交出的又一個人工智能功能和產品。
這一年以來,王小川和搜狗高管被問到最多的問題是“怎么搜狗也轉向做人工智能了?”
這位搜狗CEO每每都感到哭笑不得。一方面,他覺得外界對于人工智能的技術原理還沒得到普及,進而忽略了搜狗從搜索和輸入法到“人工智能”的自然而然;另一方面,他害怕強調技術立身的搜狗被外界誤解,認為“也玩概念”了。
從清華校園出發,通過搜索、瀏覽器和輸入法,拿下中國搜索市場第二份額和輸入法市場第一份額,王小川認為搜狗的人工智能“到時候了”。
一方面,搜索的核心本質是通過人機交互獲取信息,而人工智能會讓這種交互更加自然且高效;另一方面,搜索資源、和輸入法語料積累的大數據,也可以通過機器算法和模型,有了進一步發揮價值的時候。
2016年下半年以來,搜狗先在輸入法中推出了“快速分享”和“智能推薦”,解決聊天場景中不同App切換的問題,比如雙方約定餐廳吃飯,但需要來回在聊天應用和點評App間分享切換;或者分享一首最近發現的新歌,需要在聊天應用和音樂App間切換;再或者使用瀏覽器搜索資料時再分享時,都無法直接利用輸入法解決問題。
其后,搜狗在輸入方式上,開始把此前隱而不宣的“語音輸入”加強權重,并開始在公開活動上,頻頻展示目前“實時轉錄”的速度和準確率。
王小川認為這也和大環境息息相關,他表示互聯網和移動互聯網對于“連接”已經實現得差不多了,接下來要靠數據驅動,而數據中間則會產生智能。搜狗將主要在社會連接、商業形態提升效率方面進一步下功夫。
這位搜狗CEO還表示,年內會正式宣布新戰略,詳細談下后“三級火箭”時代里,搜狗將會成為一家什么樣的公司。
當然,對于搜狗來說,今年的重大事件或許還不止于“戰略”。
今年6月,搜狗內部晉升了三位副總裁,分別出任COO、CTO和CMO。對于這種組織架構的完善,當時官方給出的說法是“內部激勵”。但在新浪科技采訪現場,王小川的回答顯得意味深長。
這位一手在搜狐內部實現搜狗從無到有、從弱到強的CEO表示:“我覺得時間到了吧。”
值得一提的是,在說完“時間到了”之后,他略帶詭異地笑了一下,“其他考慮不能告訴你,背后有很深的思考,但是不能說。”王小川補充道。
另附經新浪科技編輯的采訪實錄節選:
新浪科技:除了實時轉錄和翻譯,這個還能怎么應用?
王小川:你和老外就可以聊天。
新浪科技:有平臺考慮嗎?我輸中文給對方直接翻英文?
王小川:平臺都可以,因為我是輸入法。我們最終會把翻譯的過程干掉,在你這兒顯示的全是中文,在對方那兒顯示的全是英文,把中間翻譯的過程去掉,你也能用語音直接輸入。
新浪科技:也會和搜索有關系?比如你之前談到的“跨語言”問答。
王小川:有關系,而且翻譯過來了,你看到的全是中文的,但背后是絕對的信息。因為你要知道中文信息是不靠譜的,我們做醫療就知道,醫療現在不是廣告問題,廣告去掉一樣很爛,中國網頁上充斥不靠譜的內容,西方世界則靠譜很多,你原材料不好,怎么都加工不出東西了,所以我們是去檢索全球內容。
還有輸入法也是,現在你輸入中文,但是你一發布就是英文出來了,發出去就是英文。我給你們看一個東西,這都是內部的東西,都沒有發的。今天我們參加了烏鎮世界互聯網大會,點這個鍵,然后在這兒,這個翻譯,這個網比較慢,它翻譯這個東西了,內部你可以輸入中文然后往英文轉。
新浪科技:現在人工智能大家都從語音這方面入手,為什么?
王小川:第一,用深度學習的方法解決語音是最合適的武器。深度學習用來解決語音圖像問題很適合,解決文字特別難,文字里面唯一能夠干的東西,唯一能夠往實用走的東西就是翻譯,翻譯不是要讀懂,只是需要把兩段話變過去就可以了,省略中間過程。
第二,傳統翻譯是靠規則的,是靠概率計算,那個翻譯的結果:一是翻譯的磕磕巴巴,讀起來非常難受,但意思不會錯,這是傳統翻譯的好處。我們現在用的這套技術,讀起來特別流暢,但有可能意思完全不對,完全可能遇到。因為它和AlphaGo第四局棋一樣,到它不會的時候是發瘋的,可以完全翻成相反的意思,這套翻譯技術都有這個問題。
新浪科技:所以做人工智能還是得有核心數據?
#p#分頁標題#e#王小川:要么是核心數據要么是核心技術,但一般來講我覺得比較靠譜的是升級你的商業,你原來商業上已經跑通了,機器只是把它的效率跑得無比高,比如放貸這件事,機器以后做小額貸款就比人貸款效率高。它其實是商業的升級,純粹從技術出發做這個事很難的。
新浪科技:認同移動互聯網時代過去了的說法嗎?怎么看趨勢?
王小川:連接這件事情差不多了,剩下要靠數據驅動了,數據中間產生智能。往下兩個方向:一個方向是虛擬體驗,不僅是VR眼鏡,但總能帶你暢想一個新的世界。我們看小說、看視頻、玩游戲都是虛擬體驗,這是人性的一部分,人就喜歡玩自己沒有經歷過的事,這是方向一,手機游戲也在這個體驗里面。
方向二是機器智能或者商業智能,大家在商業社會中由于本身的技術提升,機器開始參與做決策,使得整個社會連接、商業形態里產生更高的效率。我認為大體往這兩個方向走。
具體搜狗來說的話,虛擬體驗我其實不太會,不在我們這里。我們是商業智能。
新浪科技:那目前人工智能有缺點嗎?
王小川:人工智能,第一,要靠數據驅動。它本身不是具有推理,有通用學習能力,有人的歷史數據用來做復制,現在技術就到這一步。
第二,必須靠學習,大量數據的學習,不是說一點數據或者推理就能得到結果的,什么事能被機器取代?就是一件事情,人在里面靠經驗重復做,這時候機器只要數據大了,就可以取代。
新浪科技:現在就人工智能而言,中國和硅谷差距在什么地方?
王小川:我覺得基礎研究上差距巨大,包括學校和學校上研究出來的,像Google招的那些科學家,他們真的能夠發明新的算法和新的體系結構來解決人工智能的問題,像CNN這次聽過嗎,LSPM那些新的算法,都是人家發明的。我們基本是看論文,看誰能夠最快把論文的這些東西用到我們系統里去。我給你個數據,全球前十大互聯網上市公司,中國占了4家,但全球前100所高校,中國只有兩家,一個清華一個北大,還只是中不溜的。在這種研究能力上你的差距是巨大的。
學校是什么原因呢?因為我們學校還需要去行政化才行,老師的目標不是真正出成果,而是為了這種怎么去升職,怎么去發論文,怎么去成國家的重點項目,所以它的目標不一樣就做不好,其實老師都挺聰明的。
我們做天工智能研究院就希望給他們開個口子,因為他們有時候有的人追求的目標是升學校教授,要拿多少的科研經費,我們幫他們解決問題,看看能不能喚醒一些人。但總的來講氛圍上,就是沙漠上滴了兩滴水,還是特別難。
新浪科技:但整體而言今年是人工智能大爆發的一年,變化很大。
王小川:第一,今年是個啟蒙運動,大家開始認識到了人工智能偉大的意義,所以也會有更多的資金、人才投入到人工智能的研究或者商業中去,因此人工智能真正啟蒙運動后的大爆發剛剛開始。但是我們又有時候會高估人工智能現在的能力,開始想象人工智能是否會威脅人取代人,這是不存在的。但凡你和一些比較嚴肅的做學問的人聊的時候,大家都會不斷給你降低這里面的預期。
第二,有一些酷炫的東西很酷,但其實智能性或實用性是不夠的,比如像我講的圖像合成,拿兩個圖合成第三幅圖,比如你拿個風景畫或者一個人的照片,背后你再把中間像搞一些著名的畢加索的風格放進去,聲稱一幅畫是畢加索風格,大家說好厲害,或者一幅圖片里識別出里面有熊、長頸鹿,這種技術上的突破確實是很大的,但到整個產品實用的路徑是非常遠。
所以,今天我提出一個概念,我們在產品層面上人工智能有三個幫助:一是識別,語音識別和文字識別;二是生成,你能夠合成圖像、語音和文字,但這些可能都不夠重要,真正重要的方向是讓機器做決策,就是做準確決策。
新浪科技:在搜狗而言,你認為人工智能會有什么坑嗎?
王小川:我們覺得是好用,想得比較清楚,對技術真正了解,有些對技術不了解的公司,可能投了一個技術覺得技術做不到,或者技術轉化不了產品,或者產品沒有商業模式,我覺得我們以前在歷史的積累中對這些問題都有自己的思考。老周踩得坑,你要看我以前的一些講話里都提前講了,就是這些坑他會遇到的,硬件免費,做兒童手表那會兒又是打安全牌,這些就不靠譜嘛,但他自己實踐一次才知道。
另外的話,開放性,因為對我們而言,我們是一家 to C 的公司,最終是給普通的消費者提供我們的服務。
新浪科技:今年你們設了CMO、CTO和COO,主要是為了激勵還是有一些其他方面的考慮?
Copyright @ 2005-2020 南京同傳翻譯公司 版權所有