加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

AI想做同傳翻譯?科大訊飛劉慶峰:早著呢

2017/10/19
25
閱讀需 43 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

 

只要你開口,它就能將你的聲音轉(zhuǎn)化成文字;只要你會說一口“二級乙等”的普通話,它的轉(zhuǎn)寫準確率就可以達到 90%以上。它有一個小目標,讓人工智能今年在全球首次通過國家執(zhí)業(yè)醫(yī)師資格考試,成為“全科醫(yī)生”;它有一個大目標,在 2029 年的“而立之年”,成為全球人工智能產(chǎn)業(yè)領導者。
 
這樣的技術、這樣的愿景,來自一家名為科大訊飛的公司。近日,在它十八周年成人禮之際,記者專訪了公司董事長劉慶峰——他的公司明年上半年員工總數(shù)將逾萬人,而 1999 年成立時,連他在內(nèi)只有“十八羅漢”。
 
●說成果:9 年兩獲“國家科技進步獎”
記者:自 1999 年發(fā)展至今,科大訊飛已成為國內(nèi)語音產(chǎn)業(yè)龍頭企業(yè),目前公司在語音產(chǎn)業(yè)領先地位如何體現(xiàn)?
 
劉慶峰:科大訊飛是我國唯一以語音技術為產(chǎn)業(yè)化方向的“國家 863 計劃成果產(chǎn)業(yè)化基地”、“國家規(guī)劃布局內(nèi)重點軟件企業(yè)”、“國家高技術產(chǎn)業(yè)化示范工程”,并被原信息產(chǎn)業(yè)部確定為中文語音交互技術標準工作組組長單位,牽頭制定中文語音技術標準。“國家智能語音高新技術產(chǎn)業(yè)化基地”、“語音及語言信息處理國家工程實驗室”先后落戶公司,有利于進一步匯聚資源,提升科大訊飛產(chǎn)業(yè)龍頭地位。
 
2003 年、2011 年,科大訊飛兩次榮獲“國家科技進步獎”,2005 年、2011 年兩次獲得中國信息產(chǎn)業(yè)自主創(chuàng)新最高榮譽“信息產(chǎn)業(yè)重大技術發(fā)明獎”。自 90 年代中期以來,在歷次國內(nèi)外語音合成評測中,各項關鍵指標均名列第一。2017 年 8 月,在國際醫(yī)學影像領域的權威評測 LUNA 上,科大訊飛獲得平均召回率 92.3%的檢測效果,以顯著優(yōu)勢獲得該項評測的第一名并刷新世界紀錄。
 
基于擁有自主知識產(chǎn)權的世界領先智能語音和人工智能技術,科大訊飛已推出從大型電信級應用到小型嵌入式應用、從教育到電信等行業(yè)、從手機到車載設備、從家電到玩具等,能夠滿足不同應用環(huán)境下企業(yè)和個人用戶需求的多種產(chǎn)品。科大訊飛已占有中文語音技術市場 70%以上市場份額。
 
記者:科大訊飛從 1999 年幾個大學生創(chuàng)業(yè),到今天在 IBM、微軟、谷歌等巨頭環(huán)視的情況下占中國語音交互市場 70%的份額,更在全球與這些企業(yè)進行競爭,在這些年的發(fā)展與競爭中訊飛具體做了什么?
 
劉慶峰:1999 年我們剛創(chuàng)業(yè)的時候,外界很多人在問訊飛 18 人的團隊,憑什么有機會成功?2008 年,我們成為中國語音領域第一家上市公司。2012 年,我們做成了業(yè)界公認的中文語音產(chǎn)業(yè)第一,成為中國語音產(chǎn)業(yè)聯(lián)盟的理事長。
 
之所以能走到今天,首先,訊飛將核心技術做到了世界領先,多次獲得國家級和世界級獎項。其次,“AI+應用”全面開花?,F(xiàn)在,通過學習,我們“人工智能+醫(yī)療”在有些科目上已經(jīng)接近一線醫(yī)生的水平。我們跟中國醫(yī)學科學院協(xié)和醫(yī)學院簽訂戰(zhàn)略合作,不光是共建醫(yī)學人工智能中心,我們的目標是還要讓人工智能今年能在全球首次通過國家執(zhí)業(yè)醫(yī)師資格考試。訊飛“全科醫(yī)生”這個項目,不光是對中國,對全世界都將是一個巨大的福音。
 
記者:科大訊飛的語音合成技術早已被公認處于業(yè)界領先水平,在語音識別方面,科大訊飛有哪些競爭優(yōu)勢?
 
劉慶峰:2008 年至今,科大訊飛連續(xù)在國際說話人、語種識別評測大賽中名列前茅。2016 年,科大訊飛取得國際語音識別大賽(CHiME)全部指標第一。該項技術也深刻應用到產(chǎn)品中,比如“訊飛聽見”。“訊飛聽見”智能會議系統(tǒng)能實時將說話者的發(fā)言一字不落地完整同步到屏幕上,實時對發(fā)言者發(fā)言進行轉(zhuǎn)寫,同時,支持完整記錄、語氣詞過濾、語句順滑、文本在線修改、會議結束即時出稿,轉(zhuǎn)寫準確率可達 95%以上。
 
“訊飛聽見”智能會議系統(tǒng)是全球首款中文語音實時轉(zhuǎn)寫和多語種實時翻譯系統(tǒng)。該系統(tǒng)具有三大特點:一是實時,不僅可以將發(fā)言轉(zhuǎn)換成文字,且同時能將文字再同步翻譯成英日韓等四種語言,當演講或會議結束時就可以直接導出多語種文本;二是準確率高,對二乙水平的普通話,轉(zhuǎn)寫準確率可達 90%以上;三是離線轉(zhuǎn)寫,采用本地部署服務器,確保數(shù)據(jù)安全。這些都是科大訊飛在語音識別方面的優(yōu)勢所在。
 
●談行業(yè):人工智能產(chǎn)業(yè)進入窗口期
記者:今年以來,人工智能產(chǎn)業(yè)非?;馃幔ㄓ嶏w在內(nèi)的不少業(yè)內(nèi)人士都認為現(xiàn)在是人工智能爆發(fā)前夜。但人工智能已有幾十年的發(fā)展歷史,憑什么確認這次的時機就一定成熟?
 
劉慶峰:2016 年底,科大訊飛首先在發(fā)布會上提出,我們已經(jīng)從“互聯(lián)網(wǎng)+”時代進入到“人工智能+”時代。可以說,在科大訊飛的努力下,2016 年成了中國人工智能元年。目前,全球人工智能產(chǎn)業(yè)已經(jīng)進入一個關鍵的窗口期。今年 7 月 20 日,國務院《新一代人工智能發(fā)展規(guī)劃》正式發(fā)布,在我們國家的這一人工智能產(chǎn)業(yè)規(guī)劃中,對相關核心技術、源頭項目推動、智能產(chǎn)業(yè)發(fā)展、智能經(jīng)濟等都進行了清晰描述。可以這么說,未來 3~5 年是人工智能最關鍵的格局確定窗口期。在這 3~5 年,誰能讓人工智能應用真正形成規(guī)模、讓應用落地,誰就能在未來智能產(chǎn)業(yè)中占領先機。
 
人工智能的核心技術發(fā)展有兩條主線:第一是以深度神經(jīng)網(wǎng)絡為代表的算法,在這方面科大訊飛已處于全球領先水平,并且在多項國際比賽中拿到全球第一;第二是腦科學和類腦科學研究。目前腦科學和類腦科學相關研究不斷突破,在這個領域,我們已經(jīng)與中國醫(yī)學科學院、協(xié)和醫(yī)學院、中國科學院神經(jīng)所等眾多研究機構進行了深度合作。
 
在上述兩個方向上,科大訊飛都在持續(xù)突破。即使沒有新的算法突破,以我們今天所掌握的技術成果,結合云計算大數(shù)據(jù)和移動互聯(lián)網(wǎng),我們也已經(jīng)可以改變一個又一個的行業(yè)。當前,我們已經(jīng)可以讓機器學習行業(yè)最頂尖專家的知識,未來達到行業(yè)一流專家水平,從而超越 90%的普通專業(yè)人士,這就是今天我們面臨的機遇。
 
記者:科大訊飛目前的主要優(yōu)勢是語音識別領域,公司未來還有沒有其他人工智能領域的計劃?
 
劉慶峰:科大訊飛在語音合成、語音識別、口語評測、語言翻譯、聲紋識別、人臉識別、自然語言處理等智能語音與人工智能核心技術上代表著國際最高水平。
 
2014 年,隨著人工智能時代的到來,科大訊飛推出“訊飛超腦計劃”,目標是讓機器不僅“能聽會說”,還要“能理解會思考”,從而實現(xiàn)一個中文認知智能計算引擎,未來將引領在家居、教育、客服、醫(yī)療等領域的智能應用。
 
2015 年,科大訊飛重新定義了萬物互聯(lián)時代的人機交互標準,發(fā)布了對人工智能產(chǎn)業(yè)具有里程碑意義的人機交互界面——AIUI。
 
2016 年,圍繞科大訊飛人工智能開放平臺的使用人次與創(chuàng)業(yè)團隊成倍增長,帶動超百萬人進行雙創(chuàng)活動。截至 2017 年 6 月,訊飛開放平臺第三方的開發(fā)團隊達到 37.3 萬,每天的請求數(shù)達到 37 億次,累計終端數(shù)達到 14.7 億個,以科大訊飛為中心的人工智能產(chǎn)業(yè)生態(tài)正在持續(xù)構建。科大訊飛在智能語音、人工智能核心研究和產(chǎn)業(yè)化方面的突出成績,得到社會各界和國內(nèi)外一致認可,作為“中國人工智能國家隊”已經(jīng)形成共識。

 

●論前景:教育、醫(yī)療、司法等領域是主賽道
記者:今年人工智能概念快速熱起來,你怎么看待這種現(xiàn)象?有沒有擔心這種火熱對人工智能技術的發(fā)展帶來負面影響?
 
劉慶峰:此前有觀點認為,同聲傳譯將被人工智能取代,這其實是對新技術發(fā)展的高度神化,可能會對大眾造成錯誤引導,不利于產(chǎn)業(yè)生態(tài)持續(xù)健康發(fā)展?,F(xiàn)階段,人工智能技術發(fā)展不需要“被神化”,技術發(fā)展乃至產(chǎn)品化有其自身發(fā)展的曲線,從技術走向市場,一定是在不斷完善的過程中走向成熟。
 
目前,機器翻譯已經(jīng)取得非常大的進步,在衣食住行等常用生活用語上的中英翻譯可以達到大學六級的水平,能夠幫助人們在一些場景中處理語言交流的問題,但距離會議同傳以及高水平翻譯所講究的“信、達、雅”還存在很大的差距。
 
訊飛一直所努力的,是希望通過語音轉(zhuǎn)寫和翻譯技術幫助同傳提高工作效率、減少失誤,形成人機耦合的同傳新模式,而非替代同聲傳譯。
 
目前,人工智能技術的發(fā)展在感知智能和認知智能領域都取得了長足進步,在語音交互、智能評測、口語翻譯等方面更是有突破性建樹。
 
記者:科大訊飛目前已經(jīng)把相關技術應用到教育、醫(yī)療、司法等等領域,選擇進入行業(yè)的標準有哪些?目前,同樣做人工智能的公司有很多,但一些人似乎很難獲得切入到行業(yè)場景的能力,科大訊飛在這方面有哪些經(jīng)驗?
 
劉慶峰:在這個時代,人工智能不再是概念,應用是硬道理。人工智能改變世界的過程,需要在一個又一個的領域來進行應用的創(chuàng)新,通過與領域?qū)<业慕Y合來獲得行業(yè)的數(shù)據(jù)。這決定了人工智能產(chǎn)業(yè)不是一家公司可以包打天下的,必須建立產(chǎn)業(yè)生態(tài)。產(chǎn)業(yè)生態(tài)的好壞,建設的快慢,決定了一個企業(yè)或者一個國家的人工智能產(chǎn)業(yè)發(fā)展進程。所以,在人工智能領域,不是一個人跟另一個人的戰(zhàn)斗,也不是單個企業(yè)與單個企業(yè)之間的戰(zhàn)斗,而是一個體系和另一個體系、一個生態(tài)和另一個生態(tài)的競爭。
 
科大訊飛現(xiàn)在也確定了自己的生態(tài)體系框架:第一層是圍繞訊飛超腦,各事業(yè)群、事業(yè)部主導的方向,這構成了我們的核心層,也是核心業(yè)務構成;第二層是一些探索性方向;第三層則是更大范圍下,圍繞科大訊飛核心技術的產(chǎn)業(yè)生態(tài)。我們會按照這個生態(tài)的道路不斷向前推進。
 
記者:目前包括百度等互聯(lián)網(wǎng)公司也在做人工智能研究,并且部分板塊和科大訊飛有重合,你如何看待這種競爭?科大訊飛有哪些優(yōu)勢?
 
劉慶峰:確實現(xiàn)在非常多的優(yōu)秀公司都在做人工智能,每家公司有自己的特點,我們的優(yōu)勢是把我們最好的算法跟行業(yè)專家和行業(yè)數(shù)據(jù)結合,其他公司做人臉識別、視頻識別,他們也都有自己擅長的領域,賽道各不相同。訊飛會把核心能力平臺化地對外提供,我們選的主賽道有教育、醫(yī)療、司法、車載、客服這些領域,在這些領域,我們可以看到一個非常大的未來,而且我們可以占據(jù)很好的空間。
 
記者:科大訊飛未來的戰(zhàn)略的是什么?
 
劉慶峰:今年是科大訊飛成立十八周年,到 2029 年也就是科大訊飛成立三十周年。從“成人禮”到“三十而立”,2029 年,每一個設備都將能聽會說,人工智能將像水和電一樣無所不在。2029 年,訊飛將會怎樣?我們的愿景是成為中國人工智能產(chǎn)業(yè)領導者和產(chǎn)業(yè)生態(tài)構建者,成為全球人工智能產(chǎn)業(yè)領導者,成為一家用人工智能改變世界的偉大企業(yè)。
 
科大訊飛

科大訊飛

科大訊飛股份有限公司成立于1999年,是一家專業(yè)從事智能語音及語言技術、人工智能技術研究,軟件及芯片產(chǎn)品開發(fā),語音信息服務及電子政務系統(tǒng)集成的國家級骨干軟件企業(yè)。2008年,科大訊飛在深圳證券交易所掛牌上市,股票代碼:002230。

科大訊飛股份有限公司成立于1999年,是一家專業(yè)從事智能語音及語言技術、人工智能技術研究,軟件及芯片產(chǎn)品開發(fā),語音信息服務及電子政務系統(tǒng)集成的國家級骨干軟件企業(yè)。2008年,科大訊飛在深圳證券交易所掛牌上市,股票代碼:002230。收起

查看更多

相關推薦

電子產(chǎn)業(yè)圖譜