“你只需專注會議,其余一切交給聽悟。”11月4日,2022杭州云棲大會,阿里巴巴達摩院研發(fā)的智能產(chǎn)品“聽悟”進階版亮相大會現(xiàn)場。僅需一臺個人電腦,觀眾和媒體記者們即可體驗全面集成達摩院語音語言智能的最新AI助理,感受會議場景的前沿AI實踐。
這款“AI神器”在云棲大會上引起廣泛關(guān)注,它不僅“聽得準(zhǔn)”,而且“悟性高”,可為體驗者實時轉(zhuǎn)寫會議、秒速生成會議紀要、自動區(qū)分不同說話人、生成視頻字幕,并具備會議實時翻譯、問答自動提取等高階能力,在企業(yè)會議、金融盡調(diào)、媒體訪談、教育培訓(xùn)等泛會議場景有廣泛應(yīng)用前景。
?
(“聽悟”使用界面展示)
相比去年云棲大會發(fā)布的版本,“聽悟”今年在技術(shù)和產(chǎn)品功能上進行了全方位升級,新增三大核心AI能力:中英文自由說,采用內(nèi)嵌多語種專家模塊的“混合專家系統(tǒng)”,無需手動切換語種即可準(zhǔn)確識別中英大篇幅混說的場景;會議實時翻譯,邊說邊翻譯,無需等待,讓跨國溝通更加高效順暢;QA問答對抽取,結(jié)合說話人特征、多階段訓(xùn)練技術(shù),自動提取問題,讓訪談?wù)砀p松。
(“聽悟”進階版可實現(xiàn)問答抽取,人物及對話為示例)
同時,針對會議行業(yè)伙伴及企業(yè)用戶的多樣化需求,“聽悟”發(fā)布了PaaS產(chǎn)品形態(tài),以簡單易調(diào)用的接口方式開放核心能力,并提供多種前沿創(chuàng)新算法,從而滿足企業(yè)在音視頻會議、培訓(xùn)直播、招聘面試、智能客服等多種細分場景的不同需求。
(“聽悟”在招聘細分場景中的應(yīng)用)
阿里巴巴達摩院語音實驗室負責(zé)人鄢志杰表示,“過去十年‘人-機’交流是語音AI解鎖的核心場景,更復(fù)雜的‘人-人’交流是下一個高地,未來聽悟?qū)⒃凇?人’交流場景繼續(xù)深入探索,提供安全、保真、精準(zhǔn)的AI識別、分析與理解能力,并基于內(nèi)容為企業(yè)提供多種智能辦公服務(wù),讓AI真正為人所用,替人分擔(dān),協(xié)助處理重復(fù)繁瑣的工作事務(wù)?!?/p>