奧運(yùn)會(huì)一直是高精尖科技爭(zhēng)相亮相的舞臺(tái),一方面它是前沿技術(shù)最好的試煉場(chǎng),另一方面也是出于高水準(zhǔn)賽事的迫切需求。隨著生成式AI的發(fā)展和推廣,這項(xiàng)技術(shù)正在奧運(yùn)會(huì)上展現(xiàn)出新的落地方向和應(yīng)用空間,不論是提升運(yùn)動(dòng)員表現(xiàn)、優(yōu)化賽事管理,還是增強(qiáng)觀眾體驗(yàn)等方面,都為即將到來(lái)的2024年巴黎奧運(yùn)會(huì)注入了新的活力。
日前,英特爾分享了與國(guó)際奧林匹克委員會(huì)(IOC)的一些合作細(xì)節(jié),并披露了以行業(yè)需求為導(dǎo)向所打造的生成式AI(GenAI)檢索增強(qiáng)生成(RAG)解決方案。該成果深度展示了英特爾如何通過(guò)基于至強(qiáng)處理器和Gaudi AI加速器的開(kāi)放式AI系統(tǒng)及平臺(tái),幫助開(kāi)發(fā)者和企業(yè)應(yīng)對(duì)AI高速發(fā)展所帶來(lái)的需求。
基于生成式AI RAG的聊天機(jī)器人,跨越數(shù)據(jù)障礙
AthleteGPT是國(guó)際奧委會(huì)與英特爾合作開(kāi)發(fā)的一款聊天機(jī)器人,是一款基于英特爾至強(qiáng)處理器和Gaudi加速器的RAG解決方案,它可以說(shuō)六種語(yǔ)言,包括英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、普通話(huà)、俄語(yǔ)和阿拉伯語(yǔ),11,000名運(yùn)動(dòng)員將能夠訪問(wèn)這些語(yǔ)言,這幾乎涵蓋了他們的第一或第二語(yǔ)言。它不僅能夠應(yīng)答運(yùn)動(dòng)員的日常詢(xún)問(wèn)并進(jìn)行互動(dòng),同時(shí)將在運(yùn)動(dòng)員入住巴黎奧運(yùn)村期間,為其按需提供信息,使運(yùn)動(dòng)員能夠?qū)W⒂谧陨碛?xùn)練和比賽。
對(duì)于奧運(yùn)會(huì)這樣的國(guó)際大型賽事來(lái)說(shuō),英特爾通過(guò)與國(guó)際奧委會(huì)的合作,展示了AI普及化的一種方式。盡管這種獲取信息和互動(dòng)的方式很好,但毫無(wú)疑問(wèn),“信息量”是一個(gè)主要挑戰(zhàn)。一直以來(lái),AI的訓(xùn)練和部署在數(shù)據(jù)方面存在一定的制約和局限。對(duì)于企業(yè)來(lái)說(shuō),他們擁有大量數(shù)據(jù),這些數(shù)據(jù)往往是專(zhuān)有數(shù)據(jù)或歷史數(shù)據(jù),是企業(yè)寶貴的數(shù)字資產(chǎn)。LLM雖然是一項(xiàng)偉大創(chuàng)新,但如果無(wú)法安全訪問(wèn)和應(yīng)用這些數(shù)據(jù)的話(huà),也無(wú)法發(fā)揮力量。
英特爾方面認(rèn)為,RAG的技術(shù)和范式可以將數(shù)據(jù)和LLM結(jié)合在一起,既可以確保企業(yè)數(shù)據(jù)的安全性,又能夠借助企業(yè)數(shù)據(jù)的具體性和準(zhǔn)確性,使得LLM發(fā)揮出該有的價(jià)值。
據(jù)了解,AthleteGPT提供了RAG驅(qū)動(dòng)的前端,它可以在幕后檢索數(shù)據(jù),無(wú)需運(yùn)動(dòng)員進(jìn)行復(fù)雜操作,就可以有意義地解釋大量數(shù)據(jù)集中的信息。
企業(yè)AI開(kāi)放平臺(tái)是大規(guī)模生成式AI RAG應(yīng)用的關(guān)鍵
在大規(guī)模應(yīng)用的生成式AI RAG解決方案中,一個(gè)重要根基是英特爾與行業(yè)合作伙伴共同創(chuàng)建了開(kāi)源、可互操作的解決方案,用于輕松部署RAG。正是因?yàn)槠髽I(yè)AI開(kāi)放平臺(tái)(OPEA),能夠提供開(kāi)源、標(biāo)準(zhǔn)化、模塊化,以及異構(gòu)的RAG流水線(pipeline),并致力于為開(kāi)放式模型及多種編譯器和工具鏈的開(kāi)發(fā)提供支持,加速了針對(duì)垂直領(lǐng)域用例的容器化AI集成與交付。
下圖是RAG的具體工作流程,該生成式AI一站式解決方案將基于OPEA的微服務(wù)組件集成至用于部署英特爾至強(qiáng)處理器和Gaudi AI系統(tǒng)的、可擴(kuò)展的RAG解決方案中,可通過(guò)Kubernetes、Red Hat OpenShift等經(jīng)驗(yàn)證的編排框架進(jìn)行無(wú)縫擴(kuò)展,并提供兼具可靠性和系統(tǒng)遙測(cè)功能的標(biāo)準(zhǔn)化API。
英特爾方面表示,幾乎所有大型語(yǔ)言模型(LLM)的開(kāi)發(fā)都基于高級(jí)抽象框架PyTorch,該框架受英特爾Gaudi和至強(qiáng)技術(shù)的支持,使得在英特爾AI系統(tǒng)或平臺(tái)上進(jìn)行開(kāi)發(fā)變得輕而易舉。通過(guò)與OPEA合作,英特爾為RAG和LLM部署開(kāi)發(fā)了一個(gè)開(kāi)放的軟件堆棧,該堆棧針對(duì)GenAI交鑰匙解決方案進(jìn)行了優(yōu)化,并基于PyTorch、Hugging Face服務(wù)庫(kù)(TGI和TEI)構(gòu)建。
關(guān)于生成式AI RAG解決方案的重要意義,英特爾方面認(rèn)為,部署生成式AI解決方案會(huì)帶來(lái)諸如成本、規(guī)模、準(zhǔn)確性、開(kāi)發(fā)需求、隱私和可靠性等方面的挑戰(zhàn)。作為一種關(guān)鍵的生成式AI工作負(fù)載,RAG可以讓企業(yè)安全地利用專(zhuān)有數(shù)據(jù),增強(qiáng)AI產(chǎn)出結(jié)果的及時(shí)性與可靠性。這將極大地提高AI應(yīng)用的質(zhì)量和實(shí)用性。通過(guò)以協(xié)作的方式幫助開(kāi)發(fā)者構(gòu)建定制化的生成式AI RAG解決方案,可以滿(mǎn)足企業(yè)的多樣化需求。此外,英特爾亦將持續(xù)提供開(kāi)放、強(qiáng)大且可組合的多供應(yīng)商生成式AI解決方案。
除了生成式AI RAG聊天機(jī)器人,英特爾在支持巴黎奧運(yùn)會(huì)的邊緣AI應(yīng)用中,還攜手三星打造基于AI技術(shù)的沉浸式互動(dòng)體驗(yàn),能夠帶領(lǐng)觀眾體驗(yàn)一系列專(zhuān)業(yè)的訓(xùn)練與分析,并為其匹配出最為合適的比賽項(xiàng)目。此外,還有幫助視障人士提高賽事觀賞體驗(yàn)的AI解決方案,以及包括了全新體積視頻的3D播報(bào)形式,帶給觀眾沉浸式的實(shí)時(shí)體驗(yàn)。
當(dāng)前,如何將最新的AI計(jì)算技術(shù)應(yīng)用到實(shí)際場(chǎng)景中,并推動(dòng)關(guān)鍵業(yè)務(wù)成果落地,是企業(yè)亟待解決的問(wèn)題。通過(guò)與廣大行業(yè)合作伙伴的戰(zhàn)略合作,英特爾正為由生成式AI和RAG解決方案驅(qū)動(dòng)的AI服務(wù)創(chuàng)造更多的可能性。