在ChatGPT持續(xù)引爆行業(yè)通用大模型之后,國內(nèi)諸多互聯(lián)網(wǎng)巨頭、AI企業(yè),也都選擇紛紛跟進(jìn),參與到國產(chǎn)通用大模型的角力之中。值得注意的是,與上半年“熱鬧非凡”的行業(yè)境遇不同,具備實力且具備滿腔“產(chǎn)業(yè)抱負(fù)”的巨頭玩家,正在為大模型的大規(guī)模落地創(chuàng)造機會。
其中,以科大訊飛為代表的科技公司,正在積極與包括華為等在內(nèi)的國內(nèi)合作伙伴一起通力合作,為構(gòu)建人工智能時代的中國“Wintel聯(lián)盟”做準(zhǔn)備。而隨著越來越多的實力型玩家大踏步入場,“大模型+”的應(yīng)用拐點正在加速到來。
大模型邁入產(chǎn)業(yè)“落地”加速期
從國內(nèi)大模型的發(fā)展?fàn)顩r來看,隨著各路技術(shù)企業(yè)的紛紛參與,無論是通用大模型還是垂直行業(yè)大模型,國內(nèi)企業(yè)均有涉足。一波接一波的行業(yè)浪潮席卷而來,正在推動整個“大模型+”應(yīng)用時代的來臨。
首先,大模型不再局限于聊天、答題、內(nèi)容生產(chǎn)等C端應(yīng)用,而是轉(zhuǎn)向更偏重實體領(lǐng)域的B端應(yīng)用,以“實用”為導(dǎo)向的大模型日漸成為行業(yè)趨勢。
在上半年的持續(xù)“爆火”之后,進(jìn)入下半年大模型的風(fēng)向明顯變了。市面上越來越多的“面向B端”的應(yīng)用開始出現(xiàn),這種“實用主義”的風(fēng)向,大大加速了生成式AI產(chǎn)業(yè)化的進(jìn)程。從上半年以來,陸續(xù)有京東、攜程、網(wǎng)易有道、用友等不同領(lǐng)域的巨頭,發(fā)布相關(guān)的行業(yè)大模型應(yīng)用,包括騰訊、華為等在內(nèi)的巨頭,也將“實用”作為大模型應(yīng)用的重點,推動大模型滲入產(chǎn)業(yè)實體之中。
其次,具備通用能力的大型企業(yè),正在加強與各行業(yè)大模型企業(yè)的合作,新的大模型生產(chǎn)機制正在成型。
目前來說,業(yè)內(nèi)通用的做法是,通過開放自身的大模型能力,為行業(yè)大模型開發(fā)提供必要條件。比如,訊飛星火大模型采用了“1+N”的整體布局,即借助訊飛星火大模型平臺的7大通用能力,將其文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力等賦能給其他行業(yè)場景,形成在教育、醫(yī)療、汽車、法律等諸多領(lǐng)域的行業(yè)大模型應(yīng)用的生產(chǎn)機制。依托這種生產(chǎn)機制,各行業(yè)的大模型廠商,都不再需要“重復(fù)造輪子”,只需要專注應(yīng)用開發(fā),即可推動行業(yè)的大模型場景落地,這些條件的具備,為大規(guī)模的大模型場景落地奠定了很好的基礎(chǔ)。
“實用”大模型并非一蹴而就
如前文所述,隨著國內(nèi)大模型逐步深入產(chǎn)業(yè),以及通用大模型廠商逐步對外開放自身能力,“實用”大模型的難度已經(jīng)大大降低,但這并不意味著做“實用”大模型可以一蹴而就,甚至可以說與之恰恰相反。
其一,“實用”的大模型,通常需要企業(yè)具備很深厚的行業(yè)經(jīng)驗和專業(yè)數(shù)據(jù)積累,以確保數(shù)據(jù)的精準(zhǔn)性和專業(yè)性,而這通常需要大模型企業(yè)對行業(yè)有很深的了解。就拿本次1024開發(fā)者節(jié)上科大訊飛發(fā)布的智能編程助手iFlyCode2.0來說,其自發(fā)布以來就持續(xù)升級,目前已成為行業(yè)重要的提效工具(內(nèi)測數(shù)據(jù),在編程的設(shè)計階段提效50%、編碼階段提效37%、測試階段提效44%)。然而,這樣的能力很多企業(yè)并不具備,就如同射箭比賽,它們可能還不具備“畫靶子”的能力。
以教育行業(yè)為例,大模型中關(guān)于“小學(xué)生英語學(xué)習(xí)”的版塊,首先需要了解小學(xué)英語的學(xué)習(xí)目標(biāo),還要定義小學(xué)生英語學(xué)習(xí)的范圍,不能超綱(比如詞匯量范圍、語句類型、語句長度等等),并要找到適合孩子學(xué)習(xí)習(xí)慣和學(xué)習(xí)階段的方法——這些標(biāo)準(zhǔn),都要先定義,這就是“畫靶子的能力”。相比之下,從2004年至今,科大訊飛已經(jīng)在智慧教育領(lǐng)域深耕19年了,多年來其深度參與了中國的教育信息化整個進(jìn)程,從中小學(xué)到高等教育,從教學(xué)過程到教學(xué)結(jié)果諸多場景,系統(tǒng)積累了諸多從0到1的關(guān)鍵性技術(shù),這使其積累了其他廠商難以企及的專業(yè)經(jīng)驗和專業(yè)數(shù)據(jù),而這正是其他廠商短時間難以企及的。
在本次發(fā)布會上,搭載了星火大模型V3.0 訊飛AI學(xué)習(xí)機再度升級,首次發(fā)布啟發(fā)互動式英語AI答疑輔學(xué)功能,實現(xiàn)個性化解決、啟發(fā)引導(dǎo)式提問、互動探究式學(xué)習(xí)。同時,基于訊飛星火打造的AI心理伙伴正式發(fā)布,它具備多模態(tài)情感識別、共情表達(dá)、尋因式提問、個性化心理指導(dǎo)四大核心能力,全方位呵護(hù)孩子的心理健康。
實際上,科大訊飛在細(xì)分行業(yè)領(lǐng)域積累的經(jīng)驗不僅限于教育,包括醫(yī)療、智慧城市、金融、法律、工業(yè)等諸多領(lǐng)域,科大訊飛也均有豐富的經(jīng)驗,而這正是其可以面向諸多垂直行業(yè)推出“大模型+”的底氣所在。比如,在此次科大訊飛1024開發(fā)者節(jié)上,科大訊飛推出了醫(yī)療大模型和訊飛曉醫(yī)APP,為每個家庭提供健康助手,正是基于科大訊飛在智慧醫(yī)療行業(yè)的多年積累,科大訊飛的智醫(yī)助理在2017年就以456分(合格線360分)通過了國家臨床執(zhí)業(yè)醫(yī)師資格考試,目前已覆蓋426個覆蓋區(qū)縣,累計輔助診斷次數(shù)6.9億次。
此外,為了進(jìn)一步加速大模型行業(yè)落地,科大訊飛聯(lián)合行業(yè)龍頭共同發(fā)布12個行業(yè)大模型,包含金融、汽車、運營商、工業(yè)、住建、物業(yè)、法律等行業(yè),加速產(chǎn)業(yè)升級。
其二,行業(yè)大模型本身的門檻,使得它對大模型企業(yè)提出了很高的戰(zhàn)略要求。從大模型技術(shù)密集、資金密集、技術(shù)迭代快的特點來看,任何不具備超強研發(fā)實力的企業(yè),都很難經(jīng)得起市場的考驗。但從國內(nèi)人工智能行業(yè)發(fā)展現(xiàn)狀來看,目前我國“人工智能+行業(yè)”的投入最多不過10來年時間,專業(yè)的人工智能人才成長起來,則至少需要5年以上的技術(shù)和行業(yè)經(jīng)驗,但當(dāng)下很多行業(yè)內(nèi)的人員,遠(yuǎn)遠(yuǎn)達(dá)不到這一水平。而作為國內(nèi)最早做人工智能的科技企業(yè),訊飛在該領(lǐng)域深耕已經(jīng)25年了,人才基礎(chǔ)好、團(tuán)隊信任度高,高中腰部人才梯隊完備,這使其具備很強的研發(fā)實力,因而在大模型上它更夠?qū)崿F(xiàn)有效轉(zhuǎn)化,對市場風(fēng)向的預(yù)測也更加精準(zhǔn),更容易推陳出新、加速技術(shù)迭代。
其三,大模型本身的復(fù)雜性,使得大模型的落地并不能僅僅依靠一家企業(yè)的能力,而是需要有號召力的科技巨頭來發(fā)揮牽引作用,推動整個產(chǎn)業(yè)生態(tài)的完善和壯大。作為一家有影響力的技術(shù)巨頭,科大訊飛具備強大的產(chǎn)業(yè)協(xié)作能力,這是其能夠?qū)崿F(xiàn)技術(shù)成果“井噴”的重要因素。
比如,在本次科大訊飛1024開發(fā)者節(jié)上,其不僅展示了為數(shù)眾多的各種大模型產(chǎn)品,還展示了龐大的產(chǎn)業(yè)生態(tài),這里匯集了幾十種展品,更有搭載星火認(rèn)知大模型的開放平臺,聯(lián)合550多萬開發(fā)者,共同打造技術(shù)、場景、服務(wù)多元賦能的共創(chuàng)共榮的AI生態(tài)。也正是基于以上諸多優(yōu)勢,科大訊飛才能夠在推動大模型落地行業(yè)方面先人一步。
搶占算力制高點已成破局關(guān)鍵
從行業(yè)來看,大模型的復(fù)雜性要求廠商必須做到“十項全能”,算力、算法、數(shù)據(jù)、資金、人才,團(tuán)隊都必須足夠優(yōu)秀,缺一個都不行,可見AI大模型本質(zhì)上是一場贏家通吃的游戲。而在諸多因素之中,搶占高性能算力,已經(jīng)成為當(dāng)下國產(chǎn)廠商突破技術(shù)瓶頸的核心關(guān)鍵。
一方面,是中國AI算力需求呈現(xiàn)出高速增長的態(tài)勢。另一方面,隨著國內(nèi)大模型的蓬勃發(fā)展,支撐AI核心算力的高性能算力面臨短缺,算力吃緊的局面日益凸顯。硬件層面,由于國內(nèi)高端GPU芯片的缺乏,使得國外發(fā)布的高性能算力芯片一經(jīng)發(fā)布就遭到了哄搶,產(chǎn)品價格也水漲船高,還時刻面臨“缺貨”的風(fēng)險。軟件層面,AI時代大量使用的張量計算也跟傳統(tǒng)計算機時代的方式不同,AI算力需求的迅速增長,要求國產(chǎn)大模型廠商不僅要注重算力芯片的硬件建設(shè),還需要注重基礎(chǔ)軟件的創(chuàng)新。也就是說,想要做好大模型訓(xùn)練,不僅要做到硬件層面的更新?lián)Q代,還需要軟件層面的持續(xù)創(chuàng)新。
目前來看,想要發(fā)展大模型要么發(fā)力自研,要么高價購買外國芯片承擔(dān)風(fēng)險,而科大訊飛選擇了第三條路,與華為展開合作,共同致力于國產(chǎn)AI大模型的自主創(chuàng)新。作為當(dāng)前國產(chǎn)自主算力的代表作之一,華為昇騰平臺憑借華為自研的達(dá)芬奇架構(gòu)技術(shù),實現(xiàn)了業(yè)界最佳性能與能效,支持云邊端全棧全場景應(yīng)用。目前華為昇騰的AI集群已經(jīng)全面升級,已經(jīng)從最初的4000卡集群擴展到16000卡集群,是業(yè)界首個萬卡集群,擁有更快的訓(xùn)練速度和30天以上的穩(wěn)定訓(xùn)練周期。
早在今年7月份,就有報道介紹,在充分利用昇騰這樣的國產(chǎn)化算力平臺基礎(chǔ)上,訊飛搭建了自研的火石平臺。該平臺突破了大模型數(shù)據(jù)的系數(shù)化,低精度的量化以及高效適配等問題,加速了AI大模型的落地。同時訊飛星火也實現(xiàn)了訓(xùn)練和數(shù)據(jù)閉環(huán)的全流程設(shè)計,大模型訓(xùn)練和推理的一體化設(shè)計等等創(chuàng)新工作。在10月24日的開發(fā)者節(jié)上,科大訊飛更是宣布將聯(lián)合昇騰AI打造算力底座“飛星一號”,進(jìn)一步將雙方的合作提升到一個新的高度。
自主算力和自研平臺的結(jié)合,對于國產(chǎn)大模型來說有著深遠(yuǎn)的意義。
據(jù)預(yù)計,借助雙方不斷升級的算力基礎(chǔ)設(shè)施,科大訊飛將參與到更大規(guī)模的參數(shù)訓(xùn)練之中去,為趕上乃至超越GPT-4奠定基礎(chǔ)。同時,借助高效、穩(wěn)定、安全可控的國產(chǎn)算力基礎(chǔ)設(shè)施,更多普惠行業(yè)的國產(chǎn)AI應(yīng)用成果或?qū)⒂瓉怼按蟊l(fā)”。比如,在本次開發(fā)者節(jié)上,科大訊飛就展示了包含金融、汽車、運營商、工業(yè)、住建、物業(yè)、法律等諸多行業(yè)大模型,這些技術(shù)成果的集中涌現(xiàn),充分說明了底層原生技術(shù)的重要性。
國產(chǎn)AI大模型“Wintel時刻”已至
從業(yè)內(nèi)來看,目前業(yè)界對于大模型落地的探索,已經(jīng)初步分化出了不同的路線。具體可分為三種類型:第一種是按照使用量收費模式,就是通過AI公司研發(fā)大模型并對外提供應(yīng)用產(chǎn)品或API;第二種是谷歌模式,即從底層TPU芯片,到云基礎(chǔ)設(shè)施再到大模型產(chǎn)品全部自研;第三種則是“OpenAI+微軟”模式,雙方各自發(fā)揮自身的優(yōu)勢相互配合,共同助力大模型產(chǎn)業(yè)的發(fā)展,有點類似PC時代的“Wintel聯(lián)盟”,這和科大訊飛與華為的合作有異曲同工之妙。
作為個人計算機歷史上的一大里程碑,Wintel聯(lián)盟無疑是史上最成功的產(chǎn)業(yè)聯(lián)盟之一,其成功之處在于,通過將微軟Windows操作系統(tǒng)和英特爾硬件融合,使之達(dá)到了三個方面的效果:第一,軟硬件的兼容性,極大地降低了產(chǎn)業(yè)成本提高了行業(yè)效率;第二,微軟的軟件和英特爾的硬件相互配合、優(yōu)勢互補,各自將自身優(yōu)勢發(fā)揮到最大;第三,軟硬件相互推動,加速產(chǎn)業(yè)迭代和創(chuàng)新。比如,微軟軟件的創(chuàng)新,會推動英特爾加速硬件的性能提升;而英特爾硬件性能的提升,也會加速微軟軟件的迭代,由此形成不斷強化的產(chǎn)業(yè)飛輪,同時成就了微軟和英特爾兩大PC霸主。
如今,同樣的事情也在人工智能領(lǐng)域開始上演了。比如,全球云巨頭亞馬遜就與HuggingFace等開源新勢力展開了合作,大數(shù)據(jù)巨頭Databricks豪擲13億美元收購大模型初創(chuàng)公司MosaicML,微軟和OpenAI的合作等都是這一思路的延伸。
而從目前國內(nèi)大模型企業(yè)的發(fā)展情況來看,圍繞做產(chǎn)業(yè)生態(tài)的思路,已經(jīng)有越來越多的產(chǎn)業(yè)聯(lián)盟開始在大模型領(lǐng)域漸次鋪開,科大訊飛與華為的牽手,無疑是一個很好的行業(yè)示范。作為整個產(chǎn)業(yè)鏈、生態(tài)鏈中的核心企業(yè),它們的牽手可以起到“牽一發(fā)而動全身”的作用,帶動整個產(chǎn)業(yè)生態(tài)迅速完善起來,從而為更高質(zhì)量的大模型發(fā)展鋪平道路。
科大訊飛董事長劉慶峰在1024開發(fā)者節(jié)的主論壇演講中說,2014年上半年,訊飛星火將對標(biāo)ChatGPT4:“這絕不僅僅是一個簡單的技術(shù)對標(biāo)問題,我們要走出自己的技術(shù)路線,走出自己的產(chǎn)業(yè)方向,形成自己完整的生態(tài)。從這個角度來說,大模型時代的序幕才剛剛拉開!”
相信隨著更多產(chǎn)業(yè)生態(tài)的建立和完善,國產(chǎn)AI大模型或?qū)⒂瓉韺儆谧约旱摹癢intel時刻”,屆時作為核心企業(yè)的科大訊飛,也將受益于整個產(chǎn)業(yè)的進(jìn)步構(gòu)建起更強大的生態(tài)壁壘。
文/劉曠公眾號,ID:liukuang110