說起近兩年最熱門的話題,那一定非大模型莫屬了。眾所周知,伴隨著ChatGPT的強(qiáng)勢(shì)出圈,全球范圍內(nèi)掀起了一波人工智能熱潮,國(guó)內(nèi)外的諸多企業(yè)都開足馬力,推出了自己的大模型產(chǎn)品。而AI大模型產(chǎn)品的不斷問世,也上演了一番“百模大戰(zhàn)”的盛況。隨著越來越多AI大模型產(chǎn)品的相繼推出,AI大模型的落地應(yīng)用也逐漸提上了日程,成為了各行各業(yè)的重點(diǎn)關(guān)注方向。
值得注意的是,除了通用大模型之外,針對(duì)細(xì)分行業(yè)的垂直大模型數(shù)量也日漸增多,醫(yī)療場(chǎng)景更是受到各方關(guān)注的重點(diǎn)領(lǐng)域。事實(shí)上,自2023年以來,已經(jīng)有諸多頭部企業(yè)都在加碼醫(yī)療大模型領(lǐng)域,而這也意味著大模型正在逐漸深入醫(yī)療行業(yè)。
大模型,醫(yī)療行業(yè)的新加速器?
近兩年,AI大模型的熱度居高不下,各行各業(yè)都在積極擁抱AI大模型,希望AI大模型能夠?yàn)樾袠I(yè)帶來新的變化,醫(yī)療行業(yè)也不例外。AI大模型這股風(fēng)已然吹到了醫(yī)療行業(yè),一系列與醫(yī)療相關(guān)的大模型產(chǎn)品和應(yīng)用正在相繼涌現(xiàn)出來。比如,京東健康正式發(fā)布了面向醫(yī)療健康行業(yè)的大模型“京醫(yī)千詢”;百度正式發(fā)布國(guó)內(nèi)首個(gè)“產(chǎn)業(yè)級(jí)”醫(yī)療大模型“靈醫(yī)大模型”;醫(yī)聯(lián)正式發(fā)布了自主研發(fā)的醫(yī)療大語(yǔ)言模型MedGPT;衛(wèi)寧健康則是發(fā)布了醫(yī)療領(lǐng)域大模型“WiNGPT”。在各路玩家相繼布局醫(yī)療大模型背后,也自有其邏輯。
對(duì)企業(yè)來說,AI大模型的引入,有助于提升醫(yī)療效率,降低成本。AI大模型是深度學(xué)習(xí)模型,這也就意味著AI大模型具備很強(qiáng)的學(xué)習(xí)能力,能夠?qū)A繑?shù)據(jù)進(jìn)行分析和處理,并進(jìn)行推理和預(yù)測(cè)。正因如此,醫(yī)療大模型能夠?qū)︶t(yī)療數(shù)據(jù)進(jìn)行分析和整理,并根據(jù)醫(yī)療信息進(jìn)行相應(yīng)的診斷,輔助醫(yī)生進(jìn)行診斷,而這可以在一定程度上促進(jìn)醫(yī)護(hù)工作者醫(yī)療效率的提高。比如,醫(yī)療大模型就能夠?qū)⑨t(yī)生口述轉(zhuǎn)化為帶有對(duì)話語(yǔ)言的結(jié)構(gòu)化筆記,極大地節(jié)省了醫(yī)生手寫病歷的時(shí)間,提升了工作效率。
對(duì)用戶來說,AI大模型產(chǎn)品的推出,有助于進(jìn)一步提升患者的就診體驗(yàn),為其提供全方位醫(yī)療服務(wù)。不同于其他需求,用戶的就醫(yī)需求是長(zhǎng)期存在的,但受各類因素影響,患者往往面臨著多種難題,比如候診時(shí)間長(zhǎng)、找不到相應(yīng)科室等等,就醫(yī)過程中所遇到各種突發(fā)問題,也影響了患者的就醫(yī)體驗(yàn)。而醫(yī)療大模型的出現(xiàn),則有望解決患者在就醫(yī)過程中所遇到的痛點(diǎn)問題,為患者帶去更加高效、優(yōu)質(zhì)的就醫(yī)體驗(yàn)。比如,在診前環(huán)節(jié),醫(yī)療大模型就能夠根據(jù)患者的就醫(yī)需求,為其推薦相應(yīng)的科室,解決了患者不知道該掛哪個(gè)科室的問題。
除此之外,AI大模型的出現(xiàn)與應(yīng)用,也能夠在一定程度上助推醫(yī)療行業(yè)數(shù)字化轉(zhuǎn)型加速。眾所周知,數(shù)字化轉(zhuǎn)型早已成為了各行業(yè)企業(yè)的重點(diǎn)發(fā)力方向之一,醫(yī)療行業(yè)也不例外。然而,不同于其他行業(yè),醫(yī)療行業(yè)具備極大的特殊性和嚴(yán)肅性,再加上各地的基礎(chǔ)設(shè)施建設(shè)情況不同、新舊系統(tǒng)共存,醫(yī)療行業(yè)存在著明顯的“信息孤島”現(xiàn)象,而這也是醫(yī)療行業(yè)數(shù)字化轉(zhuǎn)型速度緩慢的重要原因所在。
AI大模型在醫(yī)療領(lǐng)域擁有廣闊的應(yīng)用場(chǎng)景,隨著AI大模型和醫(yī)療結(jié)合程度的加深,或?qū)⒂兄谕苿?dòng)醫(yī)療行業(yè)朝著更加數(shù)字化、智能化的方向發(fā)展。
百度、騰訊“水到渠成”
在這波AI大模型浪潮中,跑在最前面的無疑是互聯(lián)網(wǎng)大廠,以百度、阿里、騰訊為代表的互聯(lián)網(wǎng)大廠都相繼推出了自家的AI大模型產(chǎn)品,比如,百度的“文心一言”大模型、阿里的“通義千問”大模型、騰訊的“混元”大模型。由于醫(yī)療行業(yè)被視為AI大模型落地的最佳領(lǐng)域之一,醫(yī)療行業(yè)也掀起了一波大模型熱潮,許多互聯(lián)網(wǎng)大廠也推出了自己的醫(yī)療大模型產(chǎn)品。比如,百度發(fā)布了“靈醫(yī)大模型”、騰訊則是推出了“騰訊醫(yī)療大模型”。而互聯(lián)網(wǎng)大廠之所以能夠率先推出面向醫(yī)療行業(yè)的大模型產(chǎn)品,與其長(zhǎng)時(shí)間的積累不無關(guān)系。
一方面,百度、騰訊都已經(jīng)推出了自研的通用大模型產(chǎn)品,有研發(fā)大模型產(chǎn)品的經(jīng)驗(yàn),這些經(jīng)驗(yàn)?zāi)軌驗(yàn)槠鋵S玫尼t(yī)療大模型產(chǎn)品的推出提供借鑒和參考。
長(zhǎng)期以來,以百度、騰訊為代表的互聯(lián)網(wǎng)大廠都格外關(guān)注人工智能領(lǐng)域,并且在該領(lǐng)域持續(xù)深耕,積累了深厚的技術(shù)實(shí)力,而這些都為其推出AI大模型產(chǎn)品打下了堅(jiān)實(shí)基礎(chǔ),也助推了其垂直大模型產(chǎn)品的出現(xiàn)。比如,百度、騰訊等互聯(lián)網(wǎng)大廠就在自研的通用大模型的基礎(chǔ)上,引入專業(yè)的醫(yī)學(xué)數(shù)據(jù),對(duì)大模型進(jìn)行訓(xùn)練和微調(diào),最終推出面向醫(yī)療行業(yè)的專用大模型產(chǎn)品。具體來看,騰訊的醫(yī)療大模型就是基于騰訊全鏈路自研混元大模型研發(fā)的;百度的“靈醫(yī)”大模型的技術(shù)底座同樣來自于此前的文心一言大模型。
另一方面,百度、騰訊等互聯(lián)網(wǎng)大廠在醫(yī)療健康領(lǐng)域有所布局,有行業(yè)數(shù)據(jù)的積累。
一直以來,互聯(lián)網(wǎng)大廠都在積極拓展業(yè)務(wù)版圖,其中醫(yī)療健康領(lǐng)域就是其重點(diǎn)布局的領(lǐng)域之一。以百度為例,百度不僅推出了深耕醫(yī)療領(lǐng)域的AI醫(yī)療品牌“靈醫(yī)智惠”,還打造了能夠提供健康科普、在線問診等服務(wù)的一站式健康管理平臺(tái)“百度健康”。正因如此,百度、騰訊等互聯(lián)網(wǎng)大廠積累下來了大量醫(yī)療數(shù)據(jù),這些數(shù)據(jù)積累使其推出專業(yè)的醫(yī)療大模型產(chǎn)品成為可能。據(jù)了解,在模型訓(xùn)練過程中,百度大健康事業(yè)群(HCG)先后投入了自有積累的超1000萬優(yōu)質(zhì)醫(yī)療問答數(shù)據(jù)、超2000萬多語(yǔ)種醫(yī)學(xué)專業(yè)知識(shí)、超2億用戶每日醫(yī)療類搜索數(shù)據(jù)、超5億權(quán)威健康科普內(nèi)容。無獨(dú)有偶,騰訊的醫(yī)療大模型加入了超過285萬醫(yī)療實(shí)體、1250萬醫(yī)學(xué)關(guān)系、超98%醫(yī)學(xué)知識(shí)的知識(shí)圖譜和醫(yī)學(xué)文獻(xiàn)。
微脈、衛(wèi)寧健康“乘勢(shì)而起”
醫(yī)療大模型熱度正高,除了互聯(lián)網(wǎng)大廠頻頻布局之外,自然也少不了本行業(yè)玩家的參與,互聯(lián)網(wǎng)醫(yī)療企業(yè)同樣是落子不斷。具體來看,全病程管理平臺(tái)微脈正式發(fā)布了其自主研發(fā)的健康管理領(lǐng)域大語(yǔ)言模型應(yīng)用——CareGPT;衛(wèi)寧健康則是正式推出了醫(yī)療領(lǐng)域大模型——WiNGPT。在互聯(lián)網(wǎng)醫(yī)療企業(yè)積極擁抱AI大模型背后,也并非毫無緣由。
一來,微脈、衛(wèi)寧健康擁有豐富的醫(yī)療行業(yè)經(jīng)驗(yàn),以及海量的醫(yī)療數(shù)據(jù),能為其訓(xùn)練醫(yī)療大模型奠定基礎(chǔ)。
數(shù)據(jù)對(duì)于AI大模型的重要性可想而知,AI大模型的能力之所以能夠不斷進(jìn)化和提升,離不開數(shù)據(jù)的支撐。尤其是對(duì)行業(yè)大模型來說,行業(yè)數(shù)據(jù)更是格外重要。而無論是微脈,還是衛(wèi)寧健康,都長(zhǎng)期深耕于醫(yī)療健康領(lǐng)域,有著專業(yè)的醫(yī)療知識(shí)庫(kù)。得益于此,微脈、衛(wèi)寧健康都積累下來了海量的、高質(zhì)量的醫(yī)療數(shù)據(jù),這些數(shù)據(jù)無疑是大模型產(chǎn)品的優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)集,能夠幫助二者訓(xùn)練出精準(zhǔn)度更高、可靠性更強(qiáng)的醫(yī)療大模型產(chǎn)品。據(jù)了解,微脈的CareGPT在訓(xùn)練階段就以循證醫(yī)學(xué)為基礎(chǔ),使用了目前最新版本臨床醫(yī)學(xué)指南、疾病診療模型、專家共識(shí)等超10億的醫(yī)學(xué)文本數(shù)據(jù),以及百萬條微脈個(gè)案管理數(shù)據(jù),形成??茖2」芾淼尼t(yī)療健康知識(shí)庫(kù),并投入超過100位個(gè)案管理師參與RLHF監(jiān)督調(diào)試訓(xùn)練。另一組數(shù)據(jù)顯示,在2023年5月,WiNGPT訓(xùn)練的數(shù)據(jù)量已達(dá)到9720項(xiàng)藥品知識(shí)、7200余項(xiàng)疾病知識(shí)、2800余項(xiàng)檢查檢驗(yàn)知識(shí)、1100余份指南文檔,總訓(xùn)練Token數(shù)達(dá)37億。
二來,微脈、衛(wèi)寧健康的業(yè)務(wù)與醫(yī)療大模型有著天然的契合度,更容易實(shí)現(xiàn)醫(yī)療大模型的落地與應(yīng)用,有望助推其業(yè)務(wù)的進(jìn)一步發(fā)展。
除了大模型產(chǎn)品的推出之外,后續(xù)的落地應(yīng)用同樣是相當(dāng)重要的一環(huán)。由于微脈、衛(wèi)寧健康本身就是互聯(lián)網(wǎng)醫(yī)療企業(yè),其業(yè)務(wù)開展也都圍繞著醫(yī)療健康方面,醫(yī)療大模型與其業(yè)務(wù)有著很高的契合度,更容易實(shí)現(xiàn)落地。比如,CareGPT就能對(duì)患者聊天內(nèi)容進(jìn)行分析,可以幫助患者自主進(jìn)行初步的身體狀況篩查,實(shí)現(xiàn)分診導(dǎo)診的智能化輔助,提升患者管理的效率。隨著醫(yī)療大模型產(chǎn)品能力的不斷進(jìn)化,并且逐漸應(yīng)用到具體場(chǎng)景中,醫(yī)療大模型也能夠?yàn)榛ヂ?lián)網(wǎng)醫(yī)療企業(yè)業(yè)務(wù)賦能,有望為其帶來新的業(yè)務(wù)增長(zhǎng)點(diǎn)。
醫(yī)療大模型這條路還很遠(yuǎn)
得益于人工智能技術(shù)的蓬勃發(fā)展,以及相關(guān)技術(shù)在醫(yī)療場(chǎng)景的逐漸應(yīng)用,AI醫(yī)療正在逐漸成為現(xiàn)實(shí),醫(yī)療大模型的出現(xiàn)更是有望為醫(yī)療行業(yè)注入新的發(fā)展動(dòng)力。當(dāng)前,AI大模型浪潮席卷而來,無論是互聯(lián)網(wǎng)大廠,還是互聯(lián)網(wǎng)醫(yī)療企業(yè),都不愿意錯(cuò)失這個(gè)機(jī)會(huì),紛紛乘浪而上。只是,必須要說的是,醫(yī)療大模型雖蘊(yùn)含著機(jī)遇,但同樣有著門檻。
一是,醫(yī)療大模型容錯(cuò)率低,廠商們還需要不斷打磨產(chǎn)品。不同于其他行業(yè),醫(yī)療行業(yè)有著很強(qiáng)的嚴(yán)肅性和專業(yè)性,可以說是不容有失,這也就意味著醫(yī)療大模型產(chǎn)品的容錯(cuò)率極低,這就對(duì)廠商們提出了更高的要求。為了避免此類情況的發(fā)生,發(fā)力于此的廠商們必須保持審慎的態(tài)度,不斷打磨產(chǎn)品本身,以提升大模型產(chǎn)品的能力。
二是,醫(yī)療數(shù)據(jù)的隱私性高、數(shù)據(jù)處理難度大,醫(yī)療大模型的訓(xùn)練不易。
眾所周知,由于醫(yī)療數(shù)據(jù)往往涉及患者本身,因此具備很高的私密性,但大模型能力的訓(xùn)練又需要大量數(shù)據(jù)為支撐,對(duì)研發(fā)醫(yī)療大模型的廠商來說,數(shù)據(jù)的獲得有著比較高的難度。
不僅如此,由于數(shù)據(jù)標(biāo)準(zhǔn)不一,醫(yī)療行業(yè)的數(shù)據(jù)處理同樣難度較高,需要醫(yī)療大模型廠商多下功夫。就目前情況來看,醫(yī)療大模型產(chǎn)品的誕生或許能夠?yàn)獒t(yī)療行業(yè)帶來發(fā)展新機(jī)遇,幫助企業(yè)降本增效、為患者帶來更加優(yōu)質(zhì)的就醫(yī)體驗(yàn),但由于醫(yī)療大模型尚處于剛剛開始發(fā)展的階段,難關(guān)同樣有很多,需要廠商們?nèi)タ缭健?/p>
總而言之,醫(yī)療大模型產(chǎn)品的推出并不意味著結(jié)束,反而是新的起點(diǎn),無論是互聯(lián)網(wǎng)大廠,還是互聯(lián)網(wǎng)醫(yī)療企業(yè),都不能掉以輕心,這場(chǎng)競(jìng)賽仍持續(xù)進(jìn)行中。