2025 年大模型技術(shù)在應(yīng)用側(cè)的新趨勢是什么?哪些新的技術(shù)方向值得關(guān)注?企業(yè)在規(guī)劃? 2025 年數(shù)字化項目時有哪些核心關(guān)注點?本文將基于愛分析與企業(yè)用戶、模型廠商的調(diào)研交流中,抽象和總結(jié)出 2025 年的趨勢和洞察,供大家參考。
分享嘉賓|張揚?愛分析 聯(lián)合創(chuàng)始人兼首席分析師
01、2025 年大模型如何賦能企業(yè)數(shù)字化建設(shè)?
從數(shù)字化的核心主導方針來看,2025 年已經(jīng)明確圍繞價值創(chuàng)造展開。
宏觀環(huán)境方面,在今年四季度初時,大家對于政策有良好的預期,但從實際落地的角度來看,很多企業(yè)用戶、廠商用戶從政府側(cè)回款的周期還是比較緩慢,盡管已經(jīng)有 10 萬億的投放預期,但實際的業(yè)務(wù)變化以及經(jīng)營狀況的變化,在 2025 年還是緩慢恢復的過程。
所以在 2025 年大家做數(shù)字化規(guī)劃時,應(yīng)該以創(chuàng)造價值為核心導向,更多的關(guān)注業(yè)務(wù)收益,以及重點關(guān)注技術(shù)對于業(yè)務(wù)收益創(chuàng)造有哪些核心點。
大模型2025 年技術(shù)趨勢
上圖左邊的技術(shù)架構(gòu)是大模型完整的全鏈路技術(shù)架構(gòu),從上層的戰(zhàn)略域,到下轄的應(yīng)用域和管理域,再到基礎(chǔ)的框架域、能力域,和與框架域、能力域并行的上下文域,以及最底下的基礎(chǔ)設(shè)施的計算域。從中我們總結(jié)了幾點核心的技術(shù)趨勢。
第一是戰(zhàn)略域,是從整個大模型的技術(shù)架構(gòu)探索的一個新方向。
所謂的快思考和慢思考主要映射的是人體大腦的兩個系統(tǒng),一個是靠直覺,一個是靠推理。直覺系統(tǒng)可以理解為快思考的系統(tǒng),推理系統(tǒng)可以理解為慢思考的系統(tǒng)。過去大模型的生成能力基本是圍繞快思考的方向展開的,類似于利用人腦系統(tǒng)里面的直覺去做。對于要求響應(yīng)速度快,或者業(yè)務(wù)場景沒有太復雜的企業(yè)應(yīng)用,快思考會比較適合。例如大家現(xiàn)在用的知識庫、內(nèi)容生成、營銷素材生成、視頻生成等,都適用直覺的快思考的方式。而對于復雜的業(yè)務(wù)場景,一方面需要有大量的業(yè)務(wù) KnowHow 和業(yè)務(wù)知識,另外一方面也需要有比較完整的思考邏輯,也就是推理邏輯。在過去的大模型應(yīng)用落地時有很大的欠缺,很多企業(yè)也在通過做預訓練或者微調(diào)嘗試彌補專業(yè)知識的差距,都屬于從框架域和能力域的角度來解決問題。如果以更高維度的戰(zhàn)略域角度出發(fā),更多是企業(yè)內(nèi)在邏輯推理過程的理解。不管是用思維鏈的方式,還是把整個思考推理的邏輯訓練到模型里,要遠比純粹的知識訓練維度更高。這也就是從ChatGPT 4-o 提出的慢思考過程,在整個企業(yè)的大模型技術(shù)架構(gòu)里,不只有直接的推理,還有很多思維鏈的邏輯推理,這就更適合復雜的業(yè)務(wù)場景,例如可以用大模型做數(shù)據(jù)分析背后更加深入的下鉆、歸因、根因分析,包括潛在的應(yīng)對解決方案的分析。所以從模型推理的場景角度來看,會因為慢思考的加入,2025 年大模型的應(yīng)用將逐步深入到企業(yè)更加復雜的業(yè)務(wù)場景里。
第二是框架域,框架域的兩個核心點,一個是Agent,一個是RAG
RAG 在 2025 年核心趨勢的判斷是 RAG 的工程化會越來越成熟,幻覺的消除更多是時間長短的問題。從消除幻覺的理論基礎(chǔ)上是比較容易理解和成熟的,本質(zhì)是當有理有據(jù)的專家知識輸入時,模型的幻覺會自然消失。所以在實踐落地的過程中, RAG 具體的工程化策略中,消除幻覺是需要長時間且逐步成熟的過程。今年我們看到基于傳統(tǒng) RAG 已經(jīng)提升到 RAG 2.0,還有 Graph RAG 和新提出來的雙層信息過濾框架,這些不同的 RAG 路線,可以理解為不同的工程化策略和手段,這些工程化的策略和手段目前已經(jīng)很豐富,而且依然不停地有新的工程化路線出來,也意味著這些工程化手段的落地門檻,或者落地工具也會越來越成熟。所以預計在 2025 年末,隨著工程化手段的增加和工程化本身的能力提升,基本消除幻覺問題是可以做到的。以及企業(yè)用戶對于準確性的關(guān)注度將會降低,不再是第一位考慮的問題,因為在一些復雜場景里是無法 100% 解決幻覺的,但可能在絕大部分場景里,幻覺將不再是一個問題。
第三是能力域,包括多模態(tài)的視頻模態(tài)和端側(cè)大模型。
多模態(tài)的視頻模態(tài)肯定是 2025 年最核心最大的能力突破。一些大模型廠商、基模廠商的下一步將重點做這個方向,以及 2025 年一些 To C 的新場景迸發(fā)出來,基本也是在多模態(tài)領(lǐng)域。舉個例子,短視頻核心的組成元素包括背景音樂、文本腳本、真人表演。目前文本生成已經(jīng)不成問題,背景音樂從技術(shù)能力角度來看,大模型生成的音樂不管是從音樂多樣性的風格,還是音樂的成熟度,都已經(jīng)比較高了,只不過是欠缺一個爆款音樂的出現(xiàn),所以核心要解決的是自動化生成視頻。從 C 端的應(yīng)用角度來看,一些成熟的視頻大廠,以及基模廠商,都將會在 2025 年重點突破和關(guān)注這個方向。
2025 年消費級AI手機逐步成熟,端側(cè)大模型向企業(yè)場景滲透
當前端側(cè)大模型的場景出現(xiàn)的比較少,但是從未來的角度來說,尤其是在 2025 年,端側(cè)大模型的滲透會呈現(xiàn)比較明顯的增長趨勢。原因之一:隨著消費場景的變化,2025 年發(fā)售的手機將變成 AI 手機。端側(cè)的大模型會成為AI手機的標配,模型量化技術(shù)的成熟度在 2025 年會越來越高,尤其是在手機的端側(cè)模型中。原因之二:芯片廠商有足夠強的芯片設(shè)計適配,目前模型廠商和芯片廠商也有一些比較好的組合方式,正在向手機廠商做端側(cè)模型的輸出。
端側(cè)模型在企業(yè)場景中也滲透了三個核心場景。
第一是一線人員的作業(yè)場景。過去人員作業(yè)是紙質(zhì)的,有了手機之后變成移動終端,現(xiàn)在是從移動終端再一次升級成智能終端。
第二是在設(shè)備作業(yè)場景。一線有大量的設(shè)備作業(yè)場景,跟人員作業(yè)的場景邏輯類似,面對設(shè)備自身的生產(chǎn)控制、設(shè)備自身的維修時,設(shè)備自身的智能化能力越強,便可以預見性的提前發(fā)現(xiàn)問題,包括生產(chǎn)過程中生產(chǎn)質(zhì)量的自檢,也可以成為端側(cè)模型應(yīng)用的方向之一。
第三是圍繞端側(cè)的決策分析。典型的是設(shè)備能耗管理,或者車機端的輔助駕駛,或者人工交互展開的角色分析場景,也是比較好的應(yīng)用方向??偟膩碚f,從人員作業(yè)、設(shè)備作業(yè)和角色分析場景都是 2025 年比較好的應(yīng)用和突破方向,同時降本的效果也會比較明顯。
02、2025 年,企業(yè)大模型落地趨勢
首先是對企業(yè)模型支出方面的影響。2025 年會因為大環(huán)境的影響,企業(yè)IT預算會呈現(xiàn)微降的趨勢。但從實際預算的投入項拆分來看,第一個傳統(tǒng)的業(yè)務(wù)系統(tǒng)改造和升級依然是最大的支出項,第二個是國家要求的信創(chuàng)部分也是一大支出,第三個是大模型,也是唯一一個 it 預算正增長的方向。預估 2025 年實際支出的增速能夠接近 100% ,做到 238 億元的級別。
從企業(yè)點角度會更加看重業(yè)務(wù)的短期收益,會在大模型軟件和服務(wù)上占更高比例的投入,而在硬件層面投入會趨于平緩。同時一部分已經(jīng)完成規(guī)劃的企業(yè),在大模型支出部分會維持在 5% ~ 10% 的it支出比例,這也可以給到正在做規(guī)劃的企業(yè)一個參考。接下來重點分析大模型落地部分的調(diào)研。
首先是落地的階段,在 2025 年處于觀望學習的企業(yè)不足30%,有 20% 的企業(yè)會到試點速贏的階段,也就是從早期的探索可研到試點速贏的過程中。所以明年將是大模型產(chǎn)品跨越鴻溝的一年,也是比較關(guān)鍵的一年。其次是落地手段,沒有太大的變化,大部分企業(yè)采取私有化部署開源模型+應(yīng)用定制開發(fā)的落地手段。再從落地目的來看,圍繞創(chuàng)造價值展開的增收還是比較困難的,所以最核心的創(chuàng)造價值還是圍繞降本和提升利潤展開。
最后是大模型落地的風險點,當前準確性/幻覺是第一位,但也看到數(shù)據(jù)和知識質(zhì)量的關(guān)注度有在迅速上升。這些是調(diào)研中定性層面的總結(jié),從落地的實際業(yè)務(wù)場景中,我們核心看到產(chǎn)研和科研場景的價值已得到企業(yè)用戶認可。產(chǎn)研和科研本來就是企業(yè)重點投入的方向,屬于知識密集型和資金密集型的典型應(yīng)用場景,與大語言模型的相關(guān)性和適應(yīng)程度比較高,所以產(chǎn)研和科研是值得企業(yè)用戶 2025 年重點嘗試的場景。企業(yè)用戶對大模型預期收益會在 2025 年會回歸理性。
我們調(diào)研中,對于已經(jīng)落地大模型的企業(yè),了解到項目預期收益達成情況中,少部分實現(xiàn)和完全未實現(xiàn)的占比28%,近 1/ 3。這其中可以看到大模型落地的實際價值,與企業(yè)用戶的預期之間還是有一定差距的,在 2025 年時,這個差距會是比較良性的。同時在 2025 年也會出現(xiàn)一些大模型實際收益沒有達到預期的場景案例,這其實對于整個行業(yè)的發(fā)展還是比較正向和健康的。
主要有兩個核心的原因:
第一個核心原因是 ROI 的問題,即投入太高以及對應(yīng)產(chǎn)出太低。例如 10 倍算力的投入支出只帶來了 KPI 提升的 10% ,這個就是典型的 ROI 太低的情況。而在 2025 年基本上已經(jīng)能很穩(wěn)健地去解決這個問題了,因為基礎(chǔ)硬件設(shè)施的投入會縮減,企業(yè)用戶會更注重些能看到立竿見影效果的場景應(yīng)用,對于大規(guī)模、長周期見效的技術(shù)設(shè)施投入接受度會比較低,所以這是能自然而然隨著企業(yè)用戶對于 IT 預算分布和 IT 預算投項變化而直接能解決的問題。
第二個是本地化部署和模型能力之間的掣肘與制約問題。比較典型的是測試的時候,用公有云的模型測試效果不錯,但是本地化部署上線的手段會導致模型能力的下降,下降的比例或者下降的程度根據(jù)不同的項目有所區(qū)別,這是不及企業(yè)用戶預期的另一個核心原因。而且本地化部署的落地手段不會因為效果不及預期從而發(fā)生任何變化,明年以及未來幾年都會以本地化部署為導向。從完整的模型效果來講,30%-40% 是由基礎(chǔ)模型決定的,30%-40% 是由 RAG 決定的,剩下的 20%-30% 是由微調(diào)決定的。
所以隨著 RAG 的逐漸成熟,想要改善模型效果,一方面可以利用微調(diào)做一些補充,需要等待微調(diào)工具鏈的進一步成熟,這也是改善本地化部署與模型能力掣肘的有效方式。另外一方面是應(yīng)用工程化的成熟度,隨著企業(yè)搭建越來越多的應(yīng)用,通用性會越來越強,可以將模型能力轉(zhuǎn)移到應(yīng)用中解決,不一定全部依托于模型能力,應(yīng)用的工程化的、成熟度的提高也能解決預期收益達成的問題,但這個問題可能需要兩年甚至三年的時間來長期解決??偟膩砜?,大模型的預期收益會在 2025 年逐漸回歸理性。以上就是此次分享的內(nèi)容。
畢業(yè)于清華大學及香港中文大學,杭州市金融科技創(chuàng)新項目應(yīng)用案例專家評委,原投中集團副總裁。十余年金融行業(yè)從業(yè)經(jīng)驗,在愛分析媒體平臺發(fā)文超過 500 篇,有很深的行業(yè)影響力。