作者?|??程茜,編輯?|??漠影
展望生成式AI下一個里程碑,萬千企業(yè)的數(shù)字分身加速進階。
智東西11月16日消息,今天,聯(lián)想集團發(fā)布了2023/24財年第二財季業(yè)績,整體營收達到1044億人民幣,凈利潤近20億人民幣,連續(xù)兩個季度環(huán)比提升。
其中,IDG(智能設備業(yè)務)個人電腦出貨量市占率近24%,SSG(方案服務業(yè)務)營收、運營利潤均創(chuàng)新高,聯(lián)想集團正在打造混合式AI專業(yè)服務;能為生成式AI全生命周期提供服務的ISG(基礎設施方案業(yè)務)受多重風險制約,存儲業(yè)務市場份額仍提升至全球第三。
眾所周知,生成式AI帶來的產業(yè)變革已經席卷全球各行各業(yè),其引發(fā)的技術變革成為當下產業(yè)的焦點。
10月24日,聯(lián)想創(chuàng)新科技大會上,聯(lián)想集團提出了AI for All的戰(zhàn)略,在聯(lián)想集團董事長兼CEO楊元慶看來,AI for All意味著讓AI惠及每一個人。
同時,聯(lián)想創(chuàng)新科技大會上,聯(lián)想集團展示了AI設備產品組合,并闡釋了自己對于生成式AI時代的理解——個人與企業(yè)級人工智能雙胞胎(AI Twin)。
此次發(fā)布財報之際,聯(lián)想集團還創(chuàng)新性地隨發(fā)了一個可視化科普視頻,在展望生成式AI下一個里程碑用AI重塑Enterprise Twin(企業(yè)級人工智能雙胞胎)的同時,將其對于AI行業(yè)的深入理解進行了層層拆解。
在此節(jié)點,智東西有幸與聯(lián)想研究院人工智能實驗室商務及運營總監(jiān)陳鋼、聯(lián)想研究院人工智能實驗室主任研究員王奇剛圍繞降低大模型訓練成本等話題進行了對話,深入探討了聯(lián)想集團正如何抓住AI發(fā)展與落地的重要突破口。
1.AI重塑企業(yè)在即,訓練模型難題何解?
自去年11月底至今,生成式AI引發(fā)的技術革新愈演愈烈,產業(yè)熱情被全面點燃。在這場空前緊迫的競賽中,以企業(yè)為主體的典型代表已經躍躍欲試,試圖在新興技術浪潮中搶占先手棋。
這場風暴的起點,最早可以追溯至人類“火種”的誕生,往后,每一次生產力工具的變革都推動了社會發(fā)展。數(shù)十萬年的薪火相傳,如今,在深度學習技術的驅動下,AI在人類生產力變革中扮演著重要的角色。
火堆、時鐘、汽車……短短20余秒的時間,視頻在逼真還原火焰物理效果的同時,沉浸式帶觀看者穿梭于不同時代背景,最終使得深度學習神經網絡被“點燃”。
產業(yè)變革至今,企業(yè)已經成為生成式AI下一個里程碑的重要主體。這也就是聯(lián)想集團今年在聯(lián)想創(chuàng)新科技大會上,提出的Enterprise Twin(企業(yè)級人工智能雙胞胎)概念。
企業(yè)在AI世界的數(shù)字分身能做什么?首先,它具備AI的強大學習和表達能力,能基于企業(yè)的獨家、私有知識進行訓練;其次,它能為此前大量依賴人類經驗的任務提供有數(shù)據(jù)、邏輯清晰的輔助決策;最后,它還能通過文字、圖像等形式,將關乎企業(yè)業(yè)務規(guī)劃的內容輸出。
視頻中構建于城市大大小小的建筑物以及其中萬千企業(yè)之上可視化的數(shù)字形象正是其最恰當?shù)捏w現(xiàn)。
然而,正如畫面中緩緩旋轉并隱隱散發(fā)出些許微光的黑箱,企業(yè)熱切擁抱AI之際需要深厚的技術功底和具有遠見卓識的行業(yè)視角,真正沖破黑箱,感知到AI對企業(yè)自身帶來的顛覆式革命尤為關鍵。
這其中的第一個黑箱就是“訓練模型”。飆漲的算力需求背后是真金白銀的AI芯片,鮮少有企業(yè)能獨立支撐如此大額的支出。
大模型訓練最關鍵的三個要素就是算力、算法、數(shù)據(jù),其中數(shù)據(jù)也是“Enterprise Twin能真正聽到企業(yè)完整的自主思考與內心獨白”的關鍵,也是構建其大腦的重中之重。
可以看到,市面上的大模型參數(shù)規(guī)模動輒上百億、千億,這轉換到企業(yè)的數(shù)字分身上就是經營、生產、銷售的每一處細節(jié)。
視頻中以手機和民航飛機發(fā)動機的葉片為例,對其零部件進行可視化處理的同時,清晰展現(xiàn)出了其背后的龐大數(shù)據(jù)規(guī)模。當將手機一層層“剝離”開時,每個生產環(huán)節(jié)中的信息都可能被轉化為數(shù)據(jù);發(fā)動機上的葉片也涉及數(shù)百萬零件的供應鏈體系。
龐大數(shù)據(jù)量的處理、以月為單位的訓練時間、極易出現(xiàn)的返工等風險,都是橫亙在企業(yè)面前的一道道難題。
但可以確定的是,企業(yè)積極、主動擁抱大模型已成必然趨勢,聯(lián)想集團則為這場前路莫測的創(chuàng)新革命,點亮了一盞引路燈。
2.企業(yè)數(shù)字分身普及殺手锏讓模型可用、好用、易用
這就是聯(lián)想集團自研的AI開發(fā)及運營平臺煉AI大師,覆蓋了企業(yè)構建Enterprise Twin的各個流程。
煉AI大師擁有圖像識別、語音識別、物體檢測等9類基礎模型,將模型訓練的各個環(huán)節(jié)層層剝開,既包含其中所需的龐大數(shù)據(jù),還能靈活應對企業(yè)業(yè)務不同環(huán)節(jié)所需的多模態(tài)、多語言數(shù)據(jù)。
針對于企業(yè)訓練大模型的核心痛點,結合煉AI大師的層層能力,聯(lián)想集團將為企業(yè)訓練出具有超強大腦的大模型總結為三大要點,分別是保證訓練出的模型準確可用、訓練成本可控、能擺脫通用大模型千億級規(guī)模龐大身軀。
技術路徑、文案、視頻內容相結合,將聯(lián)想集團在幫助企業(yè)降低大模型訓練成本中的核心思路進行了呈現(xiàn)。
在保證訓練出的模型準確可用方面,一般而言,通用大模型為了保證知識的廣度會預載綜合學科、語料庫等基礎數(shù)據(jù),煉AI大師就會根據(jù)企業(yè)所處的具體行業(yè)、實際需求進行篩選。
還有一大關鍵在于,如何讓企業(yè)盡早發(fā)現(xiàn)模型訓練中間的問題?;诖?,聯(lián)想集團自研了訓測一體的流程,王奇剛解釋說,將大模型的訓練和測試交叉進行,通過測試中間環(huán)節(jié)中大模型的表現(xiàn)效果,來綜合判斷實際的效果,如果出現(xiàn)問題就及時停止復查。
此外,為了讓企業(yè)在大模型訓練時具有數(shù)據(jù)配比的參考,聯(lián)想集團將自身采樣抽取的常用操作集成到了框架中,可以幫助企業(yè)以某種規(guī)則從大數(shù)據(jù)集中生成自己的數(shù)據(jù)配方。
王奇剛談道,因為數(shù)據(jù)質量對大模型精度的影響很大, 因此,聯(lián)想集團的研發(fā)人員正在研發(fā)將雜亂無章的數(shù)據(jù)以可視化的方式呈現(xiàn)出來,便于企業(yè)進行篩選、剔除劣質數(shù)據(jù),從而進一步提高模型訓練的效率。
其次,就是更為關鍵的降低訓練成本,聯(lián)想集團開發(fā)了專門對大模型進行二次預訓練、微調的LeLLM大模型框架,其中通過3D并行分布式訓練方案中的流水線并行、模型并行、數(shù)據(jù)并行,讓模型跑起來、跑得更快。
這一方案的實現(xiàn)路徑,通過視頻中被具象化的數(shù)據(jù)、服務器、GPU進行了層層剝離,通過動態(tài)的具體操作過程闡釋了其對于降低大模型訓練成本的意義。
王奇剛談道,聯(lián)想集團將他們在加快預訓練、微調速度等工作方面的經驗,集成到了LeLLM大模型框架中,并且這一框架也正在被集成到煉AI大師平臺中。
最后一步,就是幫助企業(yè)擺脫通用大模型千億級參數(shù)規(guī)模龐大身軀的技術——剪枝。剪枝可以剔除大模型中與企業(yè)無關的參數(shù),從700億精簡至70億甚至10億。
王奇剛介紹道,他們有兩種方案,一種是量化,將浮點數(shù)從32bit轉化為16bit、8bit或4bit,以達到成倍減少大模型體積的目的;又因為大模型內部和人腦類似,存在視覺、聽覺等分離區(qū)域,因此他們嘗試針對某個場景剪掉與之無關的區(qū)域,觀察其對大模型精度的影響等,這也是其第二種方案。
歸根結底,聯(lián)想集團要做的就是提高企業(yè)訓練大模型的成功率,同時降低成本。在這之后,大模型訓練、壓縮、推理、算力設施的一系列環(huán)節(jié)完成,也就意味著企業(yè)已經擁有了擁抱AI的底氣。
3.聯(lián)想“內生外化”心法為企業(yè)擁抱大模型“鋪路搭橋”
聯(lián)想展望生成式AI下一個里程碑,用AI重塑Enterprise Twin的背后,正是其多年技術與經驗積累的印證。
事實上,煉AI大師這一平臺的研發(fā)起步可以追溯至2016年,現(xiàn)在已經迭代至6.0版本,這一平臺是聯(lián)想集團內部、企業(yè)客戶等在AI開發(fā)過程中經驗的“集大成者”。陳鋼談道,煉AI大師的路線十分清晰,就是AI訓練推理的一站式平臺。前后版本的不同之處在于,此前煉AI大師面向的主要為中小模型,去年大模型爆火后,聯(lián)想集團迅速將其在大模型領域的工程化方法進行了集成。
除了技術外,還有聯(lián)想集團一以貫之的“內生外化”思路。聯(lián)想集團基于上述訓練方法,打造了公司內部局部試用的大模型,王奇剛透露說,聯(lián)想集團的一些業(yè)務部門可以直接登錄,與大模型進行對話,或者通過調用API,來實現(xiàn)企業(yè)級客服助手、知識管理等應用。如今,這一部分能力正在聯(lián)想集團內部和外部都爆發(fā)出強大的生命力。陳鋼談道,對于聯(lián)想而言,他們自己就是大模型的第一使用者。因此,聯(lián)想集團內部在積極推進內部產品迭代、升級的同時,積極將這一部分能力外化出去。王奇剛談道,這背后聯(lián)想集團的核心思路主要集中于兩點,首先不是任何公司都有能力從頭訓練大模型,其次就是進一步增強算力的有效利用率,讓企業(yè)少走彎路。這也正是聯(lián)想集團在生成式AI產業(yè)變遷之際,積極加速AI普及的有力舉措。
4.結語:聯(lián)想加碼AI+計算,驅動AI普慧
正如視頻中所呈現(xiàn)的,生產力工具歷經數(shù)十萬年薪火相傳,如今其火把已經被傳給了AI。生成式AI在生成、理解等方面展現(xiàn)出的強大能力,不斷拓寬其在千行百業(yè)中的應用邊界。當下,AI驅動的各類應用正在變革著人們的工作、生活、學習等。
聯(lián)想從2017年開始智能化轉型布局以來,技術積累頗深,且擁有從口袋到云端的全產品組合和能力。當下,邁入AI戰(zhàn)略收獲期的聯(lián)想,將圍繞著計算和AI這兩個關鍵的“錨點”技術,加速AI的普及。