張通社 zhangtongshe.com
5.0”大模型亮相前夕,商湯科技再獲20億港元投資。
近日,商湯科技在港交所發(fā)布公告,宣布了一筆通過(guò)配售獲得的20億港元投資,多家戰(zhàn)略投資人及頭部基金入股,現(xiàn)有股東增持。資金將用于擴(kuò)大商湯科技大裝置規(guī)模、支持大模型研究及產(chǎn)品開發(fā)的生成式AI 進(jìn)一步發(fā)展。
商湯科技成立于2014年,是人工智能算法供應(yīng)商,專注于計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)原創(chuàng)技術(shù)。2021年,公司在港股上市,成為港股AI第一股,也是“AI四小龍”中首家上市企業(yè)。
上市之后,商湯科技卻不斷虧損。2021年至2023年,商湯科技同期歸母凈利潤(rùn)分別虧損171億元、60億元、64億元。在下滑的營(yíng)收和虧損的數(shù)據(jù)中,生成式AI成為商湯科技的業(yè)績(jī)亮點(diǎn),其年報(bào)顯示,2023年生成式AI收入突破11.84億元,實(shí)現(xiàn)199.9%的飛速增長(zhǎng),逐步成為其核心業(yè)務(wù)。
在今年7月,商湯科技還將發(fā)布新版大模型,其具備更強(qiáng)的知識(shí)、數(shù)學(xué)、推理及代碼能力,綜合性能全面升級(jí)。
01、2023年,生成式AI業(yè)務(wù)爆發(fā)式增長(zhǎng)199.9%
在2023年的業(yè)務(wù)重組中,商湯科技明確了新的三大業(yè)務(wù)板塊,生成式AI、傳統(tǒng)AI和智能汽車。其中,生成式AI業(yè)務(wù)為其重點(diǎn)發(fā)展方向。得益于在生成式AI業(yè)務(wù)上的不斷投入,2023年,商湯科技成功實(shí)現(xiàn)了生成式AI大模型從研發(fā)到商業(yè)化應(yīng)用的革新。
2023年4月,商湯科技推出“日日新SenseNove”大模型體系,這是商湯科技首個(gè)發(fā)布的大語(yǔ)言模型之一,同時(shí)還包括“秒畫”文書圖模型、3D內(nèi)容生成等多種生成式AI模型。
在2023年的7、8月份,商湯科技快速迭代了2.0和3.0版本,通過(guò)提高訓(xùn)練數(shù)據(jù)質(zhì)量,實(shí)現(xiàn)了基礎(chǔ)語(yǔ)言能力的顯著提升。其新的“模型即服務(wù)”商業(yè)模式,使客戶能夠輕松地在大裝置微調(diào)和調(diào)用各類生成式AI能力,無(wú)需自己建設(shè)和管理底層基礎(chǔ)設(shè)施。據(jù)了解,“日日新”成為國(guó)內(nèi)首個(gè)超越了GPT
3.5-turbo性能的基模型,也作為首批通過(guò)國(guó)家備案的大模型,正式面向用戶開放服務(wù)。
在算力規(guī)模上,“日日新”大規(guī)模體系實(shí)現(xiàn)了突破性增長(zhǎng)。據(jù)了解,商湯科技大裝置的總算力達(dá)到12000petaFLOPS,連管GPU數(shù)量達(dá)45000卡。
對(duì)于商湯科技而言,生成式AI不僅僅是AI技術(shù)領(lǐng)域的變革性創(chuàng)新,更逐步成為其核心業(yè)務(wù)。據(jù)商湯科技公布的年報(bào)顯示,“日日新”大模型+大裝置帶動(dòng)生成式AI收入突破11.837億元,業(yè)務(wù)實(shí)現(xiàn)199.9%的爆發(fā)式增長(zhǎng),占集團(tuán)收入的比例由2022年的10.4%提升至34.8%。這是商湯科技成立十年以來(lái),以最快速度從無(wú)到有、超過(guò)10億元收入體量的業(yè)務(wù)。
在弗若斯特沙利文發(fā)布的《2023年中國(guó)AI開發(fā)平臺(tái)市場(chǎng)報(bào)告中》,商湯科技在增長(zhǎng)指數(shù)和創(chuàng)新指數(shù)兩大評(píng)估維度的綜合評(píng)分中位居國(guó)內(nèi)首位。這一成績(jī)不僅展示了商湯在生成式AI領(lǐng)域的領(lǐng)先地位,更是對(duì)其創(chuàng)新能力和市場(chǎng)擴(kuò)張速度的國(guó)際認(rèn)可。
02、獲20億港幣投資,將用于AI大模型
2024年,國(guó)內(nèi)的“百模大戰(zhàn)”進(jìn)入深水區(qū),MiniMax、智譜AI、訊飛星火、華為、抖音等企業(yè)相繼推出大模型。作為已入局者,商湯科技不斷追求創(chuàng)新,提升大模型技術(shù)實(shí)力。
今年2月,商湯科技發(fā)布了“日日新”4.0版本,它在代碼編寫、數(shù)據(jù)分析和醫(yī)療問(wèn)答等多種場(chǎng)景中達(dá)到與GPT-4相匹配的能力。同時(shí),商湯科技開源了7B和20B兩種參數(shù)規(guī)格的基模型InternLM2,其性能超過(guò)了Meta的Llama2和Google的Gemma等同級(jí)別開源模型。此外,“秒畫”文生圖模型也經(jīng)歷了四次更新至4.0版本,提升到百億參數(shù)量,疊加十倍級(jí)推理加速的優(yōu)化。
為了進(jìn)一步鞏固并擴(kuò)大商湯科技在大模型、大裝置領(lǐng)域的領(lǐng)先地位,6月21日,商湯科技在港交所發(fā)布公告,根據(jù)一般授權(quán)配售新B類股份。在香港聯(lián)交所交易時(shí)段前,配售1673446000股配售股份,每股配售價(jià)為1.20港元。商湯科技表示,目前通過(guò)配售已獲得20.08億港元投資,多家戰(zhàn)略投資人及頭部基金入股,現(xiàn)有股東增持。
據(jù)了解,配售事項(xiàng)的所得款項(xiàng)凈額將主要用于繼續(xù)擴(kuò)大商湯科技的領(lǐng)先優(yōu)勢(shì),包括擴(kuò)大商湯科技大裝置規(guī)模、支持大模型研究及產(chǎn)品開發(fā)的生成式AI 進(jìn)一步發(fā)展,以及用作公司的一般營(yíng)運(yùn)資金。
在2024年戰(zhàn)略目標(biāo)中,商湯科技也不斷強(qiáng)調(diào)將著力發(fā)展大模型。具體來(lái)說(shuō),將進(jìn)一步發(fā)揮“大裝置+大模型”的深度協(xié)同優(yōu)勢(shì),持續(xù)擴(kuò)充算力規(guī)模、提升基礎(chǔ)設(shè)施和大模型的綜合服務(wù)能力;持續(xù)投入日日新模型體系的迭代,讓模型能力保持業(yè)界領(lǐng)先。
同時(shí),商湯科技還將致力于實(shí)現(xiàn)大模型推理效率提升的摩爾定律,通過(guò)云+端結(jié)合等創(chuàng)新優(yōu)化策略,讓模型推理成本迅速降低,從而打開更廣闊的應(yīng)用場(chǎng)景。
03、“日日新SenseNova 5.0”大模型發(fā)布在即
在7月的WAIC世界人工智能大會(huì)上,商湯科技將發(fā)布其新版大模型——“日日新SenseNova 5.0”。
“日日新SenseNova 5.0”大模型,具備更強(qiáng)的知識(shí)、數(shù)學(xué)、推理及代碼能力,綜合性能全面升級(jí)。這主要得益于以下三個(gè)方面的提升:一是采用混合專家架構(gòu)(MoE),激活少量參數(shù)就能完成推理,且推理時(shí)上下文窗口達(dá)到200K 左右;二是基于超過(guò)10TB tokens訓(xùn)練、覆蓋數(shù)千億量級(jí)的邏輯型合成思維鏈數(shù)據(jù);三是商湯AI大裝置SenseCore算力設(shè)施與算法設(shè)計(jì)的聯(lián)合調(diào)優(yōu)。
日前,中文大模型測(cè)評(píng)基準(zhǔn)SuperCLUE發(fā)布最新榜單,對(duì)商湯科技全新升級(jí)“日日新SenseNova 5.0”大模型進(jìn)行了全方位綜合性測(cè)評(píng),結(jié)果顯示在SuperCLUE綜合基準(zhǔn)上,日日新5.0以總分80.03分的優(yōu)異成績(jī)刷新國(guó)內(nèi)最好成績(jī),這也是國(guó)內(nèi)大模型首次在SuperCLUE中文基準(zhǔn)測(cè)試中實(shí)現(xiàn)登頂。
在端側(cè)大模型應(yīng)用上,為了滿足移動(dòng)終端用戶對(duì)大模型技術(shù)的應(yīng)用需求,商湯科技推出日日新·端側(cè)大模型,性能實(shí)現(xiàn)同等尺度性能最優(yōu),跨級(jí)尺度全面領(lǐng)先。其日日新·端側(cè)大語(yǔ)言模型的推理速度達(dá)到了業(yè)內(nèi)最快,可在中端平臺(tái)實(shí)現(xiàn)18.3字/s的平均生成速度,旗艦平臺(tái)更是達(dá)到了78.3字/s。
對(duì)于金融、代碼、醫(yī)療、政務(wù)等重點(diǎn)行業(yè)邊緣側(cè)日益增長(zhǎng)的AI應(yīng)用需求,商湯科技正式推出企業(yè)級(jí)大模型一體機(jī),可同時(shí)支持企業(yè)級(jí)千億模型加速和知識(shí)檢索硬件加速,實(shí)現(xiàn)本地化部署,即買即用,降低企業(yè)應(yīng)用大模型的門檻。相比行業(yè)同類產(chǎn)品,推理成本節(jié)約80%,檢索大大加速,CPU工作負(fù)載50%。
此外,商湯科技前瞻洞察中心化算力需求向端側(cè)擴(kuò)展的未來(lái)趨勢(shì),以及企業(yè)級(jí)在邊緣側(cè)的AI需求,在業(yè)內(nèi)首次推出“云、端、邊”全棧大模型產(chǎn)品矩陣,其中包括應(yīng)用于終端設(shè)備的“商湯端側(cè)大模型”,以及面向金融、代碼、醫(yī)療、政務(wù)等多個(gè)領(lǐng)域的邊緣產(chǎn)品“商湯企業(yè)級(jí)大模型一體機(jī)”。
憑借在大裝置+大模型深度協(xié)同優(yōu)勢(shì)、云端協(xié)同能力,以及多場(chǎng)景落地的豐富經(jīng)驗(yàn),商湯科技將在人工智能2.0的風(fēng)口上實(shí)現(xiàn)長(zhǎng)遠(yuǎn)的飛躍式發(fā)展。
文字|張文琪? ? ??編輯|呂穎穎