加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

國產(chǎn)大模型評測超GPT-4!李開復(fù):十年內(nèi)不會套現(xiàn)

05/14 10:02
3107
閱讀需 13 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者 |??程茜,編輯?|??心緣

迎戰(zhàn)GPT-5!零一萬物已啟動下一代MoE模型訓(xùn)練。

智東西5月13日報道,今天,在成立一周年之際,國內(nèi)AI大模型獨(dú)角獸零一萬物重磅發(fā)布系列產(chǎn)品升級。

閉源模型方面,零一萬物發(fā)布全球SOTA千億參數(shù)閉源大模型Yi-Large,評測結(jié)果部分超越GPT-4,同時,零一萬物創(chuàng)始人及CEO李開復(fù)該公司正在訓(xùn)練更大參數(shù)規(guī)模的MoE模型Yi-XLarge MoE。在開源領(lǐng)域,零一萬物將早先發(fā)布的Yi-34B、Yi-9B、6B中小尺寸開源模型版本升級為Yi-1.5系列,每個版本達(dá)到同尺寸中SOTA性能最佳。

開源地址:https://huggingface.co/01-ai,魔搭社區(qū):https://www.modelscope.cn/organization/01ai

同時,李開復(fù)還介紹了一站式AI工作平臺萬知,支持PC網(wǎng)頁和微信小程序使用,能做會議紀(jì)要、周報、寫作助手、PPT,解讀財報、論文等各類文件,同時可以在1-2分鐘內(nèi)生成PPT。零一萬物成立于去年5月,一周年之際其產(chǎn)品矩陣重磅升級,2023年11月發(fā)布首款預(yù)訓(xùn)練大模型Yi-34B之后,其已經(jīng)形成了面向開源、閉源和B端、C端的完整產(chǎn)品矩陣。

在媒體交流環(huán)節(jié),李開復(fù)分享說,零一萬物的C端海外生產(chǎn)力應(yīng)用今年收入預(yù)計將達(dá)到1~2億元,以國外用戶訂閱付費(fèi)為主。通用人工智能(AGI)是李開復(fù)40多年來的夢想,據(jù)他透露,他曾在一年前向投資人承諾10年不套現(xiàn),上市是零一萬物團(tuán)隊未來兩年會努力的目標(biāo)。

李開復(fù)看好國產(chǎn)芯片的發(fā)展,稱零一萬物將在合適的時候去采用國產(chǎn)芯片,同時創(chuàng)新工場一直在關(guān)注這方面的投資。零一萬物的模式比較務(wù)實,會持續(xù)探索如何用最少的芯片、最低的成本訓(xùn)練出最好的模型。此外,李開復(fù)也提到自己最近開了抖音號,將直播分享技術(shù)、產(chǎn)品以及一些觀點(diǎn)。

01.千億參數(shù)閉源大模型評測超GPT-4,已啟動Yi-XLarge MoE,將沖擊GPT-5性能

零一萬物發(fā)布全球SOTA千億參數(shù)閉源大模型Yi-Large,并同步開放API,允許開發(fā)者調(diào)用,在此基礎(chǔ)上還發(fā)布了一站式AI工作平臺萬知。

李開復(fù)透露,經(jīng)測試,Yi-Large評測結(jié)果已經(jīng)至少達(dá)到對齊GPT-4,部分指標(biāo)超越GPT-4

在第三方測評結(jié)果中,Yi-Large在斯坦福英語測評中位居第二,僅次于GPT-4-Turbo,中文SuperCLUE結(jié)果中,位于國產(chǎn)大模型榜首。

此外,零一萬物正在訓(xùn)練的基于MoE架構(gòu)的更大模型Yi-XLarge MoE,目前初步訓(xùn)練結(jié)果顯示,Yi-XLarge MoE的各個指標(biāo)都已經(jīng)超過Yi-Large,將沖擊GPT-5的性能與創(chuàng)新性。

在此前開源的6B、34B模型之上,今天,該公司宣布Yi-1.5開源系列同步升級,開源了6B、9B、34B不同參數(shù)規(guī)模,以及預(yù)訓(xùn)練、Chat模型等,包括Yi-34B Base+Chat、Yi-9B Base+Chat、Yi-6B Base+Chat。

李開復(fù)稱,Yi-1.5系列模型已經(jīng)全面超越Gemma、Mistral以及Llama-3-8B模型,測評結(jié)果顯示,Yi-1.5系列中34B模型在34B-50B模型中處于絕對領(lǐng)先地位,并且一些指標(biāo)中表現(xiàn)甚至不遜色于70B模型。

那么,開源、閉源模型如何見用戶?第一種方法是調(diào)用API,零一萬物宣布面向國內(nèi)市場一次性發(fā)布了包含Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark等多款模型API接口。

此外,還有價錢相對較低的API,包括基于開源34B模型微調(diào)出的Yi-Vision、多模態(tài)視覺模型Yi-Vision以及參數(shù)規(guī)模更小的Yi-Spark。

目前零一萬物已經(jīng)提供了免費(fèi)的額度,供開發(fā)者使用,李開復(fù)透露說,初步接觸的開發(fā)者中有80%選擇從原來的模型轉(zhuǎn)移到使用零一萬物的模型。

據(jù)零一萬物API平臺負(fù)責(zé)人藍(lán)雨川透露,Yi-Large API的定價是20元對應(yīng)百萬tokens,大概是GPT-4 Turbo成本和定價的1/3,對比其他大尺寸模型同樣非常有競爭力。同時零一萬物還提供了更快更便宜的Yi-Large-Turbo。

02.一站式AI工作站萬知上線,速讀超長文檔,2分鐘生成PPT

零一萬物一站式AI工作站萬知有微信小程序和PC網(wǎng)頁版。用戶通過使用萬知既可以閱讀海量數(shù)據(jù)、分析圖表和文字,又可以在1-2分鐘內(nèi)生成PPT。

李開復(fù)談道,所有應(yīng)用都應(yīng)該是AI原生,未來生產(chǎn)力工具的使用模式會徹底被顛覆,用戶提出指令,大模型就可以生成各種內(nèi)容。

他現(xiàn)場展示了萬知的各項能力。

首先,當(dāng)問到“我要做臺灣鹵肉飯,請給我食材表格、和做法時間步驟的思維導(dǎo)圖”。萬知通過表格呈現(xiàn)了鹵肉飯的食譜,還通過思維導(dǎo)圖呈現(xiàn)了制作的步驟。

在回答關(guān)于北京的熱門演出時,萬知給出了具體的活動時間、地點(diǎn),還會有甘特圖呈現(xiàn)出來,用戶根據(jù)自己的時間空閑就能清晰看到演出的具體信息。

萬知也可以快速閱讀理解PDF文檔、理解圖表。將PDF文檔上傳后,萬知在閱讀完成后,右邊就會生成總結(jié)和建議提問。

面對PDF中的單一圖表,萬知會根據(jù)上下文生成內(nèi)容,如下圖中“關(guān)于2010年至2022年間按地理區(qū)域劃分的被授予AI專利百分比”的圖表,萬知會給出圖表的來源以及其中呈現(xiàn)出的明顯趨勢供用戶理解。

此外,萬知作為生產(chǎn)力工具的場景中,還能快速生成PPT,當(dāng)為學(xué)生介紹什么是AI,PPT內(nèi)容需要深入淺出,還要有精彩的圖片。萬知首先會自動總結(jié)PPT內(nèi)容應(yīng)該涵蓋的重點(diǎn),然后直接生成PPT。用戶如果對PPT中某一頁圖片不滿意,也可以通過AI增強(qiáng)搜圖快速換圖。

李開復(fù)稱,萬知生成的PPT比微軟Office Copilot的效果更好,一個PPT的制作時間大概在1-2分鐘左右。

03.大模型走向普惠,AI 2.0時代TC-PMF成關(guān)鍵

關(guān)于對未來的沉淀和展望,李開復(fù)談道,最近有一個熱門的討論:一些人認(rèn)為我們應(yīng)該瘋狂追求AGI,AGI一旦發(fā)生就會改寫全部;另一部分人認(rèn)為模型做得越大越難用,我們應(yīng)該快速找到PMF(產(chǎn)品市場匹配度)。

他認(rèn)為,這兩種觀點(diǎn)都對,但都不完整,沒有一家公司可以只靠技術(shù)長期領(lǐng)跑所有公司,一定是靠非技術(shù)優(yōu)勢,也就是最終產(chǎn)品的勝出。

因此,企業(yè)不能忘記PMF重要性,但在AI 2.0時代還需要考慮TC-PMF(Product-Market-Technology-Cost Fit,技術(shù)成本 X產(chǎn)品市場契合度),其中T代表技術(shù),C代表成本。

今天模型基于Scaling Law在快速演進(jìn),企業(yè)需要不斷預(yù)測未來技術(shù)的走向,同時整個行業(yè)的推理成本過高,社交、電商、短視頻等很多應(yīng)用無法全面嵌入AI,企業(yè)需要不斷降低推理成本。

在應(yīng)用方面,一般來說要實現(xiàn)最佳的AI-First應(yīng)用,需要頂級模型才能實現(xiàn)。但有時候一些應(yīng)用會先爆發(fā),可以在更小的模型上實現(xiàn)。

針對上述這些現(xiàn)象與行業(yè)的痛點(diǎn),李開復(fù)剖析了零一萬物一直以來堅持的4個發(fā)展原則。

首先,零一萬物的產(chǎn)品面向全世界,其單一產(chǎn)品今年收入達(dá)到1億人民幣,產(chǎn)品ROI接近1,上線9個月海外產(chǎn)品用戶數(shù)已經(jīng)接近千萬。

第二個特點(diǎn)是?;步?,李開復(fù)談道,國外大廠的GPU數(shù)量達(dá)到國內(nèi)創(chuàng)企的10倍以上,在這樣的背景下,零一萬物的模型和推理團(tuán)隊有基本一樣的規(guī)模。

在訓(xùn)練方面,零一萬物此前和英偉達(dá)合作,成為全球前三實現(xiàn)FP8訓(xùn)練的,也就是說可以從頭到尾使用FP8精度實現(xiàn)更快速訓(xùn)練。他補(bǔ)充道,在這一技術(shù)的累積下, 其訓(xùn)練成本相比同行能低一半左右。

第三個特點(diǎn)是持續(xù)重視用戶體驗,模型的價值產(chǎn)生在對用戶的價值,一個很典型的功能就是萬知對于圖表的分析,而不是普通照片的理解。

最后,對所有大模型玩家的一個考驗是,企業(yè)需要考慮如何同時開發(fā)產(chǎn)品、了解市場和用戶,還要關(guān)注技術(shù)發(fā)展的速度以及模型能力的演進(jìn)、成本下降等。這里所需要的能力Know-How,包括足夠的前瞻性,還需要是否可以以獨(dú)立的力量實現(xiàn)、執(zhí)行力等。

李開復(fù)認(rèn)為,在此基礎(chǔ)上,零一萬物有四大優(yōu)勢,零一萬物的技術(shù)、產(chǎn)品以及創(chuàng)新工廠的研究人員可以預(yù)測技術(shù)發(fā)展趨勢、對產(chǎn)品的打磨能力和耐心、投資人的預(yù)測能力、推理團(tuán)隊不斷降低推理成本。談到大模型能力轉(zhuǎn)化為生產(chǎn)力所看重的市場反饋與數(shù)據(jù)指標(biāo),零一萬物生產(chǎn)力產(chǎn)品負(fù)責(zé)人曹大鵬分享說,產(chǎn)品在0-1階段重點(diǎn)關(guān)注長期留存率,包括能否產(chǎn)生用戶自發(fā)傳播的口碑,在1-100階段會更關(guān)注增長速度是否足夠快、商業(yè)模式和付費(fèi)轉(zhuǎn)化等指標(biāo)。在打造AI-First應(yīng)用時,零一萬物看重技術(shù)和成本,既要在模型能力上達(dá)到全球領(lǐng)先水平,又要從用戶視角出發(fā),降低價格同時質(zhì)量滿足用戶需求。

04.結(jié)語:開閉源矩陣雙輪驅(qū)動,零一萬物瞄準(zhǔn)AI原生應(yīng)用

成立一年,零一萬物的產(chǎn)品矩陣擁有開源、閉源模型,且應(yīng)用方向涵蓋B端、C端,其正在基于底層大模型強(qiáng)大的理解推理能力,去挖掘用戶日常的核心痛點(diǎn),如制作PPT、分析圖表等,使得AI原生的應(yīng)用真正出現(xiàn)。今年以來,在全面趕超國外頂尖大模型的同時,國內(nèi)諸多大模型應(yīng)用爆發(fā),深入用戶生活、工作的方方面面,產(chǎn)業(yè)競爭的焦點(diǎn)正在轉(zhuǎn)移,未來隨著模型性能的進(jìn)一步增強(qiáng),以及這些應(yīng)用與用戶的距離被拉近,AI原生應(yīng)用的更多高價值場景將被挖掘出來。

相關(guān)推薦

電子產(chǎn)業(yè)圖譜