加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • AI技術(shù)基因
    • 為什么是夸克
    • 大模型將如何“升級(jí)”夸克
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

自研大模型,夸克豹變

2023/11/17
2184
閱讀需 11 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者|李禾子,郵箱|lihezi@pingwest.com

11月14日,阿里巴巴智能信息事業(yè)群宣布正式推出夸克大模型。據(jù)介紹,夸克大模型是基于Transformer架構(gòu)、全部技術(shù)均為自研,同時(shí)參數(shù)規(guī)模達(dá)千億級(jí)的多模態(tài)大模型;其應(yīng)用場(chǎng)景除了基礎(chǔ)的通用搜索,還將包括醫(yī)療健康、教育學(xué)習(xí)和職場(chǎng)辦公等更垂直的領(lǐng)域。

從其應(yīng)用方向來(lái)看,夸克大模型的推出很符合當(dāng)前大模型“重落地”的發(fā)展趨勢(shì)。

推出之前,夸克大模型已經(jīng)組建了數(shù)百人的研發(fā)團(tuán)隊(duì),在上述垂直領(lǐng)域進(jìn)行了預(yù)訓(xùn)練和精調(diào)。官方發(fā)布的數(shù)據(jù)至少顯示,夸克大模型并非是一個(gè)“趕時(shí)髦”的產(chǎn)物,而是有著想做到行業(yè)頂尖的野心——

11月16日,在C-Eval和CMMLU兩大權(quán)威評(píng)測(cè)榜單的最新評(píng)測(cè)結(jié)果中,夸克大模型分別以89和以77.08的均分登頂;國(guó)內(nèi)專業(yè)考試測(cè)試方面,它在中考、高考和研究生考試中均超過(guò)了GPT-4,包括在臨床執(zhí)業(yè)醫(yī)師資格考試、計(jì)算機(jī)等級(jí)考試、公務(wù)員考試、教師資格證考試等評(píng)測(cè)中,也均優(yōu)于GPT-4(其中臨床執(zhí)業(yè)醫(yī)師資格考試成績(jī)?yōu)?86分,遠(yuǎn)高于360分的及格線)。

如果進(jìn)一步結(jié)合阿里巴巴在AI生態(tài)的布局,就會(huì)發(fā)現(xiàn)夸克大模型的誕生有著很強(qiáng)的戰(zhàn)略屬性,阿里巴巴智能信息事業(yè)群連同大模型在其中的地位一起,都被提到了相當(dāng)?shù)母叨取?/p>

AI技術(shù)基因

需要指出的是,智能信息事業(yè)群屬于阿里巴巴“1+6+N”中的N公司,同閑魚(yú)、釘釘?shù)裙居诩瘓F(tuán)內(nèi)的序列類似。

阿里巴巴智能信息事業(yè)群更注重產(chǎn)品創(chuàng)新和技術(shù)研發(fā),這也是內(nèi)外部對(duì)其的認(rèn)知之一。

該事業(yè)群成立于2021年4月,定位于信息服務(wù)方向的智能化創(chuàng)新,旗下包括了夸克App、UC瀏覽器和書(shū)旗小說(shuō)等產(chǎn)品。

同年10月,智能信息事業(yè)群升級(jí)組織架構(gòu),圍繞夸克App成立了夸克事業(yè)部。該動(dòng)作被外界解讀為是在加碼信息服務(wù)賽道,夸克則有望承擔(dān)起創(chuàng)新突破的使命。包括此次推出的夸克大模型,研發(fā)路線也是為了服務(wù)夸克的業(yè)務(wù)戰(zhàn)略。

隨著AI時(shí)代的到來(lái),信息服務(wù)領(lǐng)域的用戶價(jià)值和商業(yè)價(jià)值仍處在高速增長(zhǎng)的初期,夸克開(kāi)始被置于更高的發(fā)展優(yōu)先級(jí)。

今年9月,阿里集團(tuán)宣布了用戶為先、AI驅(qū)動(dòng)的兩大戰(zhàn)略重心,將加大對(duì)“技術(shù)驅(qū)動(dòng)的互聯(lián)網(wǎng)平臺(tái)業(yè)務(wù)”、“AI驅(qū)動(dòng)的科技業(yè)務(wù)”等業(yè)務(wù)的戰(zhàn)略性投入。

吳泳銘指明的阿里巴巴未來(lái)的戰(zhàn)略投入方向,夸克顯然是AI生態(tài)中的一份子,夸克大模型的推出已經(jīng)是一個(gè)證明。

為什么是夸克

夸克當(dāng)前的定位將關(guān)系到夸克大模型將如何應(yīng)用。

把時(shí)間拉回至幾年前,當(dāng)時(shí)出現(xiàn)在人們眼中的夸克還是一款極度簡(jiǎn)潔的小眾產(chǎn)品,專注于優(yōu)化用戶的搜索體驗(yàn)。也因?yàn)轶w驗(yàn)做得好,在極客和App玩家里圈了一大波粉絲,月活也達(dá)到了百萬(wàn)級(jí)。

后來(lái)夸克所有的探索,也都是在此基礎(chǔ)上展開(kāi)的,各種變化也一直圍繞著夸克的成長(zhǎng)。

對(duì)于當(dāng)時(shí)已經(jīng)擁有一定體量的夸克來(lái)說(shuō),一條分岔路其實(shí)已經(jīng)擺在了面前——作為一款信息服務(wù)產(chǎn)品,它必然要考慮后續(xù)的發(fā)展方向,單一的功能定位能贏得當(dāng)下,卻不一定爭(zhēng)取到更大的市場(chǎng)。夸克需要在克制的前提下做加法,然而對(duì)于這樣一款對(duì)用戶體驗(yàn)有著執(zhí)念的搜索為主的應(yīng)用而言,做加法不是個(gè)容易的過(guò)程。

期間夸克進(jìn)行過(guò)一些嘗試,譬如垂直領(lǐng)域的專業(yè)搜索,以及不同形態(tài)的優(yōu)質(zhì)內(nèi)容生態(tài)建設(shè)。

但就在人們以為夸克要走上內(nèi)容付費(fèi)時(shí),它又結(jié)合用戶需求和市場(chǎng)變化迅速對(duì)自己的業(yè)務(wù)體系進(jìn)行了梳理。

2021年夸克事業(yè)部成立,按照阿里巴巴智能信息事業(yè)群總裁吳嘉的說(shuō)法,夸克已進(jìn)入新的階段,正在從一個(gè)好用的搜索App,邁向個(gè)人學(xué)習(xí)、生活和工作的智能助手。

此前,夸克已經(jīng)在搜索業(yè)務(wù)的基礎(chǔ)上延展出了一些信息服務(wù),譬如輔助考生進(jìn)行志愿篩選的高考信息服務(wù),包括健康百科和健康精選問(wèn)答在內(nèi)的健康信息搜索,以及內(nèi)容涵蓋簡(jiǎn)歷、PPT、論文、合同、表格和期刊等在內(nèi)的文檔等。此外,工具屬性更強(qiáng)的夸克網(wǎng)盤也在2019年就已上線。

這些服務(wù)在“智能信息”的概念出現(xiàn)之前,還是較為分散的,而當(dāng)明確要做用戶“個(gè)人學(xué)習(xí)、生活和工作的智能助手”之后,夸克的定位也逐漸清晰起來(lái)。

依然是在不犧牲用戶體驗(yàn)的原則上,夸克后續(xù)又對(duì)這些服務(wù)進(jìn)行了更深入的優(yōu)化,并在2022年推出另一款工具產(chǎn)品夸克掃描王,補(bǔ)足了掃描場(chǎng)景下的用戶體驗(yàn)。也是在2022年,夸克App的Slogan正式由“新生代智能搜索”升級(jí)為“你的高效拍檔”,自此完成了從一個(gè)“小而美”的App走向新一代智能信息產(chǎn)品的生態(tài)化發(fā)展的蛻變。

由于服務(wù)場(chǎng)景更貼合學(xué)生以及年輕的上班族,夸克也在更新自己的同時(shí),積累起了一批畫像更加年輕的用戶——據(jù)QuestMobile發(fā)布的《2023年輕人群智能效率應(yīng)用研究》報(bào)告,夸克App在泛學(xué)生人群和新生代職場(chǎng)人群的用戶占比最高,年輕用戶使用時(shí)長(zhǎng)位列行業(yè)第一;此外,在夸克服務(wù)的數(shù)千萬(wàn)級(jí)用戶中,25歲以下用戶占比超過(guò)一半。

這些統(tǒng)統(tǒng)構(gòu)成了夸克區(qū)別于其他同類應(yīng)用的差異化用戶心智。

很顯然,對(duì)于夸克這樣致力于幫助用戶提高效率、有更強(qiáng)實(shí)用性質(zhì)的應(yīng)用來(lái)說(shuō),大模型的引入在現(xiàn)階段是適配的,也符合大模型的進(jìn)化規(guī)律??淇说陌l(fā)展已經(jīng)從單一服務(wù)變成產(chǎn)品矩陣形態(tài),這也給大模型提供了足夠多的落腳點(diǎn)。

大模型將如何“升級(jí)”夸克

當(dāng)我們提大模型對(duì)某個(gè)應(yīng)用的改造,一定是建立在這個(gè)應(yīng)用原有的業(yè)務(wù)基礎(chǔ)之上。

夸克首先作為一個(gè)搜索工具,在過(guò)去幾年已經(jīng)積累起了海量的中文數(shù)據(jù),并號(hào)稱有“最全面的中文數(shù)據(jù)庫(kù)”。訓(xùn)練大模型最核心的三要素之一就是數(shù)據(jù),夸克過(guò)去的積累首先給了大模型能更好理解、評(píng)估和提煉中文知識(shí)體系的前提。

而在更細(xì)分的領(lǐng)域,夸克的知識(shí)內(nèi)容體系也相對(duì)更完整。

比如高考服務(wù),到今年夸克已經(jīng)連續(xù)五年提供高考信息服務(wù),各省市的高考數(shù)據(jù)非常齊全,同時(shí)也涵蓋了豐富的圖文、視頻和直播等針對(duì)不同省份、分?jǐn)?shù)段學(xué)生的填報(bào)技巧內(nèi)容;健康服務(wù)方面,夸克也聯(lián)合數(shù)百位院士、醫(yī)療專家和專業(yè)協(xié)會(huì)建立起了夸克健康百科,并且和數(shù)十家行業(yè)頭部醫(yī)療機(jī)構(gòu)合作建立起了健康精選問(wèn)答體系;至于文檔服務(wù),其內(nèi)容也包括了實(shí)用范文、求職簡(jiǎn)歷、合同模板、PPT模板、教育教學(xué)、表格模板和研究報(bào)告等八大類,精選文檔也已上線了超千萬(wàn)份……

更重要的是,這些數(shù)據(jù)和內(nèi)容背后,包含的是非常豐富的用戶場(chǎng)景,對(duì)于大模型理解和認(rèn)知不同用戶對(duì)工作、學(xué)習(xí)和生活上的真實(shí)需求,亦是加分項(xiàng)。

某種程度上,大模型的加持和夸克一直以來(lái)的技術(shù)傳統(tǒng)是一脈相承的。

AI此前就在夸克的各項(xiàng)服務(wù)中多有應(yīng)用,就高考和健康服務(wù)來(lái)說(shuō),已經(jīng)在錄取預(yù)測(cè)、模擬填報(bào)以及針對(duì)病例、藥品的篩查等等使用場(chǎng)景下借助過(guò)AI幫助;夸克網(wǎng)盤也在今年先后上線了AI自然語(yǔ)言搜索以及播放器AI字幕生成功能;夸克掃描王在識(shí)別的準(zhǔn)確性上,也一直離不開(kāi)AI的貢獻(xiàn)。

夸克可以說(shuō)對(duì)浪潮的到來(lái)早有準(zhǔn)備,而大模型一旦加碼融入,對(duì)夸克各項(xiàng)功能服務(wù)的影響可以預(yù)見(jiàn)地也將十分顯著。

想象這樣一種場(chǎng)景,在掃描工具的使用中,用戶的痛點(diǎn)通常在于相機(jī)識(shí)別出的內(nèi)容不夠準(zhǔn)確,盡管此前借助AI已經(jīng)能在諸如版式、公式和手寫內(nèi)容等的識(shí)別上提升準(zhǔn)確度,但此類AI往往在語(yǔ)義和前后文的理解上較為機(jī)械。而大模型最強(qiáng)的能力恰恰就在于認(rèn)知,因此當(dāng)大模型被用于掃描場(chǎng)景,識(shí)別準(zhǔn)確性又可以提升一個(gè)量級(jí)。

類似的大模型應(yīng)用場(chǎng)景,幾乎可以匹配到夸克當(dāng)前的每一項(xiàng)服務(wù),從而帶來(lái)更多體驗(yàn)上的變革。

而在大模型現(xiàn)階段普遍存在的幻覺(jué)問(wèn)題方面,夸克也提出了自己的應(yīng)對(duì),建立了從內(nèi)容、搜索再到推理的一套可辨別知識(shí)真?zhèn)蔚募夹g(shù)體系,尤其是在通用知識(shí)、圖文知識(shí)、專業(yè)知識(shí)、推理知識(shí)和寫作增強(qiáng)等方面,有望讓大模型提供的內(nèi)容更具有準(zhǔn)確性和專業(yè)性。

在給用戶帶來(lái)改變前,夸克先積極擁抱了變化,改變了自己。

吳泳銘幾天前在世界互聯(lián)網(wǎng)大會(huì)上的預(yù)判是,“在可見(jiàn)的未來(lái),會(huì)有更智能的下一代產(chǎn)品進(jìn)入人們的生活,AI助理會(huì)無(wú)處不在,成為每個(gè)人工作、生活、學(xué)習(xí)中的助手”??淇艘呀?jīng)到了邁向下一代搜索的臨界點(diǎn),大模型也將成為推動(dòng)夸克持續(xù)進(jìn)行產(chǎn)品體驗(yàn)創(chuàng)新的技術(shù)底座。

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
ATXMEGA16A4U-AUR 1 Microchip Technology Inc IC MCU 8BIT 16KB FLASH 44TQFP

ECAD模型

下載ECAD模型
$2.86 查看
STM32F407VGT6 1 STMicroelectronics High-performance foundation line, Arm Cortex-M4 core with DSP and FPU, 1 Mbyte of Flash memory, 168 MHz CPU, ART Accelerator, Ethernet, FSMC

ECAD模型

下載ECAD模型
$20.39 查看
STM32F103RCT6TR 1 STMicroelectronics Mainstream Performance line, Arm Cortex-M3 MCU with 256 Kbytes of Flash memory, 72 MHz CPU, motor control, USB and CAN

ECAD模型

下載ECAD模型
$9.98 查看
阿里巴巴

阿里巴巴

阿里巴巴集團(tuán)經(jīng)營(yíng)多項(xiàng)業(yè)務(wù),另外也從關(guān)聯(lián)公司的業(yè)務(wù)和服務(wù)中取得經(jīng)營(yíng)商業(yè)生態(tài)系統(tǒng)上的支援。業(yè)務(wù)和關(guān)聯(lián)公司的業(yè)務(wù)包括:淘寶網(wǎng)、天貓、聚劃算、全球速賣通、阿里巴巴國(guó)際交易市場(chǎng)、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥(niǎo)網(wǎng)絡(luò)等。

阿里巴巴集團(tuán)經(jīng)營(yíng)多項(xiàng)業(yè)務(wù),另外也從關(guān)聯(lián)公司的業(yè)務(wù)和服務(wù)中取得經(jīng)營(yíng)商業(yè)生態(tài)系統(tǒng)上的支援。業(yè)務(wù)和關(guān)聯(lián)公司的業(yè)務(wù)包括:淘寶網(wǎng)、天貓、聚劃算、全球速賣通、阿里巴巴國(guó)際交易市場(chǎng)、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥(niǎo)網(wǎng)絡(luò)等。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

關(guān)注中國(guó)未來(lái)創(chuàng)新技術(shù)產(chǎn)業(yè)發(fā)展,講好科技創(chuàng)新的中國(guó)故事。

微信公眾號(hào)