加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 會否加劇“強者恒強”的兩極局面?
    • 面對ChatGPT沖擊波,中小企業(yè)的機會在哪里?
    • 2年后有望追上ChatGPT現(xiàn)有水平?
    • 寫在最后
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

狂飆的ChatGPT,中小企業(yè)洗洗睡吧?

2023/02/17
2530
閱讀需 10 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

Twitter上有人對比了ChatGPT、instagram、spotify、Facebook、netflix、twitter,收獲百萬、1億用戶所花的時間,其中,ChatGPT以火箭躥升之姿光速登頂,業(yè)內(nèi)人士評論“Something different is happening”、“它不是一個新產(chǎn)品、而是一個新物種”。

科技界這種盛況并不多見,上一次還是iPhone問世?ChatGPT霸屏的這段時間,相關(guān)概念股群魔亂舞,創(chuàng)業(yè)公司爭做“中國版的Open AI”……一個核心的問題浮出水面:ChatGPT會不會固化AI產(chǎn)業(yè)格局,強者恒強?如果這是一場巨頭的游戲,國內(nèi)的中小企業(yè)該怎么玩?

會否加劇“強者恒強”的兩極局面?

從硅谷到中國,ChatGPT的熱度有增無減,但主要玩家都是巨頭。目前國內(nèi)有能力競逐的也都是行業(yè)翹楚:百度文心一言、騰訊HunYuan-NLP 1T大模型、阿里“通義”大模型、華為盤古大模型、中科院自動化研究所“紫東·太初”等。當(dāng)AI闊步進入大模型時代,走在前列的巨頭會不會把追逐者遠遠甩開?

曾任華為系NLP企業(yè)首席科學(xué)家、現(xiàn)任千芯科技董事長陳巍認為,可以從企業(yè)和國家整體產(chǎn)業(yè)兩個層面來看。

目前ChatGPT這類大模型領(lǐng)域確實有一定的馬太效應(yīng),跑在前面的企業(yè)玩家具備完整的算法、數(shù)據(jù)和算力優(yōu)勢,后發(fā)者想要追趕確實有較大難度。但是對企業(yè)來說,未必就是強者恒強。例如OpenAI在ChatGPT這類問答型NLP算法曾一度落后于Google BERT,但現(xiàn)在又開始重新領(lǐng)跑。這其中少數(shù)研發(fā)人員的智慧、天賦,以及破釜沉舟般的專注,實際上是決定勝負的關(guān)鍵。

“而資金或者攢局恐怕無法代替技術(shù),比如微軟自己做小冰,最后也要讓位于ChatGPT”, 陳巍談到,“如果國內(nèi)的技術(shù)偏執(zhí)狂人能夠領(lǐng)悟或訓(xùn)練出更高水平的模型,在算法或訓(xùn)練方法上形成降維打擊,超越OpenAI也不是不可能?!?/p>

再從各國產(chǎn)業(yè)發(fā)展而言,由于AI領(lǐng)先的國家確實具備了系統(tǒng)化且領(lǐng)先的AI技術(shù)人群和豐富的算力基礎(chǔ)(大算力芯片),已經(jīng)在教育-研究-產(chǎn)品-需求上形成完整閉環(huán),一旦在ChatGPT這類大模型上拉開差距,很可能形成兩極分化的國力競爭格局,甚至形成“強者恒強”的局面。

面對ChatGPT沖擊波,中小企業(yè)的機會在哪里?

近期不少人給ChatGPT算經(jīng)濟賬,國盛證券以英偉達A100芯片、DGXA100服務(wù)器、現(xiàn)階段每日2500萬訪問量等假設(shè)為基礎(chǔ),估算得出:在初始算力投入上,為滿足ChatGPT當(dāng)前千萬級用戶的咨詢量,投入成本約為8億美元,對應(yīng)約4000臺服務(wù)器。

反觀國內(nèi)AI中小企業(yè),他們既撐不起全棧式的AI研發(fā),也無力為高昂的算力買單。那么在大模型快速發(fā)展、走向商用的過程中,他們的發(fā)展機會主要有哪些?如果只能接入巨頭的生態(tài)求生存,會不會產(chǎn)生同質(zhì)化競爭?

陳巍表示,對于做NLP算法的中小創(chuàng)業(yè)企業(yè)來說,初期確實可能會遇到比較大的打擊。因為ChatGPT這類應(yīng)用,把這些公司之前的積累基本拉平到同一檔位上,甚至可能早期的一些投入基本打水漂了。

不過,中小企業(yè)有自身的靈活優(yōu)勢,船小好掉頭,可以基于ChatGPT這類應(yīng)用,針對細分垂域做專用的領(lǐng)域模型(例如做ChatGPT+領(lǐng)域模型的混合模型)。而對于巨頭來說,由于細分領(lǐng)域眾多,即便分散兵力、撒胡椒面也未必劃算。他強調(diào),ChatGPT是通識智能、千人一面,目前并不具有個性特征、情感和某些特定領(lǐng)域?qū)<抑R,國內(nèi)的中小NLP企業(yè)反而可以充分借助ChatGPT帶來的通識和多輪對話能力提升來拓展更多客戶。

“國內(nèi)中小企業(yè)說不定能誕生有高超天賦的NLP人才,未必不能打造出類似當(dāng)年TMD(今日頭條、美團、滴滴)在BAT(百度、阿里、騰訊)之后成為新巨頭的故事。因為巨頭內(nèi)部有嚴格的季度ROI考核,對于ChatGPT這類需要多年冷板凳的研發(fā)項目不是太友好,頂尖項目在巨頭內(nèi)部發(fā)展未必好”,陳巍從研發(fā)方面指出了中小企業(yè)的可能性。

其次,對于做NLP應(yīng)用的中小創(chuàng)業(yè)企業(yè)來說,他們往往側(cè)重于場景、模型研發(fā)少,ChatGPT這類產(chǎn)品會在一定程度上加劇同質(zhì)化競爭。但接入ChatGPT,也會讓這些企業(yè)更好地提升服務(wù)獲得更多客戶。特別是那些有深厚行業(yè)積累、充分理解行業(yè)的NLP應(yīng)用企業(yè),反而會進一步受益。就好比淘寶最初把中小商家和大商家放到同一個平臺上,開始的時候競價激烈,但后來大家發(fā)現(xiàn)平臺大了,客戶圈也大了,反而擴展到省外甚至國外。

2年后有望追上ChatGPT現(xiàn)有水平?

以ChatGPT為代表的AIGC應(yīng)用,離不開大數(shù)據(jù)、大算力、大模型的訓(xùn)練結(jié)果。當(dāng)我們面對這股龍卷風(fēng)般的潮流席卷時,首先要看清自身的水平和現(xiàn)實差距。

陳巍指出,首先數(shù)據(jù)方面,國內(nèi)的高質(zhì)量語料較少,大部分能用的語料標記質(zhì)量恐怕達不到ChatGPT的訓(xùn)練要求。就拿OpenAI來說,是雇用了約40多個全職的標記員,按照特定的要求來標記語料,而不是直接找數(shù)據(jù)公司買通用的標記數(shù)據(jù)。推測這個標記方法應(yīng)該與其訓(xùn)練策略密切相關(guān),可能有一定的保密要求,是完全私有的數(shù)據(jù)集。因此,國內(nèi)企業(yè)首先要補上私有數(shù)據(jù)集這個短板、以及數(shù)據(jù)集的標記策略,而這可能都是大量燒錢訓(xùn)練之后學(xué)到的經(jīng)驗。

再說模型本身。以ChatGPT為例,基本上國內(nèi)大部分開發(fā)者都是從開源的GPT-2開始起步,大部分企業(yè)恐怕要經(jīng)過大量的盲人摸象般的訓(xùn)練才能進階到GPT-3的水平,然后再繼續(xù)訓(xùn)練到GPT-3.5和ChatGPT。假如按理想的情況:準備數(shù)據(jù)和摸索訓(xùn)練方法用半年,GPT-2到GPT-3用半年,依此類推,大概也需要2年時間才能追上ChatGPT現(xiàn)有的速度。而這還是項目進展順利、沒有被公司砍掉的情況下。而2年后,國外可能已經(jīng)進階到GPT-5或者GPT-6的水平了。

最后是大算力芯片,這才是對國內(nèi)開發(fā)者最頭大的事情。大模型訓(xùn)練規(guī)模的現(xiàn)實擺在那里,即便使用GPU,也要消耗巨大的成本。“現(xiàn)在看GPU訓(xùn)練大模型,有點像早期的深度學(xué)習(xí)研發(fā)人員看CPU訓(xùn)練AlexNet這些早期的深度學(xué)習(xí)模型,訓(xùn)練成本很高,速度又慢,這是大模型訓(xùn)練未來需要努力改進的方向”,陳巍表示。

綜合來看當(dāng)前的三方面短板,數(shù)據(jù)和模型方面,可以通過大量資金投入和研發(fā)人員的努力來補上;但大算力芯片方面,則需要半導(dǎo)體和相關(guān)產(chǎn)業(yè)鏈的整體提升,這點并不容易且是一個長期的過程,可能會成為國內(nèi)趕超的重中之重。

寫在最后

一個朋友感慨:“我對AI的印象還停留在人工智障階段,怎么突然就成了再進宮的甄嬛——不可同日而語了?”

ChatGPT的橫空出世,讓AI再度引發(fā)轟動。隨著國內(nèi)AI大模型的發(fā)展,使用成本的降低,AI將通過各種NLP或AIGC應(yīng)用進入每個人的生活,甚至成為普通人的伙伴、助手或老師。ChatGPT這類大模型技術(shù),還可以與機器人或傳統(tǒng)的制藥、材料、航空、汽車等領(lǐng)域結(jié)合,促進行業(yè)技術(shù)的快速發(fā)展。

因此,ChatGPT絕不僅僅是一個聊天機器人,也不會止步于顛覆現(xiàn)有的搜索引擎,它可能只是通用人工智能的一道開胃菜。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
MCF52258CAG66 1 Rochester Electronics LLC 32-BIT, FLASH, 66MHz, RISC MICROCONTROLLER, PQFP144, 20 X 20 MM, ROHS COMPLIANT, LQFP-144
$12.68 查看
STM32F030C8T6TR 1 STMicroelectronics Mainstream Arm Cortex-M0 Value line MCU with 64 Kbytes of Flash memory, 48 MHz CPU

ECAD模型

下載ECAD模型
$3.41 查看
MK10DX64VLH7 1 Freescale Semiconductor Kinetis K 32-bit MCU, ARM Cortex-M4 core, 64KB Flash, 72MHz, QFP 64
$6.77 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢。歡迎交流~