當我們圍觀ChatGPT炸開的多場激戰(zhàn)時,還有什么是暗流下激戰(zhàn)的?
今天要關注的,不是違背“非盈利”初心的OpenAI,也不是商業(yè)模式面臨顛覆的谷歌搜索。把目光從公司層面挪開,看向另一場已經(jīng)白熱化的戰(zhàn)爭——
借著的ChatGPT燎原之勢,2月中旬同一天的30分鐘內,就有2位谷歌大腦大模型人才先后官宣入職OpenAI,其中之一Jason Wei是思維鏈(chain-of-thought,CoT)的最早一作。
大模型交鋒背后,谷歌和OpenAI的人才戰(zhàn)爭打得正酣。和動輒上億美元的投融資同樣重要,AI人才也是兵家必爭的財富。
但其實,AI人才流動、被搶奪,早開始在ChatGPT攪動漩渦之前。
GPT系列:8人聯(lián)創(chuàng)新公司,成谷歌對戰(zhàn)ChatGPT一步棋
勢如破竹的ChatGPT,積攢了OpenAI從GPT一路迭代至InstructGPT的技術經(jīng)驗與實力。
ChatGPT基于OpenAI的GPT-3.5創(chuàng)造。2018年和2019年,OpenAI分別推出了1.17億參數(shù)的GPT-1和15億參數(shù)的GPT-2;2020年,大力出奇跡的GPT-3問世,訓練參數(shù)達到1750億,涌現(xiàn)出一些人腦獨特的能力,引起轟動;而后又在2022年初推出全新的InstructGPT模型,只要13億參數(shù),效果就比GPT-3更好。
《紐約時報》披露,原本下一代GPT-4在OpenAI內部幾乎準備就緒,只待發(fā)布;去年11月中旬,高層突然宣布新任務:兩周后發(fā)布免費聊天機器人應用,代號“Chat with GPT3.5”,這就是今天見到的ChatGPT。
51位作者,其中2人參與3次論文創(chuàng)作
GPT系列共發(fā)表了4篇論文,51位作者參與其中。
作者名單中出現(xiàn)最頻繁的是Alec Radford和Ilya Sutskever兩位,均參與GPT-1到3的論文創(chuàng)作。前者是OpenAI的ML研究員,也是indico.io的聯(lián)創(chuàng),谷歌學術上他被引用最多的研究是DC-GAN;后者更為人所熟知,OpenAI聯(lián)創(chuàng)之一,也是OpenAI首席科學家,主導了GPT系列以及DALLE系列模型的研發(fā)。
另有5人在GPT系列論文中2次貢獻了自己的力量:
51人組成的人才圖鑒,學歷一欄中名校印記俯拾皆是。據(jù)不完全統(tǒng)計,出現(xiàn)頻次最多的是MIT和斯坦福大學,曾在耶魯大學、UC伯克利、哈佛大學、牛津大學攻讀學位的人也不在少數(shù)。也不乏在這些名校中輾轉求學的人,譬如表格中提到的OpenAI前研究副總裁Dario Amodei,先后就讀于普林斯頓大學和斯坦福大學;再比如InstructGPT背后論文共同作者之一Gretchen Krueger,MIT、哈佛大學、哥倫比亞大學都是他的母校。
出走團隊打造ChatGPT競品對話式AI
毫無疑問,GPT系列背后的51人引領了大語言模型的創(chuàng)新風潮。從GPT系列結束戰(zhàn)斗后,不少人從OpenAI脫離。除開GPT-3共同作者、哥大博士在讀的Melanie Subbiah本就不屬于OpenAI,50人里共有16位人才從OpenAI流失。
其中8位的最終流向是AI初創(chuàng)公司Anthropic。更準確地說,包括Dario Amodei、GPT-3論文一作Tom B. Brown在內的一批核心人才不滿OpenAI成為微軟附庸——因被注資,OpenAI要使用Azure超算來搞研究,要將技術授權給微軟,甚至要給微軟的投資活動籌集資金,這與OpenAI創(chuàng)立的初衷(關注高級AI安全)相悖。
最終,包括8位GPT系列作者在內,共11名OpenAI前員工怒而離職,于2021年創(chuàng)辦Anthropic,要搞能控制、可解釋的AI,重心放在生成式AI上。
△出走創(chuàng)辦Anthropic的GPT系作者
1月底,Anthropic開始內測聊天機器人Cladue。同為生成式對話AI,與ChatGPT的同臺競賽不可避免,二者各有千秋,最終測評結果:Claude在12項任務中有8項更強。
關于Anthropic的最新消息讓這家“復仇者聯(lián)盟”愈發(fā)走到人們熟悉臺前。月初,谷歌向它投資3億多美元(約合人民幣20.3億元),拿下后者約10%的股份。交易條款要求,Anthropic需要從谷歌云計算部門購買計算資源。這恰好與3年前,OpenAI接受微軟高達10億美元的注資,將微軟定位獨家云提供商所呼應。
換句話說,Dario Amodei帶著Anthropic走上了3年前所不齒的OpenAI的老路,接受金主爸爸提供的算力來進行技術開發(fā)?,F(xiàn)如今,Anthropic最新估值50億美元,除谷歌外,已有的投資人包括Facebook聯(lián)創(chuàng)Dustin Moskovitz,谷歌前CEO、現(xiàn)技術顧問Eric Schmidt等人。
也曾有人轉投谷歌門下
OpenAI GPT系作出走16人,Anthropic是他們的主要流向,剩下8人中,有3位第一時間投入谷歌門下。
其一是GPT-1的三作Tim Salimans,2018年7月他就履新谷歌大腦,base阿姆斯特丹,擔任職位為高級管理科學家;其二是GPT-2的四作David Luan,2020年9月起他加入谷歌任主管,工作1年多后離職,后來和Transformer論文作者Ashish Vaswani、Niki Parmar一起,創(chuàng)辦了一家叫Adept的公司,目標是創(chuàng)造讓人和計算機能夠協(xié)同工作的通用人工智能;第三位叫a,在2021年3月加入谷歌大腦。
時至今日,Adept和Anthropic兩家AI公司的聲量比不上風頭正盛的OpenAI和其強勁對手DeepMind,不過各自在AI產(chǎn)業(yè)界頗有建樹,甚至拿出Claude這種可與ChatGPT一較高下的產(chǎn)品。從這兩家公司的今日成就不難側面看出,GPT系作者是的確不是等閑之輩。
LaMDA:1/4成員只有本科學歷
梳理完GPT系論文作者現(xiàn)狀,鏡頭轉向谷歌的LaMDA論文背后團隊,作者共60名。和GPT系作者團一樣,LaMDA作者團隊同樣不乏耀眼的名校背景,斯坦福校友最多,統(tǒng)共有6人;其次是哥倫比亞大學,有三人曾在哥大就讀;接著是浙江大學、比拉科技學院、杜克大學、上海交通大學、耶魯大學、中國臺灣大學,這6所大學出現(xiàn)了2次。
不過有一說一,相比較而言,LaMDA團隊的名校光環(huán)更少,成員的學校背景中常出現(xiàn)阿比林基督教大學、伊比利亞美洲大學、哈丁西蒙斯大學等類似的非頂尖名校。
15位作者只有本科學歷,多數(shù)人出身計算機專業(yè)
還有三個特點在LaMDA作者履歷中顯現(xiàn)。
第一,至少有17人在某個求學階段主修學科為計算機工程/科學,計算機學科背景貫穿求學始終的人也不在少數(shù),像Hongrae Lee,先是在首爾國立大學拿下計算機科學本碩學歷后,又赴往哥倫比亞大學攻讀計算機科學博士學位。
第二,據(jù)不完全統(tǒng)計,至少有15位LaMDA論文作者只擁有本科學歷,這些人中有一半就讀的專業(yè)是計算機工程/科學。
第三,有7位LaMDA論文作者在谷歌工作了10年以上,資歷最老的是Igor Krivokon,截至今年2月,他在谷歌的工作年限為19年又5個月;Will Rusch也在谷歌工作了19年,從美國南加州大學電氣工程系畢業(yè)后,他就成為了谷歌的一份子,直到今天。
上文提到,有5%的GPT系作者跑到了對家谷歌干活,相比之下,LaMDA論文作者,沒有一位跳槽到對家OpenAI,很穩(wěn)。那么,究竟是什么樣的公司,能夠得到出走的LaMDA論文作者的法眼?
答案是兩家AI初創(chuàng)公司,一家是Inflection AI,另一家是Character.AI。
出走后,成AI初創(chuàng)公司Inflection AI&Character.AI創(chuàng)始團隊
先來聊聊Inflection AI,這家機器學習初創(chuàng)公司是LaMDA作者中的Joe Fenton,和從OpenAI出來的Rewon Child(3位投奔谷歌的出走成員之一)共同創(chuàng)立,創(chuàng)始團隊中還有LinkedIn聯(lián)創(chuàng)Reid Hoffman和DeepMind創(chuàng)始成員、谷歌人工智能產(chǎn)品與政策副總裁Mustafa Suleyman,陣容十分豪華。LaMDA論文作者,曾擔任谷歌研究工程師的Maarten Bosma在公司成立后也被挖走,現(xiàn)為Inflection AI技術人員。
據(jù)了解,這家公司的總體目標是利用人工智能幫助人類與計算機“對話”。去年5月,Inflection AI獲得了2.25億美元的A輪融資,資金來源尚不清楚,公司估值超過12億美金。
以及,現(xiàn)有5名LaMDA論文作者進入Character.AI就職。
Character.AI的創(chuàng)始人Noam Shazeer是谷歌前首席軟件工程師,不僅參與了LaMDA的研究,還是Transformer論文作者之一。杜克大學本科畢業(yè)后,2000年年底,Noam Shazeer加入谷歌,是谷歌最重要的早期員工之一。雖然中途一度離職,但截至他2021年10月離職創(chuàng)辦新公司,共在谷歌工作了17年又5個月。Character.AI的現(xiàn)任總裁也是LaMDA論文作者,Daniel De Freitas,加入谷歌前,他曾在微軟Bing做軟件工程師。
實際上,LamDA論文發(fā)表時,Noam Shazeer和Daniel De Freitas都已經(jīng)從谷歌離職,開始籌備Character.AI了。據(jù)報道,Character AI已經(jīng)創(chuàng)建了一個基于LaMDA的神經(jīng)語言模型聊天機器人Web應用程序,能夠生成類似人類的文本響應并參與上下文對話。
額外提一點,除LaMDA背后作者外,谷歌的大模型人才近期流動也都比較頻繁。先不用說BERT模型四位作者之一,被稱為BERT之父的Jacob Devlin今年1月剛剛離開谷歌加入OpenAI,看看去年ChatGPT發(fā)布頁面的致謝名單里,就有Barret Zoph等5個人,都是谷歌前員工,他們在ChatGPT問世前加入OpenAI,在調整和準備ChatGPT中發(fā)揮了關鍵作用。此外,The Information消息披露,進入今年1月,又有至少4名谷歌大腦成員加入OpenAI。
危急存亡之秋,谷歌嗅到了人才流失的危險,相繼推出了一系列舉措。除卻重金投資OpenAI出走團隊打造的Anthropic外,其旗下專注語言大模型領域的“藍移團隊”(Blueshift Team)宣布,正式加入DeepMind,旨在共同提升LLM能力——先進行陣列自行調整,集中內部力量,迎接OpenAI炮火。
人才大戰(zhàn)里的華人面孔
今年年初,大模型人才的跳槽愈發(fā)頻繁。從谷歌加入OpenAI的谷歌大腦4人之一中,包括華人顧世翔(Shane Gu),谷歌大腦日本團隊前成員,劍橋大學博士,本科在多倫多大學師從三巨頭之一Hinton。去年5月,只要加上一句“讓我們一步一步地思考”就能讓GPT-3做數(shù)學題的準確率暴漲61%這事,就是顧世翔參與的研究發(fā)現(xiàn)。
像他這樣,在谷歌和OpenAI的人才爭奪大戰(zhàn)中出現(xiàn)的華人面孔還有多少?據(jù)不完全統(tǒng)計,共有16人,LaMDA論文作者里就有14人,占87.5%,也就是說華人面孔占據(jù)了大模型111人中的14.4%。
這里要著重提2個人。一位是美籍華人Ed Chi,1973年出生,現(xiàn)為谷歌杰出科學家,早年以應用資訊氣味理論預測網(wǎng)站可用性而聞名。
從美國明尼蘇達大學雙城分校取得碩士學位后,Ed Chi于1997年至2011年期間,在帕洛阿爾托研究中心(PARC)擔任研究科學家。2011年,Ed Chi以高級研究科學家的身份從PARC離職,成為谷歌的一名研究科學家。2012年,他擔任任人機交互領域最負盛名的學術會議CHI的技術項目聯(lián)合主席。2017年,Ed Chi被提升為谷歌首席科學家。
另一位要提到的是歐陽龍(Long Ouyang),他參與了與ChatGPT相關的7大技術項目中的4項研究,包括InstructGPT、webGPT、RLHF和ChatGPT,是InstructGPT論文的一作,RLHF論文的第二作者。
革命性科技浪潮背后,人才頻繁流動
梳理后不難看到,谷歌和OpenAI雖為大模型重鎮(zhèn),但人才流動其實是很尋常的事。僅僅在本文涉及的人員里,GPT-2論文四作和Transformer論文一作和共同創(chuàng)辦的Adept,不到半年就亮出了新公司的首個大模型ACT-1;Anthropic更是憑借對話機器人Cluade成為谷歌和OpenAI大戰(zhàn)中的一把利刃。
大模型人才從OpenAI和谷歌出走后,創(chuàng)立的AI初創(chuàng)公司
總體而言,爆炸性的ChatGPT讓大模型背后的人才更加收到世人關注,對這些人來說,ChatGPT帶來的風口也是他們必須迎頭面對的挑戰(zhàn)。
由此提出一個思考:做類ChatGPT產(chǎn)品,中國的優(yōu)勢在哪里?
很大程度上,構筑大模型堆參數(shù)、堆數(shù)據(jù)的大力出奇跡之道,其實是中國團隊向來擅長的事情。但不可否認,小公司負擔不起高昂的天價成本,大公司需要綜合考慮整體戰(zhàn)略,種種因素,從不同角度成為一個中國版ChatGPT誕生的外在桎梏。
如此一來,破除外在束縛需用巧力。在算法、數(shù)據(jù)等都存在差距的現(xiàn)實條件下,人才,或許能成為這場轟轟烈烈全球擂臺賽里的破局點。大模型背后的每一個參與者和理念、數(shù)據(jù)、技術擁有同等的重要價值。中國不缺人,更不缺人才,從GPT系論文和LaMDA論文背后的華人作者數(shù)量更可以看到AI人才的實力,人才的聚集能形成人才規(guī)模核心競爭力。
The battle of AGI never ends!埋頭研究,伸手搶人的現(xiàn)象,已經(jīng)在國內出現(xiàn)。想招人的,想找工作的,都可以開始準備了。