AV色综合久久天堂AV色综合,国产精品国产三级欧美,韩国精品一区二区三区无码视频

大模型評價標準，現(xiàn)在到了被擺上臺面討論的時刻。

過去兩個月，“百模大戰(zhàn)”吸足了外界眼球，大模型越發(fā)越多，但到底什么樣的大模型才是好大模型，卻也越來越眾說紛紜、備受關(guān)注。

就在這樣的時間節(jié)點，國內(nèi)最早內(nèi)測生成式AI大模型的百度，一波新的技術(shù)動作，迅速在線下引發(fā)熱烈反響：

5月9日的百度智能云的文心大模型技術(shù)交流活動現(xiàn)場，文心一言先是化身“文心問數(shù)”，秀了一把分分鐘數(shù)據(jù)可視化的能力。

但下一分鐘，“出bug”的一幕就給逮住了：在面對畫折線圖的需求時，文心一言壓根沒懂，來了一句“換個問題試試”。

這是上演直播事故了？臺上的程序員小哥，卻十分淡定，隨即調(diào)出了一個新界面——文心千帆大模型平臺。

結(jié)果下一步操作，直接讓現(xiàn)場觀眾紛紛舉起手機錄像：現(xiàn)！場！微！調(diào)！大！模！型！

只見他當場新建了一個微調(diào)數(shù)據(jù)集。

導入的是這樣一份數(shù)量在100條左右的標注數(shù)據(jù)。

一通可視化操作下來，不過10幾分鐘之后，當文心一言再次被要求：

華北地區(qū)2019年3月的銷售額，用折線圖表示。

它就已經(jīng)完全不糊涂，能快速給出正確的結(jié)果了。

不錯，“現(xiàn)場調(diào)教”，恰恰是這一次技術(shù)交流活動中，文心一言最受關(guān)注的升級重頭戲。

因為這就意味著，在百度圍繞文心一言搭建起的工具鏈中，僅需少量數(shù)據(jù)，最快幾分鐘，大模型就能完成一次“定制化”，這也是國內(nèi)第一個現(xiàn)場演示如何微調(diào)行業(yè)專屬大模型的全過程。

更重要的是，通過已在內(nèi)測中的文心千帆大模型平臺，這樣的訓練調(diào)優(yōu)經(jīng)驗和技術(shù)，已經(jīng)可以向第三方輸出了。

于是，回到一開始那個問題上，什么樣的大模型才是好大模型？大模型背后正在被改寫規(guī)則的云計算，又該用何種新標準去評價？

至少現(xiàn)在，討論的范圍中，是時候考慮加進新的樣本范例了。

文心千帆是什么？

先來研究研究，這個“文心千帆大模型平臺”，與文心一言具體是個什么關(guān)系？

簡單來說，在文心千帆大模型平臺上，企業(yè)用戶可以直接用上文心一言的大模型服務，不過與此同時，也可以基于這個平臺，訓練、調(diào)優(yōu)任何第三方大模型，打造屬于自己的大模型。

作為全球首個一站式企業(yè)級大模型平臺，文心千帆所能提供的，實際上不僅是大模型本身，更是開發(fā)大模型的一整套工具鏈和環(huán)境。

還是結(jié)合具體案例來看看，文心千帆具體能用來做什么。

首先，是公有云服務。主要包括三個組成部分：

1、推理，就是直接調(diào)用大模型的推理能力。

以百度員工“內(nèi)用”的智能辦公軟件如流為例，其中就接入了一個可以直接向文心一言提問的AI小助手。

平時無論是程序員還是產(chǎn)品經(jīng)理，手頭上的項目都有不少，遇到問題時往往需要私戳對應的負責人，光是等待時間就接近5分鐘。

現(xiàn)在有了AI助手，如流不僅能直接模擬同事身份，幫助回答一些專業(yè)問題，還能從項目文件中提取關(guān)鍵信息來答疑解惑。

而且，平均應答時間只需5秒鐘，比同事快了60倍。

這樣看，哪天身邊的同事被AI替代了，可能百度員工都不知道（手動狗頭）

2、微調(diào)，通過少量高質(zhì)量的精標業(yè)務數(shù)據(jù)，高效訓練出特定行業(yè)大模型。前文提到的文心一言現(xiàn)場微調(diào)，就是基于這一服務實現(xiàn)的。

3、托管，即把訓好的模型，發(fā)布到百度智能云上，由百度智能云來對模型進行運營維護。企業(yè)同樣只需考慮如何用好模型，而無需顧慮復雜的部署和管理問題。

百度集團副總裁侯震宇談到，盡管當前，從頭訓練大模型的成本仍然高昂，但使用、微調(diào)大模型的成本已經(jīng)在過去幾個月中，有顯著降低。

比如，現(xiàn)在調(diào)用文心一言的成本，已經(jīng)降低到模型剛發(fā)布時（3月16日）的10%。

也就是說，通過文心千帆的公有云服務，用戶可以直接服用百度智能云過去積累下的開發(fā)、應用大模型的經(jīng)驗，更低成本、低門檻地用上大模型。

公有云服務之外，文心千帆也支持私有化部署。同樣包括三個方面：

軟件授權(quán)，即在企業(yè)本地環(huán)境中，提供文心一言的大模型服務。
軟硬一體，提供整套大模型服務及對應的硬件基礎(chǔ)設(shè)施。
租賃服務。提供機器和平臺租賃，以滿足客戶的低頻需求。

以金山辦公為例，他們認為，當前市面上的文檔產(chǎn)品，無論是傳統(tǒng)的還是流式的，都是基于人們的創(chuàng)作，用自己的筆一行一行把想要的東西表達出來。

這就需要重新思考，AI時代，創(chuàng)作的過程該是什么樣子？

金山辦公選擇的策略是，“要跟中國優(yōu)秀的大模型提供方站在一起，做好大模型應用方的角色，用更好的辦公軟件，為客戶提供更多的價值”，于是在綜合考慮安全合規(guī)、模型深度、迭代速度、推理性能等多個方面的優(yōu)勢后，金山辦公pick了文心千帆。

據(jù)透露，在意圖理解、PPT大綱生成、范文書寫、生成待辦列表、文生圖等多模態(tài)生成的場景上，雙方的聯(lián)合開發(fā)已經(jīng)取得了進展，但在細節(jié)方面仍然會自己進一步調(diào)試。

說不定不久后，我們就能在WPS Office上和基于文心千帆大模型平臺打造的AI小助手對話了。

相比于公有云服務，私有化部署能滿足更嚴格的數(shù)據(jù)監(jiān)管需求。

總結(jié)一下就是，文心千帆能通過圖形化的界面，提供AI算力，數(shù)據(jù)管理、模型訓練、評估優(yōu)化、服務部署等大模型生產(chǎn)開發(fā)全流程的工具鏈。除了開發(fā)，文心千帆還為客戶提供了非常好的大模型訓練推理服務。

有意思的一點是，百度智能云AI與大數(shù)據(jù)平臺總經(jīng)理忻舟提到，“快且收斂，是大模型應用訓練中一個非常重要的指標，只快不收斂，大模型的訓練是沒有用的。”

基于文心千帆大模型平臺+百度AI大底座的能力，像Bloom、LLaMA、GLM等千億級第三方開源模型，分布式并行訓練的性能提升平均也都能達到150%。

新時代需要新的評價標準

事實上，如果進一步探尋大模型技術(shù)進展背后，來自產(chǎn)業(yè)端的需求變化，就會發(fā)現(xiàn)文心千帆所折射出的，其實是云計算規(guī)則被大模型改變之后，百度智能云自身面對新評價標準，給出的思考總結(jié)。

用侯震宇的話說，就是“從科幻向務實的轉(zhuǎn)變”：

在被劃時代技術(shù)所震驚的最初，大家都期待著大模型有“解決一切”的表現(xiàn)。但當技術(shù)的優(yōu)勢和局限在實踐中不斷被驗證，“效果”和“成本”這兩個評價大模型的關(guān)鍵詞，也逐漸清晰起來。

這一方面，使得上云使用大模型，成為絕大多數(shù)企業(yè)的首選：人人都想用大模型，還有不少人想打造自己的大模型，但同時，從頭打造大模型依然是一件高投入、高技術(shù)含量的事情。

另一方面，面對市場上越來越多的競爭者，企業(yè)如何選擇、評估大模型及背后的云計算服務，已成為新的需要被探討的問題。

而從文心千帆的應對之道中，可以看出來自產(chǎn)業(yè)的三重新評估標準已經(jīng)初現(xiàn)雛形——

大模型本身的能力
煉大模型的基礎(chǔ)設(shè)施能力
全棧技術(shù)的積累程度

新在何處？

大模型本身的能力不必過多解釋，一組數(shù)據(jù)足以說明：侯震宇透露，在文心一言開始企業(yè)內(nèi)測以后，在與百度智能云接洽大模型業(yè)務的客戶中，新客戶的比例已經(jīng)超過了老客戶的比例，“有大量的機構(gòu)，原先不太愿意用，現(xiàn)在愿意跟我們聊，也愿意去用”——大模型本身，已經(jīng)成為最主要的吸引力來源。

據(jù)介紹，截止目前，已有超過300家生態(tài)伙伴參與文心一言內(nèi)測，在400多個企業(yè)內(nèi)部場景取得測試成效。

值得關(guān)注的還有兩方面的變化：

其一，是評估大模型是否“高效好用”，顯然算力已經(jīng)不再是其中的唯一標準。

受限于自身大計算、大參數(shù)、高成本等特性，大模型此前在落地上一直存在瓶頸。

這也決定了企業(yè)在選擇大模型時，即使輸出效果足夠好，也必然還會考慮易用性、安全性、高效性、開放性、擴展性和全面性等諸多方面的因素。

如果拆解企業(yè)打造大模型的方式，會發(fā)現(xiàn)硬件算力只影響這些因素中的一小部分。

協(xié)同算力、框架、模型、應用這四層架構(gòu)打造AI大模型，才能從根本上決定其端到端的輸出效果，是“最佳調(diào)優(yōu)”模式。

打個比方，對于大模型而言，想要極致優(yōu)化推理速度和使用成本，算力、框架、模型、應用就像是四個齒輪，各自轉(zhuǎn)速之外，很大程度上還要看它們之間的“配合能力”。

此前，國內(nèi)外云廠商或多或少都已經(jīng)在軟硬件技術(shù)協(xié)同方面進行布局，國外如亞馬遜、國內(nèi)阿里都已經(jīng)在芯片層、模型層上發(fā)展了自研技術(shù)，微軟則也已經(jīng)在框架層和應用技術(shù)上有所準備。

而目前在四層架構(gòu)上均有自研技術(shù)布局的，就是百度一家。

這一布局成果，如今已經(jīng)在成本降低上有直觀的體現(xiàn)：

此前3月份啟動內(nèi)測時，如今不到2個月，百度大模型文心一言已完成4次技術(shù)版本升級，其推理成本更是已經(jīng)降為原來的十分之一。

其二，是評估“生產(chǎn)”大模型的能力時，本質(zhì)上考驗的是企業(yè)煉大模型的基礎(chǔ)設(shè)施能力。

算法、算力和數(shù)據(jù)，對于大模型而言缺一不可。值得一提的是，由于大模型的訓練和推理都需要大量算力支撐，因此云廠商能把多少算力劃分入AI算力的范疇，比單純的硬件數(shù)量更值得關(guān)注。

更重要的是，三者的綜合運用，大模型高效、穩(wěn)定的訓練和有效的收斂，離不開扎實的工程基座。

其中涉及的工程問題實際上非常復雜，包括千卡通信、集群調(diào)度、大規(guī)模分布式文件系統(tǒng)等等。

比如，文心千帆大模型平臺，其實就是把模型開發(fā)、訓練、調(diào)優(yōu)、運營等復雜過程封裝成能更高效調(diào)用的工具，來輸出百度打造大模型的工程經(jīng)驗。

“大家可能會覺得堆積算力、寫好代碼、然后進行模型訓練，把它跑起來就行了。實際上在訓練過程中會遇到各種各樣的挑戰(zhàn)，很少有人能夠使得一個大模型訓練過程能夠在連續(xù)一兩天內(nèi)不出問題?！卑俣戎悄茉圃朴嬎惝a(chǎn)品解決方案和運營部總經(jīng)理宋飛介紹。

而百度AI大底座，更是通過芯片、框架、模型、應用四層架構(gòu)之間的高效協(xié)同，在基礎(chǔ)設(shè)施層面上，實現(xiàn)千卡加速比90%、資源利用率70%，開發(fā)效率提升100%。這是AI大底座為大模型的開發(fā)和應用帶來的價值。

每一個時代的技術(shù)，有每一個時代評價標準。

而新標準的越辯越明，也往往意味著舊有格局的打破，和換道競爭機會的到來。

智能手機之于非智能手機如此，電動車之于燃油車亦如此。

而現(xiàn)在，催生了大模型，又被大模型打破規(guī)則的云計算，站在技術(shù)浪潮的最前沿，或許也同樣走到了變化的前夕。

正如李彥宏所說，大模型應用時代是一個全新的時代。

對于云計算來說，第一批參考案例已經(jīng)到來，更多新時代的新變化，還會遠嗎？

百度交流會大玩心跳！現(xiàn)場實時調(diào)教大模型，炸出背后更強底座文心千帆

文心千帆是什么？

新時代需要新的評價標準

相關(guān)推薦

百度交流會大玩心跳！現(xiàn)場實時調(diào)教大模型，炸出背后更強底座文心千帆

文心千帆是什么？

新時代需要新的評價標準

相關(guān)推薦

百度交流會大玩心跳！現(xiàn)場實時調(diào)教大模型，炸出背后更強底座文心千帆

文心千帆是什么？