加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入

AI訓(xùn)練

加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論
  • AI模型訓(xùn)練【偏差/方差】與【欠擬合/過(guò)擬合】
    AI模型訓(xùn)練【偏差/方差】與【欠擬合/過(guò)擬合】
    在我們拿到一個(gè)數(shù)據(jù)集,高高興興準(zhǔn)備訓(xùn)練一個(gè)模型時(shí),會(huì)遇到欠擬合或過(guò)擬合的問(wèn)題,業(yè)內(nèi)也喜歡用偏差和方差這兩指標(biāo)去定義它們,那這些詞什么意思呢?有什么方法能避免/解決 欠擬合和過(guò)擬合呢?這其實(shí)是非常非常基礎(chǔ)的概念,但是其實(shí)即使是業(yè)內(nèi)人士很難一下子把它們完全講明白,并列出全面的解決方法,本文為你最通俗地解答。
  • 強(qiáng)攻GPU,TPU芯片一夜躥紅
    強(qiáng)攻GPU,TPU芯片一夜躥紅
    自ChatGPT爆火之后,AI大模型的研發(fā)層出不窮,而在這場(chǎng)“百模大戰(zhàn)”激戰(zhàn)正酣之際,美國(guó)芯片公司英偉達(dá)卻憑借其GPU在大模型計(jì)算中的出色發(fā)揮賺得盆滿缽滿。
  • AI 2.0時(shí)代,服務(wù)器DDR5底層架構(gòu)迎來(lái)變革
    DDR5 內(nèi)存模塊是第一個(gè)在內(nèi)存模塊上集成PMIC的主要內(nèi)存類型,未來(lái),隨著對(duì)更高性能和電源效率的需求不斷增長(zhǎng),可能會(huì)定義新型內(nèi)存模塊。而且,這些模塊很有可能繼續(xù)在模塊上集成 PMIC,以進(jìn)一步優(yōu)化電源管理并提高整體系統(tǒng)性能。
  • H100利用率飆升至75%!英偉達(dá)親自下場(chǎng)FlashAttention三代升級(jí),比標(biāo)準(zhǔn)注意力快16倍
    H100利用率飆升至75%!英偉達(dá)親自下場(chǎng)FlashAttention三代升級(jí),比標(biāo)準(zhǔn)注意力快16倍
    大模型訓(xùn)練推理神作,又更新了!主流大模型都在用的FlashAttention,剛剛升級(jí)第三代。時(shí)隔一年,F(xiàn)lashAttention-3已經(jīng)全方位升級(jí)。訓(xùn)練速度提升1.5-2倍,F(xiàn)P16下計(jì)算吞吐量高達(dá)740TFLOPs/s,達(dá)理論最大吞吐量75%,更充分利用計(jì)算資源,此前只能做到35%。
  • 臺(tái)達(dá)研究院闕志克:降伏AI訓(xùn)練“吃電怪獸”靠誰(shuí)?
    臺(tái)達(dá)研究院闕志克:降伏AI訓(xùn)練“吃電怪獸”靠誰(shuí)?
    數(shù)據(jù)中心機(jī)房?jī)?nèi),一排排機(jī)柜內(nèi)線纜虬結(jié)、風(fēng)扇呼嘯,燈光閃爍,徹夜不息……當(dāng)前,這樣的數(shù)據(jù)中心已經(jīng)遍及世界各地,并仍然在世界頭部科技廠商的引領(lǐng)下不斷增長(zhǎng)。僅在今年6月內(nèi),微軟就已宣布將在瑞典、馬來(lái)西亞、西班牙等國(guó)家投資建設(shè)數(shù)據(jù)中心,項(xiàng)目投資總金額超140億美元;同時(shí),英偉達(dá)計(jì)劃在未來(lái)5年內(nèi)投資3萬(wàn)億美元建設(shè)數(shù)據(jù)中心;亞馬遜云科技則規(guī)劃在未來(lái)15年內(nèi)投入約1500億美元用于全球數(shù)據(jù)中心的建設(shè)與運(yùn)營(yíng)……
  • 黃仁勛“松弛感”演講談創(chuàng)新:偉大的智慧是退后一步
    在生成式AI的熱潮來(lái)臨之前需要思考:人工智能的背景是什么?深度學(xué)習(xí)的基礎(chǔ)是什么?長(zhǎng)期的影響是什么?
    5704
    06/03 13:02
  • AI推理,和訓(xùn)練有什么不同?
    AI推理,和訓(xùn)練有什么不同?
    如果要用一句話概括AI的訓(xùn)練和推理的不同之處,我覺(jué)得用“臺(tái)上一分鐘,臺(tái)下十年功”最為貼切。話說(shuō)小明已經(jīng)和心目中的女神交往數(shù)年,在邀約女神出門這件事上積累了大量的經(jīng)驗(yàn)數(shù)據(jù),但卻依然捉摸不透其中的玄機(jī)。借助AI技術(shù),能否實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)呢?小明思考再三,總結(jié)出了可能影響女神是否接受邀請(qǐng)的變量:是否節(jié)假日,天氣不好,太熱/太冷了,心情不好,生病了,另有他約,家里來(lái)親戚了......等等。
  • 瞬變對(duì)AI加速卡供電的影響
    瞬變對(duì)AI加速卡供電的影響
    圖形處理單元(GPU)、張量處理單元(TPU)和其他類型的專用集成電路(ASIC)通過(guò)提供并行處理能力來(lái)實(shí)現(xiàn)高性能計(jì)算,以滿足加速人工智能(AI)訓(xùn)練和推理工作負(fù)載的需求。AI需要大量的算力,尤其是在學(xué)習(xí)和推理時(shí)。這種需求不斷地將供電網(wǎng)絡(luò)的邊界推向前所未有的新水平。這些高密度工作負(fù)載變得愈加復(fù)雜,更高的瞬態(tài)需求推動(dòng)配電網(wǎng)絡(luò)的每個(gè)部分都必須高效運(yùn)行。AI加速卡嚴(yán)格的功耗要求對(duì)系統(tǒng)性能也有影響。本文將討論AI加速卡的配電網(wǎng)絡(luò)要求,剖析瞬變的影響,并介紹ADI公司針對(duì)這些需求提出的多相供電解決方案。
  • Eureka!NVIDIA 研究突破為機(jī)器人學(xué)習(xí)注入新動(dòng)力
    Eureka!NVIDIA 研究突破為機(jī)器人學(xué)習(xí)注入新動(dòng)力
    NVIDIA Research 開(kāi)發(fā)的一款名為 Eureka 的新型 AI 智能體可以教機(jī)器人復(fù)雜的技能,它教會(huì)了機(jī)器人手快速轉(zhuǎn)筆,并且第一次轉(zhuǎn)得像人類一樣好。上面視頻中所展示的令人驚嘆的“魔術(shù)”是機(jī)器人通過(guò) Eureka 學(xué)會(huì)熟練完成的近 30 項(xiàng)任務(wù)之一,Eureka 可以自動(dòng)編寫?yīng)剟?lì)算法來(lái)訓(xùn)練機(jī)器人。
  • ChatGPT背后的算力殺手锏
    微軟如何將大規(guī)模AI訓(xùn)練鑲在云計(jì)算的DNA里?為了向人工智能(AI)初創(chuàng)公司OpenAI的前沿研究提供支持,微軟三年前為OpenAI打造了一臺(tái)由數(shù)萬(wàn)個(gè)A100 GPU組成的大型AI超級(jí)計(jì)算機(jī),成本或超過(guò)數(shù)億美元。微軟還在60多個(gè)數(shù)據(jù)中心總共部署了幾十萬(wàn)個(gè)推理GPU。
  • 斷供高端GPU不實(shí)!對(duì)英偉達(dá)傷害性不大,侮辱性極強(qiáng)?
    科技制裁之下,沒(méi)有所謂贏家。
  • 燧原科技亮相Hot Chips大會(huì),詳解邃思芯片架構(gòu)
    今天燧原科技在一年一度的Hot Chips大會(huì)上由首席架構(gòu)師劉彥和資深芯片設(shè)計(jì)總監(jiān)馮闖一起介紹了第一代云端訓(xùn)練芯片“邃思1.0”的架構(gòu)細(xì)節(jié)。Hot Chips是全球高性能微處理器和集成電路相關(guān)的重要會(huì)議之一。

正在努力加載...