近日,后摩智能推出基于存算一體架構(gòu)的邊端大模型AI芯片——后摩漫界??M30,最高算力100TOPS,典型功耗12W。為了進(jìn)一步提升部署的便捷性,后摩智能同步推出了基于M30芯片的智算模組(SoM)和力謀??AI加速卡。
隨著AI大模型部署需求從云端迅速向端側(cè)和邊緣側(cè)設(shè)備遷移,AI芯片的性能、功耗和響應(yīng)速度面臨前所未有的挑戰(zhàn)。后摩漫界??M30芯片兼具高性能與低功耗特性,可滿足邊端側(cè)大模型部署對(duì)高效率和實(shí)時(shí)性的嚴(yán)苛要求。
后摩漫界??M30
M30是一款通用的邊端大模型AI芯片,能夠支持多種大模型,包括但不限于ChatGLM、Llama2、通義千問(wèn)等。以Qwen1.5-7B-Chat為例,M30的運(yùn)行性能可達(dá)15-20 Tokens/s。
基于M30芯片的智算模組(SoM)支持PCIe EP模式,以其小巧的體積、強(qiáng)勁的性能和極低的功耗,成為小型化設(shè)備和功耗敏感嵌入式場(chǎng)景的理想選擇。此外,基于M30芯片的力謀??AI加速卡作為標(biāo)準(zhǔn)的半高半長(zhǎng)PCIe加速卡,能在PC、一體機(jī)和服務(wù)器中實(shí)現(xiàn)快速部署,支持主動(dòng)散熱和被動(dòng)散熱兩種模式,確保設(shè)備在不同環(huán)境下的穩(wěn)定運(yùn)行。
后摩漫界??M30將以“+AI”的方式,為傳統(tǒng)的端側(cè)和邊緣側(cè)設(shè)備注入強(qiáng)大的大模型能力,現(xiàn)已成功適配包括X86、ARM在內(nèi)的多種主流處理器,可廣泛應(yīng)用于AI PC、邊緣AI一體機(jī)、智能座艙、商用顯示、智能融合網(wǎng)關(guān),NAS(網(wǎng)絡(luò)附加存儲(chǔ))等領(lǐng)域,為AI技術(shù)在更多領(lǐng)域的深入應(yīng)用注入強(qiáng)大動(dòng)力。