“2005年,在一個演講中,有專業(yè)人士預判,設計芯片的驗證工作量占比將來會超過70%,當時我很震驚。但事實證明,這一年來,我們所有的合作伙伴、客戶在芯片驗證領域所花的人力、物力已經超過了70%。這是發(fā)展的歷史見證,當芯片規(guī)模越來越大、設計越來越復雜、制程也越來越復雜,對于芯片的成功設計和生產,驗證工作變得彌足珍貴,直接關乎勝敗。” 西門子EDA全球副總裁兼中國區(qū)總經理凌琳如是說。
的確,在過去20年時間里,驗證的方法論,特別是硬件輔助驗證,已經成為EDA客戶的關注焦點。與此同時,根據業(yè)界實踐數據顯示,采用硬件輔助驗證的IC設計項目在首次硅片成功率(First Silicon Success)上有顯著提升,減少了大量的返工時間和成本。基于此,市場調研機構預測,2019-2024年間,硬件輔助驗證市場的復合年增長率(CAGR)預計超過10%。而未來,隨著AI、ML、大規(guī)模計算技術的持續(xù)發(fā)展,對硬件輔助驗證市場的需求也會同步提升。
硬件輔助驗證平臺是什么?
提到硬件輔助驗證平臺,可以參考AMD提出的三層解決方案空間觀點,即硬件仿真加速、企業(yè)級原型驗證、軟件原型驗證。
圖 | 西門子EDA硬件輔助驗證產品管理高級總監(jiān)Vijay Chobisa介紹三層解決方案空間
首先,我們來看硬件仿真加速,芯片設計團隊需要有快速的編譯,用于設計的bring up、迭代和調試,并且循環(huán)往復地快速去做這項工作。由于在設計仿真的早期就需要用到硬件仿真加速,所以需要全信號可見,來實現快速的調試。
其次,我們來看企業(yè)級原型驗證,當我們的設計相對穩(wěn)定下來,不需要再去做頻繁的更改時,就可以把驗證的工作推進到原型驗證階段,包括早期的固件和嵌入式的軟件驗證,從而實現在更長的工作鏈路上看到整個軟件的工作量。
對于企業(yè)級原型驗證而言,高度的一致性非常重要,這個一致指的是硬件仿真加速和企業(yè)級原型驗證的一致性,也就是可以把整個硬件加速的結果轉換到企業(yè)級原型驗證當中,同時如果在原型驗證中有一些具體的調試問題,也可以返回硬件仿真加速。
最后,我們來看軟件原型驗證,這個主要是給軟件工程師使用的,換言之,系統(tǒng)軟件工程師可以在芯片還未流片前就能初步測試軟件的功能和性能表現。同時,為了保持系統(tǒng)級驗證,需要有高速接口和IP驗證,以及靈活的配置,比如更改連接線,或人工更改分區(qū)等,達到以最低的成本實現最高的性能吞吐率。
根據與非網的觀察,當前全球主要的硬件輔助驗證市場企業(yè)包括西門子、Agnisys、Aldec、新思科技(ANSYS)、Blue Pearl Software、Cadence、EMA Design Automation、Hardent和Innovative Logic等,這些第一、第二梯隊的企業(yè)占據了大量的市場份額。
行業(yè)獨家,西門子同步發(fā)布三大硬件輔助驗證系統(tǒng)平臺Veloce CS
作為全球硬件輔助驗證市場中重要的平臺提供者,近日西門子數字化工業(yè)軟件推出 Veloce CS 硬件輔助驗證和確認系統(tǒng),該系統(tǒng)融合了硬件仿真、企業(yè)原型驗證和軟件原型驗證三大產品板塊:
- 用于硬件加速仿真的 Veloce Strato CS 硬件
- 用于企業(yè)原型驗證的 Veloce Primo CS 硬件
- 用于軟件原型驗證的 Veloce proFPGA CS 硬件
圖 | 西門子同時宣布新一代三大硬件輔助驗證產品
隨著Veloce CS的推出,西門子也躍升為業(yè)界唯一擁有3個硬件系統(tǒng)平臺的公司,其他競爭對手最多擁有其中1~2個硬件系統(tǒng)平臺。
事實上,如果大家對西門子的硬件輔助驗證工具有所了解,可以看到2021年西門子曾推出Veloce硬件輔助驗證系統(tǒng),該系統(tǒng)融合了虛擬平臺、硬件仿真和 FPGA 原型驗證技術。所以今年推出的Veloce CS一方面是三年前Veloce的升級,另一方面又通過收購整合增加了軟件原型驗證的平臺。
根據西門子EDA硬件輔助驗證產品管理高級總監(jiān)Vijay Chobisa的介紹,Veloce CS相比Veloce的提升不是一丁半點,包括速度提升了5-15倍,能耗減少了2倍,密度又提升了2倍。以硬件加速仿真產品為例,與上一代 Veloce Strato 相比,Veloce Strato CS 的硬件加速仿真性能顯著提高,最高可達 5 倍,同時還可保持完全的可觀測性,支持能力從 4000 萬門電路擴展到超過 400 億門電路。
圖 | Veloce Strato CS + Veloce Primo CS,提供完整統(tǒng)一的硬件/軟件開發(fā)和驗證平臺
他還提到,Veloce Strato CS和Veloce Primo CS出自同一個研發(fā)團隊,外部長相一致,系統(tǒng)架構一致,運行環(huán)境一致,并能在不同平臺之間無縫移動,所以可以大大提升用戶在啟動、設置、調試和工作負載執(zhí)行的速度。如果將其量化,Veloce Strato CS和Veloce Primo CS雙機運行大約可提高6~10倍的生產力/收益。
此外,提到軟件原型驗證平臺,它的入門成本是非常低的,用戶可以根據自己的體量需求來制定小、中、大型的系統(tǒng)配置,小型的包括單塊FPGA和4塊FPGA的桌面級原型,中型和大型的則采用刀片式架構,可從6個FPGA擴展至180個FPGA(6個為一個刀片,30個刀片即為180個FPGA),非常靈活。
自研芯片CrystalX+刀片系統(tǒng),實現從4000萬到400億的可拓展性
前面提到Veloce Strato CS擁有從 4000 萬門電路擴展到超過 400 億門電路的能力,這是如何實現的呢?
有一點很重要,那就是整個Veloce CS平臺都采用了模塊化刀片配置,可以像搭建樂高積木一樣往上累加,不僅提高了系統(tǒng)電路能力的上限,還增加了靈活性,并在規(guī)模效應中降低了成本。事實上,模塊化刀片配置在高性能計算市場是非常主流的一個趨勢,尤其符合現代數據中心的占地要求、能耗要求以及冷卻要求。
除此之外,基礎硬件的升級也是Veloce CS性能表現突出的重要基礎。
據悉,Veloce Strato CS搭載了完全由西門子自主設計的專用加速器芯片——CrystalX,該芯片采用7nm制程工藝,疊加薄膜技術的創(chuàng)新和2.5D IC堆棧技術,可以幫助客戶實現更加快速的可預測的編譯、設計、啟動和迭代。
圖 | Veloce CS 系列產品的技術基礎
而Veloce Primo CS和Veloce proFPGA CS則均采用了AMD的自適應FPGA產品——VP1902,這也是Veloce Primo CS和Veloce Strato CS在底層技術上的重要區(qū)別。
值得一提的是,由于CrystalX芯片里有一個邏輯分析器,所以Veloce Strato CS的調試性能會比Veloce Primo CS更好。
關于下一步西門子是否會考慮自研更多芯片,來替代AMD的FPGA應用時,Vijay Chobisa表示:“AMD既是西門子的供應商,又是西門子的客戶,雙方合作非常緊密,而西門子暫時也還沒有計劃自研原型驗證用的SoC或FPGA產品,來替代現有的這種高效組合。”
10億門容量,只要10千瓦能耗,是競對的1/7~1/6
我們在前面的章節(jié)提到了全球主要的硬件輔助驗證市場企業(yè),那么如何來評判這些企業(yè)的產品在市場中的地位和特色呢?首先用戶的體驗和反饋是首要的,另外在全球性推動經濟結構綠色轉型的今天,能耗也是大家關注的焦點。
據悉,Veloce CS平臺使用的是風冷系統(tǒng),不需要額外的液體或水的冷卻,所以在10億門的容量上大概需要10千瓦的能耗,與競對產品相比,Veloce CS平臺的功耗是行業(yè)最低,僅從用電和冷卻方面就可節(jié)省數百萬美元。