電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)邊緣AI應(yīng)用需要更多的高性能計(jì)算和算力的支持,AMD的Versal和Zynq系列產(chǎn)品一直支持醫(yī)療、交通、智能零售、智能工廠、智能城市等領(lǐng)域的邊緣AI落地。最近,AMD宣布擴(kuò)展 AMD Versal? 自適應(yīng)片上系統(tǒng)( SoC)產(chǎn)品組合,推出全新第二代 VersalAI Edge系列和第二代 VersalPrime系列自適應(yīng) SoC,其將預(yù)處理、AI 推理與后處理集成于單器件中,能夠?yàn)?AI 驅(qū)動(dòng)型嵌入式系統(tǒng)提供端到端加速。
AI驅(qū)動(dòng)型嵌入式系統(tǒng)的三個(gè)階段
在嵌入式系統(tǒng)中,預(yù)處理、AI推理、后處理是AI驅(qū)動(dòng)型嵌入式系統(tǒng)的三個(gè)重要階段。
在預(yù)處理器部分,主要是各類傳感器包括毫米波雷達(dá)、激光雷達(dá)、攝像頭等進(jìn)行處理與融合、數(shù)據(jù)調(diào)節(jié)等等???a href="http://m.hljzzgx.com/v/tag/1315/" target="_blank">編程邏輯能夠非常靈活,實(shí)時(shí)地支持各類傳感器接口,保證低延時(shí)、穩(wěn)定運(yùn)算,并且在現(xiàn)場(chǎng)部署之后還能夠升級(jí)。
在推理過程當(dāng)中一般使用矢量處理器,市場(chǎng)上已有很多類型。在后處理階段,通常使用高性能的嵌入式CPU。
另外,也可以通過第一代Versal AI Edge系列產(chǎn)品當(dāng)中的可編程邏輯來做預(yù)處理,用矢量處理或者人工智能引擎來做推理。但是在后處理過程需要加上外部的處理器。無論如何,此前還沒有哪一類處理器能夠針對(duì)這三個(gè)階段進(jìn)行優(yōu)化。
AMD自適應(yīng)與嵌入式計(jì)算事業(yè)部( AECG) Versal產(chǎn)品營(yíng)銷總監(jiān)Manuel Uhm分析,采用多顆芯片會(huì)給整個(gè)嵌入式系統(tǒng)帶來諸多限制。例如更高的功率、供電復(fù)雜性、更高的占板面積和終端系統(tǒng)尺寸,以及更高的內(nèi)存要求,芯片間通信帶來的時(shí)延,更多安全漏洞和故障點(diǎn),還有板卡設(shè)計(jì)的工作量等。
此次,AMD嵌入式系統(tǒng)的單芯片智能性方案推出兩個(gè)系列的產(chǎn)品,第二代Versal AI Edge系列,面向AI驅(qū)動(dòng)型嵌入式系統(tǒng);以及第二代Versal Prime系列,面向經(jīng)典嵌入式系統(tǒng)。較上一代產(chǎn)品,采用下一代AI引擎帶來高達(dá)3倍的每瓦TOPS,采用全新高性能集成CPU帶來高達(dá)10標(biāo)的標(biāo)量計(jì)算。通過AMD可編程邏輯實(shí)現(xiàn)世界領(lǐng)先的自適應(yīng)計(jì)算。
第二代Versal自適應(yīng)SoC——單芯片智能性
第二代Versal自適應(yīng)SoC單芯片就能實(shí)現(xiàn)三個(gè)階段的加速。具體來看,預(yù)處理階段,AMD可編程邏輯進(jìn)行傳感器融合和數(shù)據(jù)調(diào)節(jié)。此外還加入新的硬圖像和視頻處理,無需可編程邏輯進(jìn)行處理。
下一代AI引擎AIE-ML v2可以實(shí)現(xiàn)高達(dá)3倍的每瓦TOPS,實(shí)現(xiàn)高效AI推理?;贏MD的VitisAI開發(fā)環(huán)境進(jìn)行快速部署,開發(fā)者可以使用他們?cè)痉浅J煜さ拈_源工具,比如說PyTorch、TensorFlow等等在Vitis中進(jìn)行優(yōu)化、推理。
有了AI引擎的加持,可以支持更多的數(shù)據(jù)類型,支持不同的精度和吞吐量,比如支持共享指數(shù)數(shù)據(jù)類型,可以在提高吞吐量的情況下不減損它的精準(zhǔn)度。
AMD自適應(yīng)與嵌入式計(jì)算事業(yè)部 Versal AI Edge系列高級(jí)產(chǎn)品線經(jīng)理Steph Gauthie分析,二代Versal AI Edge系列器件中的DenseTOPS,以數(shù)據(jù)類型MX6來看,算力最高達(dá)到370TFLOPS。如果采用稀疏度計(jì)算,性能可以翻番,同時(shí)它還可以達(dá)到370TFLOPS。以INT8來看最高端可以做到184TOPS。另外,采用AIE-MLv2,還能夠做一些數(shù)據(jù)信號(hào)的處理,比如說FIR、FFT等等。
CPU性能大幅提升,實(shí)現(xiàn)高達(dá)10倍的標(biāo)量計(jì)算。集成2-8個(gè)CortexA78AE內(nèi)核,每核心最高頻率高達(dá)2.2GHz,以及高達(dá)200.3K的DMIPS算力。10個(gè)ArmCortex-R52實(shí)時(shí)處理器。每核心最高頻率高達(dá)1.05GHz,高達(dá)28.5K的DMIPS算力。
考慮到邊緣計(jì)算對(duì)于信息安全和功能安全的要求,還能夠支持ASIL D、SIL 3等級(jí)規(guī)格,可應(yīng)用于自動(dòng)駕駛和工業(yè)領(lǐng)域。
Steph Gauthie舉例,在高級(jí)自動(dòng)駕駛輔助系統(tǒng)L2和L3中,作為單芯片域控制器與前一代AIEdge相比在相近的功率資源下圖像處理能力增加4倍。
此外,智慧城市的攝像頭系統(tǒng)中,與前一代AIEdge相比每路視頻流占板面板縮小65%。應(yīng)用于專業(yè)的音視頻和廣播的視頻流,與Zyng MPSoC相比,能夠提供2倍的視頻處理能力,每路視頻流占板面積縮小35%。
總之,第二代Versal系列產(chǎn)品面向AI驅(qū)動(dòng)型及經(jīng)典嵌入式系統(tǒng)的中央計(jì)算。
已應(yīng)用于汽車視覺系統(tǒng)等
在基于攝像頭的3D感知視覺案例中,我們可以看到數(shù)據(jù)預(yù)處理完成后被傳輸?shù)紸I引擎,利用3D模型比如BEVFormer俯瞰視覺模型進(jìn)行處理,再到應(yīng)用處理單元進(jìn)行行為模式的規(guī)劃或?qū)崟r(shí)傳感。
目前第二代VersalAI Edge系列產(chǎn)品已經(jīng)應(yīng)用于汽車廠商斯巴魯?shù)腅yeSight視覺系統(tǒng),可以支持碰撞前制動(dòng)、車道偏離預(yù)警、自適應(yīng)巡航控制和車道保持輔助。
第二代VersalAI Edge系列產(chǎn)品能夠支持先進(jìn)的數(shù)據(jù)類型、確保處理的低時(shí)延、高吞吐量以及高精度,還支持ISO26262功能安全等。利用可編程邏輯的靈活性,斯巴魯?shù)南乱淮鶨yeSight系統(tǒng)可以實(shí)時(shí)修改攝像頭的傳感器參數(shù),從而助力斯巴魯強(qiáng)化車輛的安全性,并力爭(zhēng)實(shí)現(xiàn)2030年沒有致命道路事故的安全目標(biāo)。
據(jù)悉,客戶現(xiàn)在就可以采用第一代評(píng)估板和設(shè)計(jì)工具展開設(shè)計(jì)。第二代VersalAI Edge系列和第二代Versal Prime系列產(chǎn)品的芯片樣片將于2025年上半年發(fā)布,評(píng)估套件和系統(tǒng)模塊將于2025年年中推出,量產(chǎn)芯片將于2025年末面世。
小結(jié):
以汽車領(lǐng)域來看,汽車電子電氣架構(gòu)的演進(jìn)突顯了中央計(jì)算平臺(tái)的重要性。當(dāng)前業(yè)內(nèi)不少企業(yè)也推出了車載中央計(jì)算芯片,不過相比之下,AMD第二代Versal AI Edge系列產(chǎn)品,是一顆芯片覆蓋了預(yù)處理、AI推理以及后處理這三個(gè)階段,AMD也是全球少數(shù)幾家擁有預(yù)處理可編程邏輯能力的公司,從而能夠把可編程邏輯的優(yōu)勢(shì)去融合到一個(gè)芯片當(dāng)中。
Manuel Uhm表示,AMD第二代Versal自適應(yīng)SoC平臺(tái)的設(shè)計(jì)考慮到未來五年的需求恐將飛速變化,具有較好的靈活性和伸縮性,提供廣泛的性能和算力支持,如此才能應(yīng)對(duì)不斷變化的市場(chǎng)應(yīng)用。
-
amd
+關(guān)注
關(guān)注
25文章
5466瀏覽量
134083 -
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268874
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論