RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

提高TinyML、ML-DSP和深度學習工作負載的能效

CEVA ? 來源:CEVA ? 作者:CEVA ? 2023-11-09 13:10 ? 次閱讀

近來,對實時決策、降低數(shù)據(jù)吞吐量以及注重隱私的需求,已將人工智能處理的很大一部分工作轉移到邊緣。這一轉變催生了大量邊緣人工智能應用,每種應用都有著不同的要求,面臨著不同的挑戰(zhàn)。

據(jù)預測,2025年人工智能SoC市場規(guī)模將達到500億美元(資料來源:Pitchbook Emerging Tech Research),邊緣人工智能芯片預計將在這一市場中占據(jù)重要地位。

人工智能處理向邊緣轉移及提高能效勢在必行

人工智能處理向邊緣轉移標志著一系列應用(從物聯(lián)網(wǎng)傳感器到自主系統(tǒng))進入了實時決策的新時代。這一轉移有助于:減少延遲,這對即時響應起到?jīng)Q定性作用;通過本地處理提高數(shù)據(jù)隱私保證;支持離線功能,確保在遠程或具有挑戰(zhàn)性的環(huán)境中不間斷運行。由于這些邊緣應用在電池供電的設備上運行,能效有限,因此能效在這一變革中會成為焦點。

邊緣人工智能工作負載本質多元

確保邊緣人工智能處理能效的關鍵難題之一是工作負載本質多元。不同應用的工作負載大不相同,帶來獨特挑戰(zhàn)??傮w而言,所有人工智能處理工作負載可大致分為TinyML、ML-DSP深度學習工作負載。

TinyML:聲音分類、關鍵詞識別及人體存在檢測等任務需要在傳感器附近進行低延遲、實時處理。此處涉及的工作負載稱為TinyML,牽涉到在資源有限的邊緣設備上運行輕量級機器學習模型。TinyML模型專為特定硬件定制,支持順利執(zhí)行人工智能任務。定制硬件處理器和高度優(yōu)化的軟件庫對于滿足TinyML嚴格至極的功耗要求至關重要。

深度學習:相較而言,深度學習應用程序是一種計算密集型工作負載。此類應用程序涉及運行復雜的計算,通常出現(xiàn)在高級計算機視覺、自然語言處理及其他經(jīng)典和生成式人工智能密集型任務中。深度學習具有計算密集型特性,通常需要專門的硬件,如神經(jīng)處理單元 (NPU)。NPU采用多層神經(jīng)網(wǎng)絡結構,能夠高效地處理各種復雜的計算任務。NPU可為高級人工智能任務提供所需的計算能力,而且能效很高。

ML-DSP:介于上述兩類工作負載之間的是ML-DSP工作負載,涉及DSP處理、過濾及清理信號,然后才能執(zhí)行人工智能感知任務。雷達屬于此類工作負載,是一種涉及點云圖像分析的常見應用。

工作負載決定采用的架構

為了應對邊緣人工智能工作負載的多面性及其帶來的能效挑戰(zhàn),人們開發(fā)了各種架構和硬件引擎。為各工作負載選擇有針對性的架構和硬件是為了在提供最佳計算性能的同時最大限度地降低功耗。就此而言,TOPS/Watt(每秒萬億次運算/瓦)是常用的能效指標。選擇合適的架構來處理TinyML、ML-DSP及深度學習工作負載,是滿足所需能效指標的關鍵。

標量處理架構最適合TinyML工作負載,此類負載通常涉及用戶界面管理、基于時間數(shù)據(jù)制定決策以及非密集型計算需求。矢量處理架構非常適合同時處理多個數(shù)據(jù)元素的運算,及在人工智能感知之前涉及信號處理的工作負載。張量和矩陣處理架構是涉及復雜矩陣運算、圖像識別、計算機視覺及自然語言處理等深度學習任務的理想選擇。能夠以盡量高的能效高效處理涉及大型矩陣和神經(jīng)網(wǎng)絡的任務。人工智能處理器通常結合利用這些架構來高效處理各種任務。請參閱下圖。

wKgZomVMataAGTK_AANiyugdJck222.png

CEVA產(chǎn)品可應對各種人工智能工作負載

CEVA提供一系列產(chǎn)品,希望滿足TinyML、ML-DSP 及深度學習工作負載的需求。我們的產(chǎn)品包括CEVA-BX、SensPro2及NeuPro-M,品質優(yōu)越,既能支持搭載人工智能功能的邊緣設備,也能確保能效。

CEVA-BX處理器高度靈活,能夠根據(jù)具體應用配置和優(yōu)化,包括音頻、語音處理及人工智能相關的工作負載。其架構旨在實現(xiàn)性能和能效平衡,因此適用于廣泛的邊緣計算應用。

CEVA的SensPro2是一種高度可配置且獨立的矢量DSP架構,針對浮點和整數(shù)數(shù)據(jù)類型進行標量和矢量處理。專為計算機視覺和其他傳感器中的并行高帶寬數(shù)據(jù)應用而設計。能夠高效處理多達5 TOPS的人工智能工作負載,集成多達1,000個MAC。SensPro2是需要高帶寬數(shù)據(jù)和人工智能處理能力的視覺和雷達系統(tǒng)的合適選擇。

CEVA的NeuPro-M是一款神經(jīng)處理單元(NPU)IP,涵蓋在CEVA深度學習人工智能處理器NeuPro系列中。NeuPro-M旨在處理當今大多數(shù)經(jīng)典和生成式人工智能網(wǎng)絡模型,包括Transformer。專門針對低功耗、高效率處理優(yōu)化,包括一個矢量處理單元(VPU)和許多其他異構處理引擎,如稀疏性、壓縮和激活邏輯。隨著人工智能網(wǎng)絡模型快速發(fā)展,NeuPro-M憑借內(nèi)置VPU,可以為邊緣人工智能應用提供經(jīng)得起未來考驗的功能。NeuPro-M目前無法處理的更新、更復雜的人工智能網(wǎng)絡層,可以利用VPU得到高效管理。

CEVA的音頻人工智能處理器、傳感器中樞 DSP、NeuPro-M NPU IP以及相關軟件工具和開發(fā)套件可滿足所有邊緣人工智能處理工作負載的需求。

wKgZomVMataATAFOAAMoVpwGluE002.png

本文作者:Moshe Sheier, Vice President of Marketing, CEVA

關于CEVA

CEVA是排名前列的無線連接和智能傳感技術以及集成IP解決方案授權商,旨在打造更智能、更安全、互聯(lián)的世界。我們?yōu)閭鞲衅魅诤稀D像增強、計算機視覺、語音輸入和人工智能應用提供數(shù)字信號處理器、人工智能處理器、無線平臺、加密內(nèi)核和配套軟件。許多世界排名前列的半導體廠商、系統(tǒng)公司和OEM利用我們的技術和芯片設計技能,為移動、消費、汽車、機器人、工業(yè)、航天國防和物聯(lián)網(wǎng)等各種終端市場開發(fā)高能效、智能、安全的互聯(lián)設備。

我們基于DSP的解決方案包括移動、物聯(lián)網(wǎng)和基礎設施中的5G基帶處理平臺;攝像頭設備的高級影像技術和計算機視覺;適用于多個物聯(lián)網(wǎng)市場的音頻/語音/話音應用和超低功耗的始終開啟/感應應用。對于傳感器融合,我們的Hillcrest Labs傳感器處理技術為耳機、可穿戴設備、AR/VR、PC機、機器人、遙控器、物聯(lián)網(wǎng)等市場提供廣泛的傳感器融合軟件和慣性測量單元 (“IMU”) 解決方案。在無線物聯(lián)網(wǎng)方面,我們的藍牙(低功耗和雙模)、Wi-Fi 4/5/6/6E (802.11n/ac/ax)、超寬帶(UWB)、NB-IoT和GNSS 平臺是業(yè)內(nèi)授權較為廣泛的連接平臺。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • dsp
    dsp
    +關注

    關注

    553

    文章

    7984

    瀏覽量

    348711
  • CEVA
    +關注

    關注

    1

    文章

    177

    瀏覽量

    75933
  • ML
    ML
    +關注

    關注

    0

    文章

    149

    瀏覽量

    34639
  • 深度學習
    +關注

    關注

    73

    文章

    5500

    瀏覽量

    121100
  • TinyML
    +關注

    關注

    0

    文章

    42

    瀏覽量

    1225

原文標題:提高TinyML、ML-DSP和深度學習工作負載的能效

文章出處:【微信號:CEVA-IP,微信公眾號:CEVA】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    利用TinyML在MCU上實現(xiàn)AI/ML推論工作

    眾所皆知,MCU運算力有限(相對于IoT網(wǎng)關、手機、計算機),而AI/ML向來耗用運算力,如此TinyML的技術主張豈不矛盾?事實上,MCU的運算力也非如刻板印象中那樣一直不堪,MCU運算力也在提升,如此可用來執(zhí)行簡單(相對于云端機房、邊緣運算)的AI/
    發(fā)表于 09-20 11:10 ?2170次閱讀

    開發(fā)TinyML系統(tǒng)必須考慮的四大指標

    最近,隨著機器學習ML, Machine Learning)的進步出現(xiàn)了分歧,分為兩個規(guī)模:一個是傳統(tǒng)的大型ML(云ML),模型越來越大,以實現(xiàn)準確性方面的最佳性能;另外一個是新興的
    的頭像 發(fā)表于 01-11 12:10 ?2501次閱讀

    Alif Semiconductor宣布推出先進的BLE和Matter無線微控制器,搭載適用于AI/ML工作負載的神經(jīng)網(wǎng)絡協(xié)同處理器

    全新Balletto?系列無線MCU基于Alif Semiconductor先進的MCU架構,該架構具有DSP加速和專用NPU,可快速且低功耗地執(zhí)行AI/ML工作負載 ? 中國,北京
    發(fā)表于 04-18 17:51 ?668次閱讀
    Alif Semiconductor宣布推出先進的BLE和Matter無線微控制器,搭載適用于AI/<b class='flag-5'>ML</b><b class='flag-5'>工作</b><b class='flag-5'>負載</b>的神經(jīng)網(wǎng)絡協(xié)同處理器

    【先楫HPM5361EVK開發(fā)板試用體驗】:4、TinyML測試(1)

    是在這些設備上實現(xiàn)低功耗、低延遲和隱私保護的機器學習應用。 TinyML的發(fā)展受益于多個技術進步,包括模型壓縮、量化、剪枝和量化訓練等技術。這些技術允許將大型的深度學習模型壓縮到足夠小
    發(fā)表于 12-22 10:12

    深度學習及無線通信熱點問題介紹

    利用ML構建無線環(huán)境地圖及其在無線通信中的應用?使用深度學習的收發(fā)機設計和信道解碼基于ML的混合學習方法,用于信道估計、建模、預測和壓縮 使
    發(fā)表于 07-01 10:49

    什么是TinyML?微型機器學習

    了解一個叫做微型機器學習(Tiny Machine Learning,TinyML)的機器學習分部,它是什么,它的應用,硬件和軟件需求,以及它的好處。機器學習(
    發(fā)表于 04-12 10:20

    Arm Neoverse V1的AWS Graviton3在深度學習推理工作負載方面的作用

    ML 工作負載。MLCommons 是一個開放的工程聯(lián)盟,通過基準、指標、數(shù)據(jù)集和最佳實踐來支持和改進機器學習行業(yè)。在此分析中,我們?yōu)閮蓚€廣泛使用的
    發(fā)表于 08-31 15:03

    優(yōu)化用于深度學習工作負載的張量程序

    華盛頓大學計算機系博士生陳天奇、以及上海交通大學和復旦大學的研究團隊提出一個基于學習的框架,以優(yōu)化用于深度學習工作負載的張量程序。
    的頭像 發(fā)表于 05-23 15:32 ?2381次閱讀
    優(yōu)化用于<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>工作</b><b class='flag-5'>負載</b>的張量程序

    微軟要讓ML.NET框架也能用于開發(fā)深度學習應用

    模型評分轉換(TensorFlow Transform)。微軟提到,深度學習是人工智能和機器學習的子集,能夠透過實例來學習人類自然習得的能力,與傳統(tǒng)機器
    的頭像 發(fā)表于 09-27 10:33 ?3789次閱讀

    TinyML推動深度學習和人工智能發(fā)展

    TinyML深度學習和人工智能領域的最新技術。它帶來了在隨處可見的微控制器(幾乎是最小的電子芯片)中運行機器學習模型的能力。
    的頭像 發(fā)表于 11-03 14:58 ?2070次閱讀

    一文知道TinyML的演變

    TinyML是世界上最新的深度學習和人工智能技術。它增強了微控制器中運行機器學習模型的能力。
    的頭像 發(fā)表于 11-11 17:02 ?3473次閱讀
    一文知道<b class='flag-5'>TinyML</b>的演變

    什么是深度學習(Deep Learning)?深度學習工作原理詳解

    ? 本文將帶您了解深度學習工作原理與相關案例。 什么是深度學習? 深度
    的頭像 發(fā)表于 04-01 10:34 ?1w次閱讀

    機器學習概述、工作原理及重要性

    本文旨在為硬件和嵌入式工程師提供機器學習(ML)的背景,它是什么,它是如何工作的,它為什么重要,以及 TinyML 是如何適應的
    發(fā)表于 06-12 09:27 ?1564次閱讀

    如何在 MCU 上快速部署 TinyML

    您對人工智能 (AI) 和機器學習 (ML) 感到好奇嗎?您想知道如何在您已經(jīng)使用過的微控制器上使用它嗎?在本文中,我們向您介紹了微控制器上的機器學習。該主題也稱為微型機器學習 (
    的頭像 發(fā)表于 07-19 10:24 ?1844次閱讀
    如何在 MCU 上快速部署 <b class='flag-5'>TinyML</b>

    什么是TinyML?

    了解機器學習ML) 的一個子部分,稱為微型機器學習TinyML)、它是什么、它的應用程序、硬件和軟件要求以及它的優(yōu)勢。 機器學習
    的頭像 發(fā)表于 01-27 16:51 ?9891次閱讀
    什么是<b class='flag-5'>TinyML</b>?
    RM新时代网站-首页