DSP +CPU的結合:物聯(lián)網處理的*佳選擇
一般認為,在需要數(shù)字信號處理時(在調制解調器的物理層、智能揚聲器的麥克風波束形成或跟蹤設備的地理定位時)要使用DSP。如果需要數(shù)字控制(運行協(xié)議?;蚬芾硪纛l編解 碼 器或GNSS的控制方面 ),則要使用MCU。由于典型的物聯(lián)網設備需要這兩種功能,因此必須使用兩個或更多內核。對于對續(xù)航時間要求不高的高利潤設備,這也許不是什么大問題,但對許多物聯(lián)網應用而言這可能是一個嚴重缺點。對于這類應用,經優(yōu)化的復合處理器可以更經濟高效地滿足這兩種需求,并延長設備續(xù)航時間。我們對此進行了非常詳細的分析;我們認為這樣的解決方案不僅可行,而且在各種物聯(lián)網應用中具有很強的競爭力。
想想共享單車或共享踏板車。這些設備顯然需要跟蹤,因此嵌入式設備必須能夠確定位置,針對這個問題的現(xiàn)代解決方案是使用GNSS(全球導航衛(wèi)星系統(tǒng))。它還必須能夠進行通信,由于通常遠離藍牙網或Wi-Fi接入點,因此蜂窩接入是理想平臺。由于不需要傳遞大量數(shù)據,NB-IoT是*理想的協(xié)議??紤]到用戶對**性和隱私性的需求增加,還需要一定程度(可能遠多于預期)的本地計算。
這樣一來,你的簡單設備必須支持4G(可能是5G)、GNSS、應用程序和加密,也許還需要**區(qū)/**啟動。但是,你計劃將數(shù)以千計的這類設備投放到許多城市的許多地點,能否提供*佳可用性和具競爭力的價格將決定企業(yè)的存亡。因此,盡可能降低成本和能耗(減少維護)成為決定企業(yè)存亡的關鍵。
我們認為應該特別關注這些應用中的計算需求,特別是數(shù)字信號處理和數(shù)字控制的平衡。我們首先研究了NB-IoT連接、GNSS和**標準的基礎算法。我們將以約100MHz運行的資產跟蹤器應用程序的活動分解為DSP功能(基帶調制解調器和物理層控制的某些部分)和控制功能(協(xié)議棧、**性和一般系統(tǒng)管理)。對于NB-IoT不經常通信的輕量級應用程序,我們發(fā)現(xiàn)時鐘周期的消耗構成如下:
-
調制解調器PHY(主要是DSP) - 約35%
-
L1控制(DSP和控制) - 約25%
-
協(xié)議棧(主要是控制) - 約40%
在此,信號處理和控制的時鐘周期分布非常均勻,說明合并處理器是合理之舉。如果不能同時運行這兩種功能,是否會影響性能?其實不會。這些都不是高性能應用程序。在需要處理速度的情況下(比如*新eNB-IoT版本),通常可通過將功能排序降低凈能耗。讓每個功能依次快速運行和停止,這是能源管理的常見做法。
為擴展我們的分析范圍,我們研究另一種熱門應用——聲音處理和語音控制。想想智能揚聲器、無線耳塞、可穿戴設備、聲控設備以及由特殊噪音(如玻璃破碎)激活的**設備。這些應用具有不同的需求組合:音頻編解 碼 器(如杜比音樂播放)、語音/聲音拾取降噪、以及用于識別觸發(fā)短語甚至有限詞匯以便進行設備控制的神經網絡處理。
在此,我們使用杜比全景聲(Dolby Atmos)以及內部降噪和語音識別基準來按時鐘周期分析活動,并發(fā)現(xiàn)以下大致分布:
-
音頻編解 碼 器 - 控制占70% ,DSP占30%
-
降噪 –DSP(許多濾波器)占90%,控制占10%
-
RNN / LSTM神經網絡 - DSP占60%,控制占40%
這些用例更多地偏向DSP活動,但控制活動仍占一定比例,因此采用組合核心是合理做法。
在一個處理器中組合兩個功能的理由看起來非常充足,但這不僅僅是將一些MAC納入控制器。 DSP必須達到嚴格的DSP應用標準,比如*新通信標準。因此,它需要16x16和32x32 MAC、SIMD以及對GNSS需要的浮點和雙精度浮點的本地支持。隨著NB-IoT和不同GNSS標準的不斷發(fā)展,該架構必須特別靈活,以便在軟件層面進行調整。同時,這樣的解決方案必須作為控制器高效運行、代碼尺寸非常緊湊(很多數(shù)字處理DSP在這方面效率不高)和高效的開箱即用C語音開發(fā)支持,以便連接既有代碼或者開放生態(tài)系統(tǒng)代碼。
我們基于這一理念開發(fā)出CEVA-BX1和CEVA-BX2內核。*近的Linley Group報告中對它們進行了審核。該報告提供了詳細技術細節(jié),并說明平臺可獨自執(zhí)行(對另一種解決方案)需要DSP IP和MCU IP一起才能完成的任務。這值得任何關注能耗和成本的人深思。