當前位置:首頁 > 專訪 > 付斌
[導讀]十年轉瞬,Armv9架構終於露出廬山真面目,適用於Arm全系列芯片的Armv9架構,這次的升級瞄準的則是日益強大的安全、人工智能(AI)和無處不在的專用處理的需求。實際上,Armv9架構的推出也與正預示着行業的發展方向。憑藉新架構,Arm提出了3000億的目標。

Arm架構在如今的電子行業中可以説是無處不在。自1990年Arm公司正式成立Armv4架構到2011年Armv8架構,短短21年架構經過了5次重大升級。而Armv8意味着Arm正是從AArch32邁進AArch64,憑藉強大的實力在過去的五年基於Arm架構的設備出貨量超過了1000億。

十年轉瞬,Armv9架構終於露出廬山真面目,適用於Arm全系列芯片的Armv9架構,這次的升級瞄準的則是日益強大的安全、人工智能(AI)和無處不在的專用處理的需求。實際上,Armv9架構的推出也與正預示着行業的發展方向。憑藉新架構,Arm提出了3000億的目標。

Armv9的三個技術特性

根據Arm高級副總裁、首席架構師兼技術院士Richard Grisenthwaite的介紹,Armv9架構是基於Armv8既往成功的基礎,並增添了針對矢量處理的DSP、機器學習ML、安全等這三個技術特性。

Armv8之所以“統治”市場十年之久,最大的升級點便是引入了64架構,即AArch64,這也是Arm版本升級最大的一次改變。除此之外,AArch64摒棄了此前的處理器模式、優先級級別等傳統概念,提出了ELException level),並在兼容設計上定義了兩套運行環境ESExecution state)。這些也都被Armv9所繼承,可以説Armv9是集大成者,將Arm三十多年的核心完美繼承下來。

矢量處理的DSP、機器學習ML處理能力提升要歸功於可伸縮矢量擴展(SVE2)和矩陣乘法指令的引入。相比SVE128位矢量,SVE2可以支持多倍128位運算,最多2048位,因此才有如此魔力可以增強對在CPU上本地運行的5G系統、虛擬和增強現實以及ML工作負載的處理能力。

根據Richard Grisenthwaite的介紹,SVE2增強多項DSP和機器學習ML處理能力,例如Scatter-Gather DMA直接存儲器訪問,把它放到CPU架構中,能實現更多的循環,更大的DSP處理能力,從而支持更多的並行化。

安全能力提升則主要是通過Arm推出的全新的機密計算架構CCAConfidential Compute Architecture)實現,根據介紹CCA通過打造基於硬件的安全運行環境來執行計算,保護部分代碼和數據,免於被存取或修改,甚至不受特權軟件的影響。同時還將基於此前的TrustZone安全技術引入動態創建機密領域(Realms)的概念,機密領域面向所有應用,運行在獨立於安全或非安全環境之外的環境中,以實現保護數據安全的目的。

Armv9在算力上的提升

提到架構的升級,就離不開算力這一個話題,Armv9架構能夠為Arm後兩代產品提供30%的性能提升。根據介紹,以智能手機等移動平台使用的Cortex-X/A系列為例,X1/A78這一代的性能相比16nm A72提升2.5倍,下一代的Matterhorn架構及Makalu架構會保持30%以上的IPC性能提升。

除了CPU性能以外,Armv9還非常重視整體的性能提升,包括降低內存延遲(從150ns降至90ns)、頻率提升(從2.6GHz到3.3GHz)內存帶寬(從20GB/s到60GB/s)、緩存等。

Richard Grisenthwaite強調,Arm在新一代架構Armv9上將保持這個速度,預計未來兩代移動和基礎設施CPU的性能提升將超過30%。,這個數據是根據業界標準評測工具來衡量的,而且這樣30%的算力提升完全是憑藉於本身的架構而不是藉助於製程工藝來實現。

另外,隨着摩爾定律正在放緩,如何進一步提升算力呢?他認為,Arm將通過最大化地提升頻率、帶寬、緩存大小、並減少內存延遲,以最大化CPU性能。

除了CPUArm還表示Mali GPU會增加更多高級功能,例如VRS可變幀率渲染、RT光線追蹤及其他高級渲染技術等。

Armv9引發的市場競爭力

實際上,在去年Arm發佈Arm® Cortex®-M55處理器和Arm Ethos™-U55神經網絡處理器(NPU)兩款重磅“性能炸彈”時,就已開始蓄力發展人工智能(AI)。Cortex-M55是Arm歷來AI能力最為強大的Cortex-M處理器,能夠大幅提升DSP與ML的性能,同時更省電。

反觀行業趨勢,應用開始要求提供更高的數字信號處理(DSP)性能,實時算法的複雜程度增加和浮點算法趨勢下,DSP核或硬件加速單元越來越多被部署內嵌在器件之中。DSP一直影響着下一代產品創新,這是因為許多算法在字長和動態範圍有着很高的要求,DSP可免去定點到浮點的轉化工作加速產品上市,另外DSP浮點計算成本越來越接近定點計算。正因如此,便形成了Arm+DSP內核的黃金搭檔。

另外,行業也正在將越來越多的機器學習工作負載變得更加普遍,雖然機器學習有着許多專用的加速器,不過相比來説大量的小範圍機器學習的主力仍然是CPU,因此矩陣乘法指令成為關鍵。

在安全性能上,Arm曾在此前進行了多維度的功能增強,包括PSA認證、TrustZone等。目前PSA認證已經有有超過35個合作伙伴提供的60多種認證產品,而新推出的CCA則也將基於TrustZone提供更加安全的架構。

Armv9着眼的點來看,行業正逐漸對算力功耗平衡性和安全性能要求提高。Arm架構可用在物聯網的大部分設備之上,因此對這兩項要求更加吃緊。大數據時代爆炸量的信息增長下,一方面將計算分成了多個維度,另一方面將會對數據安全提出更高的要求。

根據Arm的介紹,搭載ARMv9處理器的芯片最快在2021年年底就會面世,物聯網發展日趨成熟,這個時間點恰好提升競爭力的好時機。市場或將擁有追求極致計算性能的高端產品、超低功耗的省電高手、主打安全可靠的產品。而Armv9經過架構的更新,能夠從底層和非製程方向進行大改革,相信能為市場帶來新的競爭力。

而在廣為受關注的國內授權問題上,Arm強調:“Arm既有源於美國的IP,也有非源於美國的IP。經過全面的審查,Arm確定其Armv9架構不受美國出口管理條例(EAR)的約束。Arm已將此通知美國政府相關部門,我們將繼續遵守美國商務部針對華為及其附屬公司海思的指導方針。

換一批

延伸閲讀

[消費電子] 來了,真的來了!華為鴻蒙系統正式開通官微,期待嗎?

來了,真的來了!華為鴻蒙系統正式開通官微,期待嗎?

最近一段時間,手機數碼界最火的一件事情莫過於華為開始大範圍推送手機鴻蒙OS系統,雖然目前仍處於開發測試階段,但此次測試推廣範圍達到了以往前所未有的高度,鴻蒙OS系統也引起了廣大網友激烈地討論,按照華為之前公佈的計劃,鴻蒙OS離我們普通消...

關鍵字: 華為 鴻蒙系統 EMUI

[模擬技術] 6億美元專利費到賬,華為收的專利費算多嗎?

6億美元專利費到賬,華為收的專利費算多嗎?

最近,華為又遇挫折,繼英國、瑞典、意大利等取消此前簽署的5G合作協議後,德國也通過了一項新的5G網絡立法,這項安全立法有針對華為的意思,這讓德國有權利阻止運營商與“不可信賴”供應商簽署合同。德國雖然沒有點名華為,但新的法案形同將...

關鍵字: 華為 三星 蘋果

[OFweek維科網] 印度5G供應商名單:沒有華為、中興!

印度5G供應商名單:沒有華為、中興!

(圖片源自OFweek維科網) 據外媒報道,當地時間5月4日,印度通信部發布公告稱,將允許愛立信、諾基亞、三星等全球電信設備製造商參與印度的5G試驗。但在這份5G供應商名單中,卻唯獨沒有中國企業在內。 對此,外...

關鍵字: 華為 網絡 中興 5G

[通信技術] 又一通信巨頭走向衰敗,曾與華為平起平坐!

又一通信巨頭走向衰敗,曾與華為平起平坐!

大唐電信科技股份有限公司是電信科學技術研究院(大唐電信科技產業集團)控股的的高科技企業,公司於1998年在北京註冊成立,同年10月,“大唐電信”股票在上交所掛牌上市。作為國內具有自主知識產權的信息產業骨幹企業,大唐電信已形成集成電路設計...

關鍵字: 華為 通信 大唐電信

付斌

110 篇文章

關注

發佈文章

技術子站

關閉