在全球人工智能浪潮席卷各行各業(yè)的今天,算力需求正以前所未有的速度從云端向終端側(cè)擴(kuò)散。智能手機(jī)、智能汽車、物聯(lián)網(wǎng)設(shè)備乃至個(gè)人電腦,都迫切需要更強(qiáng)大、更高效、更隱私安全的本地AI處理能力。值此關(guān)鍵節(jié)點(diǎn),全球半導(dǎo)體設(shè)計(jì)與軟件生態(tài)的基石性企業(yè)Arm,近日重磅推出了其面向終端側(cè)人工智能的“軟硬件全家桶”解決方案。這并非單一產(chǎn)品的升級(jí),而是一次從底層IP核、計(jì)算平臺(tái)到軟件開發(fā)工具、模型優(yōu)化框架的體系化出擊,旨在系統(tǒng)性降低AI技術(shù)落地的門檻,賦能全球開發(fā)者與設(shè)備制造商,加速智能向萬物終端的滲透。
硬件基石:NPU引領(lǐng)與計(jì)算平臺(tái)協(xié)同進(jìn)化
Arm此次展示的硬件核心,是其新一代的高效神經(jīng)網(wǎng)絡(luò)處理器(NPU)IP——Arm Ethos?系列。與前代相比,新版Ethos NPU在能效比和性能密度上實(shí)現(xiàn)了顯著躍升,專門針對(duì)Transformer等現(xiàn)代AI模型進(jìn)行了架構(gòu)優(yōu)化。它能夠在不顯著增加芯片面積和功耗的前提下,為終端設(shè)備提供每秒數(shù)萬億次運(yùn)算(TOPS)的AI推理算力,足以流暢運(yùn)行復(fù)雜的視覺識(shí)別、自然語言處理和多模態(tài)模型。
更重要的是,Arm強(qiáng)調(diào)“整體計(jì)算”理念。Ethos NPU并非孤立運(yùn)作,而是與Arm的CPU(如Cortex-X/A系列)和GPU(如Immortalis/Mali系列)緊密協(xié)同,構(gòu)成異構(gòu)計(jì)算聯(lián)盟。通過智能的任務(wù)分配與數(shù)據(jù)調(diào)度,系統(tǒng)能夠根據(jù)AI工作負(fù)載的特性,將其動(dòng)態(tài)分配給最合適的處理單元——NPU處理大規(guī)模的并行矩陣運(yùn)算,CPU處理控制流和復(fù)雜邏輯,GPU處理圖形與并行計(jì)算。這種協(xié)同不僅釋放了每一塊硬件的最大潛能,還實(shí)現(xiàn)了能效的最優(yōu)化,對(duì)于電池續(xù)航至關(guān)重要的移動(dòng)設(shè)備而言,這是決定性的優(yōu)勢(shì)。
軟件賦能:統(tǒng)一工具鏈與模型優(yōu)化“瘦身術(shù)”
硬件是軀體,軟件則是靈魂。Arm深諳此道,因此其“全家桶”中軟件部分的份量同樣舉足輕重。其核心是Arm Kleidi? 軟件框架和一系列配套工具。
- 統(tǒng)一的軟件開發(fā)套件(SDK):Kleidi? 為開發(fā)者提供了一個(gè)統(tǒng)一的編程接口和工具鏈,屏蔽了底層NPU、CPU、GPU的硬件差異。開發(fā)者無需為不同的Arm計(jì)算平臺(tái)重寫或大幅修改代碼,即可將AI模型高效部署到海量終端設(shè)備上,極大地提升了開發(fā)效率和軟件的可移植性。
- 先進(jìn)的模型優(yōu)化與壓縮工具:針對(duì)終端設(shè)備內(nèi)存有限、算力受限的挑戰(zhàn),Arm提供了強(qiáng)大的模型優(yōu)化工具。它支持主流的訓(xùn)練后量化(PTQ)、量化感知訓(xùn)練(QAT)、剪枝、知識(shí)蒸餾等技術(shù),能夠?qū)嫶蟮脑贫薃I模型“瘦身”為適合終端運(yùn)行的輕量化版本,在精度損失極小的情況下,將模型大小和計(jì)算需求降低一個(gè)數(shù)量級(jí)。例如,一個(gè)數(shù)十億參數(shù)的對(duì)話模型,經(jīng)過優(yōu)化后可以在高端手機(jī)上實(shí)現(xiàn)流暢的本地運(yùn)行。
- 全面的參考模型與庫支持:Arm與主流AI框架(如TensorFlow Lite、PyTorch Mobile)深度集成,并提供了針對(duì)其硬件優(yōu)化的算子庫和一系列經(jīng)過預(yù)優(yōu)化的參考AI模型(如圖像分類、目標(biāo)檢測、語音識(shí)別等),為開發(fā)者提供了堅(jiān)實(shí)的“起跑線”。
生態(tài)共振:賦能產(chǎn)業(yè),加速落地
Arm的此次布局,其深遠(yuǎn)意義在于對(duì)全球終端AI生態(tài)的系統(tǒng)性賦能。
- 對(duì)芯片設(shè)計(jì)公司(如高通、聯(lián)發(fā)科、三星等):Arm提供的是經(jīng)過驗(yàn)證的、高性能的IP模塊和設(shè)計(jì)藍(lán)圖,顯著縮短了它們開發(fā)專用AI SoC的周期和風(fēng)險(xiǎn),使其能快速推出具備強(qiáng)大AI能力的芯片產(chǎn)品。
- 對(duì)設(shè)備制造商(OEM/ODM):統(tǒng)一的軟件棧和優(yōu)化工具,使得手機(jī)、汽車、XR頭顯等廠商能夠更快速、更穩(wěn)定地將差異化的AI功能(如更聰明的拍照、實(shí)時(shí)語音翻譯、車內(nèi)智能助手)集成到產(chǎn)品中,打造核心競爭力。
- 對(duì)應(yīng)用開發(fā)者:簡化的部署流程和強(qiáng)大的性能保障,激發(fā)了創(chuàng)新活力。開發(fā)者可以更專注于AI應(yīng)用場景的創(chuàng)新,而非耗費(fèi)精力在底層硬件適配和性能調(diào)優(yōu)上,從而催生更多新穎的終端側(cè)AI應(yīng)用。
定義終端智能的下一個(gè)十年
Arm亮出的AI軟硬件全家桶,標(biāo)志其從“移動(dòng)計(jì)算架構(gòu)的提供者”向“全域智能計(jì)算平臺(tái)定義者”的戰(zhàn)略升級(jí)。它通過提供從硅前到硅后、從硬件到軟件的全棧式解決方案,正在構(gòu)建一個(gè)更開放、更高效、更易用的終端側(cè)AI開發(fā)與部署生態(tài)。這不僅是技術(shù)的堆砌,更是生態(tài)的梳理與規(guī)則的制定。在AI決勝于邊緣的時(shí)代,Arm正在鋪設(shè)一條讓智能算力無所不在的高速公路,其行動(dòng)將深刻影響未來十年消費(fèi)電子、汽車電子和物聯(lián)網(wǎng)產(chǎn)業(yè)的競爭格局與創(chuàng)新節(jié)奏。終端側(cè)AI的快速、規(guī)模化落地,由此獲得了最關(guān)鍵的底層推動(dòng)力。