10 月 30 日,Arm Unlocked 2025 AI 技術峰會終于來到了深圳。作為 Arm 與國內科技公司、芯片合作伙伴、行業專家以及開發者們的交流盛會,此次大會設有軟件和產品展示區,同時也設置了消費電子、智能汽車、邊緣 AI、基礎設施和開發者等多個專場論壇,聚焦 AI 計算在這些關鍵領域的前沿技術創新與產業落地實踐。

Arm Lumex CSS 來了,面向 AI 時代而生
在 Arm Unlocked 深圳現場,Arm 終端事業部產品管理副總裁 James McNiven 詳細介紹了 Arm Lumex CSS 平臺的架構與性能提升。該平臺是 Arm 面向旗艦智能手機和下一代個人計算設備推出的計算子系統平臺,采用 "AI 優先 "(AI-first)的全新設計理念。
Arm Lumex CSS 基于最新的 Arm v9.3-A 架構打造,這也使其與前代相比有眾多的升級,比如全新的 C1 系列 CPU 集群和全新的 SME2 矩陣擴展指令集,這也是 Arm 首次將專用矩陣運算加速單元直接集成到 CPU 核心。

其中,作為旗艦級 CPU 的 Arm C1-Ultra 超大核相比前代 Cortex-X925,在單線程峰值性能上提升高達 25%,擁有了更強的處理能力。而主打高效性能平衡的 Arm C1-Pro 大核相較上一代 Cortex-A725,在相同主頻下持續性能提升 16% 的,并在實現相同性能輸出的情況下,能效提升幅度達到 12%。
除此之外,Arm 這次也介紹了兩款針對不同細分市場的新內核,其中面向次旗艦手機設備的 Arm C1-Premium 比 Arm C1-Ultra 在性能接近的情況下面積縮小約 35%,顯著降低芯片成本。面向穿戴設備的 Arm C1-Nano,則完全是把能效最大化作為首要目標,讓迷你設備也能擁有足夠的性能。
而且,Arm Lumex CSS 還擁有全新的 Mali G1-Ultra GPU,除了在圖形和 AI 推理等方面得到雙位數百分比的性能提升外,還集成了第二代光線追蹤技術 ( RTUv2 ) ,使移動端 GPU 的光線追蹤性能相比上代提升兩倍。

得益于 SME2,CPU 在 AI 推理方面實現了至多 5 倍的性能提升,同時在相同功耗下達到 3 倍的能效優化。據 Arm 公布的數據,通過 SME2 內置加速,語音識別等延遲敏感任務的響應速度大幅提高,在測試中,語音類工作負載延遲降低了 4.7 倍,音頻生成速度提升 2.8 倍,使得 AI 翻譯、AI 會議紀要等方面的體驗得到顯著提升。
當然,SME2 所帶來的提升并不止于此,其更大的意義在于讓 CPU 也可以承擔 AI 推理的任務,如此一來即使移動平臺本身沒有配備高性能 NPU,也能夠得到足夠的 AI 性能來運行 AI 應用或服務。
SME2 依托 Arm CPU 這一通用架構,使開發者無需針對各式 NPU 做額外適配或重寫算法,大多數移動設備上都能直接運行統一的 CPU 端 AI 計算。這一點極大降低了端側 AI 應用的開發門檻和推廣成本。簡言之,SME2 讓通用計算平臺承擔 AI 推理,為開發者提供了一個 " 一次開發、廣泛適用 " 的便利途徑。

同時,Arm Lumex CSS 也能為端側設備提供了充分的算力盈余去支撐實時翻譯、智能助手、本地大模型推理等新興 AI 應用。在雷科技看來,Arm Lumex CSS 就是為 AI 時代打造的全新平臺,通過系統級協同設計和軟硬件結合,Arm 將讓 AI 計算變得無處不在且更加高效普及。
直面 Arm 終端副總裁:Lumex 還有哪些亮點?
在主題演講及會議結束后,雷科技也得到了采訪 Arm 終端事業部產品管理副總裁 James McNiven 的機會,并且提問了一個雷科技讀者非常關注的問題:
"本次發布的第二代光線追蹤單元實現了兩倍的性能提升。您如何看待這一改進對移動游戲生態的影響?此外,是否有可能通過人工智能技術,使原本不支持光線追蹤效果的游戲也能夠呈現出類似的視覺體驗?"
ames McNiven 回答稱,第二代光線追蹤單元的核心價值在于大幅擴展了游戲開發者在光照效果上的創作空間。過去由于性能所限,手游中的光線追蹤只能應用于局部場景,而隨著性能翻番,開發者有望逐步實現全場景的實時光線追蹤,帶來更加全面、自然的光影呈現。
他舉例說,在 Unreal Engine 5 的內部測試場景中,去年采用傳統光追時渲染幀率僅約 26~27FPS,而在嘗試將光追計算改為軟件實現后,雖然理論性能提高,但畫面質量并未同步改善。而全新的 Mali G1-Ultra 在同一場景下幀率提升了約 40%,并且光照效果更加真實、細膩。

至于 " 能否通過 AI 讓不支持光追的游戲呈現類似視覺效果 " 的提問,McNiven 表示這是 " 可以期待 " 的方向。他解釋道,借助神經網絡等 AI 技術,有機會為游戲圖形渲染帶來更多創新。例如,通過訓練特定模型,AI 可以在傳統光柵化畫面上模擬出更高級的光影與細節效果,彌補原始畫面的不足。
當然,具體效果取決于所使用的模型,但總體可以預見:未來 AI 驅動的圖形渲染將在光照表現上取得巨大突破。不過他也坦言,就當前而言,硬件原生光追在精確度和畫質上仍有不可替代的優勢,AI 渲染暫時是補充而非完全替代。
同時,作為一名游戲愛好者,McNiven 表示他本人對神經圖形技術充滿期待,希望看到它在移動平臺上釋放更大的潛能與創意。
除此之外,James McNiven 也回答了不少關于 SME2 的提問,表示 SME2 將矩陣加速能力直接集成進 CPU,不僅大幅降低了延遲,更具備廣泛的適配性和部署靈活性,開發者無需為不同設備重復適配,有助于 AI 應用快速落地。
James McNiven 還指出 Arm 的 C1 架構在處理快速迭代的 AI 模型時,展現出強大的通用性和計算彈性,也進一步凸顯 CPU 在異構計算體系中的重要角色。同時,針對未來端側 AI 的 " 殺手級 " 應用潛力,Arm 認為游戲和個性化助理等場景將成為推動消費者換機的核心動力,而 Lumex CSS 已經為此做好準備。
以騰訊和 vivo 等合作案例為例,SME2 已在 AI NPC、語音交互、本地推薦等功能中展現出顯著成效。James McNiven 表示,Arm 正通過軟硬件協同和系統級優化,為用戶帶來更沉浸、更智能的使用體驗,同時也加速 AI 從云端走向終端的變革。
在雷科技看來,隨著 AI 逐漸成為智能終端的核心賣點,用戶對于設備性能的關注點也從傳統的處理速度轉向了 AI 能力的強弱,而 Arm 正是這個浪潮背后最具話語權的推手。