Cloud is where AI is born;
Device is where AI acts;
Edge will be where AI lives。
如果要在 GTC DC 大會上,尋找一個英偉達身上最 " 性感 " 而非最 " 實感 " 的故事,不同人或許有不同的答案,但有一個技術品牌可能真的要新加入候選人名單了。正是為了它,英偉達剛剛花費了 10 億美元入股了老牌電信廠商諾基亞。它就是英偉達 AI-RAN 的核心技術品牌:
Aerial。
Aerial,今天是一個帶有點工業氣息的詞語。但詞源來自拉丁語 aerius,意指 " 空氣的、輕盈的、高聳的 ",在古時也用來形容虛幻的、輕盈優雅的美。它讓人聯想起另一位硅谷 " 幫主 "OpenAI 的視頻產品:
Sora。
Sora 在日語中的本意是 " 空 ",可以是天空,也可以是想象遙遠地方時的一種心境。
無論英偉達還是 OpenAI 都把自己的旗艦產品指向天空,這不是一種偶然,也不僅是一種硅谷審美樂趣上的趨同?;蛟S它們將講述的是相似一個東西,但現在我們先暫時按下不表。
所謂 AI-RAN,用大白話理解就是在通訊基站上加入算力,讓未來海量的場景計算可以不用進入云,直接在基站計算完以后就能夠返回給終端的場景設備。
這樣的方式有兩個最顯而易見的好處:
一個是節省大量的傳輸成本,降低云算力中心的壓力。
微軟 CEO 薩提亞 · 納德拉(Satya Nadella)在前兩天與 OpenAI CEO 山姆 · 奧特曼(Sam Altman)對談時就提到了這種 AGI 困境:他說他的倉庫里還有 GPU,但沒有足夠的算力中心容納,也缺少足夠的電力使用。那么其實 AI-RAN 把算力分布式地放在全球的各個基站里,就可以成為以上的解決方案之一。
第二個則是大幅降低算力的時延。
打過在線游戲的讀者都知道,有 50 毫秒以內的時延都屬于 " 流暢 ",但如果把這個延遲復用到自動駕駛上,高速路上將到處都是被撞爛的廢鐵,這也是今天高精地圖方案被邊緣化的重要原因。但如果將算力中心推進到用戶周圍,那么延遲可以降低 90% 以上,從毫秒級變成微秒級,大量高時延要求的場景就會跑通了。
根據目前可考的公開資料,Aerial 最早出現在英偉達的資料里是在2019 年洛杉磯世界移動通信大會,那時它還只是一套 SDK 工具,目的是支持 GPU 加速與軟件定義的 5G 無線接入網。
沒錯,2019 年,正是 " 何同學 " 拍 5G 視頻獲得三千萬播放量的夢幻之年。
所以從這個角度來說,Aerial 大概也能算是一個 "5G 原生 " 的工具,正是通訊帶寬的快速增長讓英偉達看到了一個未來世界的影子,于是 Aerial 誕生了。
而在過去五年時間里,5G 逐漸讓不少人失望,但 Aerial 一直在默默發育。
在這期間,Aerial 的定位脫離了最初的 SDK 工具箱的數據,而轉變為一個為 " 產學研 " 服務的平臺。
2021 年 3 月,NVIDIA 在 IEEE 的 5G 分論壇上發了一篇論文《NVIDIA Aerial GPU Hosted AI-on-5G》,介紹 5G 連接和移動邊緣計算(MEC)的 NVIDIA 超融合(hyper-converged )平臺,那時他們的案例目標是工業 4.0。
在這篇論文的摘要里,NVIDIA 明確表示:
Aerial 是一個為研究人員提供下一代無線和人工智能研究平臺,從而實現行業轉型開放平臺(As an open platform Aerial is positioned to be industry transformational by providing researchers with a platform for next generation wireless and AI research)。
一個月后,NVIDIA 在 2021 GTC 大會上推出 Aerial A100,即 NVIDIA AI-on-5G 計算平臺。
Aerial A100 其實是將,NVIDIA Aerial 軟件開發套件與 NVIDIA BlueField-2 A100 芯片結合起來的產品,后者很大程度脫胎自是英偉達 2020 年剛完成收購的 Mellanox 的 DPU 產品線。雖然是這是一個拼湊起來的產品,一張包括了"5T FOR 5G" 解決方案、集成 GPU 和 DPU 的融合型卡,但它為 AI-RAN 提供了寶貴的計算平臺,得到了包括谷歌云、富士通的支持。
是的,他們甚至沒有在名字里放入 AI ——所謂 5T,指的是 " 時間觸發傳輸技術 "(Time-Triggered Transmission Technology for Telco)。顧名思義,這其實就是要解決精確時間戳和高時鐘準確性的問題,但這其實是大規模邊緣計算的基礎。
有趣的是,而那年媒體對 2021 GTC 的標題是:"NVIDIA 推出首款 CPU,狂推 ARM 生態。" 雖然服務器業務依然重要,但今天已經不太有人想起 CPU 了,更不會用 ARM 的視角來看待 NVIDIA 了。
隨后 Aerial 迎來了一個小的高峰,這從英偉達的 " 技術博客 " 可見一斑,在 2022 年以后有體積 Aerial 的技術博客數量快速增加。

DOCA GPUNetIO 讓 GPU 繞過 CPU 實現直連網絡,降低了時延和成本、提高了吞吐量;
Sionna 庫則是一個 GPU 加速的開源庫,用于通信系統研究,官方說它可以實現 " 自動微分框架 "," 通過整個通信系統反向傳播梯度 ",非常適合 " 神經網絡集成 ";
Aerial Research Cloud 是第一個完全可編程的 5G 和 6G 網絡研究沙盒。
但你依然可以將英偉達對 Aerial 做的所有事情,都重新回到 2021 年的那個論文標題上:
GPU Hosted AI-on-5G
2024 年是英偉達 Aerial 的生態大年。
2 月,著名的 AI-RAN Alliance 成立,牽頭單位是英偉達和軟銀,其他創始單位分別是愛立信、諾基亞、三星、T-mobile、微軟、AWS、Arm、DeepSig、美國東北大學。
AI-RAN Alliance 成為了英偉達希望重新改寫 6G 定義模式的重要一步,因為它囊括了(除了華為和中興以外)幾乎最重要的通信相關的公司。其組織目標就是要讓 AI 與 RAN 結合,從而讓 6G 變成真正的 AI 原生網絡。
3 月,英偉達還推出了包含 Omniverse 生態系統和 Aerial CUDA 的 6G 研究平臺。
而直到 9 月份, 英偉達在 GTC Paris 2024 才宣布正式推出 NVIDIA AI Aerial。
這是它在官方介紹中,它已經成為了一個優化無線網絡和提供全新生成式 AI 體驗的一站式平臺。
英偉達官方的通訊稿里是這樣介紹 AI Aerial 的。
NVIDIA AI Aerial 平臺提供了全套功能,包括高性能軟件定義的 RAN 以及訓練、模擬和推理,以便電信運營商能夠參與下一代無線網絡從開發到部署的所有階段。
NVIDIA AI Aerial 平臺提供的功能包括:
NVIDIA Aerial CUDA 加速 RAN:包含使合作伙伴能夠在 NVIDIA 加速計算平臺上開發和部署高性能虛擬化 RAN 工作負載的軟件庫。
NVIDIA Aerial AI 無線電框架:包含基于 PyTorch 和 TensorFlow 的軟件庫,用于開發和訓練能夠提高頻譜效率并為 5G 和 6G 無線電信號處理添加新功能的模型。該框架還包含 NVIDIA Sionna,該鏈路級模擬器可用于開發和訓練基于神經網絡的 5G 和 6G 無線電算法。
NVIDIA Aerial Omniverse 數字孿生(AODT)是一個系統級網絡數字孿生開發平臺。AODT 能夠以物理學精度模擬無線系統,無論是單個基站,還是由大量基站組成的覆蓋整個城市的綜合網絡都不例外。它包含軟件定義的 RAN(Aerial-CUDA 加速 RAN)和用戶設備模擬器,以及物理世界的現實地形和物體屬性。
這里包含了英偉達對下一個 6G 的很多定義和想象:
高性能的算力、神經網絡的分布式網絡能力、數字孿生的虛擬世界開發能力。
也從此開始,英偉達開始加速推進整個 AI-RAN 的生態建設的擴容,不僅與 Vapor IO 這類邊緣計算服務商在拉斯維加斯開辟實驗田,也不斷開源新的工具,推進新的頭部合作伙伴。
而這一系列生態動作,在 2025 年 10 月的 GTC DC 大會上達到了一個階段性的峰值。
Aerial 沖刺 CUDA 時刻
在 10 月 GTC DC 大會期間,英偉達終于對著 AI-RAN 暗流涌動的湖面上扔下了兩個大石頭:
第一,開源 Aerial 軟件。
開源后的軟件,將可以運行于包括 NVIDIA DGX Spark 在內的多種 NVIDIA 平臺。
DGX Spark 就是黃仁勛之前親手交付給馬斯克和李在镕的小 " 便當盒子 ",是目前全球最小的 "AI 超級電腦 ",可以在本地執行最高 2000 億參數的 AI 模型推理和 700 億參數的模型微調,可以說完美匹配像 AI-RAN 場景多元的開發生態需求,非常適合高校研究者和個人開發者參與。

入股后英偉達將占比 2.9%,英偉達的 AI-RAN 生態產品將進入諾基亞的 RAN 產品組合里,雙方共同推進 6G 的 AI-RAN 落地。
第三,英偉達推出了 Aerial RAN Computer Pro (ARC-PRO)平臺。
如果說曾經的 Aerial 平臺還是一個帶有研發起步性質的小平臺,這次的 ARC-PRO 就是為頂級合作伙伴預備的產業級大跑道,它可以直接和基站結合,既能服務 5G 實現 AI-RAN 功能,還能幫助 5G 向 6G 的平滑過渡。介紹稿里的標題也從 AI-RAN,正式切換成了 "6G AI"。英偉達對這個 6G AI 平臺的口氣也變得很大,甚至在中國讀者看來可能是很具有侵略性的:
" 驅動美國重返電信領導地位 "。
如果了解英偉達歷史的讀者,至此可能已經有一種似曾相識的感覺。 Aerial 的發展歷程很像 CUDA,幾乎是一種關于技術的商業美學復刻。
黃仁勛力推 CUDA,因為它看到 GPU 不止局限于游戲圖像,而有通用計算能力的潛力;推 Aerial,因為 RAN 不止是通信,還可能是未來的 AI 基礎設施。
CUDA 從高校生態起步,花了十年時間培養,最終形成了獨有的生態護城河;Aerial 也是從小的研發性質開發平臺起步,一步步變成一個 AI-RAN 生態,總共花了五年時間,成為了英偉達基站算力業務的護城河。
從單點工具 → 通用平臺 → 生態護城河,這是英偉達與時間的經典故事。
但如果細究,則會發現兩者在商業細節上不完全相同。
這種差別不是在節奏的快慢上,Aerial 是含著金鑰匙出身的孩子,節奏自然更快。最大的區別是英偉達對生態伙伴的態度上。
以算法生態為例,CUDA 是閉源為主,Aerial 是開源為主。
在合作方面,CUDA 的開放主要是積累開發者的習慣和口碑,Aerial 雖然也擁抱大量中小開發者,但核心戰略目標直指生態中的頂級玩家。
英偉達若要復刻 CUDA 時刻,第一個 " 北極星指標 " 實際上是讓自己的標準與生態被 " 大玩家 " 接受。沒有通信行業錯綜復雜的利益生態的支持,AI-RAN 就無從談起。在通用計算方面,GPU 對 CPU 是從無到有的降維打擊。但 Aerial 對 RAN 則是從無到有的合作升維。
從這個角度來說,雖然貴為 5 萬億美金的硅谷新寵,在通信市場里,英偉達依然在扮演 " 仰攻 " 和 " 說服者 " 的角色。
"10 億美金入股 " 就是其中最有力的說服方式。
諾基亞可能是今天 Aerial 所能找到的最完美合作伙伴。
拋開華為外的歐美國家市場,諾基亞的 5G 基站市場份額已經落后愛立信,且在趨勢上與后者的差距越來越大。尤其在美國的基站市場,諾基亞丟單 Verizo 以后,一度傳出僅剩的 T-Mobile 也將不保。與英偉達的合作或許可以幫助諾基亞在美國市場重新站穩腳跟。
2023 年,諾基亞出臺過一個 "2030 年計劃 "。該計劃與英偉達的喜好高度吻合,它將 AI 放在了所有戰略的第一條,將 " 云連續體 " 放在了第二條。所謂云連續體,其實就是將 " 云 - 邊 - 端 " 無縫融合,背后最大的市場機會其實就是 " 邊緣云 " 市場。
而如果按照英偉達的技術構想,今天的通信公司未來都可以成為新的云計算公司。這點我們放在最后細說。
最后,諾基亞是一個股權分散的上市公司,大股東系芬蘭政府旗下資金,不直接干預公司經營。因此,英偉達 2.9% 的持股,既不會過度引發其他基站公司的抵觸和擔憂,也能直接對諾基亞施加影響。
對于英偉達而言,入股諾基亞有兩大戰略優勢。
第一,6G AI 的部署速度會領先行業,假如英偉達率先將部署了 Aerial 的基站設備推向市場,再在 Aerial 基礎上形成應用生態,率先做成生態的增長飛輪。
這有點像安卓之于塞班、Windows Mobile 等系統,先發優勢會形成操作系統的重要優勢。
第二,則是關于傳統 RAN 市場格局中非常重要的投票機制:3GPP。
3GPP 是全球移動通信技術標準的核心制定組織,組織內有上百個不同產業鏈的關鍵企業。3GPP 在中國算半個網紅,因為它曾在幾年前爆發過一個科技行業非常出圈的新聞,即華為主推的 Polar 碼和高通主推的 LDPC 碼的 " 投票門 "。投票過程被花邊演繹,結果對某投票的企業形成了極大的公關創傷。
其實像編碼提案是需要 71% 的投票率通過,因此并不存在嚴格意義的 " 關鍵少數 ",而是以技術共識為主、投票為輔的決策形式。但 3GPP" 權力修羅場 " 的形象已經被深刻留在了互聯網里了。
英偉達雖然有 AI-RAN 作為行業聯盟,但 3GPP 才是規則的制定者。壞消息是,由于沒有傳統的通信業務,英偉達在其中的權重很低,存在感很弱。所以英偉達也需要一個具有生態協同能力的策動能手,而諾基亞便是在 3GPP 中與華為、愛立信、高通并駕齊驅的第一梯隊權重的投票者,對上下游的其他投票權企業也有很深的影響力。
而今年和明年的 3GPP 討論 release 20 和 release 21 剛好是 5G 轉向 6G 的重要節點。
其中 2025 年的 release 20 被認為是 5G-Advanced 的最后一站,也是邁向 6G 的第一站。而大概率在明年召開的 release 21 則將是 6G 標準的第一站。英偉達需要抓住更多的時間窗口,來為自己的 AI-RAN 生態獲得更好的站位。
英偉達是今天 RAN 生態不可忽視的變量,高通也是。
如果將 AI-RAN 粗暴地分成 AI 和 RAN 兩個維度,再將二家半導體巨頭放在一起比較:顯然英偉達是 AI 強,RAN 弱;高通則是 RAN 積累更深,AI 相對英偉達處下風。
在 6G 時代,高通當然也會是重要的參與者。但這涉及到一個話語權的重新爭奪:
6G 的本質到底是傾向于 AI 還是 RAN ?
最簡單的做法是算賬。
我們暫時無法給出準確的數據,但是有一些相近的數字可以參考。DGX Spark 128G 的定價是 3999 美元,折合人民幣近 3 萬元;算力中心的大芯片 A100,大內存的單卡價格在 1.5 萬美金往上,折合 10 萬人民幣。
5G 基站方面,此前有媒體通過中國移動的總 5G 投資和總 5G 基站部署量,計算出整體的基站平均部署成本大約 40 萬人民幣(含安裝、土地等綜合成本)。不過近幾年隨著產業鏈成熟,5G 基站成本也在快速下降,有相應集采價格已經跌到 16 萬人民幣。
不過 5G 基站的類型包含了大基站、微基站等不同種類大小,功率和覆蓋范圍差異很大,所以不能一概而論。但 6G 的基站相應會比 5G 更密集,大基站空間更少,微基站更多。不過早期技術普及期,整體價格也可能會高一些。
有兩件事情是確定:
第一,芯片算力會在基站業務中占據非常重要的成本比例;
第二,這個成本占比在未來是存在彈性的:
如果算力的使用頻率越高,場景對算力的需求就會越大,那么芯片在基站中的成本占比也就越高。換言之,相比于 RAN 業務的規模,算力芯片業務的收入想象可以是很宏大的。
而黃仁勛從來沒有放棄過的東西,就是對算力 " 想象 "。
這時我們就不得不搬出 NVIDIA 的另一個殺手锏級的技術品牌:
Ominverse。
這個產品曾經是元宇宙熱潮時候的寵兒,名字也帶著元宇宙的氣息(Omni 是 " 所有 " 的意思,連起來就是 " 全宇宙 ")。2021 年,黃仁勛用它做了一個數字分身做發布會演講,成了 Metaverse 時期的一道獨特風景。
如今,Meta 的時代已經遠去,Omni 卻留了下來。
今天 Omnivesre 成為了英偉達與場景的重要鏈接器,許多跟落地相關的業務都在這里。如果你想知道,算力將在未來改變哪些場景,最簡單的方法就是直接看 Omniverse 的業務線。
比如這次 2025GTC DC 披露的重頭戲自動駕駛業務,背后是 Omniverse 為主導的團隊。
英偉達宣布將要在 2027 年前部署超過 10 萬臺自動駕駛車隊,部署 NVIDIA DRIVE AGX Hyperion 10 自動駕駛平臺。這是除了特斯拉以外,目前最龐大的部署計劃。
在 L4 期間,AI-RAN 似乎不那么重要,但是 L5 幾乎必須 6G 以上的 AI-RAN 網絡支持。
因為 L5 意味著無方向盤的無人駕駛,要在所有路況、所有時間都能夠穩定運行,而如此龐大的車流網絡就必須要邊緣算力支持、配合高精地圖的全局規劃能力。
L5 自動駕駛對于 AI-RAN 是堪稱教科書級別的場景,因為它滿足了 AI-RAN 背后三個場景強烈的需求:
超高的低時延要求、端側難以承載的算力要求、類似 " 群體智能 " 一般的 AI 算力調度能力。
馬斯克在近期接受采訪時,有個 " 大膽 " 的預言。
他說," 未來不會有操作系統,不會有 APP,你的手機只是顯示像素和發出聲音,它預測你最想看到和聽到什么,然后實時生成,我們會盡可能地將 AI 集成到這個設備中。
" 不會再有傳統意義上的手機了,我們所謂的手機,實際上是一個用于 AI 推理的邊緣節點,配備一些無線電模塊進行連接。"
而服務器端的 AI 會與用戶設備(以前被稱為手機)上的 AI 進行通信,并生成用戶想要的任何實時視頻。
馬斯克觀點的本質,其實是 AI-RAN 能力和大模型能力疊加,將取代所有的終端算力。算是最激進的一種 AI-RAN 的愿景,如果這個愿景實現,那么 AI-RAN 就是宇宙級的大生意。但許多研究機構都認同,在 6G 時代 " 云電腦 "、" 云手機 " 會從小眾走向大眾。而其中的 " 云 " 很可能就是 AI-RAN 能力加持的 " 邊緣云 "。人們不再需要花昂貴的價格占有設備,只需要在有高算力需求的時候租用即可。
不過我們如果回到現實,有兩個場景是相對近在眼前的:
一個是機器人與 XR 設備。
目前所有的機器人都面臨 " 端側 " 對話太智障,但是 " 云 " 對話緩慢且昂貴的體驗困境。智能眼鏡廠商,面臨的則是大算力芯片做不進小眼鏡,小設備撐不起長續航的困境。但未來 AI-RAN 可能會成為潛在的解決方案。
一個是 " 元宇宙 " 級別的數字孿生場景。
無論是消費級的游戲應用,還是工業、手術臺、能源、國防都可以做場景的延展。
今年 3 月,NVIDIA 出過一個數字孿生平臺,正是叫 Aerial Omniverse Digital Twin(AODT)。官方說,它可以實現從單個塔到城市規模的完整 6G 系統進行物理級準確的模擬。

一個由邊緣計算節點組建的超級計算機,一個地球 ONLINE 的超級服務器,一個 AI 打破世界的所有鏈接壁壘、又模糊掉所有邊界的線上線下同構的世界。
當然,地球 ONLINE 還很遙遠。但在此之前,你可能需要最后知道,AI-RAN 可能還將改變兩件事情:
一件是好的。
云服務器廠商的格局可能會變化," 邊緣云 " 會從小眾需求變成一件主流的超大生意,而通信服務商則可能會天然成為新的云服務商。下一個 AWS,可能未必出自亞馬遜。
一件是壞的。
如果你打開英偉達 Aeiral 頁面,你會看到一個頁面,寫著:主權 AI 基礎設施。
當然,算力原本也是脫敏的信息,但如果當 5G 通信網絡都無法實現基站生意順暢的跨國競爭。那么在 AI-RAN 時代,你可能更難以想象,歐美的政客會采用其他國家的基站設備。盡管華為可能是這個世界上,唯一既有 AI 芯片能力,又有基站能力的廠商。

它誕生在一個復雜的世界,所以也催生世界的復雜。
