
作者|SnowyM
編輯|陳伊凡
頭圖|AI 生成
"AI 原生 100" 是虎嗅科技組推出針對 AI 原生創(chuàng)新欄目,這是本系列的第「30」篇文章。
近日,OpenAI 被曝正在著手開發(fā)生成音樂的人工智能。根據(jù)科技媒體 The Information 消息,OpenAI 正在和朱麗亞德學(xué)院的學(xué)生合作,為樂譜注釋。
這則消息,讓另一家已經(jīng)在 AI 音樂生成上形成數(shù)據(jù)飛輪的 AI 初創(chuàng)企業(yè)進入了大眾視野,這就是 Suno ——被視為音樂界的 "ChatGPT"。
2024 年,Suno 的橫空出世,第一次實現(xiàn)了歌詞、人聲、伴奏等一系列音樂內(nèi)容的一次性 AI 生成。
10 月底,Suno 被曝即將完成新一輪融資,融資額 1 億美金,融資結(jié)束之后,Suno 預(yù)計估值 20 億美元,是上一輪估值的 4 倍。Suno 也成為了增長最快的人工智能公司之一。
虎嗅和多位 AI 創(chuàng)業(yè)者、投資人聊過 Suno 這個項目。對許多音樂人來說,Suno 是一個顛覆性的產(chǎn)品。Suno 的成功,再次證明了產(chǎn)品品味和數(shù)據(jù)飛輪的重要性。
第三方數(shù)據(jù)公司 Xsignal(奇異因子)創(chuàng)始人及 CEO 劉震表示,每一個賽道都需要精細化運營,且涉及到很多垂直 know-how 經(jīng)驗。例如對作曲的專業(yè)理解、AI 音樂版權(quán)問題的把握。Suno 已經(jīng)經(jīng)歷過磨難,且積累了應(yīng)對的經(jīng)驗和方法。
UpHonest Capital 投研團隊表示,Suno 的社區(qū)氛圍很好,有一點 AI 版本 Spotify 的樣子,用戶天然對自己創(chuàng)作的歌曲有好感。Suno 還會推薦社區(qū)的創(chuàng)作者,分享他們的歌曲。
AI 音樂生成的產(chǎn)品并不少,有 Udio、Riffusion,不過使用過不同產(chǎn)品的音樂人表示,Suno 的效果最好。
我們嘗試通過對 Suno 這家公司的拆解,分析 Suno 是如何做出獨特的產(chǎn)品以及經(jīng)營用戶社區(qū),又如何在競爭環(huán)伺下,還能獲得資本的持續(xù)關(guān)注。
在空白市場,做到 20 億美元估值
Suno 最核心的突破在于,它生成的不是零散的旋律或單調(diào)的節(jié)拍,而是包含人聲、歌詞、編曲和混音的完整歌曲,將音樂創(chuàng)作的門檻從 " 需要數(shù)年專業(yè)訓(xùn)練 " 降低到 " 只需要想象力 " 。
在 Suno 誕生之前,生成式 AI 的焦點主要集中在文本(如 GPT 系列)和圖像領(lǐng)域。相比之下," 音頻 AI" 的發(fā)展相對滯后,高質(zhì)量的音頻生成,尤其是包含復(fù)雜結(jié)構(gòu)和情感元素的音樂生成,是一個尚未被充分開發(fā)的市場 。

Suno 的出現(xiàn),正是為了填補這一市場。
作為一家 AI 原生應(yīng)用公司,Suno 的增長非常迅猛,自 2022 年成立以來共融資 1.25 億美元,其 2024 年 5 月的 B 輪融資由 Lightspeed Venture Partners(光速創(chuàng)投)領(lǐng)投,投后估值達到 5 億美元。投資方還包括 Nat Friedman、Daniel Gross、Matrix Partners、Founder Collective 等知名機構(gòu)和天使,在 AI 和科技領(lǐng)域具有深厚背景。
2025 年 10 月,有消息稱 Suno 正在洽談新一輪 1 億美元 融資,估值預(yù)計將飆升至 20 億美元,是上一輪估值的四倍。這反映了資本市場對 AI 音樂賽道的高度看好,即使在版權(quán)法律風(fēng)險下,投資人依然愿意押注其成長潛力。
Suno 自 2023 年下半年推出首款產(chǎn)品以來用戶增長驚人。上線短短 8 個月用戶即破千萬,相比之下,Spotify 達到 1,000 萬用戶用了整整 4 年。
截至 2024 年中,已有超過 1200 萬 人嘗試過 Suno 進行音樂創(chuàng)作。龐大的用戶基礎(chǔ)帶來可觀收入,甚至有報道稱 Suno 當(dāng)前年經(jīng)常性收入(ARR)已超 1 億美元。用戶活躍度同樣亮眼,平臺上平均每秒就產(chǎn)生 10 首 新曲目。
這種增長模式并非傳統(tǒng)軟件公司所能比擬的,其估值在短短 5 個月內(nèi)翻了兩番,ARR 在不到一年的時間里從幾乎為零增長到過億美元 。
全民 " 音樂人 "
從本質(zhì)上講,Suno 是一個基于 Web 和移動 App 的文本到音樂(Text-to-Music)生成平臺 。它的核心交互邏輯極其簡單:用戶輸入一段描述性的文本提示詞,AI 便能在幾十秒內(nèi)生成一首完整的歌曲 。
這里的 " 完整 ",指的是歌曲不僅包含旋律和伴奏,還包括由 AI 合成的人聲和生成的歌詞,這使得 Suno 與市面上大多數(shù)只能生成純音樂的 AI 工具有了本質(zhì)區(qū)別。
2024 年 7 月,Suno 推出了首款移動應(yīng)用(iOS),將以上功能搬上手機,方便用戶隨時隨地記錄靈感、創(chuàng)作音樂。移動端還接入了手機麥克風(fēng),可錄制環(huán)境聲(如鳥鳴、談話等)并自動融入創(chuàng)作,使現(xiàn)實聲音素材也能轉(zhuǎn)化為音樂元素。
用戶還可上傳或錄制一段聲音(哼唱、小樣旋律、節(jié)奏敲擊等),AI 將據(jù)此繼續(xù)譜寫歌曲,再基于這些聲音創(chuàng)作旋律。這一功能讓 " 隨手采樣、即興創(chuàng)作 " 成為可能。
Suno 同樣提供 " 添加伴奏 " 和 " 添加人聲 " 工具,用戶生成初步曲段后,可進一步讓 AI 自動加入額外的配器或和聲人聲。
例如,一段清唱旋律可以一鍵生成完整伴奏;或給無歌詞的旋律添加 AI 演唱的人聲線。這使普通用戶也能完成復(fù)雜的編曲和制作過程。
Suno 的模型迭代速度極快,每一次大版本更新都帶來了體驗上的質(zhì)變。從最早被大眾熟知的 V3/3.5 版本,到最新的 V5(Beta)版本,Suno 在音質(zhì)和人聲真實感上的提升是迅速的。
尤其是最新的 V5 模型,根據(jù)大量社區(qū)用戶的反饋,其在音質(zhì)、樂器清晰度和人聲真實感上實現(xiàn)了 " 巨大提升 ",人聲的自然度被形容為 " 幾乎與真人無異 " 。
幾乎與 V5 模型發(fā)布的同時,2025 年 9 月,Suno 發(fā)布了桌面應(yīng)用 Suno Studio,號稱全球首個 " 生成式音頻工作站 "。

Suno Studio 將 AI 生成融入專業(yè)多軌工作流程,實現(xiàn)人機協(xié)同作曲。Studio 提供專業(yè)級的節(jié)奏 BPM 控制、音高與音量調(diào)整等功能,并支持將生成的每條音軌導(dǎo)出為音頻或 MIDI 文件,以便在其他軟件中繼續(xù)制作。
Suno Studio 極大地拓展了創(chuàng)作自由度,被視為將來專業(yè)音樂制作與 AI 結(jié)合的重要探索。
Suno 當(dāng)前主要通過 訂閱增值模式(freemium),而只有最高檔的 Premier 能獨享最新最強大的模型版本(如 v5 引擎)以及 Suno Studio。
與許多音樂軟件定位專業(yè)創(chuàng)作者不同,Suno 瞄準(zhǔn)的是普羅大眾,用戶群體覆蓋極廣,其聯(lián)合創(chuàng)始人明確表示:" 我們想做的是面向所有人的創(chuàng)意工具,而非只服務(wù)于少數(shù)專業(yè)人士的技術(shù)。"
據(jù)官方博客透露,Suno 核心用戶群包含:最龐大也最具活力的大眾用戶群體,他們使用 Suno 的目的多種多樣,包括純粹的娛樂、為社交媒體帖子制作獨特的 BGM、為家庭視頻配樂、或者僅僅是把自己的想法和心情變成一首歌來與朋友分享 。對他們而言,Suno 是一個新奇的玩具,也是一個個人表達工具。
其次就是內(nèi)容創(chuàng)作者或者是營銷人員,這個群體包括視頻博主、播客主、獨立游戲開發(fā)者和廣告營銷人員。他們對高質(zhì)量、無版權(quán)風(fēng)險的定制音樂有著巨大的剛性需求。Suno 為他們提供了一個極其高效的解決方案,可以在幾分鐘內(nèi)生成符合特定情緒、風(fēng)格和主題的背景音樂或廣告歌曲,極大地降低了內(nèi)容制作的成本和時間 。
盡管 Suno 的目標(biāo)是大眾化,但它也吸引了越來越多的專業(yè)人士。對于這個群體,Suno 主要扮演著靈感激發(fā)器和音樂原型驗證的角色。
甚至連格萊美獲獎制作人 Timbaland 也公開表示,他每天會花長達 10 個小時使用 Suno 進行創(chuàng)作探索 。
虎嗅之前和一位 AI 創(chuàng)業(yè)者聊過,他的音樂人朋友在用 Suno 創(chuàng)作歌曲,他把一套提示詞和歌詞扔給 ChatGPT,讓 ChatGPT 解構(gòu)音樂元素,并翻譯成蒙語,讓 Suno 生成一首蒙古歌曲。
一群金融公司出身的 " 音樂家 "
任何一家現(xiàn)象級公司的背后,都離不開一個獨特的創(chuàng)始團隊,Suno 的故事也不例外。
Suno 由四位既熱愛音樂又精通技術(shù)的聯(lián)合創(chuàng)始人于 2022 年在美國劍橋創(chuàng)立。四位創(chuàng)始人分別是 Mikey Shulman(首席執(zhí)行官)、Georg Kucsko、Martin Camacho 和 Keenan Freyberg,他們曾一同就職于劍橋的一家金融 AI 公司 Kensho,在工作中結(jié)識。

CEO Mikey Shulman 曾長期在紐約玩樂隊、錄音和駐唱,對普通人創(chuàng)作音樂的艱辛體會深刻。盡管他本人技術(shù)上已相當(dāng)嫻熟,卻仍感到音樂創(chuàng)作的門檻極高:不僅需要訓(xùn)練有素或音樂天賦,還要投入大量時間和錢。
而且,在 Kensho,團隊的核心任務(wù)之一是處理金融領(lǐng)域的音頻數(shù)據(jù),例如充滿口音、背景噪音和專業(yè)術(shù)語的財報電話會議錄音 。這項工作讓他們深刻地認(rèn)識到,當(dāng)時的音頻 AI 技術(shù)水平,相較于文本和圖像 AI,是多么的落后和不成熟。
據(jù)團隊成員在采訪和社區(qū)分享中透露,他們在開發(fā)用于處理金融錄音的音頻大語言模型時,經(jīng)常在深夜 " 濫用 " 這個內(nèi)部工具來 " 玩音樂 " 。
他們逐漸意識到了 AI 可以進行即興創(chuàng)作,可以被用于充滿無限可能的創(chuàng)造。
帶著這個出發(fā)點,4 位創(chuàng)始人于 2022 年底直接離開原公司,投入 Suno 的創(chuàng)立。他們在早期獲得了 Matrix Partners 等風(fēng)投的種子資金支持,于 2023 年 3 月完成了 A 輪融資(金額未公開)以開發(fā)核心技術(shù)。
在創(chuàng)立 Suno 之初,團隊的第一個公開項目是一個名為 Bark 的開源文本轉(zhuǎn)音頻模型,于 2023 年發(fā)布 。Bark 可以生成非常自然的語音、音效甚至歌唱聲,并在 GitHub 等開發(fā)者社區(qū)迅速走紅,獲得了數(shù)千星標(biāo)。
在與社區(qū)的互動中,團隊收到了大量反饋,其中一個聲音越來越強烈,也越來越清晰:" 這個工具很酷,但我們真正想用它來做音樂,而不僅僅是說話。" 。
正是這個來自用戶的直接、強烈的需求,最終點燃了團隊,讓他們將公司的戰(zhàn)略重心從一個通用的音頻工具,全面轉(zhuǎn)向?qū)W⒂谝魳飞傻?Suno。
Suno 創(chuàng)始團隊在產(chǎn)品尚處早期就展現(xiàn)出大膽的一面。他們深知訓(xùn)練此類 AI 模型難免涉及版權(quán)音樂數(shù)據(jù),可能招致傳統(tǒng)音樂業(yè)的不滿甚至訴訟。然而,早期投資人如 Matrix 合伙人 Antonio Rodriguez 表示理解創(chuàng)始人的選擇,稱 " 這是我們投資時就必須承擔(dān)的風(fēng)險 "。
Rodriguez 甚至直言:" 如果公司創(chuàng)業(yè)之初就去找唱片公司談授權(quán),我反而不會投資,他們需要在無約束的環(huán)境下把產(chǎn)品做出來 "。在這種背書下,Suno 團隊選擇先專注打磨產(chǎn)品、跑馬圈地用戶,再逐步應(yīng)對版權(quán)合規(guī)挑戰(zhàn)。
逐漸激烈的音樂生成賽道
AI 生成音樂所處的市場正呈現(xiàn)爆發(fā)式增長態(tài)勢。
一方面,全球數(shù)字音樂產(chǎn)業(yè)規(guī)模龐大且持續(xù)擴張,音樂流媒體市場 2023 年產(chǎn)值已超過 260 億美元。另一方面,AI 音樂創(chuàng)作作為新興細分領(lǐng)域,近兩年增長曲線陡峭:據(jù)法國流媒體服務(wù) Deezer 等平臺統(tǒng)計,完全由 AI 生成的音樂現(xiàn)已占到每日上架曲目的 28%,且這一比例仍在迅速攀升。
Deezer 報告其每日收到的 AI 原創(chuàng)曲目從 2023 年初的 1 萬首飆升至當(dāng)年 10 月的 3 萬首 / 日。可以預(yù)見,未來 AI 將貢獻全球音樂作品相當(dāng)可觀的份額。Suno 當(dāng)前超過千萬的用戶量和每秒 10 首曲目的產(chǎn)出率,某種程度上驗證了這一增長神話。
值得注意的是,傳統(tǒng)音樂科技(Music-Tech)領(lǐng)域在過去幾年曾一度遇冷:2010 – 2018 年誕生了大批頭部融資案例(多為流媒體平臺和音樂硬件),但此后由于流媒體市場增速放緩、版權(quán)費用高企等因素,投資趨于平靜。
Suno 于 2024 年拿到史無前例的大額融資,成為 2018 年以來極少數(shù)引發(fā)轟動效應(yīng)的音樂科技創(chuàng)業(yè)公司之一,被視作行業(yè)進入新一輪創(chuàng)新周期的標(biāo)志。資本的回暖表明,音樂產(chǎn)業(yè)正從 " 渠道為王 " 的流媒體紅海,轉(zhuǎn)向創(chuàng)作賦能等藍海領(lǐng)域?qū)で笸黄啤?/p>
一個最佳證明就是,10 月,環(huán)球音樂集團首席執(zhí)行官 Lucian Grainge 曾在一份員工備忘錄中,再次重申了公司愿意與 AI 公司合作開發(fā)產(chǎn)品,前提是它們尊重版權(quán)。
音樂產(chǎn)業(yè)長期存在兩個痛點:其一,創(chuàng)作端門檻高,專業(yè)音樂人畢竟是少數(shù),大量普通人的音樂創(chuàng)造力并未被激發(fā);其二,內(nèi)容端供需錯配,受限于人力創(chuàng)作速度,音樂市場很難針對海量的個性化、長尾需求提供定制內(nèi)容。生成式 AI 音樂的出現(xiàn)正好對癥下藥。
就競爭格局而言,當(dāng)前 AI 音樂創(chuàng)作仍屬早期階段,整體上可視為 " 藍海市場 ",但正在快速變紅。目前主流音樂產(chǎn)業(yè)的巨頭(如唱片公司、流媒體)雖密切關(guān)注但自身尚未主導(dǎo)這一領(lǐng)域,給了創(chuàng)業(yè)公司先發(fā)機會。
科技巨頭們紛紛有所行動但總體尚未成熟。谷歌早在 2023 年就展示了其音樂生成模型 MusicLM,并于同年底開放了限量體驗版;Meta 的 AI 研究團隊推出了開源的文本生成音樂模型(如 MusicGen,隸屬 AudioCraft 項目)供開發(fā)者試用。OpenAI 作為生成式 AI 的領(lǐng)軍者,至今尚未正式發(fā)布音樂產(chǎn)品,但據(jù)報道其內(nèi)部正開發(fā) AI 音樂平臺。
這個情況在中國也同樣發(fā)生,作為一個 C 端流量入口,音樂一定是科技巨頭會切入的領(lǐng)域。不過虎嗅與 AI 音樂生成的創(chuàng)業(yè)者聊過,大廠切入的決心和他們做的深度,不及創(chuàng)業(yè)公司。這位創(chuàng)業(yè)者說,以字節(jié)為例,他們的音樂生成屬于算法中臺,算法中臺是一個非盈利部門,但是大廠中,其產(chǎn)品是以生產(chǎn)工具為主。" 這是個很矛盾的狀態(tài)。" 他說。
但 Suno 們的競爭對手并非只有大廠,更危險的是那些初創(chuàng)公司。隨著 AI 技術(shù)門檻降低和商業(yè)前景顯現(xiàn),各路玩家正涌入,初創(chuàng)企業(yè)開始進入市場。
來自美國的 AI 音樂平臺 Udio,與 Suno 并稱業(yè)內(nèi)雙雄。Udio 專注于讓用戶生成個性化歌曲,與 Suno 類似也面臨版權(quán)訴訟困擾。Uio 在 2024 年初獲得了 1000 萬美元融資,雖金額不及 Suno,但同樣引起關(guān)注。其最大特色是注重與獨立音樂人合作,投資方和顧問包括歌手 will.i.am 等音樂界人士,在行業(yè)資源上稍有不同。
更早期的 AI 音樂平臺 Boomy 允許用戶通過簡單選項組合生成背景音樂,并聲稱已創(chuàng)造數(shù)百萬首歌曲。2023 年 Spotify 一度下架了 Boomy 用戶上傳的大量音樂,原因是懷疑存在 " 流量作弊 " 等問題。Boomy 已于 2021 年獲得 500 萬美元投資,在 Suno 出現(xiàn)前曾是該領(lǐng)域知名玩家之一。
來自印度的 AI 音樂初創(chuàng) Beatoven,主打免版稅配樂生成。用戶可選擇心情、風(fēng)格,AI 生成用于視頻、游戲的背景音樂。Beatoven 更像是 B2B 工具,為內(nèi)容創(chuàng)作者提供低成本配樂方案。雖細分領(lǐng)域不同,但在技術(shù)原理上接近,也與 Suno 存在潛在競爭關(guān)系。
此外還有如 Splash、Bronze、AIVA、Soundful 等不同定位的 AI 音樂公司涌現(xiàn)。例如 Splash 將 AI 音樂融入電子游戲;Bronze 專注 AI 互動音樂體驗,吸引了一些藝人投資;AIVA 較早提供 AI 配樂服務(wù),被用于短片、廣告等。
競爭之外,另一個風(fēng)險是版權(quán)。
Suno 最為典型,其正面臨來自全球三大唱片公司,索尼音樂、環(huán)球音樂集團和華納音樂集團的聯(lián)合訴訟 。訴訟的核心指控是,Suno 在未經(jīng)授權(quán)的情況下,大規(guī)模使用了受其版權(quán)保護的音樂錄音來訓(xùn)練其 AI 模型。
唱片公司的指控非常具體,如果考慮到三大唱片公司擁有的曲庫規(guī)模,這些訴訟可以讓任何一家創(chuàng)業(yè)公司,包括 Suno 在內(nèi),瞬間原地破產(chǎn) 。
這也是當(dāng)下 AI 音樂生成公司普遍面臨的問題。虎嗅曾于 AI 音樂創(chuàng)業(yè)者交流過,對他們來說,目前這件事全球沒有參考,如果在做這件事的第一時間就考慮到版權(quán),就束縛住手腳了。一些 AI 音樂生成公司的做法是,會拿一些版權(quán)授權(quán),并抽取一些沒有版權(quán)的要素。
Suno 的事情出現(xiàn)有趣反轉(zhuǎn),盡管官司打得火熱,但多家媒體同時報道稱,Suno 正在與包括環(huán)球和華納在內(nèi)的唱片公司進行授權(quán)協(xié)議的談判 。
據(jù)報道,談判內(nèi)容不僅包括未來的授權(quán)費用,甚至可能涉及讓唱片公司以股權(quán)投資的方式入股 Suno。這一事件甚至被認(rèn)為是傳統(tǒng)音樂公司向 AI 公司臨陣倒戈。
這戲劇性的一幕,或許預(yù)示著 AI 原生應(yīng)用公司 Suno 的 " 野蠻生長 " 與傳統(tǒng)音樂產(chǎn)業(yè)的既有規(guī)則,在激烈的碰撞中走向一種全新的融合。
" 看,Suno 正在幫我們倘出一條路。" 一位 AI 音樂生成創(chuàng)業(yè)者說。

