我們開始看到人工智能領域正在步入技術堆棧的早期階段(注:“技術堆棧”一詞描述了一組應用程序,數字工具和平台,供應商,數據源或編程語言,它們組合在一起以提供戰略業務功能)。數以百計的新創業公司正湧入市場,開發基礎模型、構建 AI 原生應用程序并建立基礎設施/工具。
許多熱門技術趨勢在被市場趕上之前就被過度炒作了。但是,生成式人工智能的繁榮伴随着來自市場的實際收益,以及來自相關應用的真實吸引力。Stable Diffusion 和 ChatGPT 等模型正在創造用戶增長的曆史記錄,多個應用程序在推出後不到一年的時間就達到了 1 億美元的年化收入。對比顯示,人工智能在某些任務中的表現優于人類多個量級。
因此,有足夠的早期數據表明大規模變革正在發生。但關鍵問題是:這個市場的價值将在哪裡?
在過去的一年裡,我們會見了數十位直接與生成 AI 打交道的初創公司創始人和運營商。我們觀察到,基礎架構供應商可能是該市場迄今為止的最大赢家,占據了流經該領域的大部分資金。應用程序公司的收入增長非常快,但往往在留存率、産品差異化和毛利率方面苦苦掙紮。而大多數模型提供商,雖然對于這個市場的存在不可或缺,但尚未實現大規模的商業規模。
換句話說,創造最大價值的公司——即訓練生成式 AI 模型并将其應用于新程序——并沒有獲得大部分價值。很難預測接下來會發生什麼,但我們認為要了解的關鍵是堆棧的哪些部分是真正差異化和可防禦的。這将對市場結構和長期價值的驅動因素(例如利潤率和保留率)産生重大影響。到目前為止,除了傳統的公司護城河要素之外,我們很難在堆棧之中找到其他結構性防禦要素。
我們非常看好生成式人工智能,相信它将對軟件行業及其他行業産生巨大影響。這篇文章的目的是描繪出市場動态,并嘗試回答有關生成式 AI 商業模式的更廣泛問題。
技術堆棧:基礎架構、模型和應用程序 要了解生成式人工智能市場是如何形成的,我們首先需要搞明白堆棧如今的情況。 堆棧可以分為三層(需要注意的是:這不是市場地圖,而是分析市場的框架): 将生成式 AI 模型集成到面向用戶産品的應用程序 為 AI 産品提供支持的模型 為生成人工智能模型運行訓練和推理工作負載的基礎設施供應商(即雲平台和硬件制造商) 第一波生成式 AI 應用程序開始形成規模,但在留存率和差異化方面舉步維艱 在之前的技術周期中,傳統觀點認為,一家大型獨立公司想要立足必須擁有終端客戶——無論是個人消費者還是 B2B 買家。循着這個思路。人們很容易相信生成式AI領域的大公司也将面對終端用戶。但到目前為止,還不清楚是否如此。 可以肯定的是,在純粹的新奇感和大量用例的推動下,生成式 AI 應用程序的增長一直是驚人的。事實上,據我們所知,至少在圖像生成、文案撰寫和代碼編寫這三個産品類别的年收入已經超過 1 億美元。 然而,僅靠增長還不足以建立經久不衰的軟件公司,至關重要的是,增長必須是有利可圖的——從某種意義上說,用戶和客戶一旦注冊,就會産生利潤(高毛利率)并長期堅持(高保留率)。在缺乏強大技術差異性的情況下,B2B 和 B2C 應用程序通過網絡效應、立足數據或構建日益複雜的工作流程來推動長期客戶價值。 在生成式AI中,這些假設不一定成立。在我們交談過的應用程序公司中,毛利率區間很大——在少數情況下高達 90%,但更常見的是低至 50-60%,這主要是受模型推理成本的影響。Top-of-funnel(注:即銷售過程的第一階段,此階段通常指獲取更多的曝光,積累更多的用戶數據的過程)的增長非常驚人,但目前尚不清楚當前的客戶獲取策略是否具有可擴展性——我們已經看到付費獲客的有效性和保留率開始下降。許多應用程序之間也沒有差異化,因為它們依賴于類似的底層人工智能模型,并且尚沒有擁有競争對手難以複制的明顯網絡效應或數據/工作流。 因此,尚不得知面對終端用戶的應用程序是否是建立可持續的生成式 AI 業務的唯一甚至最佳途徑。随着語言模型的競争和效率的提高,利潤率應該會提高(更多内容見下文)。随着 AI 市場進一步整合,留存率應該會增加。有一個強有力的論據表明,垂直整合的應用程序在提高差異化方面具有優勢,但是還有很多東西需要證明。 展望未來,生成式 AI 應用程序公司面臨的一些重大問題包括: 垂直整合(“模型+應用程序”)。一方面,将 AI 模型作為一種服務來使用,可以讓應用程序開發人員随着技術的進步快速疊代。另一方面,一些開發人員認為産品就是模型,将産品數據持續投入到模型之中進行訓練是建立防禦性的唯一方法,但這是以更大的資金耗費和産品團隊的靈活度下降作為代價的。 層出不窮的形式 vs應用程序。生成式 AI 産品有多種不同的形式:桌面應用程序、移動應用程序、Figma/Photoshop 插件、Chrome 擴展程序,甚至是 Discord 機器人。在用戶已經使用的領域集成 AI 産品很容易,因為 UI 通常隻是一個文本框。在這其中,哪些将成為獨立的公司,哪些将被微軟或谷歌等現有企業吸收并納入其AI産品線? 随技術成熟度曲線管理公司。目前尚不清楚這些劇烈擾動是當前生成式 AI 産品固有的,還是因市場處于早期所産生的。再比如,随着市場情緒的消退,其對生成式AI的興趣是否會下降。這些問題對應用程序公司具有重要意義,包括何時積極募集資金、如何主動地投入獲客成本、哪些細分用戶需要優先考慮以及何時宣布産品-市場匹配度。 模型提供商們發明了生成式人工智能,但尚未達到大規模商業規模 如果沒有像Google、OpenAI和Stability之類的公司所做出研發貢獻,現在所說的生成式 AI 根本不會存在。通過它們創新性的模型架構和擴展訓練通道所付出的巨大努力,當前大型語言模型 (LLM) 和圖像生成模型令人驚歎的功能令所有人受益。 然而,與使用量和口碑相比,這些公司與之相關的收入仍然相對較小。在圖像生成方面,在包含用戶交互、産品托管和微調模型在内的生态系統的支持下,Stable Diffusion出現了爆炸性的用戶社群增長。但Stability 基于業務的核心原則将這些關鍵服務免費提供。在自然語言模型中,OpenAI 憑借GPT-3/3.5和ChatGPT 占據主導地位,但到目前為止,基于 OpenAI 構建的殺手級應用依然相對較少,即使價格已經下降了一次。 這可能隻是暫時的現象。Stability 是一家尚未專注于賺錢的新公司。OpenAI 有潛力成為一項龐大的業務,随着越來越多的殺手級應用程序的構建,它在所有 NLP 類别的收入中占據很大一部分——特别是如果它們順利集成到 Microsoft 的産品組合中。鑒于這些模型的大量使用,大規模的收入可能并不遙遠。 但也有相反的一面。作為開源發布的模型可以由任何人托管,包括不承擔與大規模模型訓練相關的費用(高達數千萬或數億美元)的外部公司。并且目前尚不清楚是否有任何閉源模型可以無限期地保持其優勢。例如,我們開始看到由 Anthropic、Cohere 和 Character.ai 等公司構建的 LLMs 更接近 OpenAI 的性能水平,它們都是在類似的數據集(即互聯網)上訓練并使用類似的模型架構。Stable Diffusion 的例子表明,如果開源模型達到足夠的性能水平和社區支持,那麼專有替代品可能會發現很難與之競争。 到目前為止,對于模型提供商來說,最清晰的收獲可能是覺察到托管服務在商業化層面大有可為。對專有 API(例如來自 OpenAI)的需求正在迅速增長,開源模型(例如 Hugging Face 和 Replicate)的托管服務正在成為方便共享和集成模型的有用中心——甚至在模型提供商和消費者之間産生一些間接的網絡效應。還有一個有力的假設是,可以通過與企業客戶的微調和托管協議來獲利。 不過,除此之外,模型提供商還面臨許多重大問題: 商業化。人們普遍認為,随着時間的推移,AI模型的性能會趨于一緻。然而在與應用程序開發人員交談後發現這一趨勢很明顯還沒有發生。在文本和圖像模型方面都有強大的領導者,它們的優勢不是基于獨特的模型架構,而是基于更大的資金支持、專有産品交互數據和擁有稀缺的 AI 人才。這些會成為一個持久的優勢嗎? 脫鈎風險。依賴模型提供商是應用程序公司起步甚至發展業務的好方法。但是,一旦達到規模,他們就有動力構建和/或托管自己的模型。許多模型提供商的客戶集中度非常高,少數應用程序提供了大部分收入,如果這些重要客戶轉向内部開發AI會發生什麼? 錢重要嗎?生成式 AI 的前景如此廣闊——也可能如此有害——以至于許多模型提供商組織了公共利益公司(B corps)或以其他方式将公益明确納入其使命,這些絲毫沒有阻礙他們的融資活動。但是,圍繞大多數模型提供商是否真的想要獲取價值以及他們是否應該獲取價值存在争議。 基礎設施供應商觸及一切,并獲得回報 生成式 AI 中的幾乎一切都在某種程度上通過雲托管 GPU(或 TPU)。無論是運行訓練負載的模型提供商/研究實驗室、運行推理/微調的托管公司,還是進行兩者某種組合的應用程序公司——FLOPS(每秒浮點運算次數)都是生成式 AI 的命脈。這是很長一段時間以來首次,最具颠覆性的計算技術的進步受到算力的限制。 因此,生成式AI市場的大量資金最終流向了基礎設施公司。下面列出一些非常粗略的數字:我們估計,平均而言,應用程序公司将大約 20-40% 的收入用于模型推理和微調,而這通常直接支付給雲提供商或第三方模型提供商——後者又将大約一半的收入用于雲基礎設施。因此,有理由猜測今天生成式AI總收入的 10-20% 流向了雲提供商。 最重要的是,訓練自己模型的初創公司已經從風投那裡籌集了數十億美元——其中大部分(早期高達 80-90%)通常也用于雲提供商。許多上市科技公司每年花費數億美元用于模型訓練,要麼與外部雲提供商合作,要麼直接與硬件制造商合作。 用技術術語來說,這就是我們所說的“大量資金”——尤其是對于新興市場而言。其中大部分用于三大雲:亞馬遜網絡服務 (AWS)、谷歌雲平台 (GCP) 和 Microsoft Azure。這些雲提供商每年總支出超過1000 億美元,以确保他們擁有最全面、可靠且具有成本優勢的平台。特别是在生成式 AI 中,他們還受益于供應限制,因為他們可以優先使用稀缺硬件(例如 Nvidia A100 和 H100 GPU)。 不過,有趣的是,我們開始看到可觀的競争出現。像甲骨文這樣的挑戰者已經通過大筆資本支出和銷售激勵措施取得了進展。一些初創公司,如 Coreweave 和 Lambda Labs,憑借專門針對大型模型開發人員的解決方案迅速成長。他們在成本、可用性和個性化支持方面展開競争。它們還公開了更細粒度的資源抽象,而由于 GPU 虛拟化限制,大型雲僅提供 VM 實例。 在幕後運行絕大多數 AI 工作負載的Nvidia可能是迄今為止生成式 AI 領域的最大赢家。該公司報告稱,其 2023 财年第三季度的數據中心 GPU 收入為 38億美元,其中相當一部分用于生成式 AI 用例。通過數十年來對 GPU 架構的投資、強大的軟件生态系統以及在學術界的深入使用,他們圍繞這項業務建立了強大的護城河。最近的一項分析發現,Nvidia GPU 在研究論文中的引用次數是頂級 AI 芯片初創公司總和的 90 倍。 确實存在其他硬件選項,包括 Google Tensor Processing Units (TPU)、AMD Instinct GPU、AWS Inferentia 和 Trainium 芯片以及 Cerebras、Sambanova 和 Graphcore 等初創公司的 AI 芯片。遲到的英特爾也以其高端 Habana 芯片和 Ponte Vecchio GPU 進入市場。但到目前為止,這些新芯片中占據顯著市場份額的很少。值得關注的兩個例外是谷歌和台積電,谷歌的TPU 在 Stable Diffusion 社區和一些大型 GCP 交易中獲得了關注,而台積電被認為制造了這裡列出的所有芯片,包括 Nvidia GPU(英特爾混合使用其自己的晶圓廠和台積電來制造芯片)。 換句話說,基礎設施是當下堆棧中有利可圖、可持續且看似可防禦的一層。基礎設施公司需要回答的重大問題包括: 堅持無狀态工作負載。無論在哪裡租用 Nvidia GPU,它們都是一樣的。大多數 AI 工作負載是無狀态的,因為模型推理不需要附加的數據庫或存儲(模型權重本身除外)。這意味着 AI 工作負載可能比傳統應用程序工作負載更易于跨雲移植。在這種情況下,雲提供商如何創造粘性并防止客戶跳到更便宜的選擇? 在芯片稀缺中幸存下來。雲提供商和 Nvidia 的定價得到了先進 GPU 供應稀缺的支撐。一位供應商告訴我們,A100 的實際價格較發布價上漲,這對于計算硬件來說是非常不尋常的。當通過增加芯片産量和/或采用新硬件平台最終消除這種供應限制時,這将如何影響雲提供商? 雲領域是否有挑戰者能夠突圍?我們堅信,垂直雲将通過更專業的産品從三巨頭那裡奪取市場份額。到目前為止,在 AI 領域,挑戰者已經通過适度的技術差異化和 Nvidia 的支持獲得了有意義的突破——對 Nvidia 來說,現有的雲提供商既是最大的客戶,也是新興的競争對手。更加深遠的問題是,挑戰者們是否足以克服三巨頭的規模優勢? 那麼……價值将在哪裡累積? 當然,我們還不知道。但根據我們擁有的生成式 AI 的早期數據,結合我們與早期 AI/ML 公司的經驗,我們的直覺如下: 今天,生成式人工智能似乎沒有任何系統性的護城河。應用程序缺乏很強的産品差異化,因為它們使用相似的模型;模型在長期來看也面臨同質化,因為它們是在具有相似架構的相似數據集上訓練的;雲提供商缺乏深度的技術差異化,因為他們運行相同的 GPU;甚至硬件公司也在同一家工廠生産芯片。 當然,還有标準的護城河:規模護城河(“我擁有或可以籌集到比你更多的錢!”)、供應鍊護城河(“我有 GPU,你沒有!”)、生态系統護城河(“每個人都已經在使用我的軟件了!”)、算法護城河(“我們比你聰明!”)、分銷護城河(“我已經有一個銷售團隊和比你更多的客戶!”)和數據管道護城河(“我在互聯網上爬取的數據比你多!”)。但從長遠來看,這些護城河都不會持久。現在判斷強大、直接的網絡效應是否在堆棧的任何層中占據主導地位還為時過早。 根據可用數據,尚不清楚生成式 AI 是否會出現長期的、赢者通吃的動态。 這很奇怪。但對我們來說,這是個好消息。這個市場的潛在規模很難把握——介于所有軟件和人的努力之間——所以我們期待在堆棧的各個級别都有很多玩家并産生健康的競争。我們還期望橫向和縱向公司都能夠以經過最終市場和最終用戶檢驗的模式獲得成功。例如,如果最終産品的主要差異化是 AI 本身,那麼垂直化(即将面向用戶的應用程序與本土模型緊密耦合)很可能會勝出。而如果 AI 是更大的長尾特征集的一部分,那麼它更有可能向水平化趨勢發展。當然,随着時間的推移,我們還應該看到更多傳統護城河的建立——我們甚至可能會看到新型護城河站穩腳跟。 無論如何,我們可以肯定的是,生成式 AI 會改變遊戲規則,将會釋放出巨大的價值,因此技術領域将變得非常非常不同。我們為此而來! 本文為「IPO Global」編譯 編者|子任 微信公衆号:IPO-Globa 注:這篇文章中的所有圖片均由 Midjourney 創作 原文鍊接:https://a16z.com/2023/01/19/who-owns-the-generative-ai-platform/