跳到主要內容
輝達貴不貴?你在同一條 AI 供應鏈上押了五次還沒發現

輝達貴不貴?你在同一條 AI 供應鏈上押了五次還沒發現

投資決策 · 11 個來源 · 約 14 分鐘 ·
目錄(7 節)

有人說「高不敢買,跌下來也不敢買」。有人說「AI 就跟 5G 一樣,騙局該結束了」。也有人回覆「我 100% NVDA,一股不賣,奇蹟自來」。

我把這三則並排看。三個人都在看價格——多的看「還會漲」,空的看「已經太貴」,信仰派連看都不看。

他們問的是同一個問題:輝達貴不貴?用的是同一套算法——本益比、營收成長率、跟 AMD 的市占比較。這是分析半導體公司的框架。

但輝達的 AI 晶片毛利率超過 90%。整體毛利率 75%,營業利益率超過 60%(Q4 FY2026 數字;全年回落到 71.1% 仍比任何硬體公司都高)。蘋果 46%。英特爾全盛時期 60%。沒有一家賣硬體的公司接近 90%。

90% 毛利率是平台公司的數字。是 Visa 的數字,不是台積電的數字。

我用半導體的尺量這家公司,量到的是一個不存在的輝達。

用錯的框架算出的「太貴」或「還能漲」,結論都沒有意義。

這篇不告訴你該不該買。告訴你的是你量它的時候可能用錯了尺。

你以為護城河是晶片性能,其實是一套 4.75 億美元的軟體鎖

2007 年,輝達在聖塔克拉拉總部的停車場搭了一個帳篷,五十幾個華爾街分析師坐在折疊椅上吃三明治,一邊質問黃仁勳為什麼利潤率在下降。

他們問的全是短期數字。沒有人問他為什麼花了公司四年的研發預算去做一個叫 CUDA 的東西。

CUDA 不是一顆晶片。它是一整套讓 GPU 做通用計算的軟體平台。黃仁勳花了 4.75 億美元打造它,等於把公司三分之一的研發預算燒在一個當時幾乎沒人用的東西上。2007 年 CUDA 只有 13,000 次下載。華爾街的共識是這個平台的價值是「負數」。

輝達的硬體工程師也不高興。一個早期工程師後來回憶:「說服硬體設計師為什麼要為《毀滅戰士》的效能優化很容易,說服他們為什麼要為矩陣乘法優化就難多了。」

為什麼黃仁勳還是做了?因為 2003 年,一個叫 John Nickolls 的平行運算先驅寄了一封信給他,說摩爾定律因為電晶體的物理極限正在死亡,未來屬於平行計算。黃仁勳後來雇了他當 CUDA 的首席架構師。

CUDA 的關鍵決策是:不只放在專業卡上,放在每一張消費級顯示卡上。每個買 GeForce 打遊戲的人,都在不知不覺中補貼了 CUDA 的研發成本。內部叫它「CUDA 稅」。

這解決了軟體平台最大的問題:雞生蛋還是蛋生雞。因為每張遊戲卡都內建 CUDA,全世界的學生和研究員突然有了一台買得起的超級電腦。他們在上面寫的程式碼、建的模型、跑的實驗,全部依賴 CUDA 的函式庫。

到今天,CUDA 生態系有 300 到 500 萬開發者、300 個專業函式庫、3,700 個 GPU 加速應用程式。輝達自己有一萬個工程師專門維護這套軟體。

企業的資訊長面對的選擇是:繼續用 CUDA,還是重寫幾百萬行依賴 CUDA 函式庫的程式碼?答案很明顯。

這就是為什麼「護城河是 GPU 性能」是錯的。AMD 可以做出性能接近的 GPU。但 AMD 沒有 CUDA 生態。Google 可以做 TPU。但 TPU 上面沒有那 300 個函式庫。性能可以追,生態追不了。

Gurley 說護城河在縮小,輝達工程師說在擴大

輝達的工程師不斷重寫底層機器碼壓榨新一代晶片的效能,這些優化會自動回饋到整個 CUDA 生態,開源替代方案跟不上這個速度。一個硬體買家的說法是:輝達贏在軟體。電路追得上,軟體追不上。

你大概會覺得:那 4.75 億美元的軟體鎖,跑在每年都更強的 GPU 上,誰搬得走。

Bill Gurley 搬得走。他管 Benchmark,投過 Uber、Zillow。2024 年的 podcast 裡他拿出一個類比:CUDA 的故事讓他想起 2000 年代初期的企業軟體市場——當時 100% 的新創公司跑在 Oracle 資料庫和 Sun 伺服器上,五年之內全部換成了開源的 Linux 和 MySQL。

Gurley 的論點:開發者正在往堆疊的上層走。今天大部分 AI 開發用的是 PyTorch,不直接寫 CUDA。如果未來所有人都在 PyTorch 層工作,底下是輝達還是別家的晶片,就不重要了。

同一集 podcast,科技業高管 Sunny Madra 加重語氣:「CUDA 的護城河在推論市場不存在。」他指 Grok、Cerebras、SambaNova 在推論的性能和價格上已經超越輝達。

Gurley 這套說法的殺傷力在於:它不需要輝達做錯任何事——只需要開發者停止往底層深挖。

但黃仁勳自己反駁:輝達在推論市場的護城河反而更強。全世界的資料中心已經裝了大量輝達的舊晶片,CUDA 的向後相容讓這些舊晶片可以直接跑推論。

兩邊都聽完,我第一個反應是回頭問:他們在量同一件事嗎?

Gurley 量的是開發者往上層走的趨勢:誰在寫什麼。輝達工程師量的是底層優化的速度:誰跑得快。一個量時間軸的方向,一個量時間軸的斜率。兩個人根本在辯論不同的指標,你得先選你想賭的是哪一個。

然後 Stephen Witt 的書丟出一個讓兩邊都站不穩的東西。他在同一本書裡採訪了兩撥受訪者。一位前輝達研究員說切換 CUDA 是「巨大工程」,開發者試了通常決定「不值得」。另一位受訪者說,有時候「只要改幾行程式碼」就能從 CUDA 移到競爭對手的平台。

同一本書裡的矛盾。連採訪過輝達的人之間都沒有共識。

技術上可以切。商業上沒人敢。資訊長不會拿自己的職位去賭「可能只要改幾行」。這個膠著狀態撐得住的前提是沒有一家大客戶的自研晶片證明自己——哪一天證明了,水壩裂開不需要共識,只需要一個成功案例。

為什麼輝達的 AI 晶片能收 90% 通行費

如果輝達是晶片公司,它的毛利率應該跟英特爾或 AMD 差不多,大約 40% 到 60%。但它的 AI 晶片毛利率超過 90%。整體毛利率超過 70%,營業利益率 65%。

這不是硬體公司的數字。這是收通行費的平台公司的數字。

想像一下 Visa 和 Mastercard。它們不做任何一筆交易,不承擔任何信用風險,但每一筆刷卡消費都要經過它們的網路,它們從中抽走 1% 到 3%。輝達的位置類似:每一次 AI 模型的訓練和推論,都跑在輝達的 GPU 上。每一次輝達抽走的是 70% 到 90% 的毛利。

更驚人的是,輝達的平均售價一直在漲。一般硬體產品隨時間降價,但輝達最新的 Blackwell GB200 伺服器機櫃要價 200 萬到 300 萬美元一台。客戶當然知道它貴。他們沒有替代品。

一個華爾街分析師說:「AI 領域正在打仗,而輝達是唯一的軍火商。」

但收通行費的公司有一個歷史上反覆出現的問題:當通行費高到一定程度,使用者就會開始找繞路的方法。而輝達的四個最大客戶,恰好是全世界最有能力自己修路的公司。

四個最大的客戶才是威脅

Google 在做 TPU。Meta 在做 MTIA。Amazon 在做 Trainium。Microsoft 在做 Maia。

這四家公司同時是輝達最大的買家和最積極的自研者。Meta 宣布與輝達建立多年合作,購買數百萬顆 Blackwell 和 Rubin GPU(Rubin 目前排程 H2 2026 量產、採 TSMC 3nm + HBM4,Rubin Ultra 2027 Q2 跟進),並且同時蓋了一座專用核電廠來供電。它一邊付通行費,一邊在修自己的路。

為什麼它們還在買?因為 CUDA 的切換成本讓自研晶片短期內只能用在特定工作負載上。Google 的 TPU 針對 TensorFlow 最佳化,但 AI 世界已經標準化到 PyTorch 上了。Amazon 的 Trainium 才剛起步。這些自研晶片可以處理特定任務,但在通用性和軟體生態上跟 CUDA 差距很大。

有人形容這個結構:「AI 巨獸們都陷入了囚徒困境。」每家公司都知道繼續買輝達是在餵養一個壟斷者,但沒有人敢先停,因為先停的人在 AI 競賽裡會落後。

但這個均衡不是永恆的。Gurley 提到一個投資人 Gavin Baker 的觀察:如果全世界的 AI 開發標準化在 PyTorch 上,那專門針對 PyTorch 最佳化的 ASIC(客製化晶片)理論上可以做得比通用 GPU 更好更便宜。

Witt 的報導反駁了這個前提:AI 產業的確已經標準化在 PyTorch 上了,但開發者還是選擇輝達,因為輝達積極地讓 PyTorch 在 CUDA 上跑得最好。

這場辯論的結論不是「誰對」,而是一個時間問題:自研晶片需要多久才能在一個夠大的工作負載上證明自己?一年?三年?五年?如果你打算持有輝達超過三年,你最好有個答案。

你在同一條供應鏈上押了五次,你以為自己很分散

但如果你是台灣投資人,你多了一層風險。

有人分享自己的持股配置:50% 輝達、10% 台積電、40% 其他(VOO、VTI)。

看起來很分散。算一下。

輝達的每一顆 AI 晶片都由台積電製造。台灣生產全球 37% 的邏輯晶片,先進製程的比例更高。積體電路佔台灣出口的三分之一以上。

現在算一下這位投資人的風險敞口:

  • 他持有的輝達,100% 依賴台積電製造
  • 他持有的台積電,是輝達的獨家代工廠
  • 他的薪水大概率來自台灣的科技業或金融業,跟半導體供應鏈高度相關
  • 他的勞退基金裡有大量台積電
  • 他買的 VOO 裡,輝達是最大持股之一

他沒有分散。他在同一條供應鏈上押了五次。而且這五個押注之間的相關性,在正常時期看起來很低,但在極端情境下會趨近 1。

你沒有分散。你把同一個賭注包裝了五次。

但數字之外還有一層。黃仁勳生在台北,父母是台南人。他在 COMPUTEX 演講時台灣媒體把他當搖滾巨星。牛肉麵店把他的照片印在菜單上。「台灣之光」這四個字讓你在判斷輝達的時候多了一層你不會意識到的偏見。

你知道黃仁勳自己怎麼看台灣風險嗎?

他禁止負責全球供應鏈的副總裁 Deb Shoquist 為台灣可能發生的地緣政治衝突做任何應急計劃。他的原話是:「我不想她花一個腦細胞在這上面,因為她不可能做到。」

Shoquist 自己推測,如果真的發生事情,輝達會嘗試把訂單轉到三星或其他合作夥伴,結果就是「所有人的產品都會降一個等級」。

「降一個等級」是她的話,不是我的。半導體產業的估算是:台積電如果中斷,全球損失以兆美元計,重建產能至少需要十年。

同一個討論串裡,有人說「台積電會被取代,輝達不會」,隔幾樓有人說「全世界巨頭都要仰賴台積電」。兩個人對「誰比較不可替代」的結論完全相反。

但對台灣投資人來說,這個辯論問錯了方向。兩個都持有的時候,風險是乘法不是加法。

2001 年光纖是對的技術,投資人拿回不到建設成本 10%

假設你同意上面所有分析:輝達是平台公司,CUDA 的護城河目前仍然強大,自研晶片短期內追不上。

你可能還是會虧錢。

2001 年,美國的電信公司鋪了大量的光纖電纜。光纖是真正的革命性技術,今天全球的網路基礎設施還是跑在那些電纜上。但泡沫破裂的時候,只有 1% 到 2% 的光纖被「點亮」(實際啟用)。投資人在法院清算中拿回的金額,平均不到建設成本的 10%。

技術是對的。基礎設施是需要的。但建設速度遠遠超過實際需求的增長速度。

光纖電纜埋在地底,大部分沒有亮起

經濟學家 Carlota Perez 研究了過去 250 年的五次技術革命,發現一個模式:每次革命都經歷「建設期」(金融資本瘋狂湧入)和「部署期」(技術真正融入經濟)。中間隔著一次崩潰。鐵路是這樣,電力是這樣,網路是這樣。

AI 呢?

Anthropic 的執行長 Dario Amodei 在 2026 年初的一次訪談中說了一件讓我反覆想了很久的事。他說我們「接近指數增長的盡頭」。AI 不會停。他的意思是算力的擴張速度不可能永遠超過 GDP 的增長速度。他預測到 2028 到 2029 年,AI 產業可能每年花數兆美元建設算力基礎設施,然後逐漸達到一個支出的均衡點。

短期來看,輝達的需求是爆發性的(Amodei 自己也承認)。但長期來看,當算力從爆炸式建設轉為穩定運營,輝達的角色就從「軍火商」變成「電力公司」。電力公司還是賺錢,但它們的毛利率是被管制的,股價是穩定的,沒有人會付 40 倍本益比去買電力股。

對沖基金 Elliott Management 在 2024 年夏天寫信給客戶,警告 AI 被「過度炒作」,許多應用「永遠不會有成本效益,永遠無法正常運作,耗電太多,或者被證明不值得信任」。他們的原話是:如果輝達哪怕只出現一個壞的季報,「整個科技板塊會像洩氣的輪胎一樣消風」。

我不是說輝達是泡沫。我是說:「對的公司、錯的時間點」這個風險,歷史上反覆發生過,而且每次發生的時候,當時的人都覺得「這次不一樣」。

你真正在賭的三件事

我不會告訴你輝達該不該買。但如果你決定參與,你要知道自己在賭什麼。

三件事的順序不能亂:先問 CUDA 鎖定還能撐多久(短期變量),再問 AI 建設期有沒有到頂(中期變量),最後問台灣地緣政治(長期尾端風險)。任一個失效,就是離場信號。這是一條決策樹,不是檢查清單——每件事要自己定義「失效」長什麼樣。

第一,你在賭 CUDA 的鎖定效應至少還能維持三到五年。 Witt 的報導說護城河在擴大,Gurley 說在縮小。切換技術上可行但商業上沒人敢做。我自己在看的是 Google TPU 和 Amazon Trainium 的實際部署進度,不看輝達的財報。水壩裂開不需要共識,只需要某家大客戶的自研晶片在一個關鍵工作負載上成功一次。

第二,你在賭 AI 基礎設施的建設期還沒到頂。 Amodei 說短期數兆美元的需求是真的,但增長率遲早會逼近 GDP 天花板。這句話容易讀成「以後會變慢」。Perez 研究 250 年五次技術革命得到的結論不一樣:建設期的結束不會慢慢減速。它會在某個時間點突然停下來。我會看的是超大規模客戶(Google、Meta、Amazon、Microsoft)的資本支出增長率。當增長率開始下降的那一季——不用等它變成負的那一季——就是信號。

第三,如果你是台灣投資人,你在賭台灣地緣政治風險在你的投資週期內不會實現。 這你分析不了。但你能算的是:你的薪水、退休金、和投資組合裡,有多少比例跟台灣半導體供應鏈綁在一起?答案超過 50%,你已經不是在做投資決策了。你是在做一個關於台灣未來的押注。我自己追蹤的是台積電的客戶多元化進度:日本熊本廠已量產、美國亞利桑那廠 Fab 21 Phase 1 的 N4(4 奈米)製程已在 2024 Q4 進入量產(Apple 2026-02 承諾 2026 年採購超過一億顆 Arizona 生產的晶片),Phase 2 的 3 奈米目標 2027 下半年、德國德勒斯登廠時程未定。這些海外廠的量產時程,是目前最具體的地緣政治風險對沖指標。

三個賭注都有離場條件。絕大多數人不會設。

三個問題問不出答案的人,通常會回到開場那句話:「我 100% NVDA,一股不賣,奇蹟自來。」

我自己的做法:這三個信號每季看一次。任一個轉弱,先降部位再找答案。這不是看空的姿態。只是承認邊際資訊變了,不裝看不到。

大多數人做輝達的投資決策時,想的是「它還會不會漲」。

問題在這裡:你在賭什麼?你賭的假設是什麼?如果假設失效,你的離場條件是什麼?

如果你回答不出這三個問題,你持有的不是判斷,是信仰。讀角獸給你的是框架,不是明牌。怎麼用,是你的事。


你的投資群組一定也在討論輝達。把這三個問題丟進去,然後數一下有多少人突然安靜。


本文讀了這些來源:

書:

Podcast:


追蹤

這篇文章下了三個可驗證的判斷,正在被時間驗證。未來有新事件(hyperscaler capex 財報、Nvidia 季報、自研晶片部署)時,這個區段會自動更新結案結果。對的會留下、錯的也會留下。

三條追蹤中 · 最早預期結案:2028-04(Nvidia AI 泡沫觀察期滿)

CUDA 護城河在擴大還是縮小?

Gurley vs 黃仁勳

  • 判斷日:2026-04-24
  • 驗證條件:2029-04 前若 Google TPU 或 Amazon Trainium 在至少一家頂級 AI lab(OpenAI/Anthropic/xAI/Meta)的生產環境 inference workload ≥ 60% 算力從 Nvidia GPU 遷出(以該 lab 公開 infra 文件、財報 capex 分配或 CTO 訪談揭露為準)→ Gurley 對;若 2029 前上述 lab 的 Nvidia 佔比維持 ≥ 70% → 黃仁勳對;30-60% 之間 → partial
  • 預期結案:2029-04
  • 狀態:追蹤中

AI 算力建設期會穩定擴張還是觸頂崩潰?

Amodei vs Elliott Management

  • 判斷日:2026-04-24
  • 驗證條件:2028-04 前若 Nvidia 任一季 revenue 低於 consensus ≥ 10% 且次季 SOXX ETF 跌 > 20% → Elliott 對;若 Nvidia 持續成長無重大 miss 且 hyperscaler capex 成長到 2028 → Amodei 對
  • 預期結案:2028-04
  • 狀態:追蹤中

CUDA 鎖定效應還能維持 3-5 年

作者判斷 · 信心 65%

  • 判斷日:2026-04-24
  • 驗證條件:2029-04 前若至少一家 hyperscaler(GOOG/META/AMZN/MSFT)在 AI infra 財報、10-K 或 CEO 訪談明確揭露「主力 inference 已轉向非 CUDA 平台(算力佔比 ≥ 60%)」→ 判錯(CUDA 鎖定 < 3-5 年);若 2029 前無該揭露 → 判對
  • 預期結案:2029-04
  • 狀態:追蹤中

這個區段會由站點 automation 每月自動更新。看所有追蹤


你可能也想讀:

我寫信時,寄給你

不定期。寫舊文章的後續、新發現、想討論的事。

本文為讀角獸矛盾圖譜(Contradiction Graph)的一個節點。內容以 CC BY 4.0 授權,歡迎引用、改作、再發布,請註明來源。