英伟达AI Compute Partnership：从“卖铲人“到“收租人“的算力金融化革命

原创

于 2026-07-04 17:05:39 发布 · 117 阅读

引言：GPU皇帝的"中央银行"时刻

2026年7月1日，英伟达正式宣布推出AI Compute Partnership Program——以收入分成（Revenue-sharing）和信用支持（Credit-support）双机制为核心的AI基础设施合作新模式。

同一天，Meta被曝计划推出云基础设施业务向外部出售算力，引发半导体板块暴跌6%。截然相反的市场信号两相映照，勾勒出AI算力产业最深层的结构性变革：英伟达正在从"铲子供应商"变成算力世界的"中央银行"。

更直白地说：英伟达不再只满足于把GPU卖给你，它要参与你每一次算力出租的利润分成。

一、新模式全景：英伟达的算力金融化双引擎

1.1 双机制架构

┌──────────────────────────────────────────────────────────┐
│          NVIDIA AI Compute Partnership Program             │
│                                                            │
│  ┌─────────────────────────┐  ┌─────────────────────────┐ │
│  │     收入分成机制         │  │     信用支持机制         │ │
│  │   Revenue-sharing       │  │   Credit-support        │ │
│  ├─────────────────────────┤  ├─────────────────────────┤ │
│  │ 英伟达从云服务商营收中  │  │ 英伟达利用自身资产负债  │ │
│  │ 抽取约定比例的分成收入  │  │ 表为新兴云厂商提供财务  │ │
│  │ 分成比例随合同期推进    │  │ 担保和算力信用额度      │ │
│  │ 逐步阶梯递减            │  │ 降低初始CapEx门槛       │ │
│  └─────────────────────────┘  └─────────────────────────┘ │
│                                                            │
│                  核心条款（The Information披露）              │
│  ┌──────────────────────────────────────────────────────┐  │
│  │ 若云服务商无法找到足够租户 → 英伟达以约定价格回租     │  │
│  │ 未售出的GPU产能                                      │  │
│  │                                                      │  │
│  │ 等价于：英伟达用自己的资产负债表为算力需求兜底         │  │
│  └──────────────────────────────────────────────────────┘  │
│                                                            │
│  底层架构：DSX AI Factory                                   │
│  - 基于NVIDIA DSX数据中心平台                              │
│  - 大规模多租户AI工厂设计                                   │
│  - 原生支持Blackwell系列GPU（GB300）                        │
└──────────────────────────────────────────────────────────┘

1.2 首批合作伙伴

合作伙伴	地区	部署规模	电力规划
Sharon AI	澳大利亚（纳斯达克上市）	最高40,000块GB300 GPU（远期>55,000）	—
Firmus	印度尼西亚·巴淡岛	最高170,000块英伟达GPU	360 MW可扩展园区

1.3 模式对比：从一次性交易到持续性收益

                NVIDIA商业模式三重跃迁

┌──────────────┬───────────────────┬──────────────────────┐
│    维度      │       过去         │        现在           │
├──────────────┼───────────────────┼──────────────────────┤
│     角色     │   硬件供应商       │  信用中介 + 财务投资者 │
├──────────────┼───────────────────┼──────────────────────┤
│   收入来源   │   一次性芯片销售   │  持续性使用量挂钩分成  │
├──────────────┼───────────────────┼──────────────────────┤
│   风险承担   │   不承担下游需求   │  主动承担算力过剩风险  │
│              │   风险             │  换取下游利润分成      │
├──────────────┼───────────────────┼──────────────────────┤
│   客户关系   │   卖完即止         │  长期深度绑定          │
├──────────────┼───────────────────┼──────────────────────┤
│   盈利质量   │   波动性高         │  经常性收入占比提升    │
└──────────────┴───────────────────┴──────────────────────┘

二、算力供需的真实图景：过剩还是紧缺？

2.1 市场价格信号

英伟达兜底承诺的时机恰好发生在Meta"算力过剩"恐慌引发硬件股暴跌的同一天。但供需数据给出了截然相反的信号：

GPU租赁市场价格走势（2025年10月 → 2026年3月）

H100 一年期租赁:  $1.70/小时  ───→  $2.35/小时  (+38%)
B200 高端GPU租赁:             ───→  涨幅最高94%
所有GPU按需租赁:               ───→  容量100%售罄

高端千卡算力交付周期:           ───→  12-15个月

GPU云端供应商反馈:
  供需比 ≈ 1:10（每10个需求只有1个能被满足）
  租赁价格半年涨幅 > 25%

2.2 融资障碍 vs 需求不足

新兴云服务商面临的核心障碍不是"算力没人要"，而是"没钱买"：

算力采购的"鸡生蛋"困境：

  AI模型团队需要GPU训练模型
       ↓
  但GPU太贵，需要云服务商提供算力租赁
       ↓
  云服务商需要采购大规模GPU集群
       ↓
  但采购需要巨额资本支出（CapEx），银行不愿贷款
       ↓
  新兴云服务商信用评级低，融资成本高
       ↓
  算力供给无法跟上需求增长

英伟达的解决方案：
  用自己的资产负债表为新兴云服务商提供信用增级
  → 降低融资门槛
  → 加速GPU出货
  → 获得持续性分成收益

2.3 Meta卖算力 ≠ 算力过剩

同日Meta被曝计划出售算力，被市场恐慌性解读为"算力过剩"。但细究逻辑：

角度	Meta卖算力	英伟达兜底
市场反应	恐慌性抛售硬件股	被忽视的利多信号
隐含判断	算力供过于求	算力需求确定性极高
深层逻辑	Meta CapEx 1250-1450亿美元/年	英伟达愿用自有资金为需求兜底
真相	Meta需要多元化收入来源	融资瓶颈而非需求瓶颈

英伟达用自己的资产负债表为算力需求兜底——如果它对AI算力前景缺乏信心，绝不会做这件事。

三、DSX AI Factory：多租户算力工厂架构

3.1 架构全景

DSX AI Factory是英伟达为大规模算力共享设计的新一代数据中心架构：

┌────────────────────────────────────────────────────────────┐
│                  DSX AI Factory 架构                         │
│                                                             │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐        │
│  │  AI租户A     │  │  AI租户B     │  │  AI租户C     │  ...  │
│  │ (训练任务)   │  │ (推理服务)   │  │ (微调任务)   │        │
│  └──────┬──────┘  └──────┬──────┘  └──────┬──────┘        │
│         │               │               │                  │
│         ▼               ▼               ▼                  │
│  ┌──────────────────────────────────────────────────┐      │
│  │          多租户GPU调度层（Multi-Tenant Scheduler）  │      │
│  │   - 动态资源分配     - 优先级队列      - 抢占恢复    │      │
│  │   - 租户隔离         - QoS保障         - 计费计量    │      │
│  └──────────────────────┬───────────────────────────┘      │
│                         │                                   │
│                         ▼                                   │
│  ┌──────────────────────────────────────────────────┐      │
│  │          GB300 GPU 算力池（可扩展至17万卡）        │      │
│  │  ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐   │      │
│  │  │DGX   │ │DGX   │ │DGX   │ │DGX   │ │DGX   │...│      │
│  │  │SuperPod│SuperPod│SuperPod│SuperPod│SuperPod│   │      │
│  │  └──────┘ └──────┘ └──────┘ └──────┘ └──────┘   │      │
│  └──────────────────────────────────────────────────┘      │
│                         │                                   │
│                         ▼                                   │
│  ┌──────────────────────────────────────────────────┐      │
│  │      存储层（NVMe + 分布式并行文件系统）           │      │
│  └──────────────────────────────────────────────────┘      │
│                         │                                   │
│                         ▼                                   │
│  ┌──────────────────────────────────────────────────┐      │
│  │      网络层（NVLink + InfiniBand 800G）           │      │
│  └──────────────────────────────────────────────────┘      │
│                                                             │
│  供电层：360 MW 可扩展                                     │
│  冷却：液冷（直接-to-芯片）                                  │
└────────────────────────────────────────────────────────────┘

3.2 多租户GPU调度器实现

以下是DSX AI Factory核心组件的Go实现——支持资源隔离、动态分配和抢占恢复的多租户调度器：

// DSX AI Factory - Multi-Tenant GPU Scheduler
// Core scheduling engine for NVIDIA's AI factory architecture

package scheduler

import (
	"container/heap"
	"context"
	"fmt"
	"sync"
	"time"
)

// GPU资源单元
type GPUUnit struct {
   
   
	ID         string
	Model      string     // GB200, GB300, H100, etc.
	MemoryMB   int64
	ComputeCap float64    // TFLOPS
	Status     string     // free, allocated, reserved, maintenance
	PodID      string     // 所属DGX SuperPod
	NodeID     string
}

// 租户定义
type Tenant struct {
   
   
	ID             string
	Name           string
	Priority       int           // 优先级（0-100，越高越优先）
	GuaranteedGPU  int           // 保证GPU数
	MaxGPU         int           // 最大GPU数（弹性上限）
	BurstEnabled   bool          // 是否允许突发弹性使用
	ContractLevel  string        // premium, standard, basic
	RevenueShare   float64       // 收入分成比例
}

// 任务定义
type Task struct {
   
   
	ID             string
	TenantID       string
	Type           string        // training, inference, finetune
	GPUCount       int
	MinGPU         int
	MaxGPU         int
	Duration       time.Duration
	Priority       int
	SubmittedAt    time.Time
	Deadline       time.Time
	Preemptible    bool          // 是否可被抢占
	State          string        // queued, running, preempted, completed, failed
}

// 资源分配记录
type Allocation struct {
   
   
	TaskID    string
	GPUIDs    []string
	StartTime time.Time
	EndTime   time.Time
	Cost      float64     // 累计费用
}

// MultiTenantScheduler 多租户GPU调度器
type MultiTenantScheduler struct {
   
   
	mu          sync.RWMutex
	gpuPool     map[string]*GPUUnit
	tenants     map[string]*Tenant
	taskQueue   PriorityQueue
	running     map[string]*Allocation
	metrics     *SchedulerMetrics
	
	// 调度策略参数
	config SchedulerConfig
}

type SchedulerConfig struct {
   
   
	OvercommitRatio   float64       // 超分比（默认1.2）
	PreemptionGrace   time.Duration // 抢占宽限期
	MaxQueueDepth     int
	AccountingPeriod  time.Duration // 计费周期
}

type SchedulerMetrics struct {
   
   
	TotalGPUHours      float64
	UtilizationRate    float64
	PreemptionCount    int64
	AvgQueueWaitTime   time.Duration
	TenantUtilization  map[string]float64
}

// PriorityQueue 优先级队列（堆）
type PriorityQueue []*Task

func (pq PriorityQueue) Len() int {
   
    return len(pq) }

func (pq PriorityQueue) Less(i, j int) bool {
   
   
	// 优先级高的先调度；同优先级下提交时间早的先调度
	if pq[i].Priority != pq[j].Priority {
   
   
		return pq[i].Priority > pq[j].Priority
	}
	return pq[i].SubmittedAt.Before(pq[j].SubmittedAt)
}

func (pq PriorityQueue) Swap(i, j int) {
   
   
	pq[i], pq[j] = pq[j], pq[i]
}

func (pq *PriorityQueue) Push(x interface{
   
   }) {
   
   
	*pq = append(*pq, x.(*Task))
}

func (pq *PriorityQueue) Pop() interface{
   
   } {
   
   
	old := *pq
	n := len(old)
	item := old[n-1]
	old[n-1] = nil
	*pq = old[0 : n-1]
	return item
}

// NewScheduler 创建新的多租户调度器
func NewScheduler(config SchedulerConfig) *MultiTenantScheduler {
   
   
	return &MultiTenantScheduler{
   
   
		gpuPool