引言:GPU皇帝的"中央银行"时刻
2026年7月1日,英伟达正式宣布推出AI Compute Partnership Program——以收入分成(Revenue-sharing)和信用支持(Credit-support)双机制为核心的AI基础设施合作新模式。
同一天,Meta被曝计划推出云基础设施业务向外部出售算力,引发半导体板块暴跌6%。截然相反的市场信号两相映照,勾勒出AI算力产业最深层的结构性变革:英伟达正在从"铲子供应商"变成算力世界的"中央银行"。
更直白地说:英伟达不再只满足于把GPU卖给你,它要参与你每一次算力出租的利润分成。
一、新模式全景:英伟达的算力金融化双引擎
1.1 双机制架构
┌──────────────────────────────────────────────────────────┐
│ NVIDIA AI Compute Partnership Program │
│ │
│ ┌─────────────────────────┐ ┌─────────────────────────┐ │
│ │ 收入分成机制 │ │ 信用支持机制 │ │
│ │ Revenue-sharing │ │ Credit-support │ │
│ ├─────────────────────────┤ ├─────────────────────────┤ │
│ │ 英伟达从云服务商营收中 │ │ 英伟达利用自身资产负债 │ │
│ │ 抽取约定比例的分成收入 │ │ 表为新兴云厂商提供财务 │ │
│ │ 分成比例随合同期推进 │ │ 担保和算力信用额度 │ │
│ │ 逐步阶梯递减 │ │ 降低初始CapEx门槛 │ │
│ └─────────────────────────┘ └─────────────────────────┘ │
│ │
│ 核心条款(The Information披露) │
│ ┌──────────────────────────────────────────────────────┐ │
│ │ 若云服务商无法找到足够租户 → 英伟达以约定价格回租 │ │
│ │ 未售出的GPU产能 │ │
│ │ │ │
│ │ 等价于:英伟达用自己的资产负债表为算力需求兜底 │ │
│ └──────────────────────────────────────────────────────┘ │
│ │
│ 底层架构:DSX AI Factory │
│ - 基于NVIDIA DSX数据中心平台 │
│ - 大规模多租户AI工厂设计 │
│ - 原生支持Blackwell系列GPU(GB300) │
└──────────────────────────────────────────────────────────┘
1.2 首批合作伙伴
| 合作伙伴 | 地区 | 部署规模 | 电力规划 |
|---|---|---|---|
| Sharon AI | 澳大利亚(纳斯达克上市) | 最高40,000块GB300 GPU(远期>55,000) | — |
| Firmus | 印度尼西亚·巴淡岛 | 最高170,000块英伟达GPU | 360 MW可扩展园区 |
1.3 模式对比:从一次性交易到持续性收益
NVIDIA商业模式三重跃迁
┌──────────────┬───────────────────┬──────────────────────┐
│ 维度 │ 过去 │ 现在 │
├──────────────┼───────────────────┼──────────────────────┤
│ 角色 │ 硬件供应商 │ 信用中介 + 财务投资者 │
├──────────────┼───────────────────┼──────────────────────┤
│ 收入来源 │ 一次性芯片销售 │ 持续性使用量挂钩分成 │
├──────────────┼───────────────────┼──────────────────────┤
│ 风险承担 │ 不承担下游需求 │ 主动承担算力过剩风险 │
│ │ 风险 │ 换取下游利润分成 │
├──────────────┼───────────────────┼──────────────────────┤
│ 客户关系 │ 卖完即止 │ 长期深度绑定 │
├──────────────┼───────────────────┼──────────────────────┤
│ 盈利质量 │ 波动性高 │ 经常性收入占比提升 │
└──────────────┴───────────────────┴──────────────────────┘
二、算力供需的真实图景:过剩还是紧缺?
2.1 市场价格信号
英伟达兜底承诺的时机恰好发生在Meta"算力过剩"恐慌引发硬件股暴跌的同一天。但供需数据给出了截然相反的信号:
GPU租赁市场价格走势(2025年10月 → 2026年3月)
H100 一年期租赁: $1.70/小时 ───→ $2.35/小时 (+38%)
B200 高端GPU租赁: ───→ 涨幅最高94%
所有GPU按需租赁: ───→ 容量100%售罄
高端千卡算力交付周期: ───→ 12-15个月
GPU云端供应商反馈:
供需比 ≈ 1:10(每10个需求只有1个能被满足)
租赁价格半年涨幅 > 25%
2.2 融资障碍 vs 需求不足
新兴云服务商面临的核心障碍不是"算力没人要",而是"没钱买":
算力采购的"鸡生蛋"困境:
AI模型团队需要GPU训练模型
↓
但GPU太贵,需要云服务商提供算力租赁
↓
云服务商需要采购大规模GPU集群
↓
但采购需要巨额资本支出(CapEx),银行不愿贷款
↓
新兴云服务商信用评级低,融资成本高
↓
算力供给无法跟上需求增长
英伟达的解决方案:
用自己的资产负债表为新兴云服务商提供信用增级
→ 降低融资门槛
→ 加速GPU出货
→ 获得持续性分成收益
2.3 Meta卖算力 ≠ 算力过剩
同日Meta被曝计划出售算力,被市场恐慌性解读为"算力过剩"。但细究逻辑:
| 角度 | Meta卖算力 | 英伟达兜底 |
|---|---|---|
| 市场反应 | 恐慌性抛售硬件股 | 被忽视的利多信号 |
| 隐含判断 | 算力供过于求 | 算力需求确定性极高 |
| 深层逻辑 | Meta CapEx 1250-1450亿美元/年 | 英伟达愿用自有资金为需求兜底 |
| 真相 | Meta需要多元化收入来源 | 融资瓶颈而非需求瓶颈 |
英伟达用自己的资产负债表为算力需求兜底——如果它对AI算力前景缺乏信心,绝不会做这件事。
三、DSX AI Factory:多租户算力工厂架构
3.1 架构全景
DSX AI Factory是英伟达为大规模算力共享设计的新一代数据中心架构:
┌────────────────────────────────────────────────────────────┐
│ DSX AI Factory 架构 │
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ AI租户A │ │ AI租户B │ │ AI租户C │ ... │
│ │ (训练任务) │ │ (推理服务) │ │ (微调任务) │ │
│ └──────┬──────┘ └──────┬──────┘ └──────┬──────┘ │
│ │ │ │ │
│ ▼ ▼ ▼ │
│ ┌──────────────────────────────────────────────────┐ │
│ │ 多租户GPU调度层(Multi-Tenant Scheduler) │ │
│ │ - 动态资源分配 - 优先级队列 - 抢占恢复 │ │
│ │ - 租户隔离 - QoS保障 - 计费计量 │ │
│ └──────────────────────┬───────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌──────────────────────────────────────────────────┐ │
│ │ GB300 GPU 算力池(可扩展至17万卡) │ │
│ │ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ │ │
│ │ │DGX │ │DGX │ │DGX │ │DGX │ │DGX │...│ │
│ │ │SuperPod│SuperPod│SuperPod│SuperPod│SuperPod│ │ │
│ │ └──────┘ └──────┘ └──────┘ └──────┘ └──────┘ │ │
│ └──────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌──────────────────────────────────────────────────┐ │
│ │ 存储层(NVMe + 分布式并行文件系统) │ │
│ └──────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌──────────────────────────────────────────────────┐ │
│ │ 网络层(NVLink + InfiniBand 800G) │ │
│ └──────────────────────────────────────────────────┘ │
│ │
│ 供电层:360 MW 可扩展 │
│ 冷却:液冷(直接-to-芯片) │
└────────────────────────────────────────────────────────────┘
3.2 多租户GPU调度器实现
以下是DSX AI Factory核心组件的Go实现——支持资源隔离、动态分配和抢占恢复的多租户调度器:
// DSX AI Factory - Multi-Tenant GPU Scheduler
// Core scheduling engine for NVIDIA's AI factory architecture
package scheduler
import (
"container/heap"
"context"
"fmt"
"sync"
"time"
)
// GPU资源单元
type GPUUnit struct {
ID string
Model string // GB200, GB300, H100, etc.
MemoryMB int64
ComputeCap float64 // TFLOPS
Status string // free, allocated, reserved, maintenance
PodID string // 所属DGX SuperPod
NodeID string
}
// 租户定义
type Tenant struct {
ID string
Name string
Priority int // 优先级(0-100,越高越优先)
GuaranteedGPU int // 保证GPU数
MaxGPU int // 最大GPU数(弹性上限)
BurstEnabled bool // 是否允许突发弹性使用
ContractLevel string // premium, standard, basic
RevenueShare float64 // 收入分成比例
}
// 任务定义
type Task struct {
ID string
TenantID string
Type string // training, inference, finetune
GPUCount int
MinGPU int
MaxGPU int
Duration time.Duration
Priority int
SubmittedAt time.Time
Deadline time.Time
Preemptible bool // 是否可被抢占
State string // queued, running, preempted, completed, failed
}
// 资源分配记录
type Allocation struct {
TaskID string
GPUIDs []string
StartTime time.Time
EndTime time.Time
Cost float64 // 累计费用
}
// MultiTenantScheduler 多租户GPU调度器
type MultiTenantScheduler struct {
mu sync.RWMutex
gpuPool map[string]*GPUUnit
tenants map[string]*Tenant
taskQueue PriorityQueue
running map[string]*Allocation
metrics *SchedulerMetrics
// 调度策略参数
config SchedulerConfig
}
type SchedulerConfig struct {
OvercommitRatio float64 // 超分比(默认1.2)
PreemptionGrace time.Duration // 抢占宽限期
MaxQueueDepth int
AccountingPeriod time.Duration // 计费周期
}
type SchedulerMetrics struct {
TotalGPUHours float64
UtilizationRate float64
PreemptionCount int64
AvgQueueWaitTime time.Duration
TenantUtilization map[string]float64
}
// PriorityQueue 优先级队列(堆)
type PriorityQueue []*Task
func (pq PriorityQueue) Len() int {
return len(pq) }
func (pq PriorityQueue) Less(i, j int) bool {
// 优先级高的先调度;同优先级下提交时间早的先调度
if pq[i].Priority != pq[j].Priority {
return pq[i].Priority > pq[j].Priority
}
return pq[i].SubmittedAt.Before(pq[j].SubmittedAt)
}
func (pq PriorityQueue) Swap(i, j int) {
pq[i], pq[j] = pq[j], pq[i]
}
func (pq *PriorityQueue) Push(x interface{
}) {
*pq = append(*pq, x.(*Task))
}
func (pq *PriorityQueue) Pop() interface{
} {
old := *pq
n := len(old)
item := old[n-1]
old[n-1] = nil
*pq = old[0 : n-1]
return item
}
// NewScheduler 创建新的多租户调度器
func NewScheduler(config SchedulerConfig) *MultiTenantScheduler {
return &MultiTenantScheduler{
gpuPool

4831

被折叠的 条评论
为什么被折叠?



