Pytorch 容器 - 5. Module中的参数转换/转移：cpu(), cuda(), float(), double(), half()

原创已于 2023-04-22 23:07:59 修改 · 1.4k 阅读

4 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#pytorch #人工智能 #python

于 2023-04-21 22:25:16 首次发布

Pytorch操作专栏收录该内容

14 篇文章

订阅专栏

本文介绍了PyTorch中如何在CPU和GPU间转换模型参数，包括model.cpu()、model.cuda()以及float()、half()、double()等函数的使用，强调了在GPU训练中需手动调用cuda()并将模型、数据和损失函数一并转移。

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化，内置完整运行环境与 Qwen3-32B 模型依赖，开箱即用。

1. cpu()

对于模型的cpu()函数，比如 model.cpu()，只是把 parameters 和 buffers 进行转移

2. cuda(device=None)

在PyTorch中，算法优先使用CPU，不会自动使用GPU，因此需要在程序中显示指定。如果模型要在gpu上进行训练，需要再将模型参数放到优化器之前调用cuda() 将其加载到GPU。

在网络模型的训练过程中，模型，数据(input和gt)和损失函数都需要转移到cuda
使用 torch.cuda.is_available() 判断gpu是否可用
除了 cuda(device) 函数外，还可以使用 to(device) 来进行设备转换。其中 to(device) 中的参数是必须的，cuda()中的参数是可选的。对于单机单卡(单GPU)的模型训练，代码如下：

model = Model()
# 第一种定义 device的方式
device = torch.device("cuda:1") 
# 第二种定义 device的方式
device = torch.device("cuda",1)

# 1. 使用 cuda() 进行转换
if torch.cuda.is_available():
    model = model.cuda(device)  
    # model = model.cuda() # 这种方式默认使用 cuda: 0

# 2. 使用 to() 进行转换
if torch.cuda.is_available():
    model = model.to(device)