动手学深度学习-学习笔记(总)

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen
文本生成
Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化,内置完整运行环境与 Qwen3-32B 模型依赖,开箱即用。

1、概述

本篇博客用来记录,我学习《动手学深度学习》的过程和笔记
本篇博客主要是整体的博客内容

李沐《动手学深度学习》资料
课程主页动手学深度学习-课程主页
教材动手学深度学习-教材
课程论坛讨论课程论坛讨论
Pytorch论坛Pytorch论坛


2、内容

2.1、python

python 有关于深度学习的学习笔记
python学习笔记(深度学习)

2.2、动手学深度学习

2.2.1、课前准备

链接
动手学深度学习-学习笔记【一】(学习前准备)

内容
安装 pytorch 和 pycharm


2.2.2、预备知识

链接
动手学深度学习-学习笔记【二】(基础知识)

内容
学习深度学习的一些预备知识,包括数据操作,线性代数,微积分,概率论等


2.2.3、线性神经网络

链接
动手学深度学习-学习笔记【三】(线性神经网络)

内容
主要介绍线性神经网络,训练过程,代码实现,原理等


2.2.4、多层感知机

链接
动手学深度学习-学习笔记【四】(多层感知机)

内容
主要介绍多层感知机,训练过程,代码实现,原理等


2.3、深度学习重要概念

深度学习-重要概念-学习笔记


3、常见问题

3.1、安装 d2l 失败

【问题现象】
在 conda 的 python 环境中安装 d2l 失败,报错
AttributeError: module 'pkgutil' has no attribute 'ImpImporter'. Did you mean: 'zipimporter'?

在这里插入图片描述


【问题原因】
python 版本不支持


【解决办法】
使用 conda 安装一个新的 python 环境,使用 python-3.9
执行命令
conda create -n d2l python=3.9 -y
conda activate d2l


3.2、调用 mean() 方法报错

【问题现象】

调用 mean() 方法报错 RuntimeError: mean(): could not infer output dtype. Input dtype must be either a floating point or complex dtype. Got: Long

在这里插入图片描述


【问题原因】

此错误表明你在调用 torch.mean() 时,输入的张量数据类型是 整数型(torch.long),而 torch.mean() 只能接受 浮点型(float 或 double)或复数型 的张量。


【解决办法】

将输入张量修改为浮点数类型

import torch

A = torch.arange(20, dtype=torch.float32).reshape(5, 4)
print(A)
# tensor([[ 0,  1,  2,  3],
#         [ 4,  5,  6,  7],
#         [ 8,  9, 10, 11],
#         [12, 13, 14, 15],
#         [16, 17, 18, 19]])

print(A.mean())              # tensor(9.5000)

3.3、markdown 常见公式

【问题现象】

markdown 的常见公式


【问题原因】


【解决办法】

  1. 行内公式
    我们知道圆的面积公式是 S = π r 2 S = \pi r^2 S=πr2,其中 r r r 是圆的半径。
  2. 块级公式
    F = m a F = ma F=ma
  3. 上下标
    x 2 x^2 x2 表示平方, a i j a_{ij} aij 表示矩阵元素。
  4. 分数
    1 2 \frac{1}{2} 21 a + b c − d \frac{a + b}{c - d} cda+b
  5. 根号
    2 \sqrt{2} 2 x 3 \sqrt[3]{x} 3x
  6. 积分和求和
    ∫ a b f ( x )   d x \int_{a}^{b} f(x) \, dx abf(x)dx
    ∑ i = 1 n i = n ( n + 1 ) 2 \sum_{i=1}^{n} i = \frac{n(n+1)}{2} i=1ni=2n(n+1)
  7. 希腊字母
    α , β , γ , δ , ϵ , π , η , μ , σ \alpha, \beta, \gamma, \delta, \epsilon, \pi,\eta,\mu,\sigma α,β,γ,δ,ϵ,πημσ
  8. 一元二次方程组
    x = − b ± b 2 − 4 a c 2 a x = \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} x=2ab±b24ac
  9. 偏导数
    ∂ f ∂ x \frac{\partial f}{\partial x} xf
  10. 平方误差公式
    l i ( w , b ) = 1 2 ∗ ( y ^ i − y i ) 2 l^i(w, b) = \frac{1}{2} * (\hat{y}^i - y^i)^2 li(w,b)=21(y^iyi)2
  11. 向左边的箭头
    ← \leftarrow
  12. 属于
    ∈ \in
  13. 取最大值
    arg ⁡ max ⁡ x ( 1 + 2 ) \arg\max_{x} (1+2) argxmax(1+2)
  14. 连续乘法
    ∏ k = 1 5 k \prod_{k=1}^{5} k k=15k
  15. 公式对齐
    y = x = 1 \begin{align} y &= x \\ &= 1 \end{align} y=x=1
  16. 约等于
    1.0 ≈ 1 1.0 \approx 1 1.01

3.4、执行动手学深度学习中的代码,无法显示图片

【问题现象】
执行动手学深度学习中的代码,无法显示图片


【问题原因】
在 Jupyter Notebook 中,%matplotlib inline 会自动显示图像,但 PyCharm 默认需要显式调用 plt.show() 才能渲染图像。


【解决办法】

在 PyCharm 中添加如下代码即可

from matplotlib import pyplot as plt

...

plt.show()

3.5、XX

【问题现象】


【问题原因】


【解决办法】


4、知识与总结

【Q1】数据的转换有什么负面影响吗?比如数值变得稀疏?
【A】对于深度学习而言,没有任何影响,但会消耗内存

【Q2】为什么深度学习要用张量来表示?
【A】是一路发展过来,统计学使用张量较多

【Q3】求copy与clone的区别(是关于内存吗?)
【A】copy是有可能不copy内存的,而clone是必然复制内存的

【Q4】torch不区分行向量和列向量吗?
【A】如果是一维张量一定是行向量,列向量是一个二维矩阵;可以用矩阵来区分行向量和列向量

【Q5】张量的概念,机器学习和数学是一样的吗?区别大吗?
【A】机器学习的张量不是张量,其实是一个多维数组,跟数学的张量不一样

【Q6】

您可能感兴趣的与本文相关的镜像

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen
文本生成
Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化,内置完整运行环境与 Qwen3-32B 模型依赖,开箱即用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值