动手学深度学习-学习笔记（总）

原创已于 2025-10-19 00:23:12 修改 · 912 阅读

18 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

于 2025-07-05 22:39:30 首次发布

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen

文本生成

Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化，内置完整运行环境与 Qwen3-32B 模型依赖，开箱即用。

文章目录

1、概述
2、内容
3、常见问题
4、知识与总结

1、概述

本篇博客用来记录，我学习《动手学深度学习》的过程和笔记
本篇博客主要是整体的博客内容

李沐《动手学深度学习》资料
课程主页：动手学深度学习-课程主页
教材：动手学深度学习-教材
课程论坛讨论：课程论坛讨论
Pytorch论坛：Pytorch论坛

2、内容

2.1、python

python 有关于深度学习的学习笔记
python学习笔记（深度学习）

2.2、动手学深度学习

2.2.1、课前准备

链接：
动手学深度学习-学习笔记【一】（学习前准备）

内容：
安装 pytorch 和 pycharm

2.2.2、预备知识

链接：
动手学深度学习-学习笔记【二】（基础知识）

内容：
学习深度学习的一些预备知识，包括数据操作，线性代数，微积分，概率论等

2.2.3、线性神经网络

链接：
动手学深度学习-学习笔记【三】（线性神经网络）

内容：
主要介绍线性神经网络，训练过程，代码实现，原理等

2.2.4、多层感知机

链接：
动手学深度学习-学习笔记【四】（多层感知机）

内容：
主要介绍多层感知机，训练过程，代码实现，原理等

2.3、深度学习重要概念

深度学习-重要概念-学习笔记

3、常见问题

3.1、安装 d2l 失败

【问题现象】
在 conda 的 python 环境中安装 d2l 失败，报错
AttributeError: module 'pkgutil' has no attribute 'ImpImporter'. Did you mean: 'zipimporter'?

在这里插入图片描述

【问题原因】
python 版本不支持

【解决办法】
使用 conda 安装一个新的 python 环境，使用 python-3.9
执行命令：
conda create -n d2l python=3.9 -y
conda activate d2l

3.2、调用 mean() 方法报错

【问题现象】

调用 mean() 方法报错 RuntimeError: mean(): could not infer output dtype. Input dtype must be either a floating point or complex dtype. Got: Long

在这里插入图片描述

【问题原因】

此错误表明你在调用 torch.mean() 时，输入的张量数据类型是 整数型（torch.long），而 torch.mean() 只能接受 浮点型（float 或 double）或复数型的张量。

【解决办法】

将输入张量修改为浮点数类型

import torch

A = torch.arange(20, dtype=torch.float32).reshape(5, 4)
print(A)
# tensor([[ 0,  1,  2,  3],
#         [ 4,  5,  6,  7],
#         [ 8,  9, 10, 11],
#         [12, 13, 14, 15],
#         [16, 17, 18, 19]])

print(A.mean())              # tensor(9.5000)

3.3、markdown 常见公式

【问题现象】

markdown 的常见公式

【问题原因】

【解决办法】

行内公式
我们知道圆的面积公式是 $\pi r^2$ ，其中 $r$ 是圆的半径。
块级公式
$F = ma$
上下标
$x^2$ 表示平方， $a_{ij}$ 表示矩阵元素。
分数
$\frac{1}{2}$ 和 $\frac{a + b}{c - d}$
根号
$\sqrt{2}$ 和 $\sqrt[3]{x}$
积分和求和
$\int_{a}^{b} f(x) \, dx$
$\sum_{i=1}^{n} i = \frac{n(n+1)}{2}$
希腊字母
$\alpha, \beta, \gamma, \delta, \epsilon, \pi，\eta，\mu，\sigma$
一元二次方程组
$\frac{-b \pm \sqrt{b^2 - 4ac}}{2a}$
偏导数
$\frac{\partial f}{\partial x}$
平方误差公式
$l^i(w, b) = \frac{1}{2} * (\hat{y}^i - y^i)^2$
向左边的箭头
$\leftarrow$
属于
$\in$
取最大值
$arg\max_{x} (1+2)$
连续乘法
$\prod_{k=1}^{5} k$
公式对齐
$\begin{align} y &= x \\ &= 1 \end{align}$
约等于
$\approx 1$

3.4、执行动手学深度学习中的代码，无法显示图片

【问题现象】
执行动手学深度学习中的代码，无法显示图片

【问题原因】
在 Jupyter Notebook 中，%matplotlib inline 会自动显示图像，但 PyCharm 默认需要显式调用 plt.show() 才能渲染图像。

【解决办法】

在 PyCharm 中添加如下代码即可

from matplotlib import pyplot as plt

...

plt.show()

3.5、XX

【问题现象】

【问题原因】

【解决办法】

4、知识与总结

【Q1】数据的转换有什么负面影响吗？比如数值变得稀疏？
【A】对于深度学习而言，没有任何影响，但会消耗内存

【Q2】为什么深度学习要用张量来表示？
【A】是一路发展过来，统计学使用张量较多

【Q3】求copy与clone的区别（是关于内存吗？）
【A】copy是有可能不copy内存的，而clone是必然复制内存的

【Q4】torch不区分行向量和列向量吗？
【A】如果是一维张量一定是行向量，列向量是一个二维矩阵；可以用矩阵来区分行向量和列向量

【Q5】张量的概念，机器学习和数学是一样的吗？区别大吗？
【A】机器学习的张量不是张量，其实是一个多维数组，跟数学的张量不一样

【Q6】

您可能感兴趣的与本文相关的镜像

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen

文本生成

Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化，内置完整运行环境与 Qwen3-32B 模型依赖，开箱即用。

标签

#深度学习 #学习 #笔记