第02篇：深度学习核心概念——从感知机到LLM的“中间件“

原创于 2026-07-01 14:17:13 发布 · 14 阅读

·

0

·

大模型工程师修炼手记专栏收录该内容

10 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

前置知识：第01篇数学基础 / 基础的 Python 编程经验

引言：为什么叫"中间件"？

第01篇我们聊了数学"最小够用集"。现在要往前进一层——把数学和代码之间的桥梁搭起来。

神经网络的每个组件——激活函数、归一化层、损失函数——在代码里就像是"中间件"：它们接受前一层的数据，加工处理，再传递给下一层。你不需要每次自己写它们（PyTorch 都封装好了），但如果你不理解它们各自在干什么，模型训练出问题时你根本不知道从哪里下手。

这一篇，我们就来拆解这些"中间件"：它们长什么样、为什么这么设计、换一个会怎样。

一、前向传播与反向传播：神经网络的"呼吸"

1.1 从感知机说起

感知机（Perceptron）是最简单的神经网络单元：

$\text{step}(w \cdot x + b)$

标签

#深度学习 #人工智能

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。