第02篇:深度学习核心概念——从感知机到LLM的“中间件“

前置知识:第01篇数学基础 / 基础的 Python 编程经验


引言:为什么叫"中间件"?

第01篇我们聊了数学"最小够用集"。现在要往前进一层——把数学和代码之间的桥梁搭起来。

神经网络的每个组件——激活函数、归一化层、损失函数——在代码里就像是"中间件":它们接受前一层的数据,加工处理,再传递给下一层。你不需要每次自己写它们(PyTorch 都封装好了),但如果你不理解它们各自在干什么,模型训练出问题时你根本不知道从哪里下手。

这一篇,我们就来拆解这些"中间件":它们长什么样、为什么这么设计、换一个会怎样


一、前向传播与反向传播:神经网络的"呼吸"

1.1 从感知机说起

感知机(Perceptron)是最简单的神经网络单元:

y = step ( w ⋅ x + b ) y = \text{step}(w \cdot x + b)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值