BERT vs GPT——编码器 vs 解码器

原创

于 2026-06-17 20:39:22 发布 · 226 阅读

·

6

·

标签

#AI #Transformer #BERT #GPT

BERT vs GPT——编码器 vs 解码器

上节课我们讲了Softmax，它负责把打分变成概率，是注意力机制的基石。有了概率，模型能做分类。但要真正理解语言、生成文本，还需要编码器和解码器这两个核心组件。BERT和GPT，正是把这两个组件分别放大后得到的模型。

一、从翻译说起：Transformer的初衷

Transformer诞生之初，是为了机器翻译问题。翻译这件事，天然需要两半：一半天干的是理解——读懂源语言的意思；另一半天干的是生成——用目标语言把它写出来。所以Transformer设计了编码器来理解，解码器来生成。

Transformer的翻译场景：编码器理解源语言，解码器生成目标语言

后来有人发现，如果把编码器单独拉长，堆叠很多层，就变成了BERT；如果把解码器单独拉长，就变成了GPT。这就是BERT和GPT最根本的由来——翻译的"理解"和"生成"两端，分别长成了两个参天大树。

这个理解方式很关键：BERT和GPT不是两种完全不同的模型，它们用的是同一套积木，只是搭法不同。理解了Transformer的编码器-解码器架构，就理解了BERT和GPT的根本区别。

二、BERT：双向理解的大师

BERT的全称是Bidirectional Encoder Representations from Transformers，核心就是双向编码器。它里面全是编码器层堆叠，每个词在计算时能看到整个句子里的所有其他词，不管是前面的还是后面的。

B

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小默说AI 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。