BERT学习笔记03(源码解析)

文章介绍了二分类任务在下一个句子预测中的应用。通过将字符转化为数字索引,选择部分进行mask操作,然后经过多个embedding层和encoder处理,得到每个token的embedding。CLS符号的embedding用于二分类任务,而被mask的位置则通过Linear层和softmax预测可能的词汇,计算损失。

 

二分类任务用于下一个句子预测

 最下面原始标签1 7 13 6 对应的是字符代表的索引,就是字符转化为数字后是哪些数字。1就是CLS符号。然后要选择15%的去mask,例子中选择13,而且是把它真正mask掉,变成4,也就是mask这个符号对应的索引。然后分别经过3个embedding(每个embedding对应768个维度),对应位置相加,得到真正的input embedding,也是768个维度,然后经过encoder层,最后得到每个token的最终embedding,也是768个维度。

然后把第一个字符CLS对应的768个维度接Linear层,去做二分类任务。而被mask的位置,也就是索引变成4的位置的输出的768个维度也接Linear层,在词表大小的范围内做softmax,挑选最有可能的词汇,然后去做损失,

 

emm后面代码太多了,我直接在文件里注释了,这里就不写了

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值