- 你的Word2Vec应用中用的是Skip-gram还是CBOW?
- 请推导逻辑回归的损失函数?
- L1与L2的区别是什么?
- 什么是Negative Sampling?
[面试题]机器学习算法工程师面试题
最新推荐文章于 2026-04-13 17:04:04 发布
本文探讨了Word2Vec模型中的两种主要架构——Skip-gram与CBOW,并介绍了逻辑回归损失函数的推导过程。此外,还对比了L1与L2正则化的区别,解释了Negative Sampling在训练大规模数据集时的作用。
6661

被折叠的 条评论
为什么被折叠?



