word2vec (一) 简介与训练过程概要

最新推荐文章于 2024-04-18 11:45:11 发布

原创

最新推荐文章于 2024-04-18 11:45:11 发布 · 1.5w 阅读

·

6

·

标签

#算法

本文介绍了word2vec的背景及词的向量化方法，包括one-hot表示和Distributed表示，强调了词向量在语义相似性上的优势。接着概述了概率语言模型和word2vec的训练过程，包括CBOW和Skip-gram模型，以及Hierarchical Softmax和Negative Sampling等优化策略。word2vec通过神经网络训练词向量，为NLP任务提供了有效的数学表示。

因为在组里分享会要讲word2vec，重新整理了之前凌乱的笔记，结果发现有不少新的收获，真是所谓的温故而知新！

词的向量化与word2vec简介

word2vec最初是Tomas Mikolov发表的一篇文章[1]，同时开源了相应的代码，作用是将所有词语投影到 $K$ 维的向量空间，每个词语都可以用一个 $K$ 维向量表示。

为什么要将词用向量来表示呢？这样可以给词语一个数学上的表示，使之可以适用于某些算法或数学模型。通常将词语表示成向量有如下两种方法。

一、one-hot 表示法

假如语料库里一共有 $N$ 个词，one-hot表示即是为每个词分配一个唯一的索引，并且将每个词表示为 $N$ 维的向量，在该词索引对应的维度值为1，其余维度均为0。如一共有三个词：今天、天气、真好，那么三个词的词向量分别可以是 $[1,0,0],[0,1,0],[0,0,1]$ 。这种简单的表示方法已经可以解决相当一部分NLP的问题，不过仍然存在不足，即词向量与词向量之间都是相互独立的，我们无法通过这种词向量得知两个词在语义上是否相似，并且如果N

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。