统计学习方法—概率潜在语义分析

最新推荐文章于 2022-11-28 15:20:16 发布

原创

最新推荐文章于 2022-11-28 15:20:16 发布 · 536 阅读

收录于

当前文章被以下社区和专栏收录：

概率潜在语义分析(PLSI)是一种无监督学习方法，用于文本话题分析。它通过概率生成模型揭示单词-文本的潜在话题结构。在生成模型中，文本由话题决定，话题由单词决定，而共现模型则描述了单词和文本的对称关系。PLSI的学习通常借助EM算法来估计模型参数。

统计学习方法—概率潜在语义分析

概率潜在语义分析

概率潜在语义分析

概率潜在语义分析（probabilistic latent semantic analysis， PLSI），是一种利用概率生成模型对文本集合进行话题分析的无监督学习方法。模型的最大特点使用隐变量表示话题；整个模型表示文本生成话题，话题生成单词，从而得到单词-文本共现数据的过程；假设每个文本由一个话题分布决定，每个话题由一个单词分布决定。