基于本体的数据摘要与特征选择在推荐系统中的应用
在数据处理和推荐系统领域,特征选择是一项关键任务,它能够提升模型的预测性能、降低过拟合风险。本文将介绍基于本体的数据摘要方法 ABSTAT,以及不同的特征选择技术,并通过实验评估它们在不同领域数据集上的表现。
1. ABSTAT 概述
ABSTAT 以链接数据集和(可选的)一个或多个本体作为输入,输出包含类型图、模式集合、模式频率以及局部和全局基数描述符的摘要。
例如,对于属性 dbo:cinematography ,其全局基数描述符为 minS = 1 , maxS = 249 , avgS = 5 , minO = 1 , maxO = 13 , avgO = 1 ;而对于模式 <dbo:Film, dbo:cinematography, dbo:Person> ,局部基数描述符为 minS = 1 , maxS = 249 , avgS = 14 , minO = 1 , maxO = 7 , avgO = 1 。
2. 语义感知特征选择
特征选择旨在从数据集中挑选相关属性子集,去除无关或冗余属性,以提高模型准确性和效率。常见的特征选择方法有以下三种:
超级会员免费看
订阅专栏 解锁全文
121

被折叠的 条评论
为什么被折叠?



