空间与图数据挖掘:轨迹分类与图匹配技术解析
1. 轨迹分类方法
轨迹分类问题假定有一个包含 N 条带标签轨迹的训练数据集,利用这些数据构建轨迹的训练模型,进而确定测试轨迹的未知类别标签。由于分类是聚类问题的有监督版本,轨迹分类方法与轨迹聚类方法类似,主要分为基于距离的方法和基于序列的方法。
1.1 基于距离的方法
- k - 最近邻方法 :确定给定测试实例的前 k 个最近邻,将占主导地位的类别标签报告为该测试实例的相关标签。在计算过程中,可以使用时间序列距离函数的多变量扩展,如多维 DTW。
- 基于图的方法 :在数据对象上构建 k - 最近邻图,这是一种半监督方法,因为图是在有标签和无标签对象的混合上构建的。每个节点对应一个轨迹,如果节点 j 是节点 i 的 k 个最近邻之一,或者反之,则在节点 i 和节点 j 之间添加一条无向边。目标是使用有标签的节点推断网络中无标签节点的标签,这种方法在同时有许多测试实例和训练实例时最为有效。
1.2 基于序列的方法
基于序列的方法步骤如下:
1. 使用空间或时空瓦片变换将 N 条轨迹转换为序列。
2. 使用序列分类方法确定序列的类别标签。
3. 将序列类别标签映射到轨迹类别标签。
空间瓦片变换和时空瓦片变换在将不同的空间和时间特征纳入分类过程方面具有不同的能力。使用空间瓦片变换时,分类对时间不敏感,可以根据形状对不同时期的轨迹进行建模;而使用时空瓦片变换时,分类只能对大致同一时间段的轨迹进行,分类模型不仅对轨迹的形状敏感,还
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



