[课程学习] 图学习中的拓扑不均衡问题初探

【笔记】图学习中的拓扑不均衡问题初探

来源:techbeat
主讲人:孙庆赟
talk链接:https://www.techbeat.net/talk-info?id=775

背景

样本数量不均衡

样本数量不均衡造成决策偏移。
现有方法:

  1. 数据重采样(re-sample):数据增强
  2. 算法权重重置(re-weighting):赋予不同权重

拓扑不均衡

图数据上特有的样本不均衡问题。往往导致信息传播不重复,学习到的节点表征较差。

图拓扑结构的影响

图神经网络中按照拓扑结构进行信息传递,节点之间的相互影响。

位置信息感知

解决位置不均衡问题

图神经网络的现象

  1. 欠可达现象:远离标记节点的节点获得的信息少。-> 可达系数:无标记节点到对应类的标记节点的平均最短路径长度,代表聚合过程所需的最小层数。
  2. 过压缩现象:有效信息与无用信息共同传播,并在传播过程中压缩。-> 压缩系数:无标记节点到对应类的标记节点的最短路径长度平均里奇曲率,代表三角形和环状结构的量,这两种结构有助于模型学习。

可达系数与压缩系数

  1. 可达系数:无标记节点到对应类的标记节点的平均最短路径长度,代表聚合过程所需的最小层数。
  2. 压缩系数:无标记节点到对应类的标记节点的最短路径长度平均里奇曲率,代表三角形和环状结构的量,这两种结构有助于模型学习。

位置编码

  1. 度量距离:
    (1)到全部c个类别的可达系数,构成c维向量,乘以学习矩阵,最后原始邻接矩阵、与feature相关的邻接矩阵嵌合。
    (2)与feature相关的邻接矩阵
  2. 度量质量:GRP->度量每个类别对节点的影响程度,GPR距离为两个节点之间的冲突值,冲突小则相似。

层次编码

不同空间的嵌入能力:

  1. tree-like:双曲空间
  2. 网格:平面
  3. 环状:球
    利用双曲几何空间映射,解决层次不均衡问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值