[实体关系抽取|顶刊论文]UniRel:Unified Representation and Interaction for Joint Relational Triple Extraction

UniRel模型通过统一实体和关系的表示,以及使用交互映射解决实体-实体和实体-关系交互的建模问题。它利用BERT进行预训练,将关系转换为文本与输入句子结合,然后通过Transformer捕获相关信息。实验表明,这种方法在WebNLG数据集上的性能超过人类,并且强调了统一表示和交互对于提高关系抽取效率的重要性。

2022.11.16|EMNLP 2022|中国科学技术大学 |原文链接源码链接

UniRel: Unified Representation and Interaction for Joint Relational Triple Extraction

  • 解决实体和关系异构表示问题
  • 解决实体-实体交互和实体-关系交互异构建模问题
  • 通过一个串联的自然语言序列联合编码统一实体和关系的表示,同时使用一个交互映射系统来统一交互

    过去(如CasRel、PRGC)都在关注于捕捉实体的上下文信息,但是忽略了同样重要的关系语义。文中例子:由is_capital_of可以得出,主语应该是城市,宾语应该是国家。上图的这个三元组中,也可以从【longdon-is_capital_of】和【Uk-is_capital_of】得出Uk和london是相关的。

我认为作者想表达的意思是过去把实体和关系分开来看了,但是实际上实体和关系本质上是有关联的,可以通过实体推断关系,通过关系推断实体,所以只捕捉实体的上下文是不够的


由此文章提出统一表示和交互的UniRel模型来解决上述问题。

  • 关系和实体都编码成序列来构造统一的表示,即联合编码
    • 基于语义,首先将候选关系转换成文本,与输入句子构成一个连续的序列
    • 使用BERT作为PLM预训练模型编码,并捕捉他们的信息相关性
  • 通过Transformer的自注意力机制,在单个交互映射中对实体-实体实体-关系建模
  • 基于WebNLG和NYT创建了一个新的数据集

UniRel方法:

Problem Formulation

给出X,识别出T

  • X = { x 1 , x 2 , … , x N } X=\{x_1,x_2,\dots,x_N\} X={ x1,x2,,xN}:有n个符号的句子
  • T = [ ( s l , r l , o l ) ] l = 1 L T=[(s_l,r_l,o_l)]_{l=1} ^{L} T=[(sl,rl,ol)]l=1L:在X句子中抽取出所有的三元组集合, L L L为三元组的个数
  • E = { e 1 , e 2 , … , e k } E=\{e_1,e_2,\dots,e_k\} E={ e1,e2,,ek
评论 24
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值