2022.11.16|EMNLP 2022|中国科学技术大学 |原文链接|源码链接
UniRel: Unified Representation and Interaction for Joint Relational Triple Extraction
- 解决实体和关系异构表示问题
- 解决实体-实体交互和实体-关系交互异构建模问题
- 通过一个串联的自然语言序列联合编码统一实体和关系的表示,同时使用一个交互映射系统来统一交互

过去(如CasRel、PRGC)都在关注于捕捉实体的上下文信息,但是忽略了同样重要的关系语义。文中例子:由is_capital_of可以得出,主语应该是城市,宾语应该是国家。上图的这个三元组中,也可以从【longdon-is_capital_of】和【Uk-is_capital_of】得出Uk和london是相关的。
我认为作者想表达的意思是过去把实体和关系分开来看了,但是
实际上实体和关系本质上是有关联的,可以通过实体推断关系,通过关系推断实体,所以只捕捉实体的上下文是不够的。
由此文章提出统一表示和交互的UniRel模型来解决上述问题。
- 将
关系和实体都编码成序列来构造统一的表示,即联合编码 -
- 基于语义,首先将候选关系转换成文本,与输入句子构成一个连续的序列
-
- 使用BERT作为PLM预训练模型编码,并捕捉他们的信息相关性
- 通过Transformer的自注意力机制,在单个交互映射中对
实体-实体、实体-关系建模 - 基于WebNLG和NYT创建了一个
新的数据集
UniRel方法:
Problem Formulation
给出X,识别出T
- X = { x 1 , x 2 , … , x N } X=\{x_1,x_2,\dots,x_N\} X={ x1,x2,…,xN}:有n个符号的句子
- T = [ ( s l , r l , o l ) ] l = 1 L T=[(s_l,r_l,o_l)]_{l=1} ^{L} T=[(sl,rl,ol)]l=1L:在X句子中抽取出所有的三元组集合, L L L为三元组的个数
- E = { e 1 , e 2 , … , e k } E=\{e_1,e_2,\dots,e_k\} E={ e1,e2,…,ek

UniRel模型通过统一实体和关系的表示,以及使用交互映射解决实体-实体和实体-关系交互的建模问题。它利用BERT进行预训练,将关系转换为文本与输入句子结合,然后通过Transformer捕获相关信息。实验表明,这种方法在WebNLG数据集上的性能超过人类,并且强调了统一表示和交互对于提高关系抽取效率的重要性。

被折叠的 条评论
为什么被折叠?



