Target-adaptive Graph Target-adaptive Graph for Cross-target Stance Detection论文阅读笔记

Target-adaptive Graph Target-adaptive Graph for Cross-target Stance Detection

1 原文作者

Bin Liang (Harbin Institute of Technology Shenzhen)

Yonghao Fu (Harbin Institute of Technology Shenzhen)

Lin Gui (University ofWarwick Coventry)

Min Yang (Chinese Academy of Sciences Shenzhen)

Jiachen Du (Harbin Institute of Technology Shenzhen)

Yulan He (University ofWarwick Coventry)

Ruifeng Xu (Harbin Institute of Technology Peng Cheng Lab Shenzhen)

2 论文来源

Proceedings of the 30th International Conferences on World Wide Web (WWW 2021)

3 论文地址

https://dl.acm.org/doi/pdf/10.1145/3442381.3449790

4 论文简介

由于文本中表达的立场往往取决于立场目标,因此目标在评论级的立场检测中发挥着重要作用。在实践中,我们需要处理标注的训练数据中不可见的目标。因此,对未知或不可见目标的立场检测(跨目标)是一个重要的研究问题。跨目标立场检测是指给定领域相关的 2 个目标,一个为源目标,一个为预测目标,从源目标所在数据集学习一组特定领域的知识,然后利用学到的知识判断另一个预测目标所在数据集的立场。跨目标立场检测多利用迁移学习思想,解决相同领域内出现新目标的立场检测问题。

本文提出了一种新的方法,该方法可以自动识别和适应一个词在立场表达式中对特定目标所起的依赖和独立作用,从而实现跨目标立场检测。更具体地说,本文探索了一种新的解决方案,为每个句子构建针对给定目标的异构目标自适应语用依赖图(TPDG)。构建目标内图,生成不同目标下的语用依存关系。此外,还构建了另一个跨目标图,以开发单词在所有目标上的通用性,从而促进对未知目标可用的显性词汇级立场表达的学习。本文还提出了一种基于交互式图形卷积网络(GCN)块的图形感知模型,推导出用于立场检测的目标自适应图形表示。在多个基准数据集上的实验结果表明,该模型在跨目标立场检测方面的性能优于目前最先进的方法。

5 解决问题

如下图例一所示,注意到与“equality”一词有关的立场表达对两个目标来说是相反的。这就意味着,直接使用与源目标相关的立场信息来学习目的地目标的立场表征可能产生错误的结果。其主要原因是同一个词的表达在与不同的目标相关联时,可能会发出不同的立场信号。因此,理解词汇层面的语用信息并将其应用于不同的目标,可以提高跨目标立场检测的性能。在这里,我们将固有立场与目标有关的词(如“equality”)视为目标内词。此外,在例二中,无论所关联的目标是什么,表示相同立场的颜色的单词都被视为与目标无关的立场表达式。这些参数可以有效地提高对未知目标的立场检测性能。相应地,我们把这些词视为跨目标词。我们认为,立场检测的主要挑战是识别这两种类型的单词(目标内和跨目标),并基于不同的单词类型进行建模,用于目标立场检测的上下文特征。具体来说,我们基于以下假设来进行实验:

  1. 对于仅出现在特定目标的立场表达中且始终表达同一立场的词汇,根据其关联目标对这些词汇进行建模和改编以获得语用信息,可以促进立场表征的学习。
  2. 如果词的出现均匀分布在不同的目标上,那么这些词形成的语用依赖关系应该是与目标无关的,它们将有助于生成包括未知目标在内的任何目标的立场表示。

6 本文贡献

    本文主要贡献及创新点在于:

1.本文是第一个利用基于目标内和跨目标异构图的上下文的目标自适应语用依赖性来研究跨目标立场检测的人。

2.本文提出了一种具有交互式GCN块的图形感知模型来学习上下文的图表示,该模型允许学习更精确的未知目标立场表示。

7 论文方法

本文阔目标立场检测模型主要分为四个部分:
1、向量表征:通过双向LSTM层输出结合上下文的词语表示;
2、异质图构造:构造目标内图和跨目标图;
3、交互式GCN块:提取目标相关和目标无关上下文的图表征;
4、立场表征:获取立场检测的关键信息并输出最终表征。
首先用Glove(Global Vectors for Word Representation)对包含n个词的句子进行词嵌入,得到每句话的词向量,而后通过双向LSTM,得到结合了上下文的句向量表征。
而后使用spaCy工具包生成输入句子的依存树,如下图,一个句子的中心词通常是动词(Verb),所有其他词要么依赖于中心词,要么通过依赖路径与它关联。然后根据根据单词在语料库的词频计算每个单词的语用权重,分为目标内计算与跨目标计算这两种计算方式。并通过依存树与语用权重得到目标内图与跨目标图
而后将通过交互式GCN块提取目标内图与跨目标图的信息,最后,结合图表征与句向量得到立场表针。
8 实验结果
实验准备:
数据集:
对于SEM16单目标立场检测数据集,归类为两个领域:女性权利与美国政策。并构造成多个跨目标数据集,例如:FM->LA。
WT-WT为跨目标立场检测数据集。
跨目标立场检测:
评估指标:F1-score、F1avg
实验结果:作者对比了BiLSTM、BERT等基准模型和TAN、SEKT等深度模型,以F1-score、F1avg数值作为度量标准。结果显示作者提出的方法在多个跨目标检测任务中效果最佳,并远超效果第二好的模型。

消融实验:
评估指标:F1-score
实验结果:
作者发现删除“跨目标图”或“目标内图”会显著降低性能,这表明目标内和跨目标的立场信息在检测未知目标的立场时都很重要。
9 个人收获
1)   数据集较多,实验丰富,实验结果有一定说服力;
2)   本文为将短文本向图的转换提供了方法和思路。
10 代码和数据集地址
Github链接:https://github.com/HLT-HITSZ/TPDG