点击下面卡片，关注我呀，每天给你送来AI技术干货！

论文：Dialogue Discourse-Aware Graph Model and Data Augmentation for Meeting

论文：冯夏冲、冯骁骋、秦兵、耿昕伟

作者：冯夏冲

链接：https://arxiv.org/abs/2012.03502 (arXiv preprint)

代码：https://github.com/xcfcode/DDAMS

出处：哈工大SCIR

摘要

会议参与者的动态交互性和大规模训练数据的缺乏使得会议摘要成为一项具有挑战性的任务。现有的工作一方面将会议视为顺序句子序列进行建模，忽略了句子之间丰富的交互结构；另一方面，训练数据的缺乏限制了摘要模型的性能。在本文中，我们提出引入对话篇章结构来缓解上述问题。首先，我们提出DDAMS会议摘要模型来显式地建模句子之间的交互关系，其核心模块图编码器可以有效地以图交互的方式建模会议句子和多种篇章结构关系。除此以外，我们还设计了一种可以从现有会议摘要数据集中构建伪摘要数据集的DDADA数据增强策略。通过DDADA构建的伪摘要数据集是原数据集大小的20倍，可以有效地用于预训练DDAMS会议摘要模型。实验结果显示我们的方法可以在AMI和ICSI两个会议摘要数据集上取得SOTA效果。

1. 简介

1.1 研究背景

会议摘要（Meeting Summarization）旨在从一段多人会议中提取关键信息，形成一段文字概述。由于新冠肺炎疫情的影响，人与人之间的交流频繁地采用在线会议形式，会议摘要可以有效地的帮助用户快速回顾会议内容，整理诸如任务、决策、问题等核心内容，是一项极具实用价值的任务，得到了Microsoft等公司的关注[1][2]。

1.2 研究动机

现有会议摘要工作存在以下两个问题：

1. 会议文本建模不充分。 由于会议参与者的动态交互性，会议句子之间天然地存在着丰富的交互结构，然而现有工作仅仅将会议句子视为顺序句子序列，忽略了这种丰富的交互结构，使得会议文本建模不够充分。

2. 大规模训练数据集缺乏。 基于神经网络的方法很大程度上依赖于训练数据的规模，然而，现有会议摘要数据集AMI和ICSI规模只有CNNDM数据集的千分之一，极大地限制了摘要模型的性能。

为了缓解上述两个问题，我们提出引入一种对话特定的结构信息：对话篇章结构，该结构指示了两个句子之间的语义关系，如图1所示

现有对话篇章结构一共包含16种关系类型：comment, clarification-question, elaboration, acknowledgment, continuation, explanation, conditional, QA, alternation, question-elaboration, result, background, narration, correction, parallel, contrast。

图1 对话篇章结构

对话篇章结构显式地指示了句子之间的交互关系和会议的信息流。引入该结构可以帮助模型更好地理解会议内容，从而生成更好的会议摘要，如图2所示。为了更好地建模会议文本与对话篇章结构信息，我们提出了会议摘要模型DDAMS。

图2 会议-摘要对示例

进一步，我们发现，在一段会议中，一个“问题”往往会引发一段“讨论”，这段“讨论”往往围绕“问题”展开。如图2所示，问题句包含了关键词语“battery charger”，讨论中的“design”和“cost”均围绕该词语展开。因此我们认为“问题”包含了关键的词语和信息，可以被视为“讨论”的“伪摘要”。基于该假设，我们设计了一种数据增强策略DDADA，从原始数据集中构建伪摘要数据集用于预训练会议摘要模型DDAMS。

1.3 任务定义

给定会议，会议摘要旨在生成摘要，其中会议包括了个句子，摘要包括了个词语。第个句子为，代表第个句子的第个词语。每一个句子都对应一个说话人，是说话人集合。

2. Dialogue Discourse-Aware Meeting Summarizer (DDAMS)

2.1 整体框架

我们的摘要模型DDAMS包括了四个部分：（1）会议图构建；（2）节点表示；（3）图编码器；（4）解码器。整体如图3所示。

图3 摘要模型DDAMS

2.2 会议图构建

会议图（Meeting Graph）构建包括以下几个步骤：

使用对话篇章结构解析器获得对话篇章结构关系；
Levi图转换，将边关系转换为节点，并添加正向与反向边；
添加全局节点、全局边和自连接边；
添加反向边（Reverse Edges）。

图4 会议图构建流程

2.3 节点表示

关系节点：从一个可学习的关系编码矩阵中初始化。
全局节点：初始化为0向量。
句子节点：利用双向LSTM进行初始化。

2.4 图编码器

在得到每一个节点的初始表示之后，我们使用Relational Graph Convolutional Networks [3] 更新节点表示，该网络可以充分考虑不同类型的边，从而学习到更加有效的表示：

由于不同的对话篇章结构关系有着不同程度的重要性，因此我们引入门控机制 [4] 来控制信息：

最终得到引入门控机制的图网络更新方式为：

2.5 解码器

解码器我们采用引入copy机制的解码器，并同时考虑词语级别注意力机制和句子级别的注意力机制。

3. Dialogue Discourse-Aware Data Augmentation (DDADA)

3.1 伪摘要数据集构建

图5 伪摘要数据集构造示例

给定一段会议文本及其对话篇章结构，我们发现一个“问题”往往引发一段针对这个问题的“讨论”。如图5所示，A提问“What’s the standard colour?”，其他人开始围绕颜色这个主题进行讨论。我们认为“问题”一定程度可以包含关键的信息和短语，因此本文将“问题”视为伪造的摘要，“讨论”视为伪造的会议，从原始训练数据集中构建伪摘要数据集，数据统计如表1所示。

表1 伪摘要数据集统计

3.2 预训练会议摘要模型

在得到伪摘要数据集之后，我们使用该数据集预训练我们的会议摘要模型DDAMS。一方面，通过我们的数据增强方法DDADA，我们可以隐式地增广数据；另一方面，我们从原始训练集中进行增广，可以保证增广数据和训练数据领域一致，因此可以给模型提供一个热启动参数。

4. 实验

4.1 数据集

AMI：产品设计领域会议摘要数据集，数据集划分Train/Valid/Test: 97/20/20
ICSI：学术讨论领域会议摘要数据集，数据集划分Train/Valid/Test: 53/25/6

数据集统计如表2。

表2 AMI和ICSI数据集统计

4.2 主实验

表3 主实验结果

表3为主实验结果：

引入对话篇章结构，我们的模型DDAMS可以有效地超过诸多基线模型。
结合数据增强方法DDADA，我们的模型可以取得世界最优的效果。
直接使用伪摘要数据预训练好的模型在测试集上进行测试，也可以取得一定的效果，说明了我们伪摘要数据集构建的合理性。

4.3 分析实验

图6 在测试阶段，引入对话篇章结构关系的数量与平均ROUGE值的对应关系

在测试阶段，我们按照一定的比例随机提供对话篇章结构关系。如图6所示，引入的对话篇章结构信息越多，模型的ROUGE得分越高，显示了引入对话篇章结构的有效性。

图7 在测试阶段，对话篇章结构关系的质量与平均ROUGE值的对应关系

在测试阶段，我们引入不同质量的对话篇章解析器得到的对话篇章结构信息。如图7所示，对话篇章解析器的质量越好，对话篇章结构关系质量越高，模型的的ROUGE得分越高。

图8 在测试阶段，提供不同类型的对话篇章结构关系与平均ROUGE值的对应关系

在测试阶段，我们单独提供一种特定类型的对话篇章结构关系。如图8所示，在AMI数据集上，Conditional 和Background两类关系比较重要。在ICSI数据集上，Result关系比较重要。

表4 基于会议图（Meeting Graph）和Levi图的实验结果

基于我们构建的会议图和Levi图分别进行实验（区别在于Levi图没有反向边），我们发现我们的会议图可以取得更好的效果。

4.4 样例分析

图9 生成样例

图9展示了我们模型生成的会议摘要，可以发现，通过引入对话篇章结构关系，句子1和句子3成为中心句，从而定位了更加关键的内容，最终生成与标准摘要更加相近的摘要。

5. 结论

在这篇文章中，我们的贡献如下：

我们首次将对话篇章结构应用于会议摘要任务，并设计了一种会议摘要模型DDAMS有效地建模句子之间的交互关系。
我们设计了一种数据增强策略DDADA可以成功缓解训练数据不充足的问题。
我们的方法DDAMS+DDADA在两个会议摘要数据集上取得了世界最优的效果。

参考文献

[1] Zhu C, Xu R, Zeng M, et al. A Hierarchical Network for Abstractive Meeting Summarization with Cross-Domain Pretraining. Findings of EMNLP 2020.

[2] Zhong M, Yin D, Yu T, et al. QMSum: A New Benchmark for Query-based Multi-domain Meeting Summarization. arXiv preprint arXiv:2104.05938, 2021.

[3] Schlichtkrull M, Kipf T N, Bloem P, et al. Modeling relational data with graph convolutional networks. European semantic web conference 2018.

[4] Marcheggiani D, Titov I. Encoding Sentences with Graph Convolutional Networks for Semantic Role Labeling. EMNLP 2017.

本期责任编辑：刘　铭

本期编辑：彭　湃

说个正事哈

由于微信平台算法改版，公号内容将不再以时间排序展示，如果大家想第一时间看到我们的推送，强烈建议星标我们和给我们多点点【在看】。星标具体步骤为：

（1）点击页面最上方“深度学习自然语言处理”，进入公众号主页。

（2）点击右上角的小点点，在弹出页面点击“设为星标”，就可以啦。

感谢支持，比心。

投稿或交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

点击上面卡片，关注我呀，每天推送AI技术干货~

整理不易，还望给个在看！

IJCAI 2021 | 会议摘要有难度？快来引入对话篇章结构信息相关推荐

2021年的EI会议论文发表难度评价
目前关于EI的国内的国外的会议非常多,其中肯定也有好的,也有差的,权威性肯定不一样.这些会议的官方网站也都做的有模有样,很难去评定会议的权威性,对于想要论文投稿的朋友,造成了很多困扰,而且会议论文录用 ...
周志华教授公布IJCAI 2021投稿量：4204篇，相比去年下降10%！
作者 | 陈大鑫近日,作为IJCAI 2021大会的程序主席,南京大学人工智能学院院长周志华教授在朋友圈和微博上公布了本届大会(第30届国际人工智能联合大会)的论文投稿情况: 摘要提交 5534篇 ...
从会议、医患沟通和客服对话三大场景看对话文本摘要技术
©PaperWeekly 原创 ·作者 | 海晨威研究方向 | 自然语言处理文本摘要是 NLP 领域一个重要的任务,它以凝练的语句去描述原始文本中的主要信息.文本的形式是多种多样的,其中,对话文本 ...
IJCAI 2021：周志华任大会首个华人程序主席，南大校友获AIJ杰出论文奖
来源:新智元 [导读]近日,IJCAI 2021在线上开幕,IJCAI史上首位华人程序主席南大周志华教授分析本届大会论文接收情况:中国投稿量最多,最热门的前四个领域论文接收率占56%,此外还总结了通过 ...
本周AI热点回顾：无人车的眼睛、UP主的生产力工具，都藏在百度CVPR的这十个冠军里；IJCAI 2021心电全景图及其生成网络...
‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍点击左上方蓝字关注我们 01 无人车的眼睛.UP主的生产力工具,都藏在百度CVPR的这十个冠军里啤酒.烧烤.欧洲杯是很多球迷今年夏天的消暑利器.但你可能想不到的是 ...
晒晒紫光云与智能事业群2021“成绩单”，怎一个“快”字了得
关注云报洞察深一度岁末年初,全球很多使用汉字的国家和地区都会进行一年一度的"年度汉字评选".当地民众会根据一年内发生的国内国际热点事件,选定一个汉字反映全年焦点.因汉字言简意赅 ...
IJCAI 2021 | 医学AI新坑：心电全景图及其生成网络
视学算法专栏转载:机器之心作者:j.t.chen 来自浙大睿医人工智能研究中心的研究者提出了一个全新的概念:心电全景图,并提出了一个能够通过少数几个导联的 ECG 信号输入来生成心电全景图的神经网 ...
IJCAI 2021 | 中科院计算所：自监督增强的知识蒸馏方法
知识蒸馏作为模型压缩里的一项重要技术,在学术界和工业界都得到了广泛的研究. 近日,AI Drive 邀请中科院计算所在读博士生杨传广,分享其在 IJCAI 2021 上发表的最新工作:自监督增强的知识 ...
IJCAI 2021 | 腾讯和复旦联合出品：Adv-Makeup人脸黑盒攻击对抗算法
分享一篇来自 IJCAI 2021 的论文:Adv-Makeup: A New Imperceptible and Transferable Attack on Face Recognition,由腾 ...

IJCAI 2021 | 会议摘要有难度？快来引入对话篇章结构信息

摘要