AI评论生成,如何既相关又多样?

筛选评论

Learning comment generation by leveraging user-generated data, ICASSP 2019

当前开放域的评论生成常常产生重复且无趣的回复。作者认为原因是直接使用真实用户评论会带入大量的噪音,比如同一篇文章会有多个、且可能相互矛盾的评论,并且由于检索方法会比较刻板,最终导致生成的结果问题。因此文章提出了结合检索和生成的方法,利用已有用户评论和检索出相关评论,训练一个打分器scorer(怎么训练呢?)。然后利用这些评论和文章,作为copy机制生成模型的训练数据。

上文提到了打分器,这里有三个:

  • relevance scorer:这里相关性是通过计算标题和评论的bag-of-word向量的点积,只不过向量的每个词语是带TF-IDF的权重。
  • upvote scorer:半监督的方法,主要是预测这些文章的评论没有任何赞。训练数据来源于文章中有评论的文章,并且评论至少10个赞做为正样本,其余负样本。模型如上,文章和评论通过BiLSTM之后,通过attention获得两者的context向量u

u = ∑ i = 1 n exp ⁡ ( e i ) ∑ k = 1 n exp ⁡ ( e k ) h i a e i = ( h i a ) T W a h m c \begin{array}{c}u=\sum_{i=1}^{n} \frac{\exp \left(e_{i}\right)}{\sum_{k=1}^{n} \exp \left(e_{k}\right)} h_{i}^{a} \\ e_{i}=\left(h_{i}^{a}\right)^{T} \mathbf{W}_{a} h_{m}^{c}\end{array} u=i=1nk=1nexp(ek)exp(ei)hiaei=(hia)TWahmc

  • ensemble:集成上面俩,可以看到图中的α是一个超参,通过它平衡两者之间的权重,从而得到最终的得分。relevance是评估相关性,避免千篇一律,而upvote也是为了生成更好容易获赞的评论。

道理是这样,两个relevance和upvote也是文章的点,但是实际过程中,好评论不一定会获得很多点赞,因为点赞的基础是该作品有大量的人看到,而大多数长尾可能没有,或者冷启动阶段多数文章没有。所以大概率正样本都是热门的文章,因此对于冷门文章可能是欠拟合。

所以正样本和负样本选择还是有待考究。

而生成模型,用到的是CopyNet机制,通过设置超参控制生成和拷贝的概率叠加。

DeepCom

Read, Attend and Comment: A Deep Architecture for Automatic News Comment Generation, 2019

https://cloud.tencent.com/developer/news/454058

借鉴人的阅读思想,先读文章,然后选择自己的关注点,再进行评论。因此文章提出了reading network和generation network。

  • reading network:负责理解文章,提取重要的观点信息。
  • generation network:通过关注标题和reading网络获取的观点信息,来生成回复。

两个网络通过端到到的方式训练,目标是最大化真实目标的变分下界(variational lower bound)。

reading network:representation层分别对body和title做表征学习(title的token表征经过一个GRU获得隐变量表征,body通过attention加权和),然后fusion层对body和title做融合,然后prediction层是预测多个(开始,结束)对,每个对代表一段span。这样的话,不同的span就可以代表不同的要点。

Generation Network:输入HT和HS(要点span),然后按词解码输出评论

这篇文章挺复杂的。。。并且作者实验,没有reading网络效果下降最多,这一跨也是最复杂的。。。

TPGN

Generating Pertinent and Diversified Comments with Topic-aware Pointer-Generator Networks

相关性和多样性是评论生成的两个要点,本文提出了一种Topic-aware Pointer-Generator Networks (TPGN),通过提取文章中的topic,来知道生成相关和多样的评论。在encoder中引入keyword和topic级别的attention机制来获取文章中的topic信息,然后生成过程中在融合topic信息来知道评论的生成。

Keyword-level encoder attention:文章使用TextRank抽取关键词片段,然后放入BiLSTM后的final state作为keyword的表征h_n,然后h_n通过使用attention机制获取文章中词语加权获得最终的contex表征。

Topic-level encoder attention: 文章使用LDA主题模型和Gibbs采样从数据中训练topic向量表征,然后抽取主题的top n词语作为主题词,然后计算每个topic词语的向量表征。其中Cwz是该词w在topic z中出现的次数。
p ( z ∣ w ) ∝ C w z ∑ z ′ C w z ′ p(z \mid w) \propto \frac{C_{w z}}{\sum_{z^{\prime}} C_{w z^{\prime}}} p(zw)zCwzCwz

Pointer机制和之前提出的模型很像,也不是本文重点,就不介绍了。

Reader-Aware Topic Modeling

Generating Diversified Comments via Reader-Aware Topic Modeling and Saliency Detection, 2021, AAAI 2021

评论生成不仅要关注文章中的重点和有趣的信息,并且多样性也很重要,之前的一些论文关注文章中的重要信息,忽略了评估中的读者理解因素。因此论文提出一个读者理解的话题和关键信息检测的统一框架。

reader-aware topic modeling:从评论中获取读者的topic,提出variational generative clustering algorithm,从训练集中的评论语料获取K个读者的topic标注向量。

reader-aware saliency information detection:提出Bernoulli distribution estimating。预估文章中的每个词语是否重要,用于指导下游生成,模型即转化为一个序列任务,预估每个词语是否重要。

两个模块通过端到端方式集合生成任务一起训练。

利用用户知识

Automatic Generation of Personalized Comment Based on User Profile ACL 2019

社交媒体中的用户评论非常多样,不同的用户有不同表达风格,因此论文重要集中于如何利用用户信息来做社交中的评论生成。提出PCGN模型,将用户特征通过gated memory 编码,并且加入用户描述(可能是个性签名之类)。

模型如下图,主要关注用户编码部分:

  • 用户个性签名:通过BiLSTM编码,Attentive其实就是attention机制,加权求和后获得contexD向量。
  • 数值特征:embedding编码后,通过gated memory机制针对生成不同步产生动态的用户表征,gate的计算是 g t u = s i g m o i d ( W g u s t ) g_t^u=sigmoid(W^u_g s_t) gtu=sigmoid(Wgust)。(讲真,fixed也不是不可)

利用外部知识图谱来生成:

modeling global and local node contexts for text generation from knowledge graph TACL, 2020

这篇主要是结合外部知识来生成,不止是评论生成,只是评论生成是,针对某些明星的评论,可能需要结合外部知识,例如明星的领域、代表作等,可以做参考。

【评论生成】AI生成评论,如何既相关又多样?相关推荐

  1. 《Science》杂志:机器学习究竟将如何影响人类未来的工作? 2018-01-11 Smiletalker AI科技评论 AI 科技评论按:人工智能、机器学习相关技术已经多次刷新了人们对于「计算机能

    <Science>杂志:机器学习究竟将如何影响人类未来的工作? 2018-01-11SmiletalkerAI科技评论 AI 科技评论按:人工智能.机器学习相关技术已经多次刷新了人们对于「 ...

  2. 领英1000多个假账户被曝光,用AI生成假脸冒充真人发推销信息,已形成相关产业链...

    明敏 发自 凹非寺 量子位 | 公众号 QbitAI Deepfake假头像又又又来了. 这一次扎堆"轰炸"的平台,换成了领英. 下面这个小姐姐,是不是乍看之下感觉普普通通,还很有 ...

  3. 评论对软件品牌很重要:有效地生成和管理评论

    评论已成为几乎所有产品类别购买过程中的重要组成部分. 客户评论数据告诉我们,92% 的消费者使用在线评论来指导他们的大部分普通购买决策,软件也不例外.B2B 买家在做出购买决定之前会进行大量研究. 为 ...

  4. Nat. Biotech.|药物设计的AI生成模型

    今天介绍2020年1月30日发表在Nature Biotechnology上的评论,作者为Relay Therapeutics公司的Walters和Murcko,该论文评价了当前几种基于AI的药物生成 ...

  5. 谷歌大脑科学家亲解 LSTM:一个关于“遗忘”与“记忆”的故事 本文作者:奕欣 2017-01-14 09:46 导语:AI科技评论保证这是相对通俗易懂的一篇入门介绍了,看不懂的话欢迎关注「AI 科技

    谷歌大脑科学家亲解 LSTM:一个关于"遗忘"与"记忆"的故事 本文作者:奕欣 2017-01-14 09:46 导语:AI科技评论保证这是相对通俗易懂的一篇入 ...

  6. 【机器人】标记不友好评论,AI工作效果是人类的4.4倍

    云栖号资讯:[点击查看更多行业资讯] 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 不友好的评论对于系统而言是一个大问题,因为他们的语气会影响被评论者和未来读者对 Stack Ove ...

  7. 我傻眼了:一个完全由 AI 生成的播客,采访了乔布斯

    作者 | 黄楠.施方圆 编辑 | 陈彩娴 最近大火的生成式 AI 又有新动作了! 在 podcast.ai 推出的第一集播客节目里,已故的乔布斯竟然"死而复生"成为首位嘉宾,与美国 ...

  8. 怎么AI生成绘画图片?试试这几款软件吧

    这几天我看到网上其他人用AI绘图的作品都非常好看,也很想试一试.于是就开始研究相关软件和工具,尝试着用AI来制作自己的绘图作品.虽然一开始遇到了不少困难,但是通过不断地尝试和学习,我将找到了一些AI绘 ...

  9. 花旗报告揭秘2016全球FinTech变革全景、“AI如何落地”公开课分享 | AI金融评论周刊...

    花旗报告:2016 全球 FinTech 变革全景揭秘,及 2017 年前景展望 雷锋网(公众号:雷锋网)此前报道,今年 1 月,花旗研究团队再次聚焦FinTech金融科技,并发布更新版调研报告< ...

最新文章

  1. python取百位数个位数_使用Python把数值形式的金额变成人类可读形式
  2. java 强弱软虚_Java的四种引用,强弱软虚,用到的场景
  3. 经典SQL语句大全(技巧篇)
  4. 三层架构下,优酷视频搜索测试体系很复杂吗?
  5. android测试测试什么,1,web测试,Android测试,Ios测试的共同点与
  6. 第三季-第21课-多线程同步
  7. GD32F103替换STM32F103
  8. 2022年“研究生科研素养提升”系列公益讲座在线测评
  9. 益聚星荣:海底捞要关300家店,火锅还有救吗?
  10. SCCM推送升级Win10
  11. arduino控制串口屏
  12. 官方发布!PMP证书正式纳入【北京市工作居住证】办理范围!
  13. linux 查找目录或文件 (详解)
  14. 在职场中如何和同事处好关系是门艺术活
  15. Linux系统中sda是什么意思?
  16. 成功解决:XXX不在 sudoers 文件中,此事将被报告
  17. 大型门户网站的十四大技术
  18. NTP服务端和客户端的部署——Chrony
  19. 小学语文哪课适合用计算机,小学语文新课心得体会
  20. iOS程序闪退的原因以及处理办法

热门文章

  1. 自由职客_全职工作时兼顾自由职业的14种方法
  2. Sqoop的简单使用
  3. 小程序-地图(腾讯地图)
  4. 电气设备安装技术交底
  5. 2020.08.08 网易秋招算法岗笔试简单总结(贪心,dp,二进制枚举,tarjan)
  6. source /etc/profile 在脚本里不执行
  7. 迷宫问题(经典BFS)
  8. 黑马程序员 一个程序员的自我修养
  9. 如何使用PHP书写汉字九九乘法表
  10. 怎么用java做水滴动画_‘纯css实现Material Design中的水滴动画按钮’的js体验优化...