《对话生成模型总结（解读 + 开源代码）》

本文研究如何赋予开放领域对话系统提问的能力，从而增强闲聊系统的交互性与持续性。如何提一个好问题，也较大程度体现了机器理解的能力。我们发现，一个好的提问由三种类型的词构成：疑问词、主题词与普通词，为此我们提出了 "类型化解码器"（Soft/Hard Typed Decoder）。在每个解码的位置上，解码器会先决定生成词的类型分布，并利用概率偏置提高生成对应类型词的可能性。对于 Soft 类型化解码器而言，每个解码位置上词的类别分布与词的生成概率分布进行混合；对于 Hard 类型化解码器，我们采用了 Gumbel-Softmax 的概率操作技巧（近似 argmax 功能），使得解码器具有选择动态词表的能力。自动评测和人工评测的结果说明了我们的模型所生成的提问相对基线模型具有明显的优势，更容易驱动对话继续下去。

随后会写一下这篇文章的详细解读。

代码：

victorywys/Learning2Ask_TypedDecoder?github.com

6、Sentence Function

生成特定功能的句子（疑问句、陈述句、祈使句）

论文：《Generating Informative Responses with Controlled Sentence Function》

论文链接：

http://coai.cs.tsinghua.edu.cn/hml/media/files/acl_senfun.pdf?coai.cs.tsinghua.edu.cn

论文解读：

本文着眼于闲聊对话生成领域，研究如何控制生成回复的全局功能特征，并解决功能控制和内容丰富性的兼容问题。句子功能（Sentence Function）是一种重要的语言学特征，按句子功能可将语言划分为疑问句、陈述句、祈使句等多个类别，该特征在对话中能够体现说话者的目的。本文引入条件变分自编码器，利用隐变量来建模和控制生成回复的功能特征；同时，我们在模型中设计了类别控制器，解码回复中的每个词之前会先根据隐变量和当前解码状态预测待生成词所属的类别（即功能控制词、话题词或普通词），再根据类别信息解码出相应的词，使得功能特征和内容信息能够在生成的回复中有机结合。自动评测和人工评测的结果表明，我们的模型生成的回复不仅在结构上符合设定的功能类别，而且在内容上具备丰富的信息量。

随后会写一下这篇文章的详细解读。

代码：

kepei1106/SentenceFunction?github.com

7、Prototype Editing

检索与生成相结合，采用编辑原有回复的方式，获取最终回复

论文：《Response Generation by Context-aware Prototype Editing》

论文链接：

https://arxiv.org/pdf/1806.07042v1.pdf?arxiv.org

论文解读：

super 涵：Response Generation by Prototype Editing 论文笔记?zhuanlan.zhihu.com

代码：

MarkWuNLP/ResponseEdit?github.com