多轮会话-1

时间：2020-01-12 21:32:45 阅读：85 评论：0 收藏：0 [点我收藏+]

开始了智能会话的研究。

算法的目标：让会话的轮数尽可能多；不要万能回复；不要回复说过的话

主要的方法：强化学习。

资料1

文献1：宋皓宇张伟男刘挺. (2018). 基于DQN的开放域多轮对话策略学习. 中文信息学报, 32(7), 99. http://jcip.cipsc.org.cn/CN/abstract/article_2604.shtml

思路：多轮会话策略，让轮数增多；不考虑回复生成，只考虑整体收益最大，从已有回复中，选择目标最大化的选项

主要的数据集是：微博短文本。微博正文+评论，形成一个会话回合。

资料2

文献2： Cuayahuitl, H., Yu, S., Williamson, A., & Carse, J. (2017). Deep Reinforcement Learning for Multi-Domain Dialogue Systems. Proceedings of the International Joint Conference on Neural Networks, 2017-May, 3339–3346. https://doi.org/10.1109/IJCNN.2017.7966275

思路：生成回复，对话生成；强化学习，多领域回复文本生成

数据集：饭馆和酒店的数据

多轮会话-1

原文：https://www.cnblogs.com/xuehuiping/p/12184611.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)