宋皓宇 张伟男刘挺. (2018). 基于DQN的开放域多轮对话策略学习. 中文信息学报, 32(7), 99. http://jcip.cipsc.org.cn/CN/abstract/article_2604.shtml
填槽、端对端
学习笔记(4)- DQN
原文:https://www.cnblogs.com/xuehuiping/p/12205308.html