[发明专利]一种面向任务型对话系统的对话策略方法在审

申请号：	201911331882.9	申请日：	2019-12-21
公开（公告）号：	CN111159371A	公开（公告）日：	2020-05-15
发明（设计）人：	赵阳洋;王振宇;王佩	申请（专利权）人：	华南理工大学
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/36
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	何淑珍;陈伟斌
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种面向任务对话系统策略方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种面向任务型对话系统的对话策略方法，应用在基于知识图谱的音乐智能搜索场景中，包括以下步骤：S1、针对特定领域构建马尔科夫决策模型；S2、利用贝尔曼方程计算状态值函数矩阵；S3、结合当前时刻的对话状态，匹配知识图谱和搜索知识库，得到满足用户目标的音乐结果；S4、对搜索结果进行属性信息熵计算；S5、对计算出来的属性信息熵进行分析；S6、通过状态转移矩阵计算出下一轮动作。本发明克服任务型对话系统中完全冷启动的困难，通过构建强化学习模型计算状态值函数矩阵，结合状态值函数矩阵的结果与该状态的属性信息熵，得到下一轮的动作，用更少的对话轮次完成知识搜索任务，具有很好的可用性。

技术领域

本发明涉及任务型对话系统的基于知识图谱智能搜索领域，特别涉及一种面向任务型对话系统的对话策略方法。

背景技术

随着人工智能相关技术的飞速发展，人与智能设备之间的交互方式趋于智能化，逐渐从传统的图形化交互(Graphical User Interface,GUI)向人机对话交互(Conversational User Interface)进行转变，即利用人工智能助理来帮助用户完成多项任务或多项服务。人机对话系统可以从功能上划分为非任务型(non-task-oriented)和任务型(task-oriented)的对话系统两大类。任务型对话系统又称为目标驱动型(goaldriven)对话系统，例如客服机器人、机票预订系统等，它们为用户提供特定领域的服务，旨在帮助用户完成购物、订机票等任务。这类人机对话系统能够大大降低人力成本，简化人机交互过程，提高应用的智能程度，因此具有广泛的研究和应用价值。

在任务型对话系统中，用户与系统进行多轮对话，从而完成特定的任务。在多轮对话的基于知识图谱的智能搜索领域，系统需要通过尽量少的轮次，帮助用户快速搜索到满足约束条件的知识条目。而在这个过程中，系统的引导对对话进行的路径起着决定性作用。好的对话策略能够直接简单地引导用户表达目标属性，从而确定知识图谱匹配和知识库搜索的约束条件。因此，对话系统策略的智能程度直接关系到系统的搜索效率。而任务型对话系统在工业界的应用常常面临缺少特定领域训练数据集的难题，因此无法在训练数据集上进行有监督的训练。目前，大多数的对话系统通过人工制定对话规则来解决系统完全冷启动问题。主流的人工制定对话策略虽然能够快速的构建对话策略机制，但构建过程需要消耗大量的人力，并且缺少泛化和领域迁移的能力。因此，如何在这种场景下构建出适用于完全冷启动场景，且具有智能程度且具有领域迁移能力的对话机器人是本发明的背景。

目前主流的实现对话策略的模型主要可以分为以下几种：基于有限状态自动机的对话策略黄民烈(朱小燕.对话管理中基于槽特征有限状态自动机的方法研究[J].计算机学报,2004,27(8):1092-1101)；填槽或填表法(袁琰,田怀凤,杜波,et al.基于框架的对话管理模型的研究与实现[J].计算机工程,2005(13):221-223)；和基于概率模型的对话策略(张波,蔡庆生,郭百宁.口语对话系统的POMDP模型及求解[J].计算机研究与发展,2002(02):90-97)。基于有限状态自动机的对话策略将用户与系统之间的交互过程定义为“初始状态-动作-更新状态-动作-更新状态-…-终止状态”的状态与触发动作进行交替的过程，是典型的系统主导型方法，对话的节奏完全由系统决定，用户需要按照系统指定的流程补充信息，缺少灵活性和可扩展性。基于填槽的对话策略在一定程度上改进了基于有限状态自动机的方法，它将对话建模成一个填槽的过程。这种方法为用户提供了相对灵活的输入方式，支持用户和系统混合主导的系统，适用于相对复杂的信息获取场景。但这种填槽的对话策略方法由于槽位的限制，当槽的数量过多时，算法的复杂程度也会急剧增长，因此不适用于更复杂的场景。对于槽数量很多的复杂场景，基于概率模型的方法具有较好的扩展方式。面对过多的状态或动作空间，在传统强化学习很难进行高效地探索时，深度强化学习能够大大提升模型的收敛速度。

本发明在上述三种对话策略方法的基础上，针对基于知识图谱的搜索型对话系统中所面临的两个问题，提出了一种融合强化学习和信息熵的多轮对话策略方法，所解决的两个问题为：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911331882.9/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于动态目标训练的深度神经网络人脸表情识别方法
下一篇：面向车载行人检测的分类辅助核相关滤波跟踪方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种面向任务型对话系统的对话策略方法在审

专利文献下载