[发明专利]对话意图类型识别方法、多轮对话方法、装置及计算设备有效
申请号: | 202010250336.9 | 申请日: | 2020-04-01 |
公开(公告)号: | CN111581375B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 石智中;翟羽佳 | 申请(专利权)人: | 车智互联(北京)科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06F40/284;G06F40/295;G06N3/0464;G06N3/0442;G06N3/044;G06N3/047;G06N3/08 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 意图 类型 识别 方法 轮对 装置 计算 设备 | ||
本发明公开了一种对话意图类型识别方法、一种多轮对话方法、装置及计算设备。其中对话意图类型识别方法包括:对当前轮对话文本进行实体识别,得到当前轮对话文本的实体和实体类型;对当前轮对话文本进行实体意图识别,得到当前轮对话文本的意图;融合当前轮对话文本的实体、实体类型、意图及历史对话文本的实体、实体类型、意图,得到实体集合、实体类型集合及意图集合;对实体集合、实体类型集合及意图集合中的实体、实体类型、意图分别进行向量化处理,得到多个实体向量、实体类型向量及意图向量;拼接实体向量、实体类型向量及意图向量,作为拼接向量;将拼接向量输入至分类模型,得到当前轮对话文本的意图类型。
技术领域
本发明涉及人机交互领域,具体涉及一种对话意图类型识别方法、多轮对话方法、装置及计算设备。
背景技术
在任务型多轮对话系统模型的训练和建立中,一般需要大量的人工标注数据作为训练和建立多轮对话系统模型的基础。若在用户意图不明确的情况下,不仅需要标注的数据量成倍增长,还会由于答复内容不贴合语境等问题导致用户流失。
目前,为了解决在用户意图不明确的情况下造成的标注数据量大、答复内容不符合语境等的问题,提出了意图识别的概念。但已有的意图识别仅通过将用户输入的语句进行语义分析,简单分辨意图后,直接将分析出语义的词汇填进对应的槽位,导致对用户意图识别的准确率偏低,较难对用户的潜在意图进行识别,并作出最贴合语境的回答。因此,如何准确、高效的识别用户的潜在意图是亟需解决的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的对话意图类型识别方法、多轮对话方法、装置及计算设备。根据本发明的第一方面,提供了一种对话意图类型识别方法,包括:对当前轮对话文本进行实体识别,得到当前轮对话文本的实体和实体类型;对当前轮对话文本进行实体意图识别,得到当前轮对话文本的意图;融合当前轮对话文本的实体、实体类型、意图及历史对话文本的实体、实体类型、意图,得到实体集合、实体类型集合及意图集合;对实体集合、实体类型集合及意图集合中的实体、实体类型、意图分别进行向量化处理,得到多个实体向量、实体类型向量及意图向量;拼接实体向量、实体类型向量及意图向量,作为拼接向量;将拼接向量输入至分类模型,得到所述当前轮对话文本的意图类型。
可选地,在根据本发明的对话意图类型识别方法中,当前轮对话文本利用词典匹配和/或实体识别模型进行实体识别,当前轮对话文本利用意图识别模型进行意图识别。
可选的,在根据本发明的对话意图类型识别方法中,实体识别模型采用BERT+CRF模型,意图识别模型采用TextCNN模型。
可选的,在根据本发明的对话意图类型识别方法中,历史对话文本采用预定轮数的最近对话文本。
可选的,在根据本发明的对话意图类型识别方法中,融合当前轮对话文本的实体、实体类型、意图及历史对话文本的实体、实体类型、意图,包括:对当前轮对话文本的实体及历史对话文本的实体归类;融合当前轮对话文本的实体类型、意图、历史对话文本的实体类型、意图及归类后的实体,得到实体集合、实体类型集合及意图集合。
可选的,在根据本发明的对话意图类型识别方法中,实体类型采用如下方式进行分类:判定实体是否已经存在于类别集合中,若不存在,则添加到类别集合中,并添加该实体出现的轮次标签,若存在,则更新该实体的轮次标签。
可选的,在根据本发明的对话意图类型识别方法中,分类模型包括特征提取器和分类器,输入拼接向量至分类模型,得到当前轮对话的意图类型,包括:输入拼接向量至特征提取器,得到特征向量;输入特征向量至分类器,得到意图类型概率;选择意图类型概率中最大概率对应的意图类型,作为当前轮对话的意图类型。
可选的,在根据本发明的对话意图类型识别方法中,特征提取器采用CNN网络、RNN网络、LSTM网络或者GRU网络,分类器采用SoftMax分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于车智互联(北京)科技有限公司,未经车智互联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010250336.9/2.html,转载请声明来源钻瓜专利网。