[发明专利]对话文本分析方法、装置、电子装置及存储介质在审
申请号: | 202011254446.9 | 申请日: | 2020-11-11 |
公开(公告)号: | CN112364622A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 谢恩宁;陈粮阳 | 申请(专利权)人: | 杭州大搜车汽车服务有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/295;G06F40/35;G06N3/00 |
代理公司: | 杭州华进联浙知识产权代理有限公司 33250 | 代理人: | 聂磊 |
地址: | 311100 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 文本 分析 方法 装置 电子 存储 介质 | ||
1.一种对话文本分析方法,其特征在于,包括:
获取待分析的对话文本数据,其中,所述对话文本数据包括多轮次对话文本分析所产生的文本数据及与所述多轮次对话文本分析关联的实时通信数据;
根据预设语义匹配规则对所述文本数据进行语义匹配,确定候选意向标签数据,其中,所述预设语义匹配规则基于预设语义匹配模型和预设配置信息确定,所述预设配置信息包括对不同对话文本分析所产生的文本数据进行解析的解析信息;
对所述候选意向标签数据进行筛选处理,获取目标意向标签数据,其中,所述筛选处理包括实体抽取、标签过滤;
根据所述实时通信数据确定所述目标意向标签数据对应的意向等级。
2.根据权利要求1所述的对话文本分析方法,其特征在于,根据预设语义匹配规则对所述对话文本数据进行语义匹配,确定候选意向标签数据包括:
对所述文本数据进行自然语言理解,得到与所述多轮次对话文本分析对应的第一语义数据;
获取所述第一语义数据中用户对话所对应的第一用户语义数据;
通过所述预设语义匹配模型在所述第一用户语义数据中检测至少一个第一目标语义数据,其中,所述第一目标语义数据包括所述预设配置信息中与用户意图数据关联的用户潜在意图数据,所述预设语义匹配模型包括BERT语义匹配模型;
在检测到所述第一目标语义数据的情况下,确定所述候选意向标签数据包括所述第一目标语义数据。
3.根据权利要求2所述的对话文本分析方法,其特征在于,在未检测到所述第一目标语义数据的情况下,所述方法包括:
获取第一轮次对话中的第一机器人话术,其中,所述第一轮次对话包括所述多轮次对话文本分析其中一次;
对与所述第一机器人话术对应的第一用户应答数据进行推理,得到第一推理意图数据,并确定所述候选意向标签数据包括所述第一推理意图数据,其中,所述第一推理意图数据包括所述第一用户应答数据关联的语义特征值。
4.根据权利要求2所述的对话文本分析方法,其特征在于,在确定所述候选意向标签数据包括所述第一目标语义数据之后,所述方法包括:根据所述第一目标语义数据推理得到第二推理意图数据,并确定所述候选意向标签数据包括所述第二推理意图数据,其中,所述第二推理意图数据包括相对所述第一目标语义数据具有相反语义的语义特征值。
5.根据权利要求2所述的对话文本分析方法,其特征在于,在确定所述候选意向标签数据包括所述第一目标语义数据之后,所述方法包括:
获取第二轮次对话中的第二机器人话术,其中,所述第二轮次对话包括所述多轮次对话文本分析其中一次;
在与所述第二机器人话术对应的第二用户应答数据检测第三推理意图数据,并确定所述候选意向标签数据包括所述第三推理意图数据,其中,所述第三推理意图数据包括所述第二用户应答数据关联的语义特征值。
6.根据权利要求1所述的对话文本分析方法,其特征在于,根据预设语义匹配规则对所述对话文本数据进行语义匹配,确定候选意向标签数据包括:
对所述文本数据进行自然语言理解,得到与所述多轮次对话文本分析对应的第二语义数据;
从所述第二语义数据中提取用户对话所对应的第二语义数据,并在所述第二语义数据中检测与第三轮次对话下用户意图对应的第一用户意图数据,其中,所述第三轮次对话为所述多轮次对话文本分析其中一次;
确定所述第一用户意图数据所对应的意向信息;
基于所述第三轮次对话中的第三机器人话术配置与所述意向信息所对应的推理配置意图数据,并确定所述候选意向标签数据包括所述推理配置意图数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州大搜车汽车服务有限公司,未经杭州大搜车汽车服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011254446.9/1.html,转载请声明来源钻瓜专利网。