[发明专利]对话意图的分类方法、装置、设备及存储介质在审
申请号: | 202111138386.9 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113849643A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 倪子凡;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 意图 分类 方法 装置 设备 存储 介质 | ||
1.一种对话意图的分类方法,其特征在于,所述方法包括:
获取目标对话,对所述目标对话进行分类,得到查询语句和内容语句;
通过第一双向长短期记忆编码器对所述查询语句进行编码,并通过预设的分类算法对编码后的所述查询语句进行分类,得到对应的第一分类结果;
通过第一分类结果和所述内容语句对第二双向长短期记忆编码器进行更新,并通过更新后的所述第二双向长短期记忆编码器对所述内容语句进行编码;
将所述第一分类结果和编码后的所述内容语句作为所述分类算法的输入,得到第二分类结果;
采用第二分类结果和所述查询语句对所述第一双向长短期记忆编码器进行更新,并通过更新后的所述第一双向长短期记忆编码器对所述查询语句进行编码,将编码后的所述查询数据输入所述分类算法,并将所述分类算法的输出作为新的所述第一分类结果;
采用所述第一分类结果和所述第二分类结果,以及所述查询语句和所述内容语句对所述第一双向长短期记忆编码器和所述第二双向长短期记忆编码器进行迭代更新,直至满足预设的迭代停止条件,并将迭代停止时的所述第一分类结果作为所述查询语句的意图分类结果。
2.根据权利要求1所述的对话意图的分类方法,其特征在于,所述通过第一分类结果和所述内容语句对所述第二双向长短期记忆编码器进行更新,包括:
在所述查询语句包含的k个意图集群中,分别选取至少一个子集作为支撑集,根据下式计算每个所述支撑集的原型参数:
式中,ck为所述原型参数,Sk为所述查询语句的数据集,为所述内容语句,为所述第一分类结果,fφ2为第二双向长短期记忆编码器的算法约束,i为所述第二双向长短期记忆编码器的迭代次数;
将所述查询对话中,除支撑集以外的部分作为查询数据点集合,对于任意一个所述查询数据点集合中的查询数据点,通过下式计算所述查询数据点对于所述支撑集的类分布概率:
式中,p为类分布概率,x为所述查询数据点,d(fφ2(x),ck)为所述原型参数与所述查询数据点之间的距离;
对第二双向长短期记忆编码器的参数进行更新,以使所述类分布概率满足的负对数似然最小化条件。
3.根据权利要求1所述的对话意图的分类方法,其特征在于,所述通过所述第一双向长短期记忆编码器对所述查询语句进行编码之前,还包括:
获取训练数据集,其中,所述训练数据集中包括若干个序列化的训练数据;
若所述训练数据的数量大于预设的数据阈值,获取所述训练数据的随机数序列,通过所述随机数序列对分层双向长短期记忆网络中的第一双向长短期记忆编码器和第二双向长短期记忆编码器进行初始化训练;
若所述训练数据的数量不大于预设的数据阈值,通过从语料库获取若干个语句段落对预设的原始查询编码器进行预训练,得到所述第一双向长短期记忆编码器,并通过所述语句段落对应的上下文语句对预设的原始内容编码器进行预训练,得到所述第二双向长短期记忆编码器。
4.根据权利要求3所述的对话意图的分类方法,其特征在于,所述通过从语料库获取若干个语句段落对预设的原始查询编码器进行预训练,得到所述第一双向长短期记忆编码器,并通过所述语句段落对应的上下文语句对预设的原始内容编码器进行预训练,得到所述第二双向长短期记忆编码器,包括:
通过所述原始查询编码器对所述语句段落进行编码,并计算所述语句段落的第一语句向量;
通过所述原始内容编码器获取所述上下文语句,对所述上下文语句进行编码,并计算所述上下文语句的第二语句向量;
计算所述第一语句向量与第二语句向量的内积,对所述原始查询编码器和所述原始内容编码器进行机器学习,直至所述内积的对数似然满足最大化条件,并将学习后的所述原始查询编码器和所述原始内容编码器分别作为所述第一双向长短期记忆编码器和所述第二双向长短期记忆编码器。
5.根据权利要求1所述的对话意图的分类方法,其特征在于,所述对所述目标对话进行分类,包括:
通过语法树对所述目标对话进行语义解析,得到所述目标对话的流程视图;
根据所述流程视图对所述目标对话进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111138386.9/1.html,转载请声明来源钻瓜专利网。