[发明专利]对话机器人意图语料生成方法、装置、介质及电子设备在审
申请号: | 202010201001.8 | 申请日: | 2020-03-20 |
公开(公告)号: | CN111460117A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 陈亮;李治根;杨坤;许开河;周琳;王少军;王嘉雯 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 孙强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 机器人 意图 语料 生成 方法 装置 介质 电子设备 | ||
1.一种对话机器人意图语料生成方法,其特征在于,所述方法包括:
获取包括多个意图的意图集合,其中,每一意图包括多个相似句语料,每一意图对应一个对话机器人,每一对话机器人具有至少一个意图;
获取目标意图所包括的目标相似句语料,作为目标相似句语料集合;
确定所述目标相似句语料与所述相似句语料的相似度;
基于所述相似度在所述意图集合中选择出候选相似句语料,以构建候选相似句语料集合;
基于所述候选相似句语料集合中各候选相似句语料与所述目标相似句语料集合中所述目标相似句语料的相似度,在所述候选相似句语料集合的候选相似句语料中确定出属于所述目标意图的目标相似句语料。
2.根据权利要求1所述的方法,其特征在于,所述意图集合为意图子集合,所述获取包括多个意图的意图集合,包括:
基于第一预定规则从包括多个意图的意图总集合中选择出多个意图组成意图子集合,其中,每一意图包括多个相似句语料,所述意图总集合中的每一意图对应一个对话机器人;
所述获取目标意图所包括的目标相似句语料,作为目标相似句语料集合,包括:
基于第二预定规则在所述意图子集合中意图对应的对话机器人之外的其他所有对话机器人对应的意图中选择出目标意图;
获取目标意图包括的相似句语料作为目标相似句语料,得到目标相似句语料集合。
3.根据权利要求1或2所述的方法,其特征在于,所述目标相似句语料和所述相似句语料分别由多个词元素组成,所述确定所述目标相似句语料与所述相似句语料的相似度,包括:
利用如下公式确定所述目标相似句语料与所述相似句语料的相似度:
其中,s1代表所述目标相似句语料,s2代表所述相似句语料,Len用于求取集合内词元素的个数,fscore(s1,s2)为所述目标相似句语料与所述相似句语料的相似度。
4.根据权利要求1或2所述的方法,其特征在于,所述基于所述相似度在所述意图集合中选择出候选相似句语料,以构建候选相似句语料集合,包括:
针对所述意图集合中每一意图,若该意图包括的相似句语料中存在一个相似句语料与所述目标相似句语料的相似度大于预定相似度阈值,则获取该意图包括的所有相似句语料作为候选相似句语料;
利用获取的所有候选相似句语料构建候选相似句语料集合。
5.根据权利要求1或2所述的方法,其特征在于,所述基于所述候选相似句语料集合中各候选相似句语料与所述目标相似句语料集合中所述目标相似句语料的相似度,在所述候选相似句语料集合的候选相似句语料中确定出属于所述目标意图的目标相似句语料,包括:
基于所述候选相似句语料集合中各候选相似句语料与所述目标相似句语料集合中所述目标相似句语料的相似度,利用如下公式计算所述候选相似句语料集合中各候选相似句语料的得分,并基于所述得分在所述候选相似句语料集合的候选相似句语料中确定出属于所述目标意图的目标相似句语料:
其中,si和sj代表所述目标相似句语料,sk代表所述候选相似句语料,Len用于求取集合内词元素的个数,fscore(s1,s2)为所述目标相似句语料与所述候选相似句语料的相似度,C为所述候选相似句语料集合,O为所述目标相似句语料集合,n为所述候选相似句语料集合中所述候选相似句语料的数目,m为所述目标相似句语料集合中所述目标相似句语料的数目,α为权重因子,selectSen为所述候选相似句语料集合中候选相似句语料的得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010201001.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习的视频物体分割方法及系统
- 下一篇:一种桥梁变形智能检测系统