[发明专利]用户对话衔接语生成的方法及相关设备在审
申请号: | 202110726246.7 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113297367A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 姚晓远;袁梦菲 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/31;G06F40/194;G06F40/30;G06K9/62 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 对话 衔接 生成 方法 相关 设备 | ||
1.一种用户对话衔接语生成的的方法,其特征在于,所述方法包括:
接收目标用户通过用户终端发送的话术,作为待处理话术;
对所述待处理话术进行关键词提取和话题识别,得到关键词和目标话题;
基于所述目标话题和根据索引算法计算得到的衔接语索引为所述待处理话术匹配至少一个候选衔接语;
基于所述关键词,通过相关性衰减算法计算各所述候选衔接语与所述待处理话术的相似度,并将不小于第一相似度的候选衔接语作为目标衔接语发送给所述目标用户所在的用户终端。
2.根据权利要求1所述的方法,其特征在于,所述对所述待处理话术进行关键词提取和话题识别,得到关键词和目标话题,包括:
根据关键词提取算法从所述待处理话术中获取至少一个关键词;并
通过独热编码对所述关键词进行编码处理,得到关键词向量;
获取预设词表,其中,所述预设词表包括预设关键词与其对应的至少一个对话话题的话题映射集合;
计算所述关键词向量与预设关键词向量之间的相似度,并获取相似度大于第二相似度的预设关键词对应的对话话题,作为所述目标话题。
3.根据权利要求1所述的方法,其特征在于,在所述基于所述目标话题和根据索引算法计算得到的衔接语索引为所述待处理话术匹配至少一个候选衔接语之前,还包括:
预训练带属性标签的对话模型;
将话术文本和所述话术文本的属性标签输入到所述对话模型中,进行带约束的前缀分组搜索,得到与各所述话术文本对应的衔接语前缀,以及与各所述衔接语前缀对应的预测概率;
基于衔接语过滤集合和所述预测概率,从各所述衔接语前缀中筛选得到待定衔接语;
建立所述话术文本的至少一个目标话题与所述待定衔接语之间的衔接语索引。
4.根据权利要求3所述的方法,其特征在于,所述属性标签包括话题标签、句式标签、情感标签以及长短标签,所述将话术文本和所述话术文本的属性标签输入到所述对话模型中,进行带约束的前缀分组搜索,得到与各所述话术文本对应的衔接语前缀,以及与各所述衔接语前缀对应的预测概率,包括:
将所述话题标签、所述话术文本、所述话术文本的句式标签、情感标签以及长短标签输入到transformer模型,以指示所述transformer模型中的编码器对所述话题标签、所述话术文本、所述话术文本的所述句式标签、所述情感标签以及所述长短标签进行解码,得到所述话术文本的语义表示,并指示所述transformer模型中的解码器对所述语义表示进行解码处理,得到与各所述语义表示的话术文本对应的衔接语前缀,以及各所述衔接语前缀对应的预测概率。
5.根据权利要求1所述的方法,其特征在于,所述基于所述关键词,通过相关性衰减算法计算各所述候选衔接语与所述待处理话术的相似度,包括:
通过DSSM模型计算所述候选衔接语与所述待处理话术之间的文本相似度,并将所述文本相似度作为所述相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110726246.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于炸环式烟花的开爆药装料结构
- 下一篇:基于监控视频的高空抛物检测方法