[发明专利]语句处理方法、装置、系统和介质有效
申请号: | 202010764814.8 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111858899B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 范晓东;张文慧 | 申请(专利权)人: | 中国工商银行股份有限公司;工银科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/33 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕朝蕙 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 处理 方法 装置 系统 介质 | ||
1.一种语句处理方法,包括:
获取询问语句;
确定预构建的问题库中针对所述询问语句的问题类别,所述问题库包括p个类别的问题语句;
确定预构建的事项库中针对所述询问语句的备选事项语句,所述事项库包括q个事项语句;
根据所述问题类别和所述备选事项语句,确定针对所述询问语句的答复语句;
其中,p、q均为大于等于2的整数;
所述问题类别的数量为一个;确定针对所述询问语句的答复语句包括:
在所述备选事项语句的数量为至少两个的情况下:
采用轻量级语义模型,基于所述询问语句与每个标准询问语句的相似度,确定至少两个备选事项语句中针对询问语句的目标事项语句;以及
从预构建的答复语句库中确定与所述目标事项语句和所述问题类别均具有映射关系的答复语句为针对所述询问语句的答复语句。
2.根据权利要求1所述的方法,其中,所述确定预构建的问题库中针对所述询问语句的问题类别包括:
将所述询问语句输入预训练的分类模型,确定针对所述询问语句的备选问题类别及所述询问语句针对所述备选问题类别的概率值;以及
在所述概率值大于等于预设概率值的情况下,确定所述备选问题类别为针对所述询问语句的问题类别,
其中,所述分类模型是根据所述p个类别的问题语句训练得到的。
3.根据权利要求2所述的方法,还包括:根据所述p个类别的问题语句,确定所述预设概率值;包括:
根据所述p个类别的问题语句,获得m个训练样本和n个测试样本,所述m个训练样本用于训练预定分类模型得到预训练的分类模型;
将所述n个测试样本输入所述预训练的分类模型,确定所述n个测试样本分别针对备选问题类别的概率值,得到n个概率值;以及
确定所述预设概率值为所述n个概率值的平均值,
其中,m、n均为大于等于2的整数。
4.根据权利要求3所述的方法,其中,所述获得m个训练样本和n个测试样本包括:
通过以下至少之一获得与所述p个类别的问题语句关联的r个关联问题语句:根据同义词库替换所述p个类别的问题语句中的词,得到r个关联问题语句;根据所述q个事项语句替换所述p个类别的问题语句中包括的事项语句,得到r个关联问题语句;回译所述p个类别的问题语句,得到r个关联问题语句;
向所述r个关联问题语句划分至具有关联关系的问题语句所属的类别,得到增强的p个类别的问题语句;以及
将所述增强的p个类别的问题语句划分得到m个训练样本和n个测试样本,
其中,r为大于等于1的整数。
5.根据权利要求1所述的方法,其中,确定针对所述询问语句的备选事项语句包括:
确定针对所述询问语句的字向量,作为第一字向量;
获取针对所述q个事项语句中每个事项语句的字向量,得到q个第二字向量;
确定所述q个第二字向量中每个第二字向量与所述第一字向量之间的相似度,得到q个第一相似度;
根据所述q个第一相似度与预设相似度的关系,确定所述q个第二字向量中的目标字向量;以及
确定所述目标字向量所针对的事项语句为针对所述询问语句的备选事项语句。
6.根据权利要求5所述的方法,其中,确定针对所述询问语句的字向量,作为第一字向量包括:
对所述询问语句进行分字处理,得到s个第一字;
根据停用字库,剔除所述s个第一字中的停用字,得到t个第二字;
统计所述t个第二字在所述询问语句中的出现次数;以及
根据预定字库及所述出现次数,确定所述询问语句的第一字向量,
其中,s、t均为大于等于2的整数,且s大于等于t。
7.根据权利要求5所述的方法,其中,所述每个第二字向量与所述第一字向量之间的相似度包括杰卡德相似度;所述方法还包括:
确定所述事项库中每个事项语句的字向量,得到q个第二字向量;以及
将所述q个第二字向量存储压缩文件中,以便读取,
其中,所述q个第二字向量根据预定字库确定得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司;工银科技有限公司,未经中国工商银行股份有限公司;工银科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010764814.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:保护数据模型的处理方法和装置
- 下一篇:保护数据模型的处理方法和装置