[发明专利]语句处理方法、装置、系统和介质有效
申请号: | 202010764814.8 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111858899B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 范晓东;张文慧 | 申请(专利权)人: | 中国工商银行股份有限公司;工银科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/33 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕朝蕙 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 处理 方法 装置 系统 介质 | ||
本公开提供了一种语句处理方法,包括:获取询问语句;确定预构建的问题库中针对询问语句的问题类别,所述问题库包括p个类别的问题语句;确定预构建的事项库针对询问语句的备选事项语句,事项库包括q个事项语句;以及根据问题类别和备选事项语句,确定针对询问语句的答复语句。本公开还提供了一种语句处理装置、一种计算机系统和一种计算机可读存储介质。本公开提供的方法和装置可用于人工智能领域、大数据领域和其他领域。
技术领域
本公开涉及智能问答技术领域,更具体地,涉及一种语句处理方法、装置、系统和介质。
背景技术
随着人工智能技术的快速发展,学习算法的迭代更新,以及海量问答知识数据的基类,智能问答技术在众多领域得到了快速发展。
在实现本公开构思的过程中,发明人发现相关技术中至少存在以下问题:相关技术中,问答技术主要是通过制定大量的专家规则或预训练多层深度神经网络算法来实现。其中,专家规则中设定了问题与答案的对应关系。对于类似于政务领域等特殊领域,往往会因信息化进展慢而无法积累大量的问答语料,不利于规则制定和算法训练。再者,由于用户的询问语句通常口语化表述严重,往往无法精准地匹配到用户满意的答案。
发明内容
有鉴于此,本公开提供了一种用于提高匹配得到的答复语句的准确性的语句处理方法、装置、系统和介质。
本公开一方面提供了一种语句处理方法,包括:获取询问语句;确定预构建的问题库中针对询问语句的问题类别,该问题库包括p个类别的问题语句;确定预构建的事项库中针对询问语句的备选事项语句,该事项库包括q个事项语句;以及根据问题类别和备选事项语句,确定针对询问语句的答复语句,其中,p、q均为大于等于2的整数。
根据本公开的实施例,确定预构建的问题库中针对询问语句的问题类别包括:将询问语句输入预训练的分类模型,确定针对询问语句的备选问题类别及询问语句针对备选问题类别的概率值;以及在概率值大于等于预设概率值的情况下,确定备选问题类别为针对询问语句的问题类别,其中,分类模型是根据p个类别的问题语句训练得到的。
根据本公开的实施例,上述语句处理方法还包括根据p个类别的问题语句,确定预设概率值;包括:根据p个类别的问题语句,获得m个训练样本和n个测试样本,m个训练样本用于训练预定分类模型得到预训练的分类模型;将n个测试样本输入预训练的分类模型,确定n个测试样本分别针对备选问题类别的概率值,得到n个概率值;以及确定预设概率值为n个概率值的平均值,其中,m、n均为大于等于2的整数。
根据本公开的实施例,上述获得m个训练样本和n个测试样本包括:通过以下至少之一获得与p个类别的问题语句关联的r个关联问题语句:根据同义词库替换p个类别的问题语句中的词,得到r个关联问题语句;根据p个事项语句替换多个类别的问题语句中包括的事项语句,得到r个关联问题语句;回译p个类别的问题语句,得到r个关联问题语句;向r个关联问题语句划分至具有关联关系的问题语句所属的类别,得到增强的p个类别的问题语句;以及将增强的p个类别的问题语句划分得到m个训练样本和n个测试样本,其中,r为大于等于1的整数。
根据本公开的实施例,确定针对询问语句的备选事项语句包括:确定针对询问语句的字向量,作为第一字向量;获取针对q个事项语句中每个事项语句的字向量,得到q个第二字向量;确定q个第二字向量中每个第二字向量与第一字向量之间的相似度,得到q个第一相似度;根据q个第一相似度与预设相似度的关系,确定q个第二字向量中的目标字向量;以及确定目标字向量所针对的事项语句为针对询问语句的备选事项语句。
根据本公开的实施例,确定针对询问语句的字向量,作为第一字向量包括:对询问语句进行分字处理,得到s个第一字;根据停用字库,剔除s个第一字中的停用字,得到t个第二字;统计t个第二字在询问语句中的出现次数;以及根据预定字库及所述出现次数,确定询问语句的第一字向量,其中,s、t均为大于等于2的整数,且s大于等于t。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司;工银科技有限公司,未经中国工商银行股份有限公司;工银科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010764814.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:保护数据模型的处理方法和装置
- 下一篇:保护数据模型的处理方法和装置