[发明专利]一种问答处理方法、装置、介质及电子设备有效
申请号: | 202110349133.X | 申请日: | 2021-03-31 |
公开(公告)号: | CN112989001B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 付博;王雪;李宸 | 申请(专利权)人: | 建信金融科技有限责任公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/338 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 200120 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 问答 处理 方法 装置 介质 电子设备 | ||
1.一种问答处理方法,其特征在于,所述方法包括:
将用户问题与预存问答对中预存问题进行第一特征匹配,且将匹配成功至少两个预存问题作为初始问题;
将用户问题与初始问题进行第二特征匹配,且将匹配成功的初始问题作为候选问题;
根据所述用户问题和所述候选问题之间的第三特征数据,从所述候选问题中选择目标问题,且将所述目标问题关联的回答作为所述用户问题的回答;其中,所述第一特征与所述第二特征不同;所述第三特征数据包括:句法特征、上下文特征和语义相似度特征;
根据所述用户问题和所述候选问题之间的第三特征数据,从所述候选问题中选择目标问题,且将所述目标问题关联的回答作为所述用户问题的回答,包括:将所述用户问题和所述候选问题的第三特征数据进行拼接,作为神经网络模型的输入;根据所述神经网络模型输出的所述用户问题的子问题数量和所述子问题的类别,在所述候选问题中确定目标问题;
根据所述神经网络模型输出的所述用户问题的子问题数量和所述子问题的类别,在所述候选问题中确定目标问题,包括:在所述候选问题中选择与所述子问题的类别一致的问题作为目标问题;根据所述子问题数量确定所述目标问题的数量,以核验所述子问题是否均存在对应的目标问题。
2.根据权利要求1所述的方法,其特征在于,所述第一特征是指构成所述用户问题的语言单元在所述预存问题中出现的频率,所述语言单元包括字或者词语;所述第二特征为语义特征。
3.根据权利要求2所述的方法,其特征在于,所述将用户问题与预存问答对中预存问题进行第一特征匹配,且将匹配成功至少两个预存问题作为初始问题,包括:
将所述用户问题切分为独立的语言单元;
根据各语言单元在所述预存问答对中各预存问题出现的频率,计算所述用户问题与所述预存问题的第一相似度得分;
选择所述第一相似度得分大于预设相似度阈值的至少两个所述预存问题作为初始问题。
4.根据权利要求3所述的方法,其特征在于,所述根据各语言单元在所述预存问答对中各预存问题出现的频率,计算所述用户问题与所述预存问题的第一相似度得分,包括:
按照如下公式计算所述用户问题与所述预存问题的第一相似度得分:
其中,ti表示所述用户问题中的语言单元,faqj表示所述预存问题,f(ti,faqj)表示ti在预存问题faqj中出现的频率,k1和b分别为第一调整系数和第二调整系数,wi表示相关性权重,avgFAQ表示预存问题的平均字长,N表示所述预存问答对的数量,n(ti)表示包括ti的预存问题faqj的数量,pi为权重用于表示ti重要程度。
5.根据权利要求2所述的方法,其特征在于,所述将用户问题与初始问题进行第二特征匹配,且将匹配成功的初始问题作为候选问题,包括:
根据所述用户问题和各初始问题的文本内容信息和句子结构信息,利用语义相似度模型判断初始问题是否可以和所述用户问题构成语义相似句对;
若可以,则将所述初始问题确定为候选问题。
6.根据权利要求5所述的方法,其特征在于,在根据所述用户问题和各初始问题的文本内容信息和句子结构信息,利用语义相似度模型判断初始问题是否可以和所述用户问题构成语义相似句对之前,还包括所述语义相似度模型的训练过程:
利用预先训练的语义相似句对判断模型确定训练样本句对的标签数据;其中,所述标签数据包括:语义相似句对分类属性和句对语义相似度得分;
提取所述训练样本句对的所述文本内容信息和所述句子结构信息作为特征数据;
将所述特征数据和所述标签数据,作为训练数据训练所述语义相似度模型,以供所述语义相似度模型输出语义相似句对分类属性和句对语义相似度得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信金融科技有限责任公司,未经建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110349133.X/1.html,转载请声明来源钻瓜专利网。