[发明专利]一种FAQ问句相似度计算方法及其系统在审
申请号: | 202010398632.3 | 申请日: | 2020-05-12 |
公开(公告)号: | CN111581354A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 吕海峰;宁义双;宁可;张刚 | 申请(专利权)人: | 金蝶软件(中国)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 faq 问句 相似 计算方法 及其 系统 | ||
本申请实施例公开一种FAQ问句相似度计算方法及其系统,用于提高检索式问答系统的检索结果的准确性。包括:使用文本相似度算法对被检索的问题句和预设的标准问答库中的FAQ问句进行相似度匹配计算,得出文本相似度最高的k个候选FAQ问句;将该问题句输入深度语义匹配模型,得到该问题句的语义向量,再与该FAQ问句的语义向量一起输入语义索引模型,得到语义相似度最高的L个候选FAQ问句;将上述k+L个候选FAQ问句进行并集操作,并与问题句两两配对后再次输入深度语义匹配模型,计算输出问题句与候选FAQ问句的相似度以及相似度的标签类别;将所有候选FAQ问句按相似的标签类别且相似度从高到低排列,输出相似度最大且超过预设阈值的FAQ问句。
技术领域
本申请实施例涉及自然语言处理技术领域,特别涉及一种FAQ问句相似度计算方法及其系统。
背景技术
常用问答对(frequently asked questions,FAQ),即常见的问题与该问题预设答案组成的一对组合,FAQ通常用于检索式问答系统的自动问答业务,检索式问答系统利用预设的标准问答库中存储的一系列常见的问题与该问题预设答案,对用户检索的问题进行解答。标准问答库是一个封闭的集合,在标准问答库中的每一个问题都是具有固定的答案和标题,同时也会对应多种拓展问法和关键词。
用户在使用检索式问答系统进行问题检索时,系统会使用文本相似度算法对被检索的问题与标准问答库中的FAQ问句进行相似度匹配计算,从而找到标准问答库里找到相似度高的展现给用户。然而,随着人文社会的发展,用户使用检索式问答系统检索问题越来越复杂,标准问答库中的FAQ数量也越发庞大,导致检索式问答系统展现的检索结果往往不能令人满意。
现有技术中,为提高检索式问答系统的检索结果准确性,提出了语义相似度计算方法,其思想是在输入层分别对用户的检索问题和标准问答库中的FAQ问句向量化,在表示层使用卷积神经网络(convolutional neural network,CNN)或循环神经网络(recurrentneural network,RNN)等模型表达为低维语义向量,并在匹配层通过距离函数(如cosine距离等)来计算两个语义向量的距离,若距离越小,则说明两个语义向量之间的相似度越大,反之越小。这种语义的相似度计算的模型需要依赖大规模的有监督语料,即需要大规模的人工标注语料。因此,仅基于语义匹配的相似度计算方法或仅文本相似度算法的检索时问答系统存在过度依赖人工标注语料、耗费时间人工成本,或检索结构准确性不高等问题。
发明内容
本申请实施例提供了一种FAQ问句相似度计算方法及其系统,可以提高检索式问答系统的检索结果的准确性。
本申请实施例第一方面提供一种FAQ问句相似度计算方法,包括:
接收被检索的问题句;
使用文本相似度算法对所述问题句和预设的标准问答库中的FAQ问句进行相似度匹配计算,得出文本相似度最高的k个候选FAQ问句,所述k为大于0的正整数;
将所述问题句输入深度语义匹配模型,得到所述问题句的语义向量,所述深度语义匹配模型基于预训练模型在所述预设标准问答库中FAQ问句进行微调训练而成,用于计算出所述问句的语义向量、计算由所述问题句与所述FAQ问句构成的问句对之间是否为相似的标签类别,及对应的相似度;
将所述问题句的语义向量输入语义索引模型,得到语义相似度最高的L个候选FAQ问句;
将所述文本相似度最高的k个候选FAQ问句和语义相似度最高的L个候选FAQ问句进行并集操作,得到所述问题句最相似的n个候选FAQ问句,所述n为小于或等于k+L的正整数;
将所述问题句与n个所述候选FAQ问句分别两两配对,得到n个候选问句对,将所述n个候选问句对再次输入所述深度语义匹配模型,分别输出所述问题句与n个所述候选FAQ问句是否为相似的标签类别,及对应的相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金蝶软件(中国)有限公司,未经金蝶软件(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010398632.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗遮挡的视觉目标跟踪方法
- 下一篇:一种切换组件、风道及空调器