[发明专利]一种语义匹配方法和系统有效

专利信息
申请号: 201710375390.4 申请日: 2017-05-24
公开(公告)号: CN107329949B 公开(公告)日: 2021-01-01
发明(设计)人: 殷子墨;李健;张连毅;武卫东 申请(专利权)人: 北京捷通华声科技股份有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F16/332;G06N3/04;G06N3/08
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 莎日娜
地址: 100193 北京市海淀区东北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语义 匹配 方法 系统
【说明书】:

发明提供了一种语义匹配方法和系统,该方法包括:对至少一个领域内的任意一个第一语句、第二语句、第三语句作向量转换处理,得到第一语句句向量、第二语句句向量、第三语句句向量;第一语句句向量和第二语句句向量作为正样本、第一语句句向量和第三语句句向量作为负样本分别输入至循环神经网络模型进行训练,得到用于至少一个领域的语义判断模型;将至少一个领域内任意一个目标领域的待识别语句的句向量以及目标领域内的候选语句的句向量输入至语义判断模型;依次计算待识别语句的句向量与目标领域内的每个候选语句的句向量之间的相似度;将相似度最高的候选语句确定为与待识别语句的语义相近的目标语句。

技术领域

本发明涉及信息技术领域,特别是涉及一种语义匹配方法和系统。

背景技术

在智能问答、智能客服、问题答案检索等含有QA需求的信息技术服务中往往存在着语义匹配任务。例如,在使用基于问答库的问答系统时,对用户提出的问题,需要系统理解语义并找到问答库内与之语义相同的问题,并返回答案。然而,由于自然语言的灵活性,用户可能的提问方式多种多样,使得搜索匹配的问题成为一个难题。在现有技术中,给出的解决方案是:已有问答库QASet=(Qi,Ai),1≤i≤n(n为问答库内问题总数),其中,Qi为问题库中的问题,Ai为对应的答案。对于用户提出的新问题Qa,需要构造如下函数f:

将Qi与QA分别转化为向量,并比较两个向量的夹角余弦值。两个向量夹角的余弦值通常代表它们之间的差异性。句向量的夹角余弦值越大,则认为这两句话的相关程度越高,以此来确定与用户的新问题语义相近的问题库中的问题,从而给出答案。

对于传统技术中以向量夹角余弦值的方式判断两个语句的语义相似度的方案,由于不同问题(或语句)中包含的词语范围很大,那么单纯的计算句向量之间的夹角余弦值,会使语义并不相关的句子仍得到较高的相似度得分,存在语义匹配准确率低的问题。

发明内容

本发明提供了一种语义匹配方法和系统,以解决现有技术中的语义匹配方案所存在的语义匹配准确率低的问题。

为了解决上述问题,根据本发明的一个方面,本发明公开了一种语义匹配方法,包括:

对至少一个领域内的任意一个第一语句、第二语句、第三语句分别作向量转换处理,得到所述至少一个领域内的第一语句句向量、第二语句句向量、第三语句句向量,其中,所述第二语句与所述第一语句语义相同,所述第三语句与所述第一语句语义不同;

将所述至少一个领域内的正样本、负样本分别作为训练样本输入至循环神经网络模型进行语义判断训练,得到用于所述至少一个领域的语义判断模型,其中,所述第一语句句向量和所述第二语句句向量作为一组正样本、所述第一语句句向量和所述第三语句句向量作为一组负样本;

将所述至少一个领域内任意一个目标领域的待识别语句的句向量以及所述目标领域内的目标候选语句的句向量作为一组待判断的句向量输入至所述语义判断模型,其中,所述目标领域内的每个候选语句的句向量轮流作为所述一组待判断的句向量中的所述目标候选语句的句向量;

依次计算所述待识别语句的句向量与所述目标领域内的每个候选语句的句向量之间的相似度;

将与所述待识别语句的句向量相似度最高的候选语句,确定为与所述待识别语句的语义相近的目标语句。

根据本发明的另一方面,本发明还公开了一种语义匹配系统,包括:

转换模块,用于对至少一个领域内的任意一个第一语句、第二语句、第三语句分别作向量转换处理,得到所述至少一个领域内的第一语句句向量、第二语句句向量、第三语句句向量,其中,所述第二语句与所述第一语句语义相同,所述第三语句与所述第一语句语义不同;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710375390.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top