[发明专利]句子相似度计算方法和装置及系统有效
申请号: | 201710005472.X | 申请日: | 2017-01-04 |
公开(公告)号: | CN108268441B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 胡加学;孙胜杰;王道广;刘也宽 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 句子 相似 计算方法 装置 系统 | ||
本申请提出一种句子相似度计算方法和装置及系统,该句子相似度计算方法包括:获取待计算相似度的句子对;构建所述句子对中每个句子的依存句法树;根据预先构建的句子相似度计算模型以及所述每个句子的依存句法树,计算所述句子对中句子之间的相似度。该方法能够提高句子相似度计算的准确度。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种句子相似度计算方法和装置及系统。
背景技术
计算句子对中句子之间的相似度在自然语言处理领域具有非常广泛的应用前景,如在问答系统中通过计算句子对中句子之间的相似度找到与问题相匹配的答案;在信息检索系统中通过计算句子对中句子之间的相似度找到与用户需求相似的句子等;因此,准确的计算句子之间的相似度具有重要意义,同时如何准确的计算句子之间的相似度也一直是研究人员的研究热点。
相关技术中,一般是直接根据句子对中两个句子中词的词向量计算句子之间的相似度,这种方法考虑的信息较片面,从而降低了句子相似度计算的准确度。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的一个目的在于提出一种句子相似度计算方法,该方法可以提高句子相似度计算的准确度。
本申请的另一个目的在于提出一种句子相似度计算装置。
本申请的另一个目的在于提出一种句子相似度计算系统。
为达到上述目的,本申请第一方面实施例提出的句子相似度计算方法,包括:获取待计算相似度的句子对;构建所述句子对中每个句子的依存句法树;根据预先构建的句子相似度计算模型以及所述每个句子的依存句法树,计算所述句子对中句子之间的相似度。
为达到上述目的,本申请第二方面实施例提出的句子相似度计算装置,包括:获取模块,用于获取待计算相似度的句子对;依存句法树构建模块,用于构建所述句子对中每个句子的依存句法树;相似度计算模块,用于根据预先构建的句子相似度计算模型以及所述每个句子的依存句法树,计算所述句子对中句子之间的相似度。
为达到上述目的,本申请第三方面实施例提出的句子相似度计算系统,包括:客户端,用于接收用户输入的第一句子;服务端,用于接收客户端发送的第一句子,并在已有数据中获取第二句子,将所述第一句子和所述第二句子组成句子对;构建所述句子对中每个句子的依存句法树;根据预先构建的句子相似度计算模型以及所述每个句子的依存句法树,计算所述句子对中句子之间的相似度。
本申请实施例,通过构建句子的依存句法树,并基于依存句法树计算句子之间的相似度,由于依存句法树包含句子的句法信息,因此在计算句子之间的相似度时考虑了句子的句法信息,从而提高句子之间相似度计算的准确度。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一个实施例提出的句子相似度计算方法的流程示意图;
图2是本申请另一个实施例提出的句子相似度计算方法的流程示意图;
图3是本申请另一个实施例提出的句子相似度计算方法的流程示意图;
图4是本申请实施例中一种依存句法树的组成示意图;
图5是本申请实施例句子相似度计算模型的一种拓扑结构示意图;
图6是本申请实施例中进行卷积操作的示意图;
图7是本申请一个实施例提出的句子相似度计算装置的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710005472.X/2.html,转载请声明来源钻瓜专利网。