[发明专利]语句等价性判断方法和装置有效
申请号: | 201910832807.4 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110633359B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 王然;苏海波;孙伟;刘钰;杜晓梦;刘译璟 | 申请(专利权)人: | 北京百分点科技集团股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/211;G06N3/04 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
地址: | 100096 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 等价 判断 方法 装置 | ||
本申请实施例公开了一种语句等价性判断方法和装置,所述方法包括:获取待判断等价性的语句;将所述语句输入预先训练的等价性判断模型,所述等价性判断模型根据基于深度学习模型和人工特征模型的模型平均方法训练得到;通过所述等价性判断模型对所述语句进行等价性判断,得到等价性判断结果。通过本申请实施例,可以提高语句等价性判断的效率和精确性。
技术领域
本申请涉及机器学习、人工智能、自然语言处理技术领域,尤其涉及一种语句等价性判断方法和装置。
背景技术
随着人工智能技术的兴起,各个领域都从中受益,其中就包括备受业界关注的“问答机器人”领域。从最初基于“规则”的智能体到后来基于“知识图谱”的智能体,问答机器人的性能得到了较大改善,但由于自然语言表述的复杂性及多样性,如同义句的不同语言表达结构和异义句的相似语言表达结构,容易迷惑机器人,使其在理解问题时就会产生极大的偏差,进一步产生误差传递严重限制其性能提升。
目前对于句子等价性的研究,主要是基于深度学习方法,例如基于Siamese 框架的方法和匹配聚合框架的方法。在基于Siamese框架的方法中,对两个句子分别运用相同的神经网络编码器,使得句子被编码到相同的句子向量空间中,然后仅基于两个句子向量做出匹配决策。该框架的优点是共享参数使得模型小且容易训练,缺点是在编码过程期间两个句子之间没有明确的交互,导致可能丢失一些重要信息。在基于匹配聚合框架的方法中,匹配两个句子的较小单元(如单词或者上下文向量),然后将匹配结果聚合到向量中以做出最终决定。该框架可以捕获两个句子之间的更多交互的信息,但是模型的学习效率不够高,并且忽略了深层次的匹配,缺少双向匹配甚至任意距离的匹配。
因此,现有语句等价性判断方案存在效率低、精确性差的问题。
发明内容
本申请实施例提供一种基于语句等价性判断方法和装置,以解决现有语句等价性判断方案存在效率低、精确性差的问题。
为解决上述技术问题,本发明实施例是这样实现的:
第一方面,本发明实施例提供了一种语句等价性判断方法,包括:获取待判断等价性的语句;将所述语句输入预先训练的等价性判断模型,所述等价性判断模型根据基于深度学习模型和人工特征模型的模型平均方法训练得到;通过所述等价性判断模型对所述语句进行等价性判断,得到等价性判断结果。
第二方面,本发明实施例提供了一种语句等价性判断装置,包括:获取模块,用于获取待判断等价性的语句;输入模块,用于将所述语句输入预先训练的等价性判断模型,所述等价性判断模型根据基于深度学习模型和人工特征模型的模型平均方法训练得到;判断模块,用于通过所述等价性判断模型对所述语句进行等价性判断,得到等价性判断结果。
第三方面,本发明实施例提供了一种语句等价性判断的设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述第一方面所述的语句等价性判断方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的语句等价性判断方法的步骤。
在本发明实施例中,可以通过根据基于深度学习模型和人工特征模型的模型平均方法训练得到等价性判断模型,进行句子等价性判断,基于在自然语言处理领域表现良好的深度学习模型与深度学习模型可以互补的人工特征模型相结合,再使用模型平均的方法,可以获得拟合准确性和性能更佳的语句等价性判断模型,从而提高语句等价性判断的效率和精确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百分点科技集团股份有限公司,未经北京百分点科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910832807.4/2.html,转载请声明来源钻瓜专利网。