[发明专利]句子相似度确定方法、答案搜索方法、装置、设备、系统及介质在审
申请号: | 201911423253.9 | 申请日: | 2019-12-31 |
公开(公告)号: | CN113128201A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 章波;王睿;张月 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F16/33;G06F16/332 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰;兰淑铎 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 句子 相似 确定 方法 答案 搜索 装置 设备 系统 介质 | ||
本发明实施例提供了一种句子相似度的确定方法、答案的搜索方法、数据处理方法、商品信息的搜索方法、句子相似度模型的建立方法、装置、系统、电子设备及计算机存储介质,涉及人工智能技术领域。其中,所述方法包括:对第一句子和第二句子分别进行依存句法分析,以获得第一句子对应的第一依存句法树和第二句子对应的第二依存句法树;基于第一依存句法树和第二依存句法树,分别确定第一句子的第一依存句法信息和第二句子的第二依存句法信息;基于第一依存句法信息和第二依存句法信息,预测第一句子与第二句子的相似度。通过本发明实施例,能够充分利用句子中的词语的依存关系标签信息和句子对应的依存句法树表示的依存关系结构信息,从而有效提升句子相似度模型的性能。
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种句子相似度的确定方法、答案的搜索方法、数据处理方法、商品信息的搜索方法、句子相似度模型的建立方法、装置、系统、电子设备及计算机存储介质。
背景技术
计算句子对中句子之间的相似度在自然语言处理领域具有非常广泛的应用前景,如在问答系统中通过计算句子对中句子之间的相似度找到与问题相匹配的答案等。因此,准确地计算句子之间的相似度具有重要意义,同时如何准确地计算句子之间的相似度也一直是研究人员的研究热点。
在相关技术中,句子相似度的计算是在计算机被赋予丰富涵义词汇的基础上,通过句子间的特征构建句子相似度模型,使计算机能够快速匹配系统中最为相似的句子。具体地,一般是直接根据句子对中两个句子中词语的词向量计算句子之间的相似度,这种方法考虑的信息较片面,从而降低了句子相似度模型的性能。例如,句子对“老师叫小明去教室”和“小明叫老师去教室”,如果只按照句子中词语的语义计算相似度,那么这两个句子的意思相同,但显然它们的意思是有区别的。因此,如何有效提升句子相似度模型的性能成为当前亟待解决的技术问题。
发明内容
有鉴于此,本发明实施例提供一种句子相似度的确定方法、答案的搜索方法、数据处理方法、商品信息的搜索方法、句子相似度模型的建立方法、装置、系统、电子设备及计算机存储介质,以解决现有技术中存在的如何有效提升句子相似度模型的性能的技术问题。
根据本发明实施例的第一方面,提供了一种句子相似度的确定方法。所述方法包括:对第一句子和第二句子分别进行依存句法分析,以获得所述第一句子对应的第一依存句法树和所述第二句子对应的第二依存句法树;基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息,其中,所述第一依存句法信息包括所述第一句子中的词语的依存关系标签信息和所述第一依存句法树表示的第一依存关系结构信息,并且所述第二依存句法信息包括所述第二句子中的词语的依存关系标签信息和所述第二依存句法树表示的第二依存关系结构信息;基于所述第一依存句法信息和所述第二依存句法信息,预测所述第一句子与所述第二句子的相似度。
根据本发明实施例的第二方面,提供了一种句子相似度的确定装置。所述装置包括:分析模块,用于对第一句子和第二句子分别进行依存句法分析,以获得所述第一句子对应的第一依存句法树和所述第二句子对应的第二依存句法树;确定模块,用于基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息,其中,所述第一依存句法信息包括所述第一句子中的词语的依存关系标签信息和所述第一依存句法树表示的第一依存关系结构信息,并且所述第二依存句法信息包括所述第二句子中的词语的依存关系标签信息和所述第二依存句法树表示的第二依存关系结构信息;预测模块,用于基于所述第一依存句法信息和所述第二依存句法信息,预测所述第一句子与所述第二句子的相似度。
根据本发明实施例的第三方面,提供了一种答案的搜索方法。所述方法包括:确定接收到的答案搜索请求中携带的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度;基于所述相似度,确定所述问题的答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911423253.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:测试结果确定方法及装置
- 下一篇:一种芯片机器人