[发明专利]查询结果匹配度计算方法及装置有效

专利信息
申请号: 202010033113.7 申请日: 2020-01-13
公开(公告)号: CN111221943B 公开(公告)日: 2023-08-08
发明(设计)人: 何旺贵;苑爱泉;王晓峰;王磊;桑梓森;邓哲宇;王宇昊;李向阳;芦亚飞;朱培源 申请(专利权)人: 口口相传(北京)网络技术有限公司
主分类号: G06F16/33 分类号: G06F16/33
代理公司: 北京中强智尚知识产权代理有限公司 11448 代理人: 贾依娇
地址: 100102 北京市朝*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 查询 结果 匹配 计算方法 装置
【说明书】:

发明实施例公开了一种查询结果匹配度计算方法及装置,方法包括:获取查询句以及查询句对应的至少一个查询结果的描述句;将查询句对应的查询词序列集合与任一描述句对应的描述词序列集合进行匹配得到至少一个n元词组;对至少一个n元词组进行归类,得到至少一个n元词组集合;针对任一n元词组集合中任一n元词组,根据匹配因子计算该n元词组所包含的每个单词的匹配分,匹配因子包含单词的权重因子和紧密度因子;根据各个n元词组的各个单词的匹配分,计算得到n元词组集合的匹配分;对至少一个n元词组集合的匹配分进行融合计算,得到查询结果的匹配度。采用n元词组集合的方式,鼓励连续匹配和语义地完整性,从而有效地抑制破碎匹配。

技术领域

本发明实施例涉及文本匹配计算技术领域,具体涉及一种查询结果匹配度计算方法及装置。

背景技术

在查询时,查询句与查询结果的匹配度代表了查询结果是否与查询句紧密相关。匹配度越高越紧密,说明对应的查询结果越能满足用户的查询需求,提升用户的查询体验。

现有技术在查询时所采用的查询引擎往往是将查询结果中的多个单词拼接在一起,将查询句进行切词处理后的单词进行召回,当查询句按照细粒度进行切词处理时,召回的数量较多,查询句中多个细粒度的单词能够分别命中查询结果中的多个单词。由于查询句大多为较短文本句,一般包含一个独立的实体信息或者包含单一的语义,而查询结果的不同字段往往包含不同语义或不同的实体信息,导致在字面上命中度高或相似度高,但实体信息差异较大。例如查询结果为餐品名称,“宫保鸡丁面”和“宫保鸡丁盖浇饭”两者的相似度很高,但两者分别属于不同的餐品,其实体区别较大。这种匹配算法基于单个单词进行匹配容易造成字段破碎匹配的情形。以查询句为中心进行归一化处理时,注重查询句单词本身的匹配,使得在缺乏查询结果匹配连续性信息的情况下无法区分完全匹配和部分匹配的情形,没有融入自然语言查询的理解,没有结合查询结果中各字段的相关性等信息。

发明内容

鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的查询结果匹配度计算方法及装置。

根据本发明实施例的一个方面,提供了一种查询结果匹配度计算方法,其包括:

获取查询句以及查询句对应的至少一个查询结果的描述句;

将查询句对应的查询词序列集合与任一描述句对应的描述词序列集合进行匹配得到至少一个n元词组;其中n为正整数;

对至少一个n元词组进行归类,得到至少一个n元词组集合;

针对任一n元词组集合中任一n元词组,根据匹配因子计算该n元词组所包含的每个单词的匹配分,匹配因子包含单词的权重因子和紧密度因子;以及,根据各个n元词组的各个单词的匹配分,计算得到n元词组集合的匹配分;

对至少一个n元词组集合的匹配分进行融合计算,得到查询结果的匹配度。

可选地,在获取查询句之后,方法还包括:对查询句进行切词处理,得到查询句对应的查询词序列集合;

获取查询句对应的至少一个查询结果的描述句进一步包括:根据查询句对应的查询词序列集合进行查询,获取与查询词序列集合匹配的至少一个查询结果的描述句;

方法还包括:将至少一个查询结果的描述句进行切词处理,得到描述句对应的描述词序列集合。

可选地,将查询句对应的查询词序列集合与任一描述句对应的描述词序列集合进行匹配得到至少一个n元词组进一步包括:

根据描述词序列集合过滤查询词序列集合中未匹配的单词,得到过滤后的查询词序集合;

将查询词序列集合与描述词序列集合按照匹配序列进行匹配,基于查询词序列中n个单词的序列相关性,得到至少一个n元词组;其中,n元词组由n个单词组成;不同n元词组中包含的单词不重复。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于口口相传(北京)网络技术有限公司,未经口口相传(北京)网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010033113.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top