[发明专利]基于ElasticSearch的企业名称搜索匹配方法及装置在审
申请号: | 202110415760.9 | 申请日: | 2021-04-16 |
公开(公告)号: | CN113190649A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 宋仲伟;常亚敏;高欣 | 申请(专利权)人: | 量子数聚(北京)科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F16/338;G06F40/126;G06F40/289 |
代理公司: | 北京知果之信知识产权代理有限公司 11541 | 代理人: | 卜荣丽;李志刚 |
地址: | 100071 北京市丰台区南四环西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 elasticsearch 企业名称 搜索 匹配 方法 装置 | ||
1.一种基于ElasticSearch的企业名称搜索匹配方法,其特征在于,包括:
获取输入信息,其中,所述输入信息包括搜索类型和输入文本;
根据输入文本并通过Lucene的评分计算方法计算每个企业信息的初始分值;
将每个企业信息的初始分值按照预设优化算法进行优化,确定优化分值;
将所述优化分值对应的企业信息,按照从高到底的顺序输出搜索结果。
2.根据权利要求1所述的基于ElasticSearch的企业名称搜索匹配方法,其特征在于,所述根据输入文本并通过Lucene的评分计算方法计算每个企业信息的初始分值包括:
根据输入文本的全文本并通过Lucene的评分计算方法计算每个企业信息的初始分值;或,
根据输入文本的分词结果并通过Lucene的评分计算方法计算每个企业信息的初始分值。
3.根据权利要求2所述的基于ElasticSearch的企业名称搜索匹配方法,其特征在于,若根据输入文本的全文本并通过Lucene的评分计算方法计算每个企业信息的初始分值,则在按照从高到底的顺序输出搜索结果之前,所述方法还包括:
判断搜索结果的数量是否超过预设数量;
若否,则继续根据输入文本的分词结果并通过Lucene的评分计算方法计算每个企业信息的初始分值,并将所述初始分值按照预设优化算法进行优化,确定优化分值,直到输出搜索结果。
4.根据权利要求2所述的基于ElasticSearch的企业名称搜索匹配方法,其特征在于,所述根据输入文本并通过Lucene的评分计算方法计算搜索结果的分值包括:
判断搜索类型是否为精准型,其中,所述精准型是指精准型的字符串;
若是,则根据输入文本的全文本并通过Lucene的评分计算方法计算每个企业信息的初始分值;
若否,则根据输入文本的全文本并通过Lucene的评分计算方法计算每个企业信息的初始分值和/或根据输入文本的分词结果并通过Lucene的评分计算方法计算每个企业信息的初始分值。
5.根据权利要求1所述的基于ElasticSearch的企业名称搜索匹配方法,其特征在于,所述将搜索结果的分值按照预设优化算法进行优化,包括:
根据企业信息对应的企业类型或经营状况或点击率,对所述初始分值增加或减少。
6.根据权利要求5所述的基于ElasticSearch的企业名称搜索匹配方法,其特征在于,所述根据企业信息对应的企业类型、经营状况或点击率,对所述初始分值增加或减少,包括以下一种或多种:
当企业信息中的企业类型为总公司、集团公司或母公司时,对企业信息对应的初始分值增加;
当企业信息中的企业类型为分公司或子公司时,对企业信息对应的初始分值减少;
当企业信息中的经营状况为在营企业,对企业信息对应的初始分值增加;
当企业信息中的经营状况为注销企业,对企业信息对应的初始分值减少;
当企业信息中的点击率超过预设点击阈值时,对企业信息对应的初始分值增加;
当企业信息中的点击率超过低于点击阈值时,对企业信息对应的初始分值减少。
7.根据权利要求6所述的基于ElasticSearch的企业名称搜索匹配方法,其特征在于,所述根据企业信息对应的企业类型对所述初始分值增加或减少还包括:
获取企业信息中包含的企业标签对应的企业标签编码;
将每个企业信息对应的所有企业标签编码对应的权重进行累加;
按照累加后的权重对每个企业信息对应的初始分值进行增加。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于量子数聚(北京)科技有限公司,未经量子数聚(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110415760.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:高炉渣热能回收系统
- 下一篇:一种麻栎木炭加工工艺