[发明专利]企业信息搜索方法及装置有效
申请号: | 201911222316.4 | 申请日: | 2019-12-03 |
公开(公告)号: | CN111008265B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 司徒健聪;张甸 | 申请(专利权)人: | 腾讯云计算(北京)有限责任公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
地址: | 100000 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 企业信息 搜索 方法 装置 | ||
1.一种企业信息搜索方法,其特征在于,包括:
获取搜索内容;
解析所述搜索内容获得对应的搜索关键字词;
从预先创建的全文检索库中搜索与所述搜索关键字词相匹配的企业信息,所述全文检索库中存储标注有索引字词的企业信息;
其中,所述索引字词通过对企业信息的全文进行分词处理并对与预设索引词相匹配的字词进行标注得到,所述预设索引词包括表征政务和商务意义的企业术语;
对企业信息进行自动标注的过程,包括:对待标注企业信息的全文进行分词处理得到分词结果;对于所述分词结果中的每一个分词,计算该分词与预设索引词库中的任一索引词之间的相似度;当所述相似度大于或等于相似度阈值范围时,确定分词与所述索引词相匹配;获取所述索引词对应的预先设定的权重,以及与所述索引词相匹配的分词在所述待标注企业信息中出现的频率;依据分词出现的频率及与该分词相匹配的索引词的权重,选取目标索引字词;建立所述目标索引字词与所述待标注企业信息之间的关联关系,得到标注后的企业信息;
从预设时间段内获得的搜索关键字词中查找无命中字词,所述无命中字词表征从所述全文检索库中未搜索到相匹配的企业信息的搜索关键字词;
统计所述无命中字词在所述预设时间段内出现的次数;
当所述次数大于或等于预设次数范围时,将该无命中字词添加至所述预设索引词库中,得到更新后的预设索引词库。
2.根据权利要求1所述的方法,其特征在于,所述解析所述搜索内容获得对应的搜索关键字词,包括:
所述搜索内容为文本内容,解析所述搜索内容获得对应的语义内容;
从所述语义内容中提取得到至少一个搜索关键字词。
3.根据权利要求2所述的方法,其特征在于,所述从所述语义内容中提取得到至少一个搜索关键字词,包括:
从所述语义内容中提取至少一个关键字词;
将所述至少一个关键字词与预设敏感词库进行对比,删除与所述预设敏感词库中的敏感词相匹配的关键字词,得到与所述搜索内容相匹配的搜索关键字词。
4.根据权利要求2所述的方法,其特征在于,所述从所述语义内容中提取得到至少一个搜索关键字词,包括:
从所述语义内容中提取至少一个关键字词;
对于每个关键字词,查找预设同义词库中是否包含与该关键字词相对应的同义词,所述预设同义词库中包括预先自定义的与表征政务和商务意义的企业术语相对应的同义词;
将每个关键字词及具有同义词的关键字词所对应的同义词确定为与所述搜索内容相匹配的搜索关键字词。
5.根据权利要求1所述的方法,其特征在于,所述从预先创建的全文检索库中搜索与所述搜索关键字词相匹配的企业信息,包括:
计算所述搜索关键字词与所述全文检索库中的索引字词之间的相似度;
按照所述相似度由高到低的顺序确定前预设数量个企业信息为与所述搜索关键字词相匹配的企业信息。
6.根据权利要求5所述的方法,其特征在于,所述按照所述相似度由高到低的顺序确定前预设数量个企业信息为与所述搜索关键字词相匹配的企业信息,包括:
获取搜索结果返回策略,所述搜索结果返回策略包括输入所述搜索内容的用户所属的岗位属性、该用户的搜索习惯和搜索结果优先级中的至少一种;
依据所述搜索结果返回策略从相匹配的企业信息中筛选得到目标企业信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯云计算(北京)有限责任公司,未经腾讯云计算(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911222316.4/1.html,转载请声明来源钻瓜专利网。