[发明专利]基于行业分类的检索方法、检索装置及可读存储介质在审
申请号: | 201910806758.7 | 申请日: | 2019-08-27 |
公开(公告)号: | CN110619067A | 公开(公告)日: | 2019-12-27 |
发明(设计)人: | 许赵云;许明峰;胡新平;陈明忠;毛瑞彬;赵剑;宋娜;李爱文 | 申请(专利权)人: | 深圳证券交易所 |
主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06F16/906 |
代理公司: | 44287 深圳市世纪恒程知识产权代理事务所 | 代理人: | 黄嗣童 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行业分类 预设 可读存储介质 检索 公司信息 检索装置 关键词更新 检索关键词 检索请求 检索数据 关联 分类 更新 | ||
本发明公开一种基于行业分类的检索方法、检索装置及可读存储介质,所述基于行业分类的检索方法,包括:获取与行业分类相关的行业分类文件;对所述行业分类文件的内容进行共现处理得到共现关键词;根据所述共现关键词更新所述预设行业分类词;根据更新后的所述预设行业分类词对关联的公司信息重新分类,其中,在接收到检索请求后,根据检索关键词对应的预设行业分类词获取对应的公司信息。本发明提供一种基于行业分类的检索方法、检索装置及可读存储介质,解决了现有技术中对新兴行业的检索数据不完整不准确的问题。
技术领域
本发明涉及信息检索技术领域,尤其涉及一种基于行业分类的检索方法、检索装置及可读存储介质。
背景技术
信息检索是在已有的信息数据库中检索与要求相关的信息内容,在基于行业分类的检索中,通过参考公司的行业特征和经营产品的特征对相似的公司或产品进行检索,从而获得相近的公司或相近的产品,方便用户对不同公司之间或不同产品之间进行对比及分析。
在现有技术中,随着新兴行业的出现以及现有公司的跨行业经营,在对公司进行行业分类时,由于新兴行业无法准确的通过现有行业分类的规则进行确定,因此在对涉及新兴行业的内容进行检索时,无法准确的获取与新兴行业相关的信息,从而导致检索数据不完整切不准确。
发明内容
本发明提供一种基于行业分类的检索方法、检索装置及可读存储介质,旨在解决现有技术中对新兴行业的信息检索数据不完整不准确的问题。
为实现上述目的,本发明提出了一种于行业分类的检索方法,所述基于行业分类的检索方法,包括:
获取与行业分类相关的行业分类文件;
对所述行业分类文件的内容进行共现处理得到共现关键词;
根据所述共现关键词更新预设行业分类词;
根据更新后的所述预设行业分类词对关联的公司信息重新分类,其中,在接收到检索请求后,根据检索关键词对应的预设行业分类词获取对应的公司信息。
可选地,所述对所述行业分类文件的内容进行共现处理得到共现关键词的步骤,包括:
对所述行业分类文件进行聚类处理得到至少一个文件组;
对所述文件组内的行业分类文件的内容进行共现处理得到所述文件组对应的共现关键词。
可选地,所述对所述行业分类文件进行聚类处理得到至少一个文件组的步骤,包括:
获取各个所述行业分类文件的文件向量,并获取各个所述文件向量之间的距离;
将所述距离小于预设距离的所述文件向量对应的行业分类文件聚类为一个所述文件组。
可选地,所述对所述文件组内的行业分类文件的内容进行共现处理得到所述文件组对应的共现关键词的步骤,包括:
提取各个所述行业分类文件的内容中的关键词;
获取各个所述关键词重复出现的次数;
将所述次数大于预设次数的关键词作为所述共现关键词。
可选地,所述根据所述共现关键词更新所述预设行业分类词的步骤,包括:
获取所述共现关键词的词向量;
根据所述词向量与预设词向量,更新所述预设行业分类词。
可选地,所述根据所述词向量与预设词向量,更新所述预设行业分类词的步骤,包括:
获取所述词向量与所述预设词向量的相似度;
当所述相似度大于或等于预设相似度时,采用所述词向量相关联的所述共现关键词更新所述预设行业分类词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳证券交易所,未经深圳证券交易所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910806758.7/2.html,转载请声明来源钻瓜专利网。