[发明专利]一种关键词存储方法及装置有效
申请号: | 201611070488.0 | 申请日: | 2016-11-28 |
公开(公告)号: | CN108121712B | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 王天祎 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/50 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王雪;王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关键词 存储 方法 装置 | ||
本发明公开一种关键词存储方法及装置,该方法包括:对关键词数据库中的关键词进行切词处理,得到各个关键词的分词;将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配,其中,所述关系实体集合中包括由具有特定关系的节点实体构成的图结构;利用匹配成功的分词构建图结构,其中,所述匹配成功的分词作为所述图结构的节点信息进行存储,各个分词之间具有的所述特定关系作为所述图结构的边进行存储;将所述图结构存储于图数据库中,以供用户进行查询。本发明利用图数据库对关键词进行存储,能够提高对关键词的查询效率。
技术领域
本发明涉及数据处理领域,具体涉及一种关键词存储方法及装置。
背景技术
目前,关键词数据库只能支持用户通过字符串的包含关系一个一个的筛选,例如存在分析“华为P8”与“华为P9”哪个表现好的业务需求时,系统需要从关键词数据库中一个一个的筛选匹配,从而查询到包含有“华为P8”或“华为P9”的关键词。可见,基于现有技术中关键词的存储方式,对关键词进行查询的方法效率较低。
发明内容
鉴于上述问题,本发明提供了一种关键词存储方法及装置,基于本发明提供的关键词存储方法对关键词进行查询,能够提高对关键词的查询效率。
本发明提供了一种关键词存储方法,所述方法包括:
对关键词数据库中的关键词进行切词处理,得到各个关键词的分词;
将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配,其中,所述关系实体集合中包括由具有特定关系的节点实体构成的图结构;
利用匹配成功的分词构建图结构,其中,所述匹配成功的分词作为所述图结构的节点信息进行存储,各个分词之间具有的所述特定关系作为所述图结构的边进行存储;
将所述图结构存储于图数据库中,以供用户进行查询。
优选地,所述将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配之前,还包括:
利用网络爬虫爬取网页内容,并从所述网页内容中提取具有特定关系的数据信息,构成关系实体集合。
优选地,所述方法还包括:
以预设频率更新所述关系实体集合。
优选地,所述方法还包括:
接收用户的数据分析需求,并根据所述数据分析需求在所述图数据库中查询目标关键词,所述数据分析需求为关键词文本或关键词图结构。
优选地,所述根据所述数据分析需求在所述图数据库中查询目标关键词,包括:
当所述数据分析需求为关键词文本时,将所述数据分析需求进行切词处理,得到查询目标;根据所述查询目标,在所述图数据库中查询目标关键词;
或者,当所述数据分析需求为关键词图结构时,从所述关键词图结构中提取查询目标;根据所述查询目标,在所述图数据库中查询目标关键词。
优选地,所述方法还包括:
根据所述目标关键词,在关键词指标数据库中查询所述目标关键词的指标数据,以供用户进行数据分析。
本发明还提供了一种关键词存储装置,所述装置包括:
切词模块,用于对关键词数据库中的关键词进行切词处理,得到各个关键词的分词;
匹配模块,用于将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配,其中,所述关系实体集合中包括由具有特定关系的节点实体构成的图结构;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611070488.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法和客户端设备
- 下一篇:服务提供方法和装置