[发明专利]企业关系图谱构建方法、装置、计算机设备以及存储介质在审
申请号: | 201910610328.8 | 申请日: | 2019-07-08 |
公开(公告)号: | CN110489599A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 林国胜 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/9038;G06F17/27 |
代理公司: | 44242 深圳市精英专利事务所 | 代理人: | 林燕云<国际申请>=<国际公布>=<进入 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 企业关系 企业实体 图谱 企业信息数据 企业信息 实体关系 图谱构建 预设图形 算法 企业信用信息 计算机设备 数据库生成 存储介质 公示系统 建立关系 命名实体 网络爬虫 抽取 数据库 保存 分析 | ||
1.一种企业关系图谱构建方法,其特征在于,所述方法包括:
使用网络爬虫算法从全国企业信用信息公示系统/企业年报/中爬取企业信息;
基于命名实体识别算法,从爬取到的所述企业信息中抽取企业实体、实体关系;
确定所述企业实体的属性值,并将所述企业实体的属性值、实体关系保存至预设图形数据库中;
根据所述预设图形数据库生成企业关系图谱。
2.如权利要求1所述的方法,其特征在于,所述使用网络爬虫算法从全国企业信用信息公示系统/企业年报/中爬取企业信息,包括:
确定所要爬取的全国企业信用信息公示系统/企业年报的URL地址;
遍历所确定的URL地址中的企业信息,并获取URL地址中的企业信息。
3.如权利要求1所述的方法,其特征在于,所述企业实体包括企业名称、企业法定代表人、企业股东、企业对外投资的企业名称以及企业员工姓名。
4.如权利要求1所述的方法,其特征在于,所述基于命名实体识别算法,从爬取到的所述企业信息中抽取企业实体、实体关系之后,所述方法还包括:
若企业信息中存在多个企业实体以及多个实体关系,将所抽取的多个企业实体存储于预设的实体集合中,将所抽取的多个实体关系存储于预设的关系集合中。
5.如权利要求1所述的方法,其特征在于,所述根据所述预设图形数据库生成企业关系图谱,包括:
从所述预设图形数据库中提取出企业实体关系数据,并根据所述企业实体关系数据确定企业ID和企业名称;
将所述企业ID和企业名称封装为企业节点并存放在预设节点数组中,在所述节点数组中添加企业股东和企业对外投资企业名称作为两个辅助节点;
将所述企业实体关系数据中的企业与自然人股东之间的股东关系、企业与企业股东之间的股东企业关系和企业与对外投资公司之间的对外投资关系存储到预设连线数组中;
使用网页画布将所述预设节点数组、辅助节点以及预设连线数组传入所述网页画布的力导向布局中,并根据所述网页画布的力导向布局生成所述企业关系图谱。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
若接收到用户的查询请求,根据所述查询请求在当前显示页面中显示与所述查询请求相对应的企业关系图谱。
7.一种企业关系图谱构建装置,其特征在于,所述装置包括:
爬取单元,用于使用网络爬虫算法从全国企业信用信息公示系统/企业年报/中爬取企业信息;
抽取单元,用于基于命名实体识别算法,从爬取到的所述企业信息中抽取企业实体、实体关系;
确定保存单元,用于确定所述企业实体的属性值,并将所述企业实体的属性值、实体关系保存至预设图形数据库中;
生成单元,用于根据所述预设图形数据库生成企业关系图谱。
8.如权利要求7所述的装置,其特征在于,所述爬取单元,包括:
确定单元,用于确定所要爬取的全国企业信用信息公示系统/企业年报的URL地址;
遍历获取单元,用于遍历所确定的URL地址中的企业信息,并获取URL地址中的企业信息。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6任一项所述的企业关系图谱构建方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序可被一个或者一个以上的处理器执行,以实现如权利要求1-6任一项所述的企业关系图谱构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910610328.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用户社团划分方法及装置
- 下一篇:一种空气污染传播模式的可视分析系统