[发明专利]政务图谱模型构建方法、装置、设备及计算机可读介质在审
申请号: | 202011409775.6 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112463985A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 邓亮;王晓旭 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/30;G06F16/951;G06Q50/26 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 曾军;杜欣 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 政务 图谱 模型 构建 方法 装置 设备 计算机 可读 介质 | ||
1.一种政务图谱模型构建方法,其特征在于,包括:
获取目标政务数据,其中,所述目标政务数据为从互联网政务领域中采集得到的,用于表示法人扩展信息;
从预设的法人图谱知识库中提取与所述目标政务数据匹配的图谱知识,其中,所述法人图谱知识库为根据通用政务知识图谱的构建数据得到的;
利用所述图谱知识对所述目标政务数据构建所述法人扩展信息的知识图谱。
2.根据权利要求1所述的方法,其特征在于,获取目标政务数据包括以下方式中的至少一种:
从第一抓取链路的起始页开始,依次抓取所述第一抓取链路中的各个页面中的所述目标政务数据;在所述第一抓取链路的所有页面均抓取完毕且不满足结束条件的情况下,继续从第二抓取链路的起始页开始,依次抓取所述第二抓取链路中的各个页面中的所述目标政务数据,直至满足所述结束条件时,终止抓取数据;
抓取当前页面中的所述目标政务数据;在不满足所述结束条件的情况下,从所述当前页面中的多个链接中确定目标链接,并抓取所述目标链接所指向的目标页面中的所述目标政务数据,直至满足所述结束条件时,终止抓取数据。
3.根据权利要求1所述的方法,其特征在于,从预设的法人图谱知识库中提取与所述目标政务数据匹配的图谱知识包括:
提取所述目标政务数据所要构建的所述知识图谱的模型标识;
从预设的所述法人图谱知识库中提取与所述模型标识匹配的数据分类标签、数据编码标准及实体关联关系中的至少一种。
4.根据权利要求3所述的方法,其特征在于,利用所述图谱知识对所述目标政务数据构建所述法人扩展信息的知识图谱包括:
利用所述数据分类标签对所述目标政务数据进行分类,其中,所述数据分类标签包括工商信息、股东信息、主要人员信息、分支机构信息、年报信息、税务评级、违法信息、司法协助信息及失信人信息中的至少一种;
将分类后的所述目标政务数据按照所述数据编码标准进行编码;
按照所述实体关联关系对编码后的所述目标政务数据进行关联;
利用关联后的所述目标政务数据构建所述知识图谱。
5.根据权利要求4所述的方法,其特征在于,利用关联后的所述目标政务数据构建所述知识图谱,包括:
从所述目标政务数据中确定目标法人;
提取所述目标法人的本体数据集,其中,所述本体数据集中的数据用于表示与所述目标法人关联的对象、企业、社会组织、道路、楼房及互联网文本中的至少一种;
以所述目标法人为主实体,以所述目标法人所在的业务领域为子实体,按照所述本体数据集指示的所述对象、企业、社会组织、楼房、道路及互联网文本之间的关联关系构建所述主实体与所述子实体、所述子实体与所述子实体之间的关联边。
6.根据权利要求3至5任一所述的方法,其特征在于,从预设的法人图谱知识库中提取与所述目标政务数据匹配的图谱知识之前,所述方法还包括按照如下方式中的至少一种确定所述数据分类标签,并将所述数据分类标签保存在所述法人图谱知识库中:
获取第一参照数据集;将所述第一参照数据集中的数据转换为特征向量;确定所述特征向量之间的余弦相似度,并将所述余弦相似度小于目标阈值的所述特征向量归为同一个分类数据集中;确定不同的所述分类数据集的所述数据分类标签,并将所述数据分类标签和所述分类数据集保存在所述法人图谱知识库中;
获取第二参照数据集,其中,所述第二参照数据集用表结构进行保存;对所述表结构的所述第二参照数据集进行语义识别;按照识别结果进行分类;确定每一类的所述数据分类标签;将所述数据分类标签和所述识别结果保存在所述法人图谱知识库中。
7.根据权利要求1至5任一所述的方法,其特征在于,利用所述图谱知识对所述目标政务数据构建所述法人扩展信息的知识图谱之后,所述方法还包括:
获取验证数据;
利用所述验证数据对所述法人扩展信息的所述知识图谱进行验证;
在验证结果指示所述知识图谱的准确率达到目标阈值时,验证通过。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011409775.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:线头无人化搬运系统的方法
- 下一篇:一种机电设备维修用减震装置