[发明专利]一种cognos报表指标的知识图谱分析方法及系统有效
申请号: | 201911240177.8 | 申请日: | 2019-12-06 |
公开(公告)号: | CN110955801B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 邓智鸿;张东凯;欧万翔;徐国柱 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06F16/835 | 分类号: | G06F16/835;G06F16/36;G06F40/289 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 赵平;周永君 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 cognos 报表 指标 知识 图谱 分析 方法 系统 | ||
1.一种cognos报表指标的知识图谱分析方法,其特征在于,包括:
对cognos报表样式文件进行实体抽取得到第一实体信息,具体包括:将用于存放报表样式的cognos报表样式文件导出至XML数据包文件中得到XML数据形式的cognos报表样式文件;对XML数据形式的cognos报表样式文件通过半结构化抽取得到第一实体信息,所述第一实体信息包括报表实体、指标实体、关系实体和属性实体;
对报表应用平台发布的报表对应的报表应用信息进行实体抽取得到第二实体信息,具体包括:获取报表应用平台发布的报表对应的报表信息;根据所述报表信息确定与报表关联的数据库信息;对包括所述报表信息和所述数据库信息的报表应用信息进行实体抽取得到第二实体信息,所述第二实体信息包括报表发布名称、报表发布路径、发布报表的授权岗位信息、报表设置参数、报表访问量以及报表运行的平均响应时间中的至少一种;
对所述第一实体信息和第二实体信息进行融合处理得到标准化实体信息,具体包括:将所述第一实体信息和第二实体信息进行实体对齐,将实体对齐后的第一实体信息的指标实体通过自然语言处理方法消歧和融合形成标准化实体信息,将所述第一实体信息和第二实体信息进行实体对齐具体包括:对于第一实体信息中的报表实体的实体对齐,从Cognos的半结构化XML内容中提取出所有后台报表ID、报表名称和发布路径,构建第一报表实体,然后从结构化数据中提取用户前台发布的报表名称、发布路径、报表参数和报表访问量,构建第二报表实体,第一报表实体与第二报表实体以报表名称和发布路径关联,去除干扰信息,形成新的包含报表ID、报表名称、发布路径、报表参数、报表访问量的实体,完成实体对齐;对于第一实体信息中的指标实体的实体对齐,从Cognos的半结构化XML内容提取出报表中的属性,并解析出报表层面的加工规则和对应报表模型的属性映射规则,导入模型的数据指引,根据模型字段类型说明来区分模型指标和属性,进行报表模型和指标的关联,识别报表模型中的指标,形成指标实体;
根据所述标准化实体信息形成报表指标知识图谱,根据所述知识图谱形成报表模板并向用户反馈。
2.根据权利要求1所述的知识图谱分析方法,其特征在于,所述根据所述标准化实体信息形成报表指标知识图谱具体包括:
将所述标准化实体信息存储至图数据库中;
通过图数据库得到报表实体与指标实体、指标实体与指标实体以及指标实体与数据库信息间的关系并形成知识图谱,根据所述知识图谱形成报表模板并向用户反馈。
3.根据权利要求1所述的知识图谱分析方法,其特征在于,所述方法还包括以下步骤的至少之一:
确定所述知识图谱是否存在敏感信息;
确定所述知识图谱中的中心指标;
确定所述知识图谱中的孤立指标;
根据所述知识图谱分析进行指标影响性分析;
根据所述知识图谱进行指标检索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911240177.8/1.html,转载请声明来源钻瓜专利网。