[发明专利]数据相关性示图生成方法及存储介质、硬件设备在审
申请号: | 201910142896.X | 申请日: | 2019-02-26 |
公开(公告)号: | CN110046282A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 朱凯旋 | 申请(专利权)人: | 维正知识产权服务有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东省深圳市南山区西丽街道茶*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据相关性 常量 表示数据 图生成 模式化数据 变量条件 存储介质 获取数据 数据对应 数据一致 特征信息 提取特征 硬件设备 连通图 相邻边 信息源 选择权 最大边 比对 推导 直观 | ||
本发明公开了一种数据相关性示图生成方法,涉及数据相关性识别,包括获取数据相关性准则图,数据相关性准则图包括表示数据的顶点、连接在顶点之间表示数据之间相关性的边及边的权值;获取体现数据相关性的特征信息源;提取特征信息源包含的常量条件,若常量条件与数据准则图中包含的任一数据一致,于数据准则图中标记该数据对应的顶点;在数据准则图中,比对任一已标记顶点相邻边的权值大小,选择权值最大边进行标记,将该已标记边所连接的另一顶点确定为变量条件进行标记;直至已标记顶点相邻的最大权值边全部标记,从数据准则图中提取已标记的顶点和边构成的连通图,形成数据相关性示图。支持模式化数据相关性的推导与表示,直观有效。
技术领域
本发明涉及数据相关性识别领域,更具体地说,它涉及一种数据相关性示图生成方法及存储介质、硬件设备。
背景技术
在推荐系统、搜索引擎等数据类的应用中,常常需要评估数据之间的相关性。例如在互联网知识产权服务平台中,给用户推荐一组可能有用的申报项目列表等。
在传统的数据关联应用中,常通过数据矩阵储存数据,相异性矩阵储存数据的相异性值,表示方法参照下表:
数据矩阵
相异性矩阵
数据矩阵的每个元素表示一个数据对象,相异性矩阵的每个元素表示数据对象与数据对象之间的邻近度(即差异程度)。当下,这种方式已有大量的聚类、分析算法可供使用。
但是,这种数据的表示形式仅仅表现两两数据之间的相关性,不太适合基于模式的数据类应用。而在知识产权领域,数据的关联性很适合用模式化的方法表示。如一个客户能不能申报某个项目,通常与客户所处的地域法规,客户拥有的专利数量,客户的企业规模都相关,而且有通用的关联规则。例如,上述描述可形式化表示如下:
RL1 ∧ RL2 ∧ RL3 => R (其中RLi可由其它规则推导)
其中R表示需要申报的项目,RL1表示地域法规,RL2表示专利数量规则,RL3表示企业资质规则,上面公式表示各个规则都需要满足。特别当数据关系变得复杂时,需要一种数据表示方法和处理方法去支撑模式推导。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种数据相关性示图生成方法及存储介质、硬件设备,用以支持模式化数据的相关性推导和表示。
为实现上述目的,本发明提供了如下技术方案:
第一方面,提供了一种数据相关性示图生成方法,基于图论,包括
获取数据相关性准则图,数据相关性准则图包括表示数据的顶点、连接在顶点之间表示数据之间相关性的边及边的权值;
获取体现数据相关性的特征信息源;
提取特征信息源包含的常量条件,若常量条件与数据准则图中包含的任一数据一致,于数据准则图中标记该数据对应的顶点;
在数据准则图中,比对任一已标记顶点相邻边的权值大小,选择权值最大边进行标记,将该已标记边所连接的另一顶点确定为变量条件进行标记;
直至已标记顶点相邻的最大权值边全部标记,从数据准则图中提取已标记的顶点和边构成的连通图,形成数据相关性示图。
在使用上述方法时,先对获取的特征信息源进行处理,提取常量条件,然后在数据准则图中,将与该常量条件相匹配的顶点进行标识,所谓匹配,即为该顶点对应的数据与常量条件一致,从而仅需要将常量条件与顶点对应的数据逐一比对即可。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维正知识产权服务有限公司,未经维正知识产权服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910142896.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据添加方法、装置及设备
- 下一篇:一种能源系统拓扑结构的构建方法及装置