[发明专利]一种供应链数据分析和增强处理方法及装置有效
申请号: | 202210374815.0 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114443783B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 朱海洋;陈为;季永炜;周俊;金慧颖;应石磊;孙元园;朱建龙 | 申请(专利权)人: | 浙江大学;物产中大数字科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06N3/04;G06N3/08 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 张明 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 供应 数据 分析 增强 处理 方法 装置 | ||
本说明书实施例提供一种供应链数据分析和增强处理方法及装置,获取初始关系网络图,其中包括分别归属于三个分类的多个节点,其中,第一类节点与数据集相对应,第二类节点与数据文件相对应,第三类节点与数据列相对应,在具有隶属关系的两个分类的节点之间通过第一连接边连接。对于每个节点,根据对应数据对象的名称包含的各词对应的词向量,确定对应的名称向量。对于归属于同一个分类的各节点,分别基于对应的名称向量和内容向量,计算两两节点之间的模式相似度以及内容相似度,并基于模式相似度和内容相似度,在初始关系网络图中添加第二连接边和第三连接边,得到目标关系网络图。基于目标关系网络图针对供应链数据进行分析和增强处理。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种供应链数据分析和增强处理方法及装置。
背景技术
大型供应链集成服务集团公司的超大规模供应链数据主要涉及主数据、行为数据、业务数据、财务数据及第三方数据等诸多方面,普遍存在数据冗余、数据缺失、数据格式不一致及数据分布不平衡等问题,迫切需要研究一种新型数据分析和增强的技术解决方案,以便更高效、准确地改善数据质量,为大型供应链集成服务集团公司数字化转型奠定基础。数据分析和增强是数据处理过程中的一项基本任务,用于确定并优化与数据处理及数据应用项目相关的超大规模数据集。大宗商品供应链集成服务集团公司汇聚了超大规模的机器可读和结构化数据集。这些数据一般收集在一个被称为数据湖或者数据仓库的数据存储中。数据所有者一般通过一个数据中台系统提供这些数据集或构建新的数据集,如,国内的阿里云MaxCompute系统、网易有数系统、袋鼠云数栈系统、数澜科技数栖系统和国外的Talend系统等,这些大数据平台一般是通过数据资产目录或数据标签的形式支持检索目标数据,使得用于寻找、下载、准备和整合相关数据的时间和精力都比较多。随着数据应用的大量增加和数据分类、分级的管制,相似数据集大量存在,目标数据检索难度增大,数据处理效率大大降低。因此,迫切需要提供一种解决方案,用于数据模型相似度评估、分析、处理、优化,以及基于数据安全相关法律法规要求下进行数据服务和应用的数据处理工作,提高数据处理工作效率和数据使用合规性,以实现高效和可扩展的数据分析和增强。
发明内容
本说明书一个或多个实施例描述了一种供应链数据分析和增强处理方法及装置,可以更高效更准确地对供应链数据进行分析和增强。
第一方面,提供了一种供应链数据分析和增强处理方法,包括:
获取初始关系网络图;所述初始关系网络图包括分别归属于三个分类的多个节点,其中,归属于第一个分类的节点为第一类节点,该第一类节点与数据仓库中的数据集相对应;归属于第二个分类的节点为第二类节点,该第二类节点与数据集中的数据文件相对应;归属于第三个分类的节点为第三类节点,该第三类节点与从数据文件中抽取的数据列相对应;在具有隶属关系的两个分类的节点之间通过第一连接边连接;
对于所述多个节点中的每个节点,根据对应数据集、数据文件或者数据列的名称包含的各词对应的词向量,确定该节点的名称向量;
对于所述多个节点中归属于同一个分类的各节点,基于对应的名称向量,计算两两节点之间的模式相似度,以及基于对应的内容向量,计算两两节点之间的内容相似度;其中,任一节点的内容向量,根据对应数据集、数据文件或者数据列的内容包含的各词对应的词向量而确定;
基于所述模式相似度,在所述初始关系网络图中添加第二连接边,以及基于所述内容相似度,在所述初始关系网络图中添加第三连接边,得到目标关系网络图,所述目标关系网络图用于对供应链数据进行分析和增强处理。
第二方面,提供了一种供应链数据分析和增强处理装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学;物产中大数字科技有限公司,未经浙江大学;物产中大数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210374815.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置