[发明专利]一种供应链数据向量化和可视化处理方法及装置有效
申请号: | 202111045671.6 | 申请日: | 2021-09-07 |
公开(公告)号: | CN113486630B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 朱海洋;陈为;严凡;钱中昊;毛科添;金慧颖;潘珂 | 申请(专利权)人: | 浙江大学;物产中大集团股份有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/289;G06F40/216;G06F16/35;G06K9/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 张明 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 供应 数据 量化 可视化 处理 方法 装置 | ||
本说明书实施例提供一种供应链数据向量化和可视化处理方法及装置。在向量化方法中,获取企业主数据,并从中提取内部子企业信息和外部业务合作企业信息。利用特征词提取模型,分别从两种信息中提取分词。将两种信息和对应的分词分别输入文本转换模型,得到对应的第一和第二特征向量。将得到的各特征向量进行融合,得到对应于企业主数据的目标特征向量。然后通过可视交互的方式将多条企业主数据的目标特征向量,以合适的降维算法和聚类算法展示在界面上,并通过观察确定合适的算法参数。最后可以直接基于聚类结果或者以可视化搜索的方式对可能的问题数据进行定位和清理。同时可视化搜索视图也支持对之前的搜索和修改记录进行版本回退和再次修正。
技术领域
本说明书一个或多个实施例涉及数据处理领域,尤其涉及一种供应链数据向量化和可视化处理方法及装置。
背景技术
数据是企业数字化转型成功与否的核心及关键,数据质量将直接影响数据分析的真实性、可靠性。随着现代互联网技术的不断发展,数据赋能为大型供应链集成服务集团公司带来的价值越来越大,并以此驱动企业各项业务经营及创新发展,提升企业管理水平,引领企业转型升级,不断创造出新的经济价值。从实践来看,大型供应链集成服务集团公司具有海量的数据体量、复杂的数据环境、潜在的数据缺陷等特点,其在对主数据、业务数据、分析数据等供应链数据进行分析、挖掘和应用的前期成本投入较多,但在数据应用阶段实际产生的价值往往与预期达到的目的偏差较大。其根本原因是因为企业往往只注重数据的分析、挖掘和结果应用,而没有重点关注数据处理的过程,导致数据质量不高,阻碍了集团级的数据集成和数据深度利用。因此,引入数据处理的工作是至关重要的,尤其是针对于大数据分析类型的系统开发与应用,数据处理的工作是必不可少的。
一个大型供应链集成服务集团公司由众多一级子企业以及下属各级子企业组成,为强化数据管理及集团管控,需要统一使用集团级的供应链数据库。但由于数据运营与管理的体系不健全,不同子企业之间的数据管理流程不完备,职责分工执行不到位,数据抽取、清洗、转换、汇集及分发过程中查重机制的不严谨,以及发现数据问题未能及时妥善处置等,都可能导致大量的不规则冗余数据产生,如企业主数据,包括内部子企业信息和外部业务合作企业(客户、供应商)信息,存在主数据重复等数据质量问题,成为制约企业数字化转型发展的瓶颈。在数字化转型实施推进过程中,如对存量数据没有有效的方法进行规范清洗去重,再如增量数据也没有进行有效查重,造成数据质量问题日积月累,将会严重影响数据的挖掘、分析与应用,给企业业务运营及管控带来较大影响。在企业日常数据运营管控中,这些冗余数据的处理,如采用传统的清洗方法,主要依赖于人工方式逐条进行数据审核及处理,因而效率低下只适用于小型数据集。如采用智能化的清洗方法虽然速度更快,但用户无法参与其数据处理执行过程,在处理复杂数据问题时无法保证清洗结果的可靠性。因此迫切需要提供一种解决方案,以便可以更高效更准确地对数据进行处理,对于企业挖掘数据价值、驱动业务创新,并有针对性地科学制定生产经营管理决策,具有十分重要的意义。
发明内容
本说明书一个或多个实施例描述了一种供应链数据向量化和可视化处理方法及装置,可以更高效更准确地对企业主数据进行处理。
第一方面,提供了一种供应链数据向量化方法,包括:
获取企业主数据;所述企业主数据包括内部子企业信息和外部业务合作企业信息;
从所述企业主数据中提取所述内部子企业信息和外部业务合作企业信息;
利用特征词提取模型,分别从所述内部子企业信息和外部业务合作企业信息中提取第一分词和第二分词;
将所述内部子企业信息与所述第一分词输入文本转换模型,以及,将所述外部业务合作企业信息与所述第二分词输入文本转换模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学;物产中大集团股份有限公司,未经浙江大学;物产中大集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111045671.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置