[发明专利]一种基于多维数据源的企业信息的获取方法及系统在审
申请号: | 202010938680.7 | 申请日: | 2020-09-09 |
公开(公告)号: | CN112052335A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 李欣阳;郑敏;吴呈良 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F16/33;G06F16/31 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜明 |
地址: | 214029 江苏省无锡市滨*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 数据源 企业信息 获取 方法 系统 | ||
1.一种基于多维数据源的企业信息的获取方法,其特征是所述的方法具体步骤如下:
S1根据更新频率和质量对获取的企业信息进行分类;
S2将分类的企业数据信息整理并推送;
S3选取维度对推送数据进行采集,录入企业成品信息库;
S4对企业信息汇总的数据质量进行考核与检查。
2.根据权利要求1所述的方法,其特征是所述S2将分类的企业数据信息整理并推送的具体步骤如下:
S201将企业数据信息加工成数据产品;
S202提取企业数据信息中的主要字段内容,形成待采集的企业名单。
3.根据权利要求2所述的方法,其特征是所述S3在待采集的企业名单中根据所需选取维度并进行采集,录入企业产品信息库。
4.根据权利要求3所述的方法,其特征是所述S4对企业信息汇总的数据质量进行考核与检查的具体步骤如下:
S401将整理出的企业信息汇总,并进行数据质量的核验与检查;
S402将质量不达标的数据废弃、并返回S3进行重新采集。
5.一种基于多维数据源的企业信息的获取系统,其特征是所述的系统具体包括信息分类模块、数据处理模块、采集录入模块和质量检测模块:
信息分类模块:根据更新频率和质量对获取的企业信息进行分类;
数据处理模块:将分类的企业数据信息整理并推送;
采集录入模块:选取维度对推送数据进行采集,录入企业成品信息库;
质量检测模块:对企业信息汇总的数据质量进行考核与检查。
6.根据权利要求5所述的系统,其特征是所述数据处理模块具体包括数据加工模块和数据提取模块:
数据加工模块:将企业数据信息加工成数据产品;
数据提取模块:提取企业数据信息中的主要字段内容,形成待采集的企业名单。
7.根据权利要求6所述的系统,其特征是所述采集录入模块在待采集的企业名单中根据所需选取维度并进行采集,录入企业产品信息库。
8.根据权利要求7所述的系统,其特征是所述质量检测模块具体包括数据整理模块和返回采集模块:
数据整理模块:将整理出的企业信息汇总,并进行数据质量的核验与检查;
返回采集模块:将质量不达标的数据废弃、并返回采集录入模块进行重新采集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010938680.7/1.html,转载请声明来源钻瓜专利网。