[发明专利]一种供应商画像建模方法及系统在审
申请号: | 202110688987.0 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113345080A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 陈伟;郝松杰;张亮;路适远;赵晓华;黄永伟 | 申请(专利权)人: | 郑州信源信息技术股份有限公司 |
主分类号: | G06T17/00 | 分类号: | G06T17/00;G06K9/62;G06Q30/02;G06Q10/06;G06F16/21 |
代理公司: | 广州一锐专利代理有限公司 44369 | 代理人: | 甘奎强 |
地址: | 450000 河南省郑州市高*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 供应商 画像 建模 方法 系统 | ||
本发明包括用户信息收集单元、业务场景确定单元、基础数据获取单元,数据预处理单元、建模单元以及图像化展示单元,所述用户信息收集单元基于用户交易历史及习惯、用户的历史浏览记录和用户的收藏记录,获取供应商的有效评估数据,本发明利用大数据及K‑means算法相关技术,通过对历史采购数据的分析,对供应商进行全面画像建模,直观精准地反映报价行为、投标习惯、供应商履约能力及质量水平,借助信用中国、天眼查、企查查等第三方数据,全面构建经营风险、财务指标、知识产权、法律诉讼等维度的风险模型,形成全面的、真实的供应商画像,实现采购博弈中知彼知己,协助采购策略的智能制定和辅助决策。
技术领域
本发明涉及大数据分析与处理技术领域,具体为一种供应商画像建模方法及系统。
背景技术
随着大数据兴起与不断发展,基于外部第三方的数据来源的供应商信息维度越来越丰富,通过在各种数据中挖掘出采购想要的信息以及通过多维度的评估指标对供应商进行自动化评估成为可能,其中通过用户画像技术进行供应商的整体画像越来越受到客户的关注。
用户画像目前是互联网大数据中较为热门的技术之一,广泛运用于各大电商平台中,可根据用户交易历史及习惯,确定分类及用户模型,更一步的进行用户价值挖掘、提升服务等。目前采购系统中可以对单个供应商进行信息的查询,反馈,但很难通过多维度的信息对供应商进行量化的、有效的评估。供应商的管理缺失直观、可视化的管理手段和方法。通过建立供应商画像模型可以将纷乱的数据进行清洗和建模,提供进一步的分析决策。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供一种提升高采购效率,防范采购风险供应商画像建模方法及系统。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:一种供应商画像建模系统,包括用户信息收集单元、业务场景确定单元、基础数据获取单元,数据预处理单元、建模单元以及图像化展示单元,所述用户信息收集单元基于用户交易历史及习惯、用户的历史浏览记录和用户的收藏记录,获取供应商的有效评估数据,所述业务场景确定单元根据采购过程的生命周期对供应商管理的需要,确定供应商标签属性已经使用的业务场景,所述基础数据获取单元梳理供应商现有内部数据库清单,从公司内部相关系统中获取供应商注册、资格预审以及供应商评价,获取供应商的营业执照、型式试验报告内容、业绩内容、公司资质等资质内容,处罚、履约评价等基础内容,建立基础数据库,并对数据进行整理、分析、重组,所述数据预处理单元对得到的数据中存在有缺失值、重复值情况时,在使用之前进行数据预处理,所述建模单元依据采购平台历史数据及外部数据,采用K-means聚类算法,动态地划分业务标签属性,进而为用户提供全面、精准的供应商信息,所述图像化展示单元对获取的供应商大数据进行数据清洗,保证后续用来进行识别的数据能够充分表达供应商的业务知识体系,然后通过信息整合、分析等环节识别出供应商属性,定义标签。
为了提高基础数据单元获取数据的效果,本发明改进有,所述基础数据获取单元采用Restful接口风格,使用标准的HTTP请求方式,与国家企业信用信息公示系统、中国裁判文书网等进行数据定时提取对接。
为了提高数据预处理单元的使用效果,本发明改进有,所述数据预处理单元包括数据过滤单元以及数据优化单元,所述数据过滤单元包括重复数据去除单元、缺失值处理单元,所述数据优化单元包括属性编码单元、数据标椎化处理单元以及数据正则化处理单元。
为了提高对缺失值的补全效果,本发明改进有,所述缺失值处理单元包括均值插补模块、同类均值插补模块、建模预测模块、高维映射模块、多重插补模块、压缩感知模块、矩阵补全模块以及手动插补模块。
为了提高属性编码单元的编码效果,本发明改进有,所述属性编码单元包括特征二元化以及独热编码,所述特征二元化是将数值型的属性转换为布尔值的属性,设定一个阈值作为划分属性值为0和1的分隔点,所述独热编码采用N位状态寄存器来对N个可能的取值进行编码,每个状态都由独立的寄存器来表示,并且在任意时刻只有其中一位有效。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州信源信息技术股份有限公司,未经郑州信源信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110688987.0/2.html,转载请声明来源钻瓜专利网。