[发明专利]一种基于网络爬虫的供应商推荐方法在审

专利信息
申请号: 201810670387.X 申请日: 2018-06-26
公开(公告)号: CN108960986A 公开(公告)日: 2018-12-07
发明(设计)人: 陈富民;关宗泊;姜洪权;陈琨;高智勇 申请(专利权)人: 西安交通大学
主分类号: G06Q30/06 分类号: G06Q30/06;G06F17/30;G06Q30/02
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 徐文权
地址: 710049 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于网络爬虫的供应商推荐方法,通过采用爬虫技术获取大量的供应商与其提供的企业信息,并通过数据清洗,特征提取,建立特征库。之后与需要进行供应商推荐的企业相关信和企业已有供应商信息特征进行相似度的计算,从而能够提供相应的推荐排序,供企业能够快速的选择适合自己的供应商,从而避免了人为考察供应商,进行大量供应商信息筛选的复杂过程,减少人力、物力的不必要消耗,并且随着数目的增加,推荐系统能够通过学习,从而使得推荐更加准确,这也是未来发展的一个趋势,能够更好的适应企业生产发展的方向。
搜索关键词: 供应商 供应商信息 网络爬虫 复杂过程 爬虫技术 企业生产 企业信息 数据清洗 特征提取 推荐系统 特征库 相似度 排序 筛选 消耗 考察 学习
【主权项】:
1.一种基于网络爬虫的供应商推荐方法,其特征在于,包括以下步骤:步骤1:通过python的分布式爬取框架scrapy‑redis从供应商网站爬取信息,所述信息包含供应商信息和供应商所提供产品的企业信息,并且通过爬虫技术获得需要进行供应商推荐的企业信息,如果企业已经有自己的供应商,则同时获得企业现有的供应商信息;步骤2:进行数据清洗,对爬虫爬到的信息进行清洗,选取相关的特征;步骤3:选择采用基于物品和基于用户的推荐相结合的协同过滤算法;对于爬到的信息清洗之后,如果企业是新成立的企业,并没有属于自己的供应商信息,采用基于用户的推荐算法,对与企业相似的企业进行排序,并通过推荐已有企业的供应商给需要推荐供应商的新的企业;对于已经拥有属于自己的供应商的企业,需要推荐供应商时,采用基于用户和基于物品的协同过滤结合的方法,对需要推荐供应商的企业和其已经存在的供应商信息特征与爬取到的企业与企业拥有的供应商信息特征进行相似度计算,分别按照基于用户和基于物品的协同过滤方法给出两种不同的排序,提供企业选择。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810670387.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top