[发明专利]一种基于网络爬虫的供应商推荐方法在审
申请号: | 201810670387.X | 申请日: | 2018-06-26 |
公开(公告)号: | CN108960986A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 陈富民;关宗泊;姜洪权;陈琨;高智勇 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F17/30;G06Q30/02 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于网络爬虫的供应商推荐方法,通过采用爬虫技术获取大量的供应商与其提供的企业信息,并通过数据清洗,特征提取,建立特征库。之后与需要进行供应商推荐的企业相关信和企业已有供应商信息特征进行相似度的计算,从而能够提供相应的推荐排序,供企业能够快速的选择适合自己的供应商,从而避免了人为考察供应商,进行大量供应商信息筛选的复杂过程,减少人力、物力的不必要消耗,并且随着数目的增加,推荐系统能够通过学习,从而使得推荐更加准确,这也是未来发展的一个趋势,能够更好的适应企业生产发展的方向。 | ||
搜索关键词: | 供应商 供应商信息 网络爬虫 复杂过程 爬虫技术 企业生产 企业信息 数据清洗 特征提取 推荐系统 特征库 相似度 排序 筛选 消耗 考察 学习 | ||
【主权项】:
1.一种基于网络爬虫的供应商推荐方法,其特征在于,包括以下步骤:步骤1:通过python的分布式爬取框架scrapy‑redis从供应商网站爬取信息,所述信息包含供应商信息和供应商所提供产品的企业信息,并且通过爬虫技术获得需要进行供应商推荐的企业信息,如果企业已经有自己的供应商,则同时获得企业现有的供应商信息;步骤2:进行数据清洗,对爬虫爬到的信息进行清洗,选取相关的特征;步骤3:选择采用基于物品和基于用户的推荐相结合的协同过滤算法;对于爬到的信息清洗之后,如果企业是新成立的企业,并没有属于自己的供应商信息,采用基于用户的推荐算法,对与企业相似的企业进行排序,并通过推荐已有企业的供应商给需要推荐供应商的新的企业;对于已经拥有属于自己的供应商的企业,需要推荐供应商时,采用基于用户和基于物品的协同过滤结合的方法,对需要推荐供应商的企业和其已经存在的供应商信息特征与爬取到的企业与企业拥有的供应商信息特征进行相似度计算,分别按照基于用户和基于物品的协同过滤方法给出两种不同的排序,提供企业选择。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810670387.X/,转载请声明来源钻瓜专利网。