[发明专利]一种适用于B2B电子商务平台的商品信息自动分类推荐方法有效
申请号: | 201310674950.8 | 申请日: | 2013-12-11 |
公开(公告)号: | CN103605815A | 公开(公告)日: | 2014-02-26 |
发明(设计)人: | 薛春香;王美瑄;邹苇;李莉 | 申请(专利权)人: | 焦点科技股份有限公司;南京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 张苏沛 |
地址: | 210061 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 b2b 电子商务平台 商品信息 自动 分类 推荐 方法 | ||
1.一种适用于B2B电子商务平台的商品信息自动分类推荐方法,其特征在于:通过对B2B电子商务平台中已有的商品分类信息进行处理,生成商品分类知识库,将卖家新提交的商品标题和描述信息进行抽取和表征,将表征结果与商品分类知识库中的记录进行相似度计算,找出最相似的记录,将其对应的分类信息推荐给卖家。
2.根据权利要求1所述的商品信息自动分类推荐方法,其特征在于,具体步骤包括:
步骤一、收集B2B电子商务平台上已处理的商品信息,基于已分类商品信息构建商品分类知识库;
步骤二、对卖家新提交的商品标题和描述信息进行分词、抽词、频次统计和位置加权,形成商品特征词串;
步骤三、将新提交商品的特征词串与分类知识库中每一条记录中的类目特征词串进行相似度计算,将相似度最高的记录中的分类代码推荐给新提交的商品。
3.根据权利要求1所述的商品信息自动分类推荐方法,其特征在于,具体步骤包括:
步骤一、收集B2B电子商务平台中已处理过的商品数据,形成初始的商品实例数据库,该数据库中每一条记录应包括基本的商品编号、商品标题、商品描述信息、商品分类代码;
步骤二、对商品实例数据库中存在的一个商品对应多个分类代码的情况进行处理,对应几个分类代码就拆分成几条记录,使每一条记录中每个商品只对应一个分类代码;
步骤三、对商品实例数据库中的商品标题和描述信息进行分词、抽词、频次统计和位置加权处理,形成类目特征词串;
步骤四、采用支持度、置信度来衡量类目特征词串与分类代码之间的对应关系;
步骤五、将支持度、置信度达到一定阈值的记录保留,生成商品分类知识库。
4.根据权利要求3所述的商品信息自动分类推荐方法,其特征在于:
对初始的商品实例数据库中的每条数据进行处理,以通用的分词软件对标题和商品描述信息进行分词、词频统计,构建一个基本的商品品名表,用来对商品标题和描述信息进行抽词,以便更准确地抽取商品品名;
将过滤后的结果按照分类代码序化生成分类知识库,包括分类代码和类目特征词串两个字段;同时,将所有类别特征词串中的分词进行收集、去重,形成一个商品信息分词词表用于对新商品的分词、抽词处理;分类知识库构建完成后,当有新提交的商品,通过对卖家提供的商品标题和描述信息处理,形成商品特征词串,将商品特征词串与分类知识库中所有记录中的类别特征词串计算相似度来找对最合适的分类代码。
5.根据权利要求4所述的商品信息自动分类推荐方法,其特征在于:依据相似度计算公式,将新商品的特征词串与商品分类知识库中每一条记录的类目特征词串进行相似度计算和语义相似度计算;当相似度最大值有多条记录时,将相似度最大的记录集中同一类目出现次数最多的类目信息进行推荐,或者推荐多个分类。
6.一种适用于B2B电子商务平台的商品信息自动分类推荐方法,其特征在于,包括:
基于已分类商品信息构建商品分类知识库;
抽取卖家新提交商品的标题和描述信息;
对新提交商品信息标题和描述信息进行分词、抽词、频次统计、加权,形成基于关键词串的特征表示;
将新提交商品特征词串与商品分类知识库中的分类实例通过相似度计算进行实例匹配;
将最相似的实例所对应的分类信息推荐给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司;南京理工大学,未经焦点科技股份有限公司;南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310674950.8/1.html,转载请声明来源钻瓜专利网。