[发明专利]一种类目路径识别方法及系统有效
申请号: | 201210572005.2 | 申请日: | 2012-12-25 |
公开(公告)号: | CN103902545B | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 胡德凤;朱正平;马超 | 申请(专利权)人: | 北京京东尚科信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 谢安昆;宋志强 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 类目 路径 识别 方法 系统 | ||
本发明实施例公开了一种类目路径识别方法及系统,本发明实施例中的方法包括:根据用户输入的商品标题确定所述商品标题的类目路径,而不需要用户逐级确定该商品标题的类目路径。本发明实施例方法包括:获取用户输入的商品标题;对该商品标题进行分词处理,得到商品标题中的关键词集合;根据关键词集合及预置的商品类目识别模型确定商品标题的类目路径,能够有效的实现商品标题的类目路径的识别,且避免因用户操作失误导致的类目出错的情况,提高了类目识别的操作效率及准确率。
技术领域
本发明涉及数据处理领域,尤其涉及一种类目识别方法及装置。
背景技术
随着电子商务的发展,开网店和网购在网民中越来越普遍,网上交易系统提供一个网上交易平台,站点中的所有商品都会归属到一个分类路径之下,这样能方便用户找到想要的商品,这个分类可称为类目,例如:“美特斯邦威运动长裤”这样的商品所属的类目路径即为“运动服饰/包/配件>运动服饰>运动长裤”,这里“运动服饰/包/配件”是一级类目,“运动服饰”是二级类目,“运动长裤”是三级类目。网上交易平台可按照类目对网店的商品进行管理。
在消费者与消费者(英文全称:Consumer to Consumer,缩写:C2C)网站或商家对顾客(英文全称:Business-to-Customer,缩写:B2C)网站中,卖家或运营人员发布商品时,除了填写商品名称外,还需要手工去选择商品的一级类目,二级类目,直到最低级类目,每一级类目又有若干种选择需要卖家仔细查看;甚至有多个类目都比较适合,但又都不是特别适合的状况发生,这会让用户非常踌躇,且容易出现类目错误的情况。
发明内容
本发明实施例提供了一种类目路径识别方法及系统,用于根据用户输入的商品标题确定所述商品标题的类目路径,而不需要用户逐级确定该商品标题的类目路径,能够有效的实现商品标题的类目路径的识别,且避免因用户操作失误导致的类目出错的情况,提高了类目识别的操作效率及准确性。
本发明一方面提供了一种类目路径识别方法,可包括:
获取用户输入的商品标题;
对所述商品标题进行分词处理,得到所述商品标题中的关键词集合;
根据所述关键词集合及预置的商品类目识别模型确定所述商品标题的类目路径。
在第一方面第一种可能的实现方式中,所述根据所述关键词集合及预置的商品类目识别模型确定所述商品标题的类目路径包括:
利用所述关键词集合查找所述商品类目识别模型中的关键词与类目路径计数表确定包含所述关键词集合的类目路径的集合,所述关键词与类目路径计数表中包含类目路径与关键词之间的对应关系,及所述关键词在对应的类目路径下的出现次数的计数值;
分别计算所述类目路径的集合中每一个类目路径的综合计数值;
选取所述类目路径的集合中综合计数值最大的类目路径作为所述商品标题的类目路径。
结合第一方面或者第一方面第一种可能的实现方式,在第二中可能的实现方式中,所述分别计算所述类目路径的集合中的每一个类目路径的综合计数值包括:
分别对所述类目路径的集合中的每一个类目路径执行以下步骤:
分别计算所述关键词集合中的每一个关键词在所述类目路径下的关键词计数值;
计算得到的所述关键词集合中的关键词的关键词计数值的乘积,将所述乘积作为所述类目路径的综合计数值。
结合第一方面第二种可能的实现方式,在第三种可能的实现方式中,所述分别计算所述关键词集合中的每一个关键词在所述类目路径下的关键词计数值包括:
分别对所述关键词集合中的每一个关键词执行以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司,未经北京京东尚科信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210572005.2/2.html,转载请声明来源钻瓜专利网。