[发明专利]一种类目路径识别方法及系统有效
申请号: | 201210572005.2 | 申请日: | 2012-12-25 |
公开(公告)号: | CN103902545B | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 胡德凤;朱正平;马超 | 申请(专利权)人: | 北京京东尚科信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 谢安昆;宋志强 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 类目 路径 识别 方法 系统 | ||
1.一种类目路径识别方法,其特征在于,包括:
获取用户输入的商品标题;
对所述商品标题进行分词处理,得到所述商品标题中的关键词集合;
根据所述关键词集合及预置的商品类目识别模型确定所述商品标题的类目路径;
所述根据所述关键词集合及预置的商品类目识别模型确定所述商品标题的类目路径包括:
利用所述关键词集合查找所述商品类目识别模型中的关键词与类目路径计数表确定包含所述关键词集合的类目路径的集合,所述关键词与类目路径计数表中包含类目路径与关键词之间的对应关系,及所述关键词在对应的类目路径下的出现次数的计数值;
分别计算所述类目路径的集合中每一个类目路径的综合计数值;
选取所述类目路径的集合中综合计数值最大的类目路径作为所述商品标题的类目路径。
2.根据权利要求1所述的类目路径识别方法,其特征在于,所述分别计算所述类目路径的集合中的每一个类目路径的综合计数值包括:
分别对所述类目路径的集合中的每一个类目路径执行以下步骤:
分别计算所述关键词集合中的每一个关键词在所述类目路径下的关键词计数值;
计算得到的所述关键词集合中的关键词的关键词计数值的乘积,将所述乘积作为所述类目路径的综合计数值。
3.根据权利要求2所述的类目路径识别方法,其特征在于,所述分别计算所述关键词集合中的每一个关键词在所述类目路径下的关键词计数值包括:
分别对所述关键词集合中的每一个关键词执行以下步骤:
查找所述关键词与类目路径计数表确定所述关键词在所述类目路径下的出现次数的第一计数值,在所述商品类目识别模型中的关键词计数表中查找所述关键词的出现次数的第二计数值,及在所述商品类目识别模型中的类目路径计数表中查找所述类目路径下的商品标题的总数的第三计数值,所述关键词计数表中包含每个关键词的总的出现次数的计数值,所述类目路径计数表中包含每个类目路径下的总的商品标题的计数值;
利用所述第一计数值、所述第二计数值及所述第三计数值计算所述关键词在所述类目路径下的关键词计数值。
4.根据权利要求3所述的类目路径识别方法,其特征在于,所述利用所述第一计数值、所述第二计数值及所述第三计数值计算所述关键词在所述类目路径下的关键词计数值包括:
将所述第二计数值与预置的第一参数的乘积与所述第三计数值与预置的第二参数的乘积的和作为第四计数值;
将所述第一计数值除以所述第四计数值得到的商作为所述关键词在所述类目路径下的关键词计数值。
5.一种类目路径识别系统,其特征在于,包括:
获取单元,用于获取用户输入的商品标题;
处理单元,用于在所述获取单元获取所述商品标题之后,对所述商品标题进行分词处理,得到所述商品标题中的关键词集合;
确定单元,用于在所述处理单元得到所述关键词集合之后,根据所述关键词集合及预置的商品类目识别模型确定所述商品标题的类目路径;
所述确定单元包括:
第一查找单元,用于在所述处理单元得到所述关键词集合之后,利用所述关键词集合查找所述商品类目识别模型中的关键词与类目路径计数表确定包含所述关键词集合的类目路径的集合,所述关键词与类目路径计数表中包含类目路径与关键词之间的对应关系,及所述关键词在对应的类目路径下的出现次数的计数值;
第一计算单元,用于在所述第一查找单元得到所述类目路径的集合之后,分别计算所述类目路径的集合中每一个类目路径的综合计数值;
选取单元,用于在所述第一计算单元得到所述类目路径的集中和每一个类目路径的综合计数值之后,选取所述类目路径的集合中综合计数值最大的类目路径作为所述商品标题的类目路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司,未经北京京东尚科信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210572005.2/1.html,转载请声明来源钻瓜专利网。