[发明专利]识别商品所属类目的方法和装置有效
申请号: | 201611050920.X | 申请日: | 2011-01-25 |
公开(公告)号: | CN107122980B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 王俞霖 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06F40/216 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 黄熊 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 商品 所属 类目 方法 装置 | ||
1.一种识别商品所属类目的方法,包括如下步骤:
将商品标题分成词的集合,获取商品标题中各个词在当前类目下的词频,所述词频为词在类目下的概率值;
根据各个词在当前类目下的词频,确定商品标题与当前类目的匹配程度;
根据所述商品标题与当前类目的匹配程度识别所述商品是否属于所述当前类目;
其中,所述根据所述商品标题与当前类目的匹配程度识别所述商品是否属于所述当前类目,包括:获取所述商品标题的推荐类目;根据所述商品标题和所述商品标题的推荐类目,得到与所述商品标题匹配的目标类目;根据与所述商品标题对应的所述目标类目和所述当前类目,识别所述商品是否属于所述当前类目。
2.根据权利要求1所述的方法,其特征在于,所述根据所述商品标题与当前类目的匹配程度识别所述商品是否属于所述当前类目,还包括:
根据所述商品标题与当前类目的匹配程度确定所述商品是否存在商品放置异常,根据商品是否存在商品放置异常识别所述商品是否属于所述当前类目。
3.根据权利要求2所述的方法,其特征在于,所述根据各个词在当前类目下的词频,确定商品标题与当前类目的匹配程度,包括:
根据所述各个词在当前类目下的词频计算所述商品标题的综合词频,所述综合词频越低,商品标题的商品分类在当前类目下的可能性越低;
将所述综合词频与当前类目的第一阈值相比较,根据比较结果确定所述商品标题与当前类目的匹配程度,所述第一阈值根据每个类目下包括的词及每个词在该每个类目下的词频进行设定。
4.根据权利要求3所述的方法,其特征在于,所述根据所述商品标题与当前类目的匹配程度确定所述商品是否存在商品放置异常,包括:
当所述综合词频与当前类目的第一阈值相比较的比较结果是综合词频小于第一阈值时,则所述商品标题与当前类目的不匹配,确定所述商品存在商品放置异常。
5.根据权利要求2所述的方法,其特征在于,所述根据各个词在当前类目下的词频,确定商品标题与当前类目的匹配程度,包括:
根据所述各个词在当前类目下的词频,获取商品标题中各个词在当前类目下的TOP值;其中,所述词在当前类目下的TOP值为在当前类目下词频比该词高的所有词的词频之和;
根据所述TOP值确定商品标题与当前类目的匹配程度,所述商品标题中的词在某一个类目下的TOP值越低,所述商品标题中的该词在该某一个类目下的匹配程度越高。
6.根据权利要求5所述的方法,其特征在于,根据所述TOP值确定商品标题与当前类目的匹配程度,包括:
根据预先确定的TOP值与相关度值的映射关系,获取各个词的TOP值对应的相关度值,并将各个词的TOP值对应的相关度值相加,获取商品标题在当前类目下的综合相关度值;
将所述商品标题在当前类目下的综合相关度值与第二阈值相比,根据比较结果确定所述商品标题与当前类目的匹配程度,所述第二阈值根据商品标题的综合相关度值分布状况进行设定。
7.根据权利要求6所述的方法,其特征在于,所述根据所述商品标题与当前类目的匹配程度确定所述商品是否存在商品放置异常,根据商品是否存在商品放置异常识别所述商品是否属于所述当前类目,包括:
当所述商品标题在当前类目下的综合相关度值与第二阈值相比的比较结果是所述商品标题在当前类目下的综合相关度值小于第二阈值,则确定所述商品标题与当前类目的不匹配,存在商品放置异常,所述商品不属于所述当前类目;
当所述商品标题在当前类目下的综合相关度值与第二阈值相比的比较结果是所述商品标题在当前类目下的综合相关度值大于或等于第二阈值,则确定所述商品标题与当前类目的匹配,不存在商品放置异常,所述商品属于所述当前类目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611050920.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于建议优选支付卡的方法与装置
- 下一篇:一种面向化妆品的多角度混合推荐方法