[发明专利]类目错放识别方法和装置无效
申请号: | 201110026733.9 | 申请日: | 2011-01-25 |
公开(公告)号: | CN102609422A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 王俞霖 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/00 |
代理公司: | 隆天国际知识产权代理有限公司 72003 | 代理人: | 张浴月;刘文意 |
地址: | 开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 类目 识别 方法 装置 | ||
1.一种类目错放识别方法,包括如下步骤:
获取商品标题中各个词在当前类目下的词频;
根据各个词在当前类目下的词频,计算所述商品标题的综合词频;以及
将所述综合词频与当前类目的第一阈值相比较,根据比较结果确定是否存在类目错放。
2.根据权利要求1所述的方法,其特征在于,在获取商品标题中各个词在当前类目下的词频之前,还包括将所述商品标题的各个词中的停用词进行过滤的步骤。
3.一种类目错放识别方法,包括如下步骤:
获取商品标题中各个词在当前类目下的TOP值;其中,所述词在当前类目下的TOP值为在当前类目下词频比该词高的所有词的词频之和;
根据预先确定的TOP值与相关度值的映射关系,获取各个词的TOP值对应的相关度值,并将各个词的TOP值对应的相关度值相加,获取商品标题在当前类目下的综合相关度值;
将所述商品标题在当前类目下的综合相关度值与第二阈值相比,根据比较结果确定是否存在类目错放。
4.根据权利要求3所述的方法,其特征在于,将所述商品标题在当前类目下的综合相关度值与第二阈值相比,根据比较结果确定是否存在类目错放,包括:
将所述商品标题在当前类目下的综合相关度值与第二阈值相比,如果所述商品标题在当前类目下的综合相关度值小于第二阈值,则确定存在类目错放;如果所述商品标题在当前类目下的综合相关度值大于或等于第二阈值,则确定不存在类目错放。
5.根据权利要求3所述的方法,其特征在于,将所述商品标题在当前类目下的综合相关度值与第二阈值相比,根据比较结果确定是否存在类目错放,包括:
将所述商品标题在当前类目下的综合相关度值与第二阈值相比,如果所述商品标题在当前类目下的综合相关度值小于第二阈值,则确定存在商品放置异常;
如果确定存在商品放置异常,则获取该商品标题的推荐类目,再根据该商品标题和该商品标题的推荐类目,得到与所述商品标题匹配的目标类目;
获取商品标题在目标类目下的后验概率和商品标题在当前类目下的后验概率,并比较所述商品标题在所述目标类目下的后验概率和所述商品标题在当前类目下的后验概率;
如果商品标题在目标类目下的后验概率与商品标题在当前类目下的后验概率之间的差值或比值大于第三阈值,则确定存在类目错放。
6.根据权利要求5所述的方法,其特征在于,获取与所述商品标题匹配的目标类目,包括:
获取商品标题中各个词对应的推荐类目;
将各个词在对应的推荐类目下的词频作为推荐类目的权重,统计每个推荐类目的权重之和,将权重之和最大的推荐类目作为目标类目。
7.根据权利要求5所述的方法,其特征在于,获取与所述商品标题匹配的目标类目,包括:
获取预测类目的标题向量和类目向量,所述标题向量中的元素为所述商品标题中各个词在所述商品标题中出现的概率,所述类目向量中的元素为所述商品标题中各个词在所述预测类目下的词频;
对于每个预测类目,获取标题向量和类目向量的乘积,选择乘积最大的预测类目作为所述目标类目。
8.根据权利要求3所述的方法,其特征在于,将所述商品标题在当前类目下的综合相关度值与第二阈值相比,根据比较结果确定是否存在类目错放,包括:
将所述商品标题在当前类目下的综合相关度值与第二阈值相比,如果所述商品标题在当前类目下的综合相关度值小于第二阈值,则确定存在商品放置异常;
如果确定存在商品放置异常,则获取该商品标题的推荐类目,再根据该商品标题和该商品标题的推荐类目,得到与所述商品标题匹配的目标类目;
比较所述商品标题在目标类目下的综合相关度值与所述商品标题在当前类目下的综合相关度值;
如果所述商品标题在所述目标类目下的综合相关度值与所述商品标题在所述当前类目下的综合相关度值之间的差值或比值大于第四阈值,则确定存在类目错放。
9.根据权利要求3~8中任一项所述的方法,其特征在于,获取商品标题中各个词在当前类目下的TOP值,包括:
基于词在类目下的分布熵来确定所述商品标题中是否存在停用词;
如果存在停用词,则过滤所述停用词;获取过滤停用词之后的各个词在当前类目下的TOP值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110026733.9/1.html,转载请声明来源钻瓜专利网。