[发明专利]选购热点标签的挖掘方法有效
申请号: | 201510831574.8 | 申请日: | 2015-11-25 |
公开(公告)号: | CN105488136B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 王颖 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06;G06F17/27 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 韩聪 |
地址: | 100080 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 选购 热点 标签 挖掘 方法 | ||
1.一种选购热点标签的挖掘方法,包括以下步骤:
搜索步骤,根据用户输入的关键词进行搜索,得到与搜索结果有关的商品标题;
分词步骤,使用分词工具对搜索到的商品标题进行分词;
组合步骤,使用语言模型N-Gram对分词结果进行组合,得到候选标签;和
交集步骤,将使用最大匹配算法对优质搜索词和用户输入的关键词进行处理而得到的修饰词与在上述候选标签做交集,从而获得选购热点标签,其中,上述优质搜索词是指在有效时间内,点击搜索率高于某阈值的查询式。
2.根据权利要求1所述的选购热点标签的挖掘方法,其特征在于,
在上述组合步骤中,保留组合之后词长大于等于第1词长且小于等于第2词长的标签,并且对只包含字母和汉字的标签进行N-Gram计算,其中,上述第1词长小于上述第2词长。
3.根据权利要求1所述的选购热点标签的挖掘方法,其特征在于,
在上述组合步骤中,在采用语言模型N-Gram获取候选标签时删除了商品标题的前部和后部的商品信息。
4.根据权利要求3所述的选购热点标签的挖掘方法,其特征在于,
在上述组合步骤中,在采用语言模型N-Gram获取候选标签时删除了商品标题的前部1/5和后部1/5的商品信息。
5.根据权利要求1所述的选购热点标签的挖掘方法,其特征在于,
上述优质搜索词满足的条件如下:
条件(1),搜索词在最近N天的点击搜索日志中出现,其中N=7;
条件(2),累计搜索量大于等于某阈值TIME,其中TIME=100;
条件(3),点击搜索率大于等于某阈值P,其中P=15%。
6.根据权利要求5所述的选购热点标签的挖掘方法,其特征在于,
挖掘上述优质搜索词的步骤包括:
当D≤7时,一旦满足上述条件(1)、(2)、(3)的全部,则输出查询式,作为优质搜索词,当满足上述条件(1)、(2)的全部且不满足条件(3)时,则输出查询式,作为低反馈词,该低反馈词是指点击搜索率低于某阈值的搜索词,当只满足上述条件(1)时,继续计算第D+1天的点击搜索量;
当D>7时,将不符合上述条件(1)的查询式输出,其余的处理逻辑与D≤7的情况相同,当D=180时,结束统计,
其中,上述D是指统计的日期距当日的天数。
7.根据权利要求1所述的选购热点标签的挖掘方法,其特征在于,
在上述交集步骤之后,还包括通过商品标题的关键词匹配来绑定上述选购热点标签的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510831574.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于PGIS系统的定位方法
- 下一篇:防水、防尘、防震的听筒网及其制作工艺