[发明专利]对无结果词进行标签识别的搜索方法和系统有效
申请号: | 201510082637.4 | 申请日: | 2015-02-16 |
公开(公告)号: | CN105989125B | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 贾洪园;张晶 | 申请(专利权)人: | 苏宁易购集团股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/951;G06F17/27 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 许峰 |
地址: | 210042 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种对无结果词进行标签识别的搜索方法和系统,从用户搜索词出发,分析用户真正的搜索意图,通过外网相关数据的爬取,再对爬取结果进行数据挖掘提取出与该词相关度较高的关键词即高频词,同时结合常用语料库对高频词进行归类。本发明扩大了关联数据的爬取范围,克服了普通无结果处理方法中主要局限于对站内搜索数据及用户行为的挖掘,容易出现处理失败的缺陷。 | ||
搜索关键词: | 结果 进行 标签 识别 搜索 方法 系统 | ||
【主权项】:
1.一种对无结果词进行标签识别的搜索方法,其特征在于,该方法包括以下步骤:(1)对于无结果词,基于外网数据的爬取和分词切分,提取出高频词并对其进行标注;(2)在标注的高频词基础上生成替换词,替换词的生成方法为:从被标注为品牌的高频词中取计算得分最高的记录,从被标注为品类的高频词中取计算得分最高的记录,从标注为属性的高频词中取计算得分最高的多条记录;然后将所取的三部分高频词拼接,即为替换词;(3)对无结果词进行扩展,如得到的扩展词中包括替换词,则进一步,对该替换词进行前台搜索,如果有检索结果,则将前台搜索的结果作为最终搜索结果输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁易购集团股份有限公司,未经苏宁易购集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510082637.4/,转载请声明来源钻瓜专利网。
- 上一篇:电子地图展示方法、装置及电子设备
- 下一篇:一种应用程序分类的方法及服务器