[发明专利]一种搜索目标商品集的方法及装置有效
申请号: | 201610052793.0 | 申请日: | 2016-01-26 |
公开(公告)号: | CN105550369B | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 汤奇峰;王万宝 | 申请(专利权)人: | 上海晶赞科技发展有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06Q30/06 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 吴敏 |
地址: | 200072 上海市闸北区灵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 目标 商品 方法 装置 | ||
一种搜索目标商品集的方法及装置,所述方法包括:根据已知的多个词典库对待搜索商品信息进行分词,得到多个目标关键词,其中,每一词典库存储单个类别的关键词,并与一个词典类别对应,当已知的模板包括的词典类别包含于所述多个目标关键词的对应的多个词典类别时,确定所述已知的模板为指定模板,并确定所述指定模板包含词典类别对应的指定词典库,将所述多个目标关键词中与所述指定词典库中的关键词匹配的部分作为模板词,从商品库中查找关键词与所述模板词均相同的商品信息,得到第一搜索结果,其中,所述商品库中的每个商品的商品信息均已被分词并得到对应的多个关键词。上述的方案可以提高定位目标商品的准确性。
技术领域
本发明涉及互联网爬虫领域,特别是涉及一种搜索目标商品集的方法及装置。
背景技术
近年来,随着电商、微商网站日趋增多,互联网上的商品数据也呈指数级增长,因此,为查找到某一目标商品的具体信息,需要通过输入已知的商品信息,然后根据该已知的商品信息从海量商品库中进行搜索定位。比如,消费者为买到某一款商品,可以通过提供已知的商品信息,搜索引擎根据该商品信息在海量数据中搜索定位输出与该商品信息相关的信息,消费者可再次浏览搜索引擎反馈的商品集以找出中意的商品,比如从反馈的商品集中挑选出在价格方面较优的商品,或在消费者评论方面较好的商品以最终确定购买哪一件商品。
除消费者以外,电商平台和销售商家都有从海量商品信息库中定位某一目标商品的需求。然而,在现有技术中,搜索定位标品类商品比较容易,而对于搜索定位其他类型商品来说,搜索得到的结果准确性较低,具体说来,反馈的搜索结果中存在很多与目标商品无关的商品条目,搜索定位的准确性较低。
发明内容
本发明解决的技术问题是提供一种搜索目标商品集的方法及装置,提高定位所述待搜索商品信息的准确性。
为解决上述技术问题,本发明实施例提供一种搜索目标商品集的方法,所述方法包括:
根据已知的多个词典库对待搜索商品信息进行分词,得到多个目标关键词,其中,每一词典库存储单个类别的关键词,并与一个词典类别对应;
当已知的模板包括的词典类别包含于所述多个目标关键词的对应的多个词典类别时,确定所述已知的模板为指定模板,并确定所述指定模板包含词典类别对应的指定词典库;
将所述多个目标关键词中与所述指定词典库中的关键词匹配的部分作为模板词;
从商品库中查找关键词与所述模板词均相同的商品信息,得到第一搜索结果,其中,所述商品库中的每个商品的商品信息均已被分词并得到对应的多个关键词。
可选地,所述搜索目标商品集的方法,还包括:
由所述第一搜索结果得到对应的商品的集合,并将所述集合作为目标商品集。
可选地,所述已知的模板有多个并具有不同的优先级,根据具有不同的优先级的所述已知的模板得到的所述指定模板有多个并具有对应的不同的优先级。
可选地,所述从商品库中查找关键词与所述模板词均相同的商品信息,得到第一搜索结果,包括:
按照所述多个指定模板的优先级从高至低的顺序,依次使用具有不同优先级的每个所述指定模板对应的模板词,从商品库中查找关键词与所述模板词均相同的商品信息,以得到所述第一搜索结果。
可选地,所述搜索目标商品集的方法,还包括:
从商品库中查找关键词与所述模板词以及非模板词均相同的商品信息,得到第二搜索结果,其中,对于同一指定模板,所述多个目标关键词中所述模板词以外的词为非模板词。
可选地,所述搜索目标商品集的方法,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海晶赞科技发展有限公司,未经上海晶赞科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610052793.0/2.html,转载请声明来源钻瓜专利网。