[发明专利]一种搜索关键字数字化解析方法和引擎在审
申请号: | 201710128209.X | 申请日: | 2017-03-06 |
公开(公告)号: | CN106934002A | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | 程远东 | 申请(专利权)人: | 冠生园(集团)有限公司;程远东 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海精晟知识产权代理有限公司31253 | 代理人: | 冯子玲 |
地址: | 200040 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 关键字 数字化 解析 方法 引擎 | ||
本发明涉及一种搜索关键字数字化解析方法和引擎,包括预置库和产品数据库,所述解析方法包括以下步骤:1.判断预置库中是否包含用户输入的搜索关键字;2.将搜索关键字解析成数字序列并构成一个增益范围;3.将所述增益范围进行解析校验;4.在产品数据库中查找符合条件的产品数据;5.将所述产品数据作为搜索结果输出。本发明将对搜索关键字的解析转化为对数字序列及其逻辑关系的处理,提高了计算机系统的处理速度,加快了数据解析的速度;在进行数据库维护和更新时,只需要将新添加的关键字解析成数字序列,不需要对产品标签进行编辑,降低了系统维护的难度。
技术领域
本发明涉及搜索引擎技术领域,尤其涉及一种搜索关键字数字化解析方法。
背景技术
现有的产品搜索,都是依靠产品(tag)标签,或者产品页面的爬虫来实现的。都是抓取该产品已有的txt文本字段。结果就是该产品的标签越来越臃肿、人工维护成本高、搜索引擎抓取越来越慢。
对于现有的搜索结果,即使产品页面有类似的txt关键词,但也可能跟用户的实际需求完全无关,比如用户搜索“九寨沟”,但结果中会把含有“这里比九寨沟好玩多了”的txt字段抓取为结果。
除了“九寨沟”、“张家界”这样的专有名词以外,对于计算机而言,最好的搜索是按0~1的数字维度去解析用户的需求,这样才是又快又合理。而现在的产品搜索,包括大数据分析,都还是在依赖标签原理,导致运算缓慢、搜索结果偏差大或者根本没有结果,由于每次都要为产品添加新的标签字段,人工维护的成本非常高。
发明内容
本发明所要解决的技术问题是提供一种数据处理快速且搜索结构偏差小的搜索关键字数字化解析方法。
为解决上述技术问题,本发明的技术方案是:一种搜索关键字数字化解析方法,包括一个存储有若干个关键字及其所对应的数字序列和增益范围的预置库,以及一个与所述预置库中的数字序列和增益范围相对应的产品数据库,所述解析方法包括以下步骤:1.判断预置库中是否包含用户输入的搜索关键字;2.将搜索关键字解析成数字序列并根据所述数字序列构成一个增益范围;3.将所述增益范围进行解析校验,得出最终的解析结果;4.根据解析结果在产品数据库中查找符合条件的产品数据;5.将所述产品数据作为搜索结果输出。
作为优选的技术方案,步骤1包括以下步骤:在预置库中查找与所述搜索关键字相同的关键字,若在预置库查找到相同的关键字,执行步骤2;若预置库不存在与搜索关键字相同的关键字,则将所述搜索关键字存储在所述预置库中,并在所述预置库中设置与所述搜索关键字对应的数字序列。
作为优选的技术方案,所述解析方法还包括搜集用户的历史数据,确认用户的个体属性和群体属性的步骤。
作为优选的技术方案,步骤2包括以下步骤:2a.根据预置库的设置将所述搜索关键字解析成数字序列,2b.提取搜索关键字中的限定词,对步骤2a中的数据序列进行漏斗式筛选;2c.将步骤2b中的数字序列根据群体属性进行增益干涉构成一个体现所述群体属性的增益范围;2d.将步骤2c中的增益范围根据个体属性进行增益干涉构成一个体现个体属性的增益范围。
作为优选的技术方案,还包括对预置库和产品数据库进行数据更新更新的步骤。
作为优选的技术方案,预置库数据更新方法包括将步骤2c中构成的群体属性的数字增益范围以及步骤2d中构成的个体属性的增益范围存储在所述预置库中的步骤。
作为优选的技术方案,步骤3中对增益范围进行解析校验的方法是:根据历史用户的执行情况,按照权重调整增益范围,重新构成体现群体属性的增益范围和体现个体属性的增益范围。
一种搜索关键字数字化解析方法的引擎,其特征在于,包括:
输入模块,用于接收搜索关键字或用户指令;
预置库,用于储存关键字和与其所对应的数字序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于冠生园(集团)有限公司;程远东,未经冠生园(集团)有限公司;程远东许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710128209.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分布式快速清单查询系统及方法
- 下一篇:一种文件处理方法及移动终端