[发明专利]一种分词搜索方法及其装置有效
申请号: | 201710043398.0 | 申请日: | 2017-01-21 |
公开(公告)号: | CN106844633B | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 张元康 | 申请(专利权)人: | 浙江沛宏网络科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F17/27 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 林乐飞 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种分词搜索方法,用于提高分词搜索的精准度。方法包括:将原始搜索词进行分词处理得到最大分词组和最小分词组,若在数据库中存在包含最小分词组中所有分词的第一词条时,对第一词条进行分类,找到第一词条在所有类目中数量最多的类目作为目标类目,再在数据库中的目标类目下搜索包含最小分词组中任一分词的词条作为第一目标词条输出;若数据库中存在上述的第一词条,则通过判断原始搜索词中心词的方式对数据库进行搜索,得到第二目标词条输出,从而使用户得到想要信息。本发明还公开了一种用于实现上述方法的装置。 | ||
搜索关键词: | 一种 分词 搜索 方法 及其 装置 | ||
【主权项】:
1.一种分词搜索方法,其特征在于,包括以下步骤:获取原始搜索词;对所述搜索词进行分词处理,通过双向最大匹配法获得最小分词组,在获得最小分词组后,根据最小切分法对原始搜索词进行处理获得最大分词组;搜索包含所述最小分词组中所有分词的第一词条;判断是否存在所述第一词条;若存在所述第一词条,对所述第一词条进行分类,统计第一词条在各类目中出现的次数,查找所述第一词条在各类目中出现次数最多的类目作为目标类目;获取目标类目,在所述目标类目下搜索包含所述最小分词组中任一分词的第一目标词条,并输出所述第一目标词条;若不存在所述第一词条,搜索包含所述最大分词组中任一分词的第二词条;获取所述第二词条,对所述第二词条进行分词处理得到第一分词组,并统计所述第一分词组中的分词在第二词条中出现的次数,查找所述第一分词组中与所述最小分词组中相同的分词组成分词交集,查找所述分词交集中在第二词条中出现次数最多的分词作为中心词;判断所述中心词是否位于所述原始搜索词末尾;若中心词位于所述原始搜索词末尾,查找第二词条中包含所述中心词的词条作为第二目标词条,并输出所述第二目标词条;若中心词不是所述原始搜索词里最后一个词,输出“未搜索到”。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江沛宏网络科技有限公司,未经浙江沛宏网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710043398.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种石油化工实验废弃物存储罐
- 下一篇:一种具有真空抽气结构的诊断试剂存储罐