[发明专利]一种海量电话号码快速匹配检索方法在审
申请号: | 201710205689.5 | 申请日: | 2017-03-31 |
公开(公告)号: | CN107122412A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 裴珉 | 申请(专利权)人: | 合肥天馈互联网技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 海量 电话号码 快速 匹配 检索 方法 | ||
技术领域
本发明涉及一种海量电话号码快速匹配检索方法。
背景技术
全文检索是极为常用的一种通过网络获取所需信息的方式。全文检索一般是利用到排索引技术实现检索,每进行一次查询,都需要根据检索的关键词来寻找对应的文档,并根据搜索表达式进行一系列运算,这些操作都会产生一定的I/O消耗和CPU消耗,并且单次查询的资源消耗与多次查询的资源消耗是直接相关的。
在实际应用中,在一个应用系统中,数据库中的电话表的数量少的几百张,多的几万张,一张表中的字段数量少则几十多则几百。也就是说,一个应用系统中少则几万个字段,多则上亿个字段,海量的电话号码数据的匹配会消耗大量的运算成本和运算时间。全文检索不适用于海量电话号码的匹配检索。
鉴于上述,本设计人积极加以研究创新,以期创设一种海量电话号码快速匹配检索方法,使其更具有产业上的利用价值。
发明内容
为解决上述技术问题,本发明的目的是提供一种效率高、运算简便的海量电话号码快速匹配检索方法。
本发明海量电话号码快速匹配检索方法,包括:
判断待匹配电话号码字符串的长度是大于基准长度还是等于基准长度,若等于基准长度,则不做处理;若大于基准长度,则确定电话号码字符串中的特定数字,将特定数字截除掉;
根据预设的分类规则,判断待匹配的电话号码的分类,根据电话号码的分类,在相应类别的数据库内检索匹配电话号码;
将所述待匹配电话号码的字符串分成多个分段,每个分段包括至少一个数字;
设置多个分段的匹配优先级,根据该优先级逐一进行各个分段的字符匹配,直至检索到相匹配的号码。
进一步地,还包括判断待匹配电话号码是手机号码还是座机号码,并根据相应的判断结果,在相应的手机号码数据库中或座机数据库中检索相匹配的电话号码。
进一步地,所述预设的分类规则包括,判断待匹配电话号码是否包含国家码或地区码,如果待匹配电话号码包含国家码或地区码,则在包含相同的国家码或地区码的电话号码数据库中检索相匹配的电话号码。
进一步地,将所述待匹配电话号码的字符串分成多个分段,具体包括:将电话号码的字符串以每n(n>1)个数字为一段,从首位开始分段或从尾位开始分段。
进一步地,从待匹配电话号码的位数开始分段,以数字个数为X和X+Y进行划分,其中X、Y均为正整数。
进一步地,X不小于2,Y不小于1。
进一步地,计算出每个电话号码字符串的16位整数键Ks;
计算出搜索子串的16位整数键Key;
在Ks集合中逐一与Key进行匹配运算,当结果与Key相同时,表示该号码中可能存在搜索子串,此时再进行完整字符串匹配检索。
与现有技术相比,本发明一种海量电话号码快速匹配检索方法具有以下优点:
对待检索的电话号码进行字符串分段,并且设置匹配优先级,先查询对应于优先级高的字符串,然后进一步检索剩余部分字符串,既能够节约存储空间,又能够极大地缩短处理时间,从而提高检索效率。
附图说明
图1是本发明一种海量电话号码快速匹配检索方法的流程框图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例1
如图1所示,本发明一种海量电话号码快速匹配检索方法的最佳实施例,
判断待匹配电话号码字符串的长度是大于基准长度还是等于基准长度,若等于基准长度,则不做处理;若大于基准长度,则确定电话号码字符串中的特定数字,将特定数字截除掉;以中国为例,手机号码前有时会有86,也即手机号码这时为13位,以11位为标准长度。座机号码前有时会有区号,座机号码这时为11位或12位,以8位为标准长度。
根据预设的分类规则,判断待匹配的电话号码的分类,根据电话号码的分类,在相应类别的数据库内检索匹配电话号码;
将所述待匹配电话号码的字符串分成多个分段,每个分段包括至少一个数字;
设置多个分段的匹配优先级,根据该优先级逐一进行各个分段的字符匹配,直至检索到相匹配的号码。
在本实施例中,还包括判断待匹配电话号码是手机号码还是座机号码,并根据相应的判断结果,在相应的手机号码数据库中或座机数据库中检索相匹配的电话号码。在中国手机号码是11位数,座机号码是8位数,如此,现有一个大致检索范围的划分,能够省去很多不必要的时间浪费。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥天馈互联网技术有限公司,未经合肥天馈互联网技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710205689.5/2.html,转载请声明来源钻瓜专利网。