[发明专利]一种话单去重方法及装置有效
申请号: | 201210520910.3 | 申请日: | 2012-12-06 |
公开(公告)号: | CN103037344A | 公开(公告)日: | 2013-04-10 |
发明(设计)人: | 李小平;汪德奇;徐亮 | 申请(专利权)人: | 亚信联创科技(中国)有限公司 |
主分类号: | H04W4/24 | 分类号: | H04W4/24;H04W24/04;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100086 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 话单去重 方法 装置 | ||
技术领域
本发明涉及通信技术领域,特别是涉及一种话单去重方法及装置。
背景技术
随着通信技术的快速发展,电信行业的业务量也越来越大,同时对话单采集的要求也就越来越高,话单是指通信原始记录信息,以固定电话为例,话单主要记录以下信息:流水号、用户标识、主叫号码、被叫号码、起始时间、结束时间、通话时长、通话性质、费率、费用、折扣等,具体话单包含的信息,可根据业务需求不同而不同。由于在话单采集过程中的重复采集或者交换机本身故障等异常操作可能会产生重复话单,如果不及时剔除,将会导致用户的费用统计有误,引起客户投诉,造成客源流失。因此在电信行业的计费系统中必须将重复话单剔除,所以这种话单去重技术是现在电信行业中电信数据采集系统的一种关键技术,也是一个难点技术。
现有的去重技术往往采用以下算法进行处理,具体为:采用话单中具有唯一性标识作用的主叫号码、被叫号码、通话起始时间、通过时长等关键字段值中的一些信息作为摘要信息,并将摘要信息以内容的形式保存在数据结构里,摘要信息一般为16字节的消息摘要算法(Message Digest Algorithm,MD5)值,保存的话单量十分庞大,因此占用的内存也是比较大;当处理新话单时将新话单的摘要信息与已经记录的话单的摘要信息进行匹配对比,若对比结果相同则为重单,返回信令指示为重单,否则,记录新话单。
但是,由于现在电信行业业务的快速发展,业务数据量也是越来越庞大,针对从海量的话单信息中剔除重复话单需要耗费大量的系统资源并且处理时间冗长,话单查重速度根本无法满足业务需求,经常成为影响系统性能的主要因素。
发明内容
为了解决上述技术问题,本发明提出了一种话单去重方法及装置,针对海量的话单信息,能够快速的实现去重处理,节约系统内存资源,提高处理速度,从而提高了系统性能。
本发明实施例公开了如下技术方案:
一种话单去重方法,包括:
对接收到的当前话单信息中的摘要信息进行哈希函数取值处理得到哈希数值;
提取内存数据表,根据内存数据表大小对所述哈希数值进行取模运算得到模值,所述模值指示所述摘要信息在内存数据表中的位置;
依次识别内存数据表中所述模值指示位置上是否有信息;
当所述模值指示内存数据表中的位置全部都有信息时,则向客户端指示当前话单信息为重单信息;
当所述模值指示内存数据表中的位置至少有一个位置没有信息时,则在没有信息的空位置更新所述摘要信息。
优选的,所述内存数据表采用内存数据库MDB结构进行存储。
优选的,在所述对接收到的当前话单信息中的摘要信息值进行哈希函数取值处理得到哈希数值之后,还包括:提取文件数据表,根据文件数据表大小对所述哈希数值进行取模运算得到模值,所述模值指示所述摘要信息在文件数据表中的位置。
优选的,所述文件数据表采用文件集群储存结构进行存储的。
优选的,所述对接收到的当前话单信息中的摘要信息进行哈希函数取值处理得到哈希数值,包括:根据去重错误率设置哈希数值的个数,所述去重错误率与内存大小、话单数量、哈希数值的个数成比例关系;按照设置的哈希数值的个数对摘要信息进行哈希函数取值处理,得到哈希数值。
还提供了,一种话单去重装置,包括:
映射模块,用于对接收到的当前话单信息中的摘要信息进行哈希函数取值处理得到哈希数值;
内存位置模块,用于提取内存数据表,根据内存数据表大小对所述哈希数值进行取模运算得到模值,所述模值指示所述摘要信息在内存数据表中的位置;
内存识别模块,用于依次识别内存数据表中所述模值指示位置上是否有信息;
内存判断模块,用于当所述内存识别模块识别出所述位置上全部都有信息时,则向客户端指示当前话单信息为重单信息;
内存更改模块,当所述内存识别模块识别出所述位置上至少有一个位置没有信息时,则在没有信息的空位置更新所述摘要信息。
优选的,还包括:文件位置模块,用于提取文件数据表,根据文件数据表大小对所述哈希数值进行取模运算得到模值,所述模值指示所述摘要信息在文件数据表中的位置。
优选的,还包括:文件识别模块,用于依次识别文件数据表中所述模值指示位置上是否有信息。
优选的,还包括:文件判断模块,用于当所述文件识别模块识别出所述位置上全部都有信息时,则向客户端指示当前话单信息为重单信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亚信联创科技(中国)有限公司,未经亚信联创科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210520910.3/2.html,转载请声明来源钻瓜专利网。