[发明专利]一种利用键值匹配模型提高黑名单准确率的方法及系统有效
申请号: | 202010970431.6 | 申请日: | 2020-09-16 |
公开(公告)号: | CN111930808B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 陈晓莉;丁一帆;徐菁;徐佳丽;杨世宏;徐云华;林建洪 | 申请(专利权)人: | 浙江鹏信信息科技股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06F17/18 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 311100 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 键值 匹配 模型 提高 黑名单 准确率 方法 系统 | ||
1.一种利用键值匹配模型提高黑名单准确率的方法,其特征在于,包括步骤:
S1.采集类别标签中的每个号码数据对应的24小时内的通话记录;
S2.根据采集到的通话记录计算每个号码的查询键,并将计算得到的查询键与号码对应的类别标签进行组合,生成号码的数据集;
S3.统计所有号码的数据集,并筛选统计的数据集中同一查询键所对应的类别标签,得到查询键对应的类别标签统计模型;
S4.将测试号码进行步骤S2的处理,得到测试号码的查询键,并将所述测试号码的查询键输入至得到的统计模型中,统计模型输出与测试号码的查询键相同的查询键所对应的类别标签;
S5.将输出的查询键的类别标签相加,得到输出的查询键的键值对;根据得到的键值对计算查询键所对应的类别标签,得到最终结果;
所述步骤S2包括:
S21.统计当前号码24小时内通话记录的次数;
S22.判断统计的当前号码24小时中每个时间点的通话次数是否大于第一预设阈值,若是,则将大于第一预设阈值所对应的时间点的数值转换为1;若否,则将小于等于第一预设阈值所对应的时间点的数值转换为0,并记录当前号码转换后的数据特征;
S23.获取记录的当前号码的数据特征中为1的时间点,并将获取的为1的时间点对应的数值转换为字符,将转换后的字符进行拼接,得到当前号码的查询键;
S24.将得到的当前号码的查询键与当前号码对应的类别标签进行组合,生成当前号码的数据集;
步骤S5中根据得到的键值对计算查询键所对应的类别标签具体为:
计算键值对中每个数值的结果,并将计算得到的每个数值的结果与第二预设阈值进行比较,得到大于第二预设阈值的数值,并根据得到的大于第二预设阈值的数值得到数值对应的类别标签。
2.根据权利要求1所述的一种利用键值匹配模型提高黑名单准确率的方法,其特征在于,步骤S1中的类别标签的号码包括黑名单号码、白名单号码、未定义号码、正常号码。
3.根据权利要求2所述的一种利用键值匹配模型提高黑名单准确率的方法,其特征在于,所述计算键值对中每个数值的结果,表示为:
y=exp(yi)/sum(exp(Y))
其中,y表示计算后得到各标签的概率值;yi表示键值对中第i个数值;Y表示所有标签个数累加后的yi的集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江鹏信信息科技股份有限公司,未经浙江鹏信信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010970431.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:施工现场的人机碰撞预警方法及系统
- 下一篇:复合式能量收集装置