[发明专利]一种电话号码识别方法及装置有效
申请号: | 201610293037.7 | 申请日: | 2016-05-05 |
公开(公告)号: | CN106713579B | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 卢扬;蔡超维;张华 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04M1/2745 | 分类号: | H04M1/2745;H04M1/665;H04M3/436 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电话号码 识别 方法 装置 | ||
1.一种电话号码识别方法,其特征在于,包括:
根据预先设定的第一关键字数据库中的至少一个第一关键字,搜索包含第一关键字或第一关键字关联的网页,对搜索得到的包括电话号码和文本信息的所述网页进行内容解析,以获取所述网页中的电话号码及其对应的文本信息;
建立所述电话号码和文本信息之间的对应关系,并存储所述电话号码及其对应的文本信息;
根据第一特征提取项对所述电话号码进行特征提取,得到至少一个第一特征信息;所述第一特征提取项包括所述电话号码的号码历史热度、号码字符串特点、号码行为模式、所述电话号码是否属于黄页、所述电话号码是否属于黑名单、所述电话号码在安全客户端的标记情况或者所述电话号码在安全客户端被标记为指定号码类型的情况中的一种或者多种;其中,第一特征信息包括以下至少一项:获取所述电话号码在预设时间段内的通话次数;统计用户通过安全客户端对电话号码进行标记的标记次数与所述安全客户端的用户量之间的比例;统计用户通过所述安全客户端将所述电话号码标记为指定号码类型的标记次数与用户通过所述安全客户端对所述电话号码进行标记的标记次数之间的比例;
根据第二特征提取项对所述电话号码对应的文本信息进行特征提取,得到至少一个第二特征信息;所述第二特征提取项包括所述电话号码在搜索引擎的返回页面结果,所述电话号码在指定网页被用户提到的内容,所述电话号码是否在指定网址页面出现中的一种或者多种;其中,所述第二特征信息包括以下至少一项:检测所述电话号码对应的文本信息与预先设立的第二关键字数据库中的第二关键字是否匹配;检测包含所述电话号码的其他网页中的文本信息与所述第二关键字数据库中的第二关键字是否匹配;检测包含所述电话号码的任一网页与网页数据库中的网页是否匹配;
通过机器学习,对所述第一特征信息和所述第二特征信息进行统计学习并分类,基于至少两个维度识别所述电话号码的号码类型;
当用户在呼入或者呼出所述电话号码时,向所述安全客户端发送风险提示信息,以使所述安全客户端在其终端的显示屏幕上显示所述风险提示信息,以提示用户所述电话号码的号码类型。
2.根据权利要求1所述方法,其特征在于,所述根据第一关键字数据库中的第一关键字,搜索与所述第一关键字匹配的网页,包括:
通过爬虫模块爬取与所述第一关键字匹配的网页。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610293037.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种干扰测试方法及装置
- 下一篇:一种电话号码识别方法、安全服务器以及终端