[发明专利]陌电识别方法、装置、电子设备及存储介质在审
申请号: | 202010909198.0 | 申请日: | 2020-09-02 |
公开(公告)号: | CN112199388A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 陈元礼 | 申请(专利权)人: | 卓望数码技术(深圳)有限公司 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;G06K9/62 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黄广龙 |
地址: | 518000 广东省深圳市南山区高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 方法 装置 电子设备 存储 介质 | ||
本发明公开了一种陌电识别方法、装置、电子设备及存储介质,其中陌电识别方法,包括:获取信令数据话单,对信令数据话单的数据进行处理,得到第一数据集;提取第一数据集并建立高频通话数据库;对高频通话数据库的数据进行数据处理,得到训练数据集;对训练数据集进行训练,得到陌电识别模型;将获取的陌电识别模型用于陌电识别,得到识别结果。通过获取信令数据话单,能够较为全面的获取到用户的通话数据,对数据进行准确的标记分类,对训练数据集进行训练得到的陌电识别模型,性能稳定,具有较好的抗噪能力,利用陌电识别模型能够很好地提高陌生电话识别的准确度。
技术领域
本发明涉及通信技术领域,尤其是涉及一种陌电识别方法、装置、电子设备及存储介质。
背景技术
随着移动通信技术的发展,骚扰电话也给人们的生活造成极大的困扰,目前,对陌生电话的识别常常是根据用户对号码的标记分类,以及将用户在各门户网站的行为特征作为依据对号码分类来实现的,这种方式获得的数据具有局限性,会使得对陌生电话的识别准确性较低。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种陌电识别方法,能够较为全面的获取到用户的通话数据,提高对陌生电话识别的准确性。
本发明还提出一种具有上述陌电识别方法的陌电识别装置。
本发明还提出一种具有上述陌电识别方法的电子设备。
本发明还提出一种具有上述陌电识别方法的计算机可读存储介质。
根据本发明的第一方面实施例的陌电识别方法,包括:
获取信令数据话单,对所述信令数据话单的数据进行处理,得到第一数据集;
提取所述第一数据集并建立高频通话数据库;
对所述高频通话数据库的数据进行数据处理,得到训练数据集;
对所述训练数据集进行训练,得到陌电识别模型;
将获取的所述陌电识别模型用于陌电识别,得到识别结果。
根据本发明实施例的陌电识别方法,至少具有如下有益效果:这种陌电识别方法通过获取信令数据话单,能够较为全面的获取到用户的通话数据,对数据进行准确的标记分类,对训练数据集进行训练得到的陌电识别模型,性能稳定,具有较好的抗噪能力,利用陌电识别模型能够很好地提高陌生电话识别的准确度。
根据本发明的一些实施例,所述获取信令数据话单,对所述信令数据话单的数据进行处理,得到第一数据集,包括:
获取核心网从各个网元数据收集到的所述信令数据话单;
对所述信令数据话单中的数据进行数据处理,得到所述第一数据集。
根据本发明的一些实施例,所述提取所述第一数据集并建立高频通话数据,包括:
提取所述第一数据集中的高频通话数据;
查询并标记所述高频通话数据的类型;
将标记分类的所述高频通话数据存储在标签库中,所述标签库包括有第一类型陌电、第二类型陌电、正常陌电。
根据本发明的一些实施例,所述对所述高频通话数据库的数据进行数据处理,得到训练数据集,包括:
对所述高频通话数据库的数据进行数据清洗,得到第二数据集;
对所述第二数据集进行数据预处理,得到第三数据集;
提取所述第三数据集数据的特征量,建立训练数据集。
根据本发明的一些实施例,所述数据预处理包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卓望数码技术(深圳)有限公司,未经卓望数码技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010909198.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带钢调质处理系统
- 下一篇:一种新型胎体材料及金刚石节块