[发明专利]基于深度学习测评通话质量的方法、服务器及存储介质在审
申请号: | 202211703503.6 | 申请日: | 2022-12-28 |
公开(公告)号: | CN116132574A | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 刘佳斌;贾真;刘涛 | 申请(专利权)人: | 中电信数智科技有限公司 |
主分类号: | H04M3/22 | 分类号: | H04M3/22;H04M3/42;G10L15/08;G10L15/16 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 张明浩 |
地址: | 100036*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 测评 通话质量 方法 服务器 存储 介质 | ||
本发明提供基于深度学习测评通话质量的方法,属于通话质量检测技术领域,包括以下步骤:S1、通过电话拨测系统,获取若干组主叫录音与被叫录音音频数据;S2、将步骤S1获得的音频数据全部进行快速傅里叶变换,获得对应的频谱数据;S3、将步骤S2获得的频谱数据输入训练好的卷积神经网络中,进行峰值检测、节奏点检测、响度检测、能量分析和音色分析,获得音频分析结果数据;S4、业务系统将主叫录音与对应的被叫录音经步骤S3所得到的的音频分析结果进行相似度对比,本发明能以无人值守的方式,高效的、高准确度的生成通话音频数据评测结果。
技术领域
本发明属于通话质量检测技术领域,具体涉及基于深度学习测评通话质量的方法、服务器及存储介质。
背景技术
在智能手机快速发展的时代,智能手机也随逐渐满足人们的各种需求,并在人们生活中处于不可或缺的地位。但在手机的研发过程中,由于研发人员与用户处于不同的环境,单一的得出误比特率值已不能完全代表手机的信号质量的好坏。而为了切合客户使用场景,在手机研发阶段会分时间段的场测来评价语音信号质量的高低,而场测评价信号质量的高低取决于人工判断,人工判断又存在主观行为,在一定程度上不能直观的体现信号质量。故需要一种准确且快速的测试方法来检测信号质量的好坏。
目前,传统电话通话质量测评工作,由工程师现场人工进行拨打评测,当电话、手机样本过多时需要浪费较多人力物力,效率较低,自动化、智能化欠佳。
因此需要一种测评效率高、更加智能化的方法及系统,使通话质量测评变得更加简单高效。
发明内容
本发明的目的是为了解决背景技术中提及的问题,提供基于深度学习测评通话质量的方法、服务器及存储介质,能以无人值守的方式,高效的、高准确度的生成通话音频数据评测结果。
为实现上述技术目的,本发明采取的技术方案为:
基于深度学习测评通话质量的方法,包括以下步骤:
S1、通过电话拨测系统,获取若干组主叫录音与被叫录音音频数据;
S2、将步骤S1获得的音频数据全部进行快速傅里叶变换,获得对应的频谱数据;
S3、将步骤S2获得的频谱数据输入训练好的卷积神经网络中,进行峰值检测、节奏点检测、响度检测、能量分析和音色分析,获得音频分析结果数据;
S4、业务系统将主叫录音与对应的被叫录音经步骤S3所得到的的音频分析结果进行相似度对比。
作为优选,步骤S1获得音频数据后,按照音频数据之间的停顿或者预设时间间隔对音频数据进行切分。
作为优选,步骤S2中的快速傅里叶变换公式如下:
其中,x(t)为采样的信号数据,j为长度系数,ω为旋转因子。
作为优选,步骤S3中的卷积神经网络基于深度学习框架Keras下的ResNet50模型建立;所述卷积神经网络根据输入数据尺寸配置输入层,所述输入层的输出作为ResNet50的输入;设置展平层用于展平ResNet50的输出特征向量,再通过全连接层调整次特征向量的维度,最后连接一层Softmax作为分类器。
作为优选,定义一种基于Keras中Layer类的聚类层,将卷积神经网络中分类器的输入也作为聚类层的输入,以聚类层产生的聚类结果作为分类器的参考标签,对卷积神经网络进行训练。
作为优选,步骤S4中业务系统基于杰卡德相似度算法对音频分析结果进行相似度对比,杰卡德相似度算法公式如下:
其中,A和B为两个集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电信数智科技有限公司,未经中电信数智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211703503.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种晶圆清洗方法
- 下一篇:一种分布式光伏电站监控部署系统及部署方法