[发明专利]一种语音通话场景的识别方法以及音频策略服务端有效
申请号: | 201910522205.9 | 申请日: | 2019-06-17 |
公开(公告)号: | CN110225213B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 余艳辉;朱哮锋;蔡学江;谢小灵 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04M7/00 | 分类号: | H04M7/00;H04M9/08 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 骆苏华 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 通话 场景 识别 方法 以及 音频 策略 服务端 | ||
1.一种语音通话场景的识别方法,其特征在于,包括:
音频策略服务端确定应用客户端进入录音;
所述音频策略服务端检测通话状态的模式是否满足预设音频模式;
若满足所述预设音频模式,则所述音频策略服务端在预设时长内判断下行流的评分结果是否满足预设音频阈值,所述预设时长为所述应用客户端开始进入录音后一直到录音结束之间的任意一段持续时间;
若满足所述预设音频阈值,则音频策略服务端识别语音通话VoIP场景;
所述音频策略服务端在预设时长内判断下行流的评分结果是否满足预设音频阈值,包括:
所述音频策略服务端划分所述预设时长为至少一个时长区间;
所述音频策略服务端分别对每个时长区间中下行流的M个数据特征进行加权计算,以得到每个所述时长区间的评分结果,所述M为正整数;
所述音频策略服务端判断至少一个时长区间的评分结果是否满足所述预设音频阈值。
2.根据权利要求1所述的方法,其特征在于,所述音频策略服务端确定应用客户端进入录音,包括:
所述音频策略服务端监测所述应用客户端的录音行为,所述录音行为包括录音音频源、录音音频频道或录音采样率。
3.根据权利要求1至2中任一所述的方法,其特征在于,在所述音频策略服务端识别语音通话VoIP场景之后,还包括:
所述音频策略服务端对所述VoIP场景中的语音通话进行降噪。
4.根据权利要求1至2中任一所述的方法,其特征在于,在所述音频策略服务端识别语音通话VoIP场景之后,还包括:
所述音频策略服务端指示音频管理器进入所述VoIP场景。
5.根据权利要求4所述的方法,其特征在于,在所述音频策略服务端指示音频管理器进入所述VoIP场景之后,还包括:
所述音频策略服务端监测所述下行流中是否有声音信息;
若未监测到所述声音信息,则所述音频策略服务端确定所述应用客户端退出所述录音。
6.根据权利要求5所述的方法,其特征在于,在所述音频策略服务端确定所述应用客户端退出所述录音之后,还包括:
所述音频策略服务端向所述音频管理器发送退出消息,所述退出消息用于指示所述音频管理器退出所述VoIP场景。
7.一种音频策略服务端,其特征在于,包括:
确定模块,用于确定应用客户端进入录音;
检测模块,用于检测通话状态的模式是否满足预设音频模式;
判断模块,用于在所述检测模块检测所述通话状态的模式满足所述预设音频模式时,在预设时长内判断下行流的评分结果是否满足预设音频阈值,所述预设时长为所述应用客户端开始进入录音后一直到录音结束之间的任意一段持续时间;
识别模块,用于所述判断模块在预设时长内判断下行流的评分结果满足所述预设音频阈值,识别语音通话VoIP场景;
所述判断模块包括:
划分单元,用于划分所述预设时长为至少一个时长区间;
计算单元,用于分别对所述划分单元划分出的每个时长区间中下行流的M个数据特征进行加权计算,以得到每个所述时长区间的评分结果,所述M为正整数;
判断单元,用于判断所述计算单元计算出的至少一个时长区间的评分结果是否满足所述预设音频阈值。
8.根据权利要求7所述的音频策略服务端,其特征在于,所述确定模块,包括:
监测单元,监测所述应用客户端的录音行为,所述录音行为包括录音音频源、录音音频频道或录音采样率。
9.根据权利要求7至8任一所述的音频策略服务端,其特征在于,所述音频策略服务端还包括:
降噪模块,用于在所述识别模块识别出语音通话VoIP场景之后,对所述VoIP场景中的语音通话进行降噪。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910522205.9/1.html,转载请声明来源钻瓜专利网。