[发明专利]号码状态识别方法及装置、计算机可读存储介质、终端在审
申请号: | 202211021184.0 | 申请日: | 2022-08-24 |
公开(公告)号: | CN115424619A | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 陈逸飞;吕强;李铁铮 | 申请(专利权)人: | 上海上湖信息技术有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/18;H04M3/24 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 周书敏 |
地址: | 200120 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 号码 状态 识别 方法 装置 计算机 可读 存储 介质 终端 | ||
1.一种号码状态识别方法,其特征在于,包括:
在外呼电话未接通时,抓取所述外呼电话的语音流;
将所述语音流输入至声纹识别模型进行声纹识别,得到所述语音流对应的声纹特征,其中,所述声纹识别模型从所述语音流中提取原始音频信号特征以及时频特征,对所述原始音频信号特征及时频特征进行融合,基于融合结果得到所述声纹特征;
将所述声纹特征与声纹数据库中预设的声纹样本进行相似度比对,基于相似度比对结果得到识别结果;
基于所述识别结果确定所述外呼电话的号码状态类别。
2.如权利要求1所述的号码状态识别方法,其特征在于,所述时频特征包括:采用时延神经网络提取的时延特征及基于因果膨胀卷积提取的局部特征,所述对所述原始音频信号特征及时频特征进行融合,包括:
获取所述原始音频信号特征对应的第一权重、所述时延特征对应的第二权重以及所述局部特征对应的第三权重;
采用所述第一权重、所述第二权重及所述第三权重对所述原始音频信号特征、所述时延特征以及所述局部特征进行融合,得到所述融合结果。
3.如权利要求1所述的号码状态识别方法,其特征在于,将所述语音流输入至声纹识别模型进行声纹识别之前,还包括:
对所述语音流进行语音活动检测,根据语音活动检测结果判断所述外呼电话的当前状态是否为静音;
若所述语音活动检测结果指示所述外呼电话的当前状态不为静音,则将所述语音流输入至所述声纹识别模型进行声纹识别。
4.如权利要求3所述的号码状态识别方法,其特征在于,还包括:
若所述语音活动检测结果指示所述外呼电话的当前状态为静音,则继续抓取语音流,并基于继续抓取的语音流进行号码状态识别,直至识别结果指示所述外呼电话的当前状态不为静音,将所述语音流输入至所述声纹识别模型进行声纹识别;
或者,若所述语音活动检测结果指示所述外呼电话的当前状态为静音,则继续抓取语音流,并基于继续抓取的语音流进行语音活动检测,直至所述语音活动检测结果指示所述外呼电话的当前状态为静音且抓取的语音流的累计语音时长达到第一设定时长,确定所述外呼电话的号码处于正常状态,并结束对所述外呼电话的号码状态识别。
5.如权利要求1所述的号码状态识别方法,其特征在于,所述基于所述识别结果确定所述外呼电话的号码状态类别,包括:
若所述识别结果确定所述外呼电话的号码状态类别为响铃,则继续抓取语音流,并基于继续抓取的语音流进行号码状态识别,直至所述识别结果确定所述外呼电话的号码状态类别为设定类别或者抓取的语音流的累计语音时长达到第二设定时长,结束对所述外呼电话的号码状态识别,所述设定类别选自以下任一种:暂时无法接通、空号、停机、关机、用户忙。
6.如权利要求1所述的号码状态识别方法,其特征在于,在抓取所述外呼电话的语音流之后,还包括:
对所述语音流进行音频格式处理,所述音频格式处理选自以下至少一种:采样率处理、样本宽度处理。
7.如权利要求1所述的号码状态识别方法,其特征在于,还包括:
在基于所述识别结果确定所述外呼电话的号码状态类别之后,根据号码状态类别对所述外呼电话进行分类。
8.如权利要求1所述的号码状态识别方法,其特征在于,所述声纹数据库中的声纹样本采用所述声纹识别模型进行声纹识别得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海上湖信息技术有限公司,未经上海上湖信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211021184.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种工业炉烟气余热回收装置
- 下一篇:一种便携式碳排放检测装置