[发明专利]一种语音信号处理方法、装置、电子设备和存储介质在审
申请号: | 201910682976.4 | 申请日: | 2019-07-26 |
公开(公告)号: | CN110390946A | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 聂镭;沙露露;聂颖 | 申请(专利权)人: | 龙马智芯(珠海横琴)科技有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308;G10L17/26;G10L25/87;G10L25/51;G10L25/27;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 519000 广东省珠海市横琴新区环岛*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音信号 转变点 语音信号处理 贝叶斯信息准则 存储介质 电子设备 端点检测 计算效率 快速识别 片段分割 传统的 分割点 切除 语音 分割 检测 | ||
本发明公开了语音信号处理方法,通过端点检测对语音信号中非语音部分进行切除,获得若干第一语音信号片段;对所述若干第一语音信号片段进行贝叶斯信息准则BIC检测,获得说话人转变点;将所述说话人转变点作为分割点,对所述若干语音信号片段分割,获得若干第二语音信号片段,因此,可以解决传统的基于BIC的分割方法计算效率低下的问题,实现了对语音信号的说话人转变点的准确快速识别的效果。
技术领域
本发明涉及信号处理技术领域,特别是一种语音信号处理方法。
背景技术
为提升服务质量和业绩,银行、保险、电信等行业的呼叫中心或者客服中心会对坐席或者客户经理的客服工作、营销工作等业务场景的对话语音录音进行质量检索,以检索坐席或者客户经理的讲话内容和方式是否符合单位规定和要求。当前比较热门的语音质检方法是基于人工智能技术的语音质检系统,其先将语音数据转换为文本数据,然后利用预设的关键词等搜索条件,让计算机对这些文本数据分析评测。
在上述基于人工智能技术的语音质检系统中,在将语音数据转换为文本数据前,需要将不同说话人对应的音频加以区分,即说话人转变点检测,以便后续进行处理。
说话人转变点检测技术,主要包括说话人分割和说话人聚类。对于单声道音频,现有分割常用的算法是基于BIC的分割算法,算法原理是在每一个分析窗内,用两个不断变化的分析窗来计算每一帧的BIC值,最大的BIC值即为潜在的说话人分割点,如BIC的差值大于等于零时,则该分割点为真正的说话人分割点,否则就增加分析窗的长度。若在分析窗内没有发现说话人分割点则增加分析窗的长度,直到找到说话人分割点为止。当分析窗的长度增加时,计算效率会明显下降造成计算资源的浪费。
发明内容
本发明实施例提出了一种语音信号处理方法、装置、电子设备和存储介质,以至少解决传统的基于BIC的分割方法计算效率低下的问题。
根据本发明的一个实施例,提供了一种语音信号处理方法,包括:
通过端点检测对语音信号中非语音部分进行切除,获得若干第一语音信号片段;
对所述若干第一语音信号片段进行贝叶斯信息准则BIC检测,获得说话人转变点;
将所述说话人转变点作为分割点,对所述若干语音信号片段分割,获得若干第二语音信号片段。
可选地,所述方法还包括:
对所述第二语音信号片段进行分类;
判断相邻的所述第二语音信号片段的类别是否相同,若相同,则将两段相邻的所述第二语音信号片段进行合并。
可选地,所述对所述第二语音信号片段进行分类,包括:
提取所述第二语音信号片段的语音特征,获得所述第二语音信号片段的特征向量;
根据所述特征向量,采用k-means二分类对所述第二语音信号片段进行分类。
可选地,所述提取所述第二语音信号片段的语音特征,获得所述第二语音信号片段的特征向量,包括:
分别提取所述第二语音信号片段的平均能量、过零率和说话时长;
将所述平均能量、所述过零率和所述说话时长共同组成所述第二语音信号片段的特征向量。
可选地,所述方法还包括:
对所述第二语音信号片段进行性别识别,获得各个所述第二语音信号片段的性别识别结果;
当所述性别识别结果符合预设条件时,将性别信息作为所述第二语音信号片段的语音特征之一,与所述平均能量、所述过零率和所述说话时长共同组成所述第二语音信号片段的特征向量。
可选地,所述性别识别方法为根据基频来对性别进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙马智芯(珠海横琴)科技有限公司,未经龙马智芯(珠海横琴)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910682976.4/2.html,转载请声明来源钻瓜专利网。