[发明专利]一种语音信号处理方法、装置、电子设备和存储介质在审
申请号: | 201910682976.4 | 申请日: | 2019-07-26 |
公开(公告)号: | CN110390946A | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 聂镭;沙露露;聂颖 | 申请(专利权)人: | 龙马智芯(珠海横琴)科技有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308;G10L17/26;G10L25/87;G10L25/51;G10L25/27;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 519000 广东省珠海市横琴新区环岛*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音信号 转变点 语音信号处理 贝叶斯信息准则 存储介质 电子设备 端点检测 计算效率 快速识别 片段分割 传统的 分割点 切除 语音 分割 检测 | ||
1.一种语音信号处理方法,其特征在于,所述方法包括:
通过端点检测对语音信号中非语音部分进行切除,获得若干第一语音信号片段;
对所述若干第一语音信号片段进行贝叶斯信息准则BIC检测,获得说话人转变点;
将所述说话人转变点作为分割点,对所述若干语音信号片段分割,获得若干第二语音信号片段。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述第二语音信号片段进行分类;
判断相邻的所述第二语音信号片段的类别是否相同,若相同,则将两段相邻的所述第二语音信号片段进行合并。
3.根据权利要求2所述的方法,其特征在于,所述对所述第二语音信号片段进行分类,包括:
提取所述第二语音信号片段的语音特征,获得所述第二语音信号片段的特征向量;
根据所述特征向量,采用k-means二分类对所述第二语音信号片段进行分类。
4.根据权利要求3所述的方法,其特征在于,所述提取所述第二语音信号片段的语音特征,获得所述第二语音信号片段的特征向量,包括:
分别提取所述第二语音信号片段的平均能量、过零率和说话时长;
将所述平均能量、所述过零率和所述说话时长共同组成所述第二语音信号片段的特征向量。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
对所述第二语音信号片段进行性别识别,获得各个所述第二语音信号片段的性别识别结果;
当所述性别识别结果符合预设条件时,将性别信息作为所述第二语音信号片段的语音特征之一,与所述平均能量、所述过零率和所述说话时长共同组成所述第二语音信号片段的特征向量。
6.根据权利要求5所述的方法,其特征在于,所述性别识别方法为根据基频来对性别进行识别。
7.一种语音信号处理装置,其特征在于,包括:
非语音处理模块,用于通过端点检测对语音信号中非语音部分进行切除,获得若干第一语音信号片段;
检测模块,用于对所述若干第一语音信号片段进行贝叶斯信息准则BIC检测,获得说话人转变点;
分割模块,用于将所述说话人转变点作为分割点,对所述若干语音信号片段分割,获得若干第二语音信号片段。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:
分类模块,用于对所述第二语音信号片段进行分类;
合并模块,用于判断相邻的所述第二语音信号片段的类别是否相同,若相同,则将两段相邻的所述第二语音信号片段进行合并。
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至8任一项中所述的方法。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至8任一项中所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙马智芯(珠海横琴)科技有限公司,未经龙马智芯(珠海横琴)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910682976.4/1.html,转载请声明来源钻瓜专利网。