[发明专利]声纹分割方法、装置、设备及可读存储介质在审
申请号: | 202011072873.5 | 申请日: | 2020-10-09 |
公开(公告)号: | CN112201275A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 谭聪慧 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L17/00;G10L15/26;G10L15/04;G10L15/16 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张志江 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 分割 方法 装置 设备 可读 存储 介质 | ||
1.一种声纹分割方法,其特征在于,所述方法包括以下步骤:
对目标语音帧进行语音识别得到目标语音帧对应的目标文本;
分别计算所述目标文本中各个词作为说话人分界词的概率,并基于所述概率从所述各个词中确定说话人分界词;
基于所述说话人分界词对应的发声时间确定所述目标语音帧的说话人切割点。
2.如权利要求1所述的声纹分割方法,其特征在于,所述分别计算所述目标文本中各个词作为说话人分界词的概率的步骤之前,还包括:
获取训练语料库,其中,所述训练语料库包括多条包含不同说话人发言的对话文本;
采用所述训练语料库训练得到目标文本模型;
所述分别计算所述目标文本中各个词作为说话人分界词的概率的步骤包括:
基于所述目标文本模型计算得到所述目标文本中各个词分别作为说话人分界词的概率。
3.如权利要求2所述的声纹分割方法,其特征在于,所述采用所述训练语料库训练得到目标文本模型的步骤包括:
分别统计所述训练语料库中各个词作为发言开始词的开始概率和作为发言结束词的结束概率,并将统计结果作为目标文本模型;
所述基于所述目标文本模型计算得到所述目标文本中各个词分别作为说话人分界词的概率的步骤包括:
依次将所述目标文本中的各个词作为目标词;
从所述目标文本模型中获取所述目标词对应的结束概率和所述目标文本中所述目标词的下一个词对应的开始概率;
将所述目标词对应的结束概率和所述下一个词对应的开始概率相乘,得到所述目标词作为说话人分界词的概率。
4.如权利要求1所述的声纹分割方法,其特征在于,所述对目标语音帧进行语音识别得到目标语音帧对应的目标文本的步骤包括:
将所述目标语音帧输入预设语音识别模型进行识别,得到所述目标语音帧对应的目标文本以及得到所述目标文本中各个词对应的发声时间,其中,所述发声时间包括发声开始时间点和发声结束时间点;
所述基于所述说话人分界词对应的发声时间确定所述目标语音帧的说话人切割点的步骤包括:
基于所述说话人分界词对应的发声结束时间点和所述目标文本中所述说话人分界词的下一个词对应的发声开始时间点,确定所述目标语音帧的说话人切割点。
5.如权利要求1至4任一项所述的声纹分割方法,其特征在于,所述对目标语音帧进行语音识别得到目标语音帧对应的目标文本的步骤之前,还包括:
对待分割语音进行分帧得到各个语音帧;
对各所述语音帧分别进行声纹识别得到各所述语音帧对应的说话人,并将说话人不同的相邻两个语音帧作为目标语音帧。
6.如权利要求5所述的声纹分割方法,其特征在于,当所述目标语音帧中在前的语音帧对应第一说话人,在后的语音帧对应第二说话人时,所述基于所述说话人分界词对应的发声时间确定所述目标语音帧的说话人切割点的步骤之后,还包括:
基于所述说话人切割点对所述目标语音帧进行切割,得到在前的第一切割帧和在后的第二切割帧;
将所述第一说话人作为所述第一切割帧的说话人,将所述第二说话人作为所述第二切割帧的说话人;
将各帧片段中对应相同说话人的帧片段按照时间顺序进行拼接,得到所述待分割语音对应的声纹分割结果,其中,所述各帧片段包括所述第一切割帧、第二切割帧和所述待分割语音对应的除所述目标语音帧外的各所述语音帧。
7.如权利要求5所述的声纹分割方法,其特征在于,所述对各所述语音帧分别进行声纹识别得到各所述语音帧对应的说话人的步骤包括:
对所述语音帧进行声纹特征提取,得到所述语音帧对应的声纹特征向量;
将所述语音帧的声纹特征向量分别与各说话人的声纹特征向量进行相似度匹配,得到所述语音帧分别与各说话人之间的匹配度;
将匹配度最高的说话人作为所述语音帧对应的说话人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011072873.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:通信设备的接口转换装置及通信系统
- 下一篇:一种具有自锁功能的窗帘杆