[发明专利]说话人标注方法、装置、电子设备和存储介质在审
申请号: | 202110687932.8 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113421563A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 王玮;刘寿生;苏文畅;张云;刘志悠 | 申请(专利权)人: | 安徽听见科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L17/02;G10L17/22 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 说话 标注 方法 装置 电子设备 存储 介质 | ||
本发明提供一种说话人标注方法、装置、电子设备和存储介质,其中方法包括:获取实时录制的语音数据流中的一段语音数据,对所述语音数据进行声纹分离,得到所述语音数据中各初始角色的声纹特征;基于各初始角色的声纹特征之间的匹配度,对所述语音数据进行角色重置,得到所述语音数据中各重置角色的声纹特征;基于各重置角色的声纹特征和各注册说话人的声纹特征之间的匹配度,对所述语音数据进行说话人标注,解决了录制结束后注册说话人的适配问题和在录制结束后对会议录音文件重新进行声纹提取需耗费较长时间的问题,克服了盲源分离可靠性差的问题,极大地提高了声纹分离和特征提取的可靠性和准确性,以及对语音数据进行说话人标注的效率。
技术领域
本发明涉及语音转写技术领域,尤其涉及一种说话人标注方法、装置、电子设备和存储介质。
背景技术
随着语音会议转写准确率的提高,在多人讨论的会议场景中,对语音转写引擎角色分离能力的要求也越来越高。
但是,在实际的会议讨论场景中,由于会议中各种突发事项,事先总是无法将所有说话人的声纹都进行注册,因此需在会议录制结束后补充注册说话人的声纹,然而,录制结束后注册的声纹无法直接对会中录制的语音进行说话人标注。
为了解决上述问题,需在录制结束后对会议的录音文件重新进行声纹提取。但是,录制结束后对录音文件进行声纹提取需耗费较长时间。
发明内容
本发明提供一种说话人标注方法、装置、电子设备和存储介质,用以解决现有技术中录制结束后对录音文件进行声纹提取需耗费较长时间的缺陷。
本发明提供一种说话人标注方法,包括:
获取实时录制的语音数据流中的一段语音数据,对所述语音数据进行声纹分离,得到所述语音数据中各初始角色的声纹特征;
基于各初始角色的声纹特征之间的匹配度,对所述语音数据进行角色重置,得到所述语音数据中各重置角色的声纹特征;
基于各重置角色的声纹特征和各注册说话人的声纹特征之间的匹配度,对所述语音数据进行说话人标注。
根据本发明提供的一种说话人标注方法,所述基于各重置角色的声纹特征和各注册说话人的声纹特征之间的匹配度,对所述语音数据进行说话人标注,包括:
若所述语音数据的语音转写结束,或所述各注册说话人的声纹特征发生更新,则基于各重置角色的声纹特征和各注册说话人的声纹特征之间的匹配度,对所述语音数据进行说话人标注;
所述语音数据的语音转写与声纹分离同步执行。
根据本发明提供的一种说话人标注方法,所述基于各重置角色的声纹特征和各注册说话人的声纹特征之间的匹配度,对所述语音数据进行说话人标注,包括:
若任一重置角色的声纹特征与任一注册说话人的声纹特征之间的匹配度大于标注阈值,则以所述任一注册说话人标注所述任一重置角色在所述语音数据中的发言区间;
若任一重置角色的声纹特征与各注册说话人的声纹特征之间的匹配度均小于等于所述标注阈值,则以未注册说话人标注所述任一重置角色在所述语音数据中的发言区间。
根据本发明提供的一种说话人标注方法,所述基于各重置角色的声纹特征和各注册说话人的声纹特征之间的匹配度,对所述语音数据进行说话人标注,之后还包括:
基于说话人标注所得的各说话人在所述语音数据中的发言区间,确定所述语音数据的各语音转写结果对应的说话人信息,所述各说话人包括注册说话人和未注册说话人。
根据本发明提供的一种说话人标注方法,所述基于说话人标注所得的各说话人在所述语音数据中的发言区间,确定所述语音数据的各语音转写结果对应的说话人信息,包括:
确定各语音转写结果在所述语音数据中的时间窗;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽听见科技有限公司,未经安徽听见科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110687932.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像采集方法、装置、存储介质及移动终端
- 下一篇:一种金属铸件除锈回收装置