[发明专利]语音数据处理方法、电子设备及计算机可读存储介质在审
申请号: | 202110342497.5 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113033191A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 邹平;俞凯 | 申请(专利权)人: | 上海思必驰信息科技有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F21/62;G10L15/26;G10L25/48 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
地址: | 200232 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 数据处理 方法 电子设备 计算机 可读 存储 介质 | ||
1.一种语音数据处理方法,包括:
对语音数据进行生物特征处理得到第一脱敏语音数据;
对所述第一脱敏语音数据进行语音识别处理得到第一脱敏识别文本内容;
按照预设脱敏规则确定所述第一脱敏识别文本内容中的敏感文本内容;
对所述敏感文本内容进行脱敏处理;
至少根据脱敏处理结果生成第二脱敏语音数据。
2.根据权利要求1所述的方法,其特征在于,还包括:
提取所述语音数据的原始生物特征信息;
提取所述第一脱敏语音数据的新的生物特征信息;
计算所述原始生物特征信息和所述新的生物特征信息之间的相似度,得到生物特征相似度值;
当所述生物特征相似度值小于第一预设阈值时,确定所述生物特征处理合格;否则,确定所述生物特征处理不合格。
3.根据权利要求1所述的方法,其特征在于,还包括:
对所述语音数据进行语音识别得到对应的原始识别文本内容;
计算所述原始识别文本内容和所述第一脱敏识别文本内容之间的相似度,得到第一文本相似度值;
当所述第一文本相似度值大于第二预设阈值时,确定所述生物特征处理合格;否则,确定所述生物特征处理不合格。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述至少根据脱敏处理结果生成第二脱敏语音数据,包括:
根据脱敏处理结果确定脱敏后的第二脱敏识别文本内容;
合成对应于所述第二脱敏识别文本内容的第二脱敏语音数据。
5.根据权利要求1-3中任一项所述的方法,其特征在于,所述至少根据脱敏处理结果生成第二脱敏语音数据,包括:
生成对应于脱敏处理结果的脱敏音频片段;
根据所述脱敏音频片段对所述第一脱敏语音数据进行处理得到第二脱敏语音数据。
6.根据权利要求5所述的方法,其特征在于,还包括:确定所述第一脱敏语音数据中对应于所述敏感文本内容的敏感音频片段的敏感位置信息;
根据所述脱敏音频片段对所述第一脱敏语音数据进行处理得到第二脱敏语音数据,包括:将所述第一脱敏语音数据中对应于所述敏感位置信息的语音片段替换为所述脱敏音频片段得到第二脱敏语音数据。
7.根据权利要求6所述的方法,其特征在于,还包括:
对所述第二脱敏语音数据进行语音识别处理得到第二脱敏识别文本内容;
比较所述第二脱敏识别文本内容与所述第一脱敏识别文本内容之间的第二文本相似度;
当所述第二文本相似度大于第三预设阈值时确定所述第二脱敏语音数据可用。
8.根据权利要求1所述的方法,其特征在于,还包括:在对语音数据进行生物特征处理得到第一脱敏语音数据之前,滤除所述语音数据中的背景音。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任意一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-8中任意一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海思必驰信息科技有限公司,未经上海思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110342497.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理方法、装置、电子设备及存储介质
- 下一篇:一种燃气灶的散热结构