[发明专利]音频数据处理方法、装置、存储介质及设备有效
申请号: | 202010612049.8 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111554300B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 田植良 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/07;G10L15/06 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 数据处理 方法 装置 存储 介质 设备 | ||
1.一种音频数据处理方法,其特征在于,包括:
获取目标用户的音频数据,以及所述目标用户的用户属性信息;
获取候选用户集合,以及所述候选用户集合中的候选用户的用户属性信息;
将所述候选用户集合中用户属性信息,与所述目标用户的用户属性信息匹配的候选用户作为参考用户;
获取所述参考用户的历史音频数据,对所述参考用户的历史音频数据进行音频特征提取,得到候选用户音频特征;
对所述候选用户音频特征进行融合,得到参考用户音频特征,所述参考用户音频特征包括音频内容特征以及声音属性特征,音频内容特征用于指示音频数据所包含的内容,声音属性特征用于指示参考用户针对音频数据所包含的内容的发音特征和/或表达方式;
提取所述参考用户音频特征中的参考用户声音属性特征;根据所述参考用户声音属性特征以及所述目标用户的音频数据,生成所述目标用户的音频数据对应的文本数据。
2.如权利要求1所述的方法,其特征在于,所述提取所述参考用户音频特征中的参考用户声音属性特征;根据所述参考用户声音属性特征以及所述目标用户的音频数据,生成所述目标用户的音频数据对应的文本数据,包括:
获取目标音频识别模型;
采用所述目标音频识别模型提取所述参考用户音频特征中的参考用户声音属性特征;根据所述参考用户声音属性特征以及所述目标用户的音频数据,生成所述目标用户的音频数据对应的文本数据。
3.如权利要求2所述的方法,其特征在于,所述目标音频识别模型包括感知层、特征提取层、联通层以及识别层;
所述采用所述目标音频识别模型提取所述参考用户音频特征中的参考用户声音属性特征;根据所述参考用户声音属性特征以及所述目标用户的音频数据,生成所述目标用户的音频数据对应的文本数据,包括:
采用所述感知层对所述参考用户音频特征进行属性特征提取,得到所述参考用户声音属性特征;
采用所述特征提取层对所述目标用户的音频数据进行音频特征提取,得到目标用户音频特征;所述目标用户音频特征包括目标用户声音属性特征,以及关注于所述音频数据的音频内容特征;
在所述联通层中,根据所述参考用户声音属性特征,对所述目标用户声音属性特征进行增强处理,得到增强处理后的声音属性特征;
采用所述识别层对增强处理后的声音属性特征以及所述音频内容特征进行识别,得到所述目标用户的音频数据对应的文本数据。
4.如权利要求3所述的方法,其特征在于,所述在所述联通层中,根据所述参考用户声音属性特征,对所述目标用户声音属性特征进行增强处理,得到增强处理后的声音属性特征,包括:
获取所述目标用户声音属性特征的特征启始标识以及特征结束标识;
在所述联通层中,在所述特征启始标识所在的位置之前拼接所述参考用户声音属性特征,在所述特征结束标识所在的位置之后拼接所述参考用户声音属性特征,得到增强处理后的声音属性特征。
5.如权利要求3或4所述的方法,其特征在于,所述方法还包括:
获取语言模型,以及音频识别模型,所述语言模型具有预测文本数据的能力,所述语言模型是通过样本本文数据训练得到的,所述语言模型的结构与所述音频识别模型的结构匹配;
采用所述语言模型的参数对所述音频识别模型的参数进行初始化处理;
获取样本用户的音频数据,所述样本用户的音频数据的标注文本数据,以及与所述样本用户的用户属性信息匹配的参考样本用户音频特征;
采用所述样本用户的音频数据、所述样本用户的音频数据的标注文本数据、以及所述参考样本用户音频特征对初始化后的音频识别模型进行调整;
将调整后的音频识别模型确定为所述目标音频识别模型。
6.如权利要求5所述的方法,其特征在于,所述采用所述语言模型的参数对所述音频识别模型的参数进行初始化处理,包括:
采用所述语言模型的参数,对所述音频识别模型的识别层的参数进行初始化处理,得到初始化后的音频识别模型;所述语言模型的结构与所述音频识别模型的识别层的结构相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010612049.8/1.html,转载请声明来源钻瓜专利网。