[发明专利]语音相似度确定方法及设备、程序产品在审
申请号: | 202110179824.X | 申请日: | 2021-02-07 |
公开(公告)号: | CN112951274A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 夏瑞;屠明;丁辰;郑炜明 | 申请(专利权)人: | 脸萌有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L15/16;G10L15/02 |
代理公司: | 上海光栅知识产权代理有限公司 31340 | 代理人: | 乔慧;马雯雯 |
地址: | 英属开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 相似 确定 方法 设备 程序 产品 | ||
本实施例提供的语音相似度确定方法及设备、程序产品,涉及语音技术,包括播放示范音频,并获取用户的评测音频;其中,示范音频是使用指定语言朗读指定内容的音频;获取与示范音频对应的标准发音特征,并提取评测音频中与标准发音特征相对应的评测发音特征,其中,标准发音特征用于反映指定内容在指定语言下的特异性发音;确定标准发音特征与评测发音特征之间的特征差异,并根据特征差异确定评测音频与示范音频之间的相似度。本申请的方案中,能够在评测音频中提取与示范音频对应的标准发音特征相对应的评测发音特征,从而使用于实现跟读相似度分析功能的模块体量较小。
技术领域
本公开实施例涉及语音技术,尤其涉及一种语音相似度确定方法及设备、程序产品。
背景技术
很多用户会选择在线的方式进行语言学习。比如,利用语言学习软件学习某种语言。
现有技术中的很多语言学习软件设置有用于实现跟读的相似度分析功能的分析模块,用户可以读出指定的内容,软件可以对用户阅读指定内容时生成的音频进行分析,确定该音频与指定内容对应的标准音频之间的相似度,从而使用户能够了解跟读效果。
但是,现有技术中提供的分析模块,一般只能针对一种语言进行分析,若增加其他种类语言跟读的相似度分析功能,会导致该分析模块体量较大,对运行该分析模块的硬件设备要求较高。
发明内容
本公开实施例提供一种语音相似度确定方法及设备、程序产品,以克服现有技术中实现跟读相似度分析功能的模块的体量大的问题。
第一方面,本公开实施例提供基于语音交互的语音相似度确定方法,包括:
播放示范音频,并获取用户的评测音频;其中,所述示范音频是使用指定语言朗读指定内容的音频;
获取与所述示范音频对应的标准发音特征,并提取所述评测音频中与所述标准发音特征相对应的评测发音特征,其中,所述标准发音特征用于反映所述指定内容在所述指定语言下的特异性发音;
确定所述标准发音特征与所述评测发音特征之间的特征差异,并根据所述特征差异确定所述评测音频与所述示范音频之间的相似度。
第二方面,本公开实施例提供了一种数据请求指令的处理方法,应用于服务器,所述方法包括:
接收数据请求指令;
根据所述数据请求指令向用户终端发送基于语音识别模型的编码器、示范音频、与所述示范音频对应的标准发音特征;
其中,所述示范音频是使用指定语言朗读指定内容的音频,所述编码器用于提取评测音频中与所述标准发音特征相对应的评测发音特征,其中,所述标准发音特征用于反映所述指定内容在所述指定语言下的特异性发音。
第三方面,本公开实施例提供了一种语音相似度确定装置,包括:
获取单元,用于播放示范音频,并获取用户的评测音频;其中,所述示范音频是使用指定语言朗读指定内容的音频;
特征提取单元,用于获取与所述示范音频对应的标准发音特征,并提取所述评测音频中与所述标准发音特征相对应的评测发音特征,其中,所述标准发音特征用于反映所述指定内容在所述指定语言下的特异性发音;
分析单元,用于确定所述标准发音特征与所述评测发音特征之间的特征差异,并根据所述特征差异确定所述评测音频与所述示范音频之间的相似度。
第四方面,本公开实施例提供了一种数据请求指令的处理装置,所述装置设置于服务器中,所述装置包括:
接收单元,用于接收数据请求指令;
发送单元,用于根据所述数据请求指令向用户终端发送基于语音识别模型的编码器、示范音频、与所述示范音频对应的标准发音特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于脸萌有限公司,未经脸萌有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110179824.X/2.html,转载请声明来源钻瓜专利网。