[发明专利]一种重音评价方法、装置及电子设备在审
申请号: | 202010377024.4 | 申请日: | 2020-05-07 |
公开(公告)号: | CN111583961A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 饶丰;应燚标;庞永强;王丹;汪巍;杨熙 | 申请(专利权)人: | 北京一起教育信息咨询有限责任公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G06N3/08;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 柳欣 |
地址: | 100102 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 重音 评价 方法 装置 电子设备 | ||
本发明提供了一种重音评价方法、装置及电子设备,其中,该方法包括:获取待评价的语音数据,利用具有非重音标签的输出层的深度神经网络DNN‑隐马尔科夫模HMM对待评价的语音数据进行强制对齐,得到待评价的语音数据中各音素的发音起始时间、发音终止时间以及非重音置信度;将各所述音素的发音起始时间、发音终止时间以及非重音置信度输入到具有重音标签的输出层的DNN‑HMM中,得到待评价的语音数据中的每一帧语音数据在所有音素上的重音置信度;利用所述重音置信度,对所述语音数据中各所述音素的重音进行评价。通过本发明实施例提供的重音评价方法、装置及电子设备,能够对语音数据中的各音素的重音进行准确评价。
技术领域
本发明涉及深度学习技术领域,具体而言,涉及一种重音评价方法、装置、电子设备及计算机可读存储介质。
背景技术
目前,语音评测是K12在线教育场景中的重要场景,通过在线进行语音评测,可以有效的提升学生的口语水平。而重音作为发音的重要评价部分,对口语打分的准确性起着至关重要的作用。
重音作为一个重要的评分标准,可以采用基于韵律的重音打分模型,从语言学的角度去理解重音的打分。
重音的打分过程中容易实现过拟合或者是欠拟合的现象,影响最终的打分效果。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种重音评价方法、装置、电子设备及计算机可读存储介质。
第一方面,本发明实施例提供了一种重音评价方法,包括:
获取待评价的语音数据,利用具有非重音标签的输出层的深度神经网络DNN-隐马尔科夫模HMM对待评价的语音数据进行强制对齐,得到待评价的语音数据中各音素的发音起始时间、发音终止时间以及非重音置信度;
将各所述音素的发音起始时间、发音终止时间以及非重音置信度输入到具有重音标签的输出层的DNN-HMM中,得到待评价的语音数据中的每一帧语音数据在所有音素上的重音置信度;
利用所述重音置信度,对所述语音数据中各所述音素的重音进行评价。
第二方面,本发明实施例提供了一种重音评价装置,包括:
获取模块,用于获取待评价的语音数据,利用具有非重音标签的输出层的深度神经网络DNN-隐马尔科夫模HMM对待评价的语音数据进行强制对齐,得到待评价的语音数据中各音素的发音起始时间、发音终止时间以及非重音置信度;
处理模块,用于将各所述音素的发音起始时间、发音终止时间以及非重音置信度输入到具有重音标签的输出层的DNN-HMM中,得到待评价的语音数据中的每一帧语音数据在所有音素上的重音置信度;
评价模块,用于利用所述重音置信度,对所述语音数据中各所述音素的重音进行评价。
第三方面,本发明实施例提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,所述计算机程序被所述处理器执行时实现如上述第一方面所述的重音评价方法中的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的重音评价方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京一起教育信息咨询有限责任公司,未经北京一起教育信息咨询有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010377024.4/2.html,转载请声明来源钻瓜专利网。