[发明专利]语音韵律异常评估方法、装置、计算机设备和存储介质有效
申请号: | 201811220665.8 | 申请日: | 2018-10-19 |
公开(公告)号: | CN109448758B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 李明;邹小兵 | 申请(专利权)人: | 昆山杜克大学;中山大学附属第三医院(中山大学肝脏病医院) |
主分类号: | G10L25/66 | 分类号: | G10L25/66;G10L25/63;G10L25/12;G10L15/01;G10L15/04;G10L15/06;G10L15/10;G10L15/18 |
代理公司: | 佛山帮专知识产权代理事务所(普通合伙) 44387 | 代理人: | 颜德昊 |
地址: | 215300 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 韵律 异常 评估 方法 装置 计算机 设备 存储 介质 | ||
1.一种孤独症语音韵律异常评估方法,其特征在于,包括:
录音采集语音测试数据;
提取所述语音测试数据中被测试者的语音数据,并进行语音片段划分;
选出测试数据中对评估有效的语音片段;
提取所述有效语音片段中的频谱特征;
采用得出的评估模型对所述频谱特征进行评估;
利用交叉验证和特征分类器从所述语音片段中选出被评估者语音训练数据中对评估有效的语音片段,包括采用弃一交叉验证:
从训练数据中选出一个被评估者的语音片段,剩下的训练数据训练一个分类模型用以预测所述的语音片段的韵律异常的量化得分;训练完成之后,被选中的被评估者的语音片段在所述分类模型上进行预测,得到语音片段对于语音韵律异常检测“有效”或者“无效”的预测标签,其中“有效”表示韵律异常的量化得分预测正确,“无效”表示韵律异常的量化得分预测错误;通过交叉验证得到训练数据上所有语音片段的“有效”或者“无效”的标签后,训练一个特征分类器,对所有训练数据语音片段的句子层面的特征进行“有效”或者“无效”的分类;
选出测试数据中对评估有效的语音片段,包括:将测试数据语音片段句子层面的特征通过所述特征分类器进行分类,判断各所述语音片段对于语音韵律异常检测“有效”或“无效”。
2.如权利要求1所述的一种孤独症韵律异常评估方法,其特征在于,得出所述评估模型包括:
录音采集语音训练数据,所述训练数据包括预定个数的被评估者语音数据和测试者对被评估者的语音韵律异常的主观量化得分,所述被评估者包括患有孤独症个体与正常个体;
提取所述语音训练数据中被评估者的语音数据,并进行语音片段划分;
利用交叉验证和特征分类器从所述语音片段中选出被评估者语音训练数据中对评估有效的语音片段;
提取所述有效语音片段中频谱特征;
使用深度神经网络对提取的所述频谱特征进行训练得到语音韵律异常的所述评估模型。
3.如权利要求1所述的一种孤独症韵律异常评估方法,其特征在于,进行语音片段划分包括:
测试数据的语音数据切分为预定时长的语音片段;
切分训练数据的语音数据时设置小于所述预定时长的窗移,得到具有重叠但不完全相同的预定时长的语音片段。
4.如权利要求3所述的一种孤独症韵律异常评估方法,其特征在于,还包括将提取的测试数据中的语音数据或训练数据中的语音数据进行说话人日志和能量平衡,所述能量平衡将语音片段中每一帧的能量减去整个语音片段中的能量最低值,再除以语音片段的能量极差。
5.如权利要求4所述的一种孤独症韵律异常评估方法,其特征在于,所述频谱特征包括短时傅里叶变换频谱、常数Q变换频谱、修正群延迟频谱中的任一种或任几种的组合。
6.如权利要求2所述的一种孤独症韵律异常评估方法,其特征在于,所述深度神经网络为卷积神经网络、双向长短时记忆网络、卷积神经网络+循环神经网络中的任一种或任几种的组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆山杜克大学;中山大学附属第三医院(中山大学肝脏病医院),未经昆山杜克大学;中山大学附属第三医院(中山大学肝脏病医院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811220665.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种检测语音质量的方法和装置
- 下一篇:一种教学用音频文件的制作方法