[发明专利]一种语音关键词识别中扩增语料的选取方法有效

专利信息
申请号: 202010347536.6 申请日: 2020-04-28
公开(公告)号: CN111554273B 公开(公告)日: 2023-02-10
发明(设计)人: 贺前华;汪星;严海康 申请(专利权)人: 华南理工大学
主分类号: G10L15/06 分类号: G10L15/06;G10L15/07;G10L15/16;G10L15/22;G10L15/01;G10L21/013;G10L25/87
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 李斌
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种语音关键词识别中扩增语料的选取方法,步骤包括:对含关键词的原始语音进行语音转化,得到同一语义但不同说话人信息的语音;对原始语音进行语音端点检测去除静音部分,再获取原始语音和生成语音中的关键词片段;将原始语音关键词片段分为男女两类样本,分别训练UBMM、UBMF,用第i个关键词的男女两类原始语音关键词片段分别训练GMM(M,i)、GMM(F,i);采用GMM分离度度量判断GMM分量距离,将分离度较小的设为相似GMM分量,去除GMM(M,i)、GMM(F,i)中相似GMM分量,剩下分离度较大分量形成新的GMM′(M,i)、GMM′(F,i),用GMM′(b,i)、GMM′(g,i)对生成语音关键词片段进行性别分类;采用改进后的评价系数对生成语音进行评价,选取训练样本。本发明能在存在样本较少或不均衡的情况下更高效地训练模型。
搜索关键词: 一种 语音 关键词 识别 扩增 语料 选取 方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202010347536.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top