[发明专利]一种语音识别模型的训练方法和装置有效
申请号: | 201810433323.8 | 申请日: | 2018-05-08 |
公开(公告)号: | CN108831441B | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 张卓 | 申请(专利权)人: | 上海依图网络科技有限公司;上海图智安网络科技有限公司;深圳依图信息技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200233 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音识别 文本 匹配 目标文本 方法和装置 预设条件 语音 人工智能领域 获取目标 模型输入 人工标注 人工成本 训练数据 预设 申请 数据库 存储 输出 | ||
1.一种语音识别模型的训练方法,其特征在于,包括:
向语音识别模型输入语音,从所述语音识别模型的输出侧得到所述语音对应的N个文本,所述N为正整数;
将所述N个文本中的每个文本与预设数据库中存储的多个文本进行匹配,得到所述N个文本对应的N个匹配程度值,其中,所述N个文本与所述N个匹配程度值一一对应;
根据所述N个匹配程度值和预设条件,将所述N个匹配程度值中的满足预设条件的匹配程度值对应的文本确定为目标文本;具体包括:
将所述N个文本中的每个文本与第一预设数据库中存储的多个文本进行匹配,得到所述N个文本对应的N个第一匹配程度值,其中,所述N个文本与所述N个第一匹配程度值一一对应;
从所述N个第一匹配程度值中确定出大于第一阈值的M个第一匹配程度值,所述M为不大于所述N的正整数;
根据所述M个第一匹配程度值对应的M个文本,从所述M个文本中确定出所述目标文本;
将所述语音和所述目标文本作为所述语音识别模型的训练数据,对所述语音识别模型进行训练。
2.如权利要求1所述的方法,其特征在于,针对所述N个文本中的每个文本,所述文本对应的第一匹配程度值是根据所述第一预设数据库中存储的多个文本与所述文本相匹配的数量确定的。
3.如权利要求1所述的方法,其特征在于,所述根据所述M个第一匹配程度值对应的M个文本,从所述M个文本中确定出所述目标文本,包括:
将所述M个第一匹配程度值对应的M个文本与第二预设数据库中存储的多个文本进行匹配,得到所述M个文本对应的M个第二匹配程度值,其中,所述M个文本与所述M个第二匹配程度值一一对应;
从所述M个第二匹配程度值中确定出大于第二阈值的K个第二匹配程度值,所述K为不大于所述M的正整数;
根据所述K个第二匹配程度值对应的K个文本,从所述K个文本中确定出所述目标文本。
4.如权利要求3所述的方法,其特征在于,针对所述M个文本中的每个文本,所述文本对应的第二匹配程度值是根据所述第二预设数据库中存储的多个文本与所述文本相匹配的数量确定的;
所述第二预设数据库中的数据包括所述语音识别模型的输出侧对应的训练数据。
5.一种语音识别模型的训练装置,其特征在于,包括:
获取单元,用于向语音识别模型输入语音,从所述语音识别模型的输出侧得到所述语音对应的N个文本,所述N为正整数;
确定单元,用于将所述N个文本中的每个文本与预设数据库中存储的多个文本进行匹配,得到所述N个文本对应的N个匹配程度值,其中,所述N个文本与所述N个匹配程度值一一对应;根据所述N个匹配程度值和预设条件,将所述N个匹配程度值中的满足预设条件的匹配程度值对应的文本确定为目标文本;具体用于:将所述N个文本中的每个文本与第一预设数据库中存储的多个文本进行匹配,得到所述N个文本对应的N个第一匹配程度值,其中,所述N个文本与所述N个第一匹配程度值一一对应;从所述N个第一匹配程度值中确定出大于第一阈值的M个第一匹配程度值,所述M为不大于所述N的正整数;根据所述M个第一匹配程度值对应的M个文本,从所述M个文本中确定出所述目标文本;
训练单元,用于将所述语音和所述目标文本作为所述语音识别模型的训练数据,对所述语音识别模型进行训练。
6.如权利要求5所述的装置,其特征在于,针对所述N个文本中的每个文本,所述文本对应的第一匹配程度值是根据所述第一预设数据库中存储的多个文本与所述文本相匹配的数量确定的。
7.如权利要求6所述的装置,其特征在于,所述确定单元,具体用于:
将所述M个第一匹配程度值对应的M个文本与第二预设数据库中存储的多个文本进行匹配,得到所述M个文本对应的M个第二匹配程度值,其中,所述M个文本与所述M个第二匹配程度值一一对应;从所述M个第二匹配程度值中确定出大于第二阈值的K个第二匹配程度值,所述K为不大于所述M的正整数;根据所述K个第二匹配程度值对应的K个文本,从所述K个文本中确定出所述目标文本。
8.如权利要求7所述的装置,其特征在于,针对所述M个文本中的每个文本,所述文本对应的第二匹配程度值是根据所述第二预设数据库中存储的多个文本与所述文本相匹配的数量确定的;所述第二预设数据库中的数据包括所述语音识别模型的输出侧对应的训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图网络科技有限公司;上海图智安网络科技有限公司;深圳依图信息技术有限公司,未经上海依图网络科技有限公司;上海图智安网络科技有限公司;深圳依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810433323.8/1.html,转载请声明来源钻瓜专利网。