[发明专利]一种语音识别模型的训练方法和装置有效
申请号: | 201810433323.8 | 申请日: | 2018-05-08 |
公开(公告)号: | CN108831441B | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 张卓 | 申请(专利权)人: | 上海依图网络科技有限公司;上海图智安网络科技有限公司;深圳依图信息技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200233 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例涉及人工智能领域,尤其涉及一种语音识别模型的训练方法和装置。本申请实施例提供一种语音识别模型的训练方法,包括:向语音识别模型输入语音,从语音识别模型的输出侧得到语音对应的N个文本,将N个文本中的每个文本与预设数据库中存储的多个文本进行匹配,得到N个文本对应的N个匹配程度值,根据N个匹配程度值和预设条件,将N个匹配程度值中的满足预设条件的匹配程度值对应的文本确定为目标文本,将语音和目标文本作为语音识别模型的训练数据,对语音识别模型进行训练。由于可以直接通过由语音识别模型得到的N个文本进行删选处理,确定出目标文本,不再需要人工标注得到就可以获取目标文本,如此可以节省人工成本。 | ||
搜索关键词: | 语音识别 文本 匹配 目标文本 方法和装置 预设条件 语音 人工智能领域 获取目标 模型输入 人工标注 人工成本 训练数据 预设 申请 数据库 存储 输出 | ||
【主权项】:
1.一种语音识别模型的训练方法,其特征在于,包括:向语音识别模型输入语音,从所述语音识别模型的输出侧得到所述语音对应的N个文本,所述N为正整数;将所述N个文本中的每个文本与预设数据库中存储的多个文本进行匹配,得到所述N个文本对应的N个匹配程度值,其中,所述N个文本与所述N个匹配程度值一一对应;根据所述N个匹配程度值和预设条件,将所述N个匹配程度值中的满足预设条件的匹配程度值对应的文本确定为目标文本;具体包括:将所述N个文本中的每个文本与第一预设数据库中存储的多个文本进行匹配,得到所述N个文本对应的N个第一匹配程度值,其中,所述N个文本与所述N个第一匹配程度值一一对应;从所述N个第一匹配程度值中确定出大于第一阈值的M个第一匹配程度值,所述M为不大于所述N的正整数;根据所述M个第一匹配程度值对应的M个文本,从所述M个文本中确定出所述目标文本;将所述语音和所述目标文本作为所述语音识别模型的训练数据,对所述语音识别模型进行训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图网络科技有限公司;上海图智安网络科技有限公司;深圳依图信息技术有限公司,未经上海依图网络科技有限公司;上海图智安网络科技有限公司;深圳依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810433323.8/,转载请声明来源钻瓜专利网。