[发明专利]一种语言模型建立方法及装置有效
申请号: | 201810360452.9 | 申请日: | 2018-04-20 |
公开(公告)号: | CN110390093B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 张鹏 | 申请(专利权)人: | 普天信息技术有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种语言模型建立方法及装置。所述方法包括获取语料库,语料库包括至少一个经过分词处理的句子;根据策略函数对所述语料库中的每个句子进行筛选,将满足预设筛选条件的句子组成分词词典;通过对分词词典中每个句子的分析得到语言模型;用语言模型对预先获取的声学模型进行解码以计算损失函数;若根据损失函数和预设的奖励函数得到的奖励值满足预设的优化条件,则判断所述语言模型建立完成,本发明实施例通过策略函数对获取的语料库进行筛选,然后将得到语言模型对声学模型进行解码得到CTC函数,再通过得到的奖励函数对策略函数进行优化改进,从而通过强化学习的方法快速得到需要的语言模型,且能够提高语音识别的准确率。 | ||
搜索关键词: | 一种 语言 模型 建立 方法 装置 | ||
【主权项】:
1.一种语言模型的建立方法,其特征在于,包括:获取语料库,所述语料库包括至少一个经过分词处理的句子;根据策略函数对所述语料库中的每个句子进行筛选,将满足预设筛选条件的句子组成分词词典;通过对所述分词词典中每个句子的分析得到语言模型;用所述语言模型对预先获取的声学模型进行解码以计算损失函数;若根据所述损失函数和预设的奖励函数得到的奖励值满足预设的优化条件,则判断所述语言模型建立完成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普天信息技术有限公司,未经普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810360452.9/,转载请声明来源钻瓜专利网。