[发明专利]一种语言模型计算处理方法及系统有效
申请号: | 201510504959.3 | 申请日: | 2015-08-17 |
公开(公告)号: | CN105159473B | 公开(公告)日: | 2018-02-13 |
发明(设计)人: | 肖日新 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F17/27 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 温旭,郝传鑫 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语言 模型 计算 处理 方法 系统 | ||
1.一种语言模型计算处理方法,其特征在于,所述方法包括:
根据输入发音,对训练语料数据进行查询,得到所述发音对应的词条;
通过n元语法ngram模型结合npos模型来计算所述词条的转移概率cost值;以及
选取所述计算出的cost值最小词条作为候选结果;
其中,所述通过ngram模型结合npos模型来计算所述词条的cost值包括:
当第N+1个所述词条与前N个词条不存在共现信息时,则通过所述npos模型计算所述词条的cost值,其中,N为不小于1的整数。
2.如权利要求1所述的方法,其特征在于,所述对训练语料数据进行查询,得到所述发音对应的词条包括:
对所述发音进行逐字符组合,获取所有可能的发音片段,并根据所述发音片段查询对应的词条。
3.如权利要求2所述的方法,其特征在于,所述通过所述npos模型计算所述词条的cost值包括:
计算所述前N个词条的词性共现频次以及各个词性到词的cost值。
4.如权利要求1所述的方法,其特征在于,所述选取所述计算出的cost值最小词条作为候选结果包括:
按照所述cost值由小至大排列所述词条,选取一个或多个所述最小词条作为候选结果。
5.一种语言模型计算处理系统,其特征在于,所述系统包括:
查询模块,用于根据输入发音,对训练语料数据进行查询,得到所述发音对应的词条;
计算模块,用于通过ngram模型结合npos模型来计算所述词条的cost值;
选取模块,用于选取所述计算出的cost值最小词条作为候选结果;
其中,所述通过ngram模型结合npos模型来计算所述词条的cost值包括:
当第N+1个所述词条与前N个词条不存在共现信息时,则通过所述npos模型计算所述词条的cost值,其中,N不小于1的整数。
6.如权利要求5所述的系统,其特征在于,所述查询模块包括:
字符组合单元,用于对所述发音进行逐字符组合;
获取单元,用于获取所有可能的发音片段以及
查询单元,用于根据所述发音片段查询对应的词条。
7.如权利要求5所述的系统,其特征在于,
所述通过所述npos模型计算所述词条的cost值包括:
计算前N个词条的词性共现频次以及各个词性到词的cost值。
8.如权利要求5所述的系统,其特征在于,所述选取模块包括:
排列单元,用于按照所述cost值由小至大排列所述词条;以及
选取单元,用于选取一个或多个所述最小词条作为候选结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510504959.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:触控事件响应方法及移动终端
- 下一篇:一种基于人脸姿态估计的控制方法与系统