[发明专利]一种语音输入方法和系统有效
申请号: | 201310701517.9 | 申请日: | 2013-12-18 |
公开(公告)号: | CN103677729A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 陈伟;梁伟文 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 输入 方法 系统 | ||
1.一种语音输入方法,其特征在于,包括:
采集语音数据,并将所述语音数据发送至服务器;
接收所述服务器识别出的所述语音数据对应的第一识别评分最高的前M个候选识别文本及其识别信息,其中,所述识别信息包括第一识别评分;
采用当前用户的个性化文本数据计算所述前M个候选识别文本的第二识别评分;
采用所述第一识别评分和第二识别评分计算所述前M个候选识别文本的第三识别评分;
计算第三识别评分最高的前N个候选识别文本的置信度;
按照所述置信度展示所述前N个候选识别文本。
2.根据权利要求1所述的方法,其特征在于,所述个性化文本数据包括以下的一种或多种:
输入行为文本数据、自定义词库、设备文本数据、置信度高于预置阈值的语音识别文本。
3.根据权利要求1或2所述的方法,其特征在于,所述候选识别文本包括多个语音候选词,所述识别信息还包括所述多个语音候选词的出现概率;
所述采用当前用户的个性化文本数据计算所述前M个候选识别文本的第二识别评分的步骤包括:
对所述前M个候选识别文本进行分词,获得第一分词;
分别将所述第一分词映射为预置的第二分词,其中,所述第二分词为当前用户的个性化文本数据的分词,且所述第二分词具有词频数;
分别采用所述第二分词查找所述第一分词的出现概率;所述出现概率为第一词频数与第二词频数的比值,其中,所述第一词频数为当前第一分词对应的第二分词,出现在当前第一分词前面一个或多个第一分词对应的第二分词后面的词频数,所述第二词频数为所述前面一个或多个第一分词对应的第二分词的总词频数;
采用所述第一分词的出现概率进行乘法运算以获得所述候选识别文本的连接概率;
分别采用所述多个语音候选词的出现概率和所述候选识别文本的连接概率计算所述候选识别文本的第二识别评分。
4.根据权利要求3所述的方法,其特征在于,采用以下公式计算所述候选识别文本的第二识别评分:
其中,为所述多个语音候选词的出现概率,为所述候选识别文本的连接概率,λ为权重,WP为词插入惩罚参数。
5.根据权利要求1所述的方法,其特征在于,采用以下公式计算第三识别评分:
MS(i)=α*si+β*ui
其中,MS(i)为第i个候选识别文本的第三识别评分,si为第i个候选识别文本的第一识别评分,ui为第i个候选识别文本的第二识别评分,α和β为非负数。
6.根据权利要求1所述的方法,其特征在于,所述置信度为当前候选识别文本的第三识别评分与所述前N个候选识别文本的第三识别评分的和的比值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310701517.9/1.html,转载请声明来源钻瓜专利网。