[发明专利]一种语音识别候选同音词的展示方法及设备在审
申请号: | 201910067927.X | 申请日: | 2019-01-24 |
公开(公告)号: | CN111475129A | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 周末 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G10L15/22;G10L15/26 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 蒋欢;王琦 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 候选 同音词 展示 方法 设备 | ||
本发明公开了一种语音识别候选同音词的展示方法,包括:从服务器接收语音识别后的数据;对所述数据进行解析,判断所述数据中是否有候选词;如果有候选词,则将识别概率最高的词作为主词以超链接的方式进行展示,所述主词可点击。本申请还提供了对应的电子设备及计算机可读存储介质。应用本发明公开的技术方案,能够提高智能设备在语音识别中的智能性,避免语音识别中需要用户重新手动打字输入的问题。
技术领域
本发明涉及语音识别技术领域,特别涉及一种语音识别候选同音词的展示方法及设备。
背景技术
随着科技的发展,当前人们在智能设备(例如:各种移动设备、手持设备等)中使用应用程序时经常会用到语音识别的功能。但是,基于中文语言的博大精深,现有的语音识别准确率还不能达到99.99%。具体原因如下:
1.在机器软件中使用的中文编码一般都统一为GB2312编码。GB2312编码中共收录汉字6376个,其中不包括古代文字,而汉语有声母21个,韵母35个,声调四种,音节400个,可见,音节数量远小于汉字的数量。也就是说:汉语中包含大量的同音字和同音词。
2.语音识别技术(Auto Speech Recognize,简称ASR)是一种让机器能够“听懂”人类语音的技术。语音识别的主要流程如图1所示:
首先,对输入的一段语音进行信号处理,包括降噪、分帧等;
然后,基于信号处理的结果进行特征提取,再基于声学模型进行声学模式匹配;
最后,基于语言模型进行语言处理,得到对应于所述语音的文字结果。
根据图1所示流程,将语音具体转化成文字的功能是在语言处理阶段。语音处理的主要原理是:接收一段声学序列(可简单理解为拼音),根据大量经过文本训练的语言模型、上下文语义及统计规律给出对应于该声学序列的识别概率最大的结果,此结果即为最后识别出的文字。
下面通过一个简单举例说明上述过程:
第1步:语音录入:yuèfù。这里,由于专利文件需要用文字的方式进行表达,因而使用了拼音来表示,实际上输入的是对应于该拼音的声音信号。
第2步:对第一个音节yuè进行识别,识别出的文字可以有很多,例如:月、约、越、悦等等。因为还有下文录入,所以暂时先不返回结果。
第3步:对第二个音节fù进行识别,当结合上文就是yuèfù,此时,识别的结果将发生较大的变化,将排除日常使用中不成词的组合,例如:识别出的同音词选项可以有:岳父、月付、悦府、乐府等等。根据语言模型的判断,将在以上同音词中选择识别概率最高的词作为识别结果返回。
由于概率的算法是基于语言模型中大量的文本训练得出的。训练的文本越多,能够准确识别的概率就越高。但是,上述现有技术对于识别概率较少的上下文语义,以及在其他特殊情况中,识别的结果并不理想。
基于上述原因,在我们日常使用智能设备进行语音识别时,经常会遇到录入的语音是同音词,但是语音识别后显示的文字不是我们想要的目标词语。根据现有技术,当遇到这种情况时,通常都需要使用者用输入法手动重新输入文字,才能修改成目标词语。
可见,基于目前普遍的语音识别技术方案,如果有同音词语的语音录入的情况下,可能只能识别出使用率较高的词汇,而无法正确识别出录入者想要表达的词汇。如上举例,识别出的最高概率的词语是“月付”,但是录入者的本意却是“岳父”。如需要修改只能删除原有文字重新手动打字输入。当录入的文本较多时,还需要逐行寻找需要修改的部分。以上问题的存在,严重影响了智能设备的智能性。
发明内容
本发明实施例提供了一种语音识别候选同音词的展示方法、设备及计算机可读存储介质,以避免语音识别中需要用户重新手动打字输入的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910067927.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种OTA流量自适应管理方法和设备
- 下一篇:用于周期性样式的异常检测