[发明专利]一种语音识别方法、装置及终端设备在审

申请号：	201611166106.4	申请日：	2016-12-16
公开（公告）号：	CN108206020A	公开（公告）日：	2018-06-26
发明（设计）人：	李黄海	申请（专利权）人：	北京智能管家科技有限公司
主分类号：	G10L15/16	分类号：	G10L15/16;G10L15/10;G10L15/26
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆;胡彬
地址：	101500 北京市密云县经济开发***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别音信息结果向量终端设备权重向量神经网络模型归一化处理接收用户语音信息匹配度向量化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种语音识别方法、装置及终端设备，该方法包括：接收用户输入的语音信息，确定和所述语音信息对应的主题词以及主题词向量；通过神经网络模型对所述语音信息进行识别以确定识别结果；对所述识别结果进行向量化处理得到识别结果向量；计算所述识别结果向量和所述主题词向量的距离值，对所述距离值进行归一化处理得到所述识别结果和所述主题词的距离权重值，依据所述距离权重值确定所述语音信息最终对应的识别内容。本方案使得语音识别内容和用户的需求匹配度显著提高，识别效率显著增强。

技术领域

本发明实施例涉及语音识别技术，尤其涉及一种语音识别方法、装置及终端设备。

背景技术

与机器进行语音交流，让机器明白你说什么，这是人们长期以来梦寐以求的事情。中国物联网校企联盟形象得把语音识别比做“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的智能技术。

现有技术中，在对用户语音进行识别时通常采用云服务语音识别的方式，即用户通过终端设备上传语音信息，语音识别云服务器接收到包含语音信息的文件后对其进行识别以返回相应的文本信息至终端设备。

上述方案中，语音识别服务器通过用户上传的语音信息的声音维度进行识别，使得对于同音或近音的语音信息识别效果很差，如用户语音表意为“他有哪些诗”，而最终的识别内容可能是“他有哪些事”。

发明内容

本发明提供了一种语音识别方法、装置及终端设备，使得语音识别内容和用户的需求匹配度显著提高，识别效率显著增强。

第一方面，本发明实施例提供了一种语音识别方法，包括：

接收用户输入的语音信息，确定和所述语音信息对应的主题词以及主题词向量；

通过神经网络模型对所述语音信息进行识别以确定识别结果；

对所述识别结果进行向量化处理得到识别结果向量；

计算所述识别结果向量和所述主题词向量的距离值，对所述距离值进行归一化处理得到所述识别结果和所述主题词的距离权重值，依据所述距离权重值确定所述语音信息最终对应的识别内容。

第二方面，本发明实施例还提供了一种语音识别装置，包括：

主题确定模块，用于接收用户输入的语音信息，确定和所述语音信息对应的主题词以及主题词向量；

识别结果确定模块，用于通过神经网络模型对所述语音信息进行识别以确定识别结果；

识别结果向量确定模块，用于对所述识别结果进行向量化处理得到识别结果向量；

识别内容确定模块，用于计算所述识别结果向量和所述主题词向量的距离值，对所述距离值进行归一化处理得到所述识别结果和所述主题词的距离权重值，依据所述距离权重值确定所述语音信息最终对应的识别内容。

第三方面，本发明实施例还提供了一种终端设备，所述终端设备集成了上述描述的装置。

本发明实施例提供的技术方案，通过将用户输入的语音信息和该语音信息对应的主题词进行关联，依据语音信息和对应的主题词确定最终的语音识别内容，解决了仅通过用户上传的语音信息的声音维度进行识别，带来的对于同音或近音的语音信息识别效果很差问题，使得语音识别内容和用户的需求匹配度显著提高，识别效率显著增强。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1是本发明实施例一提供的语音识别方法的流程图；

图2是本发明实施例二提供的语音识别方法的流程图；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京智能管家科技有限公司，未经北京智能管家科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201611166106.4/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音识别方法、装置及终端设备在审

专利文献下载