[发明专利]语音识别方法及装置在审

申请号：	201710606162.3	申请日：	2017-07-24
公开（公告）号：	CN107464567A	公开（公告）日：	2017-12-12
发明（设计）人：	全刚;李霄寒	申请（专利权）人：	深圳云知声信息技术有限公司
主分类号：	G10L15/28	分类号：	G10L15/28;G10L15/30
代理公司：	北京尚伦律师事务所11477	代理人：	孟姣
地址：	518000 广东省深圳市南***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音识别技术领域，尤其涉及一种语音识别方法及装置。

背景技术

语音识别存在两种模式，一种离线识别模式，即通过本地服务器识别，另外一种在线识别模式，即通过网络服务器识别。传统的方式是需要在两种模式之间显示的进行切换，需要用户感知联网和不联网，例如默认在离线识别模式进行命令识别，现在想联网查个天气预报，需要先命令切换在线模式，再查询天气预报，用户使用体验效果非常不好。

发明内容

本发明实施例提供一种语音识别方法及装置，用以实现使用在线识别和离线识别两种方式对语音进行识别，从而提高识别结果的准确性，提升用户的使用体验。

根据本发明实施例的第一方面，提供一种语音识别方法，包括：

采集语音数据信息；

分别发送所述语音数据信息至本地服务器和网络服务器，以使所述本地服务器和所述网络服务器对所述语音数据信息进行语音识别，得到对应的标记有第一语音开始点和第一语音结束点的第一识别结果和第二语音开始点和第二语音结束点的第二识别结果；

在一个实施例中，所述本地服务器识别所述语音数据信息时不需要联网，所述网络服务器识别所述语音数据信息时需要联网。即通过本地服务器识别得到的是离线识别结果，通过网络服务器识别得到的是在线识别结果。

获取所述第一识别结果和所述第二识别结果；

根据所述第一识别结果、所述第二识别结果和预设的处理策略输出最终识别结果。

在该实施例中，服务器在进行语音识别时，标记出识别结果的语音开始点和语音结束点，这样，方便终端设备根据识别结果的语音开始点和结束点确定对应于同一语音数据信息的离线识别结果和在线识别结果，进而选择合适的识别结果输出，从而保证语音识别的准确性，提升用户的使用体验。

在一个实施例中，所述根据所述第一识别结果、所述第二识别结果和预设的处理策略输出最终识别结果，包括：

当先获取到所述本地服务器对应的第一识别结果时，则执行所述第一识别结果；

当再获取到所述网络服务器对应的第二识别结果时，确定所述第一识别结果和所述第二识别结果是否相同；

当所述第一识别结果与所述第二识别结果不同时，执行回退处理，将当前状态回退到执行所述第一识别结果之前的状态，再执行所述第二识别结果。

在该实施例中，如果先获取到本地服务器对应的离线识别结果，则先执行离线识别结果，当再获取到网络服务器对应的在线识别结果时，为了保证执行的识别结果的准确性，可以先按照两个识别结果的语音开始点和语音结束点将两个识别结果进行比较，确定两者是否相同，如果两者相同，则不需要再重新执行在线识别结果；如果两者不同，则需要进行回退处理，将终端设备的当前状态回退到执行离线识别结果之前的状态，重新再执行在线识别结果。

在一个实施例中，所述根据所述第一识别结果、所述第二识别结果和预设的处理策略输出最终识别结果，还包括：

当先获取到所述网络服务器对应的第二识别结果时，则执行所述第二识别结果；

当再获取到所述本地服务器对应的第一识别结果时，丢弃所述第一识别结果。

在该实施例中，如果先获取到网络服务器对应的在线识别结果，则直接执行该在线识别结果，再获取到本地服务器对应的离线识别结果时，不进行执行处理。由于在线识别结果的准确性一般较高，因此，可以保证识别结果的正确性，提升用户的使用体验。

在一个实施例中，所述方法还包括：

接收输入的处理策略设置命令；

根据所述处理策略设置命令，设置所述预设的处理策略。

在该实施例中，用户或者厂商还可以根据个人需要设置其他处理策略，从而妥善处理在线识别结果和离线识别结果之间的关系，使得最终输出的识别结果准确性更高，更符合用户的需求，提升用户的使用体验。

根据本发明实施例的第二方面，提供一种语音识别装置，包括：

采集模块，用于采集语音数据信息；

发送模块，用于分别发送所述语音数据信息至本地服务器和网络服务器，以使所述本地服务器和所述网络服务器点对所述语音数据信息进行语音识别，得到对应的标记有第一语音开始点和第一语音结束点的第一识别结果和第二语音开始点和第二语音结束点的第二识别结果；

获取模块，用于获取所述第一识别结果和所述第二识别结果；