[发明专利]处理方法和装置在审
申请号: | 202110343223.8 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113053382A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 鹿飞 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L21/0208;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 林哲生 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 方法 装置 | ||
本申请公开了一种处理方法和装置,该方法包括,获得预处理服务器发送的预处理语音数据,预处理语音数据是预处理服务器处理客户端发送的语音数据得到的,预处理语音数据携带有表征客户端的第一标识信息;获得客户端发送的语音识别命令,语音识别命令携带有第二标识信息;如果第二标识信息与第一标识信息匹配,基于语音识别命令对预处理语音数据进行语音识别,得到语音识别结果;将语音识别结果返回给客户端。本方案中,预处理语音数据由预处理服务器直接传输至语音识别服务器,语音识别服务器能够更快的进行语音识别,从而改善语音识别的实时性。
技术领域
本申请涉及信息处理技术领域,更具体地说,涉及一种处理方法和装置。
背景技术
语音助手等语音识别应用的客户端会将采集到的语音发送到语音识别服务器侧进行语音识别。
由于语音识别应用的客户端采集到的语音可能会存在较多干扰信号,为了提高语音识别效果,在语音识别之前,还需要对语音进行降噪等预处理。而为了能够实现语音的降噪等预处理,同时又避免对语音识别服务器做过多改动,目前存在利用语音识别服务器之外单独设置的预处理服务器对客户端采集到的语音进行降噪等预处理的需求。
为了在语音识别之前对语音信号进行降噪等预处理,语音识别应用的客户端需要先将采集到的语音发送给预处理服务器进行预处理,然后,客户端再将预处理服务器返回的经过预处理的语音数据发送给语音识别服务器。然而,语音数据的数据量较多,多次频繁传输语音数据也必须要需要耗费较多的带宽,也会导致语音数据的语音识别延迟,使得语音识别的实时性较差。
发明内容
本申请提供一种处理方法和装置。
其中,一种处理方法,包括:
获得预处理服务器发送的预处理语音数据,所述预处理语音数据是所述预处理服务器处理客户端发送的语音数据得到的,所述预处理语音数据携带有表征所述客户端的第一标识信息;
获得所述客户端发送的语音识别命令,所述语音识别命令携带有第二标识信息;
如果所述第二标识信息与所述第一标识信息匹配,基于所述语音识别命令对所述预处理语音数据进行语音识别,得到语音识别结果;
将所述语音识别结果返回给所述客户端。
在一种可能的实现方式中,在获得预处理服务器发送的预处理语音数据之后,还包括:
如果未获得与所述预处理语音数据对应的语音识别命令,将获得的预处理语音数据片段对应缓存至目标缓存区;且/或,
如果在预设时间段内未获得与所述预处理语音数据对应的语音识别命令,将缓存至目标缓存区的所述预处理语音数据片段删除;
且/或,所述基于所述语音识别命令对所述预处理语音数据进行语音识别,包括:
如果所述语音识别命令携带的第二标识信息与所述目标缓存区中缓存的预处理语音数据对应的所述第一标识信息匹配,基于所述语音识别命令对所述预处理语音数据进行语音识别。
在又一种可能的实现方式中,还包括:
如果在获得所述语音识别命令之后未获得与所述语音识别命令对应的预处理语音数据,或,
如果获得的语音识别命令携带的第二标识信息与目标缓存区内缓存的预处理语音数据对应的第一标识信息不匹配,将获得的语音识别命令缓存至目标缓存区;
且/或,
基于所述语音识别命令对所述预处理语音数据进行语音识别,还包括:
如果获得的所述预处理语音数据携带的第一标识信息与所述缓存区内缓存的所述语音识别命令的第二标识信息匹配,依据所述缓存区内匹配出的所述语音识别命令对所述预处理语音数据进行语音识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110343223.8/2.html,转载请声明来源钻瓜专利网。