[发明专利]提供基于上下文的语音识别服务的方法及装置在审
申请号: | 201880099155.1 | 申请日: | 2018-11-02 |
公开(公告)号: | CN113016029A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 黄铭振;姜敏虎;池昌真 | 申请(专利权)人: | 株式会社赛斯特安国际 |
主分类号: | G10L15/183 | 分类号: | G10L15/183;G10L15/02;G10L15/22 |
代理公司: | 北京京万通知识产权代理有限公司 11440 | 代理人: | 齐晓静 |
地址: | 韩国首*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提供 基于 上下文 语音 识别 服务 方法 装置 | ||
1.一种方法,作为识别语音的方法,其中,包括:
从用户获取语音信息的步骤;
将获取的语音信息转换为语音数据的步骤;
通过利用第一语音识别模型识别转换后的所述语音数据来产生第一语音识别结果的步骤;
通过使用第二语音识别模型识别转换后的所述语音数据来产生第二语音识别结果的步骤;以及
通过特定确定过程从所述第一语音识别结果及所述第二语音识别结果中选择特定的语音识别结果的步骤。
2.根据权利要求1所述的方法,其中,所述特定确定过程包括:
从所述第一语音识别结果及所述第二语音识别结果中提取上下文信息的步骤;
将所述上下文信息分别与预设的所述第一语音识别模型的第一特征及所述第二语音识别模型的第二特征进行比较的步骤;以及
基于所述比较结果选择所述第一语音识别结果及所述第二语音识别结果中的一个的步骤。
3.根据权利要求2所述的方法,其中,上下文信息包括所述语音信息的一部分或从所述第一语音识别结果及所述第二语音识别结果获得的信息,或者与发出语音的用户有关的信息中的至少一个。
4.根据权利要求1所述的方法,其中,所述第一语音识别模型及所述第二语音识别模型是用于识别从所述用户获得的所述语音信息的多个语音识别模型中的一个。
5.根据权利要求1所述的方法,其中,进一步包括通过使用多个所述语音识别模型识别转换后的所述语音数据来生成多个语音识别结果的步骤,所述特定语音识别结果是所述第一语音识别结果,所述第二语音识别结果以及多个所述语音识别结果中选择的一种。
6.根据权利要求1所述的方法,其中,所述特定确定过程是用于基于上下文信息中包括的上下文来确定语音识别结果的过程。
7.一种方法,作为识别语音的方法,包括:
从用户获取语音信息的步骤;
将获取的语音信息转换为语音数据的步骤;
通过利用所述第一语音识别模型识别所述语音数据来产生第一语音识别结果的步骤;
基于所述第一语音识别结果,从多个语音识别模型中选择用于识别所述语音数据的第二语音识别模型的步骤;以及
通过使用所述第二语音识别模型识别所述语音数据来生成第二语音识别结果的步骤。
8.根据权利要求7所述的方法,其中,进一步包括:
从所述第一语音识别结果中提取上下文信息的步骤;以及
将所述上下文信息与多个所述语音识别模型的预设细节进行比较的步骤,
根据所述比较结果选择所述第二语音识别模型。
9.根据权利要求8所述的方法,其中,所述第一语音识别模型是用于提取所述上下文信息的语音识别模型。
10.一种方法,作为识别语音的方法,包括:
从用户获取语音信息的步骤;
将获取的语音信息转换为语音数据的步骤;以及
通过使用从多个语音识别模型中选择的特定语音识别模型识别所述语音数据来生成语音识别结果的步骤。
11.根据权利要求10所述的方法,其中,进一步包括:
设置用于语音识别的上下文信息的步骤;以及
从多个所述语音识别模型中选择语音识别模型的特征最适合于所述上下文信息的所述特定语音识别模型的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社赛斯特安国际,未经株式会社赛斯特安国际许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880099155.1/1.html,转载请声明来源钻瓜专利网。