[发明专利]用于修改语音识别结果的系统和方法在审
申请号: | 202010814764.X | 申请日: | 2020-08-13 |
公开(公告)号: | CN112397063A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 金灿佑;D.N.戈夫达;A.加格;李暻慜 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/30;G10L15/01;G06F40/211;G06F16/332;G06F16/33;G06F16/387 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 修改 语音 识别 结果 系统 方法 | ||
1.一种服务器修改从设备提供的语音识别结果的方法,所述方法包括:
从所述设备接收来自所述设备的自动语音识别ASR模型的输出文本;
识别与所述输出文本的主题相关的至少一个域;
从所述服务器中包括的多个文本修改模型中选择所述至少一个域的至少一个文本修改模型,其中,所述至少一个文本修改模型是被训练为分析与所述主题相关的文本的人工智能AI模型;
使用所述至少一个文本修改模型修改所述输出文本以生成修改的文本;以及
将所述修改的文本提供给所述设备。
2.根据权利要求1所述的方法,其中,所述至少一个文本修改模型是通过使用来自所述ASR模型的输出文本和预设域的真实文本训练的AI模型。
3.根据权利要求2所述的方法,其中,所述至少一个文本修改模型是通过使用从不同ASR模型输出的多条文本被训练为分析与所述主题相关的文本的AI模型。
4.根据权利要求1所述的方法,其中,所述多个文本修改模型分别与多个域相对应,并且
其中,选择所述至少一个文本修改模型包括从与所述多个域相对应的所述多个文本修改模型中选择与所述至少一个域相对应的所述至少一个文本修改模型。
5.根据权利要求1所述的方法,其中,接收所述文本包括:接收从所述ASR模型输出的文本流,并且
其中,识别所述至少一个域包括通过以节为单位累积所述文本流来识别所述至少一个域。
6.根据权利要求5所述的方法,其中,识别所述至少一个域包括通过计算以节为单位累积的所述文本流的域可靠性来识别所述至少一个域。
7.根据权利要求1所述的方法,其中,识别所述至少一个域包括将所述输出文本分类为多个节,并识别分别与所述多个节相关的多个域,
其中,选择所述至少一个文本修改模型包括选择与所述多个域相对应的所述多个文本修改模型,并且
其中,修改所述输出文本包括通过使用所述多个文本修改模型分别修改所述多个节的多条文本。
8.根据权利要求1所述的方法,还包括:
从所述设备接收由所述设备计算的所述输出文本的第一域可靠性;以及
计算所述输出文本的所述第二域可靠性,
其中,识别所述至少一个域包括基于所述第一域可靠性和所述第二域可靠性来识别与所述输出文本相关的所述至少一个域。
9.根据权利要求8所述的方法,还包括基于所述第一域可靠性从所述服务器中的多个域识别模块中选择域识别模块,
其中,计算所述第二域可靠性包括通过使用所述域识别模块来计算所述输出文本的第二域可靠性。
10.根据权利要求1所述的方法,其中,所述设备的ASR模型是端到端ASR模型,并且
其中,所述服务器中包括的所述多个文本修改模型中的每个文本修改模型是用于语音识别的序列到序列模型。
11.一种用于修改从设备提供的语音识别结果的服务器,所述服务器包括:
通信接口;
存储器,存储一个或多个指令;和
处理器,被配置为运行所述一个或多个指令以控制所述服务器以便:
从所述设备接收来自所述设备的自动语音识别ASR模型的输出文本,
识别与所述输出文本的主题相关的至少一个域,
从所述服务器中包括的多个文本修改模型中选择所述至少一个域的至少一个文本修改模型,其中,所述至少一个文本修改模型是被训练为分析与所述主题相关的文本的人工智能AI模型,
使用所述至少一个文本修改模型修改所述输出文本以生成修改的文本,以及
将所述修改的文本提供给所述设备。
12.根据权利要求11所述的服务器,其中,所述至少一个文本修改模型是通过使用来自所述ASR模型的输出文本和预设域的真实文本训练的AI模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010814764.X/1.html,转载请声明来源钻瓜专利网。