[发明专利]电子设备及其语音识别方法在审
申请号: | 201711210851.9 | 申请日: | 2017-11-27 |
公开(公告)号: | CN108242235A | 公开(公告)日: | 2018-07-03 |
发明(设计)人: | 李政仁;韩澜;郑皙荣 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/183 | 分类号: | G10L15/183;G10L15/197;G10L15/26 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吴晓兵 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语言模型 电子设备 语音识别 语音数据 通用语言模型 集成语言 接收语音数据 外部电子设备 语音识别结果 上下文信息 预设时间段 关联 通信接口 用户指定 存储器 处理器 构建 词语 存储 输出 | ||
提供了一种电子设备及其语音识别方法。该电子设备可以包括:通信接口,用于从外部电子设备接收语音数据;存储器,用于存储默认用于语音识别的通用语言模型、针对每个用户指定的第一语言模型、与每个用户的上下文信息相关联的第二语言模型、以及与由电子设备在从语音数据的接收时间起的预设时间段内所收集的词语相关联的第三语言模型;以及处理器,用于执行如下过程:将第一语言模型、第二语言模型和第三语言模型中的至少一个与通用语言模型相组合以构建集成语言模型,基于语音数据和集成语言模型来执行语音识别,并且输出与语音数据相对应的语音识别结果。
技术领域
本公开涉及一种电子设备及其语音识别方法。
背景技术
诸如智能电话、平板个人计算机、便携式多媒体播放器、个人数字助理、膝上型个人计算机和可穿戴设备之类的各种电子设备已经普及。此外,这样的电子设备可以配备有用于基于用户发出的语音声音来控制电子设备的各种功能的技术。
为了根据用户的语音声音来控制功能,电子设备可以具有用于识别由用户发出的语音的语音识别功能。
语音识别技术能够使用声学模型和语言模型来识别由用户发出的语音。声学模型可以指这样的数据库,所述数据库中映射和存储了通过处理语音数据而获得的特征向量和包括与特征向量相对应的音素的音素候选组。语言模型可以指存储如下这样的信息的数据库,所述信息用于基于与语音数据相对应并从声学模型中提取的音素来对词语或音节之间的语言顺序关系进行建模。可以通过收集常用和频繁使用的词语或句子模式来创建语言模型。
可以在用于语音识别的语言模型中使用附加技术,以提高语音识别精度。例如,可以使用从用户的个性化设备中提取信息并根据所提取的用户信息修改语言模型的技术。使用基于通用语言模型根据用户信息可调整的语言模型的语音识别技术能够有助于提高针对特定用户的语音识别性能。
然而,为了提高语音识别的精度,不仅要反映用户的特性,还要反映关于执行语音识别的时间和情况的信息。
因此,为了提高语音识别的精度,必须组合使用各种语音识别模型,包括反映用户的特性的语音识别模型。
发明内容
为了解决上述缺陷,本公开的主要目的是解决上述问题和/或缺点,并提供至少下述优点。因此,本公开的一方面是提供一种使用各种详细语言模型来构建集成语言模型的装置和方法,以便在执行语音识别的各种情况下提高语音识别的精度。
本公开的另一方面是提供一种装置和方法,所述装置和方法通过在类型和组合方面改变与通用语言模型集成的详细语言模型,在执行语音识别的各种情况下最大化语音识别性能。
本公开的各种实施例涉及使用通过组合各种语音模型而产生的集成语言模型来执行语音识别。
根据本公开的一方面,提供了一种电子设备。该电子设备可以包括:通信接口,用于从外部电子设备接收用户的语音数据和用户信息;存储器,用于存储默认用于语音识别的通用语言模型、针对每个用户指定的第一语言模型、与每个用户的上下文信息相关联的第二语言模型、以及与由电子设备在从语音数据的接收时间起的预设时间段内所收集的词语相关联的第三语言模型;以及处理器,用于执行如下过程:将第一语言模型、第二语言模型和第三语言模型中的至少一个与通用语言模型相组合以构建集成语言模型,基于语音数据和集成语言模型来执行语音识别,并且输出与语音数据相对应的语音识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711210851.9/2.html,转载请声明来源钻瓜专利网。