[发明专利]信息处理设备、信息处理方法和计算机可读存储介质有效

申请号：	201780024800.9	申请日：	2017-04-24
公开（公告）号：	CN109074809B	公开（公告）日：	2020-06-23
发明（设计）人：	河野真一;泷祐平	申请（专利权）人：	索尼公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L25/63;G10L15/22;G10L15/32;G10L15/187
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	康建峰;杨华
地址：	日本***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	信息处理设备方法计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

[问题]提供可以用来执行话语识别的信息处理设备、信息处理方法和计算机可读存储介质，该话语识别适应于收集音频状态中的兴奋水平。[解决方案]一种信息处理设备，该信息处理设备设置有：获取单元，获取单元获取指示收集话语状态中的兴奋水平的信息，其中：收集状态是对包括用户话语声音的语音数据进行收集的状态，并且指示兴奋程度的信息包括包括音量或声音频率的语音数据的声音的属性信息；以及话语识别单元，话语识别单元基于指示兴奋水平的信息、兴奋程度与第一阈值之间的比较以及兴奋程度大于第一阈值的持续时间的长度来执行基于话语中的音素的第一话语识别。

技术领域

本公开内容涉及信息处理设备、信息处理方法和计算机可读存储介质。

背景技术

过去，已经提出了与自然语言处理相关的各种技术。例如，以下专利文献1公开了基于用户在多个短语当中选择的短语来生成句子的技术。

此外，还提出了与语音识别相关的各种技术。在语音识别中，可以将正在讲话的用户的语音转换成字符串。

引用列表

专利文献

专利文献1：JP 2012-53634A

发明内容

技术问题

然而，在现有技术中，例如，无论用户在声音收集状态下的兴奋程度如何，都对所收集的语音固定地执行语音识别。因此，在现有技术中，无法获得反映兴奋程度的语音识别结果。

在这方面，本公开内容提出了新颖的和改进的、并且能够适应于声音收集状态中的兴奋程度来执行语音识别的信息处理设备、信息处理方法和程序。

问题的解决方案

根据本公开内容，提供了一种信息处理设备，包括：获取单元，获取单元被配置成获取指示语音的收集状态中的兴奋程度的信息，其中：收集状态是对包括用户话语声音的语音数据进行收集的状态，并且指示兴奋程度的信息包括包括音量或声音频率的语音数据的声音的属性信息；语音识别单元，语音识别单元被配置成基于指示兴奋程度的信息、兴奋程度与第一阈值之间的比较以及兴奋程度大于第一阈值的持续时间的长度来执行基于语音的音素的第一语音识别。

另外，根据本公开内容，提供了一种信息处理方法，包括：获取指示语音的收集状态中的兴奋程度的信息，其中：收集状态是对包括用户话语声音的语音数据进行收集的状态，并且指示兴奋程度的信息包括包括音量或声音频率的语音数据的声音的属性信息；以及由处理器基于指示兴奋程度的信息、兴奋程度与第一阈值之间的比较以及兴奋程度大于第一阈值的持续时间的长度来执行基于语音的音素的第一语音识别。

另外，根据本公开内容，提供了一种计算机可读存储介质，其上存储有包括指令的程序，指令当由计算机执行时使计算机执行上述信息处理方法。

本发明的有益效果

如上所述，根据本公开内容，可以适应于声音收集状态中的兴奋程度来执行语音识别。此外，这里描述的效果不一定是限制性的，并且可以包括本公开内容中描述的任何效果。

附图说明

[图1]图1是示出根据本公开内容的信息处理系统的配置示例的说明图。

[图2]图2是示出根据本公开内容的比较例的语音识别的示例的说明图。

[图3]图3是示出根据实施方式的服务器10的配置示例的功能框图。

[图4]图4是示出根据实施方式的语音识别的示例的说明图。

[图5]图5是示出根据实施方式的集合决定示例的说明图。

[图6]图6是示出根据实施方式的处理流程的一部分的流程图。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载