[发明专利]信息处理设备、信息处理方法和计算机可读存储介质有效
申请号: | 201780024800.9 | 申请日: | 2017-04-24 |
公开(公告)号: | CN109074809B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 河野真一;泷祐平 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L25/63;G10L15/22;G10L15/32;G10L15/187 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;杨华 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 设备 方法 计算机 可读 存储 介质 | ||
[问题]提供可以用来执行话语识别的信息处理设备、信息处理方法和计算机可读存储介质,该话语识别适应于收集音频状态中的兴奋水平。[解决方案]一种信息处理设备,该信息处理设备设置有:获取单元,获取单元获取指示收集话语状态中的兴奋水平的信息,其中:收集状态是对包括用户话语声音的语音数据进行收集的状态,并且指示兴奋程度的信息包括包括音量或声音频率的语音数据的声音的属性信息;以及话语识别单元,话语识别单元基于指示兴奋水平的信息、兴奋程度与第一阈值之间的比较以及兴奋程度大于第一阈值的持续时间的长度来执行基于话语中的音素的第一话语识别。
技术领域
本公开内容涉及信息处理设备、信息处理方法和计算机可读存储介质。
背景技术
过去,已经提出了与自然语言处理相关的各种技术。例如,以下专利文献1公开了基于用户在多个短语当中选择的短语来生成句子的技术。
此外,还提出了与语音识别相关的各种技术。在语音识别中,可以将正在讲话的用户的语音转换成字符串。
引用列表
专利文献
专利文献1:JP 2012-53634A
发明内容
技术问题
然而,在现有技术中,例如,无论用户在声音收集状态下的兴奋程度如何,都对所收集的语音固定地执行语音识别。因此,在现有技术中,无法获得反映兴奋程度的语音识别结果。
在这方面,本公开内容提出了新颖的和改进的、并且能够适应于声音收集状态中的兴奋程度来执行语音识别的信息处理设备、信息处理方法和程序。
问题的解决方案
根据本公开内容,提供了一种信息处理设备,包括:获取单元,获取单元被配置成获取指示语音的收集状态中的兴奋程度的信息,其中:收集状态是对包括用户话语声音的语音数据进行收集的状态,并且指示兴奋程度的信息包括包括音量或声音频率的语音数据的声音的属性信息;语音识别单元,语音识别单元被配置成基于指示兴奋程度的信息、兴奋程度与第一阈值之间的比较以及兴奋程度大于第一阈值的持续时间的长度来执行基于语音的音素的第一语音识别。
另外,根据本公开内容,提供了一种信息处理方法,包括:获取指示语音的收集状态中的兴奋程度的信息,其中:收集状态是对包括用户话语声音的语音数据进行收集的状态,并且指示兴奋程度的信息包括包括音量或声音频率的语音数据的声音的属性信息;以及由处理器基于指示兴奋程度的信息、兴奋程度与第一阈值之间的比较以及兴奋程度大于第一阈值的持续时间的长度来执行基于语音的音素的第一语音识别。
另外,根据本公开内容,提供了一种计算机可读存储介质,其上存储有包括指令的程序,指令当由计算机执行时使计算机执行上述信息处理方法。
本发明的有益效果
如上所述,根据本公开内容,可以适应于声音收集状态中的兴奋程度来执行语音识别。此外,这里描述的效果不一定是限制性的,并且可以包括本公开内容中描述的任何效果。
附图说明
[图1]图1是示出根据本公开内容的信息处理系统的配置示例的说明图。
[图2]图2是示出根据本公开内容的比较例的语音识别的示例的说明图。
[图3]图3是示出根据实施方式的服务器10的配置示例的功能框图。
[图4]图4是示出根据实施方式的语音识别的示例的说明图。
[图5]图5是示出根据实施方式的集合决定示例的说明图。
[图6]图6是示出根据实施方式的处理流程的一部分的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780024800.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:部件涂覆方法
- 下一篇:发光二极管的保护膜的沉积方法