[发明专利]信息处理装置、信息处理方法和程序在审
申请号: | 201780051273.0 | 申请日: | 2017-08-17 |
公开(公告)号: | CN109643551A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 河野真一;滝祐平 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L15/30 | 分类号: | G10L15/30;G10L15/04;G10L15/22;G10L25/78 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及使能够改善语音输入的信息处理装置、信息处理方法和程序。基于从语音信息检测到的特定无声时段和话语特征来选择正常模式下的语音识别处理或特殊模式下的语音识别处理,然后输出由所选择的语音识别处理识别的语音识别结果以及指示通过其获得语音识别结果的该语音识别处理的语音识别结果信息。该技术可以应用于例如经由网络提供语音识别处理的语音识别系统。 | ||
搜索关键词: | 语音识别 语音识别结果 信息处理装置 信息处理 语音识别系统 话语特征 网络提供 语音信息 正常模式 语音 输出 检测 应用 | ||
【主权项】:
1.一种信息处理装置,包括:话语特征检测单元,获取通过用户的话语获得的音频信息,并从所述音频信息检测所述话语的特征;特定无声时段检测单元,在检测其中所述音频信息包括音频的话语部分的处理中,检测作为未被确定为无声时段的特定短无声时段的特定无声时段;选择单元,基于已经由所述话语特征检测单元从所述音频信息检测到的所述话语的特征和已经由所述特定无声时段检测单元从所述音频信息检测到的所述特定无声时段来选择要对所述音频信息执行的音频识别处理;以及输出处理单元,将通过已经由所述选择单元选择的所述音频识别处理而识别的音频识别结果与音频识别结果信息一起输出,所述音频识别结果信息指示已经获得所述音频识别结果的所述音频识别处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780051273.0/,转载请声明来源钻瓜专利网。