[发明专利]信息处理装置、信息处理方法和程序在审

专利信息
申请号: 201780051273.0 申请日: 2017-08-17
公开(公告)号: CN109643551A 公开(公告)日: 2019-04-16
发明(设计)人: 河野真一;滝祐平 申请(专利权)人: 索尼公司
主分类号: G10L15/30 分类号: G10L15/30;G10L15/04;G10L15/22;G10L25/78
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 余刚
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音识别 语音识别结果 信息处理装置 信息处理 语音识别系统 话语特征 网络提供 语音信息 正常模式 语音 输出 检测 应用
【说明书】:

本发明涉及使能够改善语音输入的信息处理装置、信息处理方法和程序。基于从语音信息检测到的特定无声时段和话语特征来选择正常模式下的语音识别处理或特殊模式下的语音识别处理,然后输出由所选择的语音识别处理识别的语音识别结果以及指示通过其获得语音识别结果的该语音识别处理的语音识别结果信息。该技术可以应用于例如经由网络提供语音识别处理的语音识别系统。

技术领域

本发明涉及一种信息处理装置、信息处理方法和程序,并且具体涉及能够进行更优选的音频输入的信息处理装置、信息处理方法和程序。

背景技术

近年来,使用音频输入的用户界面的利用已经非常广泛,并且实现能够实现更优选的音频输入的音频识别处理是很重要的。

通常,在音频识别处理中,执行提取关于音频信息的特征量的处理,并且,例如,提取例如梅尔频率倒频谱系数(MFCC)的特征量。然后,基于从音频信息提取的特征量,音频识别引擎参考声学模型、识别词典和语言模型执行音频识别处理,并输出从音频识别的字符串。

例如,专利文献1公开了一种音频识别系统,其基于在音频识别中的针对未指定数量的用户的用户分类来选择要用于音频识别的声学模型。

现有技术文献

专利文献

专利文献1:日本专利申请公开号2000-347684

发明内容

本发明要解决的问题

顺便提及,在用于在游戏聊天、实时分发平台等中输入消息的应用中,不仅可以输入具有正常单词和短语的句子,而且可以输入未在识别词典中列出的特殊字符串,例如标识(ID)、缩写、专有名词或网络俚语。难以对这样的特殊字符串精确地执行音频识别处理,并且难以执行优选的音频输入。

本发明是针对这种情况而提出的,并且其旨在使执行更优选的音频输入成为可能。

问题的解决方案

本发明的一个方面的信息处理装置包括:话语特征检测单元,获取通过用户的话语获得的音频信息,并从音频信息检测话语的特征;特定无声时段检测单元,在检测其中音频信息包括音频的话语部分的处理中,检测作为未被确定为无声时段的特定短无声时段的特定无声时段;选择单元,基于已经由话语特征检测单元从音频信息检测到的话语的特征和已经由特定无声时段检测单元从音频信息检测到的特定无声时段,来选择要对音频信息执行的音频识别处理;以及输出处理单元,将通过已经由选择单元选择的音频识别处理而识别的音频识别结果与音频识别结果信息一起输出,音频识别结果信息指示已经获得音频识别结果的音频识别处理。

本公开的一个方面的信息处理方法或程序包括以下步骤:获取通过用户的话语获得的音频信息,并从音频信息中检测话语的特征;在检测其中音频信息包括音频的话语部分的处理中,检测作为未被确定为无声时段的特定短无声时段的特定无声时段;基于已经从音频信息检测到的话语的特征和已经从音频信息检测到的特定无声时段,选择要对音频信息执行的音频识别处理;以及将通过已经选择的音频识别处理而识别的音频识别结果与音频识别结果信息一起输出,音频识别结果信息指示已经获得音频识别结果的音频识别处理。

在本公开的一个方面中,在获取由用户的话语获得的音频信息、从语音信息检测话语的特征以及检测其中音频信息包括音频的话语部分的处理中,检测作为未被确定为无声时段的特定短无声时段的特定无声时段。然后,基于已经从音频信息检测到的话语的特征和已经从音频信息检测到的特定无声时段选择要对音频信息执行的音频识别处理,并且将通过音频识别处理识别的音频识别结果与指示已经被执行的音频识别处理的音频识别结果信息一起输出。

本发明的效果

根据本公开的一个方面,可以执行更优选的音频输入。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201780051273.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top