[发明专利]声音识别装置有效
申请号: | 200880022292.1 | 申请日: | 2008-03-27 |
公开(公告)号: | CN101689366A | 公开(公告)日: | 2010-03-31 |
发明(设计)人: | 井上让;铃木忠;佐藤史尚;竹里尚嘉 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/00;G10L15/04;G10L15/08;G10L15/28 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 侯颖媖 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 识别 装置 | ||
1.一种声音识别装置,其特征在于,包括:
声音开始指示部,该声音开始指示部指示开始声音识别;
声音输入部,该声音输入部将发出的声音输入并转换成声音信号;
声音识别部,该声音识别部基于从所述声音输入部传送来的声音信号 对声音进行识别;
发声开始时间检测部,该发声开始时间检测部检测自所述声音开始指 示部指示开始声音识别至声音信号从所述声音输入部传送来为止的时间;
发声定时判定部,该发声定时判定部通过对所述发声开始时间检测部 检测出的时间与预定的阈值进行比较,判定表示发声开始的快慢的发声定 时;
声音识别得分修正部,该声音识别得分修正部根据所述发声定时判定 部判定出的发声定时,对所述声音识别部识别出的词汇的声音识别得分进 行修正;
得分筛选判定部,该得分筛选判定部根据所述声音识别得分修正部修 正过的声音识别得分,判定是否呈现识别结果;
对话控制部,该对话控制部根据所述得分筛选判定部的判定结果,决 定呈现所述声音识别部的识别结果时的呈现内容;
系统应答生成部,该系统应答生成部基于所述对话控制部所决定的呈 现内容生成系统应答;以及
输出部,该输出部将所述系统应答生成部所生成的系统应答输出。
2.如权利要求1所述的声音识别装置,其特征在于,
包括行驶状况检测部,该行驶状况检测部检测行驶状况,
声音识别得分修正部根据发声定时判定部判定出的发声定时和所述行 驶状况检测部检测出的行驶状况,对声音识别部识别出的词汇的声音识别 得分进行修正。
3.如权利要求1所述的声音识别装置,其特征在于,
包括驾驶操作检测部,该驾驶操作检测部检测驾驶操作的状况,
声音识别得分修正部根据发声定时判定部判定出的发声定时和所述驾 驶操作检测部检测出的驾驶操作的状况,对声音识别部识别出的词汇的声 音识别得分进行修正。
4.如权利要求2所述的声音识别装置,其特征在于,
行驶状况检测部由位置检测装置构成,该位置检测装置检测当前位置 并作为位置信息输出,
声音识别得分修正部根据发声定时判定部判定出的发声定时、和基于 从所述位置检测装置输出的位置信息而判断出的行驶状况或驾驶操作状 况,对声音识别部识别出的词汇的声音识别得分进行修正。
5.如权利要求2所述的声音识别装置,其特征在于,
行驶状况检测部由加速度检测装置构成,该加速度检测装置检测加速 度,
声音识别得分修正部根据发声定时判定部判定出的发声定时、和基于 所述加速度检测装置输出的加速度而判断出的行驶状况及驾驶操作状况, 对声音识别部识别出的词汇的声音识别得分进行修正。
6.如权利要求2所述的声音识别装置,其特征在于,
行驶状况检测部由位置检测装置和加速度检测装置构成,所述位置检 测装置检测当前位置并作为位置信息输出,所述加速度检测装置检测加速 度,
声音识别得分修正部根据发声定时判定部判定出的发声定时、基于从 所述位置检测装置输出的位置信息而判断出的行驶状况、以及基于所述加 速度检测装置检测出的加速度而判断出的驾驶操作状况,对声音识别部识 别出的词汇的声音识别得分进行修正。
7.如权利要求1所述的声音识别装置,其特征在于,
包括车内设备操作状况收集部,该车内设备操作状况收集部通过车载 网络收集车内设备的操作状况,
声音识别得分修正部根据发声定时判定部判定出的发声定时、和所述 车内设备操作状况收集部所收集的车内设备的操作状况,对声音识别部识 别出的词汇的声音识别得分进行修正。
8.一种声音识别装置,其特征在于,包括:
声音开始指示部,该声音开始指示部指示开始声音识别;
声音输入部,该声音输入部将发出的声音输入并转换成声音信号;
声音识别部,该声音识别部基于从所述声音输入部传送来的声音信号 对声音进行识别;
发声开始时间检测部,该发声开始时间检测部检测自所述声音开始指 示部指示开始声音识别至声音信号从所述声音输入部传送来为止的时间;
方差考虑发声定时学习部,该方差考虑发声定时学习部计算发声定时 判定用阈值;
发声定时判定部,该发声定时判定部通过将所述方差考虑发声定时学 习部计算出的发声定时判定用阈值作为预定的阈值、与所述发声开始时间 检测部检测出的时间进行比较,来判定表示发声开始的快慢的发声定时;
对话控制部,该对话控制部根据所述发声定时,决定呈现所述声音识 别部的识别结果时的呈现内容;
系统应答生成部,该系统应答生成部基于所述对话控制部所决定的呈 现内容生成系统应答;
输出部,该输出部将所述系统应答生成部所生成的系统应答输出;以 及
修改键,该修改键指示取消声音识别部的识别结果,
所述方差考虑发声定时学习部基于所述发声开始时间检测部在过去多 次试行中检测出的时间的方差、和自所述输出部将系统应答输出直至通过 所述修改键作出取消的指示为止的时间的方差,计算所述发声定时判定用 阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880022292.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于读和/或写光学记录介质的设备的像散生成元件
- 下一篇:用于隔音处理的面板