[发明专利]声音认识装置、机器人、声音认识方法以及记录介质有效
申请号: | 201811551686.8 | 申请日: | 2018-12-18 |
公开(公告)号: | CN110033790B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 岛田敬辅 | 申请(专利权)人: | 卡西欧计算机株式会社 |
主分类号: | G10L25/84 | 分类号: | G10L25/84;G10L15/25;G10L15/22 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李逸雪 |
地址: | 日本国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 认识 装置 机器人 方法 以及 记录 介质 | ||
1.一种声音认识装置,其特征在于,具备:
认识单元,从发声者的嘴唇图像认识该发声者的发声开始的定时和发声结束的定时;
检测单元,检测自装置的周围的声音当中的噪声音的大小;
调整单元,基于由所述检测单元检测到的自装置的周围的声音当中的噪声音的大小来调整由所述认识单元认识的所述发声开始的定时和所述发声结束的定时当中至少任意一方;和
控制单元,将由所述调整单元调整过的所述发声开始的定时设为声音认识的开始定时,将由所述调整单元调整过的所述发声结束的定时设为声音认识的结束定时,来控制声音认识定时,
所述调整单元,进一步在由所述检测单元检测到的自装置的周围的声音当中的噪声音的大小为给定的阈值以上的情况下,与该噪声音的大小小于给定的阈值的情况相比,使所述发声开始的定时以及所述发声结束的定时的调整量更小。
2.根据权利要求1所述的声音认识装置,其特征在于,
所述声音认识装置具备:
算出单元,基于由所述检测单元检测到的所述自装置的周围的声音当中的噪声音的大小来算出对关于该发声者的所述发声开始的定时的偏离、以及/或者关于该发声者的所述发声结束的定时的偏离进行调整的偏离调整量,
所述控制单元将加进由所述算出单元算出的所述偏离调整量的所述发声开始的定时设为声音认识的开始定时,将加进该偏离调整量的所述发声结束的定时设为声音认识的结束定时。
3.根据权利要求2所述的声音认识装置,其特征在于,
所述控制单元在由所述检测单元检测到的自装置的周围的声音当中的噪声音的大小为给定的阈值以上的情况下,将加进由所述算出单元算出的所述偏离调整量的所述发声开始的定时设为声音认识的开始定时,将加进该偏离调整量的所述发声结束的定时设为声音认识的结束定时。
4.根据权利要求1所述的声音认识装置,其特征在于,
所述控制单元将声音认识区间作为所述声音认识定时进行控制。
5.根据权利要求1所述的声音认识装置,其特征在于,
所述检测单元将所述发声者的声音的频率范围中所含的声音以外作为对象,来检测自装置的周围的声音。
6.一种机器人,其特征在于,搭载权利要求1所述的声音认识装置。
7.一种声音认识方法,由声音认识装置执行,所述声音认识方法的特征在于,包括:
从发声者的嘴唇图像认识该发声者的发声开始的定时和发声结束的定时的认识步骤;
检测自装置的周围的声音当中的噪声音的大小的检测步骤;
基于由所述检测步骤检测到的自装置的周围的声音当中的噪声音的大小来调整由所述认识步骤认识的所述发声开始的定时和所述发声结束的定时当中至少任意一方的调整步骤;和
控制步骤,将由所述调整步骤调整过的所述发声开始的定时设为声音认识的开始定时,将由所述调整步骤调整过的所述发声结束的定时设为声音认识的结束定时,来控制声音认识定时,
所述调整步骤,进一步在由所述检测步骤检测到的自装置的周围的声音当中的噪声音的大小为给定的阈值以上的情况下,与该噪声音的大小小于给定的阈值的情况相比,使所述发声开始的定时以及所述发声结束的定时的调整量更小。
8.一种非易失性的记录介质,记录有计算机可读取的程序,其特征在于,所述程序使计算机实现如下功能:
从发声者的嘴唇图像认识该发声者的发声开始的定时和发声结束的定时的认识功能;
检测自装置的周围的声音当中的噪声音的大小的检测功能;
基于由所述检测功能检测到的自装置的周围的声音当中的噪声音的大小来调整由所述认识功能认识的所述发声开始的定时和所述发声结束的定时当中至少任意一方的调整功能;和
控制功能,将由所述调整功能调整过的所述发声开始的定时设为声音认识的开始定时,将由所述调整功能调整过的所述发声结束的定时设为声音认识的结束定时,来控制声音认识定时,
所述调整功能,进一步在由所述检测功能检测到的自装置的周围的声音当中的噪声音的大小为给定的阈值以上的情况下,与该噪声音的大小小于给定的阈值的情况相比,使所述发声开始的定时以及所述发声结束的定时的调整量更小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卡西欧计算机株式会社,未经卡西欧计算机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811551686.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:生物测定个性化音频处理系统
- 下一篇:一种歌曲基频提取方法及装置