[发明专利]关键字检测装置、关键字检测方法以及程序在审
申请号: | 201980057870.3 | 申请日: | 2019-08-28 |
公开(公告)号: | CN112655043A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 小林和则;齐藤翔一郎;伊藤弘章 | 申请(专利权)人: | 日本电信电话株式会社 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/18 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金兰 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键字 检测 装置 方法 以及 程序 | ||
抑制对并未意图要检测关键字却说出的关键字的误检测。关键字检测单元(11)生成表示从输入声音检测出特定的关键字的发音的结果的关键字检测结果。声音检测单元(12)生成表示从输入声音检测出声音区间的结果的声音区间检测结果。延迟单元(13)向声音区间检测结果赋予至少比关键字的发言时间长的延迟。句中关键字排除单元(14)在关键字检测结果表示检测出关键字且声音区间检测结果表示检测出声音区间时,将关键字检测结果更新为表示未检测出关键字的结果。
技术领域
本发明涉及检测关键字的发音的技术。
背景技术
例如在智能扬声器或车载系统等能够基于声音进行控制的机器中,有的搭载了被称为关键字唤醒的功能,该功能在成为触发的关键字被发音时开始声音辨识。在这样的功能中,需要以声音信号作为输入并检测关键字的发音的技术。
图1是非专利文献1中公开的现有技术的结构。在现有技术中,如果关键字检测单元91从被输入的声音信号检测出关键字的发音,则目标音输出单元99使开关接通,将该声音信号作为成为声音辨识等的对象的目标音输出。
现有技术文献
非专利文献
非专利文献1:Sensory,Inc.,“TrulyHandsfreeTM”,[在线(online)],[平成30年8月17日检索],互联网URL:http://www.sensory.co.jp/product/thf.htm
发明内容
发明要解决的课题
但是,在现有技术中,即使不是意图要检测关键字的发言,如果在发言之中包含着关键字或接近于关键字的音素,则有时对该关键字或接近于关键字的音素进行反应,造成关键字的误检测。例如能够举出如下情况等:在关键字是“你好ABC”的情况下,如对于利用者说出“关键字是‘你好ABC’”那样,虽然并未意图要检测关键字,却说出了关键字。
本发明的目的是,鉴于上述那样的技术课题,抑制对并未意图要检测关键字却说出的关键字的误检测。
用于解决课题的手段
为了解决上述的课题,本发明的一方式的关键字检测装置包含:关键字检测单元,生成表示从输入声音检测出特定的关键字的发音的结果的关键字检测结果;声音检测单元,生成表示从输入声音检测出声音区间的结果的声音区间检测结果;延迟单元,向声音区间检测结果赋予至少比关键字的发言时间长的延迟;以及句中关键字排除单元,在关键字检测结果表示检测出关键字且声音区间检测结果表示检测出声音区间时,将关键字检测结果更新为表示未检测出关键字的结果。
发明效果
根据本发明,能够抑制对并未意图要检测关键字却说出的关键字的误检测。
附图说明
图1是例示以往的关键字检测装置的功能结构的图。
图2是例示第一实施方式的关键字检测装置的功能结构的图。
图3是例示第一实施方式的关键字检测方法的处理过程的图。
图4是用于说明第一实施方式的原理的图。
图5是例示第二实施方式的关键字检测装置的功能结构的图。
图6是例示第二实施方式的关键字检测方法的处理过程的图。
图7是用于说明第二实施方式的原理的图。
图8是例示第三实施方式的关键字检测装置的功能结构的图。
具体实施方式
以下,针对本发明的实施方式详细地进行说明。另外,在附图中对具有相同的功能的结构单元附加相同的序号,并省略重复说明。
[第一实施方式]
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电信电话株式会社,未经日本电信电话株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980057870.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:热丝化学气相沉积装置
- 下一篇:包含可被O-糖基化的多肽区的融合多肽