[发明专利]阈值调整装置、阈值调整方法以及记录介质在审
申请号: | 201910248475.5 | 申请日: | 2019-03-29 |
公开(公告)号: | CN111754995A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 长健太;阿部一彦;李海亮 | 申请(专利权)人: | 株式会社东芝;东芝数字解决方案株式会社 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 房永峰 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 阈值 调整 装置 方法 以及 记录 介质 | ||
本发明提供对阈值的调整进行支持以便能针对预先决定的多个识别对象语分别设定适当阈值的阈值调整装置、阈值调整方法及记录介质。阈值调整装置具备:声音识别部;评价部,对声音识别部输入将针对预先决定的多个识别对象语分别独立地设定的多个阈值作为要素的阈值列表和评价用声音,基于声音识别部输出的针对评价用声音的识别结果,计算表示识别精度的评价值,识别精度是由使用了阈值列表的声音识别部针对多个识别对象语的每一个的识别精度;和显示控制部,使显示装置显示用于调整与任意的识别对象语对应的阈值的阈值调整画面。阈值调整画面包括将评价值与理想值一并提示的精度一览画面。
技术领域
本发明的实施方式涉及阈值调整装置、阈值调整方法以及记录介质。
背景技术
以往,公知有一种在输入声音中包含预先决定的多个识别对象语的任意一个的情况下,输出该识别对象语作为针对输入声音的识别结果的声音识别装置。在该声音识别装置中,能够通过阈值来控制针对各识别对象语的反应容易度。例如,当根据输入声音计算的声学特征量与多个识别对象语中的任意一个的声学特征量在特征空间上的距离为针对该识别对象语设定的阈值以下时,输出该识别对象语作为针对输入声音的识别结果。该情况下,通过针对多个识别对象语分别设定适当的阈值,能够准确地识别输入声音所包含的识别对象语。
但是,难以针对多个识别对象语分别设定适当的阈值,以便在该识别对象语包含于输入声音的情况下反应,且对其他的识别对象语、噪声不反应,谋求一种对这样的阈值的调整进行支持的结构。
发明内容
本发明所要解决的课题在于,提供对阈值的调整进行支持以便能够对预先决定的多个识别对象语分别设定适当的阈值的阈值调整装置、阈值调整方法以及记录介质。
实施方式的阈值调整装置具备声音识别部、评价部以及显示控制部。声音识别部进行声音识别。评价部对上述声音识别部输入将针对预先决定的多个识别对象语分别独立地设定的多个阈值作为要素的阈值列表和评价用声音,基于上述声音识别部输出的针对上述评价用声音的识别结果,来计算评价值,该评价值表示使用了上述阈值列表的上述声音识别部的针对上述多个识别对象语中的每一个识别对象语的识别精度。显示控制部,使显示装置显示阈值调整画面,该阈值调整画面用于调整与上述多个识别对象语中的任意的识别对象语对应的阈值。上述阈值调整画面包括精度一览画面,该精度一览画面将由上述评价部针对上述多个识别对象语分别计算出的评价值与针对上述多个识别对象语分别预先计算出的理想值一并提示。
根据上述构成的阈值调整装置,能够对阈值的调整进行支持,以便能够对预先决定的多个识别对象语分别设定适当的阈值。
附图说明
图1是表示实施方式的阈值调整装置的功能性结构例的框图。
图2是表示关键字表的一个例子的图。
图3是表示评价用数据表的一个例子的图。
图4是表示阈值列表表的一个例子的图。
图5是表示评价结果表的一个例子的图。
图6是表示理想值表的一个例子的图。
图7是表示实施方式的阈值调整装置的动作例的流程图。
图8是表示精度一览画面的一个例子的图。
图9是表示误识别解析画面的一个例子的图。
图10是表示初始评价结果画面的一个例子的图。
图11是表示变形例的阈值调整装置的功能性结构例的框图。
图12是表示变形例的精度一览画面的一个例子的图。
图13是表示阈值调整装置的硬件结构例的框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝数字解决方案株式会社,未经株式会社东芝;东芝数字解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910248475.5/2.html,转载请声明来源钻瓜专利网。