[发明专利]识别装置、识别方法以及存储介质有效
申请号: | 201710759628.3 | 申请日: | 2017-08-30 |
公开(公告)号: | CN108091334B | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 永尾学 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/08;G10L15/06;G06K9/00 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 程晨 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 装置 方法 以及 存储 介质 | ||
本发明涉及识别装置、识别方法以及存储介质。以小的计算开销高精度地对输入信号进行模式识别。识别装置对作为识别对象的输入信号进行模式识别。识别装置具备计算部和过滤部。计算部根据输入信号,计算包括每个符号的得分的多个得分矢量排列而成的得分矢量列。过滤部使计算出的得分矢量列中的一部分得分矢量通过。过滤部使与最好的得分对应的代表符号是识别对象符号的第1得分矢量、代表符号是对象外符号且代表符号的得分比第1阈值差的第2得分矢量、以及代表符号是对象外符号且代表符号的得分是第1阈值或者比第1阈值好的第3得分矢量中的、满足预先决定的第1条件的第3得分矢量通过。
技术领域
本发明的实施方式涉及识别装置、识别方法以及存储介质。
背景技术
已知识别输入信号的模式并将输入的信号变换为符号列的识别装置。例如,已知识别声音信号的声音识别装置以及从图像识别文字的OCR(Optical CharacterRecognition,光学字符识别)装置等。在这样的识别装置中,将输入信号分割为帧单位,针对分割的每个帧进行得分的计算以及符号列的搜索。
另外,还存在如下识别装置,该识别装置导入表示在输入信号中包含的信息不是识别对象的符号,在该符号的得分充分大的情况下跳过搜索处理。在这样的识别装置中,跳过用于搜索不是识别对象的符号的处理,所以能够减小计算开销。
但是,在以往的识别装置中,如果过多地跳过不是识别对象的符号,则有识别率降低的情况。
发明内容
发明想要解决的课题在于,以小的计算开销高精度地对输入信号进行模式识别。
实施方式所涉及的识别装置对作为识别对象的输入信号进行模式识别。所述识别装置具备计算部和过滤部。所述计算部根据所述输入信号,计算包括每个符号的得分的多个得分矢量排列而成的得分矢量列。所述过滤部使计算出的所述得分矢量列中的一部分得分矢量通过。所述过滤部使与最好的得分对应的代表符号是识别对象符号的第1得分矢量、所述代表符号是对象外符号且所述代表符号的得分比第1阈值差的第2得分矢量、以及所述代表符号是所述对象外符号且所述代表符号的得分是所述第1阈值或者比所述第1阈值好的第3得分矢量中的、满足预先决定的第1条件的所述第3得分矢量通过。
根据上述识别装置,能够以小的计算开销高精度地对输入信号进行模式识别。
附图说明
图1是示出实施方式所涉及的识别装置的结构的图。
图2是示出得分计算部的结构的一个例子的图。
图3是示出搜索部的处理流程的图。
图4是示出搜索部搜索出的符号列的一个例子的图。
图5是示出从图4所示的符号列删除连续的识别对象符号的处理的图。
图6是示出从图5所示的符号列删除识别对象符号以外的处理的图。
图7是示出过滤部的处理流程的图。
图8是示出由过滤部进行的处理前和处理后的得分矢量列的第1例的图。
图9是示出由过滤部进行的处理前和处理后的得分矢量列的第2例的图。
图10是示出表示由识别装置实施的处理的伪代码的一个例子的图。
图11是识别装置的硬件框图。
(符号说明)
10:识别装置;22:特征提取部;24:模式识别模型存储部;26:得分计算部;28:过滤部;30:搜索模型存储部;32:搜索部;42:输入层;44:中间层;46:输出层;101:CPU;102:操作部;103:显示部;104:麦克风;105:ROM;106:RAM;107:存储部;108:通信装置;109:总线。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710759628.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音控制方法及相关产品
- 下一篇:一种基于语音识别的实时语音翻译系统