[发明专利]信息处理设备和信息处理方法有效
申请号: | 201210102344.4 | 申请日: | 2012-04-09 |
公开(公告)号: | CN103020581B | 公开(公告)日: | 2018-01-02 |
发明(设计)人: | 永峰猛志;安部勉 | 申请(专利权)人: | 富士施乐株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京天昊联合知识产权代理有限公司11112 | 代理人: | 陈源,张天舒 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 设备 方法 | ||
技术领域
本发明涉及信息处理设备和信息处理方法。
背景技术
可以获得用于特征识别的技术。作为与这种技术相关的技术,例如,日本未审查专利申请公开第2001-285716号公开了能够以高精度检测和识别图像中的字幕(telop)的字幕信息处理设备。在字幕信息处理设备中,从图像中检测出显示字幕信息的区域,提取组成字幕字符的像素,以及通过使用字幕候选图像创建单元、字幕字符串区域候选提取单元、字幕字符像素提取单元和字幕字符识别单元,在字符识别处理中执行识别。字幕信息创建单元基于这一系列处理的可靠性评估结果来选择为一个字幕提供的多个识别结果之一。此时,字幕信息创建单元通过使用由字幕字符像素提取单元执行的字幕字符提取处理的可靠性评估值和/或由字幕字符识别单元执行的字符识别处理的识别可靠性来获取最终的字幕信息。
日本未审查专利申请公开第04-115384号公开了具有单词检查功能的日单词符识别设备,其中,如果在字典中登记有已经读取的字符串,则该字符串被确定为字,并且通过使用描述语句中的词性之间的连接关系的连接表确保字之间的有效性来根据上下文识别字符,从而提高字符读取性能。日单词符识别设备包括:读取单元,其读取日单词符并提取用于模糊字符的多个可能性高的候选;字符串创建单元,如果在通过读取单元读取的字符串中存在模糊字符,其通过组合多个可能性高的候选来创建候选字符串;单词划分单元,其对通过字符串创建单元所创建的字符串执行单词划分;字典中查找单元,其确定在字典中是否已登记有通过单词划分单元执行的单词划分所获取的字;以及连接关系确定单元,其参照描述词性间连接关系的连接表,确定已被字典中查找单元确定登记在字典中的单词的连接关系。
发明内容
本发明的目的在于提供信息处理设备和信息处理方法,其中,与不使用根据本发明示例性实施例的结构的情况相比,可以使用针对运动图像中的图像的具有较高识别精度的字符识别结果。
根据本发明的第一方面,提供了一种信息处理设备,包括鉴别单元、字符识别单元、获取单元、校正单元和输出单元。鉴别单元鉴别包括在运动图像中的静止图像。字符识别单元对通过鉴别单元鉴别的静止图像执行字符识别。获取单元获取关于运动图像的信息。校正单元基于通过获取单元所获取的信息校正通过字符识别单元生成的字符识别结果。输出单元输出与运动图像相关联的通过校正单元校正的字符识别结果。
根据本发明的第二方面,获取单元识别运动图像中的人物并获取关于人物的信息。校正单元基于通过获取单元获取的关于人物的信息校正字符识别结果。
根据本发明的第三方面,基于作为用于识别运动图像的信息的运动图像识别信息或者基于运动图像识别信息和通过鉴别单元鉴别的静止图像的时间位置,获取单元获取可能包括在静止图像中的字符信息。校正单元基于通过获取单元获取的字符信息校正字符识别结果。
根据本发明的第四方面,获取单元提取通过字符识别单元对处于预定时间位置的静止图像生成的字符识别结果中所包括的人物的名字,并获取关于人物的名字的信息。基于通过获取单元获取的关于人物的名字的信息,校正单元校正通过字符识别单元所生成的字符识别结果。
根据本发明的第五方面,获取单元提取关于运动图像的拍摄地点以及拍摄日期和时间的信息,并获取关于在拍摄日期和时间在拍摄地点举行的事件的信息。基于通过获取单元获取的关于事件的信息,校正单元校正通过字符识别单元生成的字符识别结果。
根据本发明的第六方面,获取单元对通过字符识别单元生成的字符识别结果执行形态分析,并获取关于作为形态分析结果的字符串的信息或者关于与该字符串类似的字符串的信息。基于通过获取单元获取的关于字符串的信息,校正单元校正通过字符识别单元生成的字符识别结果。
根据本发明的第七方面,获取单元提取包括在由字符识别单元生成的字符识别结果中的人物的名字或者事件标题,并且,如果字符识别结果包括多个人物的名字或多个事件标题,则获取单元基于静止图像的时间位置执行加权并获取使用加权结果而选择的关于人物的名字或事件标题的信息。基于通过获取单元获取的关于人物的名字或事件标题的信息,校正单元校正通过字符识别单元生成的字符识别结果。
根据本发明的第八方面,提供了一种图像处理方法,包括:鉴别运动图像中包括的静止图像;对鉴别的静止图像执行字符识别;获取关于运动图像的信息;基于获取的信息,校正在字符识别中生成的字符识别结果;以及输出与运动图像相关联的校正字符识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士施乐株式会社,未经富士施乐株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210102344.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:鸡球虫病研究动物饲养装置
- 下一篇:用于车辆的变速器