[发明专利]信息处理装置以及记录媒体在审
申请号: | 202010158620.3 | 申请日: | 2020-03-09 |
公开(公告)号: | CN112541499A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 冈田茂;清水淳一;吉塚公则 | 申请(专利权)人: | 富士施乐株式会社 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 马爽;臧建明 |
地址: | 日本东京*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 以及 记录 媒体 | ||
本发明涉及一种信息处理装置以及记录媒体。本发明即使在以关键字的位置为基准而定的范围内未记载对象信息的情况下,也能提取与关键字对应的对象信息。处理器在以记载于文档(20)的关键字(21)的位置为基准而定的范围内,记载有表示与关键字对应的对象信息的参照目标的参照字符串(23)时,从参照字符串(23)所表示的参照目标的页面(20b)提取对象信息。
技术领域
本发明涉及一种信息处理装置以及记录媒体。
背景技术
已知有一种使用键值(key-value)提取技术来从文档提取对象信息的技术。例如在专利文献1中公开了一种技术:确定包含关键字(key word)的区域,对所确定的区域进行文字识别处理,以提取值。
[现有技术文献]
[专利文献]
专利文献1:日本专利特开2018-128996号公报
发明内容
[发明所要解决的问题]
以往的键值提取技术中,从关键字的周边提取对象信息。然而,作为一例,存在下述情况:在合同书或诉状等文档中,在关键字的周边,取代对象信息而记载有表示对象信息的参照目标的字符串,对象信息自身被记载于参照目标中。此时,由于对象信息并非位于关键字的周边,因此依靠以往的键值提取技术无法提取对象信息。
本发明的目的在于,即使在以关键字的位置为基准而定的范围内未记载对象信息的情况下,也能提取与关键字对应的对象信息。
[解决问题的技术手段]
技术方案1的发明是一种信息处理装置,包括处理器(processor),所述处理器在以记载于文档中的关键字的位置为基准而定的范围内,记载有表示与所述关键字对应的对象信息的参照目标的字符串时,从所述字符串所表示的所述参照目标提取所述对象信息。
技术方案2的发明是根据技术方案1所述的信息处理装置,其中,所述关键字为第一关键字,所述处理器使用图案匹配(pattern matching)来从所述参照目标检测与所述第一关键字对应的第二关键字,并从以所述第二关键字的位置为基准而定的范围提取所述对象信息。
技术方案3的发明是根据技术方案1或2所述的信息处理装置,其中,所述处理器对所述文档中所含的多个页面(page)中的、与记载有所述关键字的一页面不同的至少一页面的标题(title)进行检测,从所述至少一页面中的、具有与所述字符串对应的所述标题的另一页面提取所述对象信息。
技术方案4的发明是根据技术方案1至3中任一项所述的信息处理装置,其中,所述处理器变更所述文档,以使所述经提取的对象信息与所述关键字相关联地予以显示。
技术方案5的发明是根据技术方案4所述的信息处理装置,其中,所述处理器在与所述关键字一并显示的位置追加所述对象信息。
技术方案6的发明是根据技术方案4所述的信息处理装置,其中,所述处理器对所述字符串附加前往所述参照目标的链接(link)。
技术方案7的发明是根据技术方案1至6中任一项所述的信息处理装置,其中,所述处理器在所述参照目标中记载有与所述关键字对应的多个对象信息候补时,提取从所述多个对象信息候补中选择的任一个对象信息。
技术方案8的发明是根据技术方案7所述的信息处理装置,其中,所述处理器使对选择所述多个对象信息候补中的任一个对象信息的操作进行受理的画面显示于显示部,提取通过所述操作而选择的所述对象信息。
技术方案9的发明是根据技术方案7所述的信息处理装置,其中,所述处理器决定所述多个对象信息候补的确信度,根据所述确信度,从所述多个对象信息候补中选择任一个对象信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士施乐株式会社,未经富士施乐株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010158620.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理装置以及记录媒体
- 下一篇:半导体存储器装置