[发明专利]知识处理装置以及方法有效
申请号: | 201410346227.1 | 申请日: | 2014-07-21 |
公开(公告)号: | CN104424350B | 公开(公告)日: | 2017-12-01 |
发明(设计)人: | 吉田笃弘 | 申请(专利权)人: | 株式会社东芝;东芝解决方案株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06K9/20 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 王成坤,胡建新 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 处理 装置 以及 方法 | ||
本申请享受2013年9月6日在先提出的日本国专利申请第2013-185634号的优先权的利益,并且包括在先申请的全部内容。
技术领域
实施方式涉及使用知识词典进行字符串的修正的知识处理装置、方法以及程序。
背景技术
例如,作为用于对通过OCR(Optical Character Recognition/Reader:光学字符识别)等而字符识别出的字符串进行修正而使其接近正确答案的技术,已知有知识处理。知识处理为,将作为修正的对象的字符串(以下,称为修正对象字符串)与预先准备的知识词典(单词词典)对照,根据需要用储存于知识词典的字符串(单词)置换修正对象字符串,从而进行对修正对象字符串的修正。例如,如果修正对象字符串是表示姓名的姓的字符串,则将修正对象字符串与储存了姓中使用的多个单词的知识词典对照,如果有符合的单词则置换修正对象字符串。
然而,在以往的知识处理中,从知识词典未恰当地筛选出用于置换修正对象字符串的字符串而未获得足够的修正精度的情况较多,要求精度的提高。
发明内容
实施方式公开了能够高精度地进行使用了知识词典的字符串的修正的知识处理装置以及方法。
实施方式的知识处理装置,使用知识词典进行字符串的修正,该知识处理装置具备:选择部、生成部、修正部。选择部从包含多个字符串且按每个字符串附有该字符串的属性的文件数据,选择修正对象字符串。生成部基于所述文件数据中的、属性与所述修正对象字符串不同的其他的字符串,生成取得置换字符串的候补的条件,该置换字符串用于置换所述修正对象字符串。修正部使用按照所述条件而从所述知识词典取得的所述置换字符串的候补,进行对所述修正对象字符串的修正。
附图说明
图1是对实施方式的知识处理装置的硬件构成例进行表示的框图。
图2是对实施方式的知识处理装置的功能上的构成例进行表示的框图。
图3是对文件数据的一例进行表示的图。
图4是对知识词典的一例进行表示的图。
图5是对确定置换字符串的状况进行示意性地表示的图。
图6是对无法唯一地确定置换字符串的例子进行说明的图。
图7是对无法唯一地确定置换字符串的例子进行说明的图。
图8是对基于“住所”属性的条件生成用字符串而生成为了取得对“姓”属性的修正对象字符串进行置换的置换字符串的候补所用的候补取得条件的例子进行说明的图。
图9是对基于“出生年月日”属性的条件生成用字符串而生成为了取得对“名”属性的修正对象字符串进行置换的置换字符串的候补所用的候补取得条件的例子进行说明的图。
图10是对使用按照候补取得条件而取得的置换字符串的候补而筛选置换字符串的状况进行示意性地表示的图。
图11是对使用按照候补取得条件而取得的置换字符串的候补而筛选置换字符串的状况进行示意性地表示的图。
图12是对将置换字符串的候补提示给用户的情况的提示例进行表示的图。
图13是对将置换字符串的候补提示给用户的情况的提示例进行表示的图。
图14是对实施方式的知识处理装置的处理过程的一例进行表示的流程图。
图15是对优先使用按照优先度高的候补取得条件而取得的置换字符串的候补来进行对修正对象字符串的修正的状况进行示意性地表示的图。
图16是对按照优先度进行置换字符串的筛选的过程的一例进行表示的流程图。
图17是对按照优先度进行置换字符串的筛选的过程的另一例进行表示的流程图。
图18是对将与“姓”属性的修正对象字符串邻接的“名”属性的字符串用于条件生成用字符串来取得置换字符串的候补的例子进行示意性地表示的图。
图19是对姓名的男女差进行说明的图。
图20是对利用姓名的男女差来进行置换字符串的筛选的例子进行说明的图。
具体实施方式
以下,参照附图对实施方式的知识处理装置以及方法进行详细地说明。在以下所示的实施方式中,设想进行通过OCR而字符识别出的字符串的修正的例子。然而,通过实施方式的知识处理装置修正的字符串不限于通过OCR而字符识别出的字符串。实施方式的知识处理装置能够广泛应用于使用知识词典进行字符串的修正的情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝解决方案株式会社,未经株式会社东芝;东芝解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410346227.1/2.html,转载请声明来源钻瓜专利网。