[发明专利]全文检索设备及全文检索方法无效
申请号: | 00134962.7 | 申请日: | 2000-12-13 |
公开(公告)号: | CN1300026A | 公开(公告)日: | 2001-06-20 |
发明(设计)人: | 龟代泰三;平野敬 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/18 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 杨凯,叶恺东 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 全文 检索 设备 方法 | ||
1.一种全文检索设备,其特征在于备有:识别输入图像中包含的各字符图像并输出各字符图像的一个以上的识别候选字符的同时输出各识别候选字符的准确度的字符识别装置;作成表示上述字符识别装置输出的各识别候选字符与文书的对应关系的索引的索引作成装置;在输入图像中包含的各字符图像中存在没有其准确度超过基准准确度的识别候选字符的字符图像的情况下抽出该字符图像的形状特征的特征抽出装置;作为文书的检索条件输入关键字的输入装置;以及检索装置,参照索引,检索与该关键字一致的识别候选字符的文书,另一方面,对照由特征抽出装置抽出的字符图像的形状特征和构成关键字的字符的形状特征,检索符合检索条件的文书。
2.根据权利要求1所述的全文检索设备,其特征在于:索引作成装置在索引的作成对象中包含组合了两个以上的识别候选字符的连接字符。
3.根据权利要求1所述的全文检索设备,其特征在于:索引作成装置在字符识别装置输出的各识别候选字符中,将准确度比基准准确度低的识别候选字符从索引的作成对象中除去。
4.根据权利要求3所述的全文检索设备,其特征在于:即使在字符识别装置输出的识别候选字符的准确度比基准准确度低的情况下,索引作成装置在没有其准确度超过基准准确度的识别候选字符的与字符图像有关的识别候选字符时,索引的作成对象中包含该识别候选字符,同时对该识别候选字符附加与其他识别候选字符相区别的识别记号。
5.根据权利要求1至权利要求4中的任意一项所述的全文检索设备,其特征在于:特征抽出装置将字符图像的形状特征存储在数据库中,同时将该字符图像的各识别候选字符和有可能构成单词的字符的字符码存储在数据库中。
6.根据权利要求5所述的全文检索设备,其特征在于:特征抽出装置考虑语言信息或字符种类,判断各识别候选字符和有可能构成单词的字符。
7.根据权利要求1所述的全文检索设备,其特征在于:检索装置计算由特征抽出装置抽出的字符图像的形状特征和构成关键字的字符的形状特征的距离,该距离满足规定的基准时,认定符合检索条件。
8.根据权利要求1所述的全文检索设备,其特征在于:设有设定由检索装置进行的形状特征对照处理的有无的设定装置。
9.根据权利要求1所述的全文检索设备,其特征在于:检索装置将包含与关键字一致的识别候选字符的文书从形状特征的对照对象中除去。
10.根据权利要求1所述的全文检索设备,其特征在于:只在不存在与关键字一致的识别候选字符的情况下,检索装置对照由特征抽出装置抽出的字符图像的形状特征和构成关键字的字符的形状特征。
11.根据权利要求4所述的全文检索设备,其特征在于:在特定关键字的形状特征的对照对象时,检索装置将附加了识别符号的识别候选字符作为通配符处理。
12.根据权利要求2所述的全文检索设备,其特征在于:索引作成装置考虑整个文书中出现组合了两个以上的识别候选字符的连接字符的出现概率,判断索引的作成对象中是否包含该连接字符。
13.根据权利要求12所述的全文检索设备,其特征在于:在构成连接字符的各识别候选字符是该字符图像的唯一的识别候选字符的情况下,对该连接字符的出现次数进行往上计数,更新出现概率。
14.根据权利要求12所述的全文检索设备,其特征在于:设有对与关键字一致的连接字符的出现次数计数进行往上并更新出现概率的出现概率更新装置。
15.根据权利要求12所述的全文检索设备,其特征在于:设有在修正了字符识别装置输出的识别候选字符的情况下,对包含修正后的识别候选字符的连接字符的出现次数进行往上计数并更新出现概率的出现概率更新装置。
16.一种全文检索方法,其特征在于:识别输入图像中包含的各字符图像,输出各字符图像的一个以上的识别候选字符和各识别候选字符的准确度,作成表示各识别候选字符与文书的对应关系的索引,同时在输入图像中包含的各字符图像中抽出没有其准确度超过基准准确度的识别候选字符的字符图像的形状特征,一旦输入关键字作为文书的检索条件,便参照上述索引,检索与该关键字一致的识别候选字符的文书,另一方面对照上述字符图像的形状特征和构成该关键字的字符的形状特征,检索符合检索条件的文书。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/00134962.7/1.html,转载请声明来源钻瓜专利网。