[发明专利]文档图像处理装置以及文档图像处理方法无效

申请号：	200710000960.8	申请日：	2007-01-15
公开（公告）号：	CN101226595A	公开（公告）日：	2008-07-23
发明（设计）人：	吴波;窦建军;乐宁;吴亚栋;贾靖	申请（专利权）人：	夏普株式会社
主分类号：	G06K9/62	分类号：	G06K9/62;G06F17/30
代理公司：	北京集佳知识产权代理有限公司	代理人：	雒运朴;徐谦
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文档图像处理装置以及方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种文档图像处理装置，对所存储的文档图像赋予文档名并进行管理，该文档图像处理装置的特征在于，具有：

字形特征字典，其以单个文字为单位储存有文字图像的图像特征；

标题抽出部，其抽取出在所输入的文档图像中存在的标题区域；

图像特征抽出部，其将在由上述标题抽出部抽取出的标题区域中所包含的文字列的文字图像按单个文字进行分割，并抽出各文字图像的图像特征；

候补文字列生成部，其以由上述图像特征抽出部抽出的文字图像的图像特征为基础，参照上述字形特征字典，来选择图像特征的匹配度高的文字图像作为候补文字，制作成相应于上述文字列的候补文字列，而且采用词义解析法来调整构成该候补文字列的各候补文字，并设为有意义的候补文字列；

文档名制作部，其对上述所输入的文档图像，制作包含由上述候补文字列生成部生成的有意义的候补文字列的第一文档名。

2.一种文档图像处理装置，对所存储的文档图像赋予文档名并进行管理，该文档图像处理装置的特征在于，具有：

字形特征字典，其以单个文字为单位储存有文字图像的图像特征；

标题抽出部，其抽取出在所输入的文档图像中存在的标题区域；

图像特征抽出部，其将由上述标题抽出部抽取出的标题区域中所包含的文字列的文字图像按单个文字进行分割，并抽出各文字图像的图像特征；

候补文字列生成部，其以由上述图像特征抽出部抽出的文字图像的图像特征为基础，从上述字形特征字典，按图像特征匹配度从高到低的顺序选择N个文字图像作为候补文字，其中N为N＞1的整数，且将上述文字列的文字数设为M个，其中M为M＞1的整数，在该场合下，制作M×N维索引矩阵，基于该索引矩阵，来制作将该索引矩阵中的连续的各行的一个候补文字依次排列的候补文字列，并且采用词义解析法来调整构成该候补文字列的各候补文字，并设为有意义的候补文字列；

文档名制作部，其对上述所输入的文档图像，制作包含由上述候补文字列生成部生成的有意义的候补文字列的第一文档名。

3.根据权利要求1或2所述的文档图像处理装置，其特征在于，上述文档名制作部在第一文档名中包含上述所输入的文档图像被输入的时间的数据。

4.根据权利要求1或2所述的文档图像处理装置，其特征在于，上述文档管理部除第一文档名之外另外制作包含上述所输入的文档图像被输入的时间的数据的第二文档名，并对一个文档图像利用第一文档名和第二文档名来进行管理。

5.根据权利要求1或2所述的文档图像处理装置，其特征在于，上述标题抽出部利用投影法和连通区域统计分析法，来抽取出文档图像中的标题区域。

6.根据权利要求1或2所述的文档图像处理装置，其特征在于，上述图像特征抽出部利用网格方向特征和文字图像外围特征的组合，来抽出文字图像的图像特征。

7.一种文档图像处理方法，对所存储的文档图像赋予文档名并进行管理，该文档图像处理方法的特征在于，具有：

标题抽出步骤，抽取出在所输入的文档图像中存在的标题区域；

图像特征抽出步骤，将在上述标题抽出步骤中抽取出的标题区域中所包含的文字列的文字图像按单个文字进行分割，并抽出各文字图像的图像特征；

候补文字列生成步骤，以在上述图像特征抽出步骤中抽出的文字图像的图像特征为基础，参照以单个文字为单位储存有文字图像的图像特征的字形特征字典，来选择图像特征的匹配度高的文字图像作为候补文字，并制作成相应于上述文字列的候补文字列，而且采用词义解析法来调整构成该候补文字列的各候补文字，并设为有意义的候补文字列；

文档管理步骤，对上述所输入的文档图像，制作包含上述候补文字列生成步骤中生成的有意义的候补文字列的第一文档名，并进行管理。

8.一种文档图像处理方法，对所存储的文档图像赋予文档名并进行管理，该文档图像处理方法的特征在于，具有：

标题抽出步骤，抽出在所输入的文档图像中存在的标题区域；

图像特征抽出步骤，将在上述标题抽出步骤中抽出的标题区域中所包含的文字列的文字图像按单个文字进行分割，并抽出各文字图像的图像特征；

特征匹配步骤，以在上述图像特征抽出步骤中抽出的文字图像的图像特征为基础，从以单个文字为单位储存有文字图像的图像特征的字形特征字典中，按图像特征匹配度从高到低的顺序选择N个文字图像作为候补文字，其中N为N＞1的整数，且将上述文字列的文字数设为M个，其中M为M＞1的整数，在该场合下，制作M×N维索引矩阵；

文档管理步骤，对上述所输入的文档图像，基于上述特征匹配步骤中制作出的索引矩阵，来制作包含将该索引矩阵中的连续的各行的一个候补文字按顺序排列的候补文字列的第一文档名，并进行管理。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于夏普株式会社，未经夏普株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200710000960.8/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]文档图像处理装置以及文档图像处理方法无效

专利文献下载