[发明专利]信息处理装置、机器学习装置以及信息处理方法有效
申请号: | 202010169601.0 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111695568B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 金田健太郎 | 申请(专利权)人: | 精工爱普生株式会社 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/14 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 李丹 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 机器 学习 以及 方法 | ||
一种信息处理装置、机器学习装置以及信息处理方法,将广范围的原稿作为文件名的生成对象。构成如下的信息处理装置,其具备:存储部,存储使用示教数据进行机器学习后的已学习模型,所述示教数据是将由扫描仪读取的原稿的读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与所述读取数据的文件名建立关联后的数据;以及控制部,使用所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个和所述已学习模型,来生成所述读取数据的文件名。
技术领域
本发明涉及信息处理装置、机器学习装置以及信息处理方法。
背景技术
以往,已知有自动生成文件名的技术。例如,在专利文献1中,记载有如下内容:读取按照各样式预先指定的识别部位的影像数据并进行字符识别处理,从而基于所识别的字符串来生成文件名。
专利文献1:日本特开2008-71050号公报
在现有技术中,文件名是根据特定的样式的指定部位的字符来决定的。因此,无法针对非特定的样式的读取数据生成文件名。
发明内容
本发明的目的在于,将广范围的原稿作为文件名的生成对象。
用于达成上述目的的信息处理装置具备:存储部,存储使用示教数据进行机器学习后的已学习模型,所述示教数据是将由扫描仪读取的原稿的读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与所述读取数据的文件名建立关联后的数据;以及控制部,使用所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个和所述已学习模型,来生成所述读取数据的文件名。根据该结构,能够将广范围的原稿作为文件名的生成对象。
另外,也可以是如下的结构:所述信息处理装置还具备学习部,所述学习部在所述控制部生成的所述文件名被变更的情况下,使用所述示教数据使所述已学习模型进行再学习,所述示教数据是所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与变更后的所述文件名建立关联后的数据。根据该结构,能够根据变更后的文件名的倾向来输出文件名。
而且,也可以是如下的结构:所述学习部进行再学习,以使得变更后的所述文件名比变更前的所述文件名对学习结果的影响更大。根据该结构,能够尽快学习基于使用者的变更的倾向。
而且,也可以是如下的结构:所述学习部进行再学习,以使得变更后的字符串比变更前的字符串对学习结果的影响更大。根据该结构,在使用者变更了字符串的情况下,能够尽快学习变更后的字符串的倾向。
而且,也可以是如下的结构:所述文件名具有包含在所述读取数据中的日期信息。根据该结构,能够基于读取数据生成具有日期信息的文件名。
而且,也可以是如下的结构:所述已学习模型输出在所述文件名中是否包含所述日期信息。根据该结构,能够学习在文件名中是否包含日期信息,并基于学习结果来生成文件名。
而且,也可以是如下的结构:所述示教数据所示的所述文件名包含:由使用者输入的字符串、以及通过对所述读取数据的OCR处理而读取的字符串中的至少一方。根据该结构,能够学习基于使用者的文件名的形成倾向和与在读取数据中包含的字符串关联的文件名的倾向的至少一方。
而且,也可以是如下的结构:所述图像包含示出所述原稿的发布方的图像,所述控制部以示出所述发布方的图像为基础来确定所述原稿的所述发布方,并生成包含所述发布方的名称的所述文件名。根据该结构,能够生成与公司的记录标识等图像对应的文件名。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于精工爱普生株式会社,未经精工爱普生株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010169601.0/2.html,转载请声明来源钻瓜专利网。