[发明专利]通过解析PDL文件为神经网络生成OCR用训练数据在审
申请号: | 202010268192.X | 申请日: | 2020-04-08 |
公开(公告)号: | CN111797886A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 苏东培 | 申请(专利权)人: | 京瓷办公信息系统株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京航忱知识产权代理事务所(普通合伙) 11377 | 代理人: | 陈立航 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供训练和使用人工神经网络(ANN)的方法和装置。运算装置可接收包含文本的训练文档。运算装置可对训练文档进行解析来确定出多个训练数据项。各训练数据项可包含训练标签和位置信息,训练标签与训练文档内的文本相关联,位置信息表示与训练标签相关联的文本的位置。可使用多个训练数据项和训练用输入样本对ANN进行训练来识别文档内的文本,训练用输入样本包含训练文档。在对ANN进行训练之后,可接收在应用文档中进行文本预测的请求,应用文档不同于训练文档。应用文档可包含第二文本。可通过将训练后的ANN应用于应用文档,来确定出第二文本的预测。在确定出第二文本的预测之后,可提供与第二文本相关联的信息来作为输出。 | ||
搜索关键词: | 通过 解析 pdl 文件 神经网络 生成 ocr 训练 数据 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京瓷办公信息系统株式会社,未经京瓷办公信息系统株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010268192.X/,转载请声明来源钻瓜专利网。