[发明专利]一种古籍文档数字化的方法有效
申请号: | 202010298720.6 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111507351B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 马伟洪;金连文;汪嘉鹏;伍思航;毛慧芸 | 申请(专利权)人: | 华南理工大学;华南理工大学珠海现代产业创新研究院 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/416;G06V30/19;G06V30/14;G06N3/0464;G06N3/08 |
代理公司: | 北京东方盛凡知识产权代理有限公司 11562 | 代理人: | 张雪 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种古籍文档数字化的方法,包括:收集数据,再利用收集的数据训练单字检测模型,得到单字输出结果;同时训练单字分类模型,对检测后的单字输出分类结果,结合单字的检测以及识别结果最终得到文档的识别结果;利用图形形态学的方法提取文档版面的直线,并设计算法解决文档双列夹注的问题,为文档结构化输出提供条件,最后输出图片对应的文档数字化结果,完成文档数字化的工作。本发明方法解决了版面复杂,密集文档下的单字检测以及较大的文档背景中包括污渍干扰等问题,具有简单高效,识别精度高的优点,将现代计算机信息技术与传统人文文化相结合,对于数字遗产保护,信息发现,纸质文档转录等工作具有重要的积极作用。 | ||
搜索关键词: | 一种 古籍 文档 数字化 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;华南理工大学珠海现代产业创新研究院,未经华南理工大学;华南理工大学珠海现代产业创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010298720.6/,转载请声明来源钻瓜专利网。
- 上一篇:修改时钟信号的控制器和方法、同步装置
- 下一篇:一种小型智能存储管理终端