[发明专利]一种基于书写风格建模的中文字库自动生成方法有效
申请号: | 201610828454.7 | 申请日: | 2016-09-18 |
公开(公告)号: | CN106384094B | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 连宙辉;肖建国 | 申请(专利权)人: | 北京大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/46;G06F16/51 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种基于书写风格建模的中文字库自动生成方法,通过对输入的手写体汉字图片进行笔画轨迹自动提取与错误结果筛除操作,得到训练数据,采用人工神经网络对手写体汉字笔画形状风格和笔画间架结构风格进行学习和建模,并通过统计分析得到书写笔画连接特性和笔画端部轮廓书写特征,生成与用户书写风格一致的高质量汉字字形。本发明使得只需书写少量常用汉字作为输入,无需任何人工干预,便可自动生成包含海量汉字字形的矢量中文字库,可为用户快速自动生成具备其书写风格的手写体中文字库,能够显著提高手写体中文字库的制作效率、大幅降低生产成本。 | ||
搜索关键词: | 一种 基于 书写 风格 建模 中文 字库 自动 生成 方法 | ||
【主权项】:
1.一种中文字库自动生成方法,所述方法基于书写风格建模自动生成中文字库,包括如下步骤:1)书写一定数量的汉字,通过拍照或扫描制成文本图片;2)对文本图片进行自动切割,获得多张独立汉字图片;3)自动提取每张独立汉字图片中的笔画书写轨迹,并滤除错误提取结果,得到正确的笔画轨迹;采用同样方法得到与书写汉字相对应的参考字形的笔画轨迹;4)采用人工神经网络对步骤1)书写的汉字的整体书写风格进行建模,得到汉字的整体书写风格模型,所述整体书写风格细分为笔画形状风格和笔画间架结构风格;5)通过分析与描述笔画的连接特性和笔画端部的轮廓特征,建立同类笔画端部轮廓;对书写风格细节进行建模,得到书写风格细节模型;6)基于整体书写风格模型和书写风格细节模型,将具备书写风格的汉字书写轨迹与细节特征进行重现,自动生成未书写的其他所有汉字的独立汉字字形图片;7)将步骤2)得到的书写的独立汉字图片与步骤6)所述自动生成的独立汉字字形图片一同矢量化,并打包生成标准计算机字库文件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610828454.7/,转载请声明来源钻瓜专利网。