[发明专利]一种基于加权随机分布模型的藏文字体多样性表达方法在审

专利信息
申请号: 201910959739.8 申请日: 2019-10-10
公开(公告)号: CN110728273A 公开(公告)日: 2020-01-24
发明(设计)人: 朱倩倩;车文刚;苗晗;廖江福 申请(专利权)人: 昆明理工大学
主分类号: G06K9/20 分类号: G06K9/20;G06K9/34;G06K9/46;G06K9/62
代理公司: 11350 北京科亿知识产权代理事务所(普通合伙) 代理人: 汤东凤
地址: 650504 云南*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 字体 藏文 多样性 随机分布 字符图像 字体库 加权 预处理 替换 标准字体 电子文档 文本图像 原文 模型调用 文稿扫描 字体风格 离散性 分割 计算机 版式 扫描 风格
【说明书】:

发明公开了一种基于加权随机分布模型的藏文字体多样性表达方法,所述方法包括以下步骤:S1、将藏文字体文稿扫描到计算机;S2、对扫描到计算机的文本图像做预处理;S3、对预处理后的文本图像进行分割;S4、对分割好的单一字符图像进行藏文识别;S5、将单一字符图像分成不同风格的字符图像;S6、根据字符的字体风格建立多样性字体库;S7、建立字体的加权随机分布模型;S8、以标准字体版式的藏文字体电子文档作为替换原文档,根据字体的加权随机分布模型调用多样性字体库中的字体,将替换原文档中的标准字体逐一替换为多样性字体库中的字体,实现藏文字体电子文档中字体的离散性和多样性。

技术领域

本发明涉及信息处理技术领域,特别涉及一种基于加权随机分布模型的藏文字体多样性表达方法。

背景技术

藏文是藏族人民在政治、经济、文化和宗教活动中的文字承载工具,是在中华民族历史文化发展长河中形成的独特文字形式。在长久的历史过程中,流传下来大量藏文经典文献主要采用手写和雕刻方式记载,主要分为:一,古藏文文献:如敦煌古藏文文献,被公认为敦煌学和藏学研究中的重要文献;二,《大藏经》为代表的佛教典籍:如乾隆藏本、嘉兴藏本;三,藏族先贤的作品:如达赖六世仓央嘉措的拉萨藏文木刻版《仓央嘉措情歌》、《十诫诗》以及大乘经典《药师经》;四,藏文公文为主的藏文历史档案文献。这些历史文献传统优秀的文献采用木刻和拓印的方式保存和流传,它们的最大特点是拥有独特的手写和雕刻字体,充分表现了当时年代对藏文的美学理解和文字背后的宗教精神。

由于藏文字体的原始文献种类繁多,目前计算机信息处理技术对这些经典藏文文献的处理,只是简单的通过图形扫描或矢量化图形的方式保存,或者做一些提高保存质量的工作。

上述方法虽然尽可能地保留了原版的书写和手工雕刻细节,但它需要处理巨大的数据量,而且不能在保持原著版面风格的基础上,实现藏文文字的编辑、查询、排版和发布等计算机文字信息处理的基本功能;进一步,如果采用单一的计算机藏文字体来处理,尽管可以实现编辑、查询等功能,但是不能保留原版的书写和手工雕刻细节,进而无法体现藏文的手写体和雕刻体艺术美感。

发明内容

本发明公开了一种基于加权随机模型的藏文字体多样性表达方法,该方法既能保留古籍原版的书写和手工雕刻细节,又能实现编辑和查询,实现藏文字计算机字体的多样性表达。

本发明的技术方案是:一种基于加权随机分布模型的藏文字体多样性表达方法,所述方法包括以下步骤:

S1、将藏文字体文稿扫描到计算机,生成PDF图像;

S2、对扫描到计算机的文本图像做预处理;

S3、对预处理后的文本图像进行分割,生成单一字符图像;

S4、对分割好的单一字符图像进行藏文识别;

S5、根据字符的局部特征,将单一字符图像分成不同风格的字体图像,同一风格的字体图像生成一套藏文字体集;

S6、提取图像中的字符,根据字符的字体风格建立多样性字体库;

S7、统计每一藏文字体文稿中不同风格的字体在文中出现的频度,建立字体的加权随机分布模型;

S8、以标准字体版式的藏文字体电子文档作为替换原文档,根据字体的加权随机分布模型调用多样性字体库中的字体,将替换原文档中的标准字体逐一替换为多样性字体库中的字体,实现藏文字体电子文档中字体的离散性和多样性。

所述步骤S2的具体步骤为:

S2.1、对文本图像做倾斜、去边框、去噪声处理;

S2.2、根据自动阈值法得到二值图像。

所述步骤S3的具体步骤为:

S3.1、对文本图像进行行切分;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910959739.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top