[发明专利]一种基于藏经典文献中多样性字体的计算机表达方法在审
申请号: | 202010050067.1 | 申请日: | 2020-01-17 |
公开(公告)号: | CN111274762A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 朱倩倩;车文刚;苗晗;廖江福 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/109 | 分类号: | G06F40/109;G06F40/151;G06K9/34;G06K9/62 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 650504 云南*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 经典 文献 多样性 字体 计算机 表达 方法 | ||
1.一种基于藏经典文献中多样性字体的计算机表达方法,其特征在于,所述方法包括以下步骤:
Step1、收集、归纳、整理要研究的藏经典文献的原始影印资料;
Step2、将整理的藏文经典文献原始影印资料扫描到计算机,生成文稿图像材料;
Step3、对文稿图像做去噪声、去边框、倾斜等处理;
Step4、根据文稿图像的行列布局情况进行不同的算法分割,分割成单一的藏文字符图像;
Step5、提取文稿图像中不同风格的字体;
Step6、根据经文中产生不同风格的字体的特点,建立多样性表达模型;
Step7、将从文稿中提取的N套字体根据用户偏好的不同,建立偏态分布字体模型;
Step8、根据文稿中字体的多样性和离散性的特点,提出字体多样性表达算法;
Step9、以Microsoft Himalaya字体的电子版作为经典文献的标准文档,根据偏态分布字体模型,将经典文献中的Microsoft Himalaya字体逐一替换为文稿中提取出来的多种风格的字体,实现计算机字体多样性表达,生成具有多样性和离散性字体的藏文经典文献。
2.根据权利要求1所述的一种基于藏经典文献中多样性字体的计算机表达方法,其特征在于:
步骤Step4中所述文稿图像的行列布局分为以下三种情况:行列间距明显的情况、行列间有重合但是不粘连的情况、行列间存在粘连的情况。
3.根据权利要求2所述的一种基于藏经典文献中多样性字体的计算机表达方法,其特征在于:所述步骤Step4的具体步骤如下:
Step4.1、对文稿图像进行投影分割,
公式(1)为图像在V(x,y)点的像素值,黑色(前景)像素值为1,白色(背景)像素值为0,然后对图像做行(列)投影处理,统计投影和为0的行(列),就是行(列)间空隙线,以此坐标作为图像分割点,进行图像的粗分割;
Step4.2、通过步骤Step4.1将文稿中行(列)有明显间隔的部分分割完毕,对于行(列)间无明显间隔的版面采取连通域分割方法,它是通过检查各像素与其相邻像素的连通性,将文本块联通,然后进行字符的分割;
Step4.3、通过步骤Step4.2将文稿中行(列)间有重合但又不粘连的文本块分割完毕,考虑到文稿中行(列)间可能存在粘连的情况,采用改进的滴水法分割图像,首先采用Zhang-Sueng提出的并行细化方法处理粘连字符,只保留图像的拓扑结构,然后确定候选分割点,再通过自组织映射网络确定最终分割路径,实现粘连字符的分割。
4.根据权利要求1所述的一种基于藏经典文献中多样性字体的计算机表达方法,其特征在于:所述步骤Step5的具体步骤如下:
Step5.1、对分割的单一字符进行字符识别;
Step5.2、将文稿中提取的所有字符进行字体分类;
Step5.3、根据已经分类的不同风格的字体,生成字体库文件;
Step5.4、将所有风格的字体装入计算机备用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010050067.1/1.html,转载请声明来源钻瓜专利网。