[发明专利]一种基于置信度的汉字书写质量评价方法无效
申请号: | 200910042118.X | 申请日: | 2009-08-25 |
公开(公告)号: | CN101630362A | 公开(公告)日: | 2010-01-20 |
发明(设计)人: | 金连文;高岩 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司 | 代理人: | 何淑珍 |
地址: | 510640广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 置信 汉字 书写 质量 评价 方法 | ||
技术领域
本发明属于利用计算机模式识别对手写文字图像进行识别处理的技术领域,特别是涉及一种基于置信度的汉字书写质量评价方法。
技术背景
手写汉字书写质量评价是利用计算机智能判别用户手写汉字的书写质量,其中书写质量包括书写是否正确、工整以及熟练三个方面的内容。手写汉字书写质量评价技术涉及到模式识别、图像处理、人工智能和计算机等学科,也涉及到语言文字学、书法、认知心理学等,是一门综合性很强的技术。
但是汉字书写质量评价有很多难点。首先,汉字字量大,仅国标一级字库中就有3755个汉字,而《现代汉语字典》中收集的汉字约11000个,即使智能评价3000个以上的汉字书写仍是一个相当大的问题;其次,汉字结构复杂,笔画最多的汉字有三十多画,平均每个汉字的笔画数约为11,所以手写汉字不可避免的会带来一些噪声,如连笔、笔画畸变等;再次,汉字相似性大,如“人、入”,“日、曰”,“己、已、巳”等,这些相似字有的仅有一点之差,有时人也不一定能辨认出写的不规范的手写体,这就给智能评价带来了很大的困难和挑战;最后,汉字字体众多,最常见的有楷书,行书,草书,隶书,篆书等,对各种字体书写评价的规则也是不一样的。所以目前汉字书写质量评价依然是个具有挑战性的研究题目。本文对书写质量评价做了初步的探讨,提出了一种基于置信度分析的汉字书写质量评价。
发明内容
本发明的目的在于创新性的提出了一种新的汉字书写质量评价方法,即基于置信度的汉字书写质量评价。
本发明采用的技术方案为:
一种基于置信度的汉字书写质量评价方法,其步骤如下:
(1)、利用修正二次判决函数计算候选字距离;
(2)、对候选字距离进行尺度调整;
(3)、利用候选字距离计算置信度;
(4)、利用置信度进行汉字书写质量评价
所述步骤(1)是利用修正二次判决函数(MQDF)分类器对手写汉字进行识别,得到K个候选字(一般取K=10),并计算每个候选字与手写样本的距离。MQDF分类器判决函数描述如下,
而由MQDF分类器计算出的距离di为:
其中∑i是协方差矩阵,μi是样本均值。
所述步骤(2)是对候选字距离进行尺度调整。由于由MQDF计算得到的距离di的数值有时较大,取负指数后变为0,不利于计算,因此需要将di做一个尺度上的调整di′=di/D0,其中D0为尺度因子,要根据训练样本的识别距离大小估计。估计的方法如下,
对一定数量的训练样本(从训练样本随机抽取,如:50个),统计第一候选距离最小值dmin和最末一个候选的距离最大值dmax,应有:
为了方便计算和参数调整,选取D0=2N,使得下式成立:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910042118.X/2.html,转载请声明来源钻瓜专利网。