[发明专利]满文部件切分中删除多余候选切分行的方法有效
申请号: | 201810371506.1 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108549896B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 郑蕊蕊;李敏;贺建军;许爽;吴宝春;付玉 | 申请(专利权)人: | 大连民族大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 刘斌 |
地址: | 116600 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 满文部件切分中删除多余候选切分行的方法,属于文字切分领域,为了解决提高满文切分精度的问题,要点是(1)如果序列Can_seg中只有1条候选切分行,且为第1行,则删除该行;否则转步骤(2);(2)查找连续候选切分行组成的子段conti_subseg,若子段的起始行为第1行,或者子段的结束行为第H行,则删除该子段的所有行;否则转步骤(3),H是满文单词图像的高度;(3)在连续候选切分子段conti_subseg中,按从小到大顺序,用中位数替代该子段的所有行,当具有偶数个候选行时取中间两个值的平均值再向上取整;效果是将候选切分行中,对于认定的多余候选切分行进而删除,能够提高候选切分行的准确性,从而提高切分的准确性。 | ||
搜索关键词: | 满文 部件 切分 删除 多余 候选 方法 | ||
【主权项】:
1.一种满文部件切分中删除多余候选切分行的方法,其特征在于,候选切分行组成的序列为Can_seg,删除序列Can_seg中的多余候选切分行的步骤:(1)如果序列Can_seg中只有1条候选切分行,且为第1行,则删除该行;否则转步骤(2);(2)查找连续候选切分行组成的子段conti_subseg,若子段的起始行为第1行,或者子段的结束行为第H行,则删除该子段的所有行;否则转步骤(3),H是满文单词图像的高度;(3)在连续候选切分子段conti_subseg中,按从小到大顺序,用中位数替代该子段的所有行,当具有偶数个候选行时取中间两个值的平均值再向上取整;(4)输出删除了多余候选切分行的切分行序列Can_seg_new。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810371506.1/,转载请声明来源钻瓜专利网。