[发明专利]一种盲文分词修改方法和系统有效
申请号: | 201810095381.4 | 申请日: | 2018-01-31 |
公开(公告)号: | CN108415899B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 李妍;关忠;钟经华;刘志丽;闫嘉 | 申请(专利权)人: | 北京联合大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/166;G06F40/189 |
代理公司: | 北京驰纳智财知识产权代理事务所(普通合伙) 11367 | 代理人: | 谢亮 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 盲文 分词 修改 方法 系统 | ||
本发明提供了一种盲文修改方法和系统,其中方法包括:遍历每一行,设置标识;比较基础版本;生成基础数据。本发明能够解决现有利用汉语盲文进行采集、修改管理操作不便、管理效率低的问题,实现替代人工汉语对齐,标注对比和完成修订的工作。可实现多人同平台完成盲文分词标注的修改。
技术领域
本发明涉及汉语盲文分词技术领域,特别涉及一种盲文分词修改方法和系统。
背景技术
汉语盲文研究需要专门的语料库支持,汉语盲文语料库的建设就是将我国盲文使用的语言材料进行采集、整理、记录,整体把握盲文符号、词汇、标调等问题的全貌,并进行系统的定量分析。汉语盲文的分词连写既不同于汉语拼音正词法基本规则的分词连写方式,也不同于汉语信息处理领域常用的分词规则。经过科学的选材和标注,对现存的盲文语料进行分词连写的修订,全面的分析现存语料的分词问题,提高盲文分词的一致性,进而促进盲文信息化的发展。
汉语盲文的分词连写是以词汇为单位,词汇之间以空方作为边界。现行盲文的分词连写要求盲文的书写既要符合汉语语法和语言的逻辑性习惯性,又要适当减少零散的单音节词形,以符合盲人摸读习惯,提高摸读效率。由于盲文分词连写的特殊性,导致现行盲文语料在分词连写上存在着很大的分歧。
目前汉语盲文语料库采集,多是在多个txt汉文和盲文进行采集、修改、管理时,操作不便,管理速度慢且效率低。
公开号CN200410070161.4 的发明专利申请公开了一种运行于Windows平台的盲汉对照编辑排版系统,同时也涉及该系统使用的编辑排版方法。本盲汉对照编辑排版系统由盲文输入装置,汉盲自动转换器,盲汉自动转换器,语音导航器,打印机,盲文刻印机,显示器,点显器,盲汉对照编辑排版装置所组成。该系统具有多种输入和输出功能,可以实现高准确度的汉语与盲文的自动翻译转换,盲汉对照的“所见即所得”的排版,盲文自动校对,同时针对盲文用户提供自动语音跟随功能,从而大大提高了盲文排版的效率和实用性。本盲汉对照编辑排版方法通过分行、分页和对开等格式化排版、自动对照、同步编辑、智能校对等步骤,实现了盲文编辑排版工作的自动化,为盲文出版工作提供了便利。该发明汉盲自动转换翻译并不精确,尤其对于文章的分词大同小异,例如:“火腿肠”有可能划分成“火腿”和“肠”,也有可能划分“火”、“腿”、“肠”。
发明内容
为解决上述问题,本发明提出的一种盲文分词修改方法和系统,能够解决利用txt汉语盲文进行采集、修改、管理操作不便、管理效率低的问题。
本发明的第一方面是提出了一种盲文分词修改方法,包括:获取基础版本,还包括以下步骤:
步骤1:遍历每一行字符;
步骤2:设置标识记号;
步骤3:比较所述基础版本,生成基础数据;
本发明的盲文分词修改方法自动化程度高,解决了人工分词的诸多弊端。
优选的是:所述基础版本包括中科院第一版本、中科院第二版本、北理工版本和清华版本中至少一种。这样便可多版本的引入能够降低分词识别的错误率。
在上述任一方案中优选的是:所述步骤1包括统计所述基础版本中的汉字和/或标识个数。这样,与人工识别相比较能够提高统计速度和统计效率。
在上述任一方案中优选的是:所述步骤2包括设置所述中科院第一版本中的汉字1和标识1为C1,设置所述中科院第二版本中的汉字2和标识2为C2,设置所述北理工版本中的汉字3和标识3为C3,设置所述清华版本中的汉字4和标识4为C4。这样便能够替代人工设置各版本的变量名,减少人工工作量。
在上述任一方案中优选的是:所述比较规则为判断C1和C2的大小关系,如果C1C2,则设置所述标识记号以便下次不再读取汉字2,如果C1C2,则继续读取汉字2和标记2,如果C1=C2,则继续遍历下一行。这样便能够简化人工判断流程,减少人工工作量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京联合大学,未经北京联合大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810095381.4/2.html,转载请声明来源钻瓜专利网。