[发明专利]工具书校验方法和工具书校验装置有效
申请号: | 201810175967.1 | 申请日: | 2018-03-02 |
公开(公告)号: | CN110309175B | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 石林 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F40/16 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 工具书 校验 方法 装置 | ||
本发明提供了一种工具书校验方法和工具书校验装置,其中,工具书校验方法包括:确定参考词库中的任两个预存名词之间的对应关系,以及与对应关系匹配的正则表达式;采用正则表达式提取工具书中用于对任一词条进行注释的释文名词;根据对应关系校验任一词条的注释是否正确。通过本发明的技术方案,能够高效快速地校验工具书特殊数据的正确率,极大地提高了操作速度和工作效率。
技术领域
本发明涉及文本校验技术领域,具体而言,涉及一种工具书校验方法和一种工具书校验装置。
背景技术
工具书通常是供查寻事实和数据的图书,它一般不以提供系统阅读为目的,而是作为查考和寻检知识的辅助工具。工具书能够高效地解决各种疑难问题,节约时间和精力,是普通书籍所不具备的。
由于工具书主要是供用户查询,就需要保证数据的准确性,因此,如何高效且准确地校验工具书文本成为亟待解决的技术问题。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个目的在于提供一种工具书校验方法。
本发明的另一个目的在于提供一种工具书校验装置。
本发明的再一个目的在于提供一种计算机可读存储介质。
为了实现上述目的,根据本发明的第一方面的实施例,提供了一种工具书校验方法,包括:确定参考词库中的任两个预存名词之间的对应关系,以及与对应关系匹配的正则表达式;采用正则表达式提取工具书中用于对任一词条进行注释的释文名词;根据对应关系校验任一词条的注释是否正确。
在该技术方案中,通过确定参考词库中的任两个预存名词之间的对应关系,以及与对应关系匹配的正则表达式,并采用正则表达式提取工具书中用于对任一词条进行注释的释文名词,进而根据对应关系校验任一词条的注释是否正确,提供了一种基于自身的释文名词进行校验的方案,能够高效快速地自动校验工具书特殊数据的正确率,极大地提高了操作速度和工作效率。
其中,正则表达式又称规则表达式,英文名为Regular Expression,能够被用来检索、替换那些符合预设模式(规则)的文本,正则表达式是对字符串(包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
由于参考词库的存储量庞大,因此,基于预设的正则表达式来确定两个预存名词之间的对应关系,能够实现校验工具书前的第一步过滤工作,即确定参考词库中词条与释文名词之间的对应关系,并且基于上述对应关系来校验工具书中的词条的注释是否正确,由于正则表达式在提取和校验过程中的一致性,且参考词库通常也是基于工具书录入的,进而能够有效地提高工具书校验方案的准确性和可靠性,节省了大量的人工校验成本。
在上述任一技术方案中,优选地,还包括:采用正则表达式校验指定数据库,以滤除指定数据库中的非法信息;将滤除非法信息的指定数据库确定为参考词库。
在该技术方案中,通过采用正则表达式滤除指定数据库中的非法信息,进而提高了参考词库的置信度,由于正则表达式能够滤除指定数据库中的非法信息,因此,其也可以在提取释文名词的同时,滤除注释中的非法信息。
在上述任一技术方案中,优选地,根据对应关系校验任一词条的注释是否正确,具体包括:根据对应关系确定任一词条的释文名词对应的预存名词的个数;判断个数是否大于或等于预设个数;在判定个数大于或等于预设个数时,记录词条对应的释文名词为不一致释文名词。
在该技术方案中,通过根据对应关系确定任一词条的释文名词对应的预存名词的个数,并在判定个数大于或等于预设个数时,记录词条对应的释文名词为不一致释文名词,提高了工具书的释文名词的校验效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810175967.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据查询方法、装置和服务器
- 下一篇:一种数据处理方法和数据中转站