[发明专利]用于稿件中的职务信息的检查方法和装置有效
申请号: | 201210335592.3 | 申请日: | 2012-09-11 |
公开(公告)号: | CN103678353A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 周志扬;朱建波 | 申请(专利权)人: | 北京大学;北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 稿件 中的 职务 信息 检查 方法 装置 | ||
1.一种用于稿件中的职务信息的检查方法,其特征在于,包括:
利用人名数据库对稿件进行全文检索,以确定所述稿件中的人名;
以确定的所述人名检索职务数据库,以确定所述人名所关联的职务;
利用确定的所述职务判断所述人名在所述稿件中的相关信息是否正确。
2.根据权利要求1所述的方法,其特征在于,还包括:预先创建所述人名数据库,其中包括多条记录,所述各条记录包括用于记载人名的字段;其中,利用人名数据库对稿件进行全文检索包括:
将所述各条记录中记载的人名与所述稿件的全文进行匹配;
如果在所述稿件中匹配到与所述记录中记载的人名相同的词,则将所述匹配到的词确定为所述稿件中的人名。
3.根据权利要求1所述的方法,其特征在于,还包括:预先创建所述职务数据库,其中包括多条记录,所述各条记录包括用于记载人名的第一字段和用于记载职务的第二字段;其中,以确定的所述人名检索职务数据库包括:
将确定的所述人名匹配所述各条记录;
如果在所述记录的所述第一字段中匹配到所述人名,则提取当前所述记录中的第二字段中的职务;
将所述提取的职务确定为所述人名所关联的职务。
4.根据权利要求1所述的方法,其特征在于,利用确定的所述职务判断所述人名在所述稿件中的相关信息是否正确包括:
提取所述人名在所述稿件中相邻的词;
判断所述相邻的词是否为职务;
如果所述相邻的词是职务,则确定所述相邻的词是否匹配以所述职务数据库确定的职务;
如果不匹配,则标注所述相邻的词。
5.根据权利要求1所述的方法,其特征在于,预先创建所述职务数据库,其中包括多条记录,所述各条记录包括:用于记载人名的第一字段、用于记载职务的第二字段;以及用于记载所述职务的索引的第三字段,所述索引的大小与所述职务的级别线性相关;其中,以确定的所述人名检索职务数据库,在确定所述人名所关联的职务的同时,还确定所述所关联的职务的索引。
6.根据权利要求5所述的方法,其特征在于,利用确定的所述职务判断所述人名在所述稿件中的相关信息是否正确包括:
确定所述稿件中为并列关系的所述人名;
判断所述并列的人名的所述索引在所述并列关系中的先后排序是否符合所述人名所关联的职级为从高到低;
如果不符合,则标注所述并列的人名。
7.根据权利要求6所述的方法,其特征在于,所述并列关系为以下模式:
职务1、职务2......职务m1人名1、职务1、职务2......职务m2人名2、......、职务1、职务2......职务mn人名n,
其中,n为大于等于2的自然数;m1、m2、......、mn均为非负整数,职务可有可无。
8.根据权利要求7所述的方法,其特征在于,确定所述稿件中为并列关系的所述人名包括:
A)判断当前的所述人名在所述稿件中上文相邻的词;
B)如果无词或者词不是职务,则确定所述当前人名之前无并列的人名,结束所述当前人名的并列关系的判断;
C)如果词是标点符号或词是职务,则对在上文相邻的字符循环执行步骤B和C;
D)如果词是人名,则将所述判断得到的人名加入所述并列关系,并以所述判断得到的人名作为当前的所述人名循环执行上述判断并列关系的步骤。
9.一种用于稿件中的职务信息的检查装置,其特征在于,包括:人名模块,用于利用人名数据库对稿件进行全文检索,以确定所述稿件中的人名;
职务模块,用于以确定的所述人名检索职务数据库,以确定所述人名所关联的职务;
判断模块,用于利用确定的所述职务判断所述人名在所述稿件中的相关信息是否正确。
10.根据权利要求9所述的装置,其特征在于,所述判断模块包括:提取模块,用于提取所述人名在所述稿件中相邻的词;
职务判断模块,用于判断所述相邻的词是否为职务;
匹配模块,用于如果所述相邻的词是职务,则确定所述相邻的词是否匹配以所述职务数据库确定的职务;
标注模块,用于如果不匹配,则标注所述相邻的词。
11.根据权利要求9所述的装置,其特征在于,预先创建所述职务数据库,其中包括多条记录,所述各条记录包括:用于记载人名的第一字段、用于记载职务的第二字段;以及用于记载所述职务的索引的第三字段,所述索引的大小与所述职务的级别线性相关;其中,所述职务在确定所述人名所关联的职务的同时,还确定所述所关联的职务的索引,所述判断模块包括:
并列模块,用于确定所述稿件中为并列关系的所述人名;
排序模块,用于判断所述并列的人名的所述索引在所述并列关系中的先后排序是否符合所述人名所关联的职级为从高到低;
标注模块,用于如果不符合,则标注所述并列的人名。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北大方正集团有限公司;北京北大方正电子有限公司,未经北京大学;北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210335592.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:降低彩色图像实时传输数据量的方法
- 下一篇:基于红外光栅的养殖场监视方法