[发明专利]校验行业文本的方法和装置有效
申请号: | 201611256002.2 | 申请日: | 2016-12-29 |
公开(公告)号: | CN108255887B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 孙德彬 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/953 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 校验 行业 文本 方法 装置 | ||
1.一种校验行业文本的方法,其特征在于,包括:
建立第一数据库,其中,所述第一数据库用于存储行业人员的职位顺序;
根据所述第一数据库建立第二数据库和第三数据库,其中,所述第二数据库用于存储所述行业人员的姓名,所述第三数据库用于存储所述行业人员的职位;
根据所述第一数据库、所述第二数据库以及所述第三数据库对待测文本中的行业人员的职位顺序、姓名以及职位进行校验;
根据所述第一数据库建立第二数据库和第三数据库包括:获取至少一个行业文本中的所述行业人员的姓名以及所述行业人员对应的职位;根据所述第一数据库判断所述行业人员的姓名与所述行业人员的职位是否匹配;在所述行业人员的姓名与所述行业人员的职位不相匹配的情况下,存储所述行业人员的姓名至所述第二数据库中以及存储所述行业人员的职位至所述第三数据库中。
2.根据权利要求1所述的方法,其特征在于,建立第一数据库包括:
获取至少一个行业文本;
提取所述至少一个行业文本中的行业人员的参数,其中,所述行业人员的参数至少包括如下之一:所述行业人员的姓名、所述行业人员的职位以及所述行业人员的职位顺序;
建立所述行业人员的参数之间的关联关系;
根据所述关联关系建立所述第一数据库。
3.根据权利要求2所述的方法,其特征在于,根据所述第一数据库、所述第二数据库以及所述第三数据库对待测文本中的行业人员的职位顺序、姓名以及职位进行校验,其中,根据所述第二数据库对所述行业人员的姓名进行校验以及根据所述第三数据库对所述行业人员的职位进行校验包括:
获取所述待测文本中的行业人员的姓名以及所述行业人员的职位;
根据所述第二数据库匹配所述行业人员的姓名以及根据所述第三数据库匹配所述行业人员的职位;
在匹配成功的情况下,对所述待测文本中的行业人员的姓名以及所述行业人员的职位进行校验。
4.根据权利要求2所述的方法,其特征在于,根据所述第一数据库、所述第二数据库以及所述第三数据库对待测文本中的行业人员的职位顺序、姓名以及职位进行校验,其中,根据所述第一数据库对所述行业人员的职位顺序进行校验包括:
对所述待测文本进行分句处理,得到所述待测文本中的行业人员的姓名以及所述行业人员的职位;
在所述待测文本中的行业人员的姓名按照预定规则进行排序的情况下,判断所述行业人员的姓名是否与所述行业人员的职位顺序相匹配;
在不匹配的情况下,对所述待测文本中的行业人员的职位顺序进行校验。
5.根据权利要求4所述的方法,其特征在于,根据所述第一数据库对所述行业人员的职位顺序进行校验还包括:
在所述待测文本中的行业人员的姓名未按照所述预定规则进行排序的情况下,对所述待测文本进行自然语言处理,得到处理结果;
根据所述处理结果分析所述行业人员之间的词性;
根据所述词性对所述待测文本中的行业人员的职位顺序进行校验。
6.一种校验行业文本的装置,其特征在于,包括:
第一建立模块,用于建立第一数据库,其中,所述第一数据库用于存储行业人员的职位顺序;
第二建立模块,用于根据所述第一数据库建立第二数据库以及第三数据库,其中,所述第二数据库用于存储行业人员的姓名,所述第三数据库用于存储所述行业人员的职位;
校验模块,用于根据所述第一数据库、所述第二数据库以及所述第三数据库对待测文本中的行业人员的职位顺序、姓名以及职位进行校验;
所述第二建立模块包括:第二获取模块,用于获取至少一个行业文本中的所述行业人员的姓名以及所述行业人员对应的职位;第一匹配模块,用于根据所述第一数据库判断所述行业人员的姓名与所述行业人员的职位是否匹配;保存模块,用于在所述行业人员的姓名与所述行业人员的职位不相匹配的情况下,存储所述行业人员的姓名至所述第二数据库中以及存储所述行业人员的职位至所述第三数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611256002.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种歌曲的推荐方法及系统
- 下一篇:一种数据处理方法及系统