[发明专利]一种企业关联关系识别方法及系统有效
申请号: | 201510540392.5 | 申请日: | 2015-08-28 |
公开(公告)号: | CN105138652B | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 田立娜;高军;王可鑫;段文良 | 申请(专利权)人: | 山东合天智汇信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
地址: | 250000 山东省济南市高新区舜*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种企业关联关系识别方法及系统,包括:建立统一数据格式的企业相关数据库;通过网络技术采集设定区域的企业相关数据;调取企业相关数据库中每个企业的相关数据字段,对所述数据字段进行预处理;提取企业股东数据字段,判断所述数据字段是个人还是企业;对同一企业进行数据对接;建立不同企业之间的数据关联;进行关联企业信息查询。本发明有益效果:对数据字段进行预处理,对企业股东等数据字段进行智能识别是人员还是企业,可以最大程序的提高系统对人员、企业的正确识别率,提高系统精准度,提高企业关联正确率。 | ||
搜索关键词: | 一种 企业 关联 关系 识别 方法 系统 | ||
【主权项】:
1.一种企业关联关系识别方法,其特征是,包括:在一个服务器执行该方法,所述服务器包括一个或多个处理器以及用于存储由所述一个或多个处理器执行的程序的存储器;(1)建立统一数据格式的企业相关数据库,所述数据库包括基本数据库和关联数据库;(2)通过网络技术采集设定区域的企业相关数据,并将所述数据进行格式转换后存储至基本数据库;(3)调取企业相关数据库中每个企业的相关数据字段,对所述相关数据字段进行预处理,提取出代表企业相关信息的数据字段并存入基本数据库;对所述相关数据字段进行预处理的方法包括:去除所述相关数据字段的首尾特殊字符;判断所述相关数据字段是否包含英文,如果是,则不处理;如果否,根据中间字符将所述数据字段分成多个字段;中间字符指中间分隔符,包括:空隔、逗号、分号或者顿号;判断分割后的字段长度是否大于设定的长度,如果是,将分割后的字段按多个字段进行处理;否则,去除特殊字符后,合并所有分割字段;(4)提取企业股东数据字段,判断所述股东数据字段是个人还是企业,并将判断结果存入基本数据库中相应企业的存储路径下,具体方法为:1)调取所有企业名称的前两位及后两位字符,并统计其出现频率;2)将出现频率大于设定频率阈值t的字符,保存至集合M中;3)提取企业A的股东数据字段,判断字符长度是否大于设定长度,如果是,进入步骤4);否则,判断为个人;4)提取所述企业A的股东数据字段的前两位字符,判断所述前两位字符是否出现在集合M中,如果是,判断为企业;否则,进入步骤5);5)提取所述企业A的股东数据字段的后两位字符,判断所述后两位字符是否出现在集合M中,如果是,判断为企业;否则,判断为个人;(5)对同一企业进行数据对接:将企业名称字段相同或者企业注册号字段相同的企业,合并至相同的存储路径下;(6)建立不同企业之间的数据关联:如果企业股东为另一企业名称,则将两企业进行关联;如果两个企业拥有相同名称字段的人员,则将两企业的存储路径进行关联;将关联的信息存入关联数据库;(7)用户客户端进行关联企业信息查询时,从关联数据库中调取关联企业,并从基本数据库中查询关联企业的基本信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东合天智汇信息技术有限公司,未经山东合天智汇信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510540392.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种还原氧化石墨烯的方法
- 下一篇:专利检索系统及其检索方法