[发明专利]一种企业字号查重方法、装置、设备和介质有效
申请号: | 202310610295.3 | 申请日: | 2023-05-29 |
公开(公告)号: | CN116361517B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 廖政;胡道光;贾少华 | 申请(专利权)人: | 北京拓普丰联信息科技股份有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/901;G06F16/9035 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 徐炀 |
地址: | 100000 北京市朝阳区北四环中路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业 字号 方法 装置 设备 介质 | ||
本申请提供了一种企业字号查重方法、装置、设备和介质,所述方法包括:获取已审批通过的多个历史企业字号;分别将每个历史企业字号进行字段拆分,以得到每个历史企业字号的拆分结果;基于每个历史企业字号的拆分结果,生成关于所述历史企业字号的标准trie树;在获取到企业名称注册请求后,从企业名称注册请求中提取出目标企业字号;根据所述目标企业字号,采用trie树查找方式,在所述标准trie树中查找与目标企业字号具有相似性的参考企业字号;根据查找到的参考企业字号和目标企业字号的对比结果,确定目标企业字号是否通过查重要求。
技术领域
本申请涉及数据处理领域,具体而言,涉及一种企业字号查重方法、装置、设备和介质。
背景技术
企业在进行工商企业设立登记时,需要提供企业名称(字号),只有在提供的企业名称和现有企业的名称不冲突的情况下,登记才能通过。因此,一般在企业进行登记前或进行登记时,需对新提交的企业名称(字号)进行查重校验,以避免和已有企业名称重复或相似以导致侵权情况的产生。
由于现有的企业主体数量过于庞大,并且每年新增的企业数量也很大,因此,目前技术中采用的在用户提交查重请求后,将新的企业名称和现有的全部企业名称分别进行查重比对的方式工作量过大。
发明内容
有鉴于此,本申请的目的在于提供一种企业字号查重方法、装置、设备和介质,用于解决现有技术中对企业名称的查重速度较慢的问题。
第一方面,本申请实施例提供了一种企业字号查重方法,包括:
获取已审批通过的多个历史企业字号;
分别将每个历史企业字号进行字段拆分,以得到每个历史企业字号的拆分结果;
基于每个历史企业字号的拆分结果,生成关于所述历史企业字号的标准trie树;
在获取到企业名称注册请求后,从企业名称注册请求中提取出目标企业字号;
根据所述目标企业字号,采用trie树查找方式,在所述标准trie树中查找与目标企业字号具有相似性的参考企业字号;
根据查找到的参考企业字号和目标企业字号的对比结果,确定目标企业字号是否通过查重要求。
可选的,步骤分别将每个历史企业字号进行字段拆分,以得到每个历史企业字号的拆分结果,包括:
针对每个历史企业字号,按照关键词提取的方式从该历史企业字号中提取出具有特定含义的目标词汇;
针对每个历史企业字号,将提取剩余的字段按照逐个文字的方式进行拆分,以得到每个历史企业字号的目标文字;所述目标文字包括目标字和目标字符;
将目标词汇、目标文字组成所述拆分结果。
可选的,所述标准trie树的每个分支均是按照所述目标词汇和目标文字的内容,以及所述目标词汇和目标文字在所述历史企业字号中的位置确定的。
可选的,所述标准trie树是由连接在根节点下多个分支构成,每个分支均包括多级子节点,每个下一级子节点均与所对应的上一级子节点相连接;每一个子节点均为所述历史企业字号中的一个文字或词汇。
可选的,步骤根据所述目标企业字号,采用trie树查找方式,在所述标准trie树中查找与目标企业字号具有相似性的参考企业字号,包括:
使用目标企业字号中的首个字符在所述标准trie树的第一级子节点中进行遍历,以将存在有与所述首个字符相同的一级子节点所在的分支作为候选分支;
使用目标企业字号中的下一个字符在所述标准trie树的下一级子节点中进行遍历,以根据存在有与所述下一个字符相同的下一级子节点所在的分支对候选分支进行更新;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京拓普丰联信息科技股份有限公司,未经北京拓普丰联信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310610295.3/2.html,转载请声明来源钻瓜专利网。