[发明专利]一种基于统计学的企业名名称相似度检测方法在审
申请号: | 202010916792.2 | 申请日: | 2020-09-03 |
公开(公告)号: | CN112035621A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 宋兵 | 申请(专利权)人: | 江苏经贸职业技术学院 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京力量专利代理事务所(特殊普通合伙) 11504 | 代理人: | 徐颖超 |
地址: | 211199 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于统计学的企业名名称相似度检测方法,包括如下步骤:对企业名称进行中文分词;统计全网企业名称热词,建立停用词库;将分词结果遍历停用词库,剔除遍历过程中匹配到停用词库中热词的分词,得到关键词;将关键词与全网企业名称进行匹配,将匹配对应的企业名称进行统计,建立待对比名称库;对企业名称和待检验名称库内各名称进行相似度计算。通过建立停用词库,将检测的企业名称分词结果与停用词库进行对比剔除,得到企业名称中的关键字,避免大量热词对检测过程造成干扰,减免人工删选和补充工作量,根据关键词与全网数据进行匹配,得到待对比相似度的名称集,并进行相似度计算,从而快速检测处相似度结果,提高计算精度。 | ||
搜索关键词: | 一种 基于 统计学 企业 名称 相似 检测 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏经贸职业技术学院,未经江苏经贸职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010916792.2/,转载请声明来源钻瓜专利网。
- 上一篇:标定设备及标定方法
- 下一篇:一种电力驱动电机的散热壳体