[发明专利]一种面向多要素审查标准的中文商标近似检测方法有效
申请号: | 202010769071.3 | 申请日: | 2020-08-03 |
公开(公告)号: | CN111882462B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 李学俊;高仕锦 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06Q50/18 | 分类号: | G06Q50/18;G06F16/38 |
代理公司: | 安徽华人律师事务所 34163 | 代理人: | 张璞君 |
地址: | 230601 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 要素 审查 标准 中文 商标 近似 检测 方法 | ||
本发明属于商标查询领域,具体涉及一种面向多要素审查标准的中文商标近似检测方法。该方法包括以下步骤:获取待申请商标和引证商标的名称,并计算两者公共汉字个数及重叠参数;将两商标名称分别转为音形码序列;构建D‑L编辑距离矩阵,得到两商标之间的编辑距离;根据编辑距离,计算两商标的D‑L相似度;根据D‑L相似度与重叠参数,计算两商标的字面相似度;计算两商标的含义相似度;根据字面相似度与含义相似度,计算两商标的综合相似度,最后判断两商标是否为近似商标申请。本发明符合商标法以及商标审查标准对已授权中文商标近似性的判断,应用于中文商标近似检索中有很高的准确率。
技术领域
本发明属于商标查询领域,具体涉及一种面向多要素审查标准的中文商标近似检测方法。
背景技术
随着国家知识产权局商标局商标数据的公开以及日益增长的商标申请量,待申请商标与引证商标之间的近似评判工作变得尤为重要。
通过阅读相关的文献发现,目前对于文本商标的近似判定方法研究还存在一些缺陷。例如,传统的人工检索方法是通过人工检索方式对商标进行近似判定,其处理速度有限、效率低;而简单的编辑距离方法只能从字面上考虑字符串之间的差异,这种方法虽然针对中文字符串有较好的判定效果,但不能完全符合中文商标的审查标准。
翟东升等人在论文中提出了一种商标语义相似度计算方法(翟东升,蔡文浩,张杰,李振飞.改进的中文商标语义相似度计算方法研究[J].数据分析与知识发现,2017,1(11):19-28.),该方法通过在传统的基于HowNet算法的基础上增加了公共汉字个数的影响,以此来提高准确率,但由于该方法只考虑了商标的含义,并没有考虑字形、拼音的影响,过于单一片面,所以近似检测效果也不理想;祁俊辉等人在论文(祁俊辉,龙华,赖华,毕丹宏.基于字形编码与拼音编码的近似商标辨识算法研究[J].软件导刊,2018,17(06):77-80+84.)中提出将商标文字通过字形编码、拼音编码等方式映射为数字型字符串和字母型字符串,再使用改进的Jaro-Winkler Distance算法分别计算字形、拼音相似度,最后根据相似匹配算法得出商标文字的相似程度,该方法虽然考虑了字形、拼音等因素,但对汉字顺序变化较大的商标的比对效果并不好,如,相邻汉字逆序的商标。
在信息论和计算机科学中,Damerau-Levenshtein距离以Frederick J.Damerau和Vladimir I.Levenshtein两位科学家的名字命名,是对两个字符串之间编辑距离的度量,它有四个基本操作:删除、插入、替换、换位。由于商标一般为短文本,且臆造词较多,因此本方法基于D-L编辑距离方法计算出中文商标的字面相似度,可保留该距离算法本身的汉字构成、逆序、增删个别汉字等因素。
音形码是一种汉字编码形式,该编码将一个汉字转化成一串字母数字序列,并在一定程度上保留了该汉字的字形及发音特征。音形码由音码和形码两部分组成,如附图2所示,音码由前4位组成,包括韵母、声母、韵母补码、声调,形码由后7位组成,包括汉字结构、四角码、笔画数。音形码大多数用于汉字输入法设计中,尚无应用于中文商标相似度计算的。使用音形码相似度计算方法可以较好地解决中文商标近似检测中对汉字字形、拼音等因素的近似判定问题,可有效提高中文商标近似判定的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010769071.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种VR设备交互用旋转式底座
- 下一篇:一种植物油生产用原料清理筛