[发明专利]一种基于新核函数Luke核的专利文献相似度检测方法有效
申请号: | 201310400244.4 | 申请日: | 2013-09-05 |
公开(公告)号: | CN103455609A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 王秀红;卢章平;陈潇君;汪满容;鞠时光 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 卢霞 |
地址: | 212013 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于新核函数Luke核的专利文献相似度检测方法,将专利文献分成5要素,即专利名称、摘要、权利要求书、说明书和主分类号;构造新的核函数Luke核,利用Luke核分别计算两篇专利文献前四个要素间的相似度,再利用字符串匹配计算两专利文献的主分类号之间的相似度,然后将两专利文献5要素间的相似度进行加权求和得专利文献的总体相似度。本发明的技术方案进一步提高了专利文献的相似度检测的精准率和召回率,可应用于专利文献的相似度检测。 | ||
搜索关键词: | 一种 基于 函数 luke 专利 文献 相似 检测 方法 | ||
【主权项】:
1.一种基于新核函数Luke核的专利文献相似度检测方法,其特征在于包括以下步骤:步骤1,将待比对的两篇专利文献DX和DZ的文本分别表示成向量x和z的步骤;步骤2,专利文献结构化表示的步骤:将专利文献分成专利名称、摘要、权利要求、说明书以及主分类号5个要素;所述待比对的两篇专利文献DX和DZ的所述前4个要素分别依次据步骤1所述的方法表示成向量为x1、x2、x3、x4和z1、z2、z3、z4;步骤3,构造适于专利文献相似度计算的新核函数k(x,z),并对所述函数k(x,z)是否可以作为相似度计算的核函数给予理论证明;步骤4,首先利用所述核函数k(x,z),先计算所述待比对的两篇专利文献DX和DZ前四个各对应要素间的相似度Sj,Sj=k(xj,zj),j=1,2,3,4;然后,对于所述待比对的两篇专利文献DX和DZ的主分类号要素,直接进行字符串匹配比对计算两篇专利文献DX和DZ的主分类号之间的相似度S5,具体算法过程为:依部、大类、小类、大组、小组顺序从前往后比较主分类号,如果两个专利的主分类号完全相同即小组号相同,则S5=1;如果小组号不同,但大组号相同,则S5=0.75;如果大组号不同,但小类号相同,则S5=0.5;如果小类号不同,但大类号相同,则S5=0.25;如果大类号不同,但部号相同,则S5=0.1;如果完全不同,即部号不同,则S5=0;最后加权求和得所述待比对的两篇专利文献DX和DZ的相似度S
此处,
0≤ζj≤1,j=1,2,...,5。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310400244.4/,转载请声明来源钻瓜专利网。