[发明专利]基于专利要素的关键词提取方法、终端、可读存储介质在审

专利信息
申请号: 201911405669.8 申请日: 2019-12-31
公开(公告)号: CN111159389A 公开(公告)日: 2020-05-15
发明(设计)人: 张清华;刘学颖 申请(专利权)人: 重庆邮电大学
主分类号: G06F16/335 分类号: G06F16/335;G06F16/33;G06Q50/18;G06K9/62
代理公司: 重庆辉腾律师事务所 50215 代理人: 王海军
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 专利 要素 关键词 提取 方法 终端 可读 存储 介质
【说明书】:

本申请实施例公开了一种基于专利要素的关键词提取方法、终端、计算机可读存储介质,其中方法包括:输入专利文本;将所述专利文本进行预处理,得到所述专利文本的词语集合;根据所述专利文本的专利要素和所述专利文本生成关键词候选集,所述专利要素是指专利文本中包含的专利信息;根据所述关键词候选集以及所述专利文本的词语集合进行相似度计算,根据相似度计算结果确定出所述专利文本的关键词集合。通过上述方法可以提高专利文本领域中关键词提取结果的准确性。

技术领域

本申请涉及计算机技术领域,尤其涉及一种基于专利要素的关键词提取方法、终端、计算机可读存储介质。

背景技术

计算机技术时代,专利文本数据的增长十分迅猛。人们在面对海量专利信息时,无论是应对专利侵权诉讼,还是产品在进行专利申请前,将专利库中的专利文本进行关键词提取以对专利更准确的进行分析已成为非常重要的环节。

专利文本领域中的语言处理,重点在于分析专利文本的结构和内容,计算专利间的相似性,而关键词提取作为专利文本处理的基础和关键一环,提取结果的准确性将对后续的专利侵权判定、专利申请、专利搜索和专利权认定等存在较大程度的影响,因此,如何提高专利文本关键词提取的准确性已成为一个热门的研究内容。

发明内容

本发明实施例提供一种基于专利要素的关键词提取方法、终端及计算机可存储介质,可提高专利文本领域中关键词提取结果的准确性。

第一方面,本发明实施例提供了一种基于专利要素的关键词提取方法,该方法包括:

输入专利文本;

确定所述专利文本的专利要素,并根据所述专利要素和所述专利文本生成关键词候选集,所述专利要素是指专利文本中包含的专利信息;

将所述专利文本进行预处理,得到所述专利文本的词语集合;

根据所述关键词候选集以及所述专利文本的词语集合进行相似度计算,根据相似度计算结果确定出所述专利文本的关键词集合。

在一些可行的实施方式中,所述确定所述专利文本的专利要素,并根据所述专利要素和所述专利文本生成关键词候选集之前,还包括:预设专利要素对应的提示信息,所述提示信息包括位置信息、提示词语信息、词频信息中的任意一项或多项;

所述根据所述专利文本的专利要素和所述专利文本生成关键词候选集,包括:根据所述专利要素对应的提示信息,确定所述专利文本中的专利要素所对应的词语;提取确定出的词语以生成关键词候选集。

在一些可行的实施方式中,所述根据所述关键词候选集以及所述专利文本的词语集合进行相似度计算,根据相似度计算结果确定出所述专利文本的关键词集合,包括:计算所述词语集合中各个词语间的第一相似度;计算所述关键词候选集以及所述词语集合间的各个词语的第二相似度;将所述第一相似度以及所述第二相似度进行加权处理,根据处理结果确定所述专利文本的关键词集合。

在一些可行的实施方式中,所述计算所述关键词候选集以及所述词语集合间的第二相似度,包括:利用词嵌入将所述关键词候选集以及所述词语集合嵌入为词级的向量空间表示,以计算得到所述关键词候选集以及所述词语集合间的第二相似度。

在一些可行的实施方式中,所述将所述第一相似度以及所述第二相似度进行加权处理,根据处理结果确定所述专利文本的关键词集合,包括:根据最大边界相关法MMR将所述第一相似度以及所述第二相似度进行加权处理,得到所述专利文本的词语集合中各个词语对应的权重值;按照从大到小的顺序对所述权重值进行排序,根据排序结果选择前N个权重值对应的词语作为所述专利文本的关键词集合。

在一些可行的实施方式中,所述专利文本的专利要素,包括:所述专利文本的类型、应用领域、技术特征、有益效果中的任意一种或多种。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911405669.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top