[发明专利]用于专利的检索方法、存储介质及装置在审
申请号: | 202011141538.6 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112836010A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 林赞磊;李东明;金忠良;商雷 | 申请(专利权)人: | 长城计算机软件与系统有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08;G06Q50/18 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 吴佳 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 专利 检索 方法 存储 介质 装置 | ||
本发明公开了用于专利的检索方法、存储介质及装置,涉及计算机技术领域。该方法包括:根据预先建立的神经网络模型分别对待检索专利进行语义和表面信息的特征抽取,将得到的语义特征向量和表面信息特征向量进行拼接,得到融合特征向量;根据融合特征向量从预设的特征数据库中匹配相似度满足预设相似度条件的专利,得到检索结果。本发明适用于专利文件的相似文本的检索,能够得到准确的检索结果,能够充分挖掘不同专利之间的关联性,从而提高检索结果的可信度。
技术领域
本发明涉及计算机技术领域,尤其涉及用于专利的检索方法、存储介质 及装置。
背景技术
目前,专利文本的检索主要是通过构建检索式进行的检索,检索式通常 由核心关键词构成,目前的检索方式是基于检索式中的核心关键词,匹配包 含这些核心关键词的专利,而不同的关键词可能存在一定的层级和等效关 系,如检索“机器”,其等效替换词可以为“装置、器械、设备、机械”等, 如果在检索时不能全面覆盖这些等效替换词和存在上下位关系的替换词的 各种组合,就可能存在检索不够全面的问题,导致检索结果不够准确,仅靠 专利中是否包含核心关键词的方式进行检索,找到的也仅仅是核心关键词存 在重叠的专利,其实质内容可能关联度不大,导致检索结果可信度低。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供用于专利的检 索方法、存储介质及装置。
本发明解决上述技术问题的技术方案如下:
一种用于专利的检索方法,包括:
根据预先建立的神经网络模型分别对待检索专利进行语义和表面信息 的特征抽取,将得到的语义特征向量和表面信息特征向量进行拼接,得到融 合特征向量;
根据所述融合特征向量从预设的特征数据库中匹配相似度满足预设相 似度条件的专利,得到检索结果。
作为本发明的一个较佳实现方式,所述神经网络模型包括深度神经网络 模型、浅层神经网络模型和特征融合层,所述深度神经网络模型用于提取所 述待检索专利的语义特征向量;所述浅层神经网络模型用于提取所述待检索 专利的文本表面信息特征向量,所述文本表面信息特征向量包括词频向量和 词向量;所述特征融合层用于将所述语义特征向量、所述词频向量和所述词 向量按照预设拼接规则进行拼接,得到融合特征向量。
其中,在神经网络模型中将浅层模型和深层模型进行组合,浅层模型负 责挖掘待检索专利的文本的表面信息,深层模型负责挖掘待检索专利的深层 语义信息,二者相结合可以达到最优的效果,从而提高检索准确率。
作为本发明的另一个较佳实现方式,根据预先建立的神经网络模型分别 对待检索专利进行语义和表面信息的特征抽取之前,还可以从专利库中选择 hard正样本和semi-hard负样本作为训练集,对所述神经网络模型进行训练, 并通过对比损失函数计算损失值,根据所述损失值调整优化所述神经网络模 型。
优选地,作为训练使用的正样本,可以更有针对性的选择神经网络模型 当前判断效果不佳的作为训练样本。
例如,对于semi-hard负样本,可以利用专利的IPC分类号,在不同领 域选择负例,保证训练样本覆盖到专利的不同领域。
还可以更有针对性的选择训练数据,例如,分别在不同的领域选择负例, 以防止在同一个领域选择太多相似的负例,从而让模型更快的收敛。
本发明解决上述技术问题的另一种技术方案如下:
一种存储介质,所述存储介质中存储有指令,当计算机读取所述指令时, 使所述计算机执行如上述技术方案所述的用于专利的检索方法。
一种用于专利的检索装置,包括:
存储器,用于存储计算机程序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长城计算机软件与系统有限公司,未经长城计算机软件与系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011141538.6/2.html,转载请声明来源钻瓜专利网。