[发明专利]基于隐语义主题的专利推荐方法及装置在审

专利信息
申请号: 201910620204.8 申请日: 2019-07-10
公开(公告)号: CN110457461A 公开(公告)日: 2019-11-15
发明(设计)人: 欧中洪;吴金盛;谭言信;宋美娜;宋俊德 申请(专利权)人: 北京邮电大学
主分类号: G06F16/335 分类号: G06F16/335;G06F16/35;G06F17/27;G06Q50/18
代理公司: 11201 北京清亦华知识产权代理事务所(普通合伙) 代理人: 张润<国际申请>=<国际公布>=<进入国
地址: 100876北京市海淀区西*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 词向量 主题树 构建 语义 相似度 主题相似度 匹配用户 余弦公式 语义主题 语义化 排序 引入 转换 外部
【权利要求书】:

1.一种基于隐语义主题的专利推荐方法,其特征在于,包括以下步骤:

根据专利摘要和标题获取多个专利关键词;

根据所述多个专利关键词利用开源词向量库进行词向量转换,并基于k-means构建隐语义主题树;以及

通过所述隐语义主题树获取每个专利的主体分布,并构建主题召回列表,及根据余弦公式得到主体分布相似度,以根据所述主体分相似度进行专利推荐。

2.根据权利要求1所述的方法,其特征在于,所述根据说明书摘要和发明名称获取专利关键词,包括:

通过分组正则表达式提取标题主干,并使用分词工具分词获取第一名词属性的单词,得到所述标题的至少一个专利关键词;

使用所述分词工具分词获取第二名词属性的单词,并使用TF-IDF算法无监督获取所述专利摘要的至少一个专利关键词。

3.根据权利要求1所述的方法,其特征在于,所述根据所述多个专利关键词利用开源库进行词向量转换,包括:

利用所述开源词向量库查询每个专利关键词对应的词向量,构建关键词ID映射表、专利关键词列表和关键词词向量映射表。

4.根据权利要求1所述的方法,其特征在于,所述基于k-means构建隐语义主题树,包括:

通过词向量转换获得所有专利关键词对应的词向量样本;

设置第一目标主题数使用k-means进行关键词词向量的聚类,获得聚类簇并以簇中心表示主题,以作为叶子主题;

以簇中心作为新词向量样本,设置第二目标主题数,并使用k-means聚类,获得新聚类簇并使用簇中心表示主题,作为更高一层主题,并通过同一词向量关联上下主题,直至构成一棵完整主题树,并为每个主题树每个节点设置相应主题ID,得到所述隐语义主题树。

5.根据权利要求1所述的方法,其特征在于,其中,根据当前专利主题使用近邻度量公式获取近邻主题,以进行层次主题召回。

6.一种基于隐语义主题的专利推荐装置,其特征在于,包括:

关键词获取模块,用于根据专利摘要和标题获取多个专利关键词;

词向量转换模块,用于根据所述多个专利关键词利用开源词向量库进行词向量转换;

隐语义主题树构建模块,用于基于k-means构建隐语义主题树;

主题分布获取模块,用于通过所述隐语义主题树获取每个专利的主体分布;

层次主题召回模块,用于构建主题召回列表;以及

主题相似度排序模块,用于根据余弦公式得到主体分布相似度,以根据所述主体分相似度进行专利推荐。

7.根据权利要求6所述的装置,其特征在于,所述关键词获取模块进一步用于通过分组正则表达式提取标题主干,并使用分词工具分词获取第一名词属性的单词,得到所述标题的至少一个专利关键词,并使用所述分词工具分词获取第二名词属性的单词,并使用TF-IDF算法无监督获取所述专利摘要的至少一个专利关键词。

8.根据权利要求6所述的装置,其特征在于,所述词向量转换模块进一步用于利用所述开源词向量库查询每个专利关键词对应的词向量,构建关键词ID映射表、专利关键词列表和关键词词向量映射表。

9.根据权利要求6所述的装置,其特征在于,所述隐语义主题树构建模块进一步用于通过词向量转换获得所有专利关键词对应的词向量样本,并设置第一目标主题数使用k-means进行关键词词向量的聚类,获得聚类簇并以簇中心表示主题,以作为叶子主题,并以簇中心作为新词向量样本,设置第二目标主题数,并使用k-means聚类,获得新聚类簇并使用簇中心表示主题,作为更高一层主题,并通过同一词向量关联上下主题,直至构成一棵完整主题树,并为每个主题树每个节点设置相应主题ID,得到所述隐语义主题树。

10.根据权利要求6所述的装置,其特征在于,其中,根据当前专利主题使用近邻度量公式获取近邻主题,以进行层次主题召回。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910620204.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top