[发明专利]基于隐语义主题的专利推荐方法及装置在审
申请号: | 201910620204.8 | 申请日: | 2019-07-10 |
公开(公告)号: | CN110457461A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 欧中洪;吴金盛;谭言信;宋美娜;宋俊德 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F17/27;G06Q50/18 |
代理公司: | 11201 北京清亦华知识产权代理事务所(普通合伙) | 代理人: | 张润<国际申请>=<国际公布>=<进入国 |
地址: | 100876北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词向量 主题树 构建 语义 相似度 主题相似度 匹配用户 余弦公式 语义主题 语义化 排序 引入 转换 外部 | ||
本发明公开了一种基于隐语义主题的专利推荐方法及装置,其中,方法包括以下步骤:根据专利摘要和标题获取多个专利关键词;根据多个专利关键词利用开源词向量库进行词向量转换,并基于k‑means构建隐语义主题树;通过隐语义主题树获取每个专利的主体分布,并构建主题召回列表,及根据余弦公式得到主体分布相似度,以根据主体分相似度进行专利推荐。该方法可以通过利用包含外部知识的词向量库,引入专利的语义主题信息,能更加语义化匹配用户目标,获得更加精准的推荐结果,并通过构建隐语义主题树,基于语义上的近邻主题召回进行主题相似度排序,达到进行多层次语义精准推荐。
技术领域
本发明涉及专利推荐技术领域,特别涉及一种基于隐语义主题的专利推荐方法及装置。
背景技术
随着科技的迅速发展和经济的全球化,专利的作用越来越得到人们的重视,每年国家专利局受理国内外专利申请超160万件,专利信息快速增长带来了信息超载,使得科技研发人员从海量的专利信息里寻找感兴趣的专利成为一件不轻松的工作。专利推荐算法作为一种信息过滤的重要手段,是解决专利信息超载的一种重要的、有潜力的方法.目前主流的专利推荐算法主要包含以下几大类:
(1)基于内容的推荐。它主要是根据推荐专利的元数据,发现专利之间的相关性,然后基于用户以往的喜好记录,推荐给用户相似的专利。
(2)协同过滤的推荐。它主要是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的专利,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选推荐专利。
(3)基于知识的推荐。它主要是是根据用户指定的需求,系统给出设计方案,利用已有的知识,根据不同的相似度衡量方法检索出相似的专利,或依据明确定义的推荐规则的集合获取推荐专利集合进行推荐。
如上所述,目前针对专利的推荐方式主要有:1)利用专利的元数据发现专利之间的相关性进行专利内容推荐;2)基于相似用户群体的喜好筛选过滤专利进行协同过滤推荐;3)根据用户指定需求,利用已有知识检索或筛选相应专利进行知识推荐。方法1简单易于实现,但是未能考虑专利内容本身的语义关联性,结果稀疏且无法按语义主题层次进行精准推荐;方法2推荐结果新颖扩展性强,但是由于用户评分行为信息较难以获得,存在数据稀疏和冷启动问题,同时由于用户之间的差异性,结果中可能出现一些与用户目标不相关的推荐结果,推荐结果不精准;方法3精准捕获用户需求能获得较好的推荐效果,但是用户本身需求存在不确定性和广泛性,无法对所有用户需求进行分析处理,导致方法难以实现和局限性。
综上,当前针对专利推荐的方案,大多是基于用户专利使用数据的协同过滤推荐,基于专利元数据的内容推荐以及基于用户需求的知识推荐,未能考虑外部知识引入,推荐结果与用户目标的语义关联性较低,推荐结果不精准,同时专利数据本身较难获取用户使用数据,传统协同过滤具有数据稀疏性,冷启动问题。
发明内容
本申请是基于发明人对以下问题的认识和发现做出的:
基于背景技术所述,本发明通过引入开源词向量库外部知识,扩展专利间的语义联系,基于用户访问专利本身获取需求信息,无需明确用户需求模式,避免了使用方法2的用户数据稀疏性问题和方法3方法难以实施及扩展问题,可为用户推荐专利标题以及摘要中不包含用户已访问专利的共现词,但其在内容上又和用户访问专利存在一定语义关联的专利,提供更加精准的推荐结果。
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种基于隐语义主题的专利推荐方法,该方法可以通过利用包含外部知识的词向量库,引入专利的语义主题信息,能更加语义化匹配用户目标,获得更加精准的推荐结果,并通过构建隐语义主题树,基于语义上的近邻主题召回进行主题相似度排序,达到进行多层次语义精准推荐。
本发明的另一个目的在于提出一种基于隐语义主题的专利推荐装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910620204.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本推荐方法、装置、服务器和存储介质
- 下一篇:一种合同服务方法及其系统