[发明专利]基于技术需求和新技术相似度的查询推荐方法在审
申请号: | 202011051622.9 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112307178A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 郑鑫;于德尚;陈丽娜;高睿;高全磊;于洋 | 申请(专利权)人: | 青岛檬豆网络科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/216;G06F40/284 |
代理公司: | 武汉聚信汇智知识产权代理有限公司 42258 | 代理人: | 沙莎 |
地址: | 266000 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 技术 需求 新技术 相似 查询 推荐 方法 | ||
1.基于技术需求和新技术相似度的查询推荐方法,其特征在于,包括如下步骤:
(1)准备阶段:新技术数据模型的准备;包括
步骤1.1:对数据库中新技术和用户持续录入的新技术的标题和成果简介,分别提取关键词汇句子;
步骤1.2:对新技术标题和成果简介的关键词汇句子,分别提取关键词;
步骤1.3:统计新技术的关键词和对应词频;
步骤1.4:计算新技术中关键词对应的逆向文件频率IDE;
步骤1.5:计算新技术中关键词的加权词频;
步骤1.6:根据新技术中关键词的加权词频由高到低排序,确定提取前KT个新技术关键词;
(2)运用阶段:根据技术需求匹配推荐新技术;包括:
步骤2.1:对用户输入的技术需求的标题和需求简介,分别提取关键词汇句子;
步骤2.2:对技术需求标题和需求简介的关键词汇句子,分别提取关键词;
步骤2.3:统计技术需求的关键词和对应词频;
步骤2.4:计算技术需求中关键词对应的逆向文件频率IDE;
步骤2.5:计算技术需求中关键词的加权词频;
步骤2.6:根据技术需求中关键词的加权词频,确定提取前KD个技术需求关键词;
步骤2.7:确定技术需求与新技术之间的关键词集合;
步骤2.8:由技术需求和新技术之间的关键词集合,确定技术需求与新技术之间的文本向量;
步骤2.9:根据技术需求与新技术之间的文本向量,确定技术需求和新技术之间的词向量;
步骤2.10:对技术需求与新技术之间的词向量进行相似度计算;
步骤2.11:根据相似度由高到低排序,并为用户推荐新技术。
2.如权利要求1所述的基于技术需求和新技术相似度的查询推荐方法,其特征在于,针对(1)准备阶段:对新录入的新技术,需要经过准备阶段的步骤提取关键词,并将其和新技术同时存储在数据库中,为后面的计算提供依据;对已经存在数据库的新技术和关键词信息,则无需每次经过以上步骤进行重复计算,只需要在词库发生变化时,定期进行更新即可。
3.如权利要求1所述的基于技术需求和新技术相似度的查询推荐方法,其特征在于,所述步骤1.1:提取关键词汇句子,具体方法包括:利用结巴分词的分词模块函数,基于基本词库、停用词库,对新技术成果简介进行分词,保留部分词性的词语,作为下一步新技术成果简介的描述;保留的词性包括名词、动名词、英语、语素词;对于去掉的词性,具有可提取的意义时,采用两种方式对词库进行修改补充:(1)修改词性:对词语在词库中的词性,进行修改,定义词性为vnmd,作为专属提取词语;(2)添加词性:对于新技术各个领域的专有名词,添加到新建词性为mnmd的词性库中,对应词频设置为当前基本词库中的最大词频+1;步骤2.1的提取关键词汇句子的方法与步骤1.1的方法相同。
4.如权利要求1所述的基于技术需求和新技术相似度的查询推荐方法,其特征在于,所述步骤1.2:对新技术标题和成果简介的关键词汇句子,提取关键词,具体方法包括:利用结巴分词的分词模型函数,增加专属名词库、停用词库,对步骤1.1提取的关键词汇句子进行分词,积累新技术在各个领域当中的专属名词或术语,对基本词库或专属名词库进行补充;对于停用词库的补充,只对步骤1.2的停用词库进行补充;对于步骤1.1中未筛选成功的词语,添加到停用词库中,对这部分词语不添加在成功分词的词语当中;步骤2.2的对技术需求标题和需求简介的关键词汇句子,提取关键词的方法与步骤1.2的方法相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛檬豆网络科技有限公司,未经青岛檬豆网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011051622.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多联机空调中压缩机的基准频率的确定方法
- 下一篇:多级换热系统