[发明专利]一种关键词确定方法、装置、终端及存储介质在审
申请号: | 201910501917.2 | 申请日: | 2019-06-11 |
公开(公告)号: | CN110263335A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 楚国庆;朱旭琪;闫刚;金竹;孙瑛瑛;刘洋 | 申请(专利权)人: | 北京清博大数据科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/22;G06F16/33 |
代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 苏友娟 |
地址: | 100044 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词组 特征关键词 关键词确定 删除 存储介质 文章集合 预设 相似度计算 终端 排序 关键词组 输出目标 相似度 全网 还原 检索 | ||
本发明公开了一种关键词确定方法、装置、终端及存储介质,包括:删除第一特征词组中第一个特征关键词生成当前第二特征词组,以所述当前第二特征词组作为关键词进行全网检索,得到第二文章集合;将所述第二文章集合中排序前预设数量的文章与第一文章集合中排序前预设数量的文章进行相似度计算或者将其与所述目标文章进行相似度计算;若所述相似度超过预设阈值则删除所述当前第二特征词组的第一个特征关键词作为新的第二特征词组,否则,将所述删除的特征关键词还原,依次删除下一个特征关键词作为新的第二特征词组,直至循环至最后一个特征关键词,输出目标关键词组。本发明提供的关键词确定方法、装置、终端及存储介质,能够准确地定位关键词。
技术领域
本发明涉及关键词确定技术领域,特别涉及一种关键词确定方法、装置、终端及存储介质。
背景技术
现有的比较典型的文章关键词提取方法是将文本分词然后提取特征词,根据特定规则分别计算特征词的权重,然后按特征词的权重排序提取文章的特征关键词。对于新闻工作者来说他们需要精准匹配目标文章,这种方法获取的文章特征关键词不够精准,不能够准确定位目标文章。
发明内容
本发明提供一种关键词确定方法、装置、终端及存储介质,能够比较准确地定位关键词。
第一方面,本发明实施例提供了一种关键词确定方法,包括:
删除第一特征词组中第一个特征关键词生成当前第二特征词组,以所述当前第二特征词组作为关键词进行全网检索,得到第二文章集合,所述第二文章集合中的文章根据其与目标文章的相似度进行排序,所述第一特征词组由所述目标文章中的特征关键词组成;
将所述第二文章集合中排序前预设数量的文章与第一文章集合中排序前预设数量的文章进行相似度计算或者将其与所述目标文章进行相似度计算,其中,所述第一文章集合由所述第一特征词组作为关键词进行全网检索得到,所述第一文章集合中的文章根据其与所述目标文章的相似度进行排序;
若所述相似度超过预设阈值则删除所述当前第二特征词组的第一个特征关键词作为新的第二特征词组,否则,将所述删除的特征关键词还原,依次删除下一个特征关键词作为新的第二特征词组,直至循环至最后一个特征关键词,输出目标关键词组。
优选地,还包括步骤:对目标文章进行分词处理,得到分词结果,在所述分词结果中提取特征关键词。
优选地,所述第一文章集合为与所述目标文章相似度从高到低排序的文章构成的集合,所述第二文章集合为与所述目标文章相似度从高到低排序的文章构成的集合。
优选地,所述将所述第二文章集合中排序前预设数量的文章与第一文章集合中排序前预设数量的文章进行相似度计算,具体为:分别对所述第二文章集合和所述第一文章集合中排序位置对应的文章进行相似度计算,将得到的相似度结果取平均值。
第二方面,本发明实施例提供了一种关键词确定装置,包括:
第二文章集合获取模块,用于删除第一特征词组中第一个特征关键词生成当前第二特征词组,以所述当前第二特征词组作为关键词进行全网检索,得到第二文章集合,所述第二文章集合中的文章根据其与目标文章的相似度进行排序,所述第一特征词组由所述目标文章中的特征关键词组成;
相似度计算模块,用于将所述第二文章集合中排序前预设数量的文章与第一文章集合中排序前预设数量的文章进行相似度计算或者将其与所述目标文章进行相似度计算,其中,所述第一文章集合由所述第一特征词组作为关键词进行全网检索得到,所述第一文章集合中的文章根据其与所述目标文章的相似度进行排序;
目标关键词组确定模块,用于在所述相似度超过预设阈值则删除所述当前第二特征词组的第一个特征关键词作为新的第二特征词组,否则,将所述删除的特征关键词还原,依次删除下一个特征关键词作为新的第二特征词组,直至循环至最后一个特征关键词,输出目标关键词组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京清博大数据科技有限公司,未经北京清博大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910501917.2/2.html,转载请声明来源钻瓜专利网。