[发明专利]基于重点关键词的关键词拓展方法和装置有效
申请号: | 201711227953.1 | 申请日: | 2017-11-29 |
公开(公告)号: | CN108170664B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 翁永金;李百川;陈第;蔡锐涛;李展铿 | 申请(专利权)人: | 有米科技股份有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9035 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 冯右明 |
地址: | 511400 广东省广州市番*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于重点关键词的关键词拓展方法和装置。所述方法包括:获取待拓展APP覆盖的第一级关键词,从中筛选出重点关键词;根据各重点关键词在应用库平台搜索到的APP,得到待拓展APP关联的第二级APP;进一步获取各第二级APP覆盖的关键词得到一候选关键词集合;然后计算候选关键词集合中各关键词相对于重点关键词的综合相似度;根据所述综合相似度以及候选关键词集合中各个关键词在候选关键词集合中所占的比重,可计算候选关键词集合中各关键词的相似度得分;最后可基于所述相似度得分对所述候选关键词集合进行筛选,得到待拓展APP的关联关键词。本发明能够自动拓展出APP相关的关键词,既实现量产,同时又可保证拓展质量。 | ||
搜索关键词: | 基于 重点 关键词 拓展 方法 装置 | ||
获取待拓展APP覆盖的第一级关键词,从中筛选出重点关键词;
根据各个重点关键词在应用库平台搜索到的APP,得到待拓展APP关联的第二级APP;获取各第二级APP覆盖的关键词,根据全部第二级APP覆盖的关键词得到一候选关键词集合;
根据候选关键词集合中各关键词与对应重点关键词的相似度,确定候选关键词集合中各关键词相对于重点关键词的综合相似度;获取候选关键词集合中各个关键词所占的比重;根据所述比重以及所述综合相似度计算候选关键词集合中各关键词的相似度得分;
根据所述相似度得分对所述候选关键词集合进行筛选,得到待拓展APP的关联关键词;
其中,APP覆盖的关键词需满足条件:在该关键词对应的搜索结果中包含有所述APP。
2.根据权利要求1所述的基于重点关键词的关键词拓展方法,其特征在于,所述从中筛选出重点关键词,包括:获取各个第一级关键词对于待拓展APP的重要度,选取重要度大于或等于第一设定重要度阈值的第一级关键词,作为待拓展APP覆盖的重点关键词;
其中,关键词对于待拓展APP的重要度,表征待拓展APP在该关键词的搜索结果中的排名信息。
3.根据权利要求2所述的基于重点关键词的关键词拓展方法,其特征在于,所述根据各个重点关键词在应用库平台搜索到的APP,得到待拓展APP关联的第二级APP,包括:根据历史搜索记录中各重点关键词在设定历史时段内的多次搜索结果,得到所述重点关键词对应的多次搜索结果中APP的频次排序信息;获取频次排序排在前的设定数量的APP,作为所述重点关键词搜索到的APP;
根据全部重点关键词、各个重点关键词搜索到的APP得到一APP矩阵;统计所述APP矩阵中各APP的出现频次,选取所述APP矩阵中出现频次大于或等于设定频次的APP,作为待拓展APP关联的第二级APP。
4.根据权利要求3所述的基于重点关键词的关键词拓展方法,其特征在于,在得到待拓展APP关联的第二级APP之后,获取各第二级APP覆盖的关键词之前,还包括:获取待拓展APP在应用库平台中所属的应用榜单,删除与待拓展APP属于不同应用榜单的第二级APP。
5.根据权利要求1所述的基于重点关键词的关键词拓展方法,其特征在于,根据候选关键词集合中各关键词与对应重点关键词的相似度,确定候选关键词集合中各关键词相对于重点关键词的综合相似度,包括:
获取候选关键词集合中各关键词对应的重点关键词、各关键词与对应重点关键词的相似度,计算候选关键词集合中各关键词与对应的重点关键词的相似度的平均值,作为候选关键词集合中各关键词相对于重点关键词的综合相似度。
6.根据权利要求5所述的基于重点关键词的关键词拓展方法,其特征在于,获取候选关键词集合中各关键词与对应的重点关键词的相似度的步骤,该步骤包括:根据候选关键词集合中每个关键词搜索到的APP得到每个关键词的特征向量,根据每个重点关键词搜索到的APP得到每个重点关键词的特征向量;
将候选关键词集合中各关键词的特征向量分别与对应重点关键词的特征向量进行One‑Hot编码处理,得到候选关键词集合中所述关键词的稀疏特征向量以及对应重点关键词的稀疏特征向量;
根据候选关键词集合中所述关键词的稀疏特征向量以及对应重点关键词的稀疏特征向量,计算候选关键词集合中所述关键词与对应重点关键词的相似度。
7.根据权利要求6所述的基于重点关键词的关键词拓展方法,其特征在于,通过以下公式计算候选关键词集合中第i个关键词与对应的重点关键词的相似度:
式中,KW(1)′k表示第K个重点关键词;KW(2)′i表示候选关键词集合中第i个关键词;V(KW(1)′k)·V(KW(2)′i)表示KW(1)′k的稀疏特征向量与KW(2)′i的稀疏特征向量的内积;||V(KW(1)′k)||2||V(KW(2)′i)||2表示KW(1)′k的稀疏特征向量与KW(2)′i的稀疏特征向量的2‑范数的乘积。
8.根据权利要求5所述的基于重点关键词的关键词拓展方法,其特征在于,根据全部第二级APP覆盖的关键词得到一候选关键词集合,包括:根据全部第二级APP覆盖的关键词得到一关键词矩阵;
对所述关键词矩阵中的关键词归并统计,得到候选关键词集合KW(2)=(kw(2)1,kw2(2),…,kwn(2)),以及所述候选关键词集合对应的关键词频次向量C(2)=(c1,c2,…,cn);所述关键词频次向量的各个元素分别对应候选关键词集合中各关键词的出现频次;
所述候选关键词集合KW(2)′中第i个关键词所占的比重为:
式中,i=1,2,…,n,n表示候选关键词集合KW(2)′中包含的关键词总数。
9.根据权利要求1至8任一所述的基于重点关键词的关键词拓展方法,其特征在于,根据所述比重以及所述综合相似度计算候选关键词集合中各关键词的相似度得分,包括:根据候选关键词集合中关键词的比重以及该关键词相对于重点关键词的综合相似度的乘积,得到候选关键词集合中该关键词的相似度得分。
10.根据权利要求1至8任一所述的基于重点关键词的关键词拓展方法,其特征在于,根据所述相似度得分对所述候选关键词集合进行筛选,得到待拓展APP的关联关键词,包括:从所述候选关键词集合中选取所述相似度得分由高到低排名在前的设定数量的关键词,得到待拓展APP的关联关键词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于有米科技股份有限公司,未经有米科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711227953.1/,转载请声明来源钻瓜专利网。