[发明专利]标签确定方法及装置有效
申请号: | 201611154191.2 | 申请日: | 2016-12-14 |
公开(公告)号: | CN106599194B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 陆子龙;张卫;吴宏刚;闫铭 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 林锦澜 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 确定 方法 装置 | ||
1.一种标签确定方法,其特征在于,所述方法包括:
每隔预定时间间隔获取目标应用程序对应的目标关键词集合,所述目标关键词集合中包括第一类关键词;
获取参考应用程序对应的参考关键词集合,所述参考关键词集合中包括所述第一类关键词和/或第二类关键词;
根据所述目标关键词集合和所述参考关键词集合按照预定算法确定所述目标应用程序对应的标签,所述标签为所述目标关键词集合和所述参考关键词集合中与所述目标应用程序之间的相似度大于预设相似度的关键词,和/或,根据所述目标关键词集合和所述参考关键词集合按照主题分析模型确定所述目标应用程序对应的标签,所述主题分析模型是根据所述目标应用程序对应的目标关键词集合,或根据所述目标关键词集合以及所述参考关键词集合,且基于PLSA主题模型训练得到,所述标签为所述目标关键词集合和所述参考关键词集合中,属于目标主题且在所述目标主题中所占的比例达到第二比例阈值的关键词,所述目标主题为在所述目标关键词集合中所占的比例达到第一比例阈值的主题;
其中,所述第一类关键词是直接与所述目标应用程序存在对应关系的关键词,所述第二类关键词是通过至少一个关联元素与所述目标应用程序存在对应关系的关键词,当按照预定算法确定目标应用程序对应的标签时,所述至少一个关联元素至少包括所述参考应用程序,以及所述目标关键词集合中与所述参考应用程序存在对应关系的第一类关键词,其中所述目标关键词集合中与所述参考应用程序存在对应关系的第一类关键词包括通过其他关联元素与所述参考应用程序存在对应关系的关键词;当按照主题分析模型确定目标应用程序对应的标签时,所述至少一个关联元素包括所述目标关键词集合中与所述第二类关键词属于同一个主题的第一类关键词;
所述根据所述目标关键词集合和所述参考关键词集合按照预定算法确定所述目标应用程序对应的标签,包括:
对于所述目标关键词集合和所述参考关键词集合中的每个所述第一类关键词,根据获取到的每个所述第一类关键词在所述目标关键词集合中所占的比例来确定所述第一类关键词与所述目标应用程序之间的相似度;
对于所述参考关键词集合中的每个所述第二类关键词,按照以下公式计算所述第二类关键词与所述目标应用程序之间的相似度:
其中,s(x,y)表示x与y之间的相似度,a表示所述目标应用程序,b表示所述第二类关键词,I(a)是所述目标关键词集合,I(b)是所述第二类关键词对应的所述应用程序集合,c是预设衰减因子,所述应用程序集合是直接与所述第二类关键词存在对应关系的各个应用程序的集合;
确定所述目标关键词集合和所述参考关键词集合中与所述目标应用程序之间的相似度大于预设相似度的关键词为所述目标应用程序对应的所述标签;
所述根据所述目标关键词集合和所述参考关键词集合按照主题分析模型确定所述目标应用程序对应的标签,包括:
根据所述主题分析模型确定所述目标关键词集合中包括的所述第一类关键词对应的各个主题;
确定在所述目标关键词集合中所占的比例达到第一比例阈值的目标主题;
确定所述目标关键词集合和所述参考关键词集合中,属于所述目标主题且在所述目标主题中所占的比例达到第二比例阈值的关键词为所述目标应用程序对应的所述标签。
2.根据权利要求1所述的方法,其特征在于,所述获取目标应用程序对应的目标关键词集合,包括:
获取历史搜索所述目标应用程序的搜索请求中包括的所述第一类关键词;
和/或,通过网络爬虫获取所述目标应用程序对应的所述第一类关键词;
和/或,获取所述目标应用程序的描述信息中包括的所述第一类关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611154191.2/1.html,转载请声明来源钻瓜专利网。