[发明专利]一种用户标签扩展的控制方法及装置在审
申请号: | 202010978824.1 | 申请日: | 2020-09-17 |
公开(公告)号: | CN112035750A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 黄炜民 | 申请(专利权)人: | 上海二三四五网络科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200137 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 标签 扩展 控制 方法 装置 | ||
1.一种用户标签扩展的控制方法,其基于用户的一个或多个标签获得扩展标签,其特征在于,包括如下步骤:
a:基于N-gram模型以及待扩展标签集群确定一个或多个候选待扩展标签子集,所述待扩展标签集群包含tag1、tag2…tagn-1、tagn,所述候选待扩展标签子集包含tag1、tag2…tagn-1、tagn的任意一个或多个的随机组合;
b:确定与用户相关联环境状态下的多个外在标签和/或多个外在标签集群,所述多个外在标签和/或每个外在标签集群均包含tag1、tag2…tagm-1、tagm中的任意多个的随机组合,其中,m〉n;
c:遍历所有候选被扩展标签,进行每个候选待扩展标签子集与每个候选被扩展标签的互信息计算并确定每个候选被扩展标签与每个候选待扩展标签子集之间的关联度;
d:将关联度大于第一阈值的一个或多个候选被扩展标签确定为最终被扩展标签或最终被扩展标签集群,所述最终被扩展标签或最终被扩展标签集群与所述用户的待扩展标签集群构成扩展关系。
2.根据权利要求1所述的控制方法,其特征在于,在所述步骤a之前,还包括:确定用户的待扩展标签集群,所述用户的待扩展标签集群通过用户的文本、应用推荐而确定。
3.根据权利要求1所述的控制方法,其特征在于,在所述步骤b中,所述与用户相关联环境状态下的多个外在标签和/或多个外在标签集群是指与所述用户采用相同或相近的应用或程序的其他用户的多个外在标签和/或多个外在标签集群,相应地,
在所述步骤c中,所述互信息计算为:将具有候选待扩展标签子集和候选被扩展标签的用户数量相较于候选待扩展标签子集的用户数量的占比作为候选被扩展标签与候选待扩展标签子集之间的关联度。
4.根据权利要求1所述的控制方法,其特征在于,在所述步骤b中,所述与用户相关联环境状态下的多个外在标签和/或多个外在标签集群是指与所述用户采用相同或相近的应用或程序的文本内容中的多个外在标签和/或多个外在标签集群,相应地,
在所述步骤c中,所述互信息计算为:将候选待扩展标签子集和候选被扩展标签在多个文本内容中同时出现的次数相较于候选待扩展标签子集在多个文本内容中同时出现的次数的占比作为候选被扩展标签与候选待扩展标签子集之间的关联度。
5.根据权利要求1所述的控制方法,其特征在于,在所述步骤c中,将在多个外在标签和/或多个外在标签集群中除了所述待扩展标签集群之外的其他m-n个标签作为候选被扩展标签。
6.一种用户标签扩展的控制装置,其采用如权利要求1-5中任一项所述的控制方法,其特征在于,包括:
第一确定装置(1):基于N-gram模型以及待扩展标签集群确定一个或多个候选待扩展标签子集;
第二确定装置(2):确定与用户相关联环境状态下的多个外在标签和/或多个外在标签集群;
第一处理装置(3):遍历所有候选被扩展标签,进行每个候选待扩展标签子集与每个候选被扩展标签的互信息计算并确定每个候选被扩展标签与每个候选待扩展标签子集之间的关联度;
第三确定装置(4):将关联度大于第一阈值的一个或多个候选被扩展标签确定为最终被扩展标签或最终被扩展标签集群。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海二三四五网络科技有限公司,未经上海二三四五网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010978824.1/1.html,转载请声明来源钻瓜专利网。