[发明专利]一种用于用户进行标记的标签生成方法及设备有效
申请号: | 201510494709.6 | 申请日: | 2015-08-12 |
公开(公告)号: | CN105045911B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 王志军;初显奇;刘禹;李素琴;张扬 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 马苗苗 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 用户 进行 标记 标签 生成 方法 设备 | ||
1.一种用于用户进行标记的标签生成方法,其特征在于,包括:
确定基于L个陌生通信标识的通信行为产生的历史标签记录,所述通信行为产生在第一移动终端,L为正整数;
基于所述L个陌生通信标识的标签信息,以及所述历史标签记录,确定出所述L个陌生通信标识所对应的行业类别排序,所述标签信息用于标记陌生通信标识的行业类别,所述历史标签记录为通信记录和/或标记记录,其中,所述确定出所述L个陌生通信标识所对应的行业类别排序,包括:基于所述历史标签记录确定出每个行业类别下包含的通信次数和/或标记次数,并基于所述通信次数和/或所述标记次数确定出所述行业类别排序;
基于所述行业类别排序生成第一标签列表,所述第一标签列表用于所述第一移动终端的用户对所述第一移动终端的陌生通信标识进行标记。
2.如权利要求1所述的方法,其特征在于,所述基于所述历史标签记录确定出所述L个陌生通信标识所对应的行业类别排序,具体包括:
确定出所述L个陌生通信标识的标签信息;
对所述标签信息所属的行业类别进行归类,获得对应的M个行业类别,M为正整数;
基于所述历史标签记录确定出所述M个行业类别中每个行业类别的第一评分值;
基于每个行业类别的第一评分值确定出所述行业类别排序。
3.如权利要求2所述的方法,其特征在于,所述对所述标签信息所属的行业类别进行归类,获得对应的M个行业类别,具体包括:
将所述标签信息划分为N个大类,每个大类下包含至少一个小类,N为正整数;
判断所述第一移动终端的用户采用小类对所述陌生通信标识进行标记的概率是否大于预设概率;
在大于所述预设概率时,将所述标签信息划分为M个小类;
否则,将所述标签信息划分为M个大类。
4.如权利要求2所述的方法,其特征在于,所述基于所述类别排序生成第一标签列表,具体包括:
确定每个行业类别的身份标签,其中在某个行业类别包含词义相同的至少两个身份标签时,选择所述第一移动终端的用户使用频率最高的身份标签作为对应行业类别的身份标签;
基于每个行业类别的身份标签和所述类别排序生成所述第一标签列表。
5.如权利要求2所述的方法,其特征在于,所述历史标签记录包括:在所述第一移动终端上基于所述L个陌生通信标识所产生的通信记录和所述用户针对所述L个陌生通信标识所产生的标记记录;所述基于所述历史标签记录确定出所述M个行业类别中每个行业类别的第一评分值,具体包括:
确定每个行业类别所包含的所述通信记录的第一数量;
确定每个行业类别所包含的所述标记记录的第二数量;
将所述第一数量和第一权重值的乘积、与所述第二数量和第二权重值的乘积进行加和,进而获得对应行业类别的第一评分值。
6.如权利要求5所述的方法,其特征在于,所述第二权重值大于所述第一权重值。
7.如权利要求2所述的方法,其特征在于,在所述基于每个行业类别的第一评分值确定出所述行业类别排序时,所述方法还包括:
若第一行业类别与第二行业类别的所述第一评分值相同,则确定基于所述第一行业类别的陌生通信标识产生所述历史标签记录的第一时间,以及基于所述第二行业类别的陌生通信标识产生所述历史标签记录的第二时间;
比较所述第一时间和所述第二时间距离当前时间的距离;
在所述第一时间距离当前时间近时,所述第一行业类别排序优先级高于所述第二行业类别;
在所述第二时间距离当前时间近时,所述第二行业类别排序优先级高于所述第一行业类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510494709.6/1.html,转载请声明来源钻瓜专利网。