[发明专利]标签分析方法、装置及计算机可读存储介质在审
申请号: | 201910975812.0 | 申请日: | 2019-10-12 |
公开(公告)号: | CN110889045A | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 付昌林;罗滢川;陈少梅;肖良清;石文富 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 分析 方法 装置 计算机 可读 存储 介质 | ||
1.一种基于用户行为的标签分析方法,其特征在于,所述方法包括:
接收预先构建的标签集,采集用户的原始交互数据集,将所述原始交互数据集进行预处理后得到标准交互数据集;
根据所述标准交互数据集与所述标签集建立所述用户的标签关系;
根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合;
根据所述相似度集合计算所述标签关系中的标签得分,并根据所述标签得分进行标签排序得到标签排序集;
根据预设标签个数从所述标签排序集中选择标签得到所述用户的标签分析结果,并输出所述标签分析结果。
2.如权利要求1所述的基于用户行为的标签分析方法,其特征在于,所述根据所述标准交互数据集与所述标签集建立所述待标签分析用户的标签关系,包括:
提取出所述标准交互数据集的关键字并进行关键字去重处理后得到关键字集;
根据所述关键字集从所述标签集提取出与所述关键字集相关的标签得到所述用户的标签关系。
3.如权利要求1或2所述的基于用户行为的标签分析方法,其特征在于,所述根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合,包括:
根据所述标签关系与所述预先构建的用户标签模型建立用户-标签二部图;
根据所述用户-标签二部图计算用户相似度及标签相似度;
将所述用户相似度与所述标签相似度按照用户与标签的对应关系计算得到所述相似度集合。
4.如权利要求3所述的基于用户行为的标签分析方法,其特征在于,所述用户相似度的计算方法为:
其中,Sm+1(u,u’)表示所述用户相似度,u为所述用户的交互数据,u’为所述用户标签模型中的交互数据,m为迭代次数,Trust(u,u’)为u,u’的信任度,O(u)表示所述待标签分析用户标签集合,O(u’)表示所述用户标签模型中的用户u’的标签集合,Sm+1(Oi(u),Oj(u’))表示所述待标签分析用户的标签i与所述用户标签模型中的用户u’的标签j的相似度,C1为介于[0,1]之间的常数;
所述标签相似度为:
其中,Sm+1(t,t’)表示所述待标签分析用户的标签t与所述用户标签模型中的标签t’的标签相似度,I(t)表示所述标签t的相似标签集合,I(t’)表示所述标签t’的相似标签集合,Sm+1(Ii(t),Ij(t’))表示所述标签t的相似标签集合i与所述标签t’的相似标签集合j的相似度,C2为介于[0,1]之间的常数。
5.如权利要求1所述的基于用户行为的标签分析方法,其特征在于,所述根据所述相似度集合计算所述标签关系中的标签得分的方法为:
其中,rS(u,t)表示所述标签得分,S(u,t)表示所述相似度集合,u为所述用户的交互数据,t的所述用户的标签,u’为所述用户标签模型中的交互数据,为所述用户标签模型的用户总量,为所述用户标签模型的标签总量,表示所述用户标签模型的用户与所述待标签分析用户的相似度,ru,t表示所述待标签分析用户与所述待标签分析用户的标签的过滤值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910975812.0/1.html,转载请声明来源钻瓜专利网。