[发明专利]婴幼儿内容推荐中的用户兴趣收集方法、装置在审
申请号: | 202110046182.6 | 申请日: | 2021-01-14 |
公开(公告)号: | CN112380452A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 赵永强;姜巍;廖望梅;王光勇 | 申请(专利权)人: | 北京崔玉涛儿童健康管理中心有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京绘聚高科知识产权代理事务所(普通合伙) 11832 | 代理人: | 罗硕 |
地址: | 100000 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 婴幼儿 内容 推荐 中的 用户 兴趣 收集 方法 装置 | ||
1.一种婴幼儿内容推荐中的用户兴趣收集方法,其特征在于,包括如下操作步骤:
根据各个月龄分段对不同知识的固有兴趣分析,得到各个月龄分段对应的推荐的知识,识别所述推荐的知识对应的兴趣标签并汇总,并且对汇总后的所有月龄分段的所有的兴趣标签进行权重计算并从数值大到小顺序进行排序得到第一兴趣标签权重顺序列表;从所述第一兴趣标签权重顺序列表中选择权重由高到低顺序的前TopA的标签权重作为当前月龄分段的预先兴趣并汇总,得到当前月龄分段的预先兴趣集合C1;
获取当前用户的点击内容,识别当前用户通过点击内容对应的兴趣标签并汇总;获取预设兴趣时间周期,根据预设兴趣衰减方法对所有的通过点击内容形成兴趣标签进行衰减后的兴趣标签的权重计算,得到点击内容所对应的衰减后兴趣标签权重值;将所述衰减后兴趣标签权重值与所述点击内容所对应的兴趣标签的TF-IDF的值乘积得到乘积后的兴趣标签权重数值;将所述乘积后的兴趣标签权重数值从数值大到小进行排序得到第二兴趣标签权重顺序列表;从所述第二兴趣标签权重顺序列表中选择权重由高到低顺序的前TopB的标签权重作为当前用户的后验兴趣并汇总,得到当前用户的未来预设兴趣时间周期的对应的后验兴趣集合C2;
将所述预先兴趣集合C1和当前用户的所述后验兴趣集合C2进行合并,得到合并后兴趣集合。
2.根据权利要求1所述的婴幼儿内容推荐中的用户兴趣收集方法,其特征在于,对汇总后的所有月龄分段的所有的兴趣标签进行权重计算并从数值大到小顺序进行排序得到第一兴趣标签权重顺序列表,具体包括如下操作步骤:
服务器设置月龄分段的兴趣标签权重计算方式,即公式1:
其中,M为当前月龄段所有的知识,d(t)为当前月龄分段知识对应的兴趣标签t在知识d中出现的次数;
服务器利用所述月龄分段的兴趣标签权重计算公式对每个兴趣标签的权重计算,然后对计算得到的所述月龄分段的兴趣标签的权重数值从大到小进行排序,得到第一兴趣标签权重顺序列表。
3.根据权利要求2所述的婴幼儿内容推荐中的用户兴趣收集方法,其特征在于,所述获取当前用户的点击内容,识别当前用户通过点击内容对应的兴趣标签并汇总;获取预设兴趣时间周期,根据预设兴趣衰减方法对所有的通过点击内容形成兴趣标签进行衰减后的兴趣标签的权重计算,得到点击内容所对应的衰减后兴趣标签权重值;将所述衰减后兴趣标签权重值与所述点击内容所对应的兴趣标签的TF-IDF的值乘积得到乘积后的兴趣标签权重数值,具体包括如下操作步骤:
服务器获取收集当前用户的点击内容,识别当前用户通过点击内容对应的兴趣标签,同时获取当前用户的每天点击内容对应的标签数据,所述标签数据包括点击量和点击所在天;
服务器调取当前用户的预设兴趣时间周期;在所述预设兴趣时间周期内采用兴趣标签衰减公式对所有的通过点击内容形成兴趣标签进行衰减后的兴趣标签的权重计算得到点击内容所对应的衰减后兴趣标签权重值;所述兴趣标签衰减公式为:
;公式2;
其中,为衰减后兴趣标签权重值;mi为当前用户在一天点击知识形成兴趣标签t的记录;R(t)是一个用户每天点击知识形成兴趣标签的集合;“currentday-mi(day)”表示当前计算时间点所在天距离点击知识形成兴趣标签t所在天的天数之差; currentday表示当前计算时间点所在天;mi(day)为点击知识形成兴趣标签t所在天;当前用户在一天点击知识形成兴趣标签t所反映的点击量用mi(sum)表示;α为衰减系数;
计算所述预设兴趣时间周期内对应的点击内容所对应的兴趣标签的TF-IDF值;
将所述衰减后兴趣标签权重值与所述点击内容所对应的兴趣标签的TF-IDF的值乘积得到乘积后的兴趣标签权重数值;
Weight(t)=Score(t)*TF-IDF(t);公式3;在公式3中,其中为乘积后的兴趣标签权重数值;TF-IDF(t)为所述点击内容所对应的兴趣标签的TF-IDF的值,其中:
;公式4;
在公式4中,其中TF(p,t)表示用户p点击知识形成兴趣标签t与在用户p点击知识形成的所有兴趣标签的比率;IDF(t)表示所有用户点击知识形成所有兴趣标签和所有兴趣标签t的占比;
;公式5;
在公式5中,其中,w(p,t)为用户p点击知识形成兴趣标签t上的点击数;w(p,ti)为用户p点击知识形成兴趣标签ti上的点击数;表示为用户p点击知识形成的所有兴趣标签的点击数;
;公式6;
在公式6中,其中w(pj,ti)为用户pj点击知识形成兴趣标签ti上的点击数;为所有用户点击知识形成的所有兴趣标签上的点击数;w(pj,t)为用户pj点击知识形成兴趣标签t上的点击数;为所有用户点击知识形成兴趣标签t的点击数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京崔玉涛儿童健康管理中心有限公司,未经北京崔玉涛儿童健康管理中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110046182.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:育儿知识下的商品评分处理推荐方法、装置
- 下一篇:一种文本分类方法和装置
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法