[发明专利]基于多主题追踪的个性化网络新闻推送方法有效
申请号: | 200910153589.8 | 申请日: | 2009-10-20 |
公开(公告)号: | CN101694659A | 公开(公告)日: | 2010-04-14 |
发明(设计)人: | 陈纯;何占盈;陈伟;卜佳俊;毛菥 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
基于多主题追踪的个性化网络新闻推送方法,包括以下步骤:获取用户浏览过的新闻网页,划分成多个用户子兴趣模型;根据用户是否阅读由子兴趣模型 |
||
搜索关键词: | 基于 主题 追踪 个性化 网络新闻 推送 方法 | ||
【主权项】:
1.基于多主题追踪的个性化网络新闻推送方法,包括以下步骤:1)、获取用户浏览过的新闻网页,提取各新闻网页的标题和正文;采用聚类算法将前述的新闻网页划分成多个用户感兴趣的新闻类,以每个新闻类作为一个子兴趣模型,所述的子兴趣模型为由模型中所有新闻报道的关键词信息组成的向量
其中
为子兴趣模型
中所有的新闻报道的的第i个关键词的权重信息,若第i个关键词在多篇新闻报道中出现过,则
为第i个关键词在各篇新闻报道中的权重信息之和;所述的新闻报道为由该新闻报道的关键词信息组成的向量![]()
对应的关键词与其所属的子兴趣模型
中的关键词一致;若新闻报道
中具有第i个关键词,则
为此关键词的权重信息,若新闻报道
中不具有第i个关键词,则
为0;所有的子兴趣模型构成用户的多主题兴趣模型;2)、根据用户是否阅读由子兴趣模型
推荐的新闻报道
对用户的多主题兴趣模型进行动态更新;3)、设定所述的子兴趣模型的个数的阈值M,判断子兴趣模型的个数是否超过所述的阈值M,若子兴趣模型的个数超过所述的阈值,则寻找偏离用户兴趣最远的子兴趣模型,将其删除;寻找最偏离用户兴趣的子兴趣模型包括以下步骤:(3.1)为每个子兴趣模型引入一个用于衡量该子兴趣模型所表示的用户兴趣的精确性的精确度参数precision(p),精确度参数值越大,则精确性越高,其中
really(p)为用户实际浏览的由子兴趣模型
推荐的新闻的数量,total(p)为子兴趣模型
总共推荐的新闻的数量;(3.2)根据经验设定一个表示用户对新闻的兴趣随时间衰退的因子α,引入一个表征在某一时间内、用户对新闻的兴趣的衰减程度的衰减函数e-α·t,其中t表示从当前到该子兴趣模型上一次被点击的时间间隔;(3.3)结合所述的精确度参数和衰减函数获得子兴趣模型与用户兴趣的相关度K,K=precision(p)·e-α·t,K值越小,说明该子兴趣模型与用户兴趣偏离越远;将所有的子兴趣模型根据所述的相关度从大到小排序,保留前M个子兴趣模型。4)、计算待推送的新闻与所有子兴趣模型之间的相似度W,找出最高相似度Wmax;所述的相似度W用新闻报道
与子兴趣模型
之间的夹角来表征,所述的夹角越小,相似度越高;5)、计算新闻报道
的排序值score(d),所述的排序值score(d)=Wmax·precision(p)·e-αt,将排序值从大到小进行排序,将排序后的新闻列表推送给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910153589.8/,转载请声明来源钻瓜专利网。