[发明专利]新闻评论的预测方法和新闻评论的预测系统有效
申请号: | 201610204038.X | 申请日: | 2016-04-01 |
公开(公告)号: | CN107291754B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 刘克松;杨建武;张丹;蔡慧慧;马路 | 申请(专利权)人: | 北京大学;北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06K9/62 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻 评论 预测 方法 系统 | ||
1.一种新闻评论的预测方法,其特征在于,包括:
确定发布新闻t所属的领域;
获取预设时间范围内用户对所述领域的新闻的评论记录集合;
根据所述发布新闻t的关键字,确定用户ui对所述发布新闻t属于所述评论记录集合的评论概率p(ui,t),
评论概率正比于所述发布新闻t来自所述用户ui的评论新闻集T(ui)的模型的概率,prob表征求概率函数,计算公式为:
p(ui,t)=prob(t∈T(ui));
在所述评论记录集合中,确定所述用户ui评论过的新闻数量与新闻总数的评论比例;
计算所述评论概率和所述评论比例的乘积,并作为一个用户对所述发布新闻进行评论的参考概率;
对所有用户的参考概率依次进行归一化处理,并进行求和处理,以预测所述发布新闻的评论数目;
其中,获取预设时间范围内用户对所述领域的新闻的评论记录集合,具体包括以下步骤:
获取所述预设时间范围内的评论数据,创建二维评论矩阵作为所述评论记录集合,
其中,所述二维评论矩阵中的任一元素表示为Xij,所述二维评论矩阵中的行表示一个用户,所述二维评论矩阵的列表示所述领域的一个新闻,赋值Xij为1时表示所述一个用户对所述领域的一个新闻进行了评论,赋值Xij为0时表示所述一个用户未对所述领域的一个新闻进行评论,每个元素Xij还包含新闻的标识信息:关键词。
2.根据权利要求1所述的新闻评论的预测方法,其特征在于,对所有用户的参考概率依次进行归一化处理,并进行求和处理,以预测所述发布新闻的评论数目,具体包括以下步骤:
在对所有用户的参考概率依次进行归一化处理,并进行求和处理后,确定参考评论数目;
在检测所述参考评论数目大于或等于所述评论阈值后,确定所述参考评论数目与预设放大因子的乘积作为所述评论数目,
其中,所述预设放大因子大于或等于1。
3.根据权利要求2所述的新闻评论的预测方法,其特征在于,所述预设放大因子的数值范围为1~1.5。
4.一种新闻评论的预测系统,其特征在于,包括:
确定单元,用于确定发布新闻t所属的领域;
获取单元,用于获取预设时间范围内用户对所述领域的新闻的评论记录集合;
所述确定单元还用于:根据所述发布新闻t的关键字,确定用户ui对所述发布新闻t属于所述评论记录集合的评论概率p(ui,t),
评论概率正比于所述发布新闻t来自所述用户ui的评论新闻集T(ui)的模型的概率,prob表征求概率函数,计算公式为:
p(ui,t)=prob(t∈T(ui));
所述确定单元还用于:在所述评论记录集合中,确定所述用户ui评论过的新闻数量与新闻总数的评论比例;
所述新闻评论的预测系统还包括:
计算单元,用于计算所述评论概率和所述评论比例的乘积,并作为一个用户对所述发布新闻进行评论的参考概率;
所述计算单元还用于:对所有用户的参考概率依次进行归一化处理,并进行求和处理,以预测所述发布新闻的评论数目;
所述获取单元还用于:获取所述预设时间范围内的评论数据,创建二维评论矩阵作为所述评论记录集合,
其中,所述二维评论矩阵中的任一元素表示为Xij,所述二维评论矩阵中的行表示一个用户,所述二维评论矩阵的列表示所述领域的一个新闻,赋值Xij为1时表示所述一个用户对所述领域的一个新闻进行了评论,赋值Xij为0时表示所述一个用户未对所述领域的一个新闻进行评论,每个元素Xij还包含新闻的标识信息:关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北大方正集团有限公司;北京北大方正电子有限公司,未经北京大学;北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610204038.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于用户的个性化数据搜索方法和装置
- 下一篇:一种终端推送方法及装置